Abstract
Principal component analysis (PCA) is not resistant to outliers existing in multivariate data sets. The results which are obtained by using classical PCA are far from real values in the presence of outliers. Therefore, using robust versions of PCA is favorable. The easiest way to obtain robust principal components is to replace classical estimates of the location and scale parameters with their robust versions. Robust estimations of location and scale parameters can be found with minimum covariance determinant (MCD) providing high breakdown point. In this study, algorithm of MCD is modified using Jackknife resampling approach and results of this modification are examined. Proposed robust principal component analysis (RPCA) based on modified MCD (MMCD) method that is modified using Jaccknife resampling are evaluated over two real data with different outlier ratios. In the light of obtained results, it can be said that RPCA based on MMCD is better than RPCA based on MCD in the presence of outliers.
Keywords: Minimum Covariance Determinant, Outliers, Robust Principal Component Analysis
Jel Classification: C38
Öz
Klasik temel bileşenler analizi (KTBA), çok değişkenli veri kümelerinde yer alabilen aykırı gözlemlere karşı dayanıklı değildir. Aykırı gözlemlerin varlığında KTBA kullanılarak elde edilen sonuçlar gerçekte olması gerekenden oldukça farklı çıkabilir. Bu yüzden, aykırı gözlemlerin varlığında PCA’nın dayanıklı versiyonlarının kullanımı tercih edilmelidir. Dayanıklı temel bileşenler elde etmek için en kolay yol konum ve ölçek parametrelerinin klasik tahminleriyle, onların dayanıklı tahminlerinin yer değiştirilmesidir. Çok değişkenli veri kümesi için konum ve ölçek parametrelerinin dayanıklı tahmini, yüksek bozulma noktası sağlayan en küçük kovaryans determinant (EKKD) yöntemi ile yapılabilir. Bu çalışmada, EKKD yöntemi, jacknife yeniden örnekleme yaklaşımı kullanılarak uyarlanıp, bu uyarlamadan kaynaklanan değişimlerin dayanıklı temel bileşenler analizi (DTBA) üzerindeki etkileri incelenmesi amaçlanmaktadır. Jackknife yeniden örnekleme yöntemine dayanan EKKD’nin aykırı gözlem oranındaki değişmelerden nasıl etkilendiği iki gerçek veri kümesi üzerinden değerlendirilmektedir. Elde edilen bulgular ışığında, önerilen uyarlanmış en küçük kovaryans determinant (UEKKD) tahminine dayalı DTBA, klasik EKKD’ye dayanan DTBA’ya göre veri kümesinde aykırı gözlemlerin varlığında daha iyi sonuçlar verdiği görülmektedir.
Anahtar Kelimeler: Aykırı Değerler, Dayanıklı Temel Bileşenler Analizi, En Küçük Kovaryans Determinant
Suggested citation
Aykırı Gözlemlerin Varlığında Uyarlanmış En Küçük Kovaryans Determinant Tahminine Dayalı Dayanıklı Temel Bileşenler Analizi. Alphanumeric Journal, 4(2), 85-94. http://dx.doi.org/10.17093/aj.2016.4.2.5000189525
().References
2016.04.02.STAT.02
alphanumeric journal
Pages 85-94
Received: May 16, 2016
Accepted: Aug. 25, 2016
Published: Sept. 29, 2016
2016 Alkan, BB.
This is an Open Access article, distributed under the terms of the Creative Commons Attribution licence, which permits unrestricted re-use, distribution, and reproduction in any medium, provided the original work is properly cited.
scan QR code to access this article from your mobile device
Faculty of Transportation and Logistics, Istanbul University
Beyazit Campus 34452 Fatih/Istanbul/TURKEY
Bahadır Fatih Yıldırım, Ph.D.
editor@alphanumericjournal.com
+ 90 (212) 440 00 00 - 13219
alphanumeric journal has been publishing as "International Peer-Reviewed Journal" every six months since 2013. alphanumeric serves as a vehicle for researchers and practitioners in the field of quantitative methods, and is enabling a process of sharing in all fields related to the operations research, statistics, econometrics and management informations systems in order to enhance the quality on a globe scale.