Özet
Parametre kestirimleri için yansız sonuçlar elde etmek amacıyla kullanılan En Küçük Kareler (EKK) yönteminin, aykırı değer varlığında yanlı sonuçlar vermesi ve düşük performans göstermesi sağlam regresyon yöntemlerinin tercih edilmesine neden olmuştur. Bu çalışmada sağlam regresyon yöntemlerinin karşılaştırması amacıyla benzetim çalışması ve bir uygulama yapılmıştır. R programında "rlm" ve "lm" fonksiyonları kullanılarak yapılan çalışmada, sağlam regresyon yöntemlerinden M, MM, LAD ve S yöntemleri EKK ile karşılaştırılmıştır. Ayrıca benzetim çalışmasında, farklı amaç fonksiyonları seçilerek Huber'in M, Hampel'ın M ve Tukey'in iki ağırlıklısı M yöntemleri ile kesirilen modeller EKK ile karşılaştırılmıştır. Benzetim çalışmasında 9 farklı senaryo üretilmiştir. n=10, n=30 ve n=100 için aykırı değerin olmadığı, aykırı değer sayısının 1 ve 2 olduğu, açıklayıcı değişken sayısının 2 ve 4 belirlendiği, varyansın 0,1 , 0 ve 10 olarak seçildiği durumlar için EKK ve sağlam yöntemler birbirleriyle karşılaştırılmıştır. Toplam hata kareler ortalaması (toplam HKO) ve belirtme katsayısı (R2) model performanslarını değerlendirmede kullanılmıştır. Aykırı değer olmadığı durumda benzer sonuçlar elde edilse de aykırı değer varlığında, yüksek bozulma noktasına sahip MM regresyon yönteminin aykırı değer varlığında parametre kestirimlerinde daha başarılı olduğu görülmüştür. MM'nin yüksek bozulma noktasına (%50) sahip olması parametre kestirimlerinde başarılı olduğunu göstermektedir. Amaç fonksiyonlarına göre yapılan karşılaştırmada, n=10 seçildiğinde ve aykırı değer varlığında sağlam yöntemlerden Huber'in M ve Tukey'in 2 ağırlıklı kestiricilerinin parametre kestirimlerinde daha başarılı olduğu görülmüştür. n=30 ve n=100 seçildiğinde ise aykırı değer varlığında Hampel'ın M kestiricinin daha başarılı olduğu görülmüştür. Sağlam yöntemlerin aykırı değerleri saptamadaki başarısını göstermek amacıyla, 18 ile 80 yaş arasında, tip 2 diabetes mellitüs tanısı olan, 98 erkek hasta alınarak D vitamini düzeyini etkileyebileceği düşünülen parametrelerle modelleme yapıldı. EKK yöntemi ile 3 aykırı değer, M yöntemi ile 12 aykırı değer ve MM yöntemi ile 14 aykırı değer belirlendi. MM yönteminin aykırı değerleri saptamada daha başarılı olduğu ve aykırı değerlerden arındırılan verilerle kullanılarak kestirilen EKK modelinin performansının yükseldiği görüldü. Aykırı değerler veriden çıkarıldıktan sonra önemsiz bulunan parametrelerin, önemli bulunduğu görüldü. Yaş, sistolik kan basıncı, iief-5 skoru ve yaş ile sigara etkileşimi D vitaminini en çok etkileyen faktörler olarak bulundu.