Özet
Veri bilimi kapsamında son yıllarda oldukça popüler olan makine öğrenmesi, yapay zekâ, derin öğrenme vb. alanlarda oldukça sık karşılaşılan sınıflandırma problemlerine, farklı sorunların dikkate alındığı simülasyon çalışmaları ile doğru sınıflandırma performanslarının düzeltilmesine yönelik araştırmalarla çözüm bulunmaya çalışılmıştır. İstatistik biliminde sınıflandırmada çok tercih edilen yöntemlerden biri olan lojistik regresyon, bağımlı değişkenin iki ya da daha çok düzeyde kategorik olduğu durumlarda kullanılan bir yöntem olup kategorilerin sıralı olduğu durumda sıralı lojistik regresyon adını almaktadır. Sıralı lojistik regresyonda, doğrusal regresyon modelinde olduğu gibi bağımsız değişkenler arasında korelasyonların yüksek olması çoklu bağlantı sorununu ortaya çıkarmaktadır. Bu çalışmada, sıralı lojistik regresyon modelindeki bağımsız değişkenler arasında çoklu bağlantılı olması durumunda klasik yöntem ile alternatif yöntemlerin doğru sınıflandırma performanslarının nasıl değişiklik gösterdiği incelenmiştir. Klasik sıralı lojistik tekniği ve alternatif yöntemlerden sıralı lojistik ridge, sıralı lojistik lasso ve sıralı lojistik elastik-net regresyon teknikleri değişken sayıları, örneklem büyüklüğü, dengeli/dengesiz kategori dağılımı, çoklu bağlantının gücü ve farklı bağlantı fonksiyonlarına göre karşılaştırılmıştır. Bu kapsamda simülasyon çalışması ile üretilmiş veri setleri aracılığıyla belirlenen tüm durumları araştırmak ve karşılaştırmak amacıyla 864 tane farklı deneme elde edilmiş, sıralı lojistik regresyon ve düzenlileştirme yöntemleri uygulanarak analiz sonuçlarına ulaşılmıştır. Ayrıca bu çalışmada ilgili yöntemler gerçek bir veri setiyle yapılan uygulamayla değerlendirilmiş ve yorumlanmıştır. Alternatif sıralı lojistik regresyon yöntemlerinin sınıflandırma çalışmalarında doğru ve daha üstün yöntemler olarak kullanılabileceği ortaya konmaya çalışılmıştır.