Abstract
Günümüzde finansal kararlar almak, kredi başvurularını değerlendirmek oldukça karmaşık ve hassas bir süreçtir. Kurumların finansal risk durumunu gösteren nakit akış verileri, kredi başvurularının değerlendirilmesinde çok önemli bir rol oynamaktadır. Kurum yöneticilerine daha detaylı stratejik kararlar alma ve finansal riskleri yönetme konusunda rehberlik eden çeyreklik finansal veriler, kurumların performanslarına ilişkin sonraki dönemleri tahminlemede ve alınacak önlemlerin belirlenmesine yardımcı olmaktadır. Çalışmada kullanılan 282 şirketin 2018-2022 yılları arasındaki çeyreklik dönem verilerinin uygunluğu dikkate alınarak etkin modeller oluşturulması ve bu algoritmaların bilgi kriterleri ile değerlendirilmesi alanında özgün bir yaklaşım sağlanması hedeflenmiştir. Verideki bağımlı değişkenin dengesiz dağılımı nedeniyle, makine öğrenimi algoritmaları ile birlikte örnekleme tekniklerinin kullanıldığı detaylı bir analiz, kredi sınıflandırma sürecinde işletmelerin çeyreklik dönemlerdeki performanslarını karşılaştırmak için oluşturulan farklı modelleri değerlendirildiği ve nakit akışı verilerinin süreçteki rolü vurgulanmak istenmiştir. Çalışmada, Rastgele Orman Sınıflandırıcısı (RF), Gradyan Artırma Sınıflandırıcısı (GBC), Aşırı Gradyan Artırma Sınıflandırıcısı (XgBOOST), Hafif Gradyan Artırma Sınıflandırıcısı (LGBM), Karar Ağacı Sınıflandırıcısı (DT), Ekstra Ağaçlar Sınıflandırıcısı (ETC) ve Naive Bayes (NB) algoritmaları kullanılarak modeller oluşturulmuştur. İlk aşamada kurulan çeyrek dönemler için 20 farklı modelin performansları doğruluk ve F1 skoru ile değerlendirildiğinde algoritrma performansları yüksek ve birbirine yakın bulunmuştur. Sonrasında, tüm çeyrek dönemler için oluşturulan tek bir model F1 değerinin ilk aşama modellerinin F1 ortalamasından daha düşük olduğundan en iyi model olarak seçilmiştir. Seçilen modelde, veri dengelemek amaçlı GBC algoritması ve aşırı örnekleme tekniği uygulanmıştır. Eğitim, test ve validasyon verisinde doğruluk, duyarlılık ve kesinlik değerleri kontrol edilerek yüksek bir performans sergilendiği görülmüştür. Önceki yıllarda kullanılan veri yapılarından farklı bir veri yapısı kullanılarak yapılan bu kapsamlı analiz, finansal verilerde önemli yeri olan nakit akış tablolarında çeşitli makine öğrenmesi yöntemleri ile risklerin öngörülmesi amaçlanarak elde edilen sonuçlar değerlendirilmiştir.