Mimar Sinan Güzel Sanatlar Üniversitesi Açık Bilim, Sanat Arşivi

Açık Bilim, Sanat Arşivi, Mimar Sinan Güzel Sanatlar Üniversitesi tarafından doğrudan ve dolaylı olarak yayınlanan; kitap, makale, tez, bildiri, rapor gibi tüm akademik kaynakları uluslararası standartlarda dijital ortamda depolar, Üniversitenin akademik performansını izlemeye aracılık eder, kaynakları uzun süreli saklar ve yayınların etkisini artırmak için telif haklarına uygun olarak Açık Erişime sunar.

MSGSÜ'de Ara
Gelişmiş Arama

Basit öğe kaydını göster

dc.contributor.advisorÖzdamar, Elif Özge
dc.contributor.authorYangın, Gülçin
dc.date.accessioned2022-06-20T20:16:35Z
dc.date.available2022-06-20T20:16:35Z
dc.date.issued2019
dc.identifier.urihttps://hdl.handle.net/20.500.14124/1152
dc.descriptionTez (Yüksek Lisans) -- Mimar Sinan Güzel Sanatlar Üniversitesi Fen Bilimleri Enstitüsü, 2019.en_US
dc.description.abstractSınıflandırma, insanların her zaman ilgilendiği konulardan biri olmuştur. Bu konu ilkel çağdan günümüze kadar önemini korumaya devam etmektedir. İnsanlar, canlı ve cansız varlıkları sınıflandırmayla başlamış; fakat günümüzde ise sağlık, bankacılık, finans, enerji gibi alanlarda sınıflandırma üzerine çalışmalar yapmaktadır. Özellikle sağlık alanında yapılan sınıflandırma çalışmaları, hastalığın erken teşhisi ve tanısında, ayrıca ilaç tasarlama çalışmalarına önemli katkı sunmaktadır. Dünya Sağlık Örgütü’ne göre diyabet hastalığı en çok ölüme neden olan on hastalıktan biri olmasının yanı sıra bu hastalığa yakalanan yetişkinlerin sayısı artmaya devam etmektedir. Dünya Sağlık Örgütü’nün, 2014 verilerine göre 422 milyon insan diyabetle yaşamaktadır. Diyabet hastalığının; zaman içinde kalpte, kan damarlarında, gözlerde, böbreklerde ve sinirlerde hasara yol açtığı sonucuna ulaşılmıştır. Bu hastalığa sahip yetişkinlerin kalp krizi ve felç riski geçirmesinin sağlıklı bireylere göre daha fazla olduğu saptanmıştır. Son yıllarda makine öğrenmesi ve yapay zeka gibi teknolojik gelişmeler birçok hastalıkla mücadelede kullanılmaya başlanmıştır. Hastalığın erken teşhisi ile beraber bireyin daha uzun yaşaması sağlanmaktadır. Özellikle gen dizilim çalışmalarında makine öğrenmesi önemli bir yer tutmaktadır. Tezin amacı doğrultusunda diyabet hastalığının tahmin edilmesi için makine öğrenme yöntemleri algoritmalarından yararlanılmıştır. Bu çalışmada; karar ağaçları, Rastgele Orman, Gradient Boosting ve XGBoost algoritmaları anlatılmıştır. Bu algoritmalar iki veri setine uygulanmış ve performans ölçütlerinden doğru sınıflandırma oranı, kesinlik, duyarlılık, Kappa ve F1 sonuçları elde edilmiştir. Elde edilen sonuçlardan doğru sınıflandırma oranı kullanılan algoritmalar bakımından karşılaştırması yapılıp yorumlanmıştır. Veri setlerinden birincisi 210 gözlem ve biri sınıf değişkeni olmak üzere 15 değişkenden oluşmaktadır. Diğeri ise literatürde “PIMA INDIANS” olarak bilinen 768 gözlem ve biri sınıf değişkeni olmak üzere 8 değişkenden meydana gelmektedir. Birinci veri setindeki kayıp gözlemlere IBM SPSS 23 paket programı kullanılarak çoklu atama ile değer ataması yapılmıştır. Bu çalışmada veri setlerinin bir kısmı eğitim verisi kalan kısmı da test verisi olarak ele alınmış ve uygulamada R açık kaynak yazılımı kullanılmıştır. Kullanılan sınıflandırma algoritmalarından elde edilen sonuçlar doğru sınıflandırma oranları bakımından incelenmiştir. Doğru sınıflandırma oranı bakımından karar ağaçları, Rastgele Orman, Gradient Boosting ve XGBoost algoritmalarının sırasıyla birinci veri setinde %56.10, %60.98, %65.85 ve %70.73 iken; “PIMA INDIANS” veri setinde ise %75.82, %81.05, %81.70 ve %82.35 sonuçlarını verdiği görülmüştür. Bu sonuçların ışığında her iki veri setinde de XGBoost algoritmasının performans bakımından daha iyi çalıştığı sonucuna varılmıştır.en_US
dc.format.mediumxv, 64 sayfa : grafik ; 30 cm.en_US
dc.language.isoturen_US
dc.publisherMimar Sinan Güzel Sanatlar Üniversitesi, Fen Bilimleri Enstitüsüen_US
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.subjectDiyabeten_US
dc.subjectGradient Boostingen_US
dc.subjectKarar ağaçlarıen_US
dc.subjectRastgele Ormanen_US
dc.subjectSınıflandırma algoritmalarıen_US
dc.subjectXGBoosten_US
dc.subjectİstatistiken_US
dc.titleXGBoost ve karar ağacı tabanlı algoritmaların diyabet veri setleri üzerine uygulamasıen_US
dc.typemasterThesisen_US
dc.departmentEnstitüler, Mimar Sinan Güzel Sanatlar Üniversitesi, Fen Bilimleri Enstitüsü, İstatistik Anabilim Dalı, İstatistik Programıen_US
dc.institutionauthorYangın, Gülçinen_US
dc.relation.publicationcategoryTezen_US
dc.identifier.demirbas0075384en_US
dc.identifier.yrd3702E8C9-F8ED-3A45-BC51-015670BE6895en_US


Bu öğenin dosyaları:

Thumbnail

Bu öğe aşağıdaki koleksiyon(lar)da görünmektedir.

Basit öğe kaydını göster