Mimar Sinan Fine Arts University Institutional Repository
DSpace@MSGSÜ digitally stores academic resources such as books, articles, dissertations, bulletins, reports, research data published directly or indirectly by Mimar Sinan Fine Arts University in international standarts, helps track the academic performance of the university, provides long term preservation for resources and makes publications available to Open Access in accordance with their copyright to increase the effect of publications.Search MSGSÜ
In-Silico Mutajenisite Tahmininde İstatistiksel Öğrenme Modeli
Abstract
Toksisite testleri arasında, bir etken nedeniyle ortaya çıkabilecek genetikdeğişim (mutasyon) olarak tanımlanabilen?mutajenisite önemli yer tutmaktadır.?Buçalışmada genel olarak mutajenisite belirleme sürecini iyileştirebilmek adına insilico?yaklaşım kapsamında istatistiksel öğrenme algoritmaları kullanılmıştır. Sözkonusu yaklaşım deneyler ile elde edilen?mutajenisite bilgisi içeren molekül setineuygulanmış ve dikkate değer sınıflama başarıları elde edilmiştir. Çalışmadakullanılmak üzere literatürde bulunan, moleküllerden oluşan Bursi ile Benchmarkveri setleri birleştirilmiş ve Molecular Operating Environment (MOE) programıaracılığı ile moleküllerin özellikleri hesaplanmıştır. Hesaplama sonucunda 10835gözleme ve 193 değişkene sahip veri seti üzerinde karar ağaçları?algoritmalarıuygulanarak grid arama yaklaşımı ile parametre seçimi gerçekleştirilmiştir. Eldeedilen en iyi parametreler ile kurulan modeller sonucunda değişkenlerin seçimimutajenisiteyi tahmin etmedeki önem düzeylerine göre yapılmış ve verininboyutu?en etkili 72 değişkene indirgenmiştir. Seçilen değişkenlerden oluşan yeniveriye farklı istatistiksel öğrenme algoritmaları uygulanmış ve içlerinden en iyisonuç veren?beş?sınıflama?algoritmasına karar verilmiştir. Parametre eniyilemesi?ile model başarımları arttırılan bu algoritmalar kullanılarak yaklaşık %90mutajenisiteyi doğru sınıflama oranları elde edilmiştir. Among the toxicity tests, mutagenicity defined as a genetic change that can occur due to an agent, has an important place. In this study, statistical learning algorithms were used within the scope of in-silico approach in order to improve the mutagenicity determination process in general. This approach has been applied to the set of molecules containing mutagenicity information obtained by experiments and remarkable classification success were achieved. In order to use in this study, Bursi and Benchmark data sets consisting of molecules found in the literature were combined and the properties of molecules were calculated by means of the Molecular Operating Environment (MOE). As a result of the calculation, decision trees algorithms were applied on the data set with 10835 molecules and 193 variables and parameter selection was performed with grid search approach. The selection of variables was made according to their level of importance in predicting mutagenicity as a result of models established with the best parameters obtained, and the number of descriptors variables was reduced to the 72 most effective descriptor variables. Various statistical learning algorithms were applied to the reduced data set consisting of the selected variables, and five classification algorithms with the best results were decided. By the algorithms whose model performances were increased by means of parameter optimization, accurate prediction rates were obtained approximately 90% for mutagenicity classification.
Source
Süleyman Demirel Üniversitesi Fen Bilimleri Enstitüsü DergisiVolume
25Issue
2URI
https://doi.org/10.19113/sdufenbed.867067https://app.trdizin.gov.tr/makale/TkRReE9EQXdNQT09
https://hdl.handle.net/20.500.14124/103
Collections
- TRDizin [802]