Özet
Hastalıkların tedavisini ve önlenmesini sağlayan yeni bir ilacın keşif süreci oldukça maliyetli, karmaşık ve zaman alanbir süreç olduğu için ilaç endüstrisinde kritik bir konudur. Bu çalışma, ilaç keşif sürecinde klinik öncesi aşamayı in silicoolarak da anılan hesaplamalı yöntemler ile kısaltmayı hedeflemektedir. Çalışma kapsamında potansiyel ilaç moleküllerinibelirlemekte etkin ve ilgili olan özelliklerin seçimi için destek vektör makineleri ile iki sezgisel algoritma -sürekli ve ikiliparçacık sürü optimizasyonu- hibritlenmiştir. İlaç molekülleri ve ilgili 161 özellikten oluşan ayrık iki veri seti eğitim vesınama setleri olarak kullanılmış, uygun parametreler seçilerek farklı parçacık sayıları ile hem sürekli hem de ikili olarakkarşılaştırmalı özellik seçimleri gerçekleştirilmiştir. İkili parçacık sürü optimizasyonunda 30 parçacık sayısıyla 49 özellikseçilmiş ve %92,54 doğruluk oranı elde edilmiştir. Diğer taraftan, doğruluk oranı sürekli parçacık sürü optimizasyonunda50 parçacık ve 82 özellik sayısıyla %94.03 olarak bulunmuştur.
The discovery process of a new drug that provides treatment and prevention of diseases is a critical issue in the pharmaceutical industry, as it is a costly, complex and time-consuming process. This study aims to shorten the preclinical stage in the drug discovery process with computational methods, also called in silico. Within the scope of this study, support vector machines have been hybridized with two heuristic algorithms -binary and continues particle swarm optimizations- in order to select the most relevant and informative properties for determining potential drug molecules. Two distinct datasets which consist of drug molecules with related 161 features were used as train and test sets, and both continuous and binary particle swarm optimizations were conducted with tuned parameters and different particle numbers for comparative feature selections. In binary particle swarm optimization, 49 features had been selected with 30 particles and an accuracy rate of 92.54% was obtained. On the other hand, the accuracy rate was found as 94.03% with 50 particles and 82 features by continuous particle swarm optimization.