Özet
Son yıllarda Bitcoin, kripto para birimi piyasasında en popüler dijital varlık haline gelmiştir. Fiyatları, hızla artan yatırımcı ilgisi nedeniyle son derece dalgalıdır ve bu durum fiyat hareketlerini öngörmeyi zorlaştırmaktadır. Bu bağlamda, Bitcoin fiyat yönünün tahmini, yatırımcıların yatırım stratejilerini belirlemelerine yardımcı olabilmektedir. Finansal piyasalarda fiyat yönünün tahmininde ve alım satım kararlarında makine öğrenimi teknikleri yaygın olarak kullanılmaktadır. Zamana bağlı veriler ve finansal indikatörler kullanılarak gelecekteki fiyat hareketlerini tahmin etmek için makine öğrenmesi modelleri geliştirilebilmektedir. Bitcoin fiyat hareketleri, kripto para birimi piyasasında çok sayıda faktörün etkisi altında olabilmektedir. Bu nedenle, makine öğrenmesi tekniklerinin doğruluğunun ve başarısının belirlenmesi önemlidir. Bu çalışmanın amacı, Bitcoin fiyat hareketleri üzerindeki trend dönüşlerini tahmin etmek için makine öğrenmesi tekniklerini kullanmak ve bu tekniklerin başarı oranlarını karşılaştırmaktır. Bu amaçla, çalışmada trend yönünün değiştiği noktalara odaklanılmıştır. Fiyat yönünün hangi noktada değişeceği tespit edilerek, 'al', 'sat' ve 'bekle' olmak üzere üç sınıflı tahminleme çalışması yapılmıştır. Bu amaçla, 'binance.com' üzerinden 1 Eylül 2017 ile 1 Nisan 2023 tarihleri arasında alınan günlük veriler ile öncelikle fiyatın açılış (open), kapanış (close), günün en yüksek değeri (high), günün en düşük değeri (low) ve Bitcoin ticaret hacmi (volume) bilgileri kullanılarak trend tespiti yapılmış ve finansal göstergeler hesaplanmıştır. Veri inceleme aşamasından sonra bağımsız değişkenlerin çoklu bağlantı problemine yol açmaması amacıyla temel bileşenler analizi ile boyut küçültme çalışması yapılmıştır. 'al', 'sat' ve 'bekle' sınıfları alt örnekleme (under sampling) yöntemi ile dengelenerek, Aşırı Gradyan Arttırma (XGB), Rastgele Orman (RF), Rastgele Ağaçlar (RT), Yapay Sinir Ağları (ANN), Destek Vektör Makineleri (SVM), Bayes Ağları (BN) ve K En Yakın Komşu (KNN) modelleri geliştirilmiş ve sonuçlar, kesinlik (precision), duyarlılık (recall), özgüllük (specificity), F1 puanı (F1 score) ve doğruluk (accuracy) başarı kriterlerine göre değerlendirilmiştir. ANN, SVM, BN ve KNN modellerinin ağaç tabanlı algoritmalara göre çok daha düşük performans gösterdiği görüldüğünden, çalışmada sadece XGB, RF ve RT model sonuçlarının karşılaştırması verilmiştir. Çalışma sonucunda, XGB modelinin diğer modellere göre daha yüksek başarıya sahip olduğu görülmüştür.