Abstract
Bilgisayar teknolojisindeki gelişmelerle birlikte üretilen hem sayısal hem de sayısal olmayan bilgi miktarının arttığı, veri tabanlarının daha fazla veriyi saklayabilecek boyutlara ulaştığı, ayrıca veriye ulaşmanın giderek kolaylaştığı görülmektedir. Veri tabanı sistemlerinin artan kullanımı ve hacimlerindeki olağanüstü artış, ister istemez elde edilen bu büyük hacimli verilerden organizasyonların nasıl yararlanacağı konusunu gündeme getirmiştir. Büyük hacimli veri kümelerinden değerli olan bilginin ve gizli örüntülerin ortaya çıkarılması olayına ?Veri Madenciliği? adı verilmektedir.Bilgisayarların gücündeki artış ve fiyatlarının düşmesi, veri madenciliği kapsamındaki tekniklerin de çeşitlenmesini sağlamıştır. Veri madenciliginin amaçları genellikle sınıflandırma, kümeleme, tahmin öngörü ve benzer gruplama olarak sıralanmaktadır. Amaçlardan biri olan kümeleme, istatistiksel veri analizi, örüntü tanıma vb, birçok alanda oldukça sık kullanılmaktadır. Veritabanlarındaki verilerin gruplar veya kümeler altında toplanarak, benzer özelliklere sahip nesnelerin bir araya gelmesini sağlayan sınıflandırma algoritmaları veri madenciliği alanında büyük öneme sahiptir. Bu tekniklerden biri de ağaç tabanlı sınıflandırma yöntemleri arasında yer alan ?Regresyon Ağaçları? dır. Regresyon ağaçları, sayısal değerlerin kullanılabildiği ve sonuç olarak karar vericilere karar vermelerinde kullanabilecekleri karar kurallarının üretilebildiği bir veri madenciliği yöntemidir.Bu çalışma üç bölümden oluşmuştur. Birinci bölümde veri madenciliği süreci, verilerin hazırlanması, nitelik seçimi, sınıflandırma, modelin değerlendirilmesi konuları açıklanmıştır. İkinci bölümde öğrenme kavramı, karar ağaçlarının elde edilme süreci, karar kuralları ve karar ağaçlarında entropiye dayalı bölünme, regresyon ağaçları ile sınıflandırma esasları ele alınmıştır. Üçüncü bölümde IMKB 30 grubuna dahil menkul kıymetlere ilişkin günlük kapanış fiyatları, menkul kıymet teknik analizlerinde yaygın biçimde kullanılan teknik göstergeler, altın fiyatlarındaki değişmeler, dolar kurundaki değişmeler ve bazı yurtdışı borsa göstergeleri göz önüne alınarak karar ağaçlarının oluşturulması ve bu ağaçlara dayalı olarak karar kurallarının elde edilmesi sağlanmıştır.Analize dahil edilen niteliklerin sayısını azaltmak amacıyla ?Çoklu Doğrusal Regresyon Modelleri? düzenlenmiş, çok sayıdaki modele giren değişkenlerden istatistiksel bakımdan anlamlı olanlar dikkate alınarak bu değişkenleri içeren regresyon ağaçları oluşturulmuştur. Karar kuralları da bu regresyon ağaçlarının yorumlanmasıyla oluşturulmuştur. Bu deneysel işlemlerin sonucunda, bazı menkul kıymetlere ait regresyon modellerinden elde edilen niteliklerin seçilmesiyle daha düşük ortalama hataya sahip regresyon ağaçlarının elde edilebileceği anlaşılmıştır.