Sayfalar

7 Kasım 2012 Çarşamba

RapidMiner'da Decision Tree Uygulaması

Merhaba Arkadaşlar,

Bildiğiniz gibi bir önceki yazımda RapidMiner ile ilgili temel bir kaç şeye değindik. Burada internetten bulduğunuz metin dosyası halinde gelen herhangi bir veri setini Excel'e, oradan da RapidMiner'a aktarmayı öğrendik. Bu arada gezinirken keşfettiğim bir dolu veri seti sitesinden en kullanışlı olanı sizlere söylemek istiyorum;
http://archive.ics.uci.edu/ml/datasets.html
Bu adresten uygulamalarınız için deneme amaçlı veri setlerini görebilirsiniz. Zaten veri setlerine ait açıklamalar da ayrıntılı bir biçimde verilmiş.

Bu kez; bir veri seti üzerinde Sınıflandırma metodunun bir algoritması olan Decision Tree uygulamasını sizlere elimden geldiğince anlatmak istiyorum. Veri seti olarak Göğüs Kanseri veri setini kullanacağız. Bu veri setine aşağıdaki linkten erişebilirsiniz:
http://archive.ics.uci.edu/ml/machine-learning-databases/breast-cancer-wisconsin/

Öncelikle RapidMiner'da yeni bir proses başlatalım(File->New). Yeni prosesi başlatıp Read Excel operatörünü çalışma alanına bırakalım. Bir önceki yazımızda anlattığımız üzere bu operatörü indirdiğimiz ve excel ortamına taşıdığımız veri seti ile bağlayalım. Bu kısmı tekrar anlatmayacağım. Bundan sonrasına değinmeye çalışacağım.