Minggu, 15 Maret 2015

Rapidminer for Datamining

Before you begin , you first specify the dataset you want to enter into RapidMiner , my research related to data mining , using the dataset of Uci.Dataset entered into excel . Example dataset , as drawn below

Jumat, 28 Februari 2014

Rapidminer untuk Data Mining

Sebelum memulai, anda tentukan dulu dataset yang anda ingin masukkan kedalam rapidminer, penelitian saya berhubungan dengan datamining, dataset menggunakan dari Uci.Dataset dimasukkan ke excel. Contoh dataset, seperti digambar bawah ini
Anda tentukan mana saja atributnya dan labelnya. Untuk dataset diatas, atributnya ada 85 atribut, labelnya hanya 1 , CARAVAN, jumlah recordnya 5820. Nama file excel diatas misalkan datavalid.xls.
Berikutnya kita masuk ke Rapidminer.dan masukkan tool untuk memasukkan file excel
Kemudian masukkan tool validation, digunakan untuk training dan akurasi
Tarik garis dari ave di validation  ke sebelah kanan. Double click validation, akan muncul gambar dibawah ini

Anda tentukan dulu, mau menggunakan metode apa? Naive Bayes, NeuralNetwork, SVM, K-NearesNeighbor DTree, atau KMeans, misalkan kita gunakan K-Nearest Neighbor, maka tambahkan tool nya di kotak training

kemudian kita tambahkan tool ApplyModel dan Performance di kotak Testing
Kemudian kita kembali ke main proses dengan menekan tombol panah biru yang menghadap keatas
Klik tool read excel, klik tombol configurstion wizard pada sebelah kanan atas.
pilih file excel,klik next,next,next,
pilih salah satu kolom menjadi label dan dirubah menjadi nominal
klik finish
Silahkan di-RUN dengan menekan tombol panah warna biru.
hasilnya

hasil akurasinya, 89.27%
dan kurva ROC atau ROC Curve

Jika ingin meningkatkan akurasi bisa menggunakan tool weight ChiSquare, Information Gain, SVM, Forward, Backward  atau yang lain.
Saya pernah menggunakan metode ANN, Fuzzy, KNN
Jika ingin berdiskusi, silahkan menghubungi lewat email
email:dewajat@gmail.com