Before you begin , you first specify the dataset you want to enter into RapidMiner , my research related to data mining , using the dataset of Uci.Dataset entered into excel . Example dataset , as drawn below
Praktek Rapidminer
Minggu, 15 Maret 2015
Jumat, 28 Februari 2014
Rapidminer untuk Data Mining
Sebelum memulai, anda tentukan dulu dataset yang anda ingin masukkan kedalam rapidminer, penelitian saya berhubungan dengan datamining, dataset menggunakan dari Uci.Dataset dimasukkan ke excel. Contoh dataset, seperti digambar bawah ini
Anda tentukan mana saja atributnya dan labelnya. Untuk dataset diatas, atributnya ada 85 atribut, labelnya hanya 1 , CARAVAN, jumlah recordnya 5820. Nama file excel diatas misalkan datavalid.xls.
Berikutnya kita masuk ke Rapidminer.dan masukkan tool untuk memasukkan file excel
Kemudian masukkan tool validation, digunakan untuk training dan akurasi
Tarik garis dari ave di validation ke sebelah kanan. Double click validation, akan muncul gambar dibawah ini
Anda tentukan dulu, mau menggunakan metode apa? Naive Bayes, NeuralNetwork, SVM, K-NearesNeighbor DTree, atau KMeans, misalkan kita gunakan K-Nearest Neighbor, maka tambahkan tool nya di kotak training
kemudian kita tambahkan tool ApplyModel dan Performance di kotak Testing
Kemudian kita kembali ke main proses dengan menekan tombol panah biru yang menghadap keatas
Klik tool read excel, klik tombol configurstion wizard pada sebelah kanan atas.
pilih file excel,klik next,next,next,
pilih salah satu kolom menjadi label dan dirubah menjadi nominal
klik finish
Silahkan di-RUN dengan menekan tombol panah warna biru.
hasilnya
hasil akurasinya, 89.27%
dan kurva ROC atau ROC Curve
Jika ingin meningkatkan akurasi bisa menggunakan tool weight ChiSquare, Information Gain, SVM, Forward, Backward atau yang lain.
Saya pernah menggunakan metode ANN, Fuzzy, KNN
Jika ingin berdiskusi, silahkan menghubungi lewat email
email:dewajat@gmail.com
Anda tentukan mana saja atributnya dan labelnya. Untuk dataset diatas, atributnya ada 85 atribut, labelnya hanya 1 , CARAVAN, jumlah recordnya 5820. Nama file excel diatas misalkan datavalid.xls.
Berikutnya kita masuk ke Rapidminer.dan masukkan tool untuk memasukkan file excel
Kemudian masukkan tool validation, digunakan untuk training dan akurasi
Tarik garis dari ave di validation ke sebelah kanan. Double click validation, akan muncul gambar dibawah ini
Anda tentukan dulu, mau menggunakan metode apa? Naive Bayes, NeuralNetwork, SVM, K-NearesNeighbor DTree, atau KMeans, misalkan kita gunakan K-Nearest Neighbor, maka tambahkan tool nya di kotak training
kemudian kita tambahkan tool ApplyModel dan Performance di kotak Testing
Kemudian kita kembali ke main proses dengan menekan tombol panah biru yang menghadap keatas
Klik tool read excel, klik tombol configurstion wizard pada sebelah kanan atas.
pilih file excel,klik next,next,next,
pilih salah satu kolom menjadi label dan dirubah menjadi nominal
klik finish
Silahkan di-RUN dengan menekan tombol panah warna biru.
hasilnya
hasil akurasinya, 89.27%
dan kurva ROC atau ROC Curve
Jika ingin meningkatkan akurasi bisa menggunakan tool weight ChiSquare, Information Gain, SVM, Forward, Backward atau yang lain.
Saya pernah menggunakan metode ANN, Fuzzy, KNN
Jika ingin berdiskusi, silahkan menghubungi lewat email
Langganan:
Komentar (Atom)









