Cost Sensitive Tree dan Naïve Bayes pada Klasifikasi Multiclass
Author(s) -
M. Aldiki Febriantono,
Ridho Herasmara,
Gusti Pangestu
Publication year - 2021
Publication title -
jurnal informatika polinema
Language(s) - English
Resource type - Journals
eISSN - 2614-6371
pISSN - 2407-070X
DOI - 10.33795/jip.v7i2.533
Subject(s) - mathematics , naive bayes classifier , statistics , artificial intelligence , computer science , support vector machine
Data mining merupakan proses pengolahan data untuk mengambil keputusan secara cepat, tepat dan akurat. Data mining pada bidang kesehatan dan manufacturing menjadi hal yang sangat penting dikarenakan suatu kesalahan klasifikasi (misclassification) akan memiliki dampak serius. Masalah utama pada data mining ketika data yang digunakan bersifat imbalanced multiclass karena classifier kesulitan untuk mengklasifikasikan data sehingga menyebabkan terjadinya misclassification. Solusi untuk meminimalkan missclasification dengan menggunakan metode cost sensitive pada classifier decision tree C5.0 dan naive bayes. Penelitian ini menggunakan dataset glass, lympografi, vehicle, thyroid dan wine yang diperoleh dari UCI Respository. Kelima dataset dilakukan proses seleksi atribut menggunakan particle swarm optimazation. Kemudian dataset diuji menggunakan metode cost sensitive decision tree C5.0 dan cost sensitive naive bayes. Hasil pengujian menggunakan metode cost sensitive decision tree C5.0 diperoleh nilai accuracy pada dataset glass, lympografi, vehicle, thyroid dan wine berturut-turut sebesar 76.17%, 83.33%, 75.27%, 95.81% dan 95.83%. Sedangkan metode cost sensitive naive bayes memiliki performa accuracy pada dataset berturut-turut sebesar 32.24%, 82.61%, 25.53%, 97.67% dan 94.94%.
Accelerating Research
Robert Robinson Avenue,
Oxford Science Park, Oxford
OX4 4GP, United Kingdom
Address
John Eccles HouseRobert Robinson Avenue,
Oxford Science Park, Oxford
OX4 4GP, United Kingdom