
PENGARUH PENYETELAN HYPERPARAMETER TERHADAP KINERJA PREDIKSI RANDOM FOREST PADA PENDETEKSIAN SPAM
Author(s) -
Nur Salman,
Mustika Sari
Publication year - 2020
Publication title -
jurnal instek (informatika sains dan teknologi)
Language(s) - English
Resource type - Journals
eISSN - 2581-1711
pISSN - 2541-1179
DOI - 10.24252/instek.v5i2.15617
Subject(s) - hyperparameter , statistics , mathematics , computer science , forestry , artificial intelligence , geography
Random Forest memiliki versi modifikasi dan sejumlah hyperparameter yang terpasang “default” pada aplikasi. Penelitian terdahulu telah membahas bahwa penyetelan hyperparameter dapat berpengaruh terhadap kinerja sistem. Namun, penyetelan hyperparameter secara manual bukan pekerjaan yang sederhana untuk sebuah algoritma yang kompleks. Mempertimbangkan bahwa banyak dataset keamanan data yang berdimensi tinggi, maka otomatisasi dan efisiensi menjadi pertimbangan dalam pekerjaan ini. Penyetelan hyperparameter bertujuan membentuk kombinasi hyperparameter yang dapat meningkatkan kinerja prediksi. Penelitian ini memuat perbandingan kinerja evaluasi hasil prediksi dengan penyetelan hyperparameter. Hasil yang diperoleh pada pendeteksian spam dengan 3-fold dan 5-fold-cross-validation, variabel menunjukkan bahwa kinerja prediksi meningkat menjadi 95% dan 95.4% pada Accuracy dan mencapai 98.5% dan 98.7% pada AUC, sementara ukuran tingkat kesalahan menurun hingga .50 dan .46 untuk MMCE dan .75 dan .80 untuk Brier Score.Kata Kunci — penyetelan, hyperparameter, kinerja, prediksi.