
Integrasi SMOTE pada Naive Bayes dan Logistic Regression Berbasis Particle Swarm Optimization untuk Prediksi Cacat Perangkat Lunak
Author(s) -
Andre Hardoni
Publication year - 2021
Publication title -
jurnal sistem dan teknologi informasi
Language(s) - English
Resource type - Journals
eISSN - 2620-8989
pISSN - 2460-3562
DOI - 10.26418/justin.v9i2.43173
Subject(s) - physics , computer science
Menurut sedano, ralph dan praire cacat perangkat lunak merupakam salah satu penyumbang utama pada limbah teknologi informasi dan menyebabkan pengerjaan ulang, sehingga menghabiskan banyak waktu dan biaya. Prediksi cacat perangkat lunak memiliki tujuan untuk melakukan pencegahan cacat dengan mengklasifikasikan modul tertentu sebagai cacat atau tidak cacat. Banyak peneliti yang telah melakukan penelitian dibidang cacat perangkat lunak dengan memanfaatkan NASA MDP dataset yang bersifat public, namun dataset-dataset tersebut masih memiliki kekurangan seperti ketidakseimbangan kelas dan noise attribute. Masalah ketidakseimbangan kelas dapat diatasi dengan memanfaatkan SMOTE (Synthetic Minority Over-sampling Technique) dan masalah noise attribute dapat diatasi dengan seleksi fitur dengan memanfaatkan Particle Swarm Optimization (PSO), sehingga pada penelitian ini dilakukan integrasi antara SMOTE dan PSO yang diterapkan pada teknik klasifikasi machine learning naïve bayes dan logistic regression. Dari hasil percobaan yang telah dilakukan pada 8 dataset NASA MDP dengan membagi dataset ke dalam data training dan testing diperoleh hasil bahwa integrasi SMOTE + PSO pada masing-masing teknik klasifikasi dapat meningkatkan kinerja pengklasifikasian dengan nilai AUC (Area Under Curve) tertinggi rata-rata 0,89 pada logistic regression dan 0,86 pada naïve bayes pada pembagian training dantesting 70:30 dan sekaligus lebih baik dibanding dengan tanpa mengkombinasikan keduanya.