
Pemodelan CNN Untuk Deteksi Emosi Berbasis Speech Bahasa Indonesia
Author(s) -
Yulistia Khoirotul Aini,
Tri Budi Santoso,
Titon Dutono
Publication year - 2021
Publication title -
jurnal komputer terapan
Language(s) - Spanish
Resource type - Journals
eISSN - 2460-5255
pISSN - 2443-4159
DOI - 10.35143/jkt.v7i1.4623
Subject(s) - speech recognition , humanities , computer science , art
Di dalam interaksi antara manusia dan komputer diperlukan kemampuan untuk melakukan pengenalan, penafsiran, dan memberikan respons emosi yang diekspresikan dalam ucapan. Sampai saat ini penelitan speech emotion recognition (SER) yang berbasis bahasa Indonesia masih sangat sedikit. Hal ini disebabkan keterbatasan korpus data berbahasa Indonesia untuk SER. Pada penelitian ini dibuat sistem SER dengan mengambil dataset dari TV series berbahasa Indonesia. Sistem dirancang dengan kemampuan untuk melakukan proses klasifikasi emosi, yaitu empat kelas label emosi marah, senang, netral dan sedih. Untuk implementasinya digunakan metode deep learning, yang dalam hal ini dipilih metode CNN. Pada sistem ini input berupa kombinasi dari tiga fitur, yaitu MFCC, frekuensi fundamental, dan RMSE. Dari eksperimen yang telah dijalankan telah diperoleh hasil terbaik untuk sistem SER berbahasa Indonesia dengan menggunakan input MFCC + frekuensi fundamental, yang menunjukkan tingkat akurasi sebesar 85%. Sedangkan akurasi terendah ketika menggunakan fitur MFCC +RMSE yaitu 72%. Dari study awal ini diharapkan mampu memberikan gambaran bagi para peneliti di bidang SER, tentang bagaimana memilih fitur sinyal wicara sebagai input di dalam pengujian dan mempermudah untuk langkah pengembangan penelitiannya.