z-logo
open-access-imgOpen Access
Analisis Morfologi untuk Menangani Out-of-Vocabulary Words pada Part-of-Speech Tagger Bahasa Indonesia Menggunakan Hidden Markov Model
Author(s) -
Febyana Ramadhanti,
Yudi Wibisono,
Rosa Ariani Sukamto
Publication year - 2019
Publication title -
jurnal linguistik komputasional
Language(s) - English
Resource type - Journals
ISSN - 2621-9336
DOI - 10.26418/jlk.v2i1.13
Subject(s) - computer science , hidden markov model , artificial intelligence , natural language processing , vocabulary , speech recognition , part of speech , linguistics , philosophy
Part-of-speech (PoS) tagger merupakan salah satu task dalam bidang natural language processing (NLP) sebagai proses penandaan kategori kata (part-of-speech) untuk setiap kata pada teks kalimat masukan. Hidden markov model (HMM) merupakan algoritma PoS tagger berbasis probabilistik, sehingga sangat tergantung pada train corpus. Terbatasnya komponen dalam train corpus dan luasnya kata dalam bahasa Indonesia menimbulkan masalah yang disebut out-of-vocabulary (OOV) words. Penelitian ini membandingkan PoS tagger yang menggunakan HMM+AM (analisis morfologi) dan PoS tagger HMM tanpa AM, dengan menggunakan train corpus dan testing corpus yang sama. Testing corpus mengandung 30% tingkat OOV dari 6.676 token atau 740 kalimat masukan. Hasil yang diperoleh dari sistem HMM saja memiliki akurasi 97.54%, sedangkan sistem HMM dengan metode analisis morfologi memiliki akurasi tertinggi 99.14%. 

The content you want is available to Zendy users.

Already have an account? Click here to sign in.
Having issues? You can contact us here