z-logo
open-access-imgOpen Access
Stemming Kata Berimbuhan Tidak Baku Bahasa Indonesia Menggunakan Algoritma Jaro-Winkler Distance
Author(s) -
Mudawil Qulub,
Ema Utami,
Andi Sunyoto
Publication year - 2020
Publication title -
citec (creative information technology) journal/citec journal
Language(s) - English
Resource type - Journals
eISSN - 2460-4259
pISSN - 2354-5771
DOI - 10.24076/citec.2018v5i4.218
Subject(s) - indonesian , computer science , humanities , linguistics , art , philosophy
Bahasa merupakan media untuk mengekspresikan keinginan, gagasan, dan perasaan. Dalam kaitannya dengan bahasa indonesia, bahasa dapat mencerminkan prilaku dalam sebuah masyarakat. Bahasa indonesia dapat digunakan secara formal maupun non-formal. Bahasa non-formal berbentuk kata tidak baku yang biasanya digunakan dalam komentar atau posting dalam media sosial. Salah satu contoh kata tidak baku adalah “nemenin” yang kata formalnya “menemani” dan kata dasarnya adalah “teman”. Dalam penelitian ini akan dilakukan pengujian akurasi algoritma Jaro-Winkler distance dalam mengubah kata imbuhan tidak baku menjadi bentuk dasarnya, proses ini disebut dengan stemming. Penelitian ini menggunakan data sebanyak 60 kata berimbuhan tidak baku. Hasil pengujian menunjukkan tingkat akurasi algoritma Jaro-Winkler sebesar 85% atau 51 kata berhasil di-stemming (3 overstemming, 6 unstemming, 0 understemming).Kata Kunci—Kata Imbuhan Tidak Baku, Stemming, Jaro-Winkler DistanceLanguage that represents the media to attract interest, regulate, and feel. In reversing it with Indonesian, language can reflect behavior in a society. Indonesian can be used formally or informally. Non-formal language in the form of non-formal words used in comments or posts on social media. One example of a non-formal word is "accompanying" the formal word "accompany" and the basic word is "friend". In this research, the Jaro-Winkler algorithm will be tested the distance in changing non-formal affix words into a form of interaction, this process is called stemming. This research uses data as many as 60 words that are not standardized. The test results show the level of testing of the Jaro-Winkler algorithm is 85% or 51 words successfully stemmed (3 overstemming, 6 unstemming, 0 understemming).Keywords— Non-Formal Affix, Stemming, Jaro-Winkler Distance

The content you want is available to Zendy users.

Already have an account? Click here to sign in.
Having issues? You can contact us here