z-logo
open-access-imgOpen Access
Metode Cluster Importance Untuk Peringkasan Dokumen Pada Data Tweet Berbahasa Indonesia (Study Kasus Pilkada Dki Jakarta)
Author(s) -
Dyah Hestiningtyas,
Nur Hayatin,
Yuda Munarko
Publication year - 2020
Publication title -
jurnal repositor
Language(s) - English
Resource type - Journals
eISSN - 2716-1382
pISSN - 2714-7975
DOI - 10.22219/repositor.v2i6.665
Subject(s) - humanities , automatic summarization , physics , computer science , art , artificial intelligence
Abstrak Pemanfaatan media elektronik sebagai media informasi berkembang sangat pesat di era sekarang. Terbukti meningkatnya jumlah informasi dan data. Banyaknya data yang ada diharapkan dapat memberikan manfaat yang banyak pula. Automatic Text Summarization merupakan salah satu proses peringkasan teks dokumen yang dilakukan secara otomatis melalui mesin komputer. Pada penelitian ini penulis membahas tentang peringkasan dokumen pada tweet, dimana data yang digunakan dengam mengumpulkan tweet melalui web crawler dengan memanfaatkan API Twitter . Pada paper ini diajukan sebuah metode Cluster Importance dan melakukan pemilihan tweet representatif pada setiap cluster berdasarkan bobot tweet terpenting pada suatu cluster . Yang nantinya bobot tweet  tertinggi dipilih sebagai tweet penyusun ringkasan. Penelitian ini menggunakan 25 topik. hasil dari perhitungan Rouge-N yaitu: Dari 25 topik data uji ada 3topik yang mempunyai Iterasi 1 yaitu topik HUT DKI, Kinerja Djarot, dan Pemimpin dikarenakan jumlah tweet pada topik tersebut sama - sama memiliki 2 tweet. Pengujian perbandingan antara hasil manual dan hasil sistem menunjukan hasil 100% pada topik Dukungan. Perhitungan Rouge-N menyimpulkan bahwa sistem dapat merangkum tweet minimal 3 tweet, dari perbandingan hasil sistem dan manual di dapatkan tweet minimal mempunyai nilai 96% yang di mana sistem bekerja dengan baik, serta pada topik yang memiliki 18 tweet menunjukan hasil 89%. The use of electronic media as an information media is developing very rapidly in the present era. Proven increasing amount of information and data. The amount of data available is expected to provide many benefits too. Automatic Text Summarization is one of the process of summarizing document text that is automatically through a computer machine. In this study the author discusses about  the summarization of documents on tweets, where the data is used by collecting tweets through web crawlers by utilizing the Twitter API. This paper proposes a Cluster Importance method and selected representative tweets on each cluster based on the weight of the most important tweets in a cluster. The highest tweet will be selected as summary compiler tweets. This study uses 25 topics. the results of Rouge-N are: in the 25 topics of the test data there are 3 topics that have Iteration 1 namely the topic of HUT DKI, Kinerja Djarot, and Pemimpin because the same number of tweets on the topic has 2 tweets. Testing the comparison between manual results and system results shows 100% results on the topics Ahok, Korupsi, Dukungan, and Pajak .

The content you want is available to Zendy users.

Already have an account? Click here to sign in.
Having issues? You can contact us here
Accelerating Research

Address

John Eccles House
Robert Robinson Avenue,
Oxford Science Park, Oxford
OX4 4GP, United Kingdom