
Peringkasan Multi Dokumen Berita Dengan Pemilihan Kalimat Utama Berbasis Algoritma Cluster Importance Dengan Mempertimbangkan Posisi Kalimat
Author(s) -
Syadza Anggraini,
Nur Hayatin,
Gita Indah Marthasari
Publication year - 2020
Publication title -
jurnal repositor
Language(s) - English
Resource type - Journals
eISSN - 2716-1382
pISSN - 2714-7975
DOI - 10.22219/repositor.v2i1.161
Subject(s) - computer science , humanities , art
AbstrakPeringkasan teks merupakan salah satu cara untuk mengurangi suatu dimensi dokumen yang besar untuk mendapatkan informasi penting dari dokumen tersebut. Berita adalah salah satu informasi yang biasanya dalam satu topik memiliki beberapa sub topik. Untuk dapat mengambil informasi penting dari satu topik secara cepat, peringkasan multi dokumen berita dapat menjadi solusi. Namun, peringkasan multi dokumen dapat menimbulkan redundansi. Oleh sebab itu, penelitian ini menerapkan algoritma cluster importance dengan mempertimbangkan posisi kalimat untuk mengatasi redundansi tersebut. Penelitian ini menggunakan 30 topik berita berbahasa Indonesia, dimana tiap topiknya terdiri dari 5 sub topik berita. Dari 30 topik berita yang diuji menggunakan Rouge-1, dimana terdapat 2 topik berita yang memiliki nilai Rouge-1 berbeda antara yang menggunakan algoritma cluster importance ditambah posisi kalimat dengan yang hanya menggunakan algoritma cluster. Namun dari 2 topik berita tersebut, nilai Rouge-1 yang menggunakan cluster importance ditambah posisi kalimat memiliki nilai yang lebih besar daripada yang hanya menggunakan cluster importance. Penggunaan posisi kalimat memiliki pengaruh terhadap urutan bobot kalimat pada setiap topiknya, namun hanya 2 topik berita yang berpengaruh terhadap hasil ringkasan. Abstract Text summarization is one of way to reduce large document dimension to get an important point of information. News is one of information which usually has some sub topics from one topic. In order to get the main information from one topic as fast as possible, multi document summarization is the solution. But sometimes it can create redundancy. So in this study, we applied cluster importance algorithm by considering sentence position to overcome the redundancy.This study used 30 topics of Indonesian news, where each topic consists 5 news sub topics. From 30 news topics where it has tested using Rouge-1, there are 2 news topics that have a Rouge-1 score differ between which used cluster importance algorithm by considering sentence position and which only used cluster importance. But, those 2 news topics which used cluster importance by considering sentence position have a greater score of Rouge-1 than which only used cluster importance. The use of sentence position had an effect on the order of sentence weights on each topic, but there was only 2 news topics that affect the outcome of the summary.