Open Access
Ekstraksi Teks Pada Halaman Website Renungan Rohani Menggunakan HTML Agility Pack
Author(s) -
James Wijaya
Publication year - 2019
Publication title -
journal of information system, graphics, hospitality and technology
Language(s) - Spanish
Resource type - Journals
eISSN - 2685-449X
pISSN - 2622-1594
DOI - 10.37823/insight.v1i02.43
Subject(s) - computer science , physics , humanities , philosophy
Dengan adanya perkembangan teknologi informasi, orang-orang dapat mengakses berbagai informasi dari berbagai halaman web dengan menggunakan internet. Web Santapan Rohani adalah salah satu contoh website yang dapat digunakan oleh orang-orang terlebih khusus umat Kristiani untuk membaca renungan harian atau untuk melakukan saat teduh. Penelitian ini bertujuan menciptakan suatu teknologi ekstraksi informasi dari web Santapan Rohani yang berisikan renungan harian sehingga dapat membantu untuk analisa bagi penelitian-penelitian berikutnya yang dapat dikembangkan dari kehadiran teknologi ini. Halaman web memiliki bentuk yang semi-structured dan berisikan informasi berupa teks, gambar, video, URL, dan sebagainya. Hal ini menjadi kendala untuk dapat melakukan ekstraksi informasi dari halaman web. HTML Agility Pack merupakan salah satu tools terbaik yang dapat digunakan untuk melakukan HTML Parser dari suatu halaman web. Dengan menggunakan HTML Agility Pack dapat mempermudah untuk melakukan ekstraksi informasi dari berbagai halaman web, terlebih khusus untuk melakukan ekstraksi informasi pada renungan harian dari Web Santapan Rohani.