
Pengklarifikasian Dokumen PDF Menggunakan Fungsi Cosine untuk Pencarian Informasi
Author(s) -
Jeremy Jonathan
Publication year - 2018
Publication title -
journal of business and audit information system
Language(s) - Slovenian
Resource type - Journals
eISSN - 2620-7907
pISSN - 2615-6431
DOI - 10.30813/.v1i1.1140
Subject(s) - physics , humanities , art
Dalam pengklasifikasian informasi dokumen kita dapat menggunakan sistem temu kembali informasi (Information Retrieval) . Information Retrieval (IR) adalah proses dimana pengumpulan data diwakili, disimpan, dan mencari tujuan penemuan pengetahuan sebagai tanggapan atas permintaan pengguna ( query ). Penuangan informasi dalam bentuk teks untuk sebuah materi atau ulasan yang dibahas dapat dituangkan dalam berbagai bentuk gaya ulasan yang berbeda, dikarenakan adanya perbedaan gaya mengulas untuk suatu ulasan atau topik pada dokumen maka membutuhkan waktu relatif lebih lama untuk memahami materi dokumen tersebut serta mengklasifikannya. Hal ini menyebabkan sulitnya bagi pengembang sistem untuk membuat sebuah sistem yang mampu memahami isi materi atau topik dari sebuah dokumen secara tepat. Untuk memecahkan masalah tersebut penulis menggunakan salah satu model information retrieval yaitu vector space model dengan algoritma K-NN dan Stemming nazief adriani dengan pembobotan frekuensi kata ( 15logfin"> ) dalam dokumen serta fungsi kesamaan cosine . Hasil efektifitas yang didapat pada penelitian ini dalam hal meninjau efektifitas penggunaan pembobotan frekuensi kata ( 15logfin"> ) dalam dokumen pada vector space model dengan fungsi similarity cosine. Dari hasil pengujian tersebut didapat nilai K=5 adalah 93.33% untuk precision dan 54.67% untuk recall . Dan nilai K=3 adalah 96.33% untuk precision dan 66.67% untuk recall .