
AUTOMATSKO ODREĐIVANJE TEMA KNJIGA POMOĆU TEHNIKA ZA PROCESIRANJE PRIRODNOG JEZIKA
Author(s) -
Vlada Đurđević
Publication year - 2019
Publication title -
zbornik radova fakulteta tehničkih nauka/zbornik radova fakulteta tehničkih nauka
Language(s) - Bosnian
Resource type - Journals
eISSN - 2560-5925
pISSN - 0350-428X
DOI - 10.24867/06be45djurdjevic
Subject(s) - physics , humanities , art
Ovaj rad bavi se analizom performansi LDA modela kreiranog sa ciljem određivanja tema koje se pojavljuju u nekom korpusu knjiga. Opisan je skup podataka sa kojim se radi kao i svi problemi koji se javljaju prilikom implementacije ovakvog modela. Detaljno su analizirana četiri glavna koraka kreiranja modela, pretpocesiranje podataka, NER metoda, određivanje optimalnog broja tema i izbor konkretnog algoritma za implementaciju. Za svaki od koraka su demonstrirani različiti pristupi rešavanju problema koji se javljaju. Izvršena je evaluacija rezultata za svaki od ovih pristupa nakon čega je odabran optimalan pristup sa ciljem da čini sastavni deo krajnjeg modela.