Open Access
ANALIZA RAZLIČITIH MODELA ZA PREPOZNAVANJE IMENOVANIH ENTITETA NA SRPSKOM JEZIKU
Author(s) -
Aleksandar Cvejić
Publication year - 2022
Publication title -
zbornik radova fakulteta tehničkih nauka/zbornik radova fakulteta tehničkih nauka
Language(s) - Bosnian
Resource type - Journals
eISSN - 2560-5925
pISSN - 0350-428X
DOI - 10.24867/16be40cvejic
Subject(s) - physics , transformer , humanities , art , voltage , quantum mechanics
Zadatak ovog rada jeste analiza različitih pristupa za prepoznavanje imenovanih entiteta (Named Entity Recognition, NER) u srpskom jeziku. Rad poredi performanse Conditional Random Fields (CRF) modela i transformer modela na NER zadatku. Kao transformer modeli korišćeni su BERT, DistilBERT i Electra transformer modeli. CRF se direktno trenira za NER zadatku, dok se transformer modeli treniraju u 3 koraka: (1) treniranje tokenizera, (2) pretreniranje generalnog jezičkog modela i (3) dotreniranje na NER zadatku. U radu se prikazuju rezultati više konfiguracija CRF modela, treniranim na različitim karakteristikama i rezultati transformer modela.