z-logo
open-access-imgOpen Access
Luščenje definicijskih kandidatov iz specializiranih korpusov
Author(s) -
Senja Pollak
Publication year - 2014
Publication title -
slovenščina 2.0
Language(s) - Slovenian
Resource type - Journals
SCImago Journal Rank - 0.165
H-Index - 1
ISSN - 2335-2736
DOI - 10.4312/slo2.0.2014.1.1-40
Subject(s) - physics
Predstavljamo metodo za luščenje definicij iz specializiranih korpusov. Metoda je bila razvita za slovenščino in angleščino, sestavljajo pa jo trije pristopi: v prvem definicije luščimo z leksikoskladenjskimi vzorci, drugi uporablja avtomatsko izluščeno terminologijo, tretji pa lušči stavke, v katerih se nahajata pojem in njegova nadpomenka iz semantičnega leksikona wordnet. Metodologijo smo preizkusili na primeru področja jezikovnih tehnologij. Za namene modeliranja izbranega področja smo zgradili primerljivi slovensko-angleški Korpus jezikovnih tehnologij, izluščene kandidate pa smo uporabili pri gradnji Glosarja jezikovnih tehnologij. Celotno metodologijo smo strnili v prosto dostopen delotok, implementiran v spletnem okolju za gradnjo delotokov Clowdflows. V delotok lahko uporabnik prek spleta naloži korpus v različnih formatih, ga jezikoslovno označi, izlušči terminologijo in kandidate za definicije ter rezultate vizualizira ali shrani.

The content you want is available to Zendy users.

Already have an account? Click here to sign in.
Having issues? You can contact us here