z-logo
open-access-imgOpen Access
Języki słowiańskie i litewski w korpusach równoległych Clarin-PL
Author(s) -
Violetta Koseska–Toszewa,
Roman Roszko
Publication year - 2016
Publication title -
studia z filologii polskiej i słowiańskiej
Language(s) - English
Resource type - Journals
SCImago Journal Rank - 0.123
H-Index - 2
eISSN - 2392-2435
pISSN - 0081-7090
DOI - 10.11649/sfps.2016.011
Subject(s) - slavic languages , lithuanian , linguistics , computer science , scope (computer science) , philosophy , programming language
Slavic languages and the Lithuanian language in the Clarin-PL parallel corpora The Clarin Eric and Clarin-PL strategic scientific purpose is to support humanistic research in a multicultural and multilingual Europe. Polish researchers put the emphasis on building a bridge between the Polish language and Polish linguistic technologies and other European languages and their linguistic technologies. So far, the Polish scientific community has mainly focused on Polish-English connections. Clarin-PL has been developing the first and only multilingual corpora of the Polish language in conjunction with other Slavic languages and the Lithuanian language: the Polish-Bulgarian-Russian Parallel Corpus and the Polish- Lithuanian Parallel Corpus. The parallel corpora created by the ISS PAS Corpus Linguistics and Semantics Team break through the existing “canons” and allow scientists access to interlinked multilingual language resources – in the first phase limited to the languages of the three Slavic groups and the Lithuanian language. In the article, the authors present very detailed information on their original system of the semantic annotation of scope quantification in multilingual parallel corpora, hitherto unused in the subject literature. Due to the system’s originality, the semantic annotation is carried out manually. Identification of particular values of scope quantification in a sentence and the hereby presented attempts of its recording are supported by long-term research conducted by an international team of linguists and computer scientists / mathematicians developing the issue of quantification of names, time and aspect in natural languages. Jezyki slowianskie i litewski w korpusach rownoleglych Clarin-PL Strategicznym celem naukowym Clarin ERIC i Clarin-PL jest wspieranie badan humanistycznych w wielokulturowej i wielojezycznej Europie. Dla polskich badaczy wazna jest budowa pomostu miedzy jezykiem polskim, polskimi technologiami jezykowymi a innymi jezykami europejskimi i na ich rzecz opracowanymi technologiami jezykowymi. Dotychczas w nauce polskiej najwiekszy nacisk byl kladziony na powiązania polsko-angielskie. Clarin-PL opracowuje zatem pierwsze jak dotąd wielojezyczne korpusy jezyka polskiego w zestawieniu z innymi jezykami slowianskimi oraz z jezykiem litewskim: Korpus rownolegly polsko-bulgarsko-rosyjski i Korpus rownolegly polsko-litewski. Tworzone przez Zespol Lingwistyki Korpusowej i Semantyki (IS PAN) korpusy rownolegle przelamują dotychczasowe „kanony” i udostepniają nauce powiązane wielojezyczne zasoby – w pierwszym etapie ograniczone do jezykow trzech grup slowianskich oraz jezyka litewskiego. W artykule autorzy przedstawiają bardzo szczegolową informacje o zastosowanej po raz pierwszy w literaturze przedmiotu anotacji semantycznej dotyczącej kwantyfikacji zakresowej w wielojezycznych korpusach rownoleglych. Z powodu swojego rozleglego zakresu i nowatorstwa ta anotacja semantyczna jest nanoszona recznie. Identyfikacja poszczegolnych wartości kwantyfikacji zakresowej w zdaniu oraz przedstawiane tu proby jej zapisu są poparte wieloletnimi badaniami miedzynarodowego zespolu lingwistow i matematykow-informatykow opracowujących zagadnienie kwantyfikacji imion, czasu i aspektu w jezykach naturalnych.

The content you want is available to Zendy users.

Already have an account? Click here to sign in.
Having issues? You can contact us here
Accelerating Research

Address

John Eccles House
Robert Robinson Avenue,
Oxford Science Park, Oxford
OX4 4GP, United Kingdom