
ОСОБЛИВОСТІ ПОБУДОВИ ТА ПЕРСПЕКТИВИ ВИКОРИСТАННЯ АНГЛІЙСЬКО-УКРАЇНСЬКОГО ПАРАЛЕЛЬНОГО КОРПУСУ ІТ-ТЕКСТІВ
Author(s) -
Христина МАНДЗІЙ,
Маріанна ДІЛАЙ
Publication year - 2022
Publication title -
problemi gumanìtarnih nauk. serìâ fìlologìâ
Language(s) - Ukrainian
Resource type - Journals
eISSN - 2522-4565
pISSN - 2522-4557
DOI - 10.24919/2522-4565.2021.47.16
Subject(s) - sketch , computer science , algorithm
У статті обґрунтовано актуальність створення англійсько-українського паралельного корпусу текстів сфери інформаційних технологій та окреслено перспективи його використання передусім у перекладацьких і мовознавчих студіях. Особливу увагу приділено опису основних етапів побудови паралельного корпусу, зокрема збору даних, вичитці й унормуванню текстів, вилученню нетекстової інформації, трансформуванню текстів у файли необхідного формату, завантаженню корпусу в корпусний менеджер і текстовий аналізатор «Sketch Engine», додаванню метатекстової розмітки, наданню індивідуального доступу користувачам. Хоч в українській корпусній лінгвістиці вже наявні деякі корпуси (Український національний лінгвістичний корпус (УНЛК), Генеральний регіонально анотований корпус української мови (ГРАК) тощо), нестача порівняльних корпусів, зокрема англійсько-українських, усе ж відчутна. З огляду на потужність і швидкість розвитку в наші дні сфери ІТ і на труднощі перекладу ІТ-текстів, зокрема їх термінів, актуально створити англійсько-український паралельний корпус саме для текстів сфери інформаційних технологій. Основну цінність англійсько-українського паралельного корпусу ІТ-текстів убачаємо в тому, що він може бути джерелом великої кількості перекладацьких рішень, що дасть змогу полегшити процес перекладу ІТ-текстів, покращити їх якість, уникнути стихійності перекладів. Показано також, як побудований корпус текстів можна застосувати для здійснення мовознавчих досліджень ІТ-дискурсу та дійти обґрунтованих висновків стосовно вживання в ньому мовних одиниць, визначення особливостей ІТ-термінології, аналізу структурних моделей і способів перекладу термінів, стосовно виокремлення особливостей стилю тексів сфери ІТ з опертям на реальні контексти і статистичні параметри.