
DESIGN AND DEVELOPMENT OF INSTRUMENTAL TOOLS FOR SEMANTIC ANALYSIS OF BIG DATA SCIENTIFIC AND TECHNOLOGICAL SOLUTIONS IN THE FIELD OF ENERGY
Author(s) -
Алексей Николаевич Копайгородский,
Елена Павловна Хайруллина
Publication year - 2022
Publication title -
informacionnye i matematičeskie tehnologii v nauke i upravlenii
Language(s) - English
Resource type - Journals
ISSN - 2413-0133
DOI - 10.38028/esi.2021.24.4.010
Subject(s) - computer science , python (programming language) , field (mathematics) , data science , ontology , information retrieval , world wide web , programming language , philosophy , mathematics , epistemology , pure mathematics
В статье рассмотрены подходы к проектированию и реализации отдельных компонентов инструментальных средств для семантического анализа извлекаемой из открытых источников информации о научных и технологических решениях в области энергетики. Рассмотрена структура билингвистической онтологии, позволяющая решать задачу классификации информации с учётом ее представления в различных языках и синонимии. Рассмотрен подход к поиску и обработке информации из открытых источников, основанный на применении разработанных авторами средств семантического анализа, реализация которых выполнялась на Python с использованием библиотеки Natural Language Toolkit. The article discusses approaches to the design and implementation of individual components of instrumental tools for semantic analysis of information on scientific and technological solutions in the field of energy. This information has already been placed open sources. The structure of billinguistic ontology is considered, which makes it possible to solve the task of classifying information, taking into account its submission in various languages and synonyms. The authors reviewed the approach to the search and processing of information from open sources based on the use of semantic analysis developed by authors, the implementation of which was performed on Python using the Natural Language Toolkit library