
To the Question of Developing an Information System for Processing Textual Information on the Basis of Semantic Groups
Author(s) -
S V Mochenov,
M V Vtyurin,
R. R. Ahmetgaleev
Publication year - 2018
Publication title -
vestnik iževskogo gosudarstvennogo tehničeskogo universiteta/vestnik ižgtu imeni m.t. kalašnikova
Language(s) - Russian
Resource type - Journals
eISSN - 2413-1172
pISSN - 1813-7903
DOI - 10.22213/2413-1172-2018-3-166-171
Subject(s) - basis (linear algebra) , computer science , information retrieval , natural language processing , artificial intelligence , mathematics , geometry
Рассматривается информационный подход к анализу текста, основанный на разбиении предложения на составные части и выделении темы и ремы. Актуальность работы обосновывается необходимостью поиска и выделения полезной для пользователя информации, которую он мог бы использовать при выполнении необходимых научных исследований. Введено понятие структурно-семантических смысловых групп предложений и определены требования к ним. Смысловая группа предложения определяется на основе анализа связей между словами предложения и включает в себя некоторый набор рядом расположенных слов, задающих некоторый новый образ. Описан сценарий анализа текстовой информации на основе предлагаемого подхода. Приведено описание подходов при разбиении текста документа на смысловые группы. Приведены развернутые результаты работы программного комплекса при различной целевой установке на обработку текста. Представленные результаты показывают возможности разработанного программного комплекса: выполнение структуризации отдельных предложений текста; формирование ключевых слов в виде смысловых групп для дальнейшего анализа; отбор смысловых групп, определяющих основной смысл предложений и текста; значительное сокращение текста при сохранении смысловой составляющей. В дальнейшем предполагается расширение функциональных возможностей комплекса и проверка основных идей при обработке больших информационных массивов.