z-logo
open-access-imgOpen Access
ВИКОРИСТАННЯ МЕТОДІВ DATA MINING ДЛЯ ОБРОБКИ МОВНОЇ ІНФОРМАЦІЇ
Author(s) -
О. Шумейко,
В.С. Сотник,
І.І. Жульковська,
О.О. Жульковський
Publication year - 2021
Publication title -
matematične modelûvannâ
Language(s) - Ukrainian
Resource type - Journals
eISSN - 2519-8114
pISSN - 2519-8106
DOI - 10.31319/2519-8106.2(45)2021.246944
Subject(s) - computer science , data mining
Зі збільшенням обсягів інформації, отриманої у результаті роботи інформаційних систем і процесів, у ході діяльності підприємств або іншої діяльності людства, обробка й аналіз даних стають значно складними. Для первинної обробки інформації з метою її структурування, виділення характерних ознак, узагальнення, сортування тощо застосовують Data Mining або інтелектуальний аналіз даних. Важливим складником Data Mining є обробка текстової інформації. Такого роду задачі опираються на поняття класифікації й кластеризації. Як показали отримані результати, наївний баєсівський класифікатор достатньо ефективно може використовуватися для розробки програмного забезпечення з обробки мовної інформації. Проте, у подальшому бажано як параметри розглядати також ланцюжки з декількох слів. У самому алгоритмі для запобігання втрат точності на довгих текстах потрібно використовувати замість перемножування ймовірностей (частот) додавання їх логарифмів.

The content you want is available to Zendy users.

Already have an account? Click here to sign in.
Having issues? You can contact us here