
Підхід до використання фільтра блума для багатокласової класифікації текстових даних в режимі реального часу.
Author(s) -
В. Яременко,
Д. Будьонний
Publication year - 2019
Publication title -
komp'ûterno-ìntegrovanì tehnologìï: osvìta, nauka, virobnictvo
Language(s) - Ukrainian
Resource type - Journals
eISSN - 2524-0560
pISSN - 2524-0552
DOI - 10.36910/6775-2524-0560-2019-36-24
Subject(s) - computer science
У даній роботі розглянуто фільтр Блума, який вирішує задачу фільтрації потоків, та було запропоновано новий підхід використання цього фільтру для класифікації текстових даних. В якості вхідних даних було обрано текстові дані, які надходять у реальному часі. Розглянуто модель з точки зору точності класифікації, швидкості навчання моделі, кількості використаної пам’яті та швидкістю видачі результату класифікації. Представлено метод донавчання моделі та критерій відбору слів для покращення навчання моделі. Показано процес навчання моделі для багатокласової класифікації. Виявлені проблеми даного підходу та запропоновані проблеми їх вирішення.