Open Access
Selecão de documentos baseado em centróides para classificacão de patentes usando Word2Vec e KNN
Author(s) -
Henrique Camacho Farias,
Andréia Gentil Bonfante,
Claudia Aparecida Martins
Publication year - 2020
Language(s) - Portuguese
Resource type - Conference proceedings
DOI - 10.5753/semish.2020.11335
Subject(s) - physics , humanities , art
Este artigo apresenta um método de categorizacão de patentes baseado na representacão vetorial utilizando word embedding vectors (Word2Vec), na selecão de documentos através do cálculo dos centróides das classes e no algoritmo K-Nearest Neighbour (KNN), com o objetivo de classificar documentos de patentes no nível de secão da hierarquia IPC do conjunto de dados WIPO. Os resultados experimentais indicam que o método de classificacão proposto alcancou a acurácia de 75%.