z-logo
open-access-imgOpen Access
Uma Estratégia Híbrida para o Pareamento de Textos Curtos Baseada em Similaridade Léxica e Embeddings Semânticos
Author(s) -
Thiago Pereira Meirelles,
Eduardo Corrêa Gonçalves,
Daniel Takata Gomes
Publication year - 2021
Language(s) - Portuguese
Resource type - Conference proceedings
DOI - 10.5753/eri-rj.2021.18772
Subject(s) - computer science , humanities , philosophy
Pareamento de textos é a tarefa de escolher, dentre um conjunto de textos possíveis, qual deles faz menção a um mesmo conceito ou objeto que outro determinado texto de entrada faz. Este trabalho propõe uma nova estratégia híbrida que tem por foco o pareamento de textos curtos, como nomes de produtos, marcas e serviços. A estratégia proposta baseia-se na combinação de medidas de similaridade léxica e embeddings semânticos gerados através do modelo Word2vec. Experimentos preliminares realizados em uma base de dados real contendo nomes de produtos e serviços revelam resultados promissores.

The content you want is available to Zendy users.

Already have an account? Click here to sign in.
Having issues? You can contact us here