
Compilação de um corpus etiquetado da Língua Geral Amazônica
Author(s) -
Dominick M. Alexandre,
Juliana L. Gurgel,
Leonel F. de A. Araripe
Publication year - 2021
Language(s) - Portuguese
Resource type - Conference proceedings
DOI - 10.5753/stil.2021.17823
Subject(s) - humanities , history , computer science , philosophy
Este trabalho apresenta as etapas de compilação de um corpus da Língua Geral Amazônica (LGA), ou nheengatu, desenvolvido para a posterior implementação de um etiquetador morfossintático para o sintagma nominal dessa língua. O estudo representa um avanço na construção de banco de dados para línguas indígenas e na inclusão dessas línguas minoritárias no atual contexto científico e tecnológico. Os resultados confirmam a aplicabilidade do corpus compilado para etiquetadores e outros algoritmos de processamento de linguagem natural.