Conversão de Grafemas para Fonemas em Português Europeu - Abordagem Híbrida com Modelos Probabilísticos e Regras Fonológicas
Author(s) -
Arlindo Veiga,
Sara Candeias,
Fernando Perdigão
Publication year - 2011
Publication title -
linguamática
Language(s) - Portuguese
DOI - 10.21814/lm.3.2.102
A conversao de grafema para fonema diz respeito a tarefa de encontrar a pronuncia de um vocabulo dado na sua forma escrita, a qual tem uma forte componente de aplicacao em sistemas de reconhecimento e de sintese de fala. Uma nova abordagem na conversao de grafema para fonema e proposta, aplicando um modelo hibrido para o qual concorrem regras fonologicas e decisoes estatisticas. Os resultados mostram que a incorporacao de regras fonologicas em algoritmos de informacao estatistica melhora acentuadamente o desempenho do conversor. Para este trabalho, foi construido um dicionario de pronunciacao com mais de 40000 vocabulos derivados do corpus CETEMPublico. Os dicionarios fonologicos de pronunciacao para o portugues europeu, bem como outros recursos produzidos durante este trabalho, estao disponibilizados publicamente. O sistema que aqui se descreve foi aplicado a lingua portuguesa escrita, sem e com o Acordo Ortografico de 1990, e, ainda que aplicado ao portugues na sua vertente europeia, observa caracteristicas que permitem a sua aplicacao a outras linguas românicas.
Accelerating Research
Robert Robinson Avenue,
Oxford Science Park, Oxford
OX4 4GP, United Kingdom
Address
John Eccles HouseRobert Robinson Avenue,
Oxford Science Park, Oxford
OX4 4GP, United Kingdom