
A Comparison of Deep Learning Architectures for Automatic Gender Recognition from Audio Signals
Author(s) -
Alef Iury Ferreira,
Frederico Santos de Oliveira,
Nádia F. Felipe da Silva,
Anderson S. Soares
Publication year - 2021
Language(s) - Portuguese
Resource type - Conference proceedings
DOI - 10.5753/eniac.2021.18297
Subject(s) - computer science , speech recognition , deep learning , artificial intelligence , natural language processing , humanities , philosophy
O reconhecimento de gênero a partir da fala é um problema relacionado à análise de fala humana, e possui diversas aplicações que vão desde a personalização na recomendação de produtos à ciência forense. A identificação da eficiência e custos de diferentes abordagens que lidam com esse problema é imprescindível. Este trabalho tem como foco investigar e comparar a eficiência e custos de diferentes arquiteturas de deep learning para o reconhecimento de gênero a partir da fala. Os resultados mostram que o modelo convolucional unidimensional consegue os melhores resultados. No entanto, constatou-se que o modelo fully connected apresentou resultados próximos com menor custo, tanto no uso de memória, quanto no tempo de treinamento.