Impact de la détection de la parole pour différentes tâches de traitement automatique de la parole
Author(s) -
Florent Desnous,
Anthony Larcher,
Sylvain Meignier
Publication year - 2018
Publication title -
hal (le centre pour la communication scientifique directe)
Language(s) - French
Resource type - Conference proceedings
DOI - 10.21437/jep.2018-63
Subject(s) - humanities , computer science , philosophy , political science
Dans cet article, nous proposons de comparer plusieurs systemes de detection de la parole et leurs impacts sur deux tâches du traitement de la parole : la Segmentation et le Regroupement de Locuteurs (SRL) et la Reconnaissance Automatique de la Parole (RAP). Des systemes a base de mixtures de Gaussiennes (GMM), de reseaux de neurones profonds (DNN) et recurrents (RNN) sont compares, ainsi que l'utilisation d'un systeme de RAP pour detecter la frontiere des mots. Les experiences presentees ici ont ete conduites sur les corpus issus des campagnes d'evaluation ESTER1 et 2, ETAPE et REPERE1, constitues d'emissions de radio et de television francaise.
Accelerating Research
Robert Robinson Avenue,
Oxford Science Park, Oxford
OX4 4GP, United Kingdom
Address
John Eccles HouseRobert Robinson Avenue,
Oxford Science Park, Oxford
OX4 4GP, United Kingdom