z-logo
open-access-imgOpen Access
THE USE OF SPEECH RECOGNITION SYSTEMS TO SELECT A USEFUL SIGNAL IN NOISY SPEECH AT A LOW SIGNAL-TO-NOISE RATIO
Author(s) -
Sh. R. Salimov,
N. A. Volkov,
A. V. Ivanov
Publication year - 2021
Publication title -
dinamika sistem, mehanizmov i mašin
Language(s) - Russian
Resource type - Journals
ISSN - 2310-9793
DOI - 10.25206/2310-9793-9-4-75-80
Subject(s) - speech recognition , signal (programming language) , computer science , noise (video) , signal to noise ratio (imaging) , voice activity detection , background noise , speech processing , pattern recognition (psychology) , artificial intelligence , telecommunications , image (mathematics) , programming language
В статье рассматриваются две часто используемые системы распознавания речи - YandexSpeech.Kit и Google Speech Recognition. Проводится сравнение данных систем при распознавании зашумленной речи при разных отношениях сигнал/шум. На речь уровня 65 дБ накладывается шум, отличающейся от нее по уровню от 20 дБ до -5 дБ с шагом 5 дБ. Отмечается, что предварительное обучение системы распознавания речи не проводится, в эксперименте применяются голоса четырех дикторов общей длительностью записи 100 минут. Экспериментальным путем выявлено, что при низком отношении сигнал/шум системы распознавания речи справляются недостаточно качественно, следовательно, их необходимо доработать для того, чтобы при низком отношении сигнал/шум иметь приемлемый коэффициент распознавания.

The content you want is available to Zendy users.

Already have an account? Click here to sign in.
Having issues? You can contact us here