z-logo
open-access-imgOpen Access
FEATURES OF MACHINE LEARNING BY CNN WITHIN THE SPEECH SYNTHESIS
Author(s) -
E. S. Izrailova
Publication year - 2019
Publication title -
vestnik ggntu. tehničeskie nauki
Language(s) - Russian
Resource type - Journals
ISSN - 2686-7567
DOI - 10.34708/gstou.2019.16.2.004
Subject(s) - cuda , computer science , artificial intelligence , speech recognition , parallel computing
В статье описан процесс моделирования системы синтеза речи, основанный на имеющихся акустических данных, используемых для машинного обучения с целью получения модели, соответствующей естественным характеристикам речи. Представлены характерные особенности и архитектуры сверточных нейронных сетей CNN, в которых данные реализованы в виде набора изображений, применяются локальные операциисвертки, модифицирующие и комбинирующие данные изображений карты друг с другом. Рассмотрены актуальные способы машинного обучения и применение ускоренной на GPU библиотеки для глубоких нейронных сетей NVIDIA CUDA. Дана информация о подготовке обучающей экспериментальной базы данных, процессе машинного обучения системы, настройке параметров нейронной сети, показана динамика улучшения показателей матрицы внимания и результат обучения глубокой сверточной сети CNN.

The content you want is available to Zendy users.

Already have an account? Click here to sign in.
Having issues? You can contact us here