
FEATURES OF MACHINE LEARNING BY CNN WITHIN THE SPEECH SYNTHESIS
Author(s) -
E. S. Izrailova
Publication year - 2019
Publication title -
vestnik ggntu. tehničeskie nauki
Language(s) - Russian
Resource type - Journals
ISSN - 2686-7567
DOI - 10.34708/gstou.2019.16.2.004
Subject(s) - cuda , computer science , artificial intelligence , speech recognition , parallel computing
В статье описан процесс моделирования системы синтеза речи, основанный на имеющихся акустических данных, используемых для машинного обучения с целью получения модели, соответствующей естественным характеристикам речи. Представлены характерные особенности и архитектуры сверточных нейронных сетей CNN, в которых данные реализованы в виде набора изображений, применяются локальные операциисвертки, модифицирующие и комбинирующие данные изображений карты друг с другом. Рассмотрены актуальные способы машинного обучения и применение ускоренной на GPU библиотеки для глубоких нейронных сетей NVIDIA CUDA. Дана информация о подготовке обучающей экспериментальной базы данных, процессе машинного обучения системы, настройке параметров нейронной сети, показана динамика улучшения показателей матрицы внимания и результат обучения глубокой сверточной сети CNN.