FEATURES OF MACHINE LEARNING BY CNN WITHIN THE SPEECH SYNTHESIS
Author(s) -
E. S. Izrailova
Publication year - 2019
Publication title -
вестник ггнту технические науки
Language(s) - Russian
Resource type - Journals
ISSN - 2686-7567
DOI - 10.34708/gstou.2019.16.2.004
Subject(s) - cuda , computer science , artificial intelligence , speech recognition , parallel computing
В статье описан процесс моделирования системы синтеза речи, основанный на имеющихся акустических данных, используемых для машинного обучения с целью получения модели, соответствующей естественным характеристикам речи. Представлены характерные особенности и архитектуры сверточных нейронных сетей CNN, в которых данные реализованы в виде набора изображений, применяются локальные операциисвертки, модифицирующие и комбинирующие данные изображений карты друг с другом. Рассмотрены актуальные способы машинного обучения и применение ускоренной на GPU библиотеки для глубоких нейронных сетей NVIDIA CUDA. Дана информация о подготовке обучающей экспериментальной базы данных, процессе машинного обучения системы, настройке параметров нейронной сети, показана динамика улучшения показателей матрицы внимания и результат обучения глубокой сверточной сети CNN.
Accelerating Research
Robert Robinson Avenue,
Oxford Science Park, Oxford
OX4 4GP, United Kingdom
Address
John Eccles HouseRobert Robinson Avenue,
Oxford Science Park, Oxford
OX4 4GP, United Kingdom