z-logo
open-access-imgOpen Access
Решение задачи классификации эмоций с помощью глубокого обучения
Author(s) -
A.A. Sarsembayev,
G.A. Tolganbayeva,
S.T. Janybekova
Publication year - 2022
Publication title -
international journal of information and communication technologies
Language(s) - English
Resource type - Journals
eISSN - 2708-2040
pISSN - 2708-2032
DOI - 10.54309/ijict.2020.3.3.004
Subject(s) - computer science , artificial intelligence , task (project management) , speech recognition , long short term memory , emotion recognition , artificial neural network , natural language processing , machine learning , pattern recognition (psychology) , recurrent neural network , engineering , systems engineering
Speech emotion classification is one of the most interesting and complicated problems in today's world. One of the main obstacles to this task is that emotions are subjective and difficult to capture. In this paper, we proposed deep learning methods that solve emotion classification problems based on audio streams. Three methods are propagated and compared throughout the paper. Within the first method, a Multilayer Perceptron model was built. A second method shows decreased accuracy building Long Short Term Memory models. Finally, the third method that reached the best accuracy among others isconvolutional neural network models. A speech corpus consisting of acted and spontaneous emotion samples in English language is described in detail. This dataset was tested and trained using these proposed methods. The CNN model for our emotion classification problem achieved a validation accuracy of 70%. Классификация речевых эмоций -одна из самых интересных и сложных за-дач в современном мире. Одним из основных препятствий на пути к этой задаче является то, что эмоции субъективны и их трудно уловить. В этой статье предложеныметоды глубокого обучения, которые решают задачи классификации эмоций на основе аудиопотоков. В статье распространяются и сравниваются три метода. В рамках первого метода была построена модель многослойного персептрона. Второй метод показывает снижение точности построения моделей долгосрочной краткосрочной памяти. Наконец, третий метод, достигший лучшей точности среди других -это модели сверточных нейронных сетей. Подробно описан речевой корпус, состоящий из образцов разыгрываемых и спонтанных эмоций на английском языке. Этот набор данных был протестирован и обучен с использованием предложенных методов. Модель CNN для нашей проблемы классификации эмоций достигла точности подтверждения 70%.

The content you want is available to Zendy users.

Already have an account? Click here to sign in.
Having issues? You can contact us here