DOI 10.17586/0021-3454-2024-67-9-731-740
УДК 004.81
УСОВЕРШЕНСТВОВАНИЕ АЛГОРИТМА ИДЕ НТИФИКАЦИИ ЭМОЦИОНАЛЬНОГО СОСТОЯНИЯ ЧЕЛОВЕКА С ИСПОЛЬЗОВАНИЕМ MFCC
Южно-Российский государственный политехнический университет им. М. И. Платова, кафедра программного обеспечения вычислительной техники ;
Складчиков М. В.
Донецкий национальный технический университет, кафедра электропривода и автоматизации промышленных установок ;
Ссылка для цитирования : Семенюк В. В., Складчиков М. В. Усовершенствование алгоритма идентификации эмоционального состояния человека с использованием MFCC // Изв. вузов. Приборостроение. 2024. Т. 67, № 9. С. 731–740. DOI: 10.17586/0021-3454-2024-67-9-731-740.
Аннотация. Представлен подход к реализации алгоритма эмоционального состояния человека с использованием сверточных нейронных сетей. На основе общей концепции научного исследования рассмотрен вариант усложнения иерархии идентифицируемых эмоций. Проведен сравнительный анализ применения оконного преобразования Фурье и алгоритма MFCC в качестве инструмента для обработки информационных данных. Вариант усложнения предлагаемого метода рассматривается как логический переход от более простого математического аппарата, представленного в виде оконного преобразования Фурье, к мелкепстральным коэффициентам. Благодаря данному подходу сформирован более информативный входной набор данных без усложнения архитектуры нейронной сети, скорректирована методология научного исследования и с использованием идеализированной базы данных достигнута точность идентификации, близкая к 100 %. Приведено обоснование применения Deep Network Designer как инструмента для создания архитектуры нейронной сети.
Аннотация. Представлен подход к реализации алгоритма эмоционального состояния человека с использованием сверточных нейронных сетей. На основе общей концепции научного исследования рассмотрен вариант усложнения иерархии идентифицируемых эмоций. Проведен сравнительный анализ применения оконного преобразования Фурье и алгоритма MFCC в качестве инструмента для обработки информационных данных. Вариант усложнения предлагаемого метода рассматривается как логический переход от более простого математического аппарата, представленного в виде оконного преобразования Фурье, к мелкепстральным коэффициентам. Благодаря данному подходу сформирован более информативный входной набор данных без усложнения архитектуры нейронной сети, скорректирована методология научного исследования и с использованием идеализированной базы данных достигнута точность идентификации, близкая к 100 %. Приведено обоснование применения Deep Network Designer как инструмента для создания архитектуры нейронной сети.
Ключевые слова: нейронная сеть, распознавание эмоций человека, сверточная нейронная сеть, дактилоскопия звука
Список литературы:
Список литературы:
- Топ-5 сфер применения систем распознавания объектов [Электронный ресурс]: https://habr.com/ru/company/ toshibarus/blog/433544/, 10.03.2022.
- Li X., Chen Y., Hu J., Zhang J., Zhang Z. Recognizing emotion in human-computer interaction-a survey / IEEE Transactions on Affective Computing. 2016. N 7 (2). P. 149–166.
- Шиллер А. В. Выражение модернизируемых эффектов эмоций у искусственных агентов как визуальный язык // Праксема. Проблемы визуальной семиотики. 2019. № 4 (22). С. 223—243.
- Рюмина Е. В., Карпов А. А. Аналитический обзор методов распознавания эмоций по выражениям лица человека // Научно-технический вестник информационных технологий, механики и оптики. 2020. Т. 20, № 2. С. 163–176.
- Xu H., Liang X., Sun M., Chen S., Feng J. Fusion of Visual and Affective Features for Emotion Recognition in the Wild // IEEE Transactions on Affective Computing. 2018. N 9 (2). P. 261–274.
- Zhao M., Adelhardt J., Kummert F. Real-time emotion recognition from facial images using deep neural networks // Proc. of the ACM on Intern. Conf. on Multimodal Interaction. 2018. P. 440–447.
- Shan H., Kan M., Wang S., Yan S. Deep learning for emotion recognition: A survey // IEEE Transactions on Affective Computing. 2017. N 8 (4). P. 512–527.
- Хрусталёв В. О., Зубков А. В. Разработка технологии распознавания эмоций человека на основе изображений, поступающих с веб-камеры // XXIV региональная конференция молодых ученых и исследователей Волгоградской области. 2020. С. 223–224 [Электронный ресурс]: https://elibrary.ru/item.asp?ysclid=m0425zwq 1q320826398&id=42400458.
- Курицкий В. Ю., Садов С. В. Нейросетевой алгоритм распознавания эмоций по изображению лица // Компьютерные технологии и анализ данных (CTDA’2020). 2020. С. 245–248.
- Хнюнин М. В., Ганелина Н. Д. Перспективы применения личных мобильных устройств для распознавания эмоций человека по фотографиям лица // Интеллектуальный потенциал Сибири. 2021. С. 179–182.
- Артемьева Ж. Г., Крушная Н. А. Распознавание эмоций у других людей детьми с нарушениями опорно-двигательного аппарата // Человеческий фактор: социальный психолог. 2020. № 1 (39). С. 288–294.
- Abadi M. K., Zeng Z. Emotion recognition from speech using deep learning // Proc. of the Interspeech. 2017. P. 2362– 2366.
- Семенюк В. В. Повышение качества компьютерного распознавания эмоционального состояния человека по голосу // Науч.-практ. конф. „Научные революции: Сущность и роль в развитии науки и техники“: Сб. докл. Челябинск: НИЦ „АЭТЕРНА“, 2021.