<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Publishing DTD v1.3 20210610//EN" "JATS-journalpublishing1-3.dtd">
<article article-type="research-article" dtd-version="1.3" xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xml:lang="ru"><front><journal-meta><journal-id journal-id-type="publisher-id">pribor</journal-id><journal-title-group><journal-title xml:lang="ru">Известия высших учебных заведений. Приборостроение</journal-title><trans-title-group xml:lang="en"><trans-title>Journal of Instrument Engineering</trans-title></trans-title-group></journal-title-group><issn pub-type="ppub">0021-3454</issn><issn pub-type="epub">2500-0381</issn><publisher><publisher-name>Национальный исследовательский университет ИТМО</publisher-name></publisher></journal-meta><article-meta><article-id pub-id-type="doi">10.17586/0021-3454-2024-67-9-731-740</article-id><article-id custom-type="elpub" pub-id-type="custom">pribor-27</article-id><article-categories><subj-group subj-group-type="heading"><subject>Research Article</subject></subj-group><subj-group subj-group-type="section-heading" xml:lang="ru"><subject>ИНФОРМАТИКА И ИНФОРМАЦИОННЫЕ ПРОЦЕССЫ</subject></subj-group><subj-group subj-group-type="section-heading" xml:lang="en"><subject>INFORMATICS AND INFORMATION PROCESSES</subject></subj-group></article-categories><title-group><article-title>Усовершенствование алгоритма идентификации эмоционального состояния человека с использованием MFCC</article-title><trans-title-group xml:lang="en"><trans-title>Improvement of the Human Emotional State Identification Algorithm Using MFCC</trans-title></trans-title-group></title-group><contrib-group><contrib contrib-type="author" corresp="yes"><name-alternatives><name name-style="eastern" xml:lang="ru"><surname>Семенюк</surname><given-names>В. В.</given-names></name><name name-style="western" xml:lang="en"><surname>Semenuk</surname><given-names>V. V.</given-names></name></name-alternatives><bio xml:lang="ru"><p>Виктория Валерьевна Семенюк, аспирант</p><p>кафедра программного обеспечения вычислительной техники</p><p>Новочеркасск</p></bio><bio xml:lang="en"><p>Victoria V. Semenuk, Post-Graduate Student</p><p>Department of Computer Software</p><p>Novocherkassk</p></bio><email xlink:type="simple">semenuk.viktoriya@gmail.com</email><xref ref-type="aff" rid="aff-1"/></contrib><contrib contrib-type="author" corresp="yes"><name-alternatives><name name-style="eastern" xml:lang="ru"><surname>Складчиков</surname><given-names>М. В.</given-names></name><name name-style="western" xml:lang="en"><surname>Skladchikov</surname><given-names>M. V.</given-names></name></name-alternatives><bio xml:lang="ru"><p>Максим Владимирович Складчиков, аспирант</p><p>кафедра электропривода и автоматизации промышленных установок</p><p>Донецк</p></bio><bio xml:lang="en"><p>Maxim V. Skladchikov, Post-Graduate Student</p><p>Department of Electric Drives and Automation of Industrial Installations</p><p>Donetsk</p></bio><email xlink:type="simple">maxsklad19981@yandex.ru</email><xref ref-type="aff" rid="aff-2"/></contrib></contrib-group><aff-alternatives id="aff-1"><aff xml:lang="ru"><institution>Южно-Российский государственный политехнический университет (НПИ) им. М. И. Платова</institution></aff><aff xml:lang="en"><institution>Platov South-Russian State Polytechnic University</institution></aff></aff-alternatives><aff-alternatives id="aff-2"><aff xml:lang="ru"><institution>Донецкий национальный технический университет</institution></aff><aff xml:lang="en"><institution>Donetsk National Technical University</institution></aff></aff-alternatives><pub-date pub-type="collection"><year>2024</year></pub-date><pub-date pub-type="epub"><day>25</day><month>11</month><year>2024</year></pub-date><volume>67</volume><issue>9</issue><fpage>731</fpage><lpage>740</lpage><permissions><copyright-statement>Copyright &amp;#x00A9; Национальный исследовательский университет ИТМО, 2024</copyright-statement><copyright-year>2024</copyright-year><copyright-holder xml:lang="ru">Национальный исследовательский университет ИТМО</copyright-holder><copyright-holder xml:lang="en">Национальный исследовательский университет ИТМО</copyright-holder><license xlink:href="https://pribor.ifmo.ru/jour/about/submissions#copyrightNotice" xlink:type="simple"><license-p>https://pribor.ifmo.ru/jour/about/submissions#copyrightNotice</license-p></license></permissions><self-uri xlink:href="https://pribor.ifmo.ru/jour/article/view/27">https://pribor.ifmo.ru/jour/article/view/27</self-uri><abstract><p>   Представлен подход к реализации алгоритма эмоционального состояния человека с использованием сверточных нейронных сетей. На основе общей концепции научного исследования рассмотрен вариант усложнения иерархии идентифицируемых эмоций. Проведен сравнительный анализ применения оконного преобразования Фурье и алгоритма MFCC в качестве инструмента для обработки информационных данных. Вариант усложнения предлагаемого метода рассматривается как логический переход от более простого математического аппарата,представленного в виде оконного преобразования Фурье, к мелкепстральным коэффициентам. Благодаря данному подходу сформирован более информативный входной набор данных без усложнения архитектуры нейронной сети, скорректирована методология научного исследования и с использованием идеализированной базы данных достигнута точность идентификации, близкая к 100 %. Приведено обоснование применения Deep Network Designer как инструмента для создания архитектуры нейронной сети.</p></abstract><trans-abstract xml:lang="en"><p>   An approach to the implementation of an algorithm for the emotional state of a person using convolutional neural networks is presented. Based on the general concept of scientific research, a variant of complicating the hierarchy of identifiable emotions is considered. A comparative analysis of the application of the windowed Fourier transform and the MFCC algorithm as a tool for processing information data is carried out. The variant of complication of the proposed method is considered as a logical transition from a simpler mathematical apparatus, presented in the form of a windowed Fourier transform to the use of mel-frequency cepstral coefficients. This allowed to form a more informative input data set without complicating the neural network architecture, the methodology of scientific research was adjusted and, using an idealized database, the accuracy of identification close to 100% was achieved. The rationale for using Deep Network Designer as a tool for creating neural network architecture is given.</p></trans-abstract><kwd-group xml:lang="ru"><kwd>нейронная сеть</kwd><kwd>распознавание эмоций человека</kwd><kwd>сверточная нейронная сеть</kwd><kwd>дактилоскопия звука</kwd></kwd-group><kwd-group xml:lang="en"><kwd>neural network</kwd><kwd>human emotion recognition</kwd><kwd>convolutional neural network</kwd><kwd>sound fingerprinting</kwd></kwd-group></article-meta></front><back><ref-list><title>References</title><ref id="cit1"><label>1</label><citation-alternatives><mixed-citation xml:lang="ru">Топ-5 сфер применения систем распознавания объектов [Электронный ресурс]: https://habr.com/ru/company/toshibarus/blog/433544/, 10. 03. 2022.</mixed-citation><mixed-citation xml:lang="en">https://habr.com/ru/company/toshibarus/blog/433544/. (in Russ.)</mixed-citation></citation-alternatives></ref><ref id="cit2"><label>2</label><citation-alternatives><mixed-citation xml:lang="ru">Li X., Chen Y., Hu J., Zhang J., Zhang Z. Recognizing emotion in human-computer interaction-a survey / IEEE Transactions on Affective Computing. 2016. N 7 (2). P. 149–166.</mixed-citation><mixed-citation xml:lang="en">Li X., Chen Y., Hu J., Zhang J., &amp; Zhang Z. IEEE Transactions on Affective Computing, 2016, no. 2(7), pp. 149–166.</mixed-citation></citation-alternatives></ref><ref id="cit3"><label>3</label><citation-alternatives><mixed-citation xml:lang="ru">Шиллер А. В. Выражение модернизируемых эффектов эмоций у искусственных агентов как визуальный язык // Праксема. Проблемы визуальной семиотики. 2019. № 4 (22). С. 223—243.</mixed-citation><mixed-citation xml:lang="en">Shiller A.V. Praxema. Journal of Visual Semiotics, 2019, no. 4(22), pp. 223–243. (in Russ.)</mixed-citation></citation-alternatives></ref><ref id="cit4"><label>4</label><citation-alternatives><mixed-citation xml:lang="ru">Рюмина Е. В., Карпов А. А. Аналитический обзор методов распознавания эмоций по выражениям лица человека // Научно-технический вестник информационных технологий, механики и оптики. 2020. Т. 20, № 2. С. 163–176.</mixed-citation><mixed-citation xml:lang="en">Ryumina E.V., Karpov A.A. Scientific and Technical Journal of Information Technologies, Mechanics and Optics, 2020, no. 2(20), pp. 163–176. (in Russ.)</mixed-citation></citation-alternatives></ref><ref id="cit5"><label>5</label><citation-alternatives><mixed-citation xml:lang="ru">Xu H., Liang X., Sun M., Chen S., Feng J. Fusion of Visual and Affective Features for Emotion Recognition in the Wild // IEEE Transactions on Affective Computing. 2018. N 9 (2). P. 261–274.</mixed-citation><mixed-citation xml:lang="en">Xu H., Liang X., Sun M., Chen S., &amp; Feng J. IEEE Transactions on Affective Computing, 2018, no. 2(9), pp. 261–274.</mixed-citation></citation-alternatives></ref><ref id="cit6"><label>6</label><citation-alternatives><mixed-citation xml:lang="ru">Zhao M., Adelhardt J., Kummert F. Real-time emotion recognition from facial images using deep neural networks // Proc. of the ACM on Intern. Conf. on Multimodal Interaction. 2018. P. 440–447.</mixed-citation><mixed-citation xml:lang="en">Zhao M., Adelhardt J., &amp; Kummert F. Proceedings of the 2018 ACM on International Conference on Multimodal Interaction, 2018, pp. 440–447.</mixed-citation></citation-alternatives></ref><ref id="cit7"><label>7</label><citation-alternatives><mixed-citation xml:lang="ru">Shan H., Kan M., Wang S., Yan S. Deep learning for emotion recognition: A survey // IEEE Transactions on Affective Computing. 2017. N 8 (4). P. 512–527.</mixed-citation><mixed-citation xml:lang="en">Shan H., Kan M., Wang S., &amp; Yan S. IEEE Transactions on Affective Computing, 2017, no. 4(8), pp. 512–527.</mixed-citation></citation-alternatives></ref><ref id="cit8"><label>8</label><citation-alternatives><mixed-citation xml:lang="ru">Хрусталёв В. О., Зубков А. В. Разработка технологии распознавания эмоций человека на основе изображений, поступающих с веб-камеры // XXIV региональная конференция молодых ученых и исследователей Волгоградской области. 2020. С. 223–224 [Электронный ресурс]: https://elibrary.ru/item.asp?ysclid=m0425zwq1q320826398&amp;id=42400458.</mixed-citation><mixed-citation xml:lang="en">Khrustalev V.O., Zubkov A.V. XXIV regional'naya konferentsiya molodykh uchonykh i issledovateley Volgogradskoy oblasti (XXIV Regional Conference of Young Scientists and Researchers of the Volgograd Region), Volgograd, 2020, рр. 223–224. (in Russ.) https://elibrary.ru/item.asp?ysclid=m0425zwq1q320826398&amp;id=42400458.</mixed-citation></citation-alternatives></ref><ref id="cit9"><label>9</label><citation-alternatives><mixed-citation xml:lang="ru">Курицкий В. Ю., Садов С. В. Нейросетевой алгоритм распознавания эмоций по изображению лица // Компьютерные технологии и анализ данных (CTDA’2020). 2020. С. 245–248.</mixed-citation><mixed-citation xml:lang="en">Kuritsky V.Yu., Sadov S.V. Komp'yuternyye tekhnologii i analiz dannykh (CTDA'2020) (Computer Technologies and Data Analysis (CTDA'2020)), Proceedings of the II International Scientific and Practical Conference, Minsk, April 23–24, 2020, рр. 245–248. (in Russ.)</mixed-citation></citation-alternatives></ref><ref id="cit10"><label>10</label><citation-alternatives><mixed-citation xml:lang="ru">Хнюнин М. В., Ганелина Н. Д. Перспективы применения личных мобильных устройств для распознавания эмоций человека по фотографиям лица // Интеллектуальный потенциал Сибири. 2021. С. 179–182.</mixed-citation><mixed-citation xml:lang="en">Khnyunin M.V., Ganelina N.D. Intellektual'nyy potentsial Sibiri (RNSK-2021) (Intellectual Potential of Siberia (RNSC-2021)), Collection of scientific papers of the 29&lt;sup&gt;th&lt;/sup&gt; Regional Scientific Student Conference, Novosibirsk, 2021, vol. 3, рр. 179–182. (in Russ.)</mixed-citation></citation-alternatives></ref><ref id="cit11"><label>11</label><citation-alternatives><mixed-citation xml:lang="ru">Артемьева Ж. Г., Крушная Н. А. Распознавание эмоций у других людей детьми с нарушениями опорно-двигательного аппарата // Человеческий фактор: социальный психолог. 2020. № 1 (39). С. 288–294.</mixed-citation><mixed-citation xml:lang="en">Artemyeva Zh.G., Krushnaya N.A. Human factor: social psychologist, 2020, no. 1(39), pp. 288–294. (in Russ.)</mixed-citation></citation-alternatives></ref><ref id="cit12"><label>12</label><citation-alternatives><mixed-citation xml:lang="ru">Abadi M. K., Zeng Z. Emotion recognition from speech using deep learning // Proc. of the Interspeech. 2017. P. 2362–2366.</mixed-citation><mixed-citation xml:lang="en">Abadi M.K. &amp; Zeng Z. Proceedings of the INTERSPEECH, 2017, pp. 2362–2366.</mixed-citation></citation-alternatives></ref><ref id="cit13"><label>13</label><citation-alternatives><mixed-citation xml:lang="ru">Семенюк В. В. Повышение качества компьютерного распознавания эмоционального состояния человека по голосу // Науч.-практ. конф. „Научные революции: Сущность и роль в развитии науки и техники“ : Сб. докл. Челябинск: НИЦ „АЭТЕРНА“, 2021.</mixed-citation><mixed-citation xml:lang="en">Semenyuk V.V. Nauchnyye revolyutsii: Sushchnost' i rol' v razvitii nauki i tekhniki (Scientific Revolutions: Essence and Role in the Development of Science and Technology), Scientific and practical conference, Chelyabinsk, 2021,142 р. (in Russ.)</mixed-citation></citation-alternatives></ref></ref-list><fn-group><fn fn-type="conflict"><p>The authors declare that there are no conflicts of interest present.</p></fn></fn-group></back></article>
