ISSN 0021-3454 (печатная версия)
ISSN 2500-0381 (онлайн версия)
Меню

10
Содержание
том 67 / Октябрь, 2024
СТАТЬЯ
УДК 004.934

ИССЛЕДОВАНИЕ ПРОБЛЕМЫ СБАЛАНСИРОВАННОСТИ ДАННЫХ ПРИ ПОСТРОЕНИИ АКУСТИЧЕСКИХ МОДЕЛЕЙ СИСТЕМ АВТОМАТИЧЕСКОГО РАСПОЗНАВАНИЯ РЕЧИ

Томашенко Н. А.
Лаборатория Информатики Университета Ле Мана (LIUM), Ле Ман, 72085, Франция; OOO «ЦРТ-Инновации», Санкт-Петербург, 196084, Российская Федерация; Университет ИТМО, Санкт-Петербург, 197101, Российская Федерация; аспирант; научный сотрудник; аспирант


Хохлов Ю. Ю.
ООО „ЦРТ“, Санкт-Петербург; ведущий программист


Читать статью полностью 

Аннотация. Исследована проблема сбалансированности данных при обучении акустических моделей для автоматического распознавания речи. Предложена метрика, позволяющая при кластеризации состояний трифонов явно учитывать влияние количества данных в кластере. Экспериментально доказано, что использование такого подхода позволяет повысить качество распознавания речи.
Ключевые слова:
автоматическое распознавание речи, GMM-HMM, обучение акустических моделей, связывание состояний, сбалансированность данных, кластеризация, трифоны