ИССЛЕДОВАНИЕ ПРОБЛЕМЫ СБАЛАНСИРОВАННОСТИ ДАННЫХ ПРИ ПОСТРОЕНИИ АКУСТИЧЕСКИХ МОДЕЛЕЙ СИСТЕМ АВТОМАТИЧЕСКОГО РАСПОЗНАВАНИЯ РЕЧИ
Лаборатория Информатики Университета Ле Мана (LIUM), Ле Ман, 72085, Франция; OOO «ЦРТ-Инновации», Санкт-Петербург, 196084, Российская Федерация; Университет ИТМО, Санкт-Петербург, 197101, Российская Федерация; аспирант; научный сотрудник; аспирант
Хохлов Ю. Ю.
ООО „ЦРТ“, Санкт-Петербург; ведущий программист
Читать статью полностью
Аннотация. Исследована проблема сбалансированности данных при обучении акустических моделей для автоматического распознавания речи. Предложена метрика, позволяющая при кластеризации состояний трифонов явно учитывать влияние количества данных в кластере. Экспериментально доказано, что использование такого подхода позволяет повысить качество распознавания речи.
Ключевые слова:
автоматическое распознавание речи, GMM-HMM, обучение акустических моделей, связывание состояний, сбалансированность данных, кластеризация, трифоны