СИСТЕМЫ АНАЛИЗА РЕЧИ
СТАТИСТИЧЕСКИЕ ЯЗЫКОВЫЕ ОСОБЕННОСТИ И ИХ ГЕНДЕРНЫЕ РАЗЛИЧИЯ НА ПРИМЕРЕ ЛИТОВСКОГО ЯЗЫКА
Хитров М. В., Васильев А. Ю.
7
Выявлены речевые особенности, позволяющие решать задачи автоматической идентификации языка и идентификации диктора. Предложен метод, использующий статистические параметры, характеризующие мелодический контур фраз исследуемого языка.
РАЗРАБОТКА КАНАЛОНЕЗАВИСИМЫХ ИНФОРМАТИВНЫХ ПРИЗНАКОВ
Киселёв В. В., Ткаченя А. В., Хитров М. В.
12
Исследованы информативные признаки речи с целью формирования каналонезависимого пространства признаков для повышения эффективности функционирования системы распознавания дикторов. Экспериментально определен оптимальный набор каналонезависимых информативных признаков для решения задачи выявления сходства между фонограммами на основе метода динамического программирования.
ИССЛЕДОВАНИЕ ПРОБЛЕМЫ СБАЛАНСИРОВАННОСТИ ДАННЫХ ПРИ ПОСТРОЕНИИ АКУСТИЧЕСКИХ МОДЕЛЕЙ СИСТЕМ АВТОМАТИЧЕСКОГО РАСПОЗНАВАНИЯ РЕЧИ
Томашенко Н. А., Хохлов Ю. Ю.
17
Исследована проблема сбалансированности данных при обучении акустических моделей для автоматического распознавания речи. Предложена метрика, позволяющая при кластеризации состояний трифонов явно учитывать влияние количества данных в кластере. Экспериментально доказано, что использование такого подхода позволяет повысить качество распознавания речи.
КРОССВАЛИДАЦИОННЫЙ КОНТРОЛЬ СОСТОЯНИЙ ПРИ ОБУЧЕНИИ АКУСТИЧЕСКИХ МОДЕЛЕЙ
СИСТЕМ АВТОМАТИЧЕСКОГО РАСПОЗНАВАНИЯ РЕЧИ
Черных Г. А., Кореневский М. Л., Левин К. Е., Пономарева И. А., Томашенко Н. А.
23
Предложен метод, позволяющий при обучении скрытых марковских моделей, входящих в состав систем автоматического распознавания речи, оптимизировать число компонент в гауссовых смесях состояний. Применение метода повышает качество и скорость распознавания речи системой.
СТАТИСТИЧЕСКИЕ МЕТОДЫ АВТОМАТИЧЕСКОГО ОПРЕДЕЛЕНИЯ МЕСТ И ДЛИТЕЛЬНОСТИ ПАУЗ В СИСТЕМАХ СИНТЕЗА РЕЧИ
Чистиков П. Г., Хомицевич О. Г., Рыбин С. В.
28
Рассмотрены статистические методы определения местоположения и длительности пауз в системе синтеза речи. Применение таких методов позволяет добиться лучших результатов по сравнению с использованием алгоритмов, основанных на правилах.
СИСТЕМЫ ОБРАБОТКИ РЕЧЕВЫХ И АКУСТИЧЕСКИХ СИГНАЛОВ
ОЦЕНКА ВРЕМЕННОГО СДВИГА МЕЖДУ АУДИОСИГНАЛАМИ С ИСПОЛЬЗОВАНИЕМ ИХ ОГИБАЮЩИХ
Алейник С. В., Столбов М. Б.
33
Предложен метод оценки временного сдвига между акустическими сигналами, записанными в условиях реверберации и нелинейных искажений, базирующийся на оценке кросскорреляции временных огибающих сигналов, проведено его сравнение с другими методами оценки временного сдвига.
СТОХАСТИЧНОСТЬ РЕЧЕВЫХ СИГНАЛОВ И ЕЕ ОЦЕНИВАНИЕ
Алейник С. В., Столбов М. Б.
40
Проанализированы способы оценки стохастичности речевых сигналов. Результаты моделирования показали, что предложенный способ оценки превосходит известные по качеству — оценки имеют меньшее смещение и дисперсию.
ОЦЕНКА ФУНКЦИОНАЛЬНОЙ БЕЗОПАСНОСТИ ОБНАРУЖЕНИЯ ВИБРОАКУСТИЧЕСКОГО СИГНАЛА
ПРИБЛИЖАЮЩЕГОСЯ ПОЕЗДА
Бибиков С. В., Матвеев Ю. Н., Семенов Н. Н.
47
Исследована функциональная безопасность обнаружения виброакустического сигнала приближающегося поезда методом энергетического обнаружителя. Найдено нижнее значение порога обнаружения исходя из предложенной вероятности ложной тревоги, доказана достаточность применения разработанного метода обнаружения приближающегося поезда для бесстыковых путей.
РАЗДЕЛЕНИЕ РЕЧИ ЦЕЛЕВОГО И СТОРОННИХ ДИКТОРОВ С ИСПОЛЬЗОВАНИЕМ ДВУХМИКРОФОННОЙ СИСТЕМЫ
Столбов М. Б., Татарникова М. Ю.
53
Рассмотрен метод разделения речи целевого и сторонних дикторов с помощью обработки сигналов двух симметричных микрофонов, ориентированных в противоположных направлениях. Алгоритм обработки обеспечивает пространственное разделение дикторов.
СИСТЕМЫ РАСПОЗНАВАНИЯ ЛИЧНОСТЕЙ ПО ГОЛОСУ
ЭКСПЕРТНЫЕ СИСТЕМЫ И МЕТОДЫ ИДЕНТИФИКАЦИИ ДИКТОРА
Булгакова Е. В., Краснова Е. В.
58
Проанализированы методы проведения фонографической экспертизы. Рассмотрено используемое в целях идентификации диктора программное обеспечение. Описывается звуковой редактор SIS II.
КОНЦЕПЦИЯ СИСТЕМЫ НАЦИОНАЛЬНОГО ФОНОУЧЕТА И ГОЛОСОВОГО БИОМЕТРИЧЕСКОГО ПОИСКА
Дырмовский Д. В., Коваль С. Л., Хитров М. В.
63
Представлена концепция системы национального фоноучета и голосового биометрического поиска.
АНАЛИЗ ВОЗМОЖНОСТИ ПРИМЕНЕНИЯ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ НА ОСНОВЕ МНОГООБРАЗИЙ
В ЗАДАЧАХ РАСПОЗНАВАНИЯ ДИКТОРОВ
Матвеев Ю. Н., Шулипа А. К.
70
Исследованы особенности применения методов обучения на основе многообразий, широко используемых в приложениях по распознаванию изображений, для решения задач распознавания личностей по голосу (дикторов). Проанализированы результаты экспериментов по использованию таких методов.
ПРИМЕНЕНИЕ DTW-МЕТОДА ДЛЯ МУЛЬТИСЕССИОННОГО ОБУЧЕНИЯ СКРЫТЫХ МАРКОВСКИХ МОДЕЛЕЙ
В ЗАДАЧЕ ТЕКСТОЗАВИСИМОЙ ВЕРИФИКАЦИИ ДИКТОРА
Новосёлов С. А., Сухмель В. А., Шолохов А. В., Пеховский Т. С.
77
Представлен метод обучения скрытых марковских моделей по нескольким вариантам произнесения парольной фразы с помощью алгоритма динамического временного выравнивания сигналов. Метод позволяет создавать точные статистические модели речевых сигналов и снижать вероятность возникновения ошибок верификации.
ИССЛЕДОВАНИЕ УСТОЙЧИВОСТИ ГОЛОСОВОЙ ВЕРИФИКАЦИИ К АТАКАМ, ИСПОЛЬЗУЮЩИМ СИСТЕМУ СИНТЕЗА
Щемелинин В. Л., Симончик К. К.
84
Проанализирована устойчивость современных методов верификации к взлому при помощи гибридной системы синтеза речи на основе технологий Unit Selection и скрытых марковских моделей. Представлен метод взлома, обеспечивающий достижение ошибки ложного пропуска в 98—100 % случаев при большом объеме обучающей базы; метод может быть автоматизирован при сопряжении с автоматической системой распознавания речи.