ISSN 0021-3454 (печатная версия)
ISSN 2500-0381 (онлайн версия)
Меню
Аннотации номера

СИСТЕМЫ АНАЛИЗА РЕЧИ

7
Выявлены речевые особенности, позволяющие решать задачи автоматической идентификации языка и идентификации диктора. Предложен метод, использующий статистические параметры, характеризующие мелодический контур фраз исследуемого языка.
РАЗРАБОТКА КАНАЛОНЕЗАВИСИМЫХ ИНФОРМАТИВНЫХ ПРИЗНАКОВ Киселёв В. В., Ткаченя А. В., Хитров М. В.
12
Исследованы информативные признаки речи с целью формирования каналонезависимого пространства признаков для повышения эффективности функционирования системы распознавания дикторов. Экспериментально определен оптимальный набор каналонезависимых информативных признаков для решения задачи выявления сходства между фонограммами на основе метода динамического программирования.
17
Исследована проблема сбалансированности данных при обучении акустических моделей для автоматического распознавания речи. Предложена метрика, позволяющая при кластеризации состояний трифонов явно учитывать влияние количества данных в кластере. Экспериментально доказано, что использование такого подхода позволяет повысить качество распознавания речи.
23
Предложен метод, позволяющий при обучении скрытых марковских моделей, входящих в состав систем автоматического распознавания речи, оптимизировать число компонент в гауссовых смесях состояний. Применение метода повышает качество и скорость распознавания речи системой.
28
Рассмотрены статистические методы определения местоположения и длительности пауз в системе синтеза речи. Применение таких методов позволяет добиться лучших результатов по сравнению с использованием алгоритмов, основанных на правилах.

СИСТЕМЫ ОБРАБОТКИ РЕЧЕВЫХ И АКУСТИЧЕСКИХ СИГНАЛОВ

33
Предложен метод оценки временного сдвига между акустическими сигналами, записанными в условиях реверберации и нелинейных искажений, базирующийся на оценке кросскорреляции временных огибающих сигналов, проведено его сравнение с другими методами оценки временного сдвига.
40
Проанализированы способы оценки стохастичности речевых сигналов. Результаты моделирования показали, что предложенный способ оценки превосходит известные по качеству — оценки имеют меньшее смещение и дисперсию.
47
Исследована функциональная безопасность обнаружения виброакустического сигнала приближающегося поезда методом энергетического обнаружителя. Найдено нижнее значение порога обнаружения исходя из предложенной вероятности ложной тревоги, доказана достаточность применения разработанного метода обнаружения приближающегося поезда для бесстыковых путей.
53
Рассмотрен метод разделения речи целевого и сторонних дикторов с помощью обработки сигналов двух симметричных микрофонов, ориентированных в противоположных направлениях. Алгоритм обработки обеспечивает пространственное разделение дикторов.

СИСТЕМЫ РАСПОЗНАВАНИЯ ЛИЧНОСТЕЙ ПО ГОЛОСУ

58
Проанализированы методы проведения фонографической экспертизы. Рассмотрено используемое в целях идентификации диктора программное обеспечение. Описывается звуковой редактор SIS II.
63
Представлена концепция системы национального фоноучета и голосового биометрического поиска.
70
Исследованы особенности применения методов обучения на основе многообразий, широко используемых в приложениях по распознаванию изображений, для решения задач распознавания личностей по голосу (дикторов). Проанализированы результаты экспериментов по использованию таких методов.
77
Представлен метод обучения скрытых марковских моделей по нескольким вариантам произнесения парольной фразы с помощью алгоритма динамического временного выравнивания сигналов. Метод позволяет создавать точные статистические модели речевых сигналов и снижать вероятность возникновения ошибок верификации.
84
Проанализирована устойчивость современных методов верификации к взлому при помощи гибридной системы синтеза речи на основе технологий Unit Selection и скрытых марковских моделей. Представлен метод взлома, обеспечивающий достижение ошибки ложного пропуска в 98—100 % случаев при большом объеме обучающей базы; метод может быть автоматизирован при сопряжении с автоматической системой распознавания речи.