ИСПОЛЬЗОВАНИЕ ЛИНГВИСТИЧЕСКОГО АНАЛИЗА ДЛЯ НОРМАЛИЗАЦИИ ТЕКСТА И СНЯТИЯ ОМОНИМИИ В СИСТЕМЕ СИНТЕЗА РУССКОЙ РЕЧИ
ООО „ЦРТ“, Санкт-Петербург; старший научный сотрудник
Рыбин С. В.
ООО „ЦРТ“, Санкт-Петербург; Санкт-Петербургский национальный исследовательский университет информационных технологий, кафедра речевых информационных систем; доцент
Аничкин И. М.
Университет ИТМО; аспирант
Читать статью полностью

Аннотация. Исследована проблема разрешения неоднозначности прочтения различных элементов при работе системы синтеза русской речи по тексту VitalVoice. Описываются особенности использования морфологического и синтаксического анализа при расшифровке сокращений и специальных знаков, а также снятии омонимии (омографии). Данные экспериментов свидетельствуют о том, что выбранные методы позволяют правильно прочесть более 95 % сложных элементов естественного текста.
Ключевые слова:
синтез речи по тексту, синтаксический анализ, морфологический анализ, омонимия, омография, нормализация текста