Метод оптимизации параметров преобразователей речи

Рассматривается вопрос оптимизации процесса формирования вокодерных сигнал-параметров по времени с помощью канонического разложения передаточной функции модели голосового тракта. В качестве критерия сравнения предлагается мера близости мгновенного энергетического спектра нестационарного случайного процесса на выходе модели речеобразования и энергетического спектра процесса, выделенного временным интервалом преобразователя речи. Для решения задачи оптимизации модели преобразователя речи использован метод канонического разложения Карунена-Лоэва применительно к нестационарным передаточным функциям линейных систем. Предлагаемый метод иллюстрируется на примере оптимизации длительности прямоугольного «окна».

УДК 621.391.3

В. А. Лепешкин, старший научный сотрудник ОАО «РИМР», к. т.н.; rimr500@mail.ru

Л. Я. Антонюк, заместитель технического директора ОАО «РИМР», к. т.н.; info@rimr.ru

О. Ф. Корхов, начальник лаборатории ОАО «РИМР», rimr500@mail.ru

Ключевые слова: сигнал-параметры вокодера, модель голосового тракта, разложение Карунена-Лоэва, длительность прямоугольного «окна».

Статья опубликована в № 10 журнала «Электросвязь» за 2014 г.Lepeshkin

Рубрики и ключевые слова