Способ анализа и синтеза речи и устройство для его осуществления Советский патент 1989 года по МПК G10L13/02 G10L19/02 

Описание патента на изобретение SU1501138A1

Изобретение относится к речевой информатике, а именно к цифровым кодирующим и декодирующим преобразованиям сигналов, и может быть исполь-. зовано в вычислительной технике и технике связи для синтеза речевых сообщений.

Цель изобретения - повышение качества синтезируемой речи.

.На чертеже изображена структурная схема предлагаемого устройства.

Устройство состоит из последовательно соединенных источника 1 речевого сигнала, анализатора 2, канала 3 связи и синтезатора 4. Анализатор 2 содержит последовательно соединенные фильтр 5 нижних частот (ФНЧ), аналод о-цифровой преобразователь 6 (АЦП) с тактовым генератором 7 и пер- вьй блок 8 быстрого гуэеобразования Фурье (БПФ). Выход АЦП 6 соединен

также с последовательно включенными детектором 9 высоты тона и генератором 10 сигналов возбуждения. Входы первого блока 11 умножения соединены с выходами первого и второго блоков 8 и 12 БПФ. Вход второго блока 12 БПФ соединен с выходом генератора 10 сигналов возбуждения. Последоват ель- но В1сг1ючены второй блок 13 умножения, входы которого соединены с выходами первого блока 11 умножения и генератора 14 базисных функций, первый накапливающий сумматор 15, третий блок 16 умножения, второй вход которого соединен с выходом блока 17 памяти, второй накапливающий сумматор 18 и кодер 19, первьй вход которого соединен с выходом детектора 9 высоты тона и адресным входом блока 17 памяти. Выходом анализатора 2 является выход кодера 19.

сд

с с

3150

Синтезатор 4 содержит последовательно включенные декодер 20, вход которого является входом синтезатора 4, генератор 21 сигналов возбуждения блок 23 БПФ, первьй блок 25 умножения, второй вход которого связан с выходом генератора 22 базисных функций через второй блок 24 умножения и накапливающий сумматор 26, блок 27 обратного быстрого преобразования Фурье (ОБПФ), цифроаналоговый преобразователь 28 и ФНЧ 29. Второй выход декодера 20 соединён с вторым входом второго блока 24 умножения. Выходом синтезатора 4 является выход ФНЧ 29. . Осуществление способа начинается с сегментации речевого сигнала. На каждом сегменте с помощью преобразования Фурье определяют его спектр ) на наборе частот, лежащих в диапазоне частот речевого сигнала, и принимают решение о .вокализованнос- ти сегмента и высоте тона. По принятому решению формируют соответствую- щий сигнал возбуждения и определяют его комплексно-сопряженный спектр ), Перемножая спектр исходного речевого сигнала и комплексно-сопря- женньш спектр сигнала возбуждения, получают их взаимный спектр

S(WK) X(W, ) Р (w,, ).

Координаты разложения спектральной огибающей исходного речевого сигнала определяют путем весового усреднения взаимного спектра

) t,(l,) , ,.., ,М,

Л.

- диапазон частот речевого сигнала;

Ут(и;) - базисные функции (В- 45

сплайны).

Параметры спектральной огибающей определяют путем весового суммиров - ния координат разложения

м

z

И1 t

tfn

1,.,.,М,

Ьи,„ - элементы обратной корреля1ЩОННОЙ матрицы rrtxj 55 Га,„ Т базисных функций

« П J

с весом, равным спектру мощности сигнала возбужцеНУ1Я

т

|Р(),((/)Ук().

квл

Параметры сигнала возбузвдения и параметры Cw, ,-.. о ,М, полученные при анализе, передают в синтезатор, где на основании принятых данных формируют сигнал возбуждения, которьй в точности совпадает с сигналом возбуждения, формируемым при анализе. Затем сигнал возбуждения фильтруют в соответствии с параметрами С | спектральной огибающей. Передаточная функция фильтра, используемого для фильтрации сигнала возбуждения, определяется выражением

H(UJK)

1:

И1гН

(к)

При такой передаточной функции параметры Суу, обеспечивают минимизацию ошибки

Е

кбл

IX(W) - X(W)|

где X(U y,)

P() Н((А;,(.) - спектр синтезированного речевого сигнала.

Устройство для анализа и синтеза речи работает следующим образом.

Исходный речевой сигнал с выхода источника 1 речевого сигнала фильт- руется в фильтре 5 нижних частот и поступает на вход АЦП 6, управляемого тактовым генератором 7. Цифровые отсчеты с вьпсода АЦП 6 поступают в первый блок 8 БПФ, где вычисляется спектр исходного речевого сигнала Х(1О() и на вход детектора 9 высоты тона, которьй измеряет параметры сигнала возбуждения, В соответствии с измеренными параметрами генератор 10 сигналов возбуждения формирует либо периодическую (на вокализованном сегменте), либо ,псевдослучайную (на невокализованном сегменте) цифровую, последовательность импульсов. Сигнал возбуждения поступает во второй блок 12 БПФ, где вычисляется его комплексно-сопряженный спектр (). В первом блоке 11 умножения перемножаются отсчеты спектров X(t«J,5) и и ) на первый вход второго блока 13 умножения поступают отсчеты взаимного спектра S(). Генератор

515

14 базисных функций вырабатьшает отсчеты п,( cu) , которые во втором блоке 13 умножения перемножаются с взаимным спектром S(u/ /), Полученные произведения суммируются в первом накапливающем сумматоре 15 и на первьш вход третьего блока 16 умножения цо- ступают координаты разложения спек- тральной огибающей J . В блоке 17 памяти хранятся величины Ь, предварительно рассчитанные для всех возможных сигналов возбуждения, В третьем блоке 16 умножения вычисляется Произведение величин f и b«,,j и с вы- 1хода второго накапливающего сумматора 18 в кодер 19 поступают параметры . Спектральной огибающей С, В кодер 19 с выхода детектора 9 высоты тона поступают также параметры сигнала возбуждения.

В синтезаторе А с выхода декодера 20 на вход генератора 21 сигналов возбуждения поступают параметры сиг нала ЙЬзбзгждения. Генератор 21 сиг- налов возбуждения выполнен идентично генератору 10 сигналов возбуждения в анализаторе 2. Вырабатываемая им последовательность поступает в блок . 23 БПФ, где вычисляется спектр Р(а(5). В первом блоке 24 умножения перемножаются параметры спектральной огиба кицей Си, поступающие с второго выхода декодера 20, и базисные функции вьфабатываемые генератором 22 базисных функций. С выхода накапливающего сумматора 26 на вход второго -блока 25 умножения поступают отсчеты передаточной функции Н(к ) С выхода второго блока 25 умножения отсчеты спектра синтезированного сигнала ( ) поступают в блок 270Б11Ф, где вычисляются отсчеты синтезированного речевого сигнала. Эти отсчеты в ЦАП 28 преобразуются в аналоговую форму и затем фильтруются в фильтре 29 нижних частот.

Аппроксимация передаточной функции сплайнами согласуется со свойствами слуха, что улучшает восприятие синте- зированной речи.

Формула изобретения

1. Способ анализа и синтеза речи, включающий при анализе сегментацию речевого сигнала, определение вока- лизованности каждого сегмента, формирование последовательности импульсов

38

возбуждения периодических с периодом основного тона для вокализованных сегментов или псевдослучайных для невокализованных сегментов,, определение спектра исходного речевого -сигнала, комплексно-сопряженного спектра и спектра мощности сигнала возбуждения, определения координат разложения путем усреднения произве- дения спектра исходного речевого сигнала и комплексно-сопряженного спектра сигнала возбуждения, определение и педедачу. параметров спектральной огиба ющей исходного речевого сигнала а при синтезе - формирование сигнала возбуждения, совпадающего с сигналом возбуждения, формируемым при анализе,, и фильтрацию сигнала возбуждения в соответствии с принятыми параметрами спектральной огибающей, отличающийся тем, что, с целью повышения качества синтезируемой речи, при определении коорди нат разложения усреднения выполняют с весами, совпадающими с базисными функциями, при определении параметров спектральной огибающей суммируют координаты разложения с весами, равными значениям элементов обратной корреляционной матрицы базисных функций с весом, равным спектру мощности сигнала возбуждения, а при синтезе передаточную функцию фильтрации устанавливают равной сумме базисных функций, коэффициентами в которой являются принятые параметры спектральной огибающей исходного речевого, сиг нала, причем базисным функциям присваивают значения В-сплайнов.

2. Устройство для анализа и синтеза речи, содержащее последовательно включенные источник речевого сигнала, анализатор, канал связи и синтезатор, состоящий из последовательна соединенных декодера, вход которого является входом синтезатора, и генератора сигналов возбуждения и после- довательно соединенных первого блока умножения, блока обратного быстрого преобразования Фурье, цифроаналогово- го преобразователя и фильтра нижних частот, выход которого является выходом синтезатора, анализатор содержит блок памяти, накапливающие сумматоры детектор высоты тона, генератор.сигналов возбуждения, кодер и последовательно соединенные фильтр нижних частот, вход которого является входом анализатора, аналого-цифровой преобразователь, управляющий вход которого соединен с выходом тактового генератора, первый блок быстрого преобразования Фурье и первый блок умножения, при этом выход аналого-цифрового преобразователя соединен с входом детектора высоты тона, выход которого подключен к входам генератора сигналов возбуждения и кодера, выход которого является выходом анализатора , отличающеесл тем, что, с целью повьшения качества синтезируемой речи, в анализатор введены второй и третий блоки умножения, генератор базисньк функгщй и второй блок быстрого преобразования Фурье, вход которого соединен с выходом генератора сигналов возбуждения, выход второго блока быстрого преобразования Фурье связан с вторым входом кодера через первый и второй блоки умножения, первый накапливающий сумматор.

третий блок умножения и второй накапливающий сумматор, второй вход второго блока умножения соединен с выходом генератора базисных функций, второй вход третьего блока умножения соединен с выходом блока памяти, адресный вход которого соединен с выходом детектора высоты тона, а в синтезатор введены блок быстрого преобразования Фурье, накапливающий сумматор, второй блок умножения и генератор базисных функций, выход которого соединен с первым входом второго блока умножения, второй вход которого соединей с вторым выходом декодера, выход второго блока умножения через накапливающий сумматор соединен с вторым входом первого блока умножения, первьй вход которого соединен с выходом блока быстрого преобразования Фурье, вход которого соединен с выходом генератора сигналов возбуждения.

Похожие патенты SU1501138A1

название год авторы номер документа
Способ анализа и синтеза речи и устройство для его осуществления 1986
  • Захаров Юрий Владимирович
SU1434487A1
Способ анализа и синтеза речи и устройство для его осуществления 1986
  • Захаров Юрий Владимирович
SU1316030A1
Вокодер 1986
  • Захаров Юрий Владимирович
SU1490689A1
СИНТЕЗАТОР И СПОСОБ ДЛЯ РЕЧЕВОГО СИНТЕЗА (ВАРИАНТЫ) И РАДИОУСТРОЙСТВО 1996
  • Ярвинен Кари
  • Хонканен Теро
RU2181481C2
СПОСОБ ПОСЛЕДУЮЩЕЙ ОБРАБОТКИ С ВЫСОКОЙ РАЗРЕШАЮЩЕЙ СПОСОБНОСТЬЮ ДЛЯ РЕЧЕВОГО ДЕКОДЕРА 1998
  • Экудден Эрик
  • Хаген Роар
  • Клейн Бастиан
RU2199157C2
ГЕНЕРАЦИЯ ВЫСОКОПОЛОСНОГО СИГНАЛА ВОЗБУЖДЕНИЯ 2015
  • Рамадас Правин Кумар
  • Синдер Даниел Дж.
  • Виллетт Стефан Пьер
  • Раджендран Вивек
RU2683632C2
УСТРОЙСТВО И СПОСОБ ПРЕОБРАЗОВАНИЯ ЗВУКОВОГО СИГНАЛА В ПАРАМЕТРИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ, УСТРОЙСТВО И СПОСОБ МОДИФИКАЦИИ ПАРАМЕТРИЧЕСКОГО ПРЕДСТАВЛЕНИЯ, УСТРОЙСТВО И СПОСОБ СИНТЕЗА ПАРАМЕТРИЧЕСКОГО ПРЕДСТАВЛЕНИЯ ЗВУКОВОГО СИГНАЛА 2009
  • Диш Саша
RU2487426C2
УСТРОЙСТВО И СПОСОБ РЕЧЕВОЙ МОДУЛЯЦИИ 2003
  • Ким Ки Су
RU2333546C2
УСТРОЙСТВО И СПОСОБ ДЛЯ СИНТЕЗИРОВАНИЯ АУДИОСИГНАЛА, ДЕКОДЕР, КОДЕР, СИСТЕМА И КОМПЬЮТЕРНАЯ ПРОГРАММА 2014
  • Фукс Гийом
  • Бекстрем Том
  • Гайгер Ральф
  • Егерс Вольфганг
  • Равелли Эммануэль
RU2618919C2
СИСТЕМА ИСКАЖЕНИЯ ГОЛОСА ДИКТОРА 2009
  • Котов Михаил Андреевич
  • Леднов Дмитрий Анатольевич
  • Меркулов Максим Николаевич
  • Хацкевич Андрей Валентинович
RU2403627C1

Иллюстрации к изобретению SU 1 501 138 A1

Реферат патента 1989 года Способ анализа и синтеза речи и устройство для его осуществления

Изобретение относится к речевой информатике и может быть использовано в вычислительной технике и технике связи для выделения и реконструкции речевых сообщений. Цель изобретения - повышение качества синтезируемой речи. Устройство для анализа и синтеза речи содержит блоки быстрого преобразования Фурье и формирователи взаимного спектра сегмента речи и генерируемого в анализаторе сигнала возбуждения. При аппроксимациях спектра В-сплайнами можно определить параметры фильтрации источника без решения обширных систем уравнений, что реализуется введением блока постоянной памяти, чтением данных из которого управляет детектор высоты тона. Упрощается восстановление сигнала по параметрам, принимаемым декодером из канала связи. 2 с.п.ф-лы, 1 ил.

Формула изобретения SU 1 501 138 A1

Редактор Юо Середа

Составитель В.Махонин

Техред М.ХоданичКорректор Т.Малец

Заказ 4876/49

Тираж 343

ВНИИПИ Государственного комитета по изобретениям и открытиям при ГКНТ СССР 113035, Москва, Ж-35, Р-аушская наб., д. 4/5

- Подписное

Документы, цитированные в отчете о поиске Патент 1989 года SU1501138A1

Способ анализа и синтеза речи и устройство для его осуществления 1986
  • Захаров Юрий Владимирович
SU1434487A1
Печь-кухня, могущая работать, как самостоятельно, так и в комбинации с разного рода нагревательными приборами 1921
  • Богач В.И.
SU10A1

SU 1 501 138 A1

Авторы

Захаров Юрий Владимирович

Даты

1989-08-15Публикация

1986-09-09Подача