Способ анализа и синтеза речи и устройство для его осуществления Советский патент 1987 года по МПК G10L15/04 G10L19/02 

Описание патента на изобретение SU1316030A1

113

Изобретение относится к анализу и синтезу речи и может, быть использовано в системах вокодерной телефонии,

Цель изобретения - повышение качества синтеза речи путем фильтрации сигнала возбуждения фильтром с передаточной характеристикой, зависящей от спектральной огибающей исходного речевого сигнала и обеспечивающей минимальную ошибку его восстановления .

Супщость способа заключается в следующем.

Исходный речевой сигнал разбивают на отдельные сегменты

Исходный речевой сигнал разбивают на отдельные сегменты. В течение каждого сегмента определяют спектр исходного речевого сигнала X (ЬJ,) на наборе частот uj. , k , О,. , , , М- , лежащих в диапазоне частот речевого сигнала, и параметры сигнала возбуждения: параметр тон/щум, определяющий характер сегмента, и период ос- HOFjHoro тона на вокализованном сегменте. Затем, используя параметры сигнала возбуждения, формируют сигна вотбуждения, ;.1ля вокализованных сег- мс}ггон сигнал возбуждения - это пос- -;к донательность коротких импульсов, период следона}1ия которых является периодом основного тона, а для невокализованных сегментов - псевдослу- ча1П1ая последовательность импульсов, По сигналу возбужде)1ия определяют комплексно-сонряженнь спектр сигнала возбуждения Р (li- ,) , k О, М-1, где - знак сопряжения. Перемножая атектр исходного речевого сигнала и комплексно-сопряженный спектр сигнала возбуждения, получают взаимный спектр сигналов s (w) -L X Параметры спектральной огибающей исходного речевого сигнала определяют путем усреднения взаимного спектра s (ы) в разных интервалах частот

Л1-1

Т. Ч (u;)s(uj), m 1,N, krO

где N - число параметров спектральной огибающей исходного речевого сигнала,

а весовые функции 1/(ш) принимают постоянные значения в неперекрывающихся интервалах частот

V., ;

I О, для других k. Числа 0 определяют граничные частоты при выделении параметров f :

т tn

0.v,cOj. ...V/v ;

ГО

t) . . , Ь

UJ

V.

Параметры сигнала возб -ждения (параметр тон/шум и период основного тона) и параметры t , m Т. N.

Т №

полученные при анализе, передают в синтезатор, где на основании принятых данных формируют сигнал возбуждения, который в точности совпадает с сигналом возбуждения, формируемым при анализе. Затем сигнал возбуждения фильтруют в соответствии с параметрами спектральной огибающей исходного речевого сигнала. Передаточная функция фильтра, используемо- го для фильтрации сигнала возбуждения, определяется выражением

N

П() 51 (ы,),

ГЛ г1

где С„ /а„;

М-1

А /РЧ)/Ч,(и;,),

При такой передаточной функции H(w) параметры обеспечивают минимизацию ошибки

ЛЛ-1

0

I. /x(wJ - i (wJ/S

VrO

Q где x(uj) - спектр синтезированного речевого сигнала

x(u)) P(to)H(u), На фиг,1 изобралсена структурная схема устройства для анализа и синте- 5 за речи: на фиг,2 - структурная схема цифрового фильтра.

Устройство состоит из последовательно включенных источника 1 речевого сигнала, анализатора 2, канала 3 связи и синтезатора 4, Анализатор 2 содержит фильтр 5 нижних частот, аналого-цифровой преобразователь (АЦП) 6, тактовый генератор 7, первый блок 8 быстрого преобразования Фурье (БПФ), детектор 9 высоты тона, генератор 10 сигналов возбуждения, второй блок 11 БПФ, блок 12 умножения, накапливающий сумматор 13 и ко313

дер 14, Си 1тсяатор 4 содержит последовательно соединенные декодер 15, генератор 16 сигналов возбуждения, цифровой фильтр 17, цифроаналоговый преобразователь (ЦАП) 18 и фильтр 19 нижних частот.

Цифровой фильтр 17 содержит последовательно включенные блок БПФ 20, квадратор 21, накапливающий сумматор 22, блок 23 деления, блок 24 умножения и блок 25 обратного БПФ,

Устройство для анализа и синтеза речи работает следующ1 М образом.

Исходный речевой сигнал с выхода источника 1 речевого сигнала фильтруется в фильтре 5 нижних частот и поступает на вход АЩ1 6, управляемого тактовым генератором 7. Цифровые отсчеты к., , К-1 с выхода АЦЦ 6 поступают в первый блок 8 БЦФ и на вход детектора 9 высоты тона. В первом блок 8 БЦФ вычисляется спектр исходного речевого сигнала

м-

х(иь) И fro

k о, М ,

на частотах i;.. 2irk/MT, где Т - период I-зятия oi счетов в АЦП 6. Детектор 9 высоты тона измеряет параметры сигнала возбуждения: параметр тон/шум и период основН ..го тона. В соответствии с параметром тон/ шум г енератор 10 сигналов возбуждения формирует либо цифров то последовательность импульсов с периодом повторения, равным измеренному периоду основного T0}ia, псевдослучайную цифровую послед(1вательность импульсов, С выхода генератора 10 сигналов вотб ;ден11Я цифровые отсчеты р. , i О, М-1 поступают во второй блок 11 БЦФ, в котором вычисляется спектр сигнала возбуждения

м

P- e

-juJi, т

С выходов первого В и второго 11 блоков БПФ на входы блока 12 умножения последовательно во времени поступают цифровые отсчеты х(и.; ) и P(w). В блоке 12 умножения эти отсчеты перемножаются, и на вход накапливающего сумматора 13 последовательно во времени поступают отсчеты взаимного спектра исходного речевого сигнала и си1 иала возбуждения s(w) x(w)(}

04

Блок 12 умножения можно вьтолнйть в виде обыкновенного цифрового уьшо- жителя, В этом случае на его первый вход с выхода первого блока

8 БПФ цифровые отсчеты действительных Ci(iju) и мнимых Ь,, (о.) составляющих спектра x(u).) исходного речевого сигнала должны поступать в следующем порядке:,., а (и)) ,

Ь(ш), a(u)).,, и т,д. С выхода второго блока 11 БПФ цифровые .отсчеты действительных ap(W|) и мнимых bp(u),) составляющих спектра Р(ш) сигнала возбуждения должны поступать

в следующем порядке :,,. а p(uUj) ,

bp(u)), ар(ш), bp(LUj), ao(w, )..., т.е. составляющие для каждой частоты ш, должны nocT iiaTb в блок умножения дважды. При этом на, выходе блока y ffloжeния последовательно во времени образуются произведения

. . .a,(w)ap(w) , a(u))bp(uij,), Ь i.jj)a9(w) , b(wj)bp(w).. . .

Для каждого k в накапливающем сумматоре 13 вычисляются две суммы

a,(ui)ap(u)t) + b(u))bp (w) ;

30

Ь (u()a., (u.) - а (a))bp (uj) ,

являющиеся соответственно действи- те1П1Ной и мнимой составляющими про- ияг едения спектров х(и )P(u)|) на частоте со и суммируются по всем

k при V,. k J Vtrf Таким образом,

в накапливающем сумматоре 13 производится вычисление N параметров спектральной огибающей исходного речево- г о сигнала

.S,-,

1. V(u.)s(i,), m I,N, v-o

Пара 1етры поступают с выхода накапливающего сумматора 13 на один

из нходов кодера 14, Ца другой его вход с выхода детектора 9 высоты тона поступают параметры сигнала возбуждения. Кодер 14 совместно с декодером 15 обеспечивают передачу этих

параметров по каналу 3 связи, включенному между анализатором 2 и синтезатором 4,

С первого выхода декодера 15 на вход генератора 16 сигналов возбуждеПИЯ поступают параметры тон/шум и период основного тона. Генератор 16 сигналов возбуждения в синтезаторе 4 выполнен идентично генератору 10 сиг51316030

налов возбуждения в анализаторе 2, В соответствии с входными параметрами генератор 16 сигналов возбуждения в синтезаторе 4 формирует в точности такую же последовательность циф5 ж

ровых отсчетов Р. , i О, М-1, как генератор 10 сигналов возбуждения в анализаторе 2, Эта последовательност поступает в цифровой фильтр 17 на вход блока 20 БПФ. В последнем вы- числяется спектр сигнала возбуждения Р(и,), k О, М-1, С выхода блока 20 БПФ на вход квадратора 21 поочередно поступают цифровые отсчеты действительной я(,ц;) и мнимой Ьр(ш. составляющих спектра P(u |) сигнала возбуждения ...а(и ), р(и., )

ар(Ы|), bp(u)j,)В квадраторе 21

эти составляющие возводятся в квадрат и поступают затем в накапливающий сумматор 22, где вычисляются коэффициенты

V,r

а Z. а р (ы) Ь К)

:i:

/Р()/

М-1

V

2 r(t)/P(u;)/ , m 1 ,N.

k.O

Цифровые отсчеты а с выхода накапливающего сумматора 22 поступают на первый вход блока 23 деления, на второй вход которого с второго выхода декодера 15 поступают параметры , m 1,N, В блоке деления параметры Е нормируются на отсчеты а, и с его вькода на первьй вход блока 24 умножения поступают коэффициенты С|т, f 2 блоке умножения спектр сигнала возбуждения P(u)) умножается в каждом из диапазонов частот ш., . ш (JJ на

т-1 rri

СВОЙ коэффициент С,„, в результате чего на его выходе формируется произведение спектра сигнала возбуждения Р(и) на передаточную функцию

N

H(u;,) Z (ш,).

Т.е. спектр синтезированного речевого сигнала

x(wy)

РК)Н(ю)

Р(Ы,) г ,)

для всех частот ш , k О, М-1. Величины x(u),,) с выхода блока 24 умножения поступают на вход блока обратного БПФ, вычисляюп;его цифровые отсчеты X;, , М-1 синтезированного речевого сигнала, которые далее преобразуются в ЦАЛ 18 в непрерывный сигнал и затем фильтруются в фильтре 19 нижних частот, в результате чего на выходе фильтра 19 нижних частот образуется синтезированный речевой сигнал.

Таким образом, определение параметров спектральной огибающей исходного речевого сигнала по взаимному спектру исходного речевого сигнала и сигнала возбуждения позволяет

учесть конкретньй вид сигнала возбуждения так, что минимизируется ошибка синтеза речевого сигнала, т.е. повышается качество синтеза речи.

Например, на вокализованном сегменте речи в т-й полосе анализируемых частот могут оказаться две гармоники сигнала возбуждения, однако ошибки в воспроизведении спектральной плотности речевого сигнала, выражающейся в том, что синтезированный речевой сигнал мог бы иметь в этой полосе частот спектральную плотность в 2 раза больше, чем у исходного речевого сигнала, не произойдет ввиду учета сигнала возбуждения.

Формула изобретения

1. Способ анализа и синтеза речи,

в котором при анализе исходный речевой сигнал разбивают иа отдельные сегменты, на каждом сегменте определяют параметры сигнала возбуждения, формируют сигнал возбуждения,

определяют параметры спектральной

огибающей исходного речевого сигнала, передают параметры, определенные при анализе, принимают эти параметры, формируют сигнал возбуждения, в точности совпадающий с сигналом возбуждения, формируемым при анализе, и синтезируют искусственный речевой сигнал путем фильтрации сигнала возбуждения в соответствии с параметрами спектральной огибаюп1ей исходного речевого сигнала, отличающийся тем, что, с целью повышения качества синтеза речи, при ана713

лизе находят спектр исходного речевого сигнала и комплексно-сопряженный спектр сигнала возбуждения, перемножают спектр исходного речевого сигнала и комплексно-сопряженный спектр сигнала возбуждения, а параметры спектральной огибающей исходного речевого сигнала находят путем усреднения произведения спектра исходного речевого сигнала и комплексно-сопряженного спектра сигнала возбуждения в различных непересекающихся интервалах частот,

2, Устройство для анализа и синтеза речи, содержащее последовательно включенные источник речевого сигнала, анализатор, канал связи и синтезатор, состояошй из последовательно соединенных декодера, вход которого является входом синтезатора, генератора сигналов возбуждения,цифрового фильтра, управляющий вход которого соединен с вторым выходом декодера, цифроаналогового преобразователя и фильтра нижних частот, выход которого является выходом синтезатора, причем анализатор содержит последовательно включенные фильтр нижних частот, вход которого является входом анализатора, аналого-цифровой преобразователь, управляющий вход которого соединен с выходом так08

тового генератора, детектор высоты тона, выход которого соединен с входом генератора сигналов возбуждения и первьм входом кодера, выход кото- рого является выходом анализатора, отличающееся тем, что, с целью повьшения качества синтеза речи, в анализатор введены первый блок быстрого преобразования Фурье,

вход которого соединен с входом детектора высоты тона, и последовательно соединенные второй блок быстрого преобразования Фурье, вход которого соединен с выходом генератора сигналов возбуждения, блок умножения, второй вход которого соединен с выходом первого блока быстрого преобразования Фурье, и накапливающий сумматор, выход которого соединен с вторым входом кодера, а цифровой фильтр выполнен в виде последовательно соединенных блока быстрого преобразования Фурье, вход которого является информационным входом цифрового фильтра, квадратора, накапливающего сумматора, блока деления, второй вход которого является управляющим входом цифрового фильтра, блока умножения, второй вход которого соединен с выходом блока быстрого преобразования Фурье, и блока обратного быстрого преобразования Фурье, выход которого является выходом цифрового фильтра.

фиг. 2

Редактор 0.Головач

Составитель С.Аврин Техред Л.Олийнык

Заказ 2368/54Тираж 345Подписное

ВНИИПИ Государственного комитета СССР

по делам изобретений и открытий 113035, Москва, Ж-35, Раушская наб., д,4/5

,м. «.в.. «. , «- ™,..- ---. --- ----- - i---- - - -

Производственно-полиграфическое предприятие, г.Ужгород, ул.Проектная, 4

Выход

Корректор ЛЛ1ил1тенко

Похожие патенты SU1316030A1

название год авторы номер документа
Способ анализа и синтеза речи и устройство для его осуществления 1986
  • Захаров Юрий Владимирович
SU1501138A1
Способ анализа и синтеза речи и устройство для его осуществления 1986
  • Захаров Юрий Владимирович
SU1434487A1
Вокодер 1986
  • Захаров Юрий Владимирович
SU1490689A1
Вокодер с двумерной фильтрацией 1976
  • Трофимов Юрий Казимирович
SU649146A1
Цифровой синтезатор речи 1982
  • Куля Виктор Иванович
  • Смирнов Юрий Михайлович
  • Романюк Евгений Алексеевич
SU1080198A2
СИСТЕМА И СПОСОБ УЛУЧШЕНИЯ ДЕКОДИРОВАННОГО ТОНАЛЬНОГО ЗВУКОВОГО СИГНАЛА 2009
  • Вайанкур Томми
  • Елинек Милан
  • Маленовски Владимир
  • Салами Редван
RU2470385C2
Цифровой синтезатор речи 1980
  • Куля Виктор Иванович
  • Смирнов Юрий Михайлович
SU993315A1
СИНТЕЗАТОР НЕЛИНЕЙНОГО ГАРМОНИЧЕСКОГО ВОКОДЕРА 1973
  • В. Е. Муравьев
SU372720A1
СИНТЕЗАТОР И СПОСОБ ДЛЯ РЕЧЕВОГО СИНТЕЗА (ВАРИАНТЫ) И РАДИОУСТРОЙСТВО 1996
  • Ярвинен Кари
  • Хонканен Теро
RU2181481C2
УСТРОЙСТВО И СПОСОБ ПРЕОБРАЗОВАНИЯ ЗВУКОВОГО СИГНАЛА В ПАРАМЕТРИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ, УСТРОЙСТВО И СПОСОБ МОДИФИКАЦИИ ПАРАМЕТРИЧЕСКОГО ПРЕДСТАВЛЕНИЯ, УСТРОЙСТВО И СПОСОБ СИНТЕЗА ПАРАМЕТРИЧЕСКОГО ПРЕДСТАВЛЕНИЯ ЗВУКОВОГО СИГНАЛА 2009
  • Диш Саша
RU2487426C2

Иллюстрации к изобретению SU 1 316 030 A1

Реферат патента 1987 года Способ анализа и синтеза речи и устройство для его осуществления

Изобретение может быть использовано в системах вокодерной телефонии. Цель изобретения - повьш)сиие качества синтеза речи. Устройство, реализующее способ, состоит из источника 1 речевого сигнала, анализатора 2, канала 3 связи и синтезатора 4, фильтров 5 и 19 нижних частот, аналого-цифровых преобразователей 6 и 18 тактового генератора 7, бттоков 8 и 11 быстрого преобразования Фурье, детектора 9 высоты тона, генератора 10 сигналов возбуждения, блока 12 умножения, накапливающего сумматора 13, кодера 14, декодера 15, генератора 16 сигналов возбуждения и цифрового фильтра 17. Введение новых элементов и образование новых связей между элементами устройства позволяют достичь поставленную цель путем фильтрации сигнала возбуждения фильтром с передаточной характеристикой, зависящеГ от спектральной огибающей исходного речевого сигнала и обеспе- чинлю це11 минимальную ошибку его восстановления. Определение параметров спектральной огибающей исходного ре- чевог о сигнала по взаимному спектру исходного речевого сигнала и сигнала возбуждения позволяет учесть конкретный вид сигнала возбуждения так, что минимизируется ошибка синтеза речевого сигнала. 2 с.п.ф-лы, 2 ил. о (Л 5 № со 05 О со I . л/г./

Формула изобретения SU 1 316 030 A1

Документы, цитированные в отчете о поиске Патент 1987 года SU1316030A1

Способ выделения параметрических сигналов из зашумленной речи 1976
  • Братенков Борис Георгиевич
  • Зорин Владимир Михайлович
  • Смышляев Виктор Михайлович
  • Лидих Анатолий Константинович
  • Акбулатов Юрий Шакирович
  • Петров Николай Борисович
SU570082A1
Печь-кухня, могущая работать, как самостоятельно, так и в комбинации с разного рода нагревательными приборами 1921
  • Богач В.И.
SU10A1
Патент Великобритании Р 1485803, кл
Печь для непрерывного получения сернистого натрия 1921
  • Настюков А.М.
  • Настюков К.И.
SU1A1
,(54) СПОСОБ АПАЛИЗА И СИНТЕЗА РЕЧИ И УСТРОЙСТВО ДЛЯ ЕГО ОСУЩЕСТВЛЕНИЯ

SU 1 316 030 A1

Авторы

Захаров Юрий Владимирович

Даты

1987-06-07Публикация

1986-01-06Подача