Устройство анализа и синтеза речевого сигнала Советский патент 1982 года по МПК G10L19/04 

Описание патента на изобретение SU980133A1

Изобретение относится к анализу, синтезу и передаче (запоминанию) речевых сигналов и может быть использовано в технике связи, в частности в телефонии, а также в устройствах распознавания образов.

Известны устройства анализа .и синтеза речевых сигналов, в которых выделение параметров речевого сигнала осуществляется на основе корреляционной обработки в предположении,что модель образования сигнала линейна. Синтез речевого сигнала осуществляется посредством перестраиваемого линейного фильтра-предсказателя Г 1 и 2 .

Наиболее близким к предлагаемому по технической сущности является устройство анализа и синтеза речевого сигнала, содержащее в анализаторе фильтр нижних частот, дискретизатор, генератор импульсов, вычислитель параметров линейного фильтрапредсказателя, выделитель периода основного тона и вычислитель тон/шум, в котором вычисляется среднеквадратическое отклонение ошибки предсказания, уплотнитель, который через канал связи соединен с разделителем. В синтезаторе содержатся генератор импульсов основного тона, ге.нератор шума, фильтр с пере.страиваемыми параметрами, который состоит из линейного фильтра-предсказателя и сумматора, усилители и фильтр нижних частот ГЗ .

Однако в данном устрюйстве оценка коэффициентов линейного фильтра с перестраиваемыми параметрами и

10 периода импульсов основного тона раздельна, что приводит к неоптимальной обработке речевого сигнала и, как следствие, к уменьшению точности анализа и синтеза. Кроме того,

15 в анализаторе при оценке периода основного тона неизбежны ошибки типа пропусков и появления ложных импульсов, качество синтеза оказывается сравнительно невысоким.

20

Цель изобретения - повышение точности анализа и синтеза речи за счет исключения из передачи информации об основном-тоне на основе введения нелинейной обработки сигнала.

25

Поставленная цель достигается тем, что в устройство, содержащее в анализаторе последовательно соединенные фильтр нижних частот и дискретизатор, генератор импульсов, под30ключенный к управляющему входу дискретизатора, вычислитель тон/шум, соединенный с первым входом уплотнителя, подключенного через канал связи к разделителю, в синтезаторе разделитель, первый выход которого соединен с входом линейного фильтра-предсказателя, подключенного к третьему входу сумматора, четвертый выход разделителя соединен с управляющим входом второго усилителя,вхо которого .подключен к выходу генератора Ш5ма, а выход - к первому вход сумматора, второй вход сумматор соединен с выходом первого усилителя, выход сумматора подключен к входам линейного фильтра-предска:зателя и первого фильтра нижних частот, в анализатор введен вычислитель параметров нелинейного предсказания, вход которого соединен с выходом дискретизатора, а три выхода подключены соответственно: первый - к входу вычислителя тон/шум, второй и третий - к второму и третьему входЛ уплотнителя, в синтезатор введены последовательно соединенные второй дополнительный фильтр нижних частот первый нелинейный преобразователь, линейный сглаживающий фильтр и второй нелинейный преобразователь, при этом вход второго дополнительного фильтра нижних частот соединен с выходом сумматора, выход второго нелинейного преобразователя соединен с входом первого усилителя,управляющий вход которого соединен с третьим выходом разделителя, второй выход разделителя соединен с управляющим входом линейного сглаживающего фильтра и с первым управляющим входом второго нелинейного преобразователя, второй управляющий вход которого подключен к четвертому выходу разделителя.

На фиг.1 изображенаблок-схема предлагаемого устройства; на фиг,2 осциллограммы, поясняющие его работу на фиг.З и 4 - характеристики второго и первого нелинейных преобразователей соответственно.

Анализатор предлагаемого устройства содержит фильтр 1 нижних частот, дискретизатор 2, генератор 3 импульсов, вычислитель 4 параметров нелинейного предсказания, вычислитель 5 тон/шум, уплотнитель 6. Выходы уплотнителя 6 через канал 7 связ соединены с входом разделителя 8. Устройство также содержит линейный фильтр-предсказатель 9, второй нелинейный преобразователь 10, сглаживающий фильтр 11, первый усилител 12, второй усилитель 13, генератор 14 шума, сумматор 15, второй дополнительный фильтр 16 нижних частот, первый фильтр 17 нижних частот и первый нелинейный преобразователь 1

На осциллограмме А (фиг,2) изображена изменяющаяся во времени щумовая составляющая на первом входе сумматора 15, вырабатываемая генератором 14 шума с учетом козффи- циента усиления усилителя 13, На осциллограмме Б изображен сигнал-на втором входе сумматора 15, вырабатываемый вторым нелинейным преобразователем 10 с учетом действия, окаQ зываемого усилителем 12. На осциллограмме В изображен сигнал на выходе сумматора 15. На осциллограмме Г приведен сигнал, формируемый на выходе сглаживающего фильтра 11.

Работа устройства основана на нелинейной модели речеобразования,

Предполагается, что сигнал образуется в соответствии с нелинейным уравнением следующего вида

20 . -(,8 , гдеЬ,-;, ,

S(z

j

, , о

У 41 Wf у ) гг Р { t-i f

Wt - дискретный белый шум {0,-5,i 1,m- коэффициенты линейного пред0 сказания (аналогичные коэффициентам в модели речеобра зования известного);

bjj,,r- коэффициенты сглаживания

фильтра;

5 Р-ГИ.- коэффициенты, характеризующие форму и наклон характеристики второго нелинейного преобразователя,

Все параметры сигнала Х{., к котоРШ относятся &{, i ГГт, bij,i 1,е, и среднеквадратическое отклонение ошибки нелинейного предсказания (э рассчитываются на основе корреляционной обработки х. в результате решения нелинейных корреляционных уравнений

Bxx( iBxxto - amBxx ( (1), Вхх()+- + ат8ххи-2),(у (2),

0 exx(«)aiBxx(ni-l)+...+amBxx(o)boBx4.(m),

где 8)((i),m - оценки корреляционной

функции сигнала на сегменте анализа N-f

Вхх()|д:т п-п41,6j(,(i), i 1,m

оценки- функции взаимной корреляции между сигналом х. и его нелинейным преобразованием V{z Ь- ; i- r + i, г ) на сегменте анализа

N

BXVC ( ТГТ -

П1 i+1 г

.Г.ъ,f,(„.. Таким образом, в вычислителе осуществляется расчет корреляционных функций сигнала на сегменте и решение приведенной системы корреля ционных уравнений. Исходный сигнал х ограничивается по спектру частот, дискретиэируе ся и подвергается анализу, на основе которого вычисляются параметры нелинейной модели в вычислителе параметров нелинейного предсказания и вычислителе тон/шум. Эти параметр уплотняются в уплотнителе 6, передаются по каналу 7 связи, разделяют ся в разделителе 8 и поступают в синтезатор. Синтез 5с осуществляетс следующим образом. Коэффициенты (al i 1,m.подаются на линейный фильт предсказатель 9 и определяют его состояние. Коэффициент Ъ„ управляет усилением усилителя 12 и полярность сигнала на его выходе (полярность определяется знаком bg). Коэффициен ты Ь, i г+1,е определяют состояние сглаживающего фильтра 11. Коэффициенты Ь, i г+1,Е устанавливают характеристику второго нелинейного преобразователя 10. Величина d определяет коэффициент усиления усилителя 13 и используетс .для подстройки порога л во втором нелинейном преобразователе 10. Выхо ной сигнал х, наблюдаемый на выход сумматора 15 (осциллограмма В на фиг.2), сглаживается первым фильтро 17 нижних частот. Формирование реализации .синтезированного речевого сигнала при Ь происходит следующим образом (фиг.2 Если в анализируемом сигнале обрабатывается вокализованный сегмент, соответствующий участку типа тон, то величина iЬодостаточно велика и поэтому вблизи момента времени tg на выходе второго нелинейного преобразователя 10 возникает ненулевой сигнал И (осциллограмма Б на фиг.2) при прохождении сигнала (осциллог.рамма Г на фиг.2) через пороговое значение л(фиг.3). Сигнал И воздействует на второй вход сумматора 15, на первый вход которого с выхода генератора шума подается белый шум W (осциллограмма А на фиг.2), усиленный в соответствии с величиной 6. Так как среднеквадратическое отклонение ошибки предсказания на участке типа тон обычно мало (отношение шум/сигнал около 1%), то и уровень шума относительно мал и не играет существенной роли в формировании X. На третий вход сумматора 15 воздействует сигнал с выхода линейного фильтра-предсказателя 9, равный нулю в начальный момент времени to. Сигнал X вблизи to( равен отклику цепи, состоящей из суг матора 15 и фильтра-предсказателя 9, на сигнал И и возрастает по уровню (точкаг на фиг.2, осциллограмма В). Одновременно возрастает по уровню сигнал, который пропорционален огибающей сигнала х. Это приводит к убыванию сигнала И на выходе второго нелинейного преобразователя 10 (точка Т на фиг.2, осциллограммы Б и Г и фиг.З). Далее сигнал z| изменяется медленно, так что остается близким к нулю до момента времени t, (осциллограммы Б и Г на фиг.2). Таким образом, на участке (to,t сигнал xj совпадает с откликом цепи, состоящей из cyj iMaTopa 15 и фильтра 9, на импульс с выхода второго нелинейного преобразователя 10 и незначительное шумовое воздействие wf. Так как коэффициенты , ,m определены на сегменте типа тон, то этот отклик носит характерный для вокализованных фрагментов речи осциллирующий характер. По мере приближения сигнала Z к значению (фиг.З) и убывания амплитуды 2 выходе второго нелинейного преобразователя 10 формируется новый импульс, который после усиления и уста.новкиНужной полярности в усилителе 12 вновь поступает на второй вход сумматора 15, и далее процесс повторяется до тех пор, пока x в анализаторе обрабатывается на сегменте тон (точки t, t на фиг,2). На сегменте типа шум среднеквадратическое отклонение ошибки предсказания возрастает, а коэффициент I bgl уменьшается. Это приводит к тому, что цепь нелинейной обратной связи практически не участвует в формировании х и основную роль И1- рает сигнал с выхода генератора 14 шума (точки t,t и tv в области времен t 7 t4 на фиг.2). Предлагаемое устройство по сравнению с известными позволяет повысить точность анализа и синтеза речевого сигнала, при этом качество синтезированного сигнала повышается за счет лучшего воспроизведения основного тона. Формула изобретения Устройство анализа и синтеза речевого сигнала, содержащее в анализаторе последовательно соединенные фильтр нижних частот и дискретизатор, генератор импульсов, подключенный к управляющему входу дискретизатора, вычислитель тон/шум, соединенный с первым входом уплотнителя, подключенного через канал связи к разделителю, в синтезаторе - разделитель, первый выход которого соединен с входом линейного фильтрапредсказателя, соединенного с треть входом сумматора, четвертый выход, разделителя соединен с управляющим входом второго усилителя, вход которого подключен к выходу генератор шума, а выход - к первомувходу сум матора, второй вход сумматора соединен с выходом первого усилителя, выход сумматора подключен к входам линейного фильтра-предсказателя и первого фильтра нижних частот, о тличающееся тем, что, с целью повышения точности анализа и синтеза речевого сигнала, в анализатор введен вычислитель параметров нелинейного предсказания, вход которого соединен с выходом дискретизатора, а три выхода подключены соответственно; первый - к входу вычислителя тон/шум, второй и третий - к второму и третьему входам уплотнителя, в синтезатор введены последовательно соединенные второй дополнительный фильтр нижних частот первый нелинейный преобразователь, линейный сглаживающий фильтр и второй нелинейный преобразователь, при этом вход второго дополнительного .фильтра нижних частот соединен с i выходом csMMaTopa, выход второго нелинейного преобразователя соединен с входом первого усилителя, управляющий вход которого соединен с третьим выходом разделителя, второй выход разделителя соединен с управляющим входом линейного сглаживающего фильтра и с первым управляющим входом второго нелинейного преобразователя, второй управляющий вход которого подключен к четвертому выходу разделителя. Источники информации, принятые во внимание при экспертизе 1.Atal B.S., Hanauec S.L. Analysis and Synthesis by Linear, Pirediction of Speech Wave. I.A.S.A., V. 50, № 2 (part 2), 1971. 2.F. Itakura et al. An Audio Response Unit Based on Partial Autocorrelation. IEEE Tr., V. COM-20, 4, 1972. 3.Atal B.S. Speech Analysis and Synthesis by the Use of the Linear. Prediction of Speech Wave. Oct. 29, 1969, ser. 87205l6, U.S. cl. 179-15A, № 3624302.

Похожие патенты SU980133A1

название год авторы номер документа
Устройство для ввода и вывода речевой информации 1977
  • Свириденко Владимир Александрович
  • Звездин Виктор Сергеевич
SU792247A1
Прогнозирующий вокодер 1978
  • Рылов Александр Сергеевич
  • Солонович Григорий Григорьевич
  • Люперсольский Александр Михайлович
SU788151A1
Система передачи и приема сигналов с адаптивной дифференциальной импульсно-кодовой модуляцией 1983
  • Лебедев Анатолий Титович
  • Маримонт Александр Львович
  • Новиков Николай Николаевич
  • Селянкин Юрий Васильевич
SU1100741A1
СИСТЕМЫ, СПОСОБЫ И УСТРОЙСТВА ДЛЯ УСТРАНЯЮЩЕЙ РАЗРЕЖЕННОСТЬ ФИЛЬТРАЦИИ 2006
  • Вос Коэн Бернард
  • Кандхадаи Анантападманабхан А.
RU2413191C2
Устройство синтезирования речи 1983
  • Лебедев Анатолий Титович
  • Маримонт Александр Львович
  • Новиков Николай Николаевич
  • Селянкин Юрий Васильевич
SU1100740A1
СИСТЕМЫ, СПОСОБЫ И УСТРОЙСТВА ДЛЯ ВЫСОКОПОЛОСНОГО ПРЕДЫСКАЖЕНИЯ ШКАЛЫ ВРЕМЕНИ 2006
  • Вос Кон Бернард
  • Кандхадай Анантхападманабхан А.
RU2491659C2
СПОСОБ И УСТРОЙСТВО ДЛЯ КОДИРОВАНИЯ РЕЧЕВЫХ СИГНАЛОВ С РАСЩЕПЛЕНИЕМ ПОЛОСЫ 2006
  • Вос Кон Бернард
  • Кандхадай Анантхападманабхан А.
RU2386179C2
Цифровой вокодер 1979
  • Звездин Виктор Сергеевич
  • Свириденко Владимир Александрович
SU838706A1
СИСТЕМЫ, СПОСОБЫ И УСТРОЙСТВА ДЛЯ ВЫСОКОПОЛОСНОГО ПРЕДЫСКАЖЕНИЯ ШКАЛЫ ВРЕМЕНИ 2006
  • Вос Кон Бернард
  • Кандхадай Анантхападманабхан А.
RU2376657C2
Система передачи и приема сигналов с адаптивной дифференциальной импульсно-кодовой модуляцией 1982
  • Ерохин Илья Николаевич
  • Новиков Николай Николаевич
SU1058082A1

Иллюстрации к изобретению SU 980 133 A1

Реферат патента 1982 года Устройство анализа и синтеза речевого сигнала

Формула изобретения SU 980 133 A1

з

f(l bi)

Фиг. 5

0 Фиг Л

SU 980 133 A1

Авторы

Прохоров Юрий Николаевич

Санников Владимир Григорьевич

Даты

1982-12-07Публикация

1981-02-06Подача