Показать метаданные Скрыть метаданные

(19)

(11)

1 765 843

(13)

(51)

МПК

G10L7/02(2000-01-01)

(21) (22)

Заявка

4862376, 1990-08-27

(22)

дата подачи заявки

1990-08-27

(45)

опубликовано

1992-09-30

(72)

авторы

Котенко Владимир ВладимировичГлушко Анатолий ПетровичБернацкий Анатолий ИвановичАлександров Сергей НиколаевичСвистунов Сергей СтепановичДаниленко Олег Валерьевич

(56)

Документы, цитированные в отчете о поиске

Назаров М.В., Прохоров Ю.НМетоды цифровой обработки и передачи речевых сигналовМ.: Радио и связь, 1985Фланаген ДжАнализ, синтез и восприятие речиИ.: Связь, 1968Оппенхайм А., Лим ДжВажность фазы при обработке сигналов, - ТИИЭР, 1981, № 5, сРабинер Л.Р., Шафер Р.ВЦифровая обработка речевых сигналов- М.: Радио и связь, 1981Сапожков МА., Михайлов В.ГВоко- дерная связь- М.: Радио и связь, 1983.

Анализатор речи Советский патент 1992 года по МПК G10L7/02

Описание патента на изобретение SU1765843A1

Изобретение относится к технике передачи информации и может быть использовано в системах телефонной связи.

Известен анализатор речи (см. Сапожков М. Л., Михайлов В.Г. Вокодерная связь - М.: Радио и связь, 1983), состоящий из полосовых фильтров (ПФ), разделяющих спектр речевого сигнала на частотные полосы, в каждой из которых путем декодирования и сглаживания фильтрами низких частот (ФНЧ) определяется средняя интенсивность речевого сигнала, выделителя основного тона (ВОТ), определяющего параметр основного тона речевого сигнала, выделителя тон-шум (ВТШ), определяющего вид спектра (ТОН-ШУМ) речевого сигнала; устройства расстановки кодовых комбинаций

(УРКК), преобразующего параллельный код комбинаций в последовательный для ввода их в канал связи.

Однако известное устройство имеет низкую точность оценки речевого сигнала. Причиной этого является то, что при реализации полосных вокодеров в настоящее время анализ речевого сигнала принято осуществлять на основе значений параметров мгновенного спектра амплитуд без учета информации о фазе речевого сигнала. Это объясняется тем, что в инженерной практике принято считать допустимыми потери кратковременных фазовых соотношений, так как органы слуха считаются нечувствительными к изменению фазы восстановленного речевого сигнала. Однако результаты

сл

N со

проведенных в последнее время исследований показывают, что потери естественных фазовых соотношений оказывают существенное влияние на натуральность восприятия синтезированного в вокодерных системах речевого сигнала 1,2,3.

При передаче речевого сигнала в полосных вокодерных системах его спектр разде- ляется полосовыми фильтрами на непересекающиеся частотные области (спектральные каналы). Проведенные экспериментальные исследования характеристик -сигналов показали, что сигналы на выходах полосовых фильтров Xi(t) представляют собой узкополосные процессы, которые могут быть описаны выражением вида

Xi(t)ai (t)cos ufeit + i(t)(1)

где ai(t) и 99j(t) - соответственно огибающая и фаза сигнала i-ro спектрального канала;

ftfei - частота, соответствующая максимуму энергии сигнала в i-том спектральном канале.

Исследовались сигналы на выходе полосовых фильтров полосного вокодера. Ха- р.актеристики полосовых фильтров приведены в таблице.

На вход вокодера подавались речевые сигналы, соответствующие фонемам русской речи. Регистрация сигналов спектральных каналов производилась осциллографом С 8-17, Схема экспериментальной установки приведена на фиг. 1.

На фиг. 2,3,4 показаны эпюры сигналов первого спектрального канала для фонемы а (безударное) (рис. 2), седьмого спектрального канала для фонемы к (рис. 3) и одиннадцатого спектрального канала для фонемы о (рис. 4) и др.

Аналогичные результаты получены при исследовании сигналов спектральных каналов для всей совокупности фонем русского языка, приведенной в 1. Анализ полученных результатов показывает справедливость представления сигналов на выходах полосовых фильтров в виде (1). Это показывает, что в известном устройстве анализ сигналов Xi(t) на выходах полосовых фильтров проводится недостаточно полно, так как анализируется только огибающая ai(t) без учета фазовых соотношений cos + ), что обуславливает недостаточную точность анализа параметров речевого сигнала.

Цель изобретения - повышение точности анализа параметров речевого сигнала путем учета фазовых соотношений сигналов на выходах полосовых фильтров.

Поставленная цель достигается тем, что в анализатор речи, содержащий N спектральных каналов, в каждом из которых соединены полосовой фильтр, амплитудный детектор, входы которых соединены со входами анализатора речи, а выходы со входами устройства расстановки кодовых комбинаций, выход которого подключен к каналу связи, дополнительно введены анализатор фонем, вход которого соединен со входом анализатора речи, генератор пилообразного напряжения, управляющий вход которого

0 соединен с пятым выходом блока анализа фонем, блок опорных напряжений, блок памяти информационные входы которого соединены с первым, вторым и третьим выходами блока анализа фонем, вычисли5 тель, а каждый спектральный канал дополнительно содержит фазовый детектор, вход . которого соединен с выходом полосового фильтра, и коммутатор, управляющие входы которого соединены с выходами генератора

0 пилообразного напряжения и блока опорных напряжений, а информационные входы подключены к выходам амплитудного детектора и фазового детектора, информационные входы вычислителя соединены с

5 выходами коммутаторов и выходом блока анализа фонем, а выходы соединены с входами блока памяти, выходы которого соеди- нены со входами преобразователя параллельного кода в последовательный.

0 Существенными отличительными признаками устройства являются дополнительно введенные анализатор фонем, блок памяти, генератор пилообразного напряжения, блок опорных напряжений, вычисли5 тель, а в каждом спектральном канале - фазовый детектор и коммутатор.

Наличие в предлагаемом устройстве существенных признаков, являющихся отличительными в совокупности с признаками

0 прототипа позволяет достичь положительный эффект, заключающийся в повышении точности анализа параметров речевого сигнала путем учета фазовых соотношений сигналов на выходах полосовых фильтров.

5 На фиг, 5 представлена функциональная схема предлагаемого устройства, на фиг. 6 - функциональная схема коммутатора.

Устройство содержит N спектральных

0 каналов 1, в каждом из которых соединены полосовой фильтр 2, вход которого соединен со входом анализатора речи, а выход - со входом фазового детектора 3 и входом амплитудного детектора 4, выход каждого

5 из которых соединен с информационными входами коммутатора 5; анализатор фонем 7, вход которого соединен со входом анализатора речи; генератор 8 пилообразного напряжения, управляющий вход которого соединен с пятым выходом анализатора фонем 7, а выход - с одним из управляющих входов коммутаторов 5; блок опорных напряжений 9, выходы которого соединены с управляющими входами коммутаторов 5; вычислитель 6, информационные входы которого соединены с четвертым выходом анализатора фонем 7 и с выходами коммутаторов 5; блок памяти 10, информационные и управляющие входы которого соединены с выходами вычислителя 6, а также информационные входы - с первым, вторым и третьим выходами анализатора фонем 7; преобразователь 11 параллельного кода в последовательный, входы которого соединены с выходами блока памяти 10, а выход - со входом цифрового канала связи. Устройство работает следующим образом. Речевой сигнал поступает на входы полосовых фильтров 2 спектральных каналов и вход анализатора фонем 7. Полосовые фильтры разделяют спектр речевого сигнала на непересекающиеся частотные полосы спектральных каналов. С выходов полосовых фильтров сигнал поступает на входы амплитудного 4 и фазового 3 детекторов, которые соответственно выделяют значение огибающей и фазы речевых сигналов спектральных каналов. Анализатор фонем 7 по первому выходу выдает значение параметра основного тона на длительности фонемы 4, по второму выходу - значение параметра, определяющего вид спектра (тон-шум) речевого сигнала 5, по третьему выходу - код фонемы 5 и по четвертому выходу - моменты начала и конца длительности фонемы 5. Сигнал с пятого выхода анализатора фонем 7 запускает генератор пилообразного напряжения 8, который вырабатывает пилообразное напряжение последовательно поступающее на входы компараторов 12 коммутатора 5 спектрального канала, на вторые входы которых поступает опорное напряжение с выхода блока опорных напряжений 9, При равенстве этих напряжений компараторы 12 последовательно вырабатывают управляющие импульсы, которые открывают ключи первой 13 и второй 14 группы коммутатора, что обеспечивает последовательное поступление на первый 15 и второй 16 аналого-цифровые преобразователи коммутатора значений ординат огибающих и фаз сигналов спектральных каналов, соответствующих заданным временным задержкам. Первый 15 и второй 16 аналого-цифровые преобразователи производят преобразование поступивших на их входы сигналов в цифровую форму. Одновременно управляющие импульсы с выходов компараторов 12 последовательно поступают на входы триггеров 17 коммутатора, обеспечивая их срабатывание. Сигналы с выходов триггеров 17 открывают ключи третьей 18 и четвертой 19 группы коммутатора, что обеспечивает последовательное подключение выходов первого 15 и второго 16 аналого-цифровых преобразователей к соответствующим входам вычислителя 6. Вычислитель 6 производит оценку ординат спектра речевого

сигнала по ранее рассмотренному алгоритму:

GxiO ote) Е Kai(kr0i)h(kroi)(kroi)k 1

COS((uJ0i -Jufc)kr0|) -2 Kai(kr0i)h()k 1

M siny(kroi)sin((ufei -jftb)kr0i) +

+ 2 Kai(kr0i)h(kroi)IVi (kroi)jcos((uJoi +

+ )kr0|) - 2 Ка|(Г0|)Ь(о|)М- k 1

(kroi)sin((u)oi +ju)kr0j) где Т0 - период дискретизации т в i-м спектральном канале, PJ - число выборок в i-м спектральном канале, Шо-шаг квантования по частоте, i - номер спектрального канала, определяемый из условия i I, если

«HI jftb ftfei, где Шц и СУЫ - соответственно нижняя и верхняя граничные частоты 1-го спектрального канала.

Полученные в вычислителе 6 значения передаются в блок памяти 10, где осуществляется их запоминание на длительность фонемы, а по сигналу с анализатора фонем 7 через вычислитель 6 о конце фонемы - они поступают на входы преобразователя параллельного кода в последовательный 11,

который преобразует параллельный код в последовательный и обеспечивает передачу этой информации в цифровой канал связи (в 5 преобразователь параллельного кода в последовательный назван устройством расстановки кодовых комбинаций).

Таким образом, предлагаемое устройство позволяет повысить точность анализа параметров речевого сигнала путем учета фазовых соотношений сигналов на выходах

полосовых фильтров.

Формула изобретения 1. Анализатор речи, содержащий преобразователь параллельного кода в последовательный и спектральные каналы, каждый из которых содержит полосовой фильтр, выход которого соединен с входом амплитудного детектора, входы полосовых фильтров являются входом анализатора, а выход преобразователя параллельного кода в последовательный является выходом

анализатора, отличающийся тем, что, с целью повышения точности анализатора, в него введены анализатор фонем, блок памяти, генератор пилообразного напряжения, блок опорных напряжений и вычислитель, а каждый спектральный канал дополнительно содержит фазовый детектор и коммутатор, управляющие входы которого соединены с выходами блока опорных напряжений и генератора пилообразного на- пряжения, а информационные входы подключены к выходам амплитудного детектора и фазового детектора, вход которого соединен с выходом полосового фильтра, информационные входы вычислителя сое- динены с выходами блоков коммутации и выходом анализатора фонем, а выходы соединены с управляющими входами преобразователя параллельного кода в последовательный и блока памяти, инфор-

мационные входы которого соединены с выходами вычислителя и анализатора фонем, один из выходов которого соединен с управляющим входом генератора пилообразного напряжения.

2. Анализатор по п. 1,отличающий- с я тем, что блок коммутации содержит компараторы, входы которого являются управляющими входами блока, а выходы подключены к первым входам ключей первой, второй групп, вторые входы которых являются информационными входами блока, а выходы через соответственно первый и второй аналого-цифровой преобразователи соединены с первыми входами ключей соответственно третьей и четвертой групп, выходы которых являются выходами блока, а вторые входы соединены с выходами триггеров, входы которых соединены с выходами соответствующих компараторов,

Иллюстрации к изобретению SU 1 765 843 A1

Реферат патента 1992 года Анализатор речи

Изобретение относится к технике передачи информации и может быть использовано в системах телефонной связи для повышения точности анализа параметров речевого сигнала. Цель изобретения - повышение точности анализатора. Анализатор речи содержит спектральные каналы содержащие полосовые фильтры, амплитудные и фазовые детекторы и коммутаторы, а также вычислитель, анализатор фонем, генератор пилообразного напряжения, блок опорных напряжений и блок памяти и позволяет за счет учета фазовых соотношений сигналов на выходах полосовых фильтров более точно анализировать параметры речевого сигнала. 1 з.п. ф-лы, 2 ил. (Л С

Формула изобретения SU 1 765 843 A1

Магнитофон

Полоообои фильтр

ПФ

Осциллограф

Фиг.

А-/

ЛПт

Фиг А

Документы, цитированные в отчете о поиске Патент 1992 года SU1765843A1

Назаров М.В., Прохоров Ю.Н
Методы цифровой обработки и передачи речевых сигналов
М.: Радио и связь, 1985
Фланаген Дж
Анализ, синтез и восприятие речи
И.: Связь, 1968
Оппенхайм А., Лим Дж
Важность фазы при обработке сигналов, - ТИИЭР, 1981, № 5, с
Машина для изготовления проволочных гвоздей	1922	Хмар Д.Г.	SU39A1
Рабинер Л.Р., Шафер Р.В
Цифровая обработка речевых сигналов
- М.: Радио и связь, 1981
Сапожков М
А., Михайлов В.Г
Воко- дерная связь
- М.: Радио и связь, 1983.

SU 1 765 843 A1

Авторы

Котенко Владимир Владимирович

Глушко Анатолий Петрович

Бернацкий Анатолий Иванович

Александров Сергей Николаевич

Свистунов Сергей Степанович

Даниленко Олег Валерьевич

Даты

1992-09-30—Публикация

1990-08-27—Подача

название	год	авторы	номер документа
Устройство для обработки речевого сигнала	2018	Катанович Андрей Андреевич Привалов Андрей Андреевич Попов Павел Валерьевич	RU2701120C1
УСТРОЙСТВО ДЛЯ РАСПОЗНАВАНИЯ ВИДОВ МАНИПУЛЯЦИИ ЦИФРОВЫХ СИГНАЛОВ	2005	Титов Даниил Валерьевич Мухаметов Владимир Федорович Дикарев Анатолий Семенович	RU2309414C2
Способ дикторонезависимого распознавания фонемы в речевом сигнале	2021	Лелейтнер Валерий Олегович	RU2763124C1
Устройство для оценки разборчивости речи по каналу связи	1988	Лидих Анатолий Константинович Полковский Иосиф Меерович Калистый Олег Владиславович	SU1573553A1
Сегментатор речевых сигналов	1976	Богино Виталий Игнатьевич Ефремов Николай Илларионович Князев Евгений Павлович Потапов Федор Григорьевич Тарасов Виктор Алексеевич	SU591908A1
Способ передачи речевого сигнала	1975	Вялов Виктор Леонидович Захарченко Гаррий Федорович Куля Виктор Иванович Мохнев Сергей Петрович	SU555424A1
Устройство для автоматического измерения разборчивости речи	1987	Лидих Анатолий Константинович Полковский Иосиф Меерович Ильин Анатолий Михайлович Калистый Олег Владиславович	SU1499526A1
Устройство для распознавания радиосигналов	1985	Романенко Владимир Александрович Яковлев Анатолий Александрович Пасько Сергей Васильевич Романенко Роман Владимирович	SU1304045A2
СПОСОБ РАСПОЗНАВАНИЯ ФОНЕМ РЕЧИ И УСТРОЙСТВО ДЛЯ РЕАЛИЗАЦИИ СПОСОБА	2004	Гиголо Людмила Антоновна Сахаров Виталий Олегович	RU2268504C9
Малогабаритная зенитная управляемая ракета	2018	Агальцов Дмитрий Вячеславович Александров Павел Александрович Васильев Георгий Владимирович Горохов Николай Вячеславович Грушин Максим Михайлович Жирицкий Анатолий Владимирович Кашин Валерий Михайлович Самойлов Олег Геннадьевич Смирнов Александр Геннадьевич Терехов Максим Александрович	RU2694932C1