УСТРОЙСТВО для АНАЛИЗА РЕЧЕВЫХ СИГНАЛОВ Советский патент 1971 года по МПК G10L15/00 

Описание патента на изобретение SU298943A1

Изобретение относится к области объективного анализа речи и может быть использовано при исследовании речи в устройствах для распознавания речи, в том числе для распознавания ограниченного набора команд.

Известны устройства для анализа речевых сигналов, в которых речь представляют либо в виде непрерывных сигналов, либо в виде последовательности двоичных импульсов. К первому тину относятся гетеродинные и фильтровые устройства для снектрального анализа сигналов. Ко второму типу относятся устройства, где производят подробное кодирование (отсчет за отсчетом) или выбороч ое, отмечающее те или иные характерные особенности в сигиале.

Обп1ий недостаток этих устройств состоит и том, что с их помон ью нельзя проводить инструментальный (объективный) анализ формы сигналов независимо от масштабов по осям координат, т. е. от темпа и уровня речи.

Когда произпосят несколько раз одни и те /ке речевые сигналы, например слова, наблюдают сходство форм у исходных речевых сигналов, несмотря на значительные вариации уровня и темна речи. В результате анализа речи с помощью известных устройств полученные непрерывные сигналы (например, сгибающие на выходах спектр-анализатора)

варьируют при изменениях уровня и темпа речи. При кодовом апализе соответствуюии1е коды ие похожи друг на друга.

Поэтому в настоящее время невозможен объективный динамический (времеииой) анализ речи (осциллограммы или отдельных огибающих на выходах снектр-аналнзатора), на основе которого можно сун1ествеппо повысить достоверность расиозпавапия речи. Причина недостатка состоит в том, что в известных устройствах для анализа речи нет какой-либо подстройки, компенсирующей вариации темпа и уровня в речевом сигнале.

Целью изобретет является обеспечение независимости сигналов, онисывающих дииамическую структуру речи от вариаций уровня и темиа речи, т. е. от масн1табов по осям коордииат.

Для этого в устройстве формируют эталонный сигнал и с его помон ью анализируют динамическую структуру речи по участкам, границы которых фиксируются моментами, когда произойдет рассогласование между речевым и эталонным сигналами, причем независимо от .масщтабов по осям коордииат.

Предла1ае.мое устройство отличается тем, что в него дополнительно введены усилители с регулируемым коэффициентом усиления и cyMMBtop, входы которого подключены к выходам усилителей, причем сигнальные входы

усилителей подключены к выходу источника эталонного сигнала, а их регулировочные входы-.к выходу блока управления. Выход сумматора подсоединен ко входу блока сравнения, а выход блока принятия решеНИН -к управляющему входу источника эталонного сигнала.

Сравнивая эталонный и речевой сигналы в блоке сравнения в реальном масштабе времени, регулируют коэффициенты усиления усилителей с помощью блока управления так, чтобы свести к минимуму различия между эталонным и речевым сигналами и таким образом получить совпадение масштабов этих сигналов, что дает возможность проводить далее сравнение текущих отсчетов речевого сигнала и эталонного во времени и оценить близость формы этих сигналов. Границу участка фиксируют в тот момент, когда произойдет рассогласование сигнала и эталона, после чего все операции повторяют.

Для описапия динамической структуры речи используют либо отрезки эталонного и речевого сигналов, либо код, фиксирующий границы участков.

Независимость анализа от вариаций масштабов по кобрдинат при работе устройства основана на следующих соображениях.

Эталонный сигнал произвольной формы получают в виде степенного ряда. Форма эталонного сигнала определяется числом членов ряда и показателями степени у каждого члена. Масштабы эталонного сигнала зависят от конкретного значения коэффициентов ряда.

Моделируют эталонный сигнал с помощью набора генераторов степенных функций, у которых фиксированы показатели степени (целевые или дробные).

С выхода каждого генератора сигнал подается на усилитель, изменение усиления которого меняет вес, т. е. значение соответствующего коэффициента ряда. Далее устанавливают сумматор, где суммируются взвешенные сигналы от разных генераторов, осуществляя моделирование эталонного сигнала в виде степенного ряда.

Эталонный сигнал сравнивается в блоке сравнения с речевым сигналом, и по минимуму рассогласования меняется усиление, т. е. веса, с помощью усилителей в блоке маештабных преобразований. Таким образом устанавливаются масштабы эталонного сигнала в соответствии с масштабами речевого сигнала.

Сравнивая в реальном времени эталонный и речевой сигналы, отмечают кодовой посылкой границу участка, где имеется допустимое различие сигналов. На следующем участке те же операции повторяются. Коды, отмечающие границы участков речевого сигнала, выделяют в нем такие участки, которые близки к эталонному сигналу, независимо от конкретных масштабов по осям координат.

Устройство содержит источник 1 эталоинОго сигнала, усилители 2-4 с регулируемыми коэффициентами усиления, сумматор 5, блок управления 6, источник 7 анализируемого сигнала, блок сравнения 8 и блок принятия решения 9.

В качестве источника / эталонного сигнала, как вариант осуществления, используем: набор генераторов (гетеродинный вариант). Можно также в качестве источника эталонного сигнал использовать набор фильтров с фиксированными переходными характеристика.ми (фильтровый вариант).

Эталонный сигнал из источника / подают на регулируемые усилители 2-4 и сумматор 5. Меняя с помощью блока управления 6 усиления в усилителях 2-4, настраивают эталонный сигнал на выходе сум.матора 5 таким образом, чтобы получить минимум различия эталонного и речевого сигналов, сравниваемых в блоке сравнения 8. При этом меняется только масштаб эталонного сигнала, а его форма остается неизменной. Управление источником 1 эталонного сигнала и формирование выходных сигналов осуществляется с помопгью блока принятия решения 9.

Анализ речевого сигнала в устройстве выполняют путем сравнения его в блоке сравнения 5 с эталонным сигналом.

Рассмотрим соображения, касающиеся выбора эталонного сигнала.

Выбирается функция (0 (для анализа речевого сигнала) и функция (f(t), с помощью которой устанавливаются всевозможные вариации аргумента t, т. е. изменение темпа речи, так, чтобы вариации t в сложной функции (0 свелись к вариациям коэффициента а.

Например, если (0 сть степенная функция (один член степенного ряда)

((0

а вариации аргумента также описываются степенной функцией

Ф(/)-,

тогда (.Рг; a/ где а рХ, .

Реальное время, т. е. аргумент ф(0 сложной функции (0 рассматривается здесь также как функция, зависящая от аргумента t, который Б данном случае отражает некоторое нормализованное время, изменяющееся в соответствии с идеальной равномерной шкалой времени.

При 1, реальное время изменяется так же, как и нормализованное. При / имеет степенное растяжение, при / ;1-степенное сжатие реальной щкалы времени. При А,-1 увеличивается масштаб реальной щкалы времени, при 1 масштаб уменьшается. Параметр / является показателем равномерности шкалы времени, параметр Ji характеризует масштаб такой шкалы.

Таким образом, выбор эталонного сигнала в виде суммы степенных функций позволяет осуществлять нормализацию темпа речи в достаточно широких пределах вариаций темпа, касающих.ся изменений масштаба Я.

Основываясь на вышеизложенном, выбирают источник /, содержащий генераторы степенных функций (с целыми или дробными показателями).

Изменением масштабов с помощью усилителей с регулируемым коэффициентом усиления усилителей 2-4 и сумматора 5, настраивают эталонный сигнал таким образом, чтобы он минимально отличался от речевого сигнала.

Для этого эталонный и речевой сигналы подают на блок сравнения 8, а разность между сигналами используют для управления с номощью блока принятия решения 9 блоком управления 6, который регулирует усиление усилителей.

Помимо гетеродинного варианта устройства, описанного выше, возможен и резонансный (фильтровый) вариант. В этом варианте источник / содержит фильтры, обладающие фиксированными степенными переходными характеристиками. Подавая на фильтры речевой сигнал от источника 7, получают эталонный сигнал в виде степенного разложения речевого сигнала. Коэффициенты этого разложения регулируют с помощью усилителей 2-4, так, чтобы изменить масштабы эталонного сигнала, не изменив его форму.

В остальном работа устройства не отличается от вышеописанной.

Возможны два режима работы устройства: шлловый и непрерывный.

В щаговом режиме после окончания настройки масштабов эталонного сигнала цепь

регу.чирования размыкают, производят сравне}П е эталонного и речевого сигналов в реальном масщтабе времени, а по достижении огфеделенного уровня рассогласования сигналов вновь включают цепь регулирования. Одновременно переключают с помощью блока принятия решения 9 источник / эталонного сигнала на начало образования эталонного сигнала.

В непрерывном режиме цель регулирования не размыкают.

Возможны различные варианты съема информации, получаемой в устройстве в процессе анализа речевого сигнала. Панример,

съем информации можно осуществлять в виде последовательных кодовых посылок, отмечающих 1раиицы участков, где наблюдалось предельное рассогласование эталонного и речевою сигналов или непрерывным сигналом

рассогласования между этими сигналами.

Предмет изобретения

Устройство для анализа речевых сигналов, содержащее источники анализируемого и эталонного сигналов, блоки сравнения, управления и принятия рещения, отличающееся тем, гто, с целью обеспечения независимости результатов анализа речевых сигналов от темпа и уровня речи, в него дополнительно введены усилители с регулируемым коэффициентом усиления и сумматор, входы которого подключены к выходам усилителей, причем сигнальные входы усилителей подключены к выходу источника эталонного сигнала, а их

регулировочные входы - к выходу блока управления; выход сумматора подсоединен ко входу блока сравнения, а выход блока принятия решения - к управляющему входу источника эталонного сигнала.

Похожие патенты SU298943A1

название год авторы номер документа
СПОСОБ ВЫЯВЛЕНИЯ ЭМОЦИОНАЛЬНОГО СОСТОЯНИЯ ЧЕЛОВЕКА ПО ГОЛОСУ 2012
  • Голубинский Андрей Николаевич
  • Булгаков Олег Митрофанович
  • Асташов Роман Анатольевич
  • Николаенков Юрий Кимович
RU2553413C2
СПОСОБ ИДЕНТИФИКАЦИИ СИГНАЛА СЛУЧАЙНОГО ПРОЦЕССА И УСТРОЙСТВО ДЛЯ ЕГО ОСУЩЕСТВЛЕНИЯ 1995
  • Капля Э.И.
RU2097917C1
СПОСОБ И УСТРОЙСТВО СИНТЕЗА, ПЕРЕДАЧИ, ПРИЕМА, АНАЛИЗА И ОЦЕНКИ МНОГОВАРИАНТНЫХ ПО ФОРМЕ, МНОГОПОЗИЦИОННЫХ И ЛОКАЛЬНЫХ ПО СПЕКТРУ СИГНАЛОВ 2000
  • Виноградов С.М.
  • Виноградова Н.В.
  • Денисенко В.П.
  • Новиков И.В.
  • Шуленин П.Л.
RU2160509C1
Устройство для ввода информации 1989
  • Гуревич Вероника Зальмановна
  • Крупицкий Эммануил Ильич
  • Морозов Сергей Викторович
  • Пелевин Владимир Юрьевич
  • Сергеенко Татьяна Николаевна
SU1714643A1
СПОСОБ УПРАВЛЕНИЯ ИМПУЛЬСНЫМ СТАБИЛИЗАТОРОМ НАПРЯЖЕНИЯ 2012
  • Краснобаев Юрий Вадимович
  • Капулин Денис Владимирович
  • Тюхтев Дмитрий Александрович
RU2509337C1
УСТРОЙСТВО ЗОНДИРОВАНИЯ СТРОИТЕЛЬНЫХ КОНСТРУКЦИЙ 2015
  • Сычев Сергей Анатольевич
  • Дикарев Виктор Иванович
RU2589886C1
СИСТЕМА ИСКАЖЕНИЯ ГОЛОСА ДИКТОРА 2009
  • Котов Михаил Андреевич
  • Леднов Дмитрий Анатольевич
  • Меркулов Максим Николаевич
  • Хацкевич Андрей Валентинович
RU2403627C1
СИСТЕМА ДИСПЕТЧЕРСКОГО КОНТРОЛЯ И УПРАВЛЕНИЯ ИНКАССАТОРСКИМИ МАШИНАМИ 2005
  • Дикарев Виктор Иванович
  • Журкович Виталий Владимирович
  • Сергеева Валентина Георгиевна
  • Рыбкин Леонид Всеволодович
RU2303293C2
Способ выделения речевого сигнала на фоне помех и устройство для его осуществления 1983
  • Кабанова Евгения Ильинична
  • Махонин Вячеслав Андреевич
SU1156126A1
СПОСОБ СЛУХОРЕЧЕВОЙ РЕАБИЛИТАЦИИ И УСТРОЙСТВО ДЛЯ ЕГО РЕАЛИЗАЦИИ 2013
  • Кочергин Анатолий Васильевич
  • Кочергин Андрей Анатольевич
  • Колигаев Олег Анатольевич
  • Колигаев Сергей Олегович
RU2525366C1

Иллюстрации к изобретению SU 298 943 A1

Реферат патента 1971 года УСТРОЙСТВО для АНАЛИЗА РЕЧЕВЫХ СИГНАЛОВ

Формула изобретения SU 298 943 A1

SU 298 943 A1

Даты

1971-01-01Публикация