СПОСОБ ПРЕОБРАЗОВАНИЯ РЕЧЕВБГХ СИГНАЛОВ Советский патент 1973 года по МПК G10L15/10 

Описание патента на изобретение SU399908A1

1

Изобретение относится к области автоматического распознания и передачи речевых сигналов.

Изменчивость формы акустического сигнала, соответствующего разным произнесениям одного и того же слова, создает, как известно, значительные трудности в процессах распознавания речи. Иреодоление этих трудностей возможно, если воспользоваться так называемым непрерывно-групповым подходом к распознаванию речи, в основе которого лежит вычисление параметров преобразований текущего речевого сигнала к эталону. Процесс принятия решений в этом случае происходит, с одной стороны, iB пространстве RHраметров, в котором разграничены области допустимых значений для каждого класса звукосочетаний, а, с другой стороны, в пространстве видеограмм, где преобразованные по вычисленным параметра.м реализаций неизвестных звукосочетаний коррелируются с эталонами звукосочетаний. Последняя операция необходима для реализации принципа максимальной помехоустойчивости при распознавании.

До сих пор преобразования речевых сигналов, как правило, элементарные (линейные) осуид,ествлялись лишь с ломощью алгоритмических методов на электронно-цифровых вычислительных машинах или на довольно сложных аналоговых устройствах.

Цель изобретения - реализация преобразований и коррелирование речевых сигналов в аналоговой форме без каких-либо ограничений на вид преобразования и упрон1ение самой процедуры преобразований. Для этого с помощью сигналов, пропорциональных параметрам преобразований, фор.мируют сигнаны нелинейных разверток эталонной снектрограммы но частоте и времени, суммируют этн сигналы с сигналамн соответствующих линейных разверток, синхронизируют полученные сигналы с опросом текущего спектра входного сигнала и сравнивают амплитуды сигналов соответственных точек эталонной )i входной спектрограмм.

В основе предлагаемого рен1ення лежит переход от непосредственного преобразования видеограммы к изменению скорости ее опроса по частоте и времени, в соответствии с зависимостью, определяемой вычисленными параметрами. Панболее простым в реализации здесь оказывается преобразование не тскун|ей видиограммы, а эталона, причем сам эталон удобнее всего представить в виде двумерного изображения па фотопосителе.

На чертеже приведена блок-схема устройства для осуществления предлагаемого способа.

Речевой сигиНоТ, разложенный в енсктрографе 1 на ряд частотных полос, поступает в блок вычисления параметров преобразований 2, куда также подаются сигналы от блока эталонов 3. Вычисленные параметры преобразований по осям времени и частоты порознь подаются соответственно на блоки 4 и 5, представляющие модели дифференциальных уравнений, решениями которых являются искомые преобразования, например,

f - ,t

О) Oj -j- flji -f 4- asto ++

где a, G2 - вычисленные параметры преобразовапий, а / и со - значение времени и частоты на эталоне, соответствующее их значениям на текущей видеограмме.

Каждая из этих зависимостей в аналоговой реализации, очевидно, имеет своим аргументом время, но в одной из них время имеет смысл частоты. Эти зависимости суммируются в блоках 6 с линейно нарастающими сигналами развертки эталона по частоте (блок 7) и времени (блок 8), обеспечивающими о.прос эталона при тождественном преобразовании. Суммарные сигналы разверток подаются на опрос эталона.

Изменение скорости опроса по осям частоты и времени, очевидно, эквивалентно преобразованиям плоскости ((OiO в равномерной развертке. Пользуясь телевизионной терминологией, можно сказать, что развертка эталона ПО t (как более медленная) аналогична кадровой развертке, а развертка по со - строчной. Обе развертки синхронизируются коммутатором спектрографа 1, осуществляющего опрос фильтров, с тем, чтобы обеспечить совпадения начала отсчета для эталона и неизвестной реализации.

Опрашиваемые в соответствии с вычисленным законом преобразования спектральные

разрезы эталона коррелируются со спектральными разрезами текущего сигнала, опращиваемого в равномерном ритме, причем разрезы текущего сигнала задерживаются в блоке

задержки 9. Корреляция осуществляется в блоке 10, откуда сигнал передается в блок принятия рещений 11, в который также приходят сигналы корреляции от остальных эталонов. Принятие решения о принадлежности

данного звукосочетания происходит, как обычно, по максимуму корреляции.

В случае представления эталонной видеограммы дискретными отсчетами по частоте и времени, занисанными, например, на резисторной матрице, процедура преобразования заключается в изменении интервалов опроса этих отсчетов, задаваемом сигналами с выходов моделей 4 и 5.

Предмет изобретения

Способ преобразования речевых сигналов, согласно которому сигнал разлагают на частотные полосы, выделяют огибающие спектральных разрезов, определяют значения амплитуды, частоты и времени характерных точек и вычисляют по иим параметры преобразований текущего сигнала к эталону, отличиющийся тем, что, с целью увеличения помехоустойчивости и упрон1,ения его аппаратурной реализации, с помощью сигналов, нропорциональных параметрам преобразований, формируют сигналы нелинейных разверток

эталонной спектрограммы по частоте и времени, суммируют эти сигналы с сигналами соответствующих линейных разверток, синхронизируют полученные сигналы, с опросом текущего спектра входного сигнала и сравнивают амплитуды сигналов соответственных точек эталонной и входной спектрограмм.

Похожие патенты SU399908A1

название год авторы номер документа
СПОСОБ ОБРАБОТКИ РЕЧЕВОГО СИГНАЛА 1973
  • Авторы Изобретени
SU404122A1
Способ автоматического распознавания речевых сигналов 1991
  • Дрюченко Алексей Яковлевич
SU1775730A1
СПОСОБ И УСТРОЙСТВО УЛУЧШЕНИЯ РЕЧЕВОГО СИГНАЛА С ИСПОЛЬЗОВАНИЕМ БЫСТРОЙ СВЕРТКИ ФУРЬЕ 2022
  • Щекотов Иван Сергеевич
  • Андреев Павел Константинович
  • Аланов Айбек Арстанбекович
  • Иванов Олег Юрьевич
  • Ветров Дмитрий Петрович
RU2795573C1
АБОНЕНТСКИЙ БЛОК ДЛЯ БЕСПРОВОДНОЙ ЦИФРОВОЙ ТЕЛЕФОННОЙ СИСТЕМЫ 1988
  • Авис Грэхем Мартин
  • Сритчлоу Дэвид Нортон
RU2231222C2
СПОСОБ КОДИРОВАНИЯ РЕЧЕВЫХ СИГНАЛОВ 1993
  • Фомин В.В.
RU2120700C1
Фотоэлектронный измеритель смещений светового пятна 1985
  • Пушной Леонид Андреевич
  • Телеганов Арсентий Алексеевич
SU1357711A1
Способ и система для разложения акустического сигнала на звуковые объекты, а также звуковой объект и его использование 2016
  • Плюта Адам
RU2731372C2
Устройство для определения координат объекта 1990
  • Бакут Петр Алексеевич
  • Ворновицкий Игорь Эммануилович
  • Ильин Анатолий Григорьевич
  • Казанцев Генрих Дмитриевич
  • Курячий Михаил Иванович
  • Ли Вячеслав Владимирович
SU1814196A1
СПОСОБ КОДИРОВАНИЯ И ДЕКОДИРОВАНИЯ РЕЧЕВОГО СИГНАЛА МЕТОДОМ ЛИНЕЙНОГО ПРЕДСКАЗАНИЯ 2006
  • Тарасов Валерий Юрьевич
RU2319222C1
ТЕКСТОЗАВИСИМЫЙ СПОСОБ КОНВЕРСИИ ГОЛОСА 2010
  • Бредихин Александр Юрьевич
  • Петровский Александр Александрович
  • Сергейчев Николай Евгеньевич
RU2427044C1

Иллюстрации к изобретению SU 399 908 A1

Реферат патента 1973 года СПОСОБ ПРЕОБРАЗОВАНИЯ РЕЧЕВБГХ СИГНАЛОВ

Формула изобретения SU 399 908 A1

SU 399 908 A1

Авторы

Автор Изобретени

Даты

1973-01-01Публикация