Показать метаданные Скрыть метаданные

(19)

(11)

399 908

(13)

(51)

МПК

G10L15/10(2000-01-01)

(21) (22)

Заявка

1624605,

(22)

дата подачи заявки

(45)

опубликовано

1973-01-01

(72)

авторы

Автор Изобретени

СПОСОБ ПРЕОБРАЗОВАНИЯ РЕЧЕВБГХ СИГНАЛОВ Советский патент 1973 года по МПК G10L15/10

Описание патента на изобретение SU399908A1

Изобретение относится к области автоматического распознания и передачи речевых сигналов.

Изменчивость формы акустического сигнала, соответствующего разным произнесениям одного и того же слова, создает, как известно, значительные трудности в процессах распознавания речи. Иреодоление этих трудностей возможно, если воспользоваться так называемым непрерывно-групповым подходом к распознаванию речи, в основе которого лежит вычисление параметров преобразований текущего речевого сигнала к эталону. Процесс принятия решений в этом случае происходит, с одной стороны, iB пространстве RHраметров, в котором разграничены области допустимых значений для каждого класса звукосочетаний, а, с другой стороны, в пространстве видеограмм, где преобразованные по вычисленным параметра.м реализаций неизвестных звукосочетаний коррелируются с эталонами звукосочетаний. Последняя операция необходима для реализации принципа максимальной помехоустойчивости при распознавании.

До сих пор преобразования речевых сигналов, как правило, элементарные (линейные) осуид,ествлялись лишь с ломощью алгоритмических методов на электронно-цифровых вычислительных машинах или на довольно сложных аналоговых устройствах.

Цель изобретения - реализация преобразований и коррелирование речевых сигналов в аналоговой форме без каких-либо ограничений на вид преобразования и упрон1ение самой процедуры преобразований. Для этого с помощью сигналов, пропорциональных параметрам преобразований, фор.мируют сигнаны нелинейных разверток эталонной снектрограммы но частоте и времени, суммируют этн сигналы с сигналамн соответствующих линейных разверток, синхронизируют полученные сигналы с опросом текущего спектра входного сигнала и сравнивают амплитуды сигналов соответственных точек эталонной )i входной спектрограмм.

В основе предлагаемого рен1ення лежит переход от непосредственного преобразования видеограммы к изменению скорости ее опроса по частоте и времени, в соответствии с зависимостью, определяемой вычисленными параметрами. Панболее простым в реализации здесь оказывается преобразование не тскун|ей видиограммы, а эталона, причем сам эталон удобнее всего представить в виде двумерного изображения па фотопосителе.

На чертеже приведена блок-схема устройства для осуществления предлагаемого способа.

Речевой сигиНоТ, разложенный в енсктрографе 1 на ряд частотных полос, поступает в блок вычисления параметров преобразований 2, куда также подаются сигналы от блока эталонов 3. Вычисленные параметры преобразований по осям времени и частоты порознь подаются соответственно на блоки 4 и 5, представляющие модели дифференциальных уравнений, решениями которых являются искомые преобразования, например,

f - ,t

О) Oj -j- flji -f 4- asto ++

где a, G2 - вычисленные параметры преобразовапий, а / и со - значение времени и частоты на эталоне, соответствующее их значениям на текущей видеограмме.

Каждая из этих зависимостей в аналоговой реализации, очевидно, имеет своим аргументом время, но в одной из них время имеет смысл частоты. Эти зависимости суммируются в блоках 6 с линейно нарастающими сигналами развертки эталона по частоте (блок 7) и времени (блок 8), обеспечивающими о.прос эталона при тождественном преобразовании. Суммарные сигналы разверток подаются на опрос эталона.

Изменение скорости опроса по осям частоты и времени, очевидно, эквивалентно преобразованиям плоскости ((OiO в равномерной развертке. Пользуясь телевизионной терминологией, можно сказать, что развертка эталона ПО t (как более медленная) аналогична кадровой развертке, а развертка по со - строчной. Обе развертки синхронизируются коммутатором спектрографа 1, осуществляющего опрос фильтров, с тем, чтобы обеспечить совпадения начала отсчета для эталона и неизвестной реализации.

Опрашиваемые в соответствии с вычисленным законом преобразования спектральные

разрезы эталона коррелируются со спектральными разрезами текущего сигнала, опращиваемого в равномерном ритме, причем разрезы текущего сигнала задерживаются в блоке

задержки 9. Корреляция осуществляется в блоке 10, откуда сигнал передается в блок принятия рещений 11, в который также приходят сигналы корреляции от остальных эталонов. Принятие решения о принадлежности

данного звукосочетания происходит, как обычно, по максимуму корреляции.

В случае представления эталонной видеограммы дискретными отсчетами по частоте и времени, занисанными, например, на резисторной матрице, процедура преобразования заключается в изменении интервалов опроса этих отсчетов, задаваемом сигналами с выходов моделей 4 и 5.

Предмет изобретения

Способ преобразования речевых сигналов, согласно которому сигнал разлагают на частотные полосы, выделяют огибающие спектральных разрезов, определяют значения амплитуды, частоты и времени характерных точек и вычисляют по иим параметры преобразований текущего сигнала к эталону, отличиющийся тем, что, с целью увеличения помехоустойчивости и упрон1,ения его аппаратурной реализации, с помощью сигналов, нропорциональных параметрам преобразований, формируют сигналы нелинейных разверток

эталонной спектрограммы по частоте и времени, суммируют эти сигналы с сигналами соответствующих линейных разверток, синхронизируют полученные сигналы, с опросом текущего спектра входного сигнала и сравнивают амплитуды сигналов соответственных точек эталонной и входной спектрограмм.

Иллюстрации к изобретению SU 399 908 A1

Реферат патента 1973 года СПОСОБ ПРЕОБРАЗОВАНИЯ РЕЧЕВБГХ СИГНАЛОВ

Формула изобретения SU 399 908 A1

SU 399 908 A1

Авторы