1
Изобретение относится к области автоматического распознания и передачи речевых сигналов.
Изменчивость формы акустического сигнала, соответствующего разным произнесениям одного и того же слова, создает, как известно, значительные трудности в процессах распознавания речи. Иреодоление этих трудностей возможно, если воспользоваться так называемым непрерывно-групповым подходом к распознаванию речи, в основе которого лежит вычисление параметров преобразований текущего речевого сигнала к эталону. Процесс принятия решений в этом случае происходит, с одной стороны, iB пространстве RHраметров, в котором разграничены области допустимых значений для каждого класса звукосочетаний, а, с другой стороны, в пространстве видеограмм, где преобразованные по вычисленным параметра.м реализаций неизвестных звукосочетаний коррелируются с эталонами звукосочетаний. Последняя операция необходима для реализации принципа максимальной помехоустойчивости при распознавании.
До сих пор преобразования речевых сигналов, как правило, элементарные (линейные) осуид,ествлялись лишь с ломощью алгоритмических методов на электронно-цифровых вычислительных машинах или на довольно сложных аналоговых устройствах.
Цель изобретения - реализация преобразований и коррелирование речевых сигналов в аналоговой форме без каких-либо ограничений на вид преобразования и упрон1ение самой процедуры преобразований. Для этого с помощью сигналов, пропорциональных параметрам преобразований, фор.мируют сигнаны нелинейных разверток эталонной снектрограммы но частоте и времени, суммируют этн сигналы с сигналамн соответствующих линейных разверток, синхронизируют полученные сигналы с опросом текущего спектра входного сигнала и сравнивают амплитуды сигналов соответственных точек эталонной )i входной спектрограмм.
В основе предлагаемого рен1ення лежит переход от непосредственного преобразования видеограммы к изменению скорости ее опроса по частоте и времени, в соответствии с зависимостью, определяемой вычисленными параметрами. Панболее простым в реализации здесь оказывается преобразование не тскун|ей видиограммы, а эталона, причем сам эталон удобнее всего представить в виде двумерного изображения па фотопосителе.
На чертеже приведена блок-схема устройства для осуществления предлагаемого способа.
Речевой сигиНоТ, разложенный в енсктрографе 1 на ряд частотных полос, поступает в блок вычисления параметров преобразований 2, куда также подаются сигналы от блока эталонов 3. Вычисленные параметры преобразований по осям времени и частоты порознь подаются соответственно на блоки 4 и 5, представляющие модели дифференциальных уравнений, решениями которых являются искомые преобразования, например,
f - ,t
О) Oj -j- flji -f 4- asto ++
где a, G2 - вычисленные параметры преобразовапий, а / и со - значение времени и частоты на эталоне, соответствующее их значениям на текущей видеограмме.
Каждая из этих зависимостей в аналоговой реализации, очевидно, имеет своим аргументом время, но в одной из них время имеет смысл частоты. Эти зависимости суммируются в блоках 6 с линейно нарастающими сигналами развертки эталона по частоте (блок 7) и времени (блок 8), обеспечивающими о.прос эталона при тождественном преобразовании. Суммарные сигналы разверток подаются на опрос эталона.
Изменение скорости опроса по осям частоты и времени, очевидно, эквивалентно преобразованиям плоскости ((OiO в равномерной развертке. Пользуясь телевизионной терминологией, можно сказать, что развертка эталона ПО t (как более медленная) аналогична кадровой развертке, а развертка по со - строчной. Обе развертки синхронизируются коммутатором спектрографа 1, осуществляющего опрос фильтров, с тем, чтобы обеспечить совпадения начала отсчета для эталона и неизвестной реализации.
Опрашиваемые в соответствии с вычисленным законом преобразования спектральные
разрезы эталона коррелируются со спектральными разрезами текущего сигнала, опращиваемого в равномерном ритме, причем разрезы текущего сигнала задерживаются в блоке
задержки 9. Корреляция осуществляется в блоке 10, откуда сигнал передается в блок принятия рещений 11, в который также приходят сигналы корреляции от остальных эталонов. Принятие решения о принадлежности
данного звукосочетания происходит, как обычно, по максимуму корреляции.
В случае представления эталонной видеограммы дискретными отсчетами по частоте и времени, занисанными, например, на резисторной матрице, процедура преобразования заключается в изменении интервалов опроса этих отсчетов, задаваемом сигналами с выходов моделей 4 и 5.
Предмет изобретения
Способ преобразования речевых сигналов, согласно которому сигнал разлагают на частотные полосы, выделяют огибающие спектральных разрезов, определяют значения амплитуды, частоты и времени характерных точек и вычисляют по иим параметры преобразований текущего сигнала к эталону, отличиющийся тем, что, с целью увеличения помехоустойчивости и упрон1,ения его аппаратурной реализации, с помощью сигналов, нропорциональных параметрам преобразований, формируют сигналы нелинейных разверток
эталонной спектрограммы по частоте и времени, суммируют эти сигналы с сигналами соответствующих линейных разверток, синхронизируют полученные сигналы, с опросом текущего спектра входного сигнала и сравнивают амплитуды сигналов соответственных точек эталонной и входной спектрограмм.
название | год | авторы | номер документа |
---|---|---|---|
СПОСОБ ОБРАБОТКИ РЕЧЕВОГО СИГНАЛА | 1973 |
|
SU404122A1 |
Способ автоматического распознавания речевых сигналов | 1991 |
|
SU1775730A1 |
СПОСОБ И УСТРОЙСТВО УЛУЧШЕНИЯ РЕЧЕВОГО СИГНАЛА С ИСПОЛЬЗОВАНИЕМ БЫСТРОЙ СВЕРТКИ ФУРЬЕ | 2022 |
|
RU2795573C1 |
АБОНЕНТСКИЙ БЛОК ДЛЯ БЕСПРОВОДНОЙ ЦИФРОВОЙ ТЕЛЕФОННОЙ СИСТЕМЫ | 1988 |
|
RU2231222C2 |
СПОСОБ КОДИРОВАНИЯ РЕЧЕВЫХ СИГНАЛОВ | 1993 |
|
RU2120700C1 |
Фотоэлектронный измеритель смещений светового пятна | 1985 |
|
SU1357711A1 |
Способ и система для разложения акустического сигнала на звуковые объекты, а также звуковой объект и его использование | 2016 |
|
RU2731372C2 |
Устройство для определения координат объекта | 1990 |
|
SU1814196A1 |
СПОСОБ КОДИРОВАНИЯ И ДЕКОДИРОВАНИЯ РЕЧЕВОГО СИГНАЛА МЕТОДОМ ЛИНЕЙНОГО ПРЕДСКАЗАНИЯ | 2006 |
|
RU2319222C1 |
ТЕКСТОЗАВИСИМЫЙ СПОСОБ КОНВЕРСИИ ГОЛОСА | 2010 |
|
RU2427044C1 |
Авторы
Даты
1973-01-01—Публикация