Изобретение относится к прибЬ ростроению и может быть использовано в акустике, а именно в системах распознавания речевых сигналов, например при речевом вводе информации в вычислительные машины. Известен способ распознавания речевых сигналов, заключающийся в том. Что производят преобразование речевого сигнала путем квантования его по эталонным значениям напряжения, измерения времени существования и времени отсутствия напряжения на каящом уровне эталонного значения напряжения речевого сигнала, запоминания результатов измерения и сравнения их с эталонными значениями напряжения речевого сигнала
Недостатком данного способа явля ется невысокая надежность и недостаточное быстродействие распознавания речевого сигнала.
Наиболее близким техническим решением к изобретению является реализованный в устройстве способ распознавания речевого сигнала путем его преобразования в последовательность импульсов с учетом заданной элементарной площади под кривой сигнала, запоминания и сравнения с эталонными значениями 2.
Недостатком известного способа является невысокая надежность распоз-, навания речевого-сигнала при наличии помех. Изменение формы речевого сигнала, а также флуктуации амплитуды сигнала из-за наложенной на него аддитивной помехи оказывают.отрица10тельное влияние на результат распознавания. Кроме того, недостатком способа является невысокое быстродействие распознавания вследствие того, что речевой сигнал не нормирует15ся. Это ведет к необходимости перебора большого -числ а реализаций одного и того же образа с большими временными затратами.
Цель изобретения - повышение на20дежности и быстродействия распознавания речевого сигнала.
Поставленная цель достигается тем, согласно способу распознавания речевого сигнала путем его преобразова25ния в последовательность импульсов с учетом заданнойэлементарной плов{ади под кривой сигнала, запоминания и сравнения с эталонными энaчeния Жr в котором производят но| 4ализацию
30 входного сигнала по уровню на квази-
стационарных участках, а также преобразуют последовательность импульсов в бинарную форму относительно тактовой последовательности импульсов и выделяют стационарные блоки единицнепрерывные последовательности единиц, если их число превышает некоторое заданное число, стационарные блоки нулей - .непрерывные последовательности нулей, если их число превышает некоторое заданное число, и не.стационарные блоки произвольные последовательности бинарных элементов , а также разрывы стационарных блоков единиц, по стационарным блокам единиц определяют границы элементарных сегментов и используют содержащуюся в них информацию для принятия решения о фонетической принадлежности звука.
На фиг.1 изображено устройство дл.ч осуществления предложенного способа распознавания речевого сигнала на фиг.2 - осциллограмма речевого сигнала и преобразование речевого сигнала в систему признаков, представленных в бинарной форме.
Устройство , осуществляюдее предлагаемый способ распознавания речево го сигнала, содержит микрофон 1 микрофонный усилитель 2 динамический нормализатор уровня 3, реЦептор 4, блок памяти 5, анализатор 6 и классификатор 7.
Микрофон 1 через микрофонный усилитель 2 соединен с динамическим нормализатором уровня 3, выход которого подключен к входу рецептора 4, связанного с блоком памяти 5. Выход блока памяти 5 через анализатор б соединен с классификатором 7.
Распознавание речевых сигналов бсуществляется следующим образом.
Речевой сигнал нормируется по уровню на квазистационарных участках. Этим минимизируется пространство при.знаков описания распознаваемого образа. Затем преобразуют речевой сигнал (фиг.2; с учетом психофизического эффекта сглаживания в слухе в систему признаков, представленных в бинарной форме на определенном интервале времени (выборке, например 20mS). Из структур бинарных элементов выделяют базовые блоки, т.е. стационарные блоки единиц Y(113,
стационарные блоки нулей N(00), нестационарные блоки Х(01), а также признак BY. При этом для маркировки границ элементарного сегмента используют признак У(11). Затем измеряют временные значения признаков Y(ll), N(00), BY и в результате анализа этих значений в зависимости от требуемой надежности распознают речевой сигнал по одному или более элементарным сегментам.
Предлагаемый способ распознавания повышает надежность и быстродействие обработки речевого сигнала.
Формула изобретения
Способ распознавания речевого сигнала путем его- преобразования в последовательность импульсов с учетом заданной элементарной площади под кривой сигнала, запоминания и сравнения с эталонными значениями, отлич ающийся тем, что, с целью повышения надежности и быстродействия распознавания, производят нормализацию входного сигнала по уров:ню на квазистационарных участках, а также преобразуют последовательность импульсов в бинарную форму относительно тактовой последовательности и выделяют стационарные блоки единиц - непрерывные последовательности единиц, если их число превышает некоторое заданное число, стацинарные блоки нулей - непрерывные последовательности нулей, еСлк их число превышает некоторое заданное число, и нестационарные блоки - произвольные последовательности бинарных элементов, а также разрывы стационарных блоков единиц, по стационарным блокам единиц определяют границы элементарных сегментов и используют содержащуюся в них информацию для принятия решения о фонетической принадлежности звука.
Источники информации, принятые во внимание при экспертизе
1.Авторскоесвидетельство СССР № 614461, кл. G10 L 1/02, 1977.
2.Авторскоесвидетельство СССР 830521, кл. G10 L 1/02, 1981.
Dн
название | год | авторы | номер документа |
---|---|---|---|
СПОСОБ РАСПОЗНАВАНИЯ ИЗОЛИРОВАННЫХ СЛОВ РЕЧИ С АДАПТАЦИЕЙ К ДИКТОРУ | 1994 |
|
RU2047912C1 |
СПОСОБ РАСПОЗНАВАНИЯ СЛОВ В СЛИТНОЙ РЕЧИ И СИСТЕМА ДЛЯ ЕГО РЕАЛИЗАЦИИ | 1996 |
|
RU2101782C1 |
Способ автоматического распознавания речевых сигналов | 1991 |
|
SU1775730A1 |
Устройство для обработки речевого сигнала | 2018 |
|
RU2701120C1 |
СПОСОБ ОЦЕНКИ ВАРИАТИВНОСТИ ПАРОЛЬНОЙ ФРАЗЫ (ВАРИАНТЫ) | 2013 |
|
RU2598314C2 |
СПОСОБ ВЕРИФИКАЦИИ ПОЛЬЗОВАТЕЛЯ В СИСТЕМАХ САНКЦИОНИРОВАНИЯ ДОСТУПА | 2007 |
|
RU2351023C2 |
СПОСОБ И УСТРОЙСТВО АВТОМАТИЧЕСКОЙ ВЕРИФИКАЦИИ ЛИЧНОСТИ ПО ГОЛОСУ | 2008 |
|
RU2399102C2 |
СПОСОБ РАСПОЗНАВАНИЯ СЛОВ РЕЧИ | 2005 |
|
RU2296376C2 |
Способ транскрибирования речи по цифровым сигналам с низкоскоростным кодированием | 2023 |
|
RU2801621C1 |
СПОСОБ РАСПОЗНАВАНИЯ ФОНЕМ РЕЧИ И УСТРОЙСТВО ДЛЯ РЕАЛИЗАЦИИ СПОСОБА | 2004 |
|
RU2268504C9 |
Фм. f
Авторы
Даты
1983-01-23—Публикация
1981-01-14—Подача