Известны способы распознавания звуков речи, в которых за единицу распознавания взяты фонема, слог или слово. Исследование устной речи сводится к определению спектральных, временных характеристик звукового . Распознаваемое слово произносят перед микрофоном и пропускают через схему автоматической регулировки громкости. Но надежность этих способов низка из-за различного пронзношення фонем, что связано со спенифнкой голосового тракта диктора.
Особенность предлагаемого способа заключается в том, что за единицу распознавания выбрано слово, и распознавание слов ведется по смысловым признакам, которые зависят только от смысловой информации речи и не зависят от голоса диктора, акустики помещений, грамматического и синтаксического построения фразы.
Звуковую информацию пропускают через систему анализирующих блоков. Число блоков зависит от состава и объема словаря. Блоки осуществляют параллельное кодирование распознаваемых слов но смысловым признакам и образуют из кодов, выработанных но этим признакам, составной равномерный код распознаваемого слова, который подают на воспринимающую автоматическую систему.
ловым признакам целых слов путем следующей последовательности операций:
определяют число «мащинных слогов в слове путем подсчета числа горбов в огибающей звукового сигнала;
определяют номер ударного слога в слове,
как слога со звуковой энергией в несколько
раз большей, чем энергия безударного слога;
определяют количество глухих взрывных согласных и афрнкатов по числу разрывов в
огибающей звукового сигнала;
определяют особенности переднего фронта слова по присутствию сигнала малой амплнтуды, соответствуюи1ей определенным согласным, перед полной амплитудой гласного звука;
определяют число высокочастотных звуков
по числу горбов в огибающей сигнала после
прохождения раснознаваемого слова через систему фильтров верхних частот (/ 5500-
7000 гц);
онределяют количество двухформанТньтх гласных по числу горбов в огибающей сигнала носле прохождения распознаваемого слова через ограничитель по амплитуде и через полосовой фильтр с полосой пропускания 2000- 4000 гц;
ющих навыходе блока для подсчета числа слогов и на выходе блока для подсчета числа разрывов в огибаюо ей;
определяют номер слога, в котором имеется высокочастотный звук, путем совместного рассмотрения сигналов, возникающих на выходе блока для подсчета числа слогов и на выходе блока для определения числа высокочастотных звуков.
Это дает возможность повысить надежность кодирования сигнала и выполнять этот процесс в реальном масштабе времени.
На чертеже изображена схема, с помощью которой осуществляется описываемый способ.
Распознаваемое слово произносится перед микрофоном 1 и поступает на входной блок 2, в котором усиливается, проходит через систему автол атической регулировки громкости и демодулируется. С выхода блока 2 сигнал подается на входы анализирующих блоков 3, 4, 5, 6, 7, 8 для выработки кодов по смысловым признакам.
Коды, выработанные по отдельным смысловым признакам, подаются на логические схемы совпадений «И 9 и схемы индикации 10. На выходе схемы устанавливается код, соответствующий распознаваемому слову.
Описываемый способ кодирования (распознавания) устной речи по смысловым признакам приводит к компактным кодам изображения слов и нозволит создать устройства со словарем распознавания любого объема.
Работающие с такими словарями устройства могут быть использованы как входные устройства современных вычислительных мащин и систем автоматического управления.
Предмет изобретения
1. Способ кодирования (распознавания) смысловой информации устной речи, при котором распознаваемое слово произносят перед микрофоном и пропускают через схему автоматической регулировки громкости, отличающийся тем, что, с целью надежного однозначного безощибочного кодирования устной речи независимо от особенностей голоса диктора, исключения статистической и вероятностной обработки сигнала и выполнения процесса кодировання в реальном масштабе времени, звуковую информацию пропускают через систему анализирующих блоков, число которых зависит от состава и объема словаря, осуществляющих параллельное кодирование распознаваемых слов по смысловым признакам, и образуют из кодов, выработанных по этим призиакам, составной равномерный код распознаваемого слова, который подают на воспринимающую автоматическую систему.
2. Способ по -п. 1, отличающийся тем, что при параллельном кодировании распознаваемых слов по смысловым признакам определяют: число «мащинных слогов в слове, номер ударного слога, количество глухих взрывных согласных, особенности переднего фронта огибающей звукового сигнала, число высокочастотных звуков, количество двухформантных гласных, номер слога, в котором имеет место разрыв в огибающей, номер слога, в котором
имеет место высокочастотный звук.
название | год | авторы | номер документа |
---|---|---|---|
СПОСОБ ИДЕНТИФИКАЦИИ ГОВОРЯЩЕГО ПО ФОНОГРАММАМ ПРОИЗВОЛЬНОЙ УСТНОЙ РЕЧИ НА ОСНОВЕ ФОРМАНТНОГО ВЫРАВНИВАНИЯ | 2009 |
|
RU2419890C1 |
СПОСОБ РАСПОЗНАВАНИЯ ИЗОЛИРОВАННЫХ СЛОВ РЕЧИ С АДАПТАЦИЕЙ К ДИКТОРУ | 1994 |
|
RU2047912C1 |
КОМПЬЮТЕРНОЕ УСТРОЙСТВО ДЛЯ ЧТЕНИЯ ПЛОСКОПЕЧАТНОГО ТЕКСТА | 1996 |
|
RU2113726C1 |
СПОСОБ ГИБРИДНОЙ ГЕНЕРАТИВНО-ДИСКРИМИНАТИВНОЙ СЕГМЕНТАЦИИ ДИКТОРОВ В АУДИО-ПОТОКЕ | 2013 |
|
RU2530314C1 |
СПОСОБ ПРЕДВАРИТЕЛЬНОЙ ОБРАБОТКИ ТЕКСТА | 2007 |
|
RU2386178C2 |
СПОСОБ РАСПОЗНАВАНИЯ СЛОВ РЕЧИ | 2005 |
|
RU2296376C2 |
СИСТЕМА И СПОСОБ РАСПОЗНАВАНИЯ РЕЧИ | 2011 |
|
RU2466468C1 |
УСТРОЙСТВО ДЛЯ РАСПОЗНАВАНИЯ ИЗОЛИРОВАННЫХ СЛОВ | 1998 |
|
RU2136059C1 |
СПОСОБ РЕАБИЛИТАЦИИ И РАЗВИТИЯ СЛУХОРЕЧЕВОЙ ФУНКЦИИ У ПАЦИЕНТОВ С КОХЛЕАРНЫМИ ИМПЛАНТАМИ | 2007 |
|
RU2342109C1 |
Набор пособий для осуществления комплексного способа повышения мотивации речи | 2022 |
|
RU2796187C1 |
Даты
1966-01-01—Публикация