Способ селекции признаков для распознавания речевых сигналов Советский патент 1983 года по МПК G10L15/08 

Описание патента на изобретение SU1037292A1

Изобретение относится к технической кибернетике, в частности к способам распознавания образцов, и может быть использовано при идентификации личности по полосу.

Известен способ селекции приэнаков для распознавания речевых сигналов, основанный на преобразовании речевого сигнала в последовательност опорных сигналов, измерении амплитуд этих .сигналов и их сравнении с амплитудами пороговых сигналов Г1.3 ; Наиболее близким к изобретению по; технической сущности является способ основанный на преобразовании речевого сигнала в последовательность опорных сигналов, выделении спектральных характеристик сигналов и сравнении их с эталонными характеристикаг м образцов t23.

Недостаток известных устройств состоит в невысокой надежности селекции признаков,

Цель изобретения состоит в повышении надежности селекции признаков

Поставленная цель достигается тем что согласно способу, основанному на выделении огибающей речевого сигнала сравнении ее амплитуды с амплитудой порогового напряжения и формировании порогового временного интервала, опорных последовательностей речевых сигналов и имйульсов, инвертируют амплитуды опорных речевых сигналов, последовательно суммируют их с амплитудой огибающей речевого сиг- . нала и в моменты формирования порегового Временного интервала преобразуют амплитуду полученного суммарного сигнала, в последовательность сйгналовттризнаков путем временной модуляции опорной последовательности импульсов длительностью соответствующего порогового временного интервала.

На чертеже представлена предлагае мая блок-схема устройства.

Речевой сигнал поступает на вход усилителя 1, с выхода которого подается на формантные фильтры 2-4 с детекторами огибающей, выделяющие амплитуды Aj опорных сигналов. Амплитуда огибающей речевого сигнала выделяется детектором 5 и подается. на блоки б-в последовательного вычитания. Блок 9 формирует пороговый интервал, начало которого определяется по превышению амплитуды речевого сизгнала над амплитудой эталонного сигнала, а конец, наоборот по превышению амплитуды эталонного сигнала над амплитудой речевого сигнала.. Выход блока 9 подается на управляющий вход генератора 10 импульсов, который через схе№а совпадения 11-13 осуществляет ввод разностных сигналов в блок 14 принятия решения.

Импульсы основного тона выделяются блоком 15 и через схему 16 совпадения подаются на счетчик 17. Время счета определяется длительностью временного интервала, вырабатыва мого блоком 18.

Для управления работой блока 14 принятия решения, блока 19 памяти и с 1етчика 17 служит блок 20 управлени-я.

Речёврй сигнал усиливается усилителем 1 и разделяется на формантные .области спектра, фильтрами 2-4, на выходах которых получаются амплитуды опорных сигналов А - А.. На выходе детектора 5 выделяется амплитуда речевого сигнала. На выходах блоков 6-8 последовательного вычитания из опорных сигналов А - А$ формируются разностные сигналы. Время анализа определяется длительностью временного интервала, вырабатываемого блоком 9. В течение этого времени интервала генератор 10 импульсов вырабатывает последовательность импульсов, которые через схемы 11-13 совпадения осуществляют ввод разностных сигналов в блок 14 принятия решения.

Для выделения импульсов основного тона используется блок 15, средняя частота основного тона пропорционгшьна числу импульсов, прошедших через схему 16 совпадения, и подсчитываетс счетчиком .17. Время счета определяется длительностью заданного временного интервала, формируемого блоком .18. Эталонные характеристики образов хранятся в блоке 19 памяти. Блок 20 управления вырабатывает необходимые управляющие .сигналы для начальной установки счетчика 17, запуска блока 14 принятия решения и выдачи эталонных характеристик образов из блока 19 памяти.

Проводились экспериментальные исследования предлагаемого способа. В качестве речевого материала использовались 1200 произнесений слова Аэлита для 60 мужских и женских голосов, по 20 произнесений на одного диктора. Граничные частоты формант.ных фильтров 2-4 бьши равны соответственно 200-850, 850-2200, 2200-3400 Гц. Временной интервал соответствовал участку слова Аэли. За это время в блок 14, в качестве которого использовалась ЭВМ Наири-3-1, оснащенная устройством вёода аналоговых сигналов, вводилось в.среднем, 30 отсчетов разностных сигналов. Программным путем формировалось для любого произнесения 10 отсчетов, нормализованных по времени Средняя частота основного тона под

Похожие патенты SU1037292A1

название год авторы номер документа
СПОСОБ ИДЕНТИФИКАЦИИ ГОВОРЯЩЕГО ПО ФОНОГРАММАМ ПРОИЗВОЛЬНОЙ УСТНОЙ РЕЧИ НА ОСНОВЕ ФОРМАНТНОГО ВЫРАВНИВАНИЯ 2009
  • Коваль Сергей Львович
RU2419890C1
СПОСОБ ГИБРИДНОЙ ГЕНЕРАТИВНО-ДИСКРИМИНАТИВНОЙ СЕГМЕНТАЦИИ ДИКТОРОВ В АУДИО-ПОТОКЕ 2013
  • Хитров Михаил Васильевич
  • Пеховский Тимур Сахиевич
  • Шулипа Андрей Константинович
RU2530314C1
СПОСОБ РАСПОЗНАВАНИЯ ИЗОЛИРОВАННЫХ СЛОВ РЕЧИ С АДАПТАЦИЕЙ К ДИКТОРУ 1994
  • Сорокин Виктор Николаевич
RU2047912C1
СПОСОБ РАСПОЗНАВАНИЯ СЛОВ РЕЧИ 2005
  • Гиголо Людмила Антоновна
  • Сахаров Виталий Олегович
RU2296376C2
СПОСОБ И УСТРОЙСТВО АВТОМАТИЧЕСКОЙ ВЕРИФИКАЦИИ ЛИЧНОСТИ ПО ГОЛОСУ 2008
  • Голубинский Андрей Николаевич
RU2399102C2
Способ дикторонезависимого распознавания фонемы в речевом сигнале 2021
  • Лелейтнер Валерий Олегович
RU2763124C1
Биометрический способ идентификации абонента по речевому сигналу 2020
  • Мельник Сергей Владиславович
RU2742040C1
МЕТОД РАСПОЗНАВАНИЯ ДИКТОРА И УСТРОЙСТВО ДЛЯ ЕГО ОСУЩЕСТВЛЕНИЯ 2002
  • Лабутин П.В.
  • Раев А.Н.
  • Коваль С.Л.
RU2230375C2
Способ идентификации личности по голосу 1973
  • Рамишвили Гурам Соломонович
SU518791A1
Устройство для распознавания слоев 1981
  • Пашук Виталий Филиппович
  • Ткаченко Александр Александрович
SU999093A2

Иллюстрации к изобретению SU 1 037 292 A1

Реферат патента 1983 года Способ селекции признаков для распознавания речевых сигналов

СПОСОБ СЕЛЕКЦИИ ПРИЗНАКОВ ДЛЯ РАСПОЗНАВАНИЯ РЕЧЕВЫХ СИГНАЛОВ, основанный на выделении огибающей речевого сигнала, сравнении ее ампли туды с амплитудой порюгового напряжения и формировании порогового временного интервала, опорных последовательностей речевых сигналов и импульсов,.отличающийся тем, что, с целью повышения надежности селекции признаков, инве1 тируют амплитуды опорных речевых сигналов, последовательно суммируют их с амплитудой огибающей речевого сигнала и в моменты формирования порогового временного интервала преобразуют амплитуду полученного суммарного сигнала в последовательность сигналов признаков путем временной Кюдуляции опорной последовательности импульсов длительностью соответствующео в го порогового временного интервала.

Документы, цитированные в отчете о поиске Патент 1983 года SU1037292A1

Печь для непрерывного получения сернистого натрия 1921
  • Настюков А.М.
  • Настюков К.И.
SU1A1
СТАНОК ДЛЯ ИЗГОТОВЛЕНИЯ ДЕРЕВЯННЫХ ГУБОК БЕЛЬЕВЫХ ЗАЖИМОВ 1933
  • Анчаров Л.М.
SU36637A1
Вагонетка для движения по одной колее в обоих направлениях 1920
  • Бурковский Е.О.
SU179A1
Контрольный висячий замок в разъемном футляре 1922
  • Назаров П.И.
SU1972A1
Аппарат для очищения воды при помощи химических реактивов 1917
  • Гордон И.Д.
SU2A1
Патент США 3770892, кл
Вагонетка для движения по одной колее в обоих направлениях 1920
  • Бурковский Е.О.
SU179A1
Приспособление для склейки фанер в стыках 1924
  • Г. Будденберг
SU1973A1

SU 1 037 292 A1

Авторы

Кузнецов Петр Григорьевич

Лялин Вадим Евгеньевич

Поздеев Владимир Степанович

Даты

1983-08-23Публикация

1982-05-06Подача