Способ верификации диктора Советский патент 1991 года по МПК G10L17/00 

Описание патента на изобретение SU1675936A1

Изобретение относится к автоматическому распознаванию образов на основе анализа речевых сигналов и может быть использовано для автоматизации контрольно-пропускных пунктов (КПП) учреждений и разработки голосовых ключей, обеспечивающих санкционированный доступ определенных лиц к банкам данных или механизмам специального назначения на основе предъявления этими лицами свидетельства о личности своей речи.

Целью изобретения является упрощение процесса верификации и повышение ее быстродействия при сохранении высокого уровня надежности верификации.

На фиг. 1 на конкретном примере контрольной фазы (слова) дается временная диаграмма анализа акустического материала; фиг. 2 - приведена блок-схема устройства, реализующего способ.

Способ поясняется на конкретном примере анализа контрольной фразы (слова) афиша (фиг. 1).

На фиг. 1 а приведена осцилограмма речевого сигнала; на фиг. 16 - вид речевого сигнала, который сегментирован по признаку звонкость-глухость.

В пределах выделенных звонких участков, начало и конец которых определяют управляющие импульсы (фиг. 1 в), в моменты времени, соответствующие тактовым импульсам (фиг. 1г), дискретно определяют значения плотностей нулевых пересечений сигналов, соответствующих выделенным участкам речевого отрезка в отфильтрованных частотных полосах основного тона голоса PQ (фиг. 1д). третьей pi и четвертой pi

О

XJ ел ю ы

Os

формант (фиг. 1е и ж, соответственно). Эти признаки характеризуют индивидуальную манеру произнесения говорящего, а также тональные и тембральные особенности его голоса. По дискретным значениям признаков ро(+) i/9i(+), (+) формируют матрицу данных (фиг. 1з). Матрица данных содержит подматрицы, которые сравнивают с соответствующими эталонными подматрицами раздельно, Число строк всех трех подматриц (в указанном примере) равно трем, число столбцов в первой подматрице равно четырем, во второй - шести и в третьей - четырем.

Полученная матрица подлежит сравнению с эталонной в соответствии с заранее выбранным значением порога сравнения 9.

Устройство, реализующее способ, (фиг. 2) состоит из усилителя 1, разделителя 2 речевого сигнала на звонкие и глухие участки, низкочастотных фильтров 3 для выделения первой гармоники сигнала и двух полосовых фильтров 4 и 5, выделяющих участки спектра, соответствующее третьей и четвертой формантам. Блоки 6-8 осуществляют выделение признака плотностей нулевых пересеченийр0 ,pt, речевого сигнала, проходящего, соответственно, через фильтры 3-5. Данные об изменении плотностей/э нулей во времени записываются в запоминающее устройство - формирователь 9 матрицы данных в виде дискретных значений в дискретные моменты времени. Управление записью соответствующих данных в блок 9 осуществляется с помощью блока 10, фиксирующего начало и конец звонких участков сигнала, и блоком 11, генерирующим в этих промежутках времени тактовые импульсы, дискретизирую- щие значения.

Устройство работает в режиме обучения - правое положение переключателя 12, и верификации - левое положение переключателя 12,

Данные из блока 9 в режиме обучения передаются в блок 13, который представляет собой запоминающее устройство. В режиме верификации данные о неизвестном произнесении фиксируются в блоке 14, который является сравнивающим устройством, сопоставляющим данные блоков 13 и 9. Блок 15 принятия решения анализирует результаты сравнения и констатирует факт принадлежности или непринадлежности контрольного произнесения эталонному.

Устройство работает следующим образом.

Речевой сигнал после усиления до величины, необходимой для поддержания работы следующих блоков, подается на разделитель 2, который содержит набор

узкополосных фильтров, накрывающих диапазон частот 100-500 Гц. Ширина полосы пропускания каждого фильтра не больше возможной частоты основного тона голоса и составляет примерно 70-80 Гц. Во время

произнесения звуков устройство позволяет определять линейчатую структуру сигнала и отделять его от сплошного спектра, имеющего место при глухих звуках.

Выделенные блоков 2 звонкие участки

речи подаются на три фильтра. Первый из них (3) представляет собой низкочастотный фильтр с крутизной спада 18 дБ/окт, начиная от 200 Гц. Этот фильтр служит для выделения первой гармоники сигнала. Фильтр 4

является полосовым фильтром в области спектра третьей форманты 2200-3200 Гц. Фильтр 5 также является полосным фильтром в области четвертой форманты спектра 2800-4000 Гц.

Проходящие через указанные фильтры сигналы далее подаются на блоки 6, 7 и 8 ( /о-метры), формирующие последовательность значений нулевых точек сигнала, р-метры представляют собой

простые конденсаторные накопители или интеграторы, выдающие определенные потенциалы в зависимости от числа нулевых точек поступающего на них сигнала в промежутке между двумя тактовыми импульсами.

Очевидно, чем выше частота речевого сигнала, проходящего через фильтры 3, 4 и 5, тем больше число нулевых точек и, поэтому, тем выше потенциал на накопителе в

пределах двух соседних тактовых импульсов. Измеренные таким образом значения на выходах блоков 6-8 отражают как индивидуальные особенности основного тона голоса и двух высших формант, так и особенность их изменения во времени в дискретные моменты времени, обусловленные тактовыми импульсами. Последовательности этих дискретных значений отражают на выходе блока 6 характер изменения (мелодию) основного тона голоса, на выходах же блоков 7 и 8 характер изменения третьей и четвертой формант речи.

Для формирования матрицы данных дискретные значения всех выделенных

признаков (ра ,pi, и/за ) записывают в запоминающее устройство (блок 9) со строго определенной адресацией. Управление процессом дискретизации значений y°o(t) ./9l(t) и/°2(г) Р и запись этих значений

в ЗУ осуществляет блок 10, фиксирующий начало и конец звонких участков сигнала и, тем самым, определяющий адрес записи соответствующих данных в 3 и блок 11, представляющий собой генератор тактовых импульсов, служащий для преобразования с частотой 25 Гц аналоговых значений признаков в цифровые в промежутке между управляющими импульсами (блок 10), Сформированная таким образом матрица данных служит основой для характеристики голоса человека. В режиме обучения (правое положение переключателя 12) матрица данных передается в долговременное запоминающее устройство (блок 13) в режиме верификации (левое положение переключателя 12) эти данные передаются в блок 14, где происходит их сравнение с данными блоками 13. Блок 14 фактически является арифметическим устройством, вычисляющим разницу между двумя матрицами. При этом разность берется раздельно по различным участкам матрицы, соответствующим подматрицам. Каждая подматрица отражает соответствующий звонкий участок произносимого речевого отрезка. При неравенстве числа подматриц в контрольном произнесении и эталоне на блок 15 принятия решения выдается отрицательный сигнал, указывающий на чужое произнесение. При равенстве числа подматриц блок принятия решения анализирует значение разности матриц и, в зависимости от того, меньше или больше полученное в блоке сравнения абсолютное значение разности матриц некоторого порога 9, констатирует, что диктор свой или чужой, соответственно. В качестве порога 0 берут 10-20% суммы всех членов эталонной матрицы. В случае решения свой блок 15 выдает на выходе исполнительный импульс.

В случае неравенства числа столбцов контрольной подматрицы и эталонной

подматрицы сравнение производят по тем столбцам, которые в обоих подматрицах имеют место ненулевые значения, т. е, сравнение происходит по наикратчайшей (по числу столбцов) матрице (по значимым

отличным от нуля столбцам матрицы). Формула изобретения Способ верификации диктора, заключающийся в произнесении диктором заранее выбранной контрольной фразы,

выделении акустических признаков речевого сигнала, определении их параметров и порогового сравнения параметров выделенных признаков с заранее установленными эталонными значениями, от л и ч а ющ и и с я тем, что, с целью упрощения и повышения быстродействия путем упрощенного упорядочения сопоставляемых сигналов, обеспечивающего минимизацию ошибок без применения

операции нелинейной нормализации сигналов, в качестве контрольной фразы используют речевой отрезок, с последовательностью глухих и однофонемных звонких участков, выбранный речевой отрезок сегментируют на звонкие и глухие участки, определяют последовательность значений плотностей нулевых пересечений сигналов, соответствующих выделенным звонким участкам речевого отрезка в отфильтрованных частотных полосах основного тона голоса и третьей и четвертой формант, а пороговое сравнение параметров выделенных признаков производят самостоятельно в пределах каждого

выделенного участка.

aPtvtlou сигнал

1675936

,

Похожие патенты SU1675936A1

название год авторы номер документа
Способ идентификации говорящего 1986
  • Рамишвили Гурам Соломонович
  • Саакян Роман Рачикович
  • Тушишвили Михаил Акакиевич
SU1453442A1
СПОСОБ И УСТРОЙСТВО АВТОМАТИЧЕСКОЙ ВЕРИФИКАЦИИ ЛИЧНОСТИ ПО ГОЛОСУ 2008
  • Голубинский Андрей Николаевич
RU2399102C2
СПОСОБ ИДЕНТИФИКАЦИИ ГОВОРЯЩЕГО ПО ФОНОГРАММАМ ПРОИЗВОЛЬНОЙ УСТНОЙ РЕЧИ НА ОСНОВЕ ФОРМАНТНОГО ВЫРАВНИВАНИЯ 2009
  • Коваль Сергей Львович
RU2419890C1
СПОСОБ ГИБРИДНОЙ ГЕНЕРАТИВНО-ДИСКРИМИНАТИВНОЙ СЕГМЕНТАЦИИ ДИКТОРОВ В АУДИО-ПОТОКЕ 2013
  • Хитров Михаил Васильевич
  • Пеховский Тимур Сахиевич
  • Шулипа Андрей Константинович
RU2530314C1
СПОСОБ ВЫДЕЛЕНИЯ ОСНОВНОГО ТОНА 1998
  • Архипов И.О.
  • Веркиенко Ю.В.
  • Гитлин В.Б.
  • Казаков В.С.
RU2174714C2
СПОСОБ ВЕРИФИКАЦИИ ПОЛЬЗОВАТЕЛЯ В СИСТЕМАХ САНКЦИОНИРОВАНИЯ ДОСТУПА 2007
  • Сорокин Виктор Николаевич
  • Цыплихин Александр Иванович
RU2351023C2
СИСТЕМА И СПОСОБ РАСПОЗНАВАНИЯ РЕЧИ 2011
  • Кочаров Даниил Александрович
  • Хомяков Александр Борисович
RU2466468C1
МЕТОД РАСПОЗНАВАНИЯ ДИКТОРА И УСТРОЙСТВО ДЛЯ ЕГО ОСУЩЕСТВЛЕНИЯ 2002
  • Лабутин П.В.
  • Раев А.Н.
  • Коваль С.Л.
RU2230375C2
Устройство для распознавания слоев 1974
  • Осокин Александр Николаевич
  • Кучер Николай Федорович
  • Малевич Геннадий Иванович
  • Степанов Валерий Федорович
SU516094A1
СПОСОБ ОЦЕНКИ ВАРИАТИВНОСТИ ПАРОЛЬНОЙ ФРАЗЫ (ВАРИАНТЫ) 2013
  • Хитров Михаил Васильевич
  • Дырмовский Дмитрий Викторович
RU2598314C2

Иллюстрации к изобретению SU 1 675 936 A1

Реферат патента 1991 года Способ верификации диктора

Изобретение относится к области автоматического распознавания образов на основе анализа речевых сигналов и может быть использовано для автоматизации контрольно-пропускных пунктов и разработки голосовых ключей, обеспечивающих санкционированный доступ определенных лиц к банкам данных. Способ упрощает процесс верификации и повышает ее быстродействие при сохранении надежности. Способ заключается в произнесении диктором контрольной фразы, содержащей последовательность глухих и однофонемных звонких участков, выделении звонких участков и их фильтрации в полосах частот основного тона голоса и третьей и четвертой формант, определении последовательности значений плотностей нулевых пересечений сигналов в отфильтрованных частотных полосах и пороговом сравнении параметров выделенных признаков с эталонными самостоятельно в пределах каждого выделенного участка от его начала. 2 ил.

Формула изобретения SU 1 675 936 A1

ftCememu.uptit - lima и гмаин уютксн ptvetoa аянзла

бц/ ро&лямщие инцики

уТахмЖ/е имяупеи

5 «Л

to

i|yf;/

I ж) А

fiifu- felMiiftbW hifftt

fit fa ) J«n««JW l--fiiflt fiifiifrdttti Jlln Jnn

Фиг.1

/4

H

fj

Документы, цитированные в отчете о поиске Патент 1991 года SU1675936A1

Способ опознавания диктора 1980
  • Гумецкий Роман Яремович
  • Деркач Мирон Филиппович
SU898496A1
Печь-кухня, могущая работать, как самостоятельно, так и в комбинации с разного рода нагревательными приборами 1921
  • Богач В.И.
SU10A1
Розенберг А
Автоматическая верификация диктора
Обзор
Тематический выпуск Речевая связь с машиной
ТИИЭР, 1976, т
Нефтяной конвертер 1922
  • Кондратов Н.В.
SU64A1

SU 1 675 936 A1

Авторы

Рамишвили Гурам Соломонович

Даты

1991-09-07Публикация

1989-06-25Подача