Способ идентификации говорящего Советский патент 1989 года по МПК G10L17/00 

Описание патента на изобретение SU1453442A1

Изобретение относится к анализу речевых сигналов и автоматическом распознаванию образов и может быть использовано для автоматизации контрольно-пропускных пунктов (КПП) уч- реждений и разработки голосовых ключей, обеспечивающих санкциониро- ванньй доступ определенных лиц к банкам или механизмам специального назначения на основе предъявления этими лицами в качестве свидетельства о личности своей речи.

Целью изобретения является повышение надежности идентификации гово- рящего путем анализа наиболее информативных с точки зрения различения голосов гласных фонем, выделяемых лишь по признаку наибольшей интенсив ности и звонкости звука.

Способ свободен от необходимости осуществления сложных процедур нелинейной нормализации продолжительности звучания фразы. Действительно, простая по своей природе операция не вносит больших интраиндивидуаль- ных вариаций при различных произнесениях одного и того же диктора, ив то же время может обеспечить существенный вклад при отстранении чужих :ГОЛОСОВ за счет возможной неидентичной зкстракции опорных гласных для разных дикторов даже в случае, если мистификатору известна парольная фраза.

На фиг. 1 показан пример устройства, реализующего способ; на фиг. 2 - вреЧ менные диaгpa Iмы, иллюстрирующие спо- 1соб идантификации.

, Устройство содержит кнопку 1 запус- 1ка, усилитель 2, выделитель 3 звонких участков сигнала, механический фикса- ;тор 4 кода для установки числа вьще- пяемых опорных сегментов, экстрактор 5 интенсивных фонем, а также начального и конечного сегментов сигнала, измеритель 6 длительности между опорными сегментами, счетчик-определитель 7 числа экстремальных точек, детектор 8 первой гармоники сигнала, счетчик 9 числа нулевых точек, формирова- тель 10 матрицы признаков, переключатель 11 режимов обучения и верификации, блок 12 обучения, блок 13 сра- )внения и блок 14 принятия решения.

Пусть в качестве парольной фразы идентифицируемым лицом выбрана фра- Sa: Мой голос-мой код (фиг. 2). Характер огибающего речевого сигна

.Q

с

5

5

0

5

ла, соответствующего этой парольной , фразе, приводится на фиг. 2а. Для удобства под иллюстрацией дается буквенная (а не фонематическая) запись парольной фразы.

С произнесением фразы сигнал через усилитель 2 поступает на вьщелитель звонких участков сигнала 3. Этот блок состоит из набора узкополосных фильтров с частотным диапазоном 100- 500 Гц. Ширина полосы пропускания каждого фильтра не больше возможного периода основного тона голоса и составляет примерно 70-80 Гц. Во время произнесения звонких звуков это позволяет определить линейчатость структуры сигнала, так как гармоники сигнала не смогут одновременно попасть во все фильтры. Обратная картина имеет место при произнесении глухих звуков.

Разделение сигнала на звонкие и не звонкие участки сигнала показано на фиг. 26. Заштрихованная часть диаграммы указывает на звонкий характер сигнала.

Далее с помощью экстрактора 5 из сигнала выделяются интенсивные участки на местах ударных гласных звуков, а также в начале и в конце произнесения. Этот блок представляет собой микропроцессор, включающий в себя запоминающее устройство и вычислитель числа (задаваемого заранее с помощью фиксатора 4) энергетически мощных участков сигнала, а также стандартных по длительности участков в начальной и конечной части сигнала, Для случая п 5 эта операция показана на фиг. 2в.

Далее с помощью блока 6 определяются длительности Т,- Т между началами вьйранных мощных учатсков (опорных сегментов) сигнала, а также длительность времени Т от запуска (кнопкой 1) устройства до начала произнесения. Эти параметры показаны на фиг.2г.

Счетчик 7 определяет число экст- ремумой речевого сигнала за стандартный период выбранньк опорных сегментов (фиг. 2д), счетчик 9 - число нулевых точек после детектирования блоком 7 (этот блок представляет собой низкочастотный фильтр с крутизной спада 18 дБ/окт., начиная с 200 Гц) первой гармоники сигнала (фиг. 2е). Эти последние параметры испол1 эуют в дальнейшем для вычисления значения

Ыц/Ыц, где N° - число нулевых точек первой гармоники сигнала в начальном, опорном сегменте; N - в конечном опорном cerMisHTe.

Формирователь 10 признаков (матрицы) представляет собой буферное запоминающее устройство, куда поступают перечисленные данные из блока 6 и счетчиков 7 и 9: Тр-Тд, N,- Nj и NS/N°.

Необходимо отметить,.что.число столбцов матрицы для разных случаев задания будет разным и, таким образом, оно также, как и другие признаки индивидуальности голоса, участвует в правильной верификации диктора,

В режиме обучения, т.е. в режиме запоминания голосовых и произносительных характеристик идентифицируемого лица, переключатель 11 находится в правом положении. В этом случае все данные из формирователя 10 матрицы передаются в блок 12, который представляет собой долговременное запоминающее устройство (ДЗУ).

В режиме идентификации (переключатель 11 находится в левом положении) данные анализа контрольной фразы из блока 10 формирования признаков подаются уже на блок 13, которьй производит сопоставление и сравнение этих данных с данными обучения из блока 12, В результате формируется разностный

ные интервалы между сегментами, определяют выдержку времени до начала произнесения парольной фразы, подсчитывают число экстремальных точек в каждом из вьщеленных сегментов ,определяют отношение числа нулей, подсчитанных на первой гармонике сигнала в начальном и конечном сегмен 0 тах,и сравнивают полученный комплекс параметров с индивидуальными для диктора эталонами. При этом из звонких участков на местах интенсивных гласных звуков, и в начале и в конце

15 парольной фразы вьщеляют заранее выбранное число сегментов одинаковой

, длительности; определяют временные интервалы между этими сегментами; определяют выдержку времени до нача20 ла произнесения парольной фразы; подсчитывают число экстремальных точек в каждом из выделенн(х сегментов; определяют отнощение числа нулей, подсчитанных по первой гармонике сиг25 нала в начальном и конечном сегментах,

Формула изобретения

Способ идентификации говорящего путем произнесения им парольной фра30 зы, вьщеления временных параметров этой фразы и порогового сравнения с ; эталонными параметрами, о т л и ч а ю щ и и с я тем, что, с целью повышения надежности идентификации.

сигнал и между сравниваемыми матрица- параметры произнесения контрольной ми, который подается на блок 14 при-фразы устанавливают индивидуально

нятия решения. В этом блоке, также представляющем сравнивающее устройпо трудно имитируемьм неконтролируе- мым на слух особенностям речевого поведения говорящего, при этом пара- некоторым заранее установленным поре- Q метры для идентификации выбирают из совокупности временных интервалов

между заранее выбранными наиболее ин- тенсивными сегментами одинаковой длительности на звонких участках и в 45 начале и конце парольной фразы, опрество, происходит сопоставление Л с

гом 0 . При происходит отстранение лица,произносящего испытательную фразу, при й.в диктор квалифицируется как личность, на которую настроен верификатор.

--jT- ----- .-.

Таким образом, сущность способа сое- деляют вьщержк.у времени до начала

состоит в том, что преобразовангалй из парольной фразы речевой сигнал усиливают, выделяют из него звонкие участки, из которых выделяют заранее выбранное число сегментов одинаковой длительности на местах интенсивных гласных звуков и в начале и в конце парольной фразы, определяют времен50

произнесения парольной фразы,, опре- деляют интервалы между переходами через нуль речевых колебаний, соот- ветствуняцих этим сегментам, и определяют соотношение фильтрованных в частотной области первой гармоники сигнала числа нулей в начальной и конечном сегментах.

ные интервалы между сегментами, определяют выдержку времени до начала произнесения парольной фразы, подсчитывают число экстремальных точек в каждом из вьщеленных сегментов ,определяют отношение числа нулей, подсчитанных на первой гармонике сигнала в начальном и конечном сегмен0 тах,и сравнивают полученный комплекс параметров с индивидуальными для диктора эталонами. При этом из звонких участков на местах интенсивных гласных звуков, и в начале и в конце

5 парольной фразы вьщеляют заранее выбранное число сегментов одинаковой

длительности; определяют временные интервалы между этими сегментами; определяют выдержку времени до нача0 ла произнесения парольной фразы; подсчитывают число экстремальных точек в каждом из выделенн(х сегментов; определяют отнощение числа нулей, подсчитанных по первой гармонике сиг5 нала в начальном и конечном сегментах,

Формула изобретения

Способ идентификации говорящего путем произнесения им парольной фра0 зы, вьщеления временных параметров этой фразы и порогового сравнения с ; эталонными параметрами, о т л и ч аю щ и и с я тем, что, с целью повышения надежности идентификации.

деляют вьщержк.у времени до начала

произнесения парольной фразы,, опре- деляют интервалы между переходами через нуль речевых колебаний, соот- ветствуняцих этим сегментам, и определяют соотношение фильтрованных в частотной области первой гармоники сигнала числа нулей в начальной и конечном сегментах.

Похожие патенты SU1453442A1

название год авторы номер документа
СПОСОБ ИДЕНТИФИКАЦИИ ГОВОРЯЩЕГО ПО ФОНОГРАММАМ ПРОИЗВОЛЬНОЙ УСТНОЙ РЕЧИ НА ОСНОВЕ ФОРМАНТНОГО ВЫРАВНИВАНИЯ 2009
  • Коваль Сергей Львович
RU2419890C1
Способ верификации диктора 1989
  • Рамишвили Гурам Соломонович
SU1675936A1
СПОСОБ ГИБРИДНОЙ ГЕНЕРАТИВНО-ДИСКРИМИНАТИВНОЙ СЕГМЕНТАЦИИ ДИКТОРОВ В АУДИО-ПОТОКЕ 2013
  • Хитров Михаил Васильевич
  • Пеховский Тимур Сахиевич
  • Шулипа Андрей Константинович
RU2530314C1
СПОСОБ АУТЕНТИФИКАЦИИ ДИКТОРА ПО ПАРОЛЬНОЙ ФРАЗЕ 2009
  • Столов Евгений Львович
RU2422920C2
СПОСОБ ОЦЕНКИ ВАРИАТИВНОСТИ ПАРОЛЬНОЙ ФРАЗЫ (ВАРИАНТЫ) 2013
  • Хитров Михаил Васильевич
  • Дырмовский Дмитрий Викторович
RU2598314C2
СИСТЕМА И СПОСОБ РАСПОЗНАВАНИЯ РЕЧИ 2011
  • Кочаров Даниил Александрович
  • Хомяков Александр Борисович
RU2466468C1
Способ автоматического распознавания речевых сигналов 1991
  • Дрюченко Алексей Яковлевич
SU1775730A1
СПОСОБ ВЕРИФИКАЦИИ ПОЛЬЗОВАТЕЛЯ В СИСТЕМАХ САНКЦИОНИРОВАНИЯ ДОСТУПА 2007
  • Сорокин Виктор Николаевич
  • Цыплихин Александр Иванович
RU2351023C2
СПОСОБ ВЫДЕЛЕНИЯ ОСНОВНОГО ТОНА 1998
  • Архипов И.О.
  • Веркиенко Ю.В.
  • Гитлин В.Б.
  • Казаков В.С.
RU2174714C2
УСТРОЙСТВО ДЛЯ РАСПОЗНАВАНИЯ ИЗОЛИРОВАННЫХ СЛОВ 1998
  • Брайнина И.С.
  • Кузнецов М.В.
RU2136059C1

Иллюстрации к изобретению SU 1 453 442 A1

Реферат патента 1989 года Способ идентификации говорящего

Изобретение касается анализа речевых сигналов и автоматического распознавания образов и может быть использовано для автоматизации контрольно-пропускных пунктов и разработки голосовых клкмей ; Применение способа повышает надежность идентификации личности и обеспечение устойчивости система к попыткам имитации голоса. Способ заключается в сравнении временной последовательности комплекса параметров речевого сигнала с индивидуальными для диктора эталонами.

Формула изобретения SU 1 453 442 A1

Редактор С, Патрушева

Составитель В. Махонин Техред М.Дидык

Заказ 7289/48

Тираж 343

ВНИИПИ Государственного комитета по изобретениям и открытиям при ГКНТ СГСр 113035, Москва, Ж-35, Раушская наб., д. 4/5

Корректор А. Ворович

Подписное

Документы, цитированные в отчете о поиске Патент 1989 года SU1453442A1

Способ опознания говорящего и устройство для его осуществления 1983
  • Беликов Авенир Павлович
  • Карасев Игорь Алексеевич
  • Мулюкин Николай Васильевич
  • Тунис Константин Викторович
SU1117687A1
Печь-кухня, могущая работать, как самостоятельно, так и в комбинации с разного рода нагревательными приборами 1921
  • Богач В.И.
SU10A1
Разборный с внутренней печью кипятильник 1922
  • Петухов Г.Г.
SU9A1
Печь-кухня, могущая работать, как самостоятельно, так и в комбинации с разного рода нагревательными приборами 1921
  • Богач В.И.
SU10A1

SU 1 453 442 A1

Авторы

Рамишвили Гурам Соломонович

Саакян Роман Рачикович

Тушишвили Михаил Акакиевич

Даты

1989-01-23Публикация

1986-05-05Подача