Изобретение относится к автоматическому распознаванию образов на основе анализа речевых сигналов и может быть использовано для автоматизации контрольно-пропускных пунктов (КПП) учреждений и разработки голосовых ключей, обеспечивающих санкционированный доступ определенных лиц к банкам данных или механизмам специального назначения на основе предъявления этими лицами свидетельства о личности своей речи.
Целью изобретения является упрощение процесса верификации и повышение ее быстродействия при сохранении высокого уровня надежности верификации.
На фиг. 1 на конкретном примере контрольной фазы (слова) дается временная диаграмма анализа акустического материала; фиг. 2 - приведена блок-схема устройства, реализующего способ.
Способ поясняется на конкретном примере анализа контрольной фразы (слова) афиша (фиг. 1).
На фиг. 1 а приведена осцилограмма речевого сигнала; на фиг. 16 - вид речевого сигнала, который сегментирован по признаку звонкость-глухость.
В пределах выделенных звонких участков, начало и конец которых определяют управляющие импульсы (фиг. 1 в), в моменты времени, соответствующие тактовым импульсам (фиг. 1г), дискретно определяют значения плотностей нулевых пересечений сигналов, соответствующих выделенным участкам речевого отрезка в отфильтрованных частотных полосах основного тона голоса PQ (фиг. 1д). третьей pi и четвертой pi
О
XJ ел ю ы
Os
формант (фиг. 1е и ж, соответственно). Эти признаки характеризуют индивидуальную манеру произнесения говорящего, а также тональные и тембральные особенности его голоса. По дискретным значениям признаков ро(+) i/9i(+), (+) формируют матрицу данных (фиг. 1з). Матрица данных содержит подматрицы, которые сравнивают с соответствующими эталонными подматрицами раздельно, Число строк всех трех подматриц (в указанном примере) равно трем, число столбцов в первой подматрице равно четырем, во второй - шести и в третьей - четырем.
Полученная матрица подлежит сравнению с эталонной в соответствии с заранее выбранным значением порога сравнения 9.
Устройство, реализующее способ, (фиг. 2) состоит из усилителя 1, разделителя 2 речевого сигнала на звонкие и глухие участки, низкочастотных фильтров 3 для выделения первой гармоники сигнала и двух полосовых фильтров 4 и 5, выделяющих участки спектра, соответствующее третьей и четвертой формантам. Блоки 6-8 осуществляют выделение признака плотностей нулевых пересеченийр0 ,pt, речевого сигнала, проходящего, соответственно, через фильтры 3-5. Данные об изменении плотностей/э нулей во времени записываются в запоминающее устройство - формирователь 9 матрицы данных в виде дискретных значений в дискретные моменты времени. Управление записью соответствующих данных в блок 9 осуществляется с помощью блока 10, фиксирующего начало и конец звонких участков сигнала, и блоком 11, генерирующим в этих промежутках времени тактовые импульсы, дискретизирую- щие значения.
Устройство работает в режиме обучения - правое положение переключателя 12, и верификации - левое положение переключателя 12,
Данные из блока 9 в режиме обучения передаются в блок 13, который представляет собой запоминающее устройство. В режиме верификации данные о неизвестном произнесении фиксируются в блоке 14, который является сравнивающим устройством, сопоставляющим данные блоков 13 и 9. Блок 15 принятия решения анализирует результаты сравнения и констатирует факт принадлежности или непринадлежности контрольного произнесения эталонному.
Устройство работает следующим образом.
Речевой сигнал после усиления до величины, необходимой для поддержания работы следующих блоков, подается на разделитель 2, который содержит набор
узкополосных фильтров, накрывающих диапазон частот 100-500 Гц. Ширина полосы пропускания каждого фильтра не больше возможной частоты основного тона голоса и составляет примерно 70-80 Гц. Во время
произнесения звуков устройство позволяет определять линейчатую структуру сигнала и отделять его от сплошного спектра, имеющего место при глухих звуках.
Выделенные блоков 2 звонкие участки
речи подаются на три фильтра. Первый из них (3) представляет собой низкочастотный фильтр с крутизной спада 18 дБ/окт, начиная от 200 Гц. Этот фильтр служит для выделения первой гармоники сигнала. Фильтр 4
является полосовым фильтром в области спектра третьей форманты 2200-3200 Гц. Фильтр 5 также является полосным фильтром в области четвертой форманты спектра 2800-4000 Гц.
Проходящие через указанные фильтры сигналы далее подаются на блоки 6, 7 и 8 ( /о-метры), формирующие последовательность значений нулевых точек сигнала, р-метры представляют собой
простые конденсаторные накопители или интеграторы, выдающие определенные потенциалы в зависимости от числа нулевых точек поступающего на них сигнала в промежутке между двумя тактовыми импульсами.
Очевидно, чем выше частота речевого сигнала, проходящего через фильтры 3, 4 и 5, тем больше число нулевых точек и, поэтому, тем выше потенциал на накопителе в
пределах двух соседних тактовых импульсов. Измеренные таким образом значения на выходах блоков 6-8 отражают как индивидуальные особенности основного тона голоса и двух высших формант, так и особенность их изменения во времени в дискретные моменты времени, обусловленные тактовыми импульсами. Последовательности этих дискретных значений отражают на выходе блока 6 характер изменения (мелодию) основного тона голоса, на выходах же блоков 7 и 8 характер изменения третьей и четвертой формант речи.
Для формирования матрицы данных дискретные значения всех выделенных
признаков (ра ,pi, и/за ) записывают в запоминающее устройство (блок 9) со строго определенной адресацией. Управление процессом дискретизации значений y°o(t) ./9l(t) и/°2(г) Р и запись этих значений
в ЗУ осуществляет блок 10, фиксирующий начало и конец звонких участков сигнала и, тем самым, определяющий адрес записи соответствующих данных в 3 и блок 11, представляющий собой генератор тактовых импульсов, служащий для преобразования с частотой 25 Гц аналоговых значений признаков в цифровые в промежутке между управляющими импульсами (блок 10), Сформированная таким образом матрица данных служит основой для характеристики голоса человека. В режиме обучения (правое положение переключателя 12) матрица данных передается в долговременное запоминающее устройство (блок 13) в режиме верификации (левое положение переключателя 12) эти данные передаются в блок 14, где происходит их сравнение с данными блоками 13. Блок 14 фактически является арифметическим устройством, вычисляющим разницу между двумя матрицами. При этом разность берется раздельно по различным участкам матрицы, соответствующим подматрицам. Каждая подматрица отражает соответствующий звонкий участок произносимого речевого отрезка. При неравенстве числа подматриц в контрольном произнесении и эталоне на блок 15 принятия решения выдается отрицательный сигнал, указывающий на чужое произнесение. При равенстве числа подматриц блок принятия решения анализирует значение разности матриц и, в зависимости от того, меньше или больше полученное в блоке сравнения абсолютное значение разности матриц некоторого порога 9, констатирует, что диктор свой или чужой, соответственно. В качестве порога 0 берут 10-20% суммы всех членов эталонной матрицы. В случае решения свой блок 15 выдает на выходе исполнительный импульс.
В случае неравенства числа столбцов контрольной подматрицы и эталонной
подматрицы сравнение производят по тем столбцам, которые в обоих подматрицах имеют место ненулевые значения, т. е, сравнение происходит по наикратчайшей (по числу столбцов) матрице (по значимым
отличным от нуля столбцам матрицы). Формула изобретения Способ верификации диктора, заключающийся в произнесении диктором заранее выбранной контрольной фразы,
выделении акустических признаков речевого сигнала, определении их параметров и порогового сравнения параметров выделенных признаков с заранее установленными эталонными значениями, от л и ч а ющ и и с я тем, что, с целью упрощения и повышения быстродействия путем упрощенного упорядочения сопоставляемых сигналов, обеспечивающего минимизацию ошибок без применения
операции нелинейной нормализации сигналов, в качестве контрольной фразы используют речевой отрезок, с последовательностью глухих и однофонемных звонких участков, выбранный речевой отрезок сегментируют на звонкие и глухие участки, определяют последовательность значений плотностей нулевых пересечений сигналов, соответствующих выделенным звонким участкам речевого отрезка в отфильтрованных частотных полосах основного тона голоса и третьей и четвертой формант, а пороговое сравнение параметров выделенных признаков производят самостоятельно в пределах каждого
выделенного участка.
aPtvtlou сигнал
1675936
,
название | год | авторы | номер документа |
---|---|---|---|
Способ идентификации говорящего | 1986 |
|
SU1453442A1 |
СПОСОБ И УСТРОЙСТВО АВТОМАТИЧЕСКОЙ ВЕРИФИКАЦИИ ЛИЧНОСТИ ПО ГОЛОСУ | 2008 |
|
RU2399102C2 |
СПОСОБ ИДЕНТИФИКАЦИИ ГОВОРЯЩЕГО ПО ФОНОГРАММАМ ПРОИЗВОЛЬНОЙ УСТНОЙ РЕЧИ НА ОСНОВЕ ФОРМАНТНОГО ВЫРАВНИВАНИЯ | 2009 |
|
RU2419890C1 |
СПОСОБ ГИБРИДНОЙ ГЕНЕРАТИВНО-ДИСКРИМИНАТИВНОЙ СЕГМЕНТАЦИИ ДИКТОРОВ В АУДИО-ПОТОКЕ | 2013 |
|
RU2530314C1 |
СПОСОБ ВЫДЕЛЕНИЯ ОСНОВНОГО ТОНА | 1998 |
|
RU2174714C2 |
СПОСОБ ВЕРИФИКАЦИИ ПОЛЬЗОВАТЕЛЯ В СИСТЕМАХ САНКЦИОНИРОВАНИЯ ДОСТУПА | 2007 |
|
RU2351023C2 |
СИСТЕМА И СПОСОБ РАСПОЗНАВАНИЯ РЕЧИ | 2011 |
|
RU2466468C1 |
МЕТОД РАСПОЗНАВАНИЯ ДИКТОРА И УСТРОЙСТВО ДЛЯ ЕГО ОСУЩЕСТВЛЕНИЯ | 2002 |
|
RU2230375C2 |
Устройство для распознавания слоев | 1974 |
|
SU516094A1 |
СПОСОБ ОЦЕНКИ ВАРИАТИВНОСТИ ПАРОЛЬНОЙ ФРАЗЫ (ВАРИАНТЫ) | 2013 |
|
RU2598314C2 |
Изобретение относится к области автоматического распознавания образов на основе анализа речевых сигналов и может быть использовано для автоматизации контрольно-пропускных пунктов и разработки голосовых ключей, обеспечивающих санкционированный доступ определенных лиц к банкам данных. Способ упрощает процесс верификации и повышает ее быстродействие при сохранении надежности. Способ заключается в произнесении диктором контрольной фразы, содержащей последовательность глухих и однофонемных звонких участков, выделении звонких участков и их фильтрации в полосах частот основного тона голоса и третьей и четвертой формант, определении последовательности значений плотностей нулевых пересечений сигналов в отфильтрованных частотных полосах и пороговом сравнении параметров выделенных признаков с эталонными самостоятельно в пределах каждого выделенного участка от его начала. 2 ил.
ftCememu.uptit - lima и гмаин уютксн ptvetoa аянзла
бц/ ро&лямщие инцики
уТахмЖ/е имяупеи
5 «Л
to
i|yf;/
I ж) А
fiifu- felMiiftbW hifftt
fit fa ) J«n««JW l--fiiflt fiifiifrdttti Jlln Jnn
Фиг.1
/4
H
fj
Способ опознавания диктора | 1980 |
|
SU898496A1 |
Печь-кухня, могущая работать, как самостоятельно, так и в комбинации с разного рода нагревательными приборами | 1921 |
|
SU10A1 |
Розенберг А | |||
Автоматическая верификация диктора | |||
Обзор | |||
Тематический выпуск Речевая связь с машиной | |||
ТИИЭР, 1976, т | |||
Нефтяной конвертер | 1922 |
|
SU64A1 |
Авторы
Даты
1991-09-07—Публикация
1989-06-25—Подача