Изобреление отггссится .к области автсматического ра СЛОЗ:Нава(ния речевых еитналов.
Известны устройства, позволяющ-ие вы,делять непос:редст1ввнио из речевого iaнгнaлa дифференциальные ориз-наки , имеющие дискретный ха рактер. При этом отыскивание диф,фербН|Ц1иаль.ных призна.ков осуществляется путем сопоста1вле1 ия множеств реализации фонем -и отбора таишх параметров речесого сигнала, которые могли бы обеспечить различение этих фонем в любом контексте. Оанако фонемы тгаходятся «а высоком уровне а-бстракцлн и иапользова:и1ие такого подхода в условиях недостаточного знания и воз можно,сти выделения нфар 1ати1в,ных пара:метров речевого оилнала приводит к сложным и далеко ие всепда эффективньим рещающИМ ира1ВИЛЛ1М.
Другой возможный .путь ж дисиретно.му аписаиию речевого сигнала за ключается в изучении артикуляции и а-иустили в процессе речеобра3ава11ия и выделении на этой основе признаков Непосредственно кодирующих речевой оишнал без перехода к фоиема.м. В соответстви.и с этим .подходом .целью изобретения является использование кодмроваиия артикуляЦио. движений дл-я выделения признаков речевых сигналов, н.еза1виоимых от диктора. Для этого предла1гавмое устройство со.дерЖ1ИТ блок нормировки, входы которого пад.ключе ;ы к выхода.м бло.кс.в .вы.деления ам.плитуды и частотЬ четвертой формаиты и частоты и и.нтенСТ Е ности основного TCiiia; блоки деления н блок оценми качества neipexoiaiioro (Процесса. Одни входы блоков деления подсоединены соот1зетстзен но iK выхода.м блоков зыделекшя частот первой, второй и третьей форЛ1аи1т, а другие - к выходу блока нормнро.. Вход блока оценки качества переход.по.гэ .процесса лодключен .к выходу блоки вы.деленшя а милнтуды цервой фор.манты. Выходы блоков деления и блока оценки качества переходного процесса первой фор манты иодсоедилены к вхо.да;м пороговых элементов, авязглиных через .днфферен.ц1ирующ1 е цопочк с блокаМи деления.
Описывая лрсцесс артмкуля.ции как отклоиенне арт.нкуЛЯциоццых орган.ов от некоторого нейтрального положения и учитывая, что частоты формант ловыщаются или понижаются в завиоимост от того, 1прихо.дится ли сужение («ли ра.ошнрение) в голосо.во.м тракте ма пучность или узел соответствующей собственной функции колебаний воздушного пото-ка, лолучают возможность кодирования места а ртикул51ции ло а кустичес1кому сишиалу.
В силу конечных размеров арти куляиионлых органов оказывается, что для высщлх
формант, начиная с четвертой, узлы и пучности соответствующих -собственных функиий
одновраменио .попадают в область а ртИкуляции, II поэтОМу частоты щысших фор1мант 1не (И|с:пы,ты1вают ретлля|р1ното опклоненшя в п роцессе а1ртмкуЛЯЦ1ИН, в результате чэго инфсрм.ативпыми оказы.ваются только первые три форманты.
Если Обозначить частоты фо1р:мант, соответствующих нейтральнаму состоянию голссо--ВОГО аП;па рата, как FQI, Ро2 и оз, то :выделение п.риз1:-1., характе,р1ив|ующих масто арти(кулжции в к1вазиСта|ЦИ01нарнам режиме, можно Ссуш;ест1вить 3|Накалии paeiHостей т&к ущего зиаче1НИя формант с этимш лороговыми величиliia MH
Si Sgn (f, - F,:) .
Для ци-намичэских -режимав основную роль IB получении .приз.иаксв играют ;не снм.и знании о.ткло.иэния фор1ма1нт от .иейт|ральных зна челий, а зиа1ки их производных то времени, указывающие направлеяие ларехода.
Получение :приз:наков, характеризуюш их место образования, возможно ло переходным яроцессам а1М|Плитда ф|0рмант, исходя из того, ЧТО Инерц1юнность губ, .ко.нчика языка и середины языка неодинаковы. Иапользуя ка1кую-Л1ибо оценку качест1В а переходного процесса, например «тинейлую интегральную.
1
A,(t)dt,
Pi
А,-..
где Л,- (t) -текущее 31вачвние а1мплиту|ды i-й
фо1рма1нты;
Л,-, - зна1чение, соответствующее окончанию пареходного процесса; Т - время переходного 1ПрО цесоа; и срав(нив,ая Р с порогами, получают спедифичеоыий nip-.HSHaK места образования, осно(ваийый не на частотных, ,а на временных свойст.вах реч9во1го сптнала.
.Поскольку динамика ам|нлитуд формант сильно ко.рреЛИрова.на, то оцеику качестоза переходных процессов МОЖНО производить лищь по одной фо.р1ма1нте, nanpiHiMep первой, либо, пользуясь всеми фо1рмантаМ1и, повысить надежность этой о ценки.
Тот факт, что частоты высщих формант иракти1че1с.ки яе завлсят от артикуляции, а определяюпся только длиной голосового тракта, позволяет, нор,МИ(р1уя первые три формаиты по одной из вьющих {|на1Пр1И1мер, чет1ве|ртой), получить И|Н|В1а|р1иалтность к разб1росу длин гол1осовых трактов от диктора к диктору и компенсировать таким Обр-азом более чем 20%-1ный разб|рос форм.аит на одеих и тех же . В тех случаях, когда высшие форманты «е удается выделить И1з .речевого сигнала, более грубая нормировка возможна по частоте основного тона, усре1дненеой за некоторый инте|рв ал врамени.
Хотя получаемое в рез/ультате использования Нзложелных процедур (дискретно олиса1ние речевого процесса и может быть использовало для р.аопознавания фолем (в сочеталйи 5 с уже и31весБнЫ|МИ лроцйдурами 1выяелен1ия лризваксв тон/шум, на-чальности л др.), в задаче распоз1Н1авалия не слиш|ком больших словарей та-кой необ ходи1М01Сти нет, и олиса1Н1ие слов проще производить, используя прл знаки, вьвделяемые предлагаемым устройством.
На фиг. 1 изооражена блок-схема предлагаемого устройства; 1на фиг. 2 - схема блока, (вьпр абатьшающего нормирующий сигнал; ла фит. 3 - схем.а блока оценки качества переХ01ДНОГО процесса.
BxcuaiMH устройств.а служат блоки /-8. В блоке 1 происходит выделение частоты ос1НСЗНОГО тон-а, в блоке 2 - интенсив.ности ослазнсго тсна, в блоках 3 i 4 - частоты и
а1мплиту|ды четвертой форманты, в блоках 5, 6 н 7 - частот первой, второй и третьей формант соответственно, в блоке 8 - а-мплит уды первой форманты.
Выходы блоков /-4 связаны с .входом
блока Я вычисляющего нор1мирующий сигнал, использующийся для деления частот первых трех фор|М1а.нт в бло.ках 10, 11 и 12 на величину, лропоршиональную частоте основного тона или четвертой форманты. Сигнал с выхода блока -8 поступает на вход блока 13, в котором осуществляется оценка 1качества переходлого процесса для первой фо.рмалты. Нормирс1ва. си1гналы с выходов блоков 10, 11 и 12 проходят иа (входы цапочак 14, 15 и 16,
5 осуществляющих ди|ф;ференцирова.ние по времени.
(Каждый из выходов блоков 10-13 и диффере:нцирующих цепочек 14, 15 и 16 соединен с входами пороговых элементов 17-23, имею0 Ш1ИХ золу нечувствительности, (подбир.аемую для каждого калала в отдельности. Пороговые элементы Имеют на (Выходе сигналы -i-1,. Выходы элементов 17-23 соадиле1НЫ с регистра1ми 24, 25 и 26, предназйаченны5 МИ для з аооминания кодовых ко.мбиеаций текущего речевого .сигнала. Перенос инфор(мащии с одного .регистра ла другой осуществляется под действием сигнала, формируемого в случае И31менения на любом из входоВ
0 элементо.в 17-23 блоком 27.
В процессе работы устроййтва По окончаНИИ произноюимого слова регистры представляют собой матр1ищу из троичных элементов, nipi«eiM Номер регистра косвенно отоб.ражает
5 реальнОе время, но ле зависит от темпа дроизнощепия.
В блоке 9 (СМ. фиг. 2) нормирующий сигнал вычисляется либо по частоте чет1вертой форманты, либо по ч.астоте основного тона, 0 либо остается постоянным и соот1ветствует /04 2600 Гц, причем приоритет отдается надежно вычисленной част0.те F. Если аМПЛИтуда четвертой форманты, определенная блоКОМ 4, больще некоторого порога, уста НОВ лен5 ного в элементе 28, то сигнал от блока / через схему «И 29 и схему «ИЛИ 30 подается на усредняющую цепочку 31 с лостоянвой времени 200-400 мс, а затам на загооминающее уст,роЙ1Ство 32. Одноврем дно си:пнал с .выхода элемент.а 28 падается на блок 33, запрещающий через схему «И 34 лрохаждение остальных оятналов еа схйму 30 в течение 0,8-1 с. Если интенсивность основного тон-а, агаределяамаЯ блоком 2, выше порога, устанавленного в элементе 35, а сипвал в элементе 28 ниже nopiOra, то частота чет1вертой ф.ор;ма нты из блака 3 через схему «И 36 и усилительный элемент 37 трохоаит на схему «ИЛИ 38. Если же и амшлитуда чет1вертой фораранты .и интен1СИ1вность основного тона ниже порога, то , соответствующий /о4 2500 Гц, выдается из блока 39 через схему «И 40.
Схема блока 13 оценки качества юереход1Чого процесса (см. фиг. 3) реализует формулу
Ai(t}dt А +А/СО
Я,-
где Л,-д - я.ачальное звачеиие а-.м плитуды первой форманты.
Если амтлитзда первой форм ая;ты, апрсделяамая блоком 8, больше некоторой величины, то пороговый элемент 41 ор абатывает « 1ВЫ|дает импульс на схему «И 42, разрешающую прохождение оишнала от блока 43, вычисляющего праиз|во(дную от амплитуды, блока 44, нормирующего эту производную, и порогового эле(Мвнта 45. Выход cxesMbi 42 з-агплскает интегратор 46 и дает сигнал на з апоМИнание отсчета блоком 47. Это значение А{ сум1М1ируется с текущей величиной Л,-() в
блоке 48 и норми)рует результат текущего интегрирования Ai{t) в блоке 49. В момент
А (t апада (/) или . . ниже порога зыдают i (ч
ся .имюульсы на сброс блока 47, выдачу через схему «И 50 накопленного значения оценки качества переходного процесса и сброс интегратора 46.
Предмет изобретения
Устройство для выделения лризнакОЗ речевых сигналов, содержащее блоки :выделения частот первой, второй и третьей форма нт, блоки выделения частоты и ам1ПЛ|ИТ 1ДЬ четзертоГ форманты и частоты и интенсив нести основного тана, блок выделеш-гя амплигуды .первой форманты, пороговые элементы с зоной нечувст1ВИтельност1И, Выходы которых подключены к .параллельны1М регистраМ и входам фор.мирователя сдвига регистров, отличающееся тем, что, с целью выделения лризпэкоз речевого сигнала, незаВИСимых от дшктора, оно содержит блок но.римировки, входы которого подключены к выходам блоков выделения амплитуды и частоты четве.ртой фор:манты и частоты ,и интенсивности основного тона, блоки деЛенин, одни входы которых подсоединены соответственно к выходам блоков выделения частот первой, второй и третьей формант, а другие- .к выходу блока нормировки, блок оценки качеств а переходного процесса, вход кото. рого подключен к выходу блока выделения амплитуды первой .а1нты, а выходы блоков деления и блока оценки качества переходного процесса первой форманты подключены к входам пороговых элементов, соединенных через .дифференцирующие цепочки с блоками деления.
название | год | авторы | номер документа |
---|---|---|---|
СПОСОБ И УСТРОЙСТВО АВТОМАТИЧЕСКОЙ ВЕРИФИКАЦИИ ЛИЧНОСТИ ПО ГОЛОСУ | 2008 |
|
RU2399102C2 |
СПОСОБ ИДЕНТИФИКАЦИИ ГОВОРЯЩЕГО ПО ФОНОГРАММАМ ПРОИЗВОЛЬНОЙ УСТНОЙ РЕЧИ НА ОСНОВЕ ФОРМАНТНОГО ВЫРАВНИВАНИЯ | 2009 |
|
RU2419890C1 |
МЕТОД РАСПОЗНАВАНИЯ ДИКТОРА И УСТРОЙСТВО ДЛЯ ЕГО ОСУЩЕСТВЛЕНИЯ | 2002 |
|
RU2230375C2 |
Способ верификации диктора | 1989 |
|
SU1675936A1 |
СПОСОБ ОСУЩЕСТВЛЕНИЯ МАШИННОЙ ОЦЕНКИ КАЧЕСТВА ЗВУКОВЫХ СИГНАЛОВ | 2005 |
|
RU2312405C2 |
СПОСОБ РАСПОЗНАВАНИЯ ИЗОЛИРОВАННЫХ СЛОВ РЕЧИ С АДАПТАЦИЕЙ К ДИКТОРУ | 1994 |
|
RU2047912C1 |
Устройство для оценки отношения сигнал/помеха | 1987 |
|
SU1494228A1 |
СПОСОБ ГИБРИДНОЙ ГЕНЕРАТИВНО-ДИСКРИМИНАТИВНОЙ СЕГМЕНТАЦИИ ДИКТОРОВ В АУДИО-ПОТОКЕ | 2013 |
|
RU2530314C1 |
СИСТЕМА ИСКАЖЕНИЯ ГОЛОСА ДИКТОРА | 2009 |
|
RU2403627C1 |
Способ идентификации говорящего | 1986 |
|
SU1394233A1 |
Даты
1974-06-15—Публикация
1971-12-16—Подача