Показать метаданные Скрыть метаданные

(19)

(11)

1 117 687

(13)

(51)

МПК

G10L17/00(2000-01-01)

(21) (22)

Заявка

3555361, 1983-02-22

(22)

дата подачи заявки

1983-02-22

(45)

опубликовано

1984-10-07

(72)

авторы

Беликов Авенир ПавловичКарасев Игорь АлексеевичМулюкин Николай ВасильевичТунис Константин Викторович

(56)

Документы, цитированные в отчете о поиске

Анализ и синтез речиНовосибирск, Наука, 1970Автоматическое опознавание говорящего по голосуМ., Радио и связь, 1981, с

Способ опознания говорящего и устройство для его осуществления Советский патент 1984 года по МПК G10L17/00

Описание патента на изобретение SU1117687A1

Изобретение относится к технике анализа и визуализации свойств речевых волн на экране электроннолучевой трубки и может быть использовано для опознания говорящего и выявления его языковой принадлежности, диалектных особенностей и эмоционального состояния. Известен способ обработки речевого сигнала путем формирования спектральных признаков, характеризующих текущие значения среднеквадратичной частоты и среднеквадратичной амплиту ды мгновенного спектра речи. Этот способ позволяет отобразить ре.чевой сигнал без развертки спектральных признаков во времени без потери существенной информации об особенностя артикуляции Ql . Недостатком способа является поте ря сведений об относительных частотах проявления различных особенностей артикуляции. Известен также способ опознания говорящего, основанный на формироваНИИ плоского полутонового изображения спектральных признаков его речи и визуальном сравнении этого изображения с эталонным, полученным аналогично. Этот способ позволяет легко обучить экспертов опознанию говорящего путем визуального сопоставления фрагментов изображения, полученного временной разверткой спектральных призлаков речи, с фрагментами силуэтов спектральных признаков ключевых звукосочетаний 2. Недостатком способа является бол шая избыточность формируемых изобра жений и большой объем произвольного речевого материала, необходимого дл опознания говорящего. Известно также устройство для опознания говорящего, содерж&щее блок вьщеления спектральных признаков аналого-цифровой преобразователь и соединенные последовательно ЭЦВМ, блок формирования видеосигналов и телевизионный монитор. Это устройст позволяет экспертам сравнивать на экране телевизионного монитора фраг менты изображений, полученных разверткой признаков речи, формируемых из текущих спектральных признаков и из памяти ЭЦВМ З . Недостатком устройства является невозможность визуализации текущего статистического описания артикуляции говорящего, реализующей предлагаемый способ опознания говорящего. Цель изобретения - сокращение объема произвольного речевого материала, необходимого для опознания говорящего, а также расширение функциональных возможностей устройства реализующего способ опознания говорящего. Поставленная цель достигается тем, что согласно способу опознания говорящего, основанному на формировании плоского полутонового изображения спектральных признаков его речи и визуальном сравнении этого изображения с эталонным, полученным аналоично, при формировании признаков, вьщеляют признаки среднеквадратичной частоты и среднеквадратичной амплитуды спектра, а изображение формируют в координатах текущих значений вьщеленных признаков, при этом оптическую плотность каждой точки устанавливают пропорциональной текущей плотности совместной вероятности появления этих значений. Кроме того, в устройство для опознания говорящего, содержащее блок вьщеления спектральных признаков, аналого-1Ц1фровой преобразователь, и соединенные последовательно ЭЦВМ, блок формирования видеосигналов и телевизионный монитор, введены второй аналого-цифровой преобразователь, два коммутатора, трехвходовой селек- тор записи и оперативное запоминающее устройство и соединенные с ним два дешифратора адреса и синхрогенератор, блок вьщеления спектральных признаков выполнен на измерителях текущих среднеквадратичной частоты и среднеквадратичной амплитуды спектра, выходы которых через аналого-цифровые преобразователи и коммутаторы соединены с входами дешифраторов адреса, два входа селектора записи соединены с выходами аналого-цифровых преобразователей, причем третий вход селектора записи, управляющие входы коммутаторов, синхровход формирователя видеосигналов и вход считывания оперативного запоминающего устройства соединены с соответствующими выходами синхрогенератора, а вход и выход оперативного запоминащего устройства соединены с селектором записи и с ЭЦВМ соответственно. Формированием изображения в координатах текущих значений выделенных спектральных признаков с установлением оптической плотности, пропорциона ной текущей локальной плотности совместной вероятности появления этих значений,достигнуто безизбыточное пре ставление артикуляционных укладов го ворящих, взвешенное вероятностями проявления этих уклаДов, которое мало зависит от произносимого текста, Такое безизбыточное представление позволяет распознавать говорящего по 90 с его речи. При опознании по изображениям ключевых фрагментов необходимы ;более 10 мин речи, включающей эти ключевые звукосочетания. На фиг. 1-4 приведены фотографии изображений, полученных фотооптической аналоговой обработкой записей коротких фонограмм двух различных текстов, произнесенных двумя разными дикторами; на фиг. 5 - блок-схема устройства для осуществления способа опознания говорящего. Фиг. 1 и фиг. 2 показывают сходство изображений, полученных обработ кой речи первого диктора при произне сении первого и второго текстов соответственно, а фиг. 3 и фиг. 4 получе ны обработкой произнесений этих текстов вторым диктором. Фотографии получены экспонированием луча, перемещавшегося по -экрану электроннолучевой трубки при изменениях текущей среднеквадратичной частоты, отклоняв шей луч по горизонтали, и среднеквад ратичной амплитуды спектра, отклоняв шей луч по вертикали. Каждое прохождение лучем точки экрана приводит к новому экспонированию соответству-ющей Точки фотоматериала, чем достигается пропорционал1ьность между оптической плотностью каждой точки негатива и числом совместных появлений соответствующих значений спектральных признаков, отклонявших луч. Блок-схема устройства для осущест вления способа опознания говорящего содержит блок 1 вьщеления спектральных признаков, первый 2 и второй 3 аналого-цифровые преобразователи,ком мутаторы 4 и.5, дешифраторы 6 и 7 адреса, оперативное запоминающее устройство 8, селектор 9 записи, ЭЦВМ 10, блок 11 формирования видеосигналов, телевизионный монитор 12 и синхрогенератор 13. Вход устройства для осуществления способа опознания говорящего соединен с блоком 1 вьщеления спектральны признаков 1, который первым и вторым 87 выходами соединен с входами первого 2 и второго 3 аналого-цифрового преобразователей соответственно. Выходы преобразователей через коммутаторы 4 и 5 и дешифраторы 6 и 7 адреса соединены с оперативным запоминающим устройством 8, селектор 9 записи которого своими первым и вторым входами соединен с соответствующими входами коммутаторов. Выход оперативного запоминающего устройства через ЭЦВМ 10 и блок 11 формирования видеосигналов соединен с телевизионным монитором 12. Выходы синхрогенератора 13 соединены с соответствующими синхровходами коммутаторов, селектора записи, оперативного запоминающего устройства и блока формирования видеосигналов. Устройство для осуществления способа опознания говорящего работает следующим образом. Речевой сигнал, поступивший на вход устройства с микрофона или магнитофона, в блоке выделения спектральных признаков преобразуется в текущие значения среднеквадратичной частоты и среднеквадратичной амплитуды спектра, которые преобразуются в цифровую форму соответствующими аналого-цифровыми преобразователями. Каждое новое появление кодов цифрового представления спектральных признаков с помощью селектора записи, коммутаторов и дешифраторов адреса вызывает увеличение на единицу содержимого ячейки оперативного запоминающего устройства, адрес которой соответствует указанным кодам. Записываемое в оперативное запоминающее устройство накапливается в нем до тех пор, пока продолжается обработка исследуемого речевого сигнала, после чего накопленная информация вводится в ЭЦВМ и с помощью блока формирования видеосигналов отображается на экране телевизионного монитора. На этот же экран эксперт, производящий опознание говорящего или выявление его эмоционального состояния, языковой принадлежности и диалектных особенностей, может вызвать с помощью ЭЦВМ эталонные изобр 1жения сформированные аналогичнб. Цредлагаемый способ опознания говорящего и устройство для его осуществления позволят ускорить экспертизу фонограмм и повысить надежность принимаемых экспертами решений

Иллюстрации к изобретению SU 1 117 687 A1

Реферат патента 1984 года Способ опознания говорящего и устройство для его осуществления

1. Способ опознания говорящего, основанный на формировании плоского полутонового изображения спектральных признаков его речи и визуальном сравнении этого изображения с эталонным, полученным аналогично, о т л ичающийся тем, что, с целью сокращения объема произвольного речевого материала, необходимого для опознания говорящего, при формировании признаков вьщеляют признаки среднеквадратичной частоты и среднеквадратичной амплитуды спектра, а изображение формируют в координатах декущих значений выделенных признаков, при зтом оптическую плотность каждой точки устанавливают пропорциональной текущей плотности совместной вероятности появления этих значений. 2. Устройство для опознания говорящего, содержащее блок выделения спектральных признаков, аналого-цифровой преобразователь и соединенные последовательно ЭЦВМ, блок формирования видеосигналов и телевизионньй монитор, отличающееся тем, что, с целью расщирения функциональных возможностей устройства, в него введены второй аналого-дифровой преобразователь, два коммутатора, трехвходовой селектор записи и оперативное запоминающее устройство и соединенные с ним два дешифратора адреса и синхрогенератор, блок вьщеления (Л спектральных признаков выполнен на измерителях текущих среднеквадратичной частоты и среднеквадратичной амплитуды, выходы которых через аналогоцифровые преобразователи и коммутаторы соединены с входами дешифраторов адреса, два входа селектора записи соединены с выходами аналого-цифровых преобразователей, причем третий вход а селектора записи, управляющие входы 00 коммутаторов, синхровход формирователя видеосигналов и вход считьшания оперативного запоминающего устройства соединены с соответствующими выходами синхрогенератора, а вход и выход оперативного запоминающего устройства соединены с селектором записи и с ЭЦВМ соответственно.

Документы, цитированные в отчете о поиске Патент 1984 года SU1117687A1

Печь для непрерывного получения сернистого натрия	1921	Настюков А.М. Настюков К.И.	SU1A1
Способ обработки речевого сигнала	1979	Беликов Авенир Павлович Мулюкин Николай Васильевич	SU847347A1
Печь-кухня, могущая работать, как самостоятельно, так и в комбинации с разного рода нагревательными приборами	1921	Богач В.И.	SU10A1
Аппарат для очищения воды при помощи химических реактивов	1917	Гордон И.Д.	SU2A1
Анализ и синтез речи
Новосибирск, Наука, 1970
Переносная печь для варки пищи и отопления в окопах, походных помещениях и т.п.	1921	Богач Б.И.	SU3A1
Автоматическое опознавание говорящего по голосу
М., Радио и связь, 1981, с
Приспособление для соединения пучка кисти с трубкою или втулкою, служащей для прикрепления ручки	1915	Кочетков Я.Н.	SU66A1

SU 1 117 687 A1

Авторы

Беликов Авенир Павлович

Карасев Игорь Алексеевич

Мулюкин Николай Васильевич

Тунис Константин Викторович

Даты

1984-10-07—Публикация

1983-02-22—Подача