Способ разделения речевых и нестационарных шумовых сигналов Советский патент 1992 года по МПК G10L5/00 G10L7/00 

Описание патента на изобретение SU1781701A1

с

Похожие патенты SU1781701A1

название год авторы номер документа
Способ разделения тональных и шумовых сигналов звуков речи 1990
  • Молчанов Александр Павлович
  • Бабкина Людмила Назаровна
SU1755321A1
Способ разделения речи и речеподобного шума путем анализа значений энергии и фаз частотных составляющих сигнала и шума 2019
  • Белогуров Владимир Александрович
  • Золотарев Владимир Алексеевич
RU2700189C1
СПОСОБ И УСТРОЙСТВО ВОКОДИРОВАНИЯ ПЕРЕМЕННОЙ СКОРОСТИ ПРИ ПОНИЖЕННОЙ СКОРОСТИ КОДИРОВАНИЯ 1995
  • Эндрю П.Деджако
RU2146394C1
СПОСОБ АДАПТИВНОГО КОДИРОВАНИЯ РЕЧЕВЫХ СИГНАЛОВ НА ОСНОВЕ СИСТЕМЫ С ПЕРЕМЕННОЙ СТРУКТУРОЙ 2006
  • Афанасьев Андрей Алексеевич
  • Богачев Геннадий Васильевич
  • Басов Олег Олегович
RU2343564C2
СИСТЕМА ГОЛОСОВОЙ ИДЕНТИФИКАЦИИ ДИКТОРА 2009
  • Зыков Александр Павлович
  • Леднов Дмитрий Анатольевич
  • Меркулов Максим Николаевич
RU2385272C1
Способ разделения речи и пауз путем анализа значений фаз частотных составляющих шума и сигнала 2018
  • Белогуров Владимир Александрович
  • Золотарев Владимир Алексеевич
RU2680735C1
МЕТОД РАСПОЗНАВАНИЯ ДИКТОРА И УСТРОЙСТВО ДЛЯ ЕГО ОСУЩЕСТВЛЕНИЯ 2002
  • Лабутин П.В.
  • Раев А.Н.
  • Коваль С.Л.
RU2230375C2
СПОСОБ АДАПТИВНОЙ ФИЛЬТРАЦИИ РЕЧЕВЫХ СИГНАЛОВ В СЛУХОВЫХ АППАРАТАХ 1996
  • Молчанов А.П.
  • Бабкина Л.Н.
RU2111732C1
СПОСОБ (ВАРИАНТЫ) ФИЛЬТРАЦИИ ЗАШУМЛЕННОГО РЕЧЕВОГО СИГНАЛА В УСЛОВИЯХ СЛОЖНОЙ ПОМЕХОВОЙ ОБСТАНОВКИ 2015
  • Титов Олег Николаевич
  • Афанасьев Андрей Алексеевич
  • Рыжков Александр Павлович
RU2580796C1
СПОСОБ ПОДАВЛЕНИЯ ШУМА В ИНФОРМАЦИОННОМ СИГНАЛЕ И УСТРОЙСТВО ДЛЯ ЕГО ОСУЩЕСТВЛЕНИЯ 2002
  • Столбов М.Б.
RU2206960C1

Иллюстрации к изобретению SU 1 781 701 A1

Реферат патента 1992 года Способ разделения речевых и нестационарных шумовых сигналов

Изобретение относится к измерительной технике и может быть использовано при создании устройств для анализа сигналов сложной формы. Цель: повышение помехоустойчивости разделения речевых и нестационарных шумовых сигналов. Сущность изобретения: способ состоит в усилении анализируемого сигнала, его низкочастотной фильтрации, определении значений числа нулевых переходов полученного сигнала с последующим сравнением их с пороговой величиной, по результатам которого идентифицируют речевые и нестационарные шумовые сигналы, причем после низкочастотной фильтрации сигнала в его выборке выделяют участки с наибольшей интенсивностью, для которых и определяют значения числа нулевых переходов. 2 ил.

Формула изобретения SU 1 781 701 A1

Изобретение относится к измерительной технике и может быть использовано при создании устройств для анализа сигналов сложной формы, применяемых в технике связи, акустике, в системах распознавания речевых и иных сигналов.

Известен способ распознавания речевых сигналов в телефонной линии по оценке наличия в них пауз характерной длительности. Недостатком такого способа является необходимость использования достаточно длительной выборки анализируемого сигнала не менее нескольких десятков секунд для выявления и определения распределения длительностей, встречающихся в нем пауз.

Наиболее близким к заявленному способу разделения сигналов на речевые и неречевые является известный способ классификации речевых сигналов, в котором предусматривается усиление анализируемого сигнала, фильтрация его через НЧ

. фильтр с частотой среза 3 кГц, ограничение по амплитуде и цифровое кодирование с последующим сравнением нулевых переходов в анализируемом сигнале с заданным значением, определенным для сигналов других типов. Для реализации способа создано устройство, содержащее последовательно соединенные усилитель, фильтр, ограничитель, АЦП с компараторами. Ограничитель описанного устройства выполнен на двух встречно включенных диодах.

Недостатком вышеописанного способа является его низкая помехоустойчивость по отношению к помехам типа белого шума.

Проведенные исследования показали, что разделение речевых сигналов и сигналов типа нестационарного шума с помощью описанного выше способа идет эффективно лишь в том случае, если отношение сигнал/шум для речевого сигнала не менее 10. Уже при отношении сигнал/шум менее 8

00

ч о

наблюдается существенное ухудшение вероятности правильной классификации.

Целью изобретения является повышение помехоустойчивости разделения речевых и нестационарных шумовых сигналов.

Для достижения поставленной цели в способе разделения речевых и нестационарных шумовых сигналов, заключающемся в усилении анализируемого сигнала, его низкочастотной фильтрации, определении значений чиЙ13 Щпейых переходов полученного сигнаггя с последующим сравнением их с пороговой величиной, по результатам которого идентифицируют речевые и нестационарные шумовые сигналы, после низкочастотной фильтрации анализируемого сигнала в его выборке выделяют участки с наибольшей интенсивностью, для которых определяют значение числа пулевых переходсп.

Значение числа переходов анализируемого сигнала через ноль, определенное только для его участков с наибольшей энергией в случае речевого сигнала, в меньшей степени зависит ог отношения сигнал/шум, чем значение числа переходов через ноль, определенное для всей выборки речевого сигнала.

8 то же время для нестационарных шумовых сигналов зна юния числа переходов через ноль как для всей выборки, так и для ее участков с наибольшей энергией близки друг к другу и мало зависят от отношения сигнал/шум. Таким образом, в предлагаемом способе отличие в значениях числа переходов разделяемых сигналов через ноль оказывается менее зависимым от отношения сигнал/шум, т.е. более помехоустойчивым, в чем и состоит полезность предлагаемого способа.

На фиг.1 изображена функциональная схема, реализующая предлагаемый способ разделения речевых и нестационарных шумовых сигналов; на фиг.2 - гистограммы значений чисел перехода речевых сигналов (пунктир) и нестационарных шумовых сигналов (сплошная линия) через ноль, определенных для всей выборки сигналов (а,б) и для наибольших элементов в выборках сигналов (в г) при различных отношениях сигнал/шум (а,в) - отношении сигнал/шум 10, (б,г) - сигнал/шум 5.

На фиг.1 использованы следующие обозначения: 1 - источник сигналов; 2 - усипитель; 3 - фильтр низких частот; 4 - выделитель элементов выборки сигнала; 5 - определитель числа переходов через ноль для элементов выборки сигналов; 6 - определитель энергии элементов выборки сигнала; 7 - блок запоминания значений числа

переходов через ноль для элементов выборки сигнала и их энергией; 8 - выделитель элементов в выборках сигнала, имеющих наибольшую энергию (интенсивность); 9 определитель средней частоты переходов через ноль для выделенных элементов выборки сигнала; 10 - блок сравнения; 11 - источник порогового значения.

По предлагаемому способу сигнал

0 после усиления и фильтрации делят на элементы, для каждого из которых определяют число переходов через ноль и энергию. Полученные данные запоминают для всех элементов, входящих в выборку анали5 зируемого сигнала, После чего определяют среднюю частоту перехода через ноль для элементов, имеющих наибольшую энергию

Л

(например, превышающую -гг от значения

0 максимальной энергии элемента в данной выборке). Полученное значение средней частоты перехода через ноль сравнивают с пороговым значением, па основании чего и производят разделение речевых и шумовых

5 нестационарных сигналов.

Функциональная схема на фиг.1, реализующая предлагаемый способ, включает в себя источник сигнала 1, усилитель 2, филыр 3, выделитель элементов выборки

0 сигнала 4, определитель числа переходов сигнала через ноль для элемента выборки сигнала 5. определитель энергии элемента выборки сигнала 6. Блок запоминания значений числа переходов через ноль и энергий

5 элементов, входящих в выборку сигнала 7, выделитель элементов с наибольшей энергией 8, определитель значения сродней частоты перехода через ноль для элементов с наибольшей энергией 9, схема сравнения

0 10, источник порогового значения 11.

Выполнение описанных выше операций в функциональной схеме, изображенной на фиг. 1, обеспечивается тем, что выход источника сигнала 1, соединен со входом усили5 теля 2, выход которого соединен со входом фильтра 3, выход которого соединен со входом выделителя элементов выборки сигнала 4, один из выходов которого соединен со входом определителя числа переходов че0 рез ноль для элемента выборки сигнала 5, выход которого соединен со входом блока запоминания, другой вход которого соединен с выходом определителя энергии элемента выборки сигнала 6, один вход

5 которого соединен со вторым выходом выделителя элементов выборки сигнала 4, а второй вход соединен с выходом фильтра 3, причем выход блока запоминания 7 сооди- пен со входом выделителя элементов с наи- большеи (интенсивностью) 8,

выход которого соединен с определителем средней частоты перехода через ноль для выделенных элементов выборки сигнала 9, выход которого соединен со входом схемы сравнения 10, другой вход которой соеди- нен с выходом источника порогового значения 11, а выход схемы сравнения 10 является выход всей схемы,

Практическая реализация узлов, входящих в функциональную схему, изображен- ную на фиг.1, может быть выполнена на серийно выпускаемых элементах.

Так усилитель 2 и фильтр низких частот 3, выполня отся на операционных усилителях по типовым схемам (например, на мик- росхемахтипа 140 IVD2A и 140 IVD4).

Выделитель элементов выборки сигнала 4 может быть реализован в соответствии со схемой сегментатора, описанной в авторском свидетельстве № 485565.

В простейшем случае в качестве выделителя элементов выборки сигнала 4 может использоваться ключевая схема, управляемая интегральным программируемым (например, 580 ВИ 53) или непрог- раммируемым (например, 1006 ВИ1) таймером с периодом порядка 10 мс.

Определитель числа переходов через ноль для элементов выборки сигналов 5 может быть реализован на интегральных ком- параторе и счетчике (например, на микросхемах 597САЗА и 561 НЕЮ). Определитель энергии элементов выборки сигнала 6 в простейшем случае может быть образован последовательно включенными двухполупе- риодным измерительным выпрямителем, интегратором, схемой выборки хранения и аналого-цифровым преобразователем, управляемым узлом 4. Эти компоненты могут строиться на микросхемах 140УД20, 544УД1А, 590КН12, 1100СК2Б. 1113ПВ1Аи логических схемах малой интеграции.

Дальнейшую обработку целесообразно вести средствами микропроцессорного контроллера, имеющего оперативную память достаточной емкости, выполняющей функции блока 7 запоминания значений числа переходов через ноль и энергии для элементов выборки сигнала.

Выделитель элементов с наибольшей энергией 8 реализуется программно. Он осуществляет операцию выбора наибольшего значения энергии (интенсивности) Ётах элемента из запомненных в блоке па- мяти и определяет номера тех элементов, значения энергии интенсивности которых

превышают величину -, где N - заранее заданная величина (например, 2).

В контроллере, выполняющем указанную операцию, может использоваться микропроцессорный комплект серии 580 с микросхемами памяти серии 537. Определитель средней частоты переходов через ноль для выделенных элементов выборки сигнала 9 выполняется с помощью того же контроллера.

Значения частот переходов через ноль для выделенных элементов складываются и полученная величина делится на число выделенных элементов.

Схема сравнения 10 реализуется программно средствами типового контроллера, выполняющего операцию вычитания двух чисел, занесенных в блок памяти.

В качестве источника порогового значения 11, используется блок памяти, в заданной ячейке которого записано значение пороговой величины, определенное на основе анализа обучающих выборок разделяемых классов сигналов.

В целом функции, выполняемые совокупностью узлов 7, 8, 9, 10, 11, могут быть полностью реализованы с помощью малых универсальных ЭВМ типа Электроника- 60М, СМ1425, ЕС1841 и т.п.

Для анализа причин, обуславливающих недостаточную помехоустойчивость существующих способов разделения речевых и нестационарных шумовых сигналов по частоте перехода через ноль, рассмотрим особенности временных структур разделяемых сигналов.

Основной особенностью структуры речевых сигналов являются микропаузы.

Наличие в речи микропауз обусловлено самой природой процесса формирования звуков речи. Так наличие прерываний во взрывных, фрикативных, дрожащих звуках создает микропаузы даже в намеренно непрерывной речи. К таким микропаузам при- бавляются паузы между словами, интонационные паузы и т.п.

В целом вероятностное распределение пауз в непрерывной речи описывается распределением Вайбулла.

Таким образом, в выборке из речевого сигнала длительностью в 0,5 с суммарное время пауз составит около 250 мс.

Частота перехода через ноль у чистого речевого сигнала в основном обусловлена частотой перехода на участках гласных звуков, которые занимают основное время в течении звучания речи. Характерные значения частоты перехода через ноль для гласных звуков гораздо ниже тактовых для нестационарного шума, что и позволяет по этому признаку разделять эти два класса сигналов.

В то же время появление шумовой помехи в речевом сигнале на участках гласных мало влияет на частоту перехода через ноль.

Однако на участках пауз шум обеспечивает резкое возрастание частоты переходов через ноль, что влияет на общее значение этого параметра, определенного по всей выборке анализируемого речевого сигнала.

В то же время у шумового нестационарного сигнала паузы практически отсутствуют и, следовательно, наличие шумовой помехи у сигналов такого класса должно мало влиять на среднее значение частоты перехода через, ноль.

Для проверки эффективности предлагаемого способа разделения речевых и неста- ционарных шумовых сигналов был разработан и испытан макет, реализующий функциональную схему, изображенную на фиг.1.

В качестве источника сигнала использовались: магнитофон Электроника-004 (для речевых сигналов) и генераторы Г2-57 SG 201 и ГЗ-101 (для шумовых сигналов).

Формирование смеси сигнала с шумом осуществлялось сумматорами на операционных усилителях типа 140УД7.

В качестве речевого сигнала использовалась повествовательная речь на различных языках. Длительность записей составляла не менее 3-х мин каждая. Всего было использовано при экспериментах 25 записей различных дикторов. При построении гистограмм использовалось не менее 100 выборок каждого сигнала, Длительность анализируемой выборки сигнала составляла менее 0,5 с. В качестве фильтра использовался активный PC фильтра Бессе- пя низких частот 10 порядка с частотой среза 4 кГц.

Фильтр реализован на операционных усилителях 140УД7.

Выделение элементов выборТки сигнала осуществлялось с помощью тактового генератора (Г5-60), Длительность элемента составляла 10 мс. Всего в выборке использовалось 32 элемента.

Определитель энергии элемента сигнала реализовывался с помощью интегратора, собранного на операционном усилителе типа 544УД1А со схемой сброса на ключах 590КН5, срабатывающей от импульсов тактового генератора после задержки необходимой для записи сигнала интегратора схемой выборки-хранения 1100 СК2. Преобразование сигнала с выхода этой схемы в код производилось с помощью АЦП типа 1113ПВ1А. Определитель частоты перехода через ноль для элемента сигнала реализовывался с помощью микросхем типа 597САЗ и 133ИЕ5.

Код числа переходов через ноль и коде выхода АЦП в конце каждого элемента считывались через интерфейс ЭВМ по команде от тактового генератора.

Блоки 7,8,9,10,11, а также алгоритмы управления экспериментом были реализованы средствами ЭВМ Электроника-60,

0 программы управления считыванием данных, их накопления и предоставления результатов разрабатывались и отлаживались средствами операционной системы РАФОС на комплекс Электроника-В, дополнеи5 ном накопителем на гибких магнитных дисках ГМД-70.

На фиг.2 представлены гистограммы, характеризующие эффективность существующего и предлагаемого способов разделе0 ния речевых и шумовых нестационарных сигналов.

На фиг.2(а,б), представлены числа переходов через ноль, определенных по существующему способу, т.е. для всей выборки

5 сигналов для речевых (пунктирная линия) и шумовых нестационарных сигналов (сплошная линия) при отсутствии помех (фиг.2а - отношение сигнал/шум больше 10) и при их наличии (фиг.2б - отношение сигнал/шум

0 равно 5).

Сопоставление гистограмм, изображенных на фиг.2(а и б), показывает, что в то время как для чистых сигналов оба класса по частоте переходов через ноль, определен5 ной по существующему способу, хорошо разделяются, появление даже незначительной помехи резко ухудшает разделение сигналов. Так| для отношения сигнал/шум, равного 5, вероятность ошибки разделения

0 составляет 35%.

Характерно, что появление шумовой помехи мало влияет на характер гистограммы для нестационарного шума и ухудшение разделения сигналов идет за счет деформа5 ции шумовой помехой гистограмма для речевого сигнала.

Рассмотрение аналогичных гистограмм, приведенных на фиг.2в, 2г для значений частоты переходов через ноль,

0 определенных по предлагаемому способу, показывает и значительно большую помехоустойчивость.

Из фиг.2(в, г) следует, что процесс разделения по предлагаемому способу для

5 шумовых и речевых нестационарных сигналов при соотношении сигнал/шум, равном 5, происходит с вероятностью ошибки не хуже 6%.

Таким образом, экспериментально под- тверждено, что предлагаемый способ обеспечивает увеличение помехоустойчивости разделения речевых и шумовых нестационарных сигналов не менее, чем в 5 раз по сравнению с существующим способом, что и определяет его полезность.

Формула изобретения Способ разделения речевых и нестационарных шумовых сигналов, заключающийся в усилении анализируемого сигнала, его низкочастотной фильтрации, определении значений числа нулевых переходов получен0

ного сигнала с последующим сравнением их с пороговой величиной, по результатам которого идентифицируют речевые и нестационарные шумовые сигналы, отличающийся тем, что, с целью повышения помехоустойчивости разделения, после низкочастотной фильтрации анализируемого сигнала в его выборке определяют участки с наибольшей интенсивностью, дли которых определяют значения числа нулевых переходов.

Фие.1

Документы, цитированные в отчете о поиске Патент 1992 года SU1781701A1

Патент США № 4027102, кл
Очаг для массовой варки пищи, выпечки хлеба и кипячения воды 1921
  • Богач Б.И.
SU4A1
Патент ФРГ № 3236000, кл
Печь-кухня, могущая работать, как самостоятельно, так и в комбинации с разного рода нагревательными приборами 1921
  • Богач В.И.
SU10A1

SU 1 781 701 A1

Авторы

Молчанов Александр Павлович

Бабкина Людмила Назаровна

Денисон Борис Георгиевич

Даты

1992-12-15Публикация

1990-09-27Подача