Показать метаданные Скрыть метаданные

(19)

(11)

2 807 194

(13)

(51)

МПК

H04Q1/46(2006-01-01)

(21) (22)

Заявка

2022129413, 2022-11-14

(24)

Дата начала отсчета патента

2022-11-14

(22)

дата подачи заявки

2022-11-14

(45)

опубликовано

2023-11-10

(72)

авторы

Золотарев Владимир АлексеевичКарманов Данил Сергеевич

(73)

патентообладатели

Акционерное Общество

(56)

Документы, цитированные в отчете о поиске

Л.РРабинер, Р.ВШафер, "Цифровая обработка речевых сигналов", Москва, "Радио и связь", 1981, сUS 7529660 B2, 05.05.2009US 9064498 B2, 23.06.2015.

Способ выделения речи путем анализа значений амплитуд помехи и сигнала в двухканальной системе обработки речевого сигнала Российский патент 2023 года по МПК H04Q1/46

Описание патента на изобретение RU2807194C1

Изобретение относится к области техники передачи и трансляции речевой информации и может найти применение в устройствах связи и в устройствах громкоговорящей связи.

Известно устройство для выделения акустических сигналов в каналах связи, описанное в патенте RU 2171549 H04Q 1/46. Изобретение относится к электросвязи, в частности к автоматическим средствам приема сигналов тональной сигнализации в системах многоканальной связи, и может использоваться, например, для обнаружения акустических сигналов (АС) в телефонных каналах. Функционирование основано на вычислении ряда решающих статистик, которые являются отличительными признаками при распознавании информационного АС от канальных шумов и паразитных речевых сигналов. В качестве решающих статистик используются оценка мощности сигнала в информационной полосе частот, распределение энергии входного сигнала по частотному диапазону и величина неравномерности, огибающей отфильтрованного в полосовом фильтре входного сигнала. Для принятия окончательного решения о присутствии в канале связи АС используется вторичная обработка, которая основана на применении мажоритарного правила для последовательной серии первичных решений.

Недостатком известного устройства является его невысокая эффективность при решении задачи выделения речи из смеси речевого сигнала и акустических помех.

Известно устройство для выделения тональных сигналов в каналах связи по патенту RU 2214051 H04B 3/46, H04Q 1/457, H04M 1/50. Изобретение относится к области электросвязи, в частности к автоматическим средствам приема сигналов канальной сигнализации в системах многоканальной связи, и может использоваться для обнаружения акустических сигналов в телефонных каналах.

Известное техническое решение обладает недостаточно высокой эффективностью при решении задачи выделения речи из смеси речевого сигнала и акустических помех.

Известен способ разделения речи и пауз путем сравнительного анализа значений мощностей помехи и смеси сигнала и помехи, описанный в патенте RU 2668407 H04Q 1/46, у которого недостаточно высокая эффективность выделения речи из смеси речевого сигнала и акустических помех.

Наиболее близким аналогом по технической сущности к предлагаемому является способ разделения речи и пауз, описанный в книге «Цифровая обработка речевых сигналов. // Л.Р. Рабинер, Р.В. Шафер. Перевод с английского под редакцией М.В. Назарова и Ю.Н. Прохорова. Москва, «Радио и связь», 1981», стр. 123 - 126, принятый за прототип.

Способ-прототип заключается в следующем.

Сигнал, поступающий в систему, дискретизируют в течение интервала времени, установленного для его анализа, и заносят в память для последующей обработки. Обрабатываемый сигнал состоит из интервала, который содержит только помеху, длительность данного интервала составляет около 100 мс, и интервала, который содержит аддитивную смесь речевого сигнала и помехи (в дальнейшем - смесь сигнала и помехи).

В качестве основных параметров используется число переходов через ноль в течение 10 мс и функция среднего значения, вычисленная с использованием окна длительностью 10 мс. По этим отсчетам вычисляются средние значения и дисперсии взвешенной суммы абсолютных значений амплитуд отсчетов и среднего числа переходов через ноль (статистические характеристики акустической помехи).

С учетом значений этих характеристик и максимального среднего значения вычисляются пороги для среднего числа переходов через ноль (СЧПН) и энергии сигнала. Определяется фрагмент колебаний, на котором траектория среднего значения энергии сигнала (СЗЭС) превышает верхний порог. Предполагается, что начало и конец слова лежат вне этого фрагмента.

Затем, двигаясь в обратном направлении по оси времени от момента, где среднее значение энергии сигнала впервые превысило порог, определяют момент, в котором СЗЭС впервые оказалось меньше нижнего порога (точка N₁). Этот момент выбирается в качестве предполагаемого начала. Таким же образом определяется и предполагаемое окончание слова (точка N₂) (см. «Цифровая обработка речевых сигналов. // Л.Р. Рабинер, Р.В. Шафер. Перевод с английского под редакцией М.В. Назарова и Ю.Н. Прохорова. Москва, «Радио и связь», 1981», стр. 125, рис. 4.16).

Следующий шаг состоит в перемещении влево от точки N₁ (вправо от точки N₂) и сравнении числа переходов через ноль с порогом, вычисленным по данным начального участка. Если число переходов через ноль превышает порог 3 или более раз, начало слова переносится туда, где кривая числа переходов через ноль впервые превысила порог. В противном случае точка N₁ считается началом слова. Аналогичный процесс осуществляется в отношении точки N₂.

Недостатком способа-прототипа является невозможность решения задачи выделения речевого сигнала из акустических помех.

Задача предлагаемого способа - обеспечение выделения речевого сигнала из акустических помех.

Для решения поставленной задачи в способе выделения речи путем анализа значений амплитуд помехи и сигнала в двухканальной системе обработки речевого сигнала, заключающемся в том, что на всем интервале анализа, состоящего из интервала, который не содержит речевой сигнал, и интервала, который содержит смесь сигнала и помехи, сигнал, поступающий в систему, дискретизируют, согласно изобретению, обработку акустической помехи или смеси помехи и речевого сигнала осуществляют в двух каналах: первом - основном и втором - дополнительном; предварительно в обоих каналах в условиях отсутствия помехи берут отсчеты речевого сигнала, рассчитывают средние значения амплитуд сигнала и значение коэффициента изменения амплитуды речевого сигнала во втором канале относительно первого канала; в интервале, который не содержит речевой сигнал, берут отсчеты помехи в каждом канале, рассчитывают средние значения амплитуд помехи и рассчитывают коэффициент изменения амплитуды помехи во втором канале относительно первого канала; после появления речевого сигнала измеряют амплитуды смеси помехи и сигнала в каждом канале, и рассчитывают значение амплитуды сигнала путем решения системы двух линейных уравнений, в которых неизвестными являются амплитуды речевого сигнала и акустической помехи; в паузах между передачами речевых сообщений берут отсчеты помехи в каждом канале, рассчитывают средние значения амплитуд помехи и рассчитывают коэффициент изменения амплитуды помехи во втором канале относительно первого канала, после появления речевого сигнала процесс выделения речи из акустической помехи осуществляют с использованием уточненного значения коэффициента изменения амплитуды помехи во втором канале относительно первого канала; при снижении качества принимаемой речевой информации абонент передает соответствующее сообщение абоненту, передающему речевую информацию, в этом случае абонент, передающий речевую информацию, прекращает на небольшой временной интервал передачу, в этом интервале рассчитывают коэффициент изменения амплитуды помехи во втором канале относительно первого канала, после чего возобновляют обмен речевыми сообщениями и процесс выделения речи из акустической помехи, при этом используют уточненное значение коэффициента изменения амплитуды помехи во втором канале относительно первого канала.

Предлагаемый способ заключается в следующем.

На всем интервале анализа, состоящего из интервала, который не содержит речевой сигнал, и интервала, который содержит смесь речевого сигнала и акустической помехи (шума) (далее по тексту - сигнал), обработку осуществляют в двух каналах, основном и дополнительном.

Предварительно в каждом канале в условиях отсутствия акустических помех берут отсчеты речевого сигнала, рассчитывают средние значения амплитуд сигнала в каналах и значение коэффициента изменения амплитуды речевого сигнала во втором канале относительно первого канала.

Значение коэффициента изменения амплитуды речевого сигнала во втором канале относительно первого канала рассчитывают по формуле

где: U_с1i, U_с2i - i-ое значение амплитуды речевого сигнала, измеренное в основном и дополнительном каналах соответственно;

N - число отсчетов.

В интервале, который не содержит речевой сигнал, берут отсчеты помехи в каждом канале, рассчитывают средние значения амплитуд помехи и рассчитывают коэффициент изменения амплитуды помехи во втором канале относительно первого канала.

Значение коэффициента изменения амплитуды помехи во втором канале относительно первого канала рассчитывают по формуле

где: U_п1i, U_п2i - i-ое значение амплитуды помехи, измеренное в основном и дополнительном каналах соответственно;

N - число отсчетов.

После появления речевого сигнала измеряют амплитуды смеси помехи и сигнала и рассчитывают значение амплитуды сигнала.

Определение факта появления речевого сигнала может осуществляться, например, за счет использования способа разделения речи и пауз по значениям дисперсий амплитуд спектральных составляющих, описание которого приведено в патенте RU 2723301 H04B 1/10.

Способ заключается в следующем.

На всем интервале анализа, состоящего из интервала, который содержит помеху или речевой сигнал, или смесь речевого сигнала и помехи, которые поступают в устройство - входной сигнал, сигнал разветвляют на две одинаковые составляющие. Одну из них фильтруют фильтром нижних частот (ФНЧ), вторую составляющую фильтруют полосовым фильтром. Сигналы, поступившие на выходы фильтров дискретизируют и заносят в память для последующей обработки. Формируют «скользящее окно», состоящее из интервалов одинаковой длительности. «Скользящее окно» сдвигают на некоторое, заранее определенное количество отсчетов. «Скользящее окно» формируют так, что оно включает в себя два интервала анализа, каждый из которых состоит из нескольких интервалов одинаковой длительности. Первое положение «скользящего окна» устанавливают так, что в первом интервале анализа присутствует только помеха. Осуществляют спектральный анализ входного сигнала для каждого интервала следующим образом. Каждый результат преобразования входного сигнала, который образуется после умножения входного сигнала на синус и косинус опорных частот, разветвляют на две одинаковые составляющие. Первую составляющую фильтруют ФНЧ, полоса которого согласована с полосой анализируемого сигнала. Одновременно вторую составляющую фильтруют полосовым фильтром, полоса пропускания которого выбирается так, что верхняя частота полосового фильтра соответствует верхней частоте анализируемого сигнала, нижнюю частоту полосового фильтра устанавливают равной некоторому заранее заданному значению. Выбор ФНЧ и полосового фильтра осуществляют с идентичными в максимальной степени фазо-частотными характеристиками и так, что амплитудно-частотная характеристика (АЧХ) полосового фильтра в области частот, близких к нулю, имеет максимально возможную крутизну; в области частот, начиная со значения, для которого разность значений АЧХ ФНЧ и полосового фильтра становится меньше некоторой заранее заданной величины, обеспечивают идентичность их АЧХ в максимальной степени. Сигналы, прошедшие ФНЧ и полосовой фильтр, вычитают один из другого. Результаты вычитания преобразуют в цифровой вид. По данным значениям, соответствующим синусной и косинусной составляющей одной частоты, определяют мгновенную спектральную плотность (МСП) для каждой опорной частоты и запоминают эти значения пропорциональные амплитуде сигналов. Находят среднее значение МСП. Определяют значение порога путем умножения найденного среднего значения МСП на коэффициент, значение которого устанавливают заранее. Полученные значения МСП сравнивают с порогом. По результатам сравнения принимают решение о наличии или об отсутствии сигнала с соответствующей частотой. Находят значения мощности каждого выделенного сигнала путем возведения в квадрат соответствующих значений МСП. Находят для каждой гармоники дисперсию значений мощностей для первого и второго интервалов анализа. Рассчитывают среднее значение дисперсий мощностей первого и второго интервалов. Усреднение осуществляют по числу гармоник. Определяют пороговое значение путем умножения среднего значения дисперсии значений мощностей первого интервала анализа, принадлежащего «скользящему окну», на коэффициент, значение которого определяют заранее. Находят значение разности средних значений дисперсий мощностей, рассчитанных для первого и второго интервалов анализа. Данное значение разности сравнивают с порогом. Считают, что во втором интервале анализа присутствует только помеха, если значение разности средних значений дисперсий мощностей не превышает порог. В противном случае считают, что во втором интервале анализа присутствует сигнал или смесь сигнала и помехи. Сдвигают «скользящее окно» на заданное значение интервалов. Описанную процедуру повторяют. Для последующих шагов пороговое значение для разности средних значений дисперсии значений мощностей интервалов анализа определяют с использованием среднего значения средних значений дисперсии мощностей интервалов анализа, которое рассчитывают, применяя принцип «первый пришел, первый ушел». Процесс продолжают до тех пор, пока не закончится время, отведенное для анализа входного сигнала.

Амплитуда смеси сигнала и помехи в основном канале может быть записана в виде

где: U_с1, U_п1 - значения амплитуд речевого сигнала и помехи в основном канале соответственно.

Амплитуда смеси сигнала и помехи в дополнительном канале может быть записана в виде

где: U_с2, U_п2 - значения амплитуд речевого сигнала и помехи в дополнительном канале соответственно.

С учетом формул (1), (2) выражение для амплитуды смеси сигнала и помехи в дополнительном канале может быть записано следующим образом

Выражения (3) и (5) являются системой двух линейных уравнений, где неизвестными являются U_с1 и U_п1, то есть

Решив систему линейных уравнений (6) относительно U_с1 получим

Рассчитывая значения амплитуд речевого сигнала по формуле (7) получают огибающую речевого сигнала в цифровой форме.

Темп взятия отсчетов определяют исходя из необходимой точности воспроизведения огибающей речевого сигнала. Значение частоты взятия отсчетов может быть установлено путем математического моделирования или экспериментальным путем.

В паузах между передачами речевых сообщений берут отсчеты помехи в каждом канале. Рассчитывают средние значения амплитуд помехи и рассчитывают коэффициент изменения амплитуды помехи во втором канале относительно первого канала по формуле (2).

После появления речевого сигнала процесс выделения речи из акустической помехи осуществляют с использованием уточненного значения коэффициента изменения амплитуды помехи в дополнительном канале относительно основного канала.

При снижении качества принимаемой речевой информации абонент передает соответствующее сообщение абоненту, передающему речевую информацию.

В этом случае абонент, передающий речевую информацию, прекращает на небольшой временной интервал передачу. В этом интервале рассчитывают коэффициент изменения амплитуды помехи во втором канале относительно первого канала. После чего возобновляют обмен речевыми сообщениями и процесс выделения речи из акустической помехи. При этом используют уточненное значение коэффициента изменения амплитуды помехи в дополнительном канале относительно основного канала.

Технический результат - обеспечение выделения речевого сигнала из акустических помех.

Структурная схема устройства, реализующего предлагаемый способ, приведена на фиг. 2, где обозначено:

1.1, 1.2 - первое и второе электроакустическое устройство (ЭАУ);

2.1, 2.2 - первый и второй полосовой фильтр (ПФ);

3.1, 3.2 - первый и второй усилитель низкой частоты (УНЧ);

4.1, 4.2 - первый и второй аналого-цифровые преобразователи (АЦП);

5 - вычислительное устройство (ВУ).

Устройство состоит из основного (первого) и дополнительного (второго) каналов. Основной канал содержит последовательно соединенные первый ЭАУ 1.1, первый ПФ 2.1, первый УНЧ 3.1, первый АЦП 4.1 и ВУ 5, выход которого является выходом устройства, вход первого ЭАУ 1.1 является первым входом устройства. Дополнительный канал содержит последовательно соединенные второй ЭАУ 1.2, второй ПФ 2.2, второй УНЧ 3.2 и второй АЦП 4.2, выход которого соединен со вторым входом ВУ 5, вход второго ЭАУ 1.2 является вторым входом устройства.

Устройство работает следующим образом.

В основном канале сигнал, который поступает с выхода первого ЭАУ 1.1, фильтруют первым ПФ 2.1, полоса которого согласована с полосой речевого сигнала. Затем профильтрованный сигнал усиливают в первом УНЧ 3.1 и преобразуют в цифровой вид в первом АЦП 4.1. Отсчеты с выхода первого АЦП 4.1 подают на первый вход ВУ 5.

В дополнительном канале сигнал обрабатывают так же как в основном канале. При этом отсчеты с выхода второго АЦП 4.2 подают на второй вход ВУ 5.

В ВУ 5 поступившие отсчеты помехи или смеси сигнала и помехи обрабатывают по алгоритму, приведенному выше.

В качестве первого 1.1 и второго 1.2 ЭАУ могут использоваться, например, микрофоны или ларингофоны.

Первый 3.1 и второй 3.2 УНЧ могут быть реализованы, например, на микросхеме OP467GS фирмы Analog Devices.

Первый 4.1 и второй 4.2 АЦП могут быть реализованы, например, на микросхеме ADS8422 фирмы Texas Instruments.

Вычислительное устройство 5 может быть выполнено в виде программируемой логической интегральной схемы (ПЛИС), и реализовано, например, на микросхеме XC2V3000-6FG676I фирмы Xilinx.

Таким образом, за счет использования описанного устройства, может быть реализован предлагаемый способ выделения речи путем анализа значений амплитуд помехи и сигнала в двухканальной системе обработки речевого сигнала.

Иллюстрации к изобретению RU 2 807 194 C1

Реферат патента 2023 года Способ выделения речи путем анализа значений амплитуд помехи и сигнала в двухканальной системе обработки речевого сигнала

Изобретение относится к средствам для обмена речевыми сообщениями. Технический результат заключается в обеспечении выделения речевого сигнала из акустических помех. Обработку сигнала осуществляют в двух каналах, основном (первом) и дополнительном (втором). Предварительно в обоих каналах в условиях отсутствия помехи берут отсчеты речевого сигнала, в интервале, который не содержит речевой сигнал, берут отсчеты помехи в каждом канале. Рассчитывают средние значения амплитуд сигнала и помехи и рассчитывают коэффициент изменения амплитуды помехи и изменения сигнала во втором канале относительно первого канала. После появления речевого сигнала измеряют амплитуды смеси помехи и сигнала и рассчитывают значение амплитуды сигнала с использованием значений амплитуд смеси помехи и сигнала в каждом канале, а также значения коэффициента изменения амплитуды речевого сигнала во втором канале относительно первого канала и значения коэффициента изменения амплитуды помехи во втором канале относительно первого канала. В паузах между передачами речевых сообщений, которые в том числе организуют при ухудшении качества принимаемой речевой информации, берут отсчеты помехи в каждом канале, уточняют значение коэффициента изменения амплитуды помехи во втором канале относительно первого канала. 2 ил.

Формула изобретения RU 2 807 194 C1

Способ выделения речи путем анализа значений амплитуд помехи и сигнала в двухканальной системе обработки речевого сигнала, заключающийся в том, что на всем интервале анализа, состоящего из интервала, который не содержит речевой сигнал, и интервала, который содержит смесь сигнала и помехи, сигнал, поступающий в систему, дискретизируют, отличающийся тем, что обработку акустической помехи или смеси помехи и речевого сигнала осуществляют в двух каналах: первом - основном и втором - дополнительном; предварительно в обоих каналах в условиях отсутствия помехи берут отсчеты речевого сигнала, рассчитывают средние значения амплитуд сигнала и значение коэффициента изменения амплитуды речевого сигнала во втором канале относительно первого канала; в интервале, который не содержит речевой сигнал, берут отсчеты помехи в каждом канале, рассчитывают средние значения амплитуд помехи и рассчитывают коэффициент изменения амплитуды помехи во втором канале относительно первого канала; после появления речевого сигнала измеряют амплитуды смеси помехи и сигнала в каждом канале, и рассчитывают значение амплитуды сигнала с использованием значений амплитуд смеси помехи и сигнала в каждом канале, а также значения коэффициента изменения амплитуды речевого сигнала во втором канале относительно первого канала и значения коэффициента изменения амплитуды помехи во втором канале относительно первого канала, в паузах между передачами речевых сообщений берут отсчеты помехи в каждом канале, рассчитывают средние значения амплитуд помехи и рассчитывают коэффициент изменения амплитуды помехи во втором канале относительно первого канала, после появления речевого сигнала процесс выделения речи из акустической помехи осуществляют с использованием уточненного значения коэффициента изменения амплитуды помехи во втором канале относительно первого канала; при снижении качества принимаемой речевой информации абонент передает соответствующее сообщение абоненту, передающему речевую информацию, в этом случае абонент, передающий речевую информацию, прекращает на небольшой временной интервал передачу, в этом интервале рассчитывают коэффициент изменения амплитуды помехи во втором канале относительно первого канала, после чего возобновляют обмен речевыми сообщениями и процесс выделения речи из акустической помехи, при этом используют уточненное значение коэффициента изменения амплитуды помехи во втором канале относительно первого канала.

Документы, цитированные в отчете о поиске Патент 2023 года RU2807194C1

Л.Р
Рабинер, Р.В
Шафер, "Цифровая обработка речевых сигналов", Москва, "Радио и связь", 1981, с
Устройство для разметки подлежащих сортированию и резанию лесных материалов	1922	Войтинский Н.С. Квятковский М.Ф.	SU123A1
УСТРОЙСТВО ДЛЯ ВЫДЕЛЕНИЯ АКУСТИЧЕСКИХ СИГНАЛОВ В КАНАЛАХ СВЯЗИ	2000	Каленков Б.О. Щевьев В.Н. Акимов Б.П. Павлов Д.Н.	RU2171549C1
УСТРОЙСТВО ДЛЯ ВЫДЕЛЕНИЯ ТОНАЛЬНЫХ СИГНАЛОВ В КАНАЛАХ СВЯЗИ	2001	Егоров А.И. Каленков Б.О. Щевьев В.Н.	RU2214051C2
Способ разделения речи и пауз путем сравнительного анализа значений мощностей помехи и смеси сигнала и помехи	2017	Белогуров Владимир Александрович Золотарев Владимир Алексеевич	RU2668407C1
Способ разделения речи и пауз по значениям дисперсий амплитуд спектральных составляющих	2019	Белогуров Владимир Александрович Золотарев Владимир Алексеевич	RU2723301C1
US 7529660 B2, 05.05.2009
US 9064498 B2, 23.06.2015.

RU 2 807 194 C1

Авторы

Золотарев Владимир Алексеевич

Карманов Данил Сергеевич

Даты

2023-11-10—Публикация

2022-11-14—Подача

название	год	авторы	номер документа
Способ разделения речи и пауз путем сравнительного анализа значений мощностей помехи и смеси сигнала и помехи	2017	Белогуров Владимир Александрович Золотарев Владимир Алексеевич	RU2668407C1
Способ выделения речевого сигнала путем анализа значений параметров гармонических составляющих	2024	Золотарев Владимир Алексеевич	RU2829627C1
Способ разделения речи и пауз по значениям дисперсий амплитуд спектральных составляющих	2019	Белогуров Владимир Александрович Золотарев Владимир Алексеевич	RU2723301C1
Способ разделения речи и пауз путем анализа значений характеристик спектральных составляющих смеси сигнала и помехи	2023	Золотарев Владимир Алексеевич	RU2814115C1
Способ разделения речи и пауз путем анализа изменения значений частотных и временных параметров аддитивной смеси сигнала и помехи	2023	Золотарев Владимир Алексеевич Карманов Данил Сергеевич	RU2811741C1
Способ выделения речевого сигнала с использованием временного анализа спектра аддитивной смеси сигнала и акустических помех	2022	Белогуров Владимир Александрович Золотарев Владимир Алексеевич	RU2786547C1
СПОСОБ ВЫДЕЛЕНИЯ РЕЧЕВОГО СИГНАЛА В УСЛОВИЯХ НАЛИЧИЯ ПОМЕХ И УСТРОЙСТВО ДЛЯ ЕГО ОСУЩЕСТВЛЕНИЯ	2013	Белогуров Владимир Александрович Гриднев Анатолий Антонович Золотарев Владимир Алексеевич	RU2536343C2
Способ разделения речи и речеподобного шума путем анализа значений энергии и фаз частотных составляющих сигнала и шума	2019	Белогуров Владимир Александрович Золотарев Владимир Алексеевич	RU2700189C1
Способ разделения речи и пауз путем анализа значений корреляционной функции помехи и смеси сигнала и помехи	2018	Белогуров Владимир Александрович Золотарёв Владимир Алексеевич	RU2691603C1
Способ разделения речи и пауз путем анализа значений фаз частотных составляющих шума и сигнала	2018	Белогуров Владимир Александрович Золотарев Владимир Алексеевич	RU2680735C1