УСТРОЙСТВО ГОЛОСОВОЙ СВЯЗИ, СПОСОБ ГОЛОСОВОЙ СВЯЗИ И ПРОГРАММА Российский патент 2021 года по МПК G10L21/208 G10K11/178 

Описание патента на изобретение RU2744518C1

ОБЛАСТЬ ТЕХНИКИ

[0001] Настоящее изобретение относится к методике эхоподавления для подавления эха, которое является звуком, который доносится из громкоговорителя до микрофона при вызове в режиме громкой связи.

УРОВЕНЬ ТЕХНИКИ

[0002] Устройство, которое подавляет эхо (акустическое эхо), которое является звуком, который доносится из громкоговорителя до микрофона при вызове в режиме громкой связи, таком как телевизионная конференция и голосовая конференция, именуется устройством эхоподавления. Фиг. 16 иллюстрирует конфигурацию устройства 800 голосовой связи, которое включает в себя устройство 805 эхоподавления предшествующего уровня техники и раскрывается в Патентной Литературе 1. Как проиллюстрировано на Фиг. 16 устройство 805 эхоподавления включает в себя блок 820 вычитания, блок 830 сложения, первый адаптивный фильтр 840 и второй адаптивный фильтр 850. Конфигурация, полученная путем добавления громкоговорителя 890, основного микрофона 892 и суб-микрофона 894 к устройству 800 эхоподавления, является устройством 800 голосовой связи. Устройство 805 эхоподавления соединено с основным микрофоном 892 и суб-микрофоном 894. Основной микрофон 892 расположен таким образом, чтобы захватывать голос говорящего субъекта 10 ближнего конца насколько это возможно и захватывать звук из громкоговорителя 890 как можно меньше. Суб-микрофон 894 расположен так, чтобы захватывать звук из громкоговорителя 890 насколько это возможно и захватывать голос говорящего субъекта 10 ближнего конца как можно меньшей. Основной микрофон 892 и суб-микрофон 894 соответственно реализованы посредством направленного микрофона, обращенного в направлении говорящего субъекта, и направленного микрофона, обращенного в направлении громкоговорителя. Устройство 805 эхоподавления подавляет эхо путем использования двух адаптивных фильтров, которые являются первым адаптивным фильтром 840 для обработки звукового захваченного сигнала, полученного суб-микрофоном 894, и вторым адаптивным фильтром 850 для обработки принятого речевого сигнала, который перед выводом через громкоговоритель (т.е. голосовой сигнал говорящего субъекта дальнего конца (не показано), переданный через сеть 900). Соответственно эхо, как, впрочем, и компоненты искажения звука громкоговорителя, могут быть подавлены, и может быть реализован вызов в режиме громкой связи с высокой эффективностью, даже если корпус устройства 800 голосовой связи имеет небольшие размеры.

ЛИТЕРАТУРА ПРЕДШЕСТВУЮЩЕГО УРОВНЯ ТЕХНИКИ

ПАТЕНТНАЯ ЛИТЕРАТУРА

[0003] Патентная Литература 1: Японская Выложенная Заявка на Патент № 2011-160429

СУЩНОСТЬ ИЗОБРЕТЕНИЯ

ПРОБЛЕМЫ, РЕШАЕМЫЕ ИЗОБРЕТЕНИЕМ

[0004] Однако, направленный микрофон, который используется в конфигурации устройства 800 голосовой связи дорог в сравнении с ненаправленным микрофоном. Кроме того, в корпусе устройства 800 голосовой связи требуется много звуковых отверстий для включения направленных микрофоном, что накладывает большое ограничение на исполнение.

[0005] Вследствие этого цель настоящего изобретения состоит в предоставлении методики голосовой связи для обеспечения возможности реализации превосходного эхоподавления даже при использовании ненаправленных микрофонов.

СРЕДСТВО ДЛЯ РЕШЕНИЯ ПРОБЛЕМ

[0006] Аспект настоящего изобретения включает в себя: громкоговоритель, который испускает принятый речевой сигнал, который является голосовым сигналом говорящего субъекта дальнего конца; первый микрофон, который захватывает акустический сигнал, который содержит голос говорящего субъекта, который является голосом, которым говорит говорящий субъект ближнего конца, и звук воспроизведения, который получается путем испускания принятого речевого сигнала, в качестве первого звукового захваченного сигнала; второй микрофон, который захватывает акустический сигнал, который содержит голос говорящего субъекта и звук воспроизведения, в качестве второго звукового захваченного сигнала; блок коррекции, который формирует скорректированный звуковой захваченный сигнал, который является сигналом, полученным путем коррекции разности амплитуд на основе разности между расстоянием d1 от громкоговорителя до первого микрофона и расстоянием d2 от громкоговорителя до второго микрофона (здесь d2≤d1), из любого из первого звукового захваченного сигнала и второго звукового захваченного сигнала; первый блок вычитания, который формирует первый звуковой захваченный сигнал с первым вычитанием, который является сигналом, полученным путем вычитания второго звукового захваченного сигнала из скорректированного звукового захваченного сигнала, или сигналом, полученным путем вычитания скорректированного звукового захваченного сигнала из первого звукового захваченного сигнала; адаптивный фильтр, который формирует второй звуковой захваченный сигнал с адаптивной фильтрацией (т.е. второй звуковой захваченный сигнал, в отношении которого выполнена адаптивная фильтрация) путем подавления эха, которое меняется по времени, от второго звукового захваченного сигнала и передаваемого речевого сигнала, который должен быть передан говорящему субъекту дальнего конца; и второй блок вычитания, который формирует сигнал, который получается путем вычитания второго звукового захваченного сигнала с адаптивной фильтрацией из первого звукового захваченного сигнала с первым вычитанием, в качестве передаваемого речевого сигнала.

ЭФФЕКТЫ ИЗОБРЕТЕНИЯ

[0007] Настоящее изобретение обеспечивает голосовую связь, которая реализует превосходное эхоподавление даже при использовании ненаправленных микрофонов.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

[0008] Фиг. 1 является структурной схемой, иллюстрирующей пример конфигурации устройства 100 голосовой связи.

Фиг. 2 является блок-схемой, иллюстрирующей пример работы устройства 100 голосовой связи.

Фиг. 3A является схемой, иллюстрирующей пример позиционного отношения между громкоговорителем и микрофонами.

Фиг. 3B является схемой, иллюстрирующей пример позиционного отношения между громкоговорителем и микрофонами.

Фиг. 3C является схемой, иллюстрирующей пример позиционного отношения между громкоговорителем и микрофонами.

Фиг. 3D является схемой, иллюстрирующей пример позиционного отношения между громкоговорителем и микрофонами.

Фиг. 4 является структурной схемой, иллюстрирующей пример конфигурации устройства 200 голосовой связи.

Фиг. 5 является блок-схемой, иллюстрирующей пример работы устройства 200 голосовой связи.

Фиг. 6 является структурной схемой, иллюстрирующей пример конфигурации устройства 300 голосовой связи.

Фиг. 7 является блок-схемой, иллюстрирующей пример работы устройства 300 голосовой связи.

Фиг. 8 является структурной схемой, иллюстрирующей пример конфигурации устройства 400 голосовой связи.

Фиг. 9 является блок-схемой, иллюстрирующей пример работы устройства 400 голосовой связи.

Фиг. 10 является структурной схемой, иллюстрирующей пример конфигурации устройства 500 голосовой связи.

Фиг. 11 является блок-схемой, иллюстрирующей пример работы устройства 500 голосовой связи.

Фиг. 12 является структурной схемой, иллюстрирующей пример конфигурации устройства 600 голосовой связи.

Фиг. 13 является блок-схемой, иллюстрирующей пример работы устройства 600 голосовой связи.

Фиг. 14 является структурной схемой, иллюстрирующей пример конфигурации устройства 601 голосовой связи.

Фиг. 15 является блок-схемой, иллюстрирующей пример работы устройства 601 голосовой связи.

Фиг. 16 является структурной схемой, иллюстрирующей пример конфигурации устройства 800 голосовой связи.

ПОДРОБНОЕ ОПИСАНИЕ ВАРИАНТОВ ОСУЩЕСТВЛЕНИЯ

[0009] Варианты осуществления в соответствии с настоящим изобретением подробно описаны ниже. Компонентам, обладающим взаимно одинаковыми функциями, даны одинаковые цифровые обозначения и их дублированное описание опущено.

[0010] <Первый вариант осуществления>

Устройство 100 голосовой связи описывается ниже при обращении к Фиг. 1 и Фиг. 2. Фиг. 1 является структурной схемой, иллюстрирующей конфигурацию устройства 100 голосовой связи. Фиг. 2 является блок-схемой, иллюстрирующей работу устройства 100 голосовой связи. Как проиллюстрировано на Фиг. 1 устройство 100 голосовой связи включает в себя громкоговоритель, первый микрофон 104, второй микрофон 106, блок 110 умножения, первый блок 120 вычитания, второй блок 130 вычитания и адаптивный фильтр 140.

[0011] Громкоговоритель 102 испускает голосовой сигнал (далее упоминается как принятый речевой сигнал) говорящего субъекта дальнего конца (не показано), который передается через сеть 900. Говорящий субъект 10 ближнего конца произвольно издает звуки. Голос, которым говорит говорящий субъект 10 ближнего конца, упоминается как голос говорящего субъекта.

[0012] Первый микрофон 104 расположен в позиции более удаленной от громкоговорителя 102, чем второй микрофон 106. Т.е. второй микрофон 106 расположен в позиции ближе к громкоговорителю 102, чем первый микрофон 104. Первый микрофон 104 и второй микрофон 106 могут быть ненаправленными микрофонами. Громкоговоритель 102, первый микрофон 104 второй микрофон 106 смонтированы в корпусе устройства 100 голосовой связи. Например, расстояние между громкоговорителем 102 и первым микрофоном 104 может составлять приблизительно 30мм, расстояние меду громкоговорителем 102 и вторым микрофоном 106 может составлять приблизительно 10мм, и размер корпуса устройства 100 голосовой связи может быть относительно небольшим, таким как приблизительно 80мм × 40мм.

[0013] Устройство 100 голосовой связи выводит передаваемый речевой сигнал, который должен быть передан говорящему субъекту дальнего конца. Передаваемый речевой сигнал передается говорящему субъекту дальнего конца через сеть 900.

[0014] Работа устройства 100 голосовой связи описывается ниже при обращении к Фиг. 2. Блок 110 умножения формирует сигнал путем умножения звукового захваченного сигнала, который захвачен вторым микрофоном 106 (упоминается ниже как второй звуковой захваченный сигнал), на предварительно определенный фиксированный коэффициент (упоминается ниже как усиленный второй звуковой захваченный сигнал) (S110). Второй звуковой захваченный сигнал является сигналом, полученным путем захвата голоса говорящего субъекта и звука воспроизведения, который получается путем испускания принятого речевого сигнала, например. Способ для определения фиксированного коэффициента описывается позже.

[0015] Первый блок 120 вычитания формирует сигнал путем вычитания усиленного второго звукового захваченного сигнала из звукового захваченного сигнала, который захватывается первым микрофоном 104 (упоминается ниже как первый звуковой захваченный сигнал) (упоминается ниже как первый звуковой захваченный сигнал с первым вычитанием) (S120). Первый звуковой захваченный сигнал также является сигналом, полученным путем захвата голоса говорящего субъекта, звука воспроизведения и аналогичного, как в случае со вторым звуковым захваченным сигналом. Посредством этапа S120 подавляются компоненты эха, которые содержатся в первом звуковом захваченном сигнале, и получается сигнал, содержащий меньше компонентов эха (т.е. первый звуковой захваченный сигнал с первым вычитанием).

[0016] Адаптивный фильтр 140 формирует второй звуковой захваченный сигнал с адаптивной фильтрацией путем подавления эха, которое меняется по времени, от второго звукового захваченного сигнала и передаваемого речевого сигнала (S140). Другими словами, адаптивный фильтр 140 формирует второй звуковой захваченный сигнал с адаптивной фильтрацией, который получается путем подавления эха от передаваемого речевого сигнала, путем использования второго звукового захваченного сигнала в качестве ввода. Компоненты эха содержат компоненты звука воспроизведения, оставшиеся из-за влияний изменения характеристик микрофона, характеристик корпуса устройства 100 голосовой связи, характеристик эха у помещения, в котором используется устройство голосовой связи, и аналогичного. Т.е. адаптивный фильтр 140 используется для подавления эха, которое вызывается влияниями характеристик эха помещения и аналогичного, которые не могут быть учтены заранее. Для обработки изменения эха по времени, последовательно обновляется набор коэффициентов фильтра в адаптивном фильтре 140. Способ для обновления коэффициента фильтра (адаптивный алгоритм) описывается позже.

[0017] Чтобы также подавить компоненты искажения, которые формируются в громкоговорителе 102, обработка этапа S140 исполняется путем использования второго звукового захваченного сигнала, полученного путем захвата звука воспроизведения, содержащего искажение, посредством второго микрофона 106, расположенного ближе к громкоговорителю 102.

[0018] Второй блок 130 вычитания формирует сигнал в качестве передаваемого речевого сигнала путем вычитания второго звукового захваченного сигнала с адаптивной фильтрацией из первого звукового захваченного сигнала с первым вычитанием (S130).

[0019] [Фиксированный коэффициент]

Теперь описывается фиксированный коэффициент. Амплитуда голосового сигнала, который однородно испускается в свободное пространство, уменьшается обратно пропорционально расстоянию. Когда расстояние от громкоговорителя 102 до второго микрофона 106 обозначается как d2, а расстояние от громкоговорителя 102 до первого микрофона 104 обозначается как d1 (где d2≤d1), то следующее отношение устанавливается между амплитудой P1 звука, который наблюдается на первом микрофоне 104, и амплитудой P2 звука, который наблюдается на втором микрофоне 106.

[0020]

…(1)

[0021] С помощью данного отношения оценивается звук, который непосредственно достигает первого микрофона 104 от громкоговорителя 102, и выполняется вычитание. В частности, значение, вычисленное на основе расположения микрофонов, т.е. отношение d2/d1 между расстоянием d2 от громкоговорителя 102 до второго микрофона 106 и расстоянием d1 от громкоговорителя 102 до первого микрофона 104, устанавливается в фиксированный коэффициент, и сигнал, полученный путем умножения второго звукового захваченного сигнала на фиксированный коэффициент d1/d1 (усиленный второй звуковой захваченный сигнал), вычитается из первого звукового захваченного сигнала.

[0022] Здесь ожидается, что второй звуковой захваченный сигнал, который захватывается микрофоном 106, содержит звук воспроизведения от громкоговорителя 102 в качестве основного компонента.

[0023] Здесь, вместо просто использования отношения d2/d1 между двумя расстояниями, значение, при котором эхо, выводимое из первого блока 120 вычитания, становится минимальным, может быть получено экспериментально и значение может быть использовано в качестве фиксированного коэффициента.

[0024] [Позиционное отношение между громкоговорителем и двумя микрофонами]

В вышеприведенном описании только требуется, чтобы второй микрофон 106 был позиционирован ближе к громкоговорителю 102, чем первый микрофон 104. Фиг. 3A, Фиг. 3B, Фиг. 3C и Фиг. 3D иллюстрируют примеры позиционного отношения между громкоговорителем и микрофонами. Фиг. 3A иллюстрирует позиционное отношение, при котором микрофоны позиционированы только по одной стороне громкоговорителя, но громкоговоритель может быть позиционирован между двумя микрофонами, как проиллюстрировано на Фиг. 3B. Кроме того, громкоговоритель может быть расположен по существу на равных расстояниях от двух микрофонов, как проиллюстрировано на Фиг. 3C. Кроме того, как проиллюстрировано на Фиг. 3D, может быть использовано неравное расположение в горизонтальном направлении (на соответствующем чертеже).

[0025] [Адаптивный алгоритм]

Адаптивный алгоритм для последовательного обновления коэффициента фильтра используется в адаптивном фильтре. В качестве типичных адаптивных алгоритмов присутствуют алгоритм нормализованного метода наименьших квадратов (NLMS), алгоритм метода наименьших квадратов (LMS) и аналогичное. Коэффициент фильтра обновляется путем использования принятого речевого сигнала x(t) от говорящего субъекта дальнего конца и передаваемого речевого сигнала e(t) к говорящему субъекту дальнего конца, например, Алгоритм NLMS и алгоритм LMS просто описаны ниже (см. Патентную Литературу 1).

[0026] (Алгоритм NLMS)

Алгоритм NLMS является алгоритмом для обновления коэффициента фильтра путем использования только передаваемого речевого сигнала e(t) одного самого последнего наблюдаемого образца и отличается небольшим объемом вычислений. Формула для обновления коэффициента выражается следующими двумя формулами.

[0027]

[0028] Где H1(t) и Hm(t) (m=2, …, M; M является целым числом, которое составляет 2 или больше и обозначает количество микрофонов) обозначают векторы коэффициента фильтра по отношению к принятому речевому сигналу x(t) в момент времени t и выражаются как Hm(t)=(hm(t,0), …, hm(t, L-1))T (m=1, …, M), в котором L обозначает количество звеньев. a1 и am (m=2, …, M) обозначает предварительно установленные размеры шага алгоритма NLMS и удовлетворяют 0<a1<2 и 0<am<2. Кроме того, X(t) обозначает вектор принятого речевого сигнала x(t) для L образцов в момент времени t и выражается как X(t)=(x(t-0), …, x(t-L+1))T. Y(t) обозначает вектор принятого звукового сигнала y(t) для L образцов в момент времени t и выражается как Ym(t) = (ym(t-0), …, ym(t-L+1))T (принятый звуковой сигнал ym(t) является голосовым сигналом, захваченным микрофоном m).

[0029] (Алгоритм LMS)

Алгоритм LMS также является алгоритмом для обновления коэффициента фильтра путем использования только передаваемого речевого сигнала e(t) одного самого последнего наблюдаемого образца и отличается небольшим объемом вычислений, как и в случае с алгоритмом NLMS. Формула обновления алгоритма LMS может быть выражена следующими двумя формулами.

[0030]

[0031] Здесь b1 и bm (m=2, …, M) обозначают предварительно установленные размеры шага алгоритма LMS.

[0032] Если обучение адаптивного фильтра для обновления коэффициента фильтра выполняется в состоянии двойного разговора, в котором голос говорящего субъекта ближнего конца (голос говорящего субъекта) звучит в то же самое время, когда голосовой сигнал говорящего субъекта дальнего конца (принятый речевой сигнал) выводится из громкоговорителя, то коэффициент фильтра может быть обновлен так, чтобы подавлять голос говорящего субъекта ближнего конца (голос говорящего субъекта). Для того чтобы предотвратить это, фокусируются на том, чтобы голосовой сигнал говорящего субъекта дальнего конца (принятый речевой сигнал), который выводится из громкоговорителя, ослаблялся в выходном сигнале второго блока 130 вычитания (передаваемый речевой сигнал). Мощность выходного сигнала второго микрофона 106 (второго звукового захваченного сигнала) сравнивается с мощностью выходного сигнала второго блока 130 вычитания (передаваемый речевой сигнал). Когда мощность выходного сигнала второго блока 130 вычитания (передаваемый речевой сигнал) достаточно меньше мощности выходного сигнала второго микрофона 106 (второго звукового захваченного сигнала), адаптивный фильтр обучается (т.е. коэффициент фильтра у адаптивного фильтра обнуляется). Является достаточно небольшим означает что составляет приблизительно от 0.5 до 0.1 величины, например. Т.е. это означает, что отношение Pow1/Pow2 между мощностью Pow1 у выходного сигнала второго блока 130 вычитания (передаваемого речевого сигнала) и мощностью Pow2 у выходного сигнала второго микрофона 106 (второй звуковой захваченный сигнал) равно или меньше порогового значения или меньше порогового значения, когда пороговое значение установлено в предварительно определенное действительное число (определенное действительное число от 0.1 до 0.5 включительно, например). Здесь состояние, при котором отношение Pow1/Pow2 равно или меньше порогового значения или меньше порогового значения означает состояние, при котором отношение Pow1/Pow2 находится в рамках предварительно определенного диапазона, представляющего собой то, что отношение Pow1/Pow2 является небольшим.

[0033] В качестве альтернативы может быть использован адаптивный алгоритм в Ссылочной Патентной Литературе 1 (упоминаемый ниже как модифицированный алгоритм аффинной проекции).

(Ссылочная Патентная Литература 1: Японская Выложенная Заявка на Патент № 2006-135886)

[0034] Предполагается, что устройство эхоподавления имеет смоделированный путь эха с характеристикой моделирования h’*(k) (k обозначает количество шагов, представляющих собой дискретное время предварительно определенных интервалов) вектора h* (** обозначает вектор далее) с длиной L и с импульсной характеристикой пути эха между громкоговорителем и микрофоном в качестве элемента. Здесь характеристика моделирования h’*(k) соответствует коэффициенту фильтра. Формула для обновления характеристики моделирования h’*(k) выражается следующей формулой.

[0035]

[0036] Здесь x(k) обозначает принятый речевой сигнал от говорящего субъекта дальнего конца, x*(k)=(x(k), x(k-1), …, x(k-L+1))T, X*(k)=(x*(k), x*(k-1), …, x*(k-p+1))T, µ(k) обозначает фиксированный или переменный по времени коэффициент регулировки обновления (0<µ(k)<2), e(k) обозначает передаваемый речевой сигнал к говорящему субъекту дальнего конца и e*(k) обозначает вектор сигнала ошибки, выраженный следующей формулой.

[0037]

[0038] Кроме того, функция-ограничитель ψ(a) является произвольной функцией с характеристикой для сдерживания своего значения при увеличении входного значения a.

[0039] В модифицированном алгоритме аффинной проекции верхнее предельное значение функции-ограничителя ψ(a) устанавливается в значение, которое меньше 1 и обучение адаптивного фильтра замедляется в сегменте, содержащем много голосовых компонентов говорящего субъекта ближнего конца. Т.е. это означает, что верхнее предельное значение функции-ограничителя ψ(a) равно или меньше порогового значения или меньше порогового значения, когда пороговое значение установлено в предварительно определенное действительное число (действительное число от 0.1 до 0.5 включительно, например). Здесь состояние, при котором верхнее предельное значение функции-ограничителя ψ(a) равно или меньше порогового значения или меньше порогового значения, означает состояние, при котором верхнее предельное значение функции-ограничителя ψ(a) находится в рамках предварительно определенного диапазона, представляющего собой, что верхнее предельное значение является небольшим.

[0040] Верхнее предельное значение функции-ограничителя ψ(a) устанавливается в меньшее значение, чем предварительно определенное значение, и коэффициент фильтра обновляется посредством модифицированного алгоритма аффинной проекции, обеспечивая предотвращение подавления голоса от говорящего субъекта ближнего конца (голоса говорящего субъекта).

[0041] Вариант осуществления настоящего изобретения обеспечивает голосовую связь, в которой превосходное эхоподавление реализуется даже при использовании ненаправленных микрофонов. В частности, даже в устройстве голосовой связи небольшого размера с большим искажением в звуке громкоговорителя превосходное эхоподавление может быть реализовано с помощью недорогих ненаправленных микрофонов.

[0042] В варианте осуществления настоящего изобретения фиксированный коэффициент устанавливается с помощью предварительно известной информации (отношение d2/d1), способный подавить эхо от первоначального состояния. Кроме того, использование адаптивного фильтра позволяет дополнительно подавлять компоненты звука воспроизведения, остающиеся из-за влияний изменения характеристик микрофона, характеристик помещения, в котором используется голосовое устройство связи, и аналогичного. Соответственно эхо может быть стабильно подавлено даже при большом изменении характеристик микрофона или большой ошибке сборки корпуса.

[0043] <Второй вариант осуществления>

Поскольку расстояние d2 между громкоговорителем 102 и вторым микрофоном 106 короче расстояния d1 между громкоговорителем 102 и первым микрофоном 104, то звук воспроизведения, который получается посредством испускания принятого звукового сигнала через громкоговоритель 102, захватывается вторым микрофоном 106 и первым микрофоном 104 в данной очередности. Эффективность эхоподавления может быть дополнительно улучшена путем учета интервала по временной привязке захвата звука. Второй вариант осуществления, учитывающий интервал по временной привязке захвата звука, описывается ниже.

[0044] Устройство 200 голосовой связи описывается ниже при обращении к Фиг. 4 и Фиг. 5. Фиг. 4 является структурной схемой, иллюстрирующей конфигурацию устройства 200 беспроводной связи. Фиг. 5 является блок-схемой, иллюстрирующей работу устройства 200 голосовой связи. Как проиллюстрировано на Фиг. 4 устройство 200 голосовой связи включает в себя громкоговоритель 102, первый микрофон 104, второй микрофон 106, блок 210 задержки, блок 110 умножения, первый блок 120 вычитания, второй блок 130 вычитания и адаптивный фильтр 140. Т.е. устройство 200 голосовой связи отличается от устройства 100 голосовой связи тем, что устройство 200 голосовой связи дополнительно включает в себя блок 210 задержки.

[0045] Работа устройства 200 голосовой связи описывается ниже при обращении к Фиг. 5. Блок 210 задержки формирует сигнал путем добавления предварительно определенной задержки к второму звуковому захваченному сигналу (упоминается ниже как второй звуковой захваченный сигнал с задержкой (S210). Способ определения времени задержки описывается позже.

[0046] Блок 110 умножения формирует усиленный второй звуковой захваченный сигнал путем умножения второго звукового захваченного сигнала с задержкой на предварительно определенный фиксированный коэффициент (S110). Первый блок 120 вычитания формирует первый звуковой захваченный сигнал с первым вычитанием путем вычитания усиленного второго звукового захваченного сигнала из первого звукового захваченного сигнала (S120). Адаптивный фильтр 140 формирует второй звуковой захваченный сигнал с адаптивной фильтрацией путем подавления эха, которое меняется по времени, от второго звукового захваченного сигнала и передаваемого речевого сигнала (S140). Второй блок 130 вычитания формирует передаваемый речевой сигнал путем вычитания второго звукового захваченного сигнала с адаптивной фильтрацией из первого звукового захваченного сигнала с первым вычитанием (S130).

[0047] [Время задержки]

Теперь описывается время задержки, которое должно быть добавлено блоком 210 задержки. Время τ может быть установлено в качестве времени задержки, причем время τ берется, когда звук проходит расстояние d1-d2, соответствующее разности между расстоянием d1 от громкоговорителя 102 до первого микрофона 104 и расстоянием d2 от громкоговорителя 102 до второго микрофона 106.

[0048]

…(2)

[0049] Здесь v обозначает скорость звука.

[0050] Вариант осуществления настоящего изобретения обеспечивает голосовую связь в которой превосходное эхоподавление реализуется даже при использовании ненаправленных микрофонов. В частности, даже в устройстве голосовой связи небольшого размера с большим искажением в звуке громкоговорителя превосходное эхоподавление может быть реализовано с помощью недорогих ненаправленных микрофонов.

[0051] Вариант осуществления настоящего изобретения учитывает интервал по временной привязке захвата звука, который формируется позиционным отношением между громкоговорителем и микрофонами так, что дополнительно может быть улучшена эффективность эхоподавления.

[0052] <Третий вариант осуществления>

Блок 210 задержки и блок 110 умножения во втором варианте осуществления могут учитывать интервал по временной привязке захвата звука между первым микрофоном 104 и вторым микрофоном 106 (разность времени задержки) и разность амплитуд звуковых захваченных сигналов, но не может учитывать различие в частотных характеристиках между первым микрофоном 104 и вторым микрофоном 106. Вследствие этого третий вариант осуществления описывает конфигурацию, использующую фиксированный фильтр, который также выполнен с возможностью обработки различия в частотных характеристиках между первым микрофоном 104 и вторым микрофоном 106.

[0053] Устройство 300 голосовой связи описывается ниже при обращении к Фиг. 6 и Фиг. 7. Фиг. 6 является структурной схемой, иллюстрирующей конфигурацию устройства 300 голосовой связи. Фиг. 7 является блок-схемой, иллюстрирующей работу устройства 300 голосовой связи. Как проиллюстрировано на Фиг. 6 устройство 300 голосовой связи включает в себя громкоговоритель 102, первый микрофон 104, второй микрофон 106, фиксированный фильтр 310, первый блок 120 вычитания, второй блок 130 вычитания и адаптивный фильтр 140. Т.е. устройство 300 голосовой связи отличается от устройства 200 голосовой связи тем, что устройство 300 голосовой связи включает в себя фиксированный фильтр 310 вместо блока 210 задержки и блока 110 умножения.

[0054] Работа устройства 300 голосовой связи описывается ниже при обращении к Фиг. 7. Фиксированный фильтр 310 формирует фильтрованный второй звуковой захваченный сигнал путем выполнения предварительно определенной фильтрации по отношению к второму звуковому захваченному сигналу (S310). Фильтр конечной импульсной характеристики (FIR), например, может быть использован в качестве фиксированного фильтра 310. Установка фиксированного фильтра 310 описывается ниже. Считается, что изменение характеристик излучения звука у громкоговорителя 102 и характеристик микрофона формирует различие в частотных характеристиках прямых звуковых компонентов у эха, достигающего первый микрофон 104 и второй микрофон 106. Вследствие этого разность времени задержки, разность амплитуд, разность частотных характеристик между первым микрофоном 104 и вторым микрофоном 106 получаются посредством экспериментов и моделирования, и эти разности устанавливаются в фиксированном фильтре 310.

[0055] Первый блок 120 вычитания формирует первый звуковой захваченный сигнал с первым вычитанием путем вычитания отфильтрованного второго звукового захваченного сигнала из первого звукового захваченного сигнала (S120). Адаптивный фильтр 140 формирует второй звуковой захваченный сигнал с адаптивной фильтрацией путем подавления эха, которое меняется по времени, от второго звукового захваченного сигнала и передаваемого речевого сигнала (S140). Второй блок 130 вычитания формирует передаваемый речевой сигнал путем вычитания второго звукового захваченного сигнала с адаптивной фильтрацией из первого звукового захваченного сигнала с первым вычитанием (S130).

[0056] Вариант осуществления настоящего изобретения обеспечивает голосовую связь, в которой превосходное эхоподавление реализуется даже при использовании ненаправленных микрофонов. В частности, даже в устройстве голосовой связи небольшого размера с большим искажением в звуке громкоговорителя превосходное эхоподавление может быть реализовано с помощью недорогих ненаправленных микрофонов.

[0057] Вариант осуществления настоящего изобретения также учитывает различие частотных характеристик микрофонов в фиксированном фильтре, причем точность оценки прямых звуковых компонентов эха улучшается в сравнении с первым вариантом осуществления и вторым вариантом осуществления и таким образом может быть улучшена эффективность эхоподавления.

[0058] <Четвертый вариант осуществления>

Отфильтрованный второй звуковой захваченный сигнал вычитается из первого звукового захваченного сигнала в третьем варианте осуществления. Однако, это вызывает ухудшение частотной характеристики голоса у говорящего субъекта ближнего конца, который является целевым звуком. Данное ухудшение увеличивается по мере того, как расстояние d1 между громкоговорителем 102 и первым микрофоном 104 приближается к расстоянию d2 между громкоговорителем 102 и вторым микрофоном 106. Четвертый вариант осуществления описывает конфигурацию, в которую добавляется фиксированный фильтр для коррекции такого ухудшения частотной характеристики.

[0059] Устройство 400 голосовой связи описывается ниже при обращении к Фиг. 8 и Фиг. 9. Фиг. 8 является структурной схемой, иллюстрирующей конфигурацию устройства 400 голосовой связи. Фиг. 9 является блок-схемой, иллюстрирующей работу устройства 400 голосовой связи. Как проиллюстрировано на Фиг. 8 устройство 400 голосовой связи включает в себя громкоговоритель 102, первый микрофон 104, второй микрофон 106, фиксированный фильтр 310, второй фиксированный фильтр 410, первый блок 120 вычитания, второй блок 130 вычитания и адаптивный фильтр 140. Т.е. устройство 400 голосовой связи отличается от устройства 300 голосовой связи тем, что устройство 400 голосовой связи дополнительно включает в себя второй фиксированный фильтр 410.

[0060] Работа устройства 400 голосовой связи описывается ниже при обращении к Фиг. 9. Второй фиксированный фильтр 410 формирует отфильтрованный первый звуковой захваченный сигнал путем выполнения предварительно определенной фильтрации по отношению к первому звуковому захваченному сигналу (S410). Фильтр конечной импульсной характеристики (FIR), например, может быть использован в качестве второго фиксированного фильтра 410.

[0061] Фиксированный фильтр 310 формирует отфильтрованный второй звуковой захваченный сигнал путем выполнения предварительно определенной фильтрации по отношению к второму звуковому захваченному сигналу (S310). Первый блок 120 вычитания формирует первый звуковой захваченный сигнал с первым вычитанием путем вычитания отфильтрованного второго звукового захваченного сигнала из отфильтрованного первого звукового захваченного сигнала (S120). Адаптивный фильтр 140 формирует второй звуковой захваченный сигнал с адаптивной фильтрацией путем подавления эха, которое меняется по времени, от второго звукового захваченного сигнала и передаваемого речевого сигнала (S140). Второй блок 130 вычитания формирует передаваемый речевой сигнал путем вычитания второго звукового захваченного сигнала с адаптивной фильтрацией из первого звукового захваченного сигнала с первым вычитанием (S130).

[0062] Вариант осуществления настоящего изобретения обеспечивает голосовую связь, в которой превосходное эхоподавление реализуется даже при использовании ненаправленных микрофонов. В частности, даже в устройстве голосовой связи небольшого размера с большим искажением в звуке громкоговорителя превосходное эхоподавление может быть реализовано с помощью недорогих ненаправленных микрофонов.

[0063] В варианте осуществления настоящего изобретения первый звуковой захваченный сигнал подвергается предварительно определенной фильтрации для коррекции, обеспечивая возможность сдерживания ухудшения частотной характеристики голоса у говорящего субъекта ближнего конца, который является целевым звуком.

[0064] <Пятый вариант осуществления>

Эхоподавление выполняется путем использования адаптивного фильтра 140, использующего второй звуковой захваченный сигнал в качестве ввода, в каждом из вариантов осуществления, описанных до сих пор. Здесь в качестве пятого варианта осуществления описывается конфигурация, в которую добавляется второй адаптивный фильтр, использующий принятый речевой сигнала в качестве ввода. Здесь описывается конфигурация, полученная путем добавления второго адаптивного фильтра к четвертому варианту осуществления, но может быть использована конфигурация, полученная путем добавления адаптивного фильтра в любой из вариантов осуществления с первого по третий, вместо четвертого варианта осуществления.

[0065] Устройство 500 голосовой связи описывается ниже при обращении к Фиг. 10 и Фиг. 11. Фиг. 10 является структурной схемой, иллюстрирующей конфигурацию устройства 500 голосовой связи. Фиг. 11 является блок-схемой, иллюстрирующей работу устройства 500 голосовой связи. Как проиллюстрировано на Фиг. 10 устройство 500 голосовой связи включает в себя громкоговоритель 102, первый микрофон 104, второй микрофон 106, фиксированный фильтр 310, второй фиксированный фильтр 410, первый блок 120 вычитания, второй блок 130 вычитания, адаптивный фильтр 140 и второй адаптивный фильтр 540. Т.е. устройство 500 голосовой связи отличается от устройства 400 голосовой связи тем, что устройство 500 голосовой связи дополнительно включает в себя второй адаптивный фильтр 540.

[0066] Работа устройства 500 голосовой связи описывается ниже при обращении к Фиг. 11. Второй фиксированный фильтр 410 формирует отфильтрованный первый звуковой захваченный сигнал путем выполнения предварительно определенной фильтрации по отношению к первому звуковому захваченному сигналу (S410). Фиксированный фильтр 310 формирует отфильтрованный второй звуковой захваченный сигнал путем выполнения предварительно определенной фильтрации по отношению к второму звуковому захваченному сигналу (S310). Первый блок 120 вычитания формирует первый звуковой захваченный сигнал с первым вычитанием путем вычитания отфильтрованного второго звукового захваченного сигнала из отфильтрованного первого звукового захваченного сигнала (S120). Адаптивный фильтр 140 формирует второй звуковой захваченный сигнал с адаптивной фильтрацией путем подавления эха, которое меняется по времени, от второго звукового захваченного сигнала и передаваемого речевого сигнала (S140).

[0067] Второй адаптивный фильтр 540 формирует принятый речевой сигнал с адаптивной фильтрацией путем подавления эха, которое меняется по времени, от принятого речевого сигнала и передаваемого речевого сигнала (S540). Другими словами, второй адаптивный фильтр 540 формирует принятый речевой сигнал с адаптивной фильтрацией, который получается путем подавления эха от передаваемого речевого сигнала путем использования принятого речевого сигнала в качестве ввода.

[0068] Второй блок 130 вычитания формирует сигнал в качестве передаваемого речевого сигнала путем вычитания второго звукового захваченного сигнала с адаптивной фильтрацией и принятого речевого сигнала с адаптивной фильтрацией из первого звукового захваченного сигнала с первым вычитанием (S130).

[0069] Вариант осуществления настоящего изобретения обеспечивает голосовую связь, в которой превосходное эхоподавление реализуется даже при использовании ненаправленных микрофонов. В частности, даже в устройстве голосовой связи небольшого размера с большим искажением в звуке громкоговорителя превосходное эхоподавление может быть реализовано с помощью недорогих ненаправленных микрофонов.

[0070] В варианте осуществления настоящего изобретения добавляется адаптивный фильтр, использующий принятый речевой сигнал в качестве ввода, обеспечивая возможность дополнительного подавления остаточного звука громкоговорителя и улучшения эффективности эхоподавления.

[0071] <Шестой вариант осуществления>

Устройство 600 голосовой связи описывается ниже при обращении к Фиг. 12 и Фиг. 13. Фиг. 12 является структурной схемой, иллюстрирующей конфигурацию устройства 600 голосовой связи. Фиг. 13 является блок-схемой, иллюстрирующей работу устройства 600 голосовой связи. Как проиллюстрировано на Фиг. 12 устройство 600 голосовой связи включает в себя громкоговоритель 102, первый микрофон 104, второй микрофон 106, блок 610 коррекции, первый блок 120 вычитания, второй блок 130 вычитания и адаптивный фильтр 140. Т.е. устройство 600 голосовой связи отличается от устройства 100 голосовой связи тем, что устройство 600 голосовой связи включает в себя блок 610 коррекции вместо блока 110 умножения.

[0072] Работа устройства 600 голосовой связи описывается ниже при обращении к Фиг. 13. Блок 610 коррекции формирует скорректированный звуковой захваченный сигнал, который является сигналом, полученным путем коррекции разности амплитуд на основе разности между расстоянием d1 от громкоговорителя 102 до первого микрофона 104 и расстояния d2 от громкоговорителя 102 до второго микрофона 106, из первого звукового захваченного сигнала (S610). Степень коррекции может быть определена в свете Формулы (1), описанной в разделе [Фиксированной коэффициент] первого варианта осуществления, например.

[0073] Первый блок 120 вычитания формирует первый звуковой захваченный сигнал с первым вычитанием путем вычитания второго звукового захваченного сигнала из скорректированного звукового захваченного сигнала, сформированного на этапе S610 (S120). Адаптивный фильтр 140 формирует второй звуковой захваченный сигнал с адаптивной фильтрацией путем подавления эха, которое меняется по времени, от второго звукового захваченного сигнала и передаваемого речевого сигнала (S140). Второй блок 130 вычитания формирует передаваемый речевой сигнал путем вычитания второго звукового захваченного сигнала с адаптивной фильтрацией из первого звукового захваченного сигнал с первым вычитанием (S130).

[0074] (Модификация)

Устройство 600 голосовой связи выполнено с возможностью коррекции первого звукового захваченного сигнала, но может быть выполнено с возможностью коррекции второго звукового захваченного сигнала. Описывается устройство 601 голосовой связи с такой конфигурацией.

[0075] Устройство 601 голосовой связи описывается ниже при обращении к Фиг. 14 и Фиг. 15. Фиг. 14 является структурной схемой, иллюстрирующей конфигурацию устройства 601 голосовой связи. Фиг. 15 является блок-схемой, иллюстрирующей работу устройства 601 голосовой связи. Как проиллюстрировано на Фиг. 14 устройство 601 голосовой связи включает в себя громкоговоритель 102, первый микрофон 104, второй микрофон 106, блок 611 коррекции, первый блок 120 вычитания, второй блок 130 вычитания и адаптивный фильтр 140. Т.е. устройство 601 голосовой связи отличается от устройства 600 голосовой связи тем, что устройство 601 голосовой связи включает в себя блок 611 коррекции вместо блока 610 коррекции.

[0076] Работа устройства 601 голосовой связи описывается ниже при обращении к Фиг. 15. Блок 611 коррекции формирует скорректированный звуковой захваченный сигнал, который является сигналом, полученным путем коррекции разности амплитуд на основе разности между расстоянием d1 от громкоговорителя 102 до первого микрофона 104 и расстояния d2 от громкоговорителя до второго микрофона 106, из второго звукового захваченного сигнала (S611). Степень коррекции может быть определена в свете Формулы (1), описанной в разделе [Фиксированный коэффициент] первого варианта осуществления, например.

[0077] Первый блок 120 вычитания формирует первый звуковой захваченный сигнал с первым вычитанием путем вычитания скорректированного звукового захваченного сигнала, сформированного на этапе S611, из первого звукового захваченного сигнала (S120). Адаптивный фильтр 140 формирует второй звуковой захваченный сигнал с адаптивной фильтрацией путем подавления эха, которое меняется по времени, от второго звукового захваченного сигнала и передаваемого речевого сигнала (S140). Второй блок 130 вычитания формирует передаваемый речевой сигнал путем вычитания второго звукового захваченного сигнала с адаптивной фильтрацией из первого звукового захваченного сигнала с первым вычитанием (S130).

[0078] Вариант осуществления настоящего изобретения обеспечивает голосовую связь, в которой превосходное эхоподавление реализуется даже при использовании ненаправленных микрофонов. В частности, даже в устройстве голосовой связи небольшого размера с большим искажением в звуке громкоговорителя превосходное эхоподавление может быть реализовано с помощью недорогих ненаправленных микрофонов.

[0079] <Приложение>

Каждое устройство в соответствии с настоящим изобретением имеет, в качестве единого объекта аппаратного обеспечения, например, блок ввода, с которым может быть соединена клавиатура или аналогичное, блок вывода, с которым может быть соединен жидкокристаллический дисплей или аналогичное, блок связи, с которым может быть соединено устройство связи (например, кабель связи), выполненный с возможностью связи с внешней частью объекта аппаратного обеспечения, центральный блок обработки (CPU, который может включать в себя кэш-память и/или регистры), RAM или ROM в качестве памятей, внешнее запоминающее устройство, которое является жестким диском, и шину, которая соединяет блок ввода, блок вывода, блок связи, CPU, RAM, ROM и внешнее запоминающее устройство так, что между ними может быть осуществлен обмен данными. Объект аппаратного обеспечения также может включать в себя, например, устройство (накопитель), выполненное с возможностью чтения и записи носителя записи, такое как CD-ROM по желанию. Физический объект, обладающий такими ресурсами аппаратного обеспечения, может быть компьютером общего назначения, например.

[0080] Внешнее запоминающее устройство объекта аппаратного обеспечения имеет хранящиеся на нем программы, необходимые для воплощения вышеупомянутых функций, и данные, необходимые при обработке программ (в дополнение к внешнему запоминающему устройство программы могут быть предварительно сохранены в ROM, как запоминающем устройстве исключительно для чтения, например). Также данные или аналогичное, получаемые в результате обработки этих программ, сохраняются в RAM и внешнем запоминающем устройстве в зависимости от обстоятельств.

[0081] В объекте аппаратного обеспечения программы и данные, необходимые для обработки программ, которые хранятся на внешнем запоминающем устройстве (или ROM и аналогичном), считываются в память при необходимости для интерпретации и исполнения/обработки в зависимости от обстоятельств посредством CPU. Как следствие, CPU воплощает предварительно определенные функции (компоненты, представленные выше в качестве блоков, средств или аналогичного).

[0082] Как уже упоминалось, когда функции обработки объектов аппаратного обеспечения, описанных в вариантах осуществления (устройств настоящего изобретения), должны воплощаться с помощью компьютера, то детали обработки у функций, которые должны быть предоставлены объектами аппаратного обеспечения, описываются программой. Посредством программы, которая затем исполняется компьютером, функции обработки объекта аппаратного обеспечения воплощаются на компьютере.

[0083] Программа, описывающая детали обработки, может быть записана на машиночитаемом носители записи. Машиночитаемый носитель записи может быть любого вида, таким как магнитное устройство записи, оптической диск, магнитооптический носитель записи или полупроводниковая память. Более конкретно, магнитное устройство записи может быть устройством жесткого диска, гибким диском или магнитной лентой; оптический диск может быть DVD (цифровой универсальный диск), DVD-RAM (память с произвольным доступом), CD-ROM (постоянная память на компакт диске) или CD-R (записываемый)/RW (перезаписываемый); магнитооптический носитель записи может быть MO (магнитооптический диск); и полупроводниковая память может быть EEP-ROM (электрически стираемая и программируемая постоянная память), например.

[0084] Также распространение данной программы выполняется посредством, например, продажи, переноса или одалживания портативного носителя записи, такого как DVD или CD-ROM, на котором записана программа. Кроме того, может быть принята конфигурация, в которой данная программа распространяется путем сохранения программы на запоминающем устройстве серверного компьютера и переноса программы на другие компьютеры с серверного компьютера через сеть.

[0085] Компьютер, который исполняет такую программу сначала, например, временно сохраняет программу, записанную на портативном носителе записи или программу, которая перенесена с серверного компьютера, в своем запоминающем устройстве. В момент исполнения обработки компьютер тогда считывает программу, сохраненную в его запоминающем устройстве, и исполняет обработку в соответствии со считанной программой. Также в качестве другой формы исполнения данной программы компьютер может считывать программу непосредственного с портативного носителя записи и исполнять обработку в соответствии с программой и, кроме того, каждый раз, когда программа переносится на компьютер с серверного компьютера, компьютер может последовательно исполнять обработку в соответствии с принятой программой. Также может быть принята конфигурация, в которой перенос программы на компьютер с серверного компьютера не выполняется, и описанная выше обработка исполняется посредством так называемой услуги типа поставщика услуг по аренде приложений (ASP), посредством которой функции обработки реализуются только посредством инструкции для их исполнения и получения результата. Отметим, что программа в данной форме должна охватывать информацию, которая используется при обработке электронным компьютером и действует подобно программе (такую как данные, которые не являются непосредственной командой для компьютера, но обладают свойствами, предписывающими компьютерную обработку).

[0086] Кроме того, несмотря на то, что объект аппаратного обеспечения был описан как сконфигурированный через исполнение предварительно определенной программы на компьютере в данной форме, по меньшей мере некоторые из этих деталей обработки могут вместо этого быть воплощены с помощью аппаратного обеспечения.

[0087] Вышеупомянутое описание вариантов осуществления изобретения было представлено с целью иллюстрации и описания. Не подразумевается, что оно является исчерпывающим и ограничивающим изобретение точной раскрытой формой. Модификации или вариации возможны в свете вышеупомянутых идей. Вариант осуществления был выбран и описан для обеспечения наилучшей иллюстрации принципов изобретения и его практического применения, и чтобы позволить специалисту в соответствующей области техники использовать изобретение в различных вариантах осуществления и с различными модификациями, которые подходят для конкретного предполагаемого использования. Все такие модификации и вариации находятся в рамках объема изобретения, как определено прилагаемой формулой изобретения при толковании в соответствии с широтой, на которую они имеют справедливое, законное и равное право.

Похожие патенты RU2744518C1

название год авторы номер документа
УСТРОЙСТВО ЭХОПОДАВЛЕНИЯ, СПОСОБ ЭХОПОДАВЛЕНИЯ И ПРОГРАММА ЭХОПОДАВЛЕНИЯ 2020
  • Сатоми, Юки
RU2799561C2
УСТРОЙСТВО ДВУХСТОРОННЕЙ СВЯЗИ, СОДЕРЖАЩЕЕ ОДИН ТРАНСДЮСЕР 2004
  • Масуда Масахиса
  • Куме Ясухиро
RU2370890C2
УСТРОЙСТВО И СПОСОБ РАСЧЕТА КОЭФФИЦИЕНТОВ ФИЛЬТРА ЭХОПОДАВЛЕНИЯ 2009
  • Кюх Фабиан
  • Каллингер Маркус
  • Фаллер Кристоф
  • Фаврот Алексис
RU2485607C2
УСТРОЙСТВО ЭХОПОДАВЛЕНИЯ, СПОСОБ ЭХОПОДАВЛЕНИЯ И ПРОГРАММА ЭХОПОДАВЛЕНИЯ 2019
  • Сатоми, Юки
RU2767297C1
УСТРОЙСТВО ПОДАВЛЕНИЯ АКУСТИЧЕСКОГО ЭХА И ФРОНТАЛЬНОЕ УСТРОЙСТВО КОНФЕРЕНЦСВЯЗИ 2009
  • Кюх Фабиан
  • Каллингер Маркус
  • Шмидт Маркус
  • Зоуруб Мерай
  • Диатшук Марко
  • Мозер Оливер
RU2520359C2
УСТРОЙСТВО СВЯЗИ С ИСПОЛЬЗОВАНИЕМ БЕЗГОЛОСОВОЙ РЕЧИ 2002
  • Сидоров С.Н.
RU2260252C9
МНОГОКАНАЛЬНОЕ АКУСТИЧЕСКОЕ ЭХОПОДАВЛЕНИЕ 2010
  • Трики Махди
  • Янсе Корнелис Питер
RU2546717C2
СРЕДСТВО ОБНАРУЖЕНИЯ ГОЛОСОВОЙ АКТИВНОСТИ С ИСПОЛЬЗОВАНИЕМ НЕСКОЛЬКИХ МИКРОФОНОВ 2008
  • Ван Сун
  • Гупта Самир Кумар
  • Чой Эдди Л.Т.
RU2450368C2
Способ приема речевых сигналов 2018
  • Янгуразов Артем Олегович
  • Дубровских Дмитрий Иосифович
  • Еремеев Игорь Михайлович
RU2716556C1
СПОСОБ ГОЛОСОВОГО УПРАВЛЕНИЯ, НОСИМОЕ УСТРОЙСТВО И ТЕРМИНАЛ 2018
  • Чжан, Лун
  • Ли, Чуньцзянь
  • Цю, Цуньшоу
  • Чан, Цин
RU2763392C1

Иллюстрации к изобретению RU 2 744 518 C1

Реферат патента 2021 года УСТРОЙСТВО ГОЛОСОВОЙ СВЯЗИ, СПОСОБ ГОЛОСОВОЙ СВЯЗИ И ПРОГРАММА

Изобретение относится к средствам для голосовой связи. Технический результат заключается в повышении эффективности связи. Устройство голосовой связи формирует передаваемый речевой сигнал, который должен быть передан говорящему субъекту дальнего конца. Устройство голосовой связи включает в себя громкоговоритель, который испускает принятый речевой сигнал, который является голосовым сигналом говорящего субъекта дальнего конца, первый микрофон, который захватывает акустический сигнал в качестве первого звукового захваченного сигнала, причем акустический сигнал содержит голос говорящего субъекта, который является голосом, которым говорит говорящий субъект ближнего конца, и звук воспроизведения, который получается путем испускания принятого речевого сигнала, и второй микрофон, который захватывает акустический сигнал в качестве второго звукового захваченного сигнала, причем акустический сигнал содержит голос говорящего субъекта и звук воспроизведения. При этом способ голосовой связи содержит: этап коррекции, первый этап вычитания, этап адаптивной фильтрации и второй этап вычитания. 5 н. и 2 з.п. ф-лы, 19 ил.

Формула изобретения RU 2 744 518 C1

1. Устройство голосовой связи, содержащее:

громкоговоритель, который испускает принятый речевой сигнал, причем принятый речевой сигнал является голосовым сигналом говорящего субъекта дальнего конца;

первый микрофон, который захватывает акустический сигнал в качестве первого звукового захваченного сигнала, причем акустический сигнал содержит голос говорящего субъекта, который является голосом, которым говорит говорящий субъект ближнего конца, и звук воспроизведения, который получается путем испускания принятого речевого сигнала;

второй микрофон, который захватывает акустический сигнал в качестве второго звукового захваченного сигнала, причем акустический сигнал содержит голос говорящего субъекта и звук воспроизведения;

блок коррекции, который формирует скорректированный звуковой захваченный сигнал, причем скорректированный звуковой захваченный сигнал является сигналом, полученным путем коррекции разности амплитуд на основе разности между расстоянием d1 от громкоговорителя до первого микрофона и расстоянием d2 от громкоговорителя до второго микрофона (здесь d2≤d1), из любого из первого звукового захваченного сигнала и второго звукового захваченного сигнала;

первый блок вычитания, который формирует первый звуковой захваченный сигнал с первым вычитанием, причем первый звуковой захваченный сигнал с первым вычитанием является сигналом, полученным путем вычитания второго звукового захваченного сигнала из скорректированного звукового захваченного сигнала, или сигналом, полученным путем вычитания скорректированного звукового захваченного сигнала из первого звукового захваченного сигнала;

адаптивный фильтр, который формирует второй звуковой захваченный сигнал с адаптивной фильтрацией путем подавления эха, которое меняется по времени, от второго звукового захваченного сигнала и передаваемого речевого сигнала, причем передаваемый речевой сигнал является тем, который должен быть передан говорящему субъекту дальнего конца; и

второй блок вычитания, который формирует сигнал, который получается путем вычитания второго звукового захваченного сигнала с адаптивной фильтрацией из первого звукового захваченного сигнала с первым вычитанием, в качестве передаваемого речевого сигнала.

2. Устройство голосовой связи, содержащее:

громкоговоритель, который испускает принятый речевой сигнал, причем принятый речевой сигнал является голосовым сигналом говорящего субъекта дальнего конца;

первый микрофон, который захватывает акустический сигнал в качестве первого звукового захваченного сигнала, причем акустический сигнал содержит голос говорящего субъекта, который является голосом, которым говорит говорящий субъект ближнего конца, и звук воспроизведения, который получается путем испускания принятого речевого сигнала;

второй микрофон, который захватывает акустический сигнал в качестве второго звукового захваченного сигнала, причем акустический сигнал содержит голос говорящего субъекта и звук воспроизведения;

блок задержки, который формирует второй звуковой захваченный сигнал с задержкой, причем второй звуковой захваченный сигнал с задержкой является сигналом, полученным путем добавления предварительно определенной задержки к второму звуковому захваченному сигналу;

блок умножения, который формирует усиленный второй звуковой захваченный сигнал, причем усиленный второй звуковой захваченный сигнал является сигналом, полученным путем умножения второго звукового захваченного сигнала с задержкой на предварительно определенный фиксированный коэффициент;

первый блок вычитания, который формирует первый звуковой захваченный сигнал с первым вычитанием, причем первый звуковой захваченный сигнал с первым вычитанием является сигналом, полученным путем вычитания усиленного второго звукового захваченного сигнала из первого звукового захваченного сигнала;

адаптивный фильтр, который формирует второй звуковой захваченный сигнал с адаптивной фильтрацией путем подавления эха, которое меняется по времени, от второго звукового захваченного сигнала и передаваемого речевого сигнала, причем передаваемый речевой сигнал является тем, который должен быть передан говорящему субъекту дальнего конца; и

второй блок вычитания, который формирует сигнал, который получается путем вычитания второго звукового захваченного сигнала с адаптивной фильтрацией из первого звукового захваченного сигнала с первым вычитанием, в качестве передаваемого речевого сигнала, при этом

расстояние d1 от громкоговорителя до первого микрофона равно или длиннее расстояния d2 от громкоговорителя до второго микрофона и

фиксированный коэффициент является отношением d2/d1 между расстоянием d2 и расстоянием d1.

3. Устройство голосовой связи по п.1 или 2, в котором коэффициент фильтра у адаптивного фильтра обновляется путем использования алгоритма нормализованного метода наименьших квадратов (NLMS) или алгоритма метода наименьших квадратов (LMS), когда отношение Pow1/Pow2 между мощностью Pow1 передаваемого речевого сигнала и мощностью Pow2 второго звукового захваченного сигнала равно или меньше порогового значения либо меньше порогового значения.

4. Устройство голосовой связи по п.1 или 2, в котором коэффициент фильтра у адаптивного фильтра обновляется путем использования модифицированного алгоритма аффинной проекции, когда верхнее предельное значение функции-ограничителя ψ(a), причем функция-ограничитель ψ(a) используется в модифицированном алгоритме аффинной проекции, равно или меньше порогового значения либо меньше порогового значения.

5. Способ голосовой связи, в котором устройство голосовой связи формирует передаваемый речевой сигнал, который должен быть передан говорящему субъекту дальнего конца,

причем устройство голосовой связи включает в себя

громкоговоритель, который испускает принятый речевой сигнал, который является голосовым сигналом говорящего субъекта дальнего конца,

первый микрофон, который захватывает акустический сигнал в качестве первого звукового захваченного сигнала, причем акустический сигнал содержит голос говорящего субъекта, который является голосом, которым говорит говорящий субъект ближнего конца, и звук воспроизведения, который получается путем испускания принятого речевого сигнала, и

второй микрофон, который захватывает акустический сигнал в качестве второго звукового захваченного сигнала, причем акустический сигнал содержит голос говорящего субъекта и звук воспроизведения,

при этом способ голосовой связи содержит:

этап коррекции, на котором устройство голосовой связи формирует скорректированный звуковой захваченный сигнал, причем скорректированный звуковой захваченный сигнал является сигналом, полученным путем коррекции разности амплитуд на основе разности между расстоянием d1 от громкоговорителя до первого микрофона и расстоянием d2 от громкоговорителя до второго микрофона (здесь d2≤d1), из любого из первого звукового захваченного сигнала и второго звукового захваченного сигнала;

первый этап вычитания, на котором устройство голосовой связи формирует первый звуковой захваченный сигнал с первым вычитанием, причем первый звуковой захваченный сигнал с первым вычитанием является сигналом, полученным путем вычитания второго звукового захваченного сигнала из скорректированного звукового захваченного сигнала, или сигналом, полученным путем вычитания скорректированного звукового захваченного сигнала из первого звукового захваченного сигнала;

этап адаптивной фильтрации, на котором устройство голосовой связи формирует второй звуковой захваченный сигнал с адаптивной фильтрацией путем подавления эха, которое меняется по времени, от второго звукового захваченного сигнала и передаваемого речевого сигнала; и

второй этап вычитания, на котором устройство голосовой связи формирует сигнал, который получается путем вычитания второго звукового захваченного сигнала с адаптивной фильтрацией из первого звукового захваченного сигнала с первым вычитанием, в качестве передаваемого речевого сигнала.

6. Способ голосовой связи, в котором устройство голосовой связи формирует передаваемый речевой сигнал, который должен быть передан говорящему субъекту дальнего конца,

причем устройство голосовой связи включает в себя

громкоговоритель, который испускает принятый речевой сигнал, который является голосовым сигналом говорящего субъекта дальнего конца,

первый микрофон, который захватывает акустический сигнал в качестве первого звукового захваченного сигнала, причем акустический сигнал содержит голос говорящего субъекта, который является голосом, которым говорит говорящий субъект ближнего конца, и звук воспроизведения, который получается путем испускания принятого речевого сигнала, и

второй микрофон, который захватывает акустический сигнал в качестве второго звукового захваченного сигнала, причем акустический сигнал содержит голос говорящего субъекта и звук воспроизведения,

при этом способ голосовой связи содержит:

этап задержки, на котором устройство голосовой связи формирует второй звуковой захваченный сигнал с задержкой, причем второй звуковой захваченный сигнал с задержкой является сигналом, полученным путем добавления предварительно определенной задержки к второму звуковому захваченному сигналу;

этап умножения, на котором устройство голосовой связи формирует усиленный второй звуковой захваченный сигнал, причем усиленный второй звуковой захваченный сигнал является сигналом, полученным путем умножения второго звукового захваченного сигнала с задержкой на предварительно определенный фиксированный коэффициент;

первый этап вычитания, на котором устройство голосовой связи формирует первый звуковой захваченный сигнал с первым вычитанием, причем первый звуковой захваченный сигнал с первым вычитанием является сигналом, полученным путем вычитания усиленного второго звукового захваченного сигнала из первого звукового захваченного сигнала;

этап адаптивной фильтрации, на котором устройство голосовой связи формирует второй звуковой захваченный сигнал с адаптивной фильтрацией путем подавления эха, которое меняется по времени, от второго звукового захваченного сигнала и передаваемого речевого сигнала; и

второй этап вычитания, на котором устройство голосовой связи формирует сигнал, который получается путем вычитания второго звукового захваченного сигнала с адаптивной фильтрацией из первого звукового захваченного сигнала с первым вычитанием, в качестве передаваемого речевого сигнала, при этом

расстояние d1 от громкоговорителя до первого микрофона равно или длиннее расстояния d2 от громкоговорителя до второго микрофона и

фиксированный коэффициент является отношением d2/d1 между расстоянием d2 и расстоянием d1.

7. Машиночитаемый носитель записи, на котором записана программа, которая при ее исполнении компьютером предписывает компьютеру функционировать в качестве устройства голосовой связи по п.1 или 2.

Документы, цитированные в отчете о поиске Патент 2021 года RU2744518C1

JP 5241582 A, 21.09.1993
JP 2007336132 A, 27.12.2007
JP 8223275 A, 30.08.1996
JP 6189395 A, 08.07.1994
JP 2017191987 A, 19.10.2017
УЛУЧШЕНИЕ РАЗБОРЧИВОСТИ РЕЧИ В МОБИЛЬНОМ КОММУНИКАЦИОННОМ УСТРОЙСТВЕ ПУТЕМ УПРАВЛЕНИЯ РАБОТОЙ ВИБРАТОРА В ЗАВИСИМОСТИ ОТ ФОНОВОГО ШУМА 2006
  • Артс Роналдус Мария
  • Белт Харм Ян
RU2411595C2

RU 2 744 518 C1

Авторы

Кобаяси, Кадзунори

Даты

2021-03-11Публикация

2018-11-13Подача