УСТРОЙСТВО ЭХОПОДАВЛЕНИЯ, СПОСОБ ЭХОПОДАВЛЕНИЯ И ПРОГРАММА ЭХОПОДАВЛЕНИЯ Российский патент 2023 года по МПК H04R3/00 H04B3/20 H04M9/08 

Описание патента на изобретение RU2799561C2

Область техники

[0001]

Настоящее изобретение относится к устройству эхоподавления, способу эхоподавления и программе эхоподавления.

Предпосылки создания изобретения

[0002]

В патентном документе 1 описано устройство эхоподавления, в котором при определении отсутствия передачи сигнала через тракт прохождения передаваемого сигнала и наличии передачи сигнала через тракт прохождения принимаемого сигнала для осуществления процесса подавления эха в уловленном звуковом сигнале используют эхоподавитель.

Список библиографических ссылок

Патентная литература

[0003]

Патентный документ 1: JP 2018-201147 A

Изложение сущности изобретения

Техническая задача

[0004]

Однако в устройстве эхоподавления, описанном в патентном документе 1, если эффективность динамика или усилителя динамика является низкой, существует вероятность возрастания нелинейных эхосигналов, увеличения некомпенсированных эхосигналов и ухудшения качества разговорной речи.

[0005]

Настоящее изобретение было разработано с учетом вышеизложенного, и цель настоящего изобретения состоит в обеспечении устройства эхоподавления, способа эхоподавления и программы эхоподавления, которые позволяют подавлять нелинейное эхо и снижать ухудшение качества речи.

Решение проблемы

[0006]

Для решения этой проблемы устройство эхоподавления в соответствии с настоящим изобретением представляет собой, например, устройство эхоподавления для подавления эха, генерируемого при поступлении выходного голосового сигнала из динамика в микрофон. Устройство эхоподавления включает в себя блок регулировки уровня, блок удаления эха и блок обнаружения одновременного разговора. Блок регулировки уровня предусмотрен в тракте прохождения принимаемого сигнала для передачи принимаемого сигнала со стороны дальнего конца линии связи на динамик. Блок удаления эха предусмотрен в тракте прохождения передаваемого сигнала для передачи входного сигнала с микрофона. Блок удаления эха удаляет остаточное эхо из уловленного звукового сигнала с микрофона. Блок обнаружения одновременного разговора определяет наличие состояния одновременного разговора, при котором сигналы передают одновременно в тракт прохождения передаваемого сигнала и в тракт прохождения принимаемого сигнала. Блок регулировки уровня включает в себя компрессор. Если блок обнаружения одновременного разговора определяет состояние одновременного разговора, компрессор осуществляет процесс сжатия для сигнала, превышающего первый порог, из числа принимаемых сигналов. Если блок обнаружения одновременного разговора не определяет состояние одновременного разговора, компрессор осуществляет процесс сжатия для сигнала, превышающего второй порог, который превышает первый порог, из числа принимаемых сигналов.

[0007]

Устройство эхоподавления в соответствии с настоящим изобретением содержит компрессор в тракте прохождения принимаемого сигнала для передачи принимаемого сигнала на динамик. При определении состояния одновременного разговора компрессор осуществляет процесс сжатия для сигнала, превышающего первый порог, из числа принимаемых сигналов со стороны дальнего конца. Таким образом, можно предотвращать нелинейное эхо. В результате можно снижать ухудшение качества голоса.

[0008]

В данном случае, если блок обнаружения одновременного разговора не определяет состояние одновременного разговора, компрессор может выполнять процесс сжатия для сигнала, превышающего второй порог, который превышает первый порог, из числа принимаемых сигналов. Это позволяет более надежно предотвращать нелинейное эхо.

[0009]

При этом блок регулировки уровня может включать в себя блок регулировки коэффициента усиления, который регулирует коэффициент усиления принимаемого сигнала. Компрессор может регулировать порог таким образом, чтобы первый порог становился небольшим по мере увеличения коэффициента усиления. Компрессор может выполнять процесс сжатия для сигнала, поступающего от блока регулировки коэффициента усиления. В результате, даже если блок регулировки коэффициента усиления выдает голосовой сигнал большого уровня, компрессор уменьшает пик голосового сигнала, и, таким образом, можно уменьшить нелинейное эхо.

[0010]

В данном случае компрессор может повышать степень сжатия по мере увеличения коэффициента усиления. В результате, даже если блок регулировки коэффициента усиления выдает голосовой сигнал большого уровня, компрессор уменьшает пик голосового сигнала, и, таким образом, можно уменьшить нелинейное эхо.

[0011]

При этом компрессор может изменять степень сжатия на основании информации об искажениях динамика. Это позволяет уменьшать нелинейное эхо.

[0012]

В данном случае может быть дополнительно предусмотрен эхоподавитель, который осуществляет процесс подавления эха для сигнала, из которого остаточное эхо было удалено блоком удаления эха. В результате, даже в случае, если уровень громкости звука динамика установлен большим из-за большого уровня шума в окружающей среде или т.п., а нелинейные эхосигналы генерируются в большом количестве, возможно удаление эхокомпонента.

[0013]

При этом компрессор может сравнивать значение принимаемого сигнала с третьим порогом для каждой полосы частот. Если блок обнаружения одновременного разговора определяет состояние одновременного разговора, компрессор может выполнять процесс сжатия для принимаемого сигнала со значением, превышающим третий порог. Соответственно, часть сигналов, сжимаемых компрессором, уменьшается с получением еще более естественного голоса, что позволяет повысить качество телефонного разговора.

[0014]

Для решения проблемы способ эхоподавления в соответствии с настоящим изобретением представляет собой, например, способ эхоподавления для подавления эха в терминале ближнего конца, содержащем динамик и микрофон. Способ эхоподавления включает: определение нахождения сигналов в состоянии одновременного разговора, при котором сигналы одновременно проходят в тракт прохождения передаваемого сигнала для передачи сигнала, вводимого с микрофона, и в тракт прохождения принимаемого сигнала для передачи сигнала на динамик; выполнение процесса сжатия для сигнала, превышающего первый порог, из числа принимаемых сигналов со стороны дальнего конца при обнаружении состояния одновременного разговора; вывод сигнала после процесса сжатия из динамика и удаление остаточного эха из уловленного звукового сигнала, выводимого с микрофона. В результате становится возможным подавление нелинейного эха и устранение ухудшения качества голоса.

[0015]

Для решения проблемы программа эхоподавления в соответствии с настоящим изобретением представляет собой, например, программу эхоподавления для подавления эха в терминале ближнего конца, содержащем динамик и микрофон. Программа эхоподавления заставляет компьютер функционировать в качестве: блока обнаружения одновременного разговора, который определяет нахождение сигналов в состоянии одновременного разговора, при котором сигналы одновременно передают в тракт прохождения передаваемого сигнала для передачи сигнала, вводимого с микрофона, и в тракт прохождения сигнала для передачи сигнала на динамик; компрессора, который осуществляет процесс сжатия для сигнала, превышающего первый порог, из числа принимаемых сигналов со стороны дальнего конца при определении состояния одновременного разговора; и блока удаления эха, который удаляет остаточное эхо из уловленного звукового сигнала, выводимого с микрофона. В результате можно подавить нелинейное эхо и устранить ухудшение качества голоса.

Преимущества изобретения

[0016]

В соответствии с настоящим изобретением можно подавлять нелинейное эхо и устранять ухудшение качества голоса.

Краткое описание графических материалов

[0017]

На ФИГ. 1 представлена схема, примерно изображающая систему 100 голосовой связи с устройством 1 эхоподавления в соответствии с первым вариантом осуществления.

На ФИГ. 2 представлена структурная схема, изображающая общую конфигурацию устройства 1 эхоподавления.

На ФИГ. 3 представлена схема, схематически иллюстрирующая процесс, осуществляемый компрессором при обнаружении состояния одновременного разговора.

На ФИГ. 4 представлена схема, схематически иллюстрирующая процесс, осуществляемый компрессором при необнаружении состояния одновременного разговора.

На ФИГ. 5 представлена схема, схематически иллюстрирующая процесс, осуществляемый компрессором при изменении коэффициента усиления.

На ФИГ. 6 представлена структурная схема, иллюстрирующая общую конфигурацию устройства 2 эхоподавления.

На ФИГ. 7 представлена структурная схема, изображающая общую конфигурацию устройства 3 эхоподавления.

На ФИГ. 8 представлена схема, схематически иллюстрирующая процесс, осуществляемый компрессором.

Описание вариантов осуществления

[0018]

Ниже будут подробно описаны варианты осуществления устройства эхоподавления в соответствии с настоящим изобретением со ссылкой на рисунки. Устройство эхоподавления - это устройство, подавляющее эхо, генерируемое во время телефонного вызова в системе голосовой связи.

[0019]

Первый вариант осуществления

На ФИГ. 1 представлена схема, примерно изображающая систему 100 голосовой связи с устройством 1 эхоподавления в соответствии с первым вариантом осуществления. Система 100 голосовой связи главным образом включает в себя терминал 50, содержащий микрофон 51 и динамик 52, два сотовых телефона 53 и 54, усилитель 55 динамика и устройство 1 эхоподавления.

[0020]

Система 100 голосовой связи представляет собой систему, в которой пользователь (пользователь A на стороне ближнего конца), использующий терминал 50 (терминал ближнего конца), находится в голосовой связи с пользователем (пользователем B на стороне дальнего конца), использующим сотовый телефон 54 (терминал дальнего конца). Входной голосовой сигнал посредством сотового телефона 54 усиливается и выводится динамиком 52, причем микрофон 51 принимает голосовой сигнал, подаваемый пользователем на стороне ближнего конца, и передает на сотовый телефон 54. Таким образом, пользователь A может совершать усиленный голосовой вызов (вызов по громкой связи) и при этом не держать сотовый телефон 53 в руках. Сотовый телефон 53 и сотовый телефон 54 соединены друг с другом посредством телефонной линии связи общего пользования.

[0021]

Устройство 1 эхоподавления подавляет эхосигналы, генерируемые при поступлении выходных голосовых сигналов из динамика 52 на микрофон 51. Устройство 1 эхоподавления предусмотрено между терминалом 50 и сотовым телефоном 53, т.е. в тракте прохождения передаваемого сигнала для передачи уловленного микрофоном 51 звукового сигнала от микрофона 51 к сотовому телефону 53 и в тракте прохождения принимаемого сигнала для передачи принимаемого сигнала от сотового телефона 54 на стороне дальнего конца от сотового телефона 53 на динамик 52.

[0022]

Устройство 1 эхоподавления может быть выполнено в виде специализированной платы, установленной на речевом терминале или т.п. (например, встроенное устройство, система конференц-связи или мобильный терминал) в системе 100 голосовой связи. Кроме того, устройство 1 эхоподавления может включать в себя, например, компьютерное аппаратное и программное обеспечение (программу эхоподавления). Программа эхоподавления может быть заранее сохранена, например, на HDD в качестве носителя данных, встроенного в устройство, такое как компьютер, и в ПЗУ на микрокомпьютере, содержащем центральный процессор (ЦП), и может быть установлена с него на компьютер. Кроме того, программа эхоподавления может временно или постоянно храниться (находиться в памяти) на съемном носителе данных, таком как полупроводниковое запоминающее устройство, карта памяти, оптический диск, магнитооптический диск, магнитный диск или т.п.

[0023]

На ФИГ. 2 представлена структурная схема, изображающая общую конфигурацию устройства 1 эхоподавления. Устройство 1 эхоподавления главным образом включает в себя блок 11 регулировки уровня, блок 13 удаления эха и блок 15 обнаружения одновременного разговора. На ФИГ. 2 верхний тракт прохождения сигнала представляет собой тракт прохождения передаваемого сигнала, а нижний тракт прохождения сигнала представляет собой тракт прохождения принимаемого сигнала.

[0024]

Блок 11 регулировки уровня предусмотрен в тракте прохождения принимаемого сигнала. Блок 11 регулировки уровня преимущественно включает в себя регулятор 111 усиления и компрессор 112.

[0025]

Регулятор 111 усиления представляет собой блок регулировки коэффициента усиления, который регулирует коэффициент усиления входного принимаемого сигнала. В частности, регулятор 111 усиления регулирует уровень (коэффициент усиления) усиления входного сигнала для регулировки уровня (амплитуды) выходного сигнала. Регулятор 111 усиления может автоматически изменять коэффициент усиления в зависимости от шума или т.п. в окружающей среде, в которой установлен терминал 50. Дополнительно при приведении в действие блока ввода, такого как ручка регулировки, регулятор 111 усиления может изменять коэффициент усиления в зависимости от положения блока ввода.

[0026]

Выходной сигнал от регулятора 111 усиления поступает на компрессор 112. Компрессор 112 усиливает (т.е. сжимает) принятый сигнал, превышающий порог, из числа входных принимаемых сигналов, с предварительно заданным коэффициентом (коэффициент имеет значение меньше 1) и выводит сигнал. Компрессор 112 будет подробно описан ниже.

[0027]

Следует отметить, что в настоящем варианте осуществления блок 11 регулировки уровня включает в себя регулятор 111 усиления и компрессор 112, но регулятор 111 усиления является необязательным. При отсутствии регулятора 111 усиления принимаемый сигнал, передаваемый с сотового телефона 53, поступает непосредственно на компрессор 112, и компрессор 112 должен только сжимать принятый сигнал, превышающий порог, из числа входных принимаемых сигналов.

[0028]

Блок 13 удаления эха предусмотрен в тракте прохождения передаваемого сигнала для удаления остаточного эха из уловленного звукового сигнала, выводимого с микрофона 51. Блок 13 удаления эха представляет собой линейный эхокомпенсатор, который удаляет остаточное эхо с помощью адаптивного фильтра. Более конкретно, блок 13 удаления эха обновляет коэффициент фильтра в соответствии с заданной процедурой для генерирования сигнала псевдоэхо из сигнала, переданного через тракт прохождения принимаемого сигнала, и вычитает сигнал псевдоэхо из сигнала, переданного через тракт прохождения передаваемого сигнала, для удаления остаточного эха. Следует отметить, что адаптивные фильтры хорошо известны, и, таким образом, описание адаптивного фильтра опущено.

[0029]

Следует отметить, что в настоящем варианте осуществления адаптивный фильтр применяют к блоку 13 удаления эха, но в блоке 13 удаления эха можно применять и другой известный алгоритм удаления эха.

[0030]

После удаления из сигнала остаточного эхо с помощью блока 13 удаления эха этот сигнал передают на сотовый телефон 53. Сигнал, из которого остаточное эхо было удалено блоком 13 удаления эха, является входным сигналом для блока 15 обнаружения одновременного разговора.

[0031]

Блок 15 обнаружения одновременного разговора определяет, находится ли входной голосовой сигнал, передаваемый в устройство 1 эхоподавления, в состоянии одиночного разговора или в состоянии одновременного разговора. В данном случае термин «одиночный разговор» относится к состоянию (речь на ближнем конце или речь на дальнем конце), в котором либо пользователь A, либо пользователь B эмитирует голос, а сигнал передают либо в тракт прохождения передаваемого сигнала, либо в тракт прохождения принимаемого сигнала. Одновременный разговор относится к состоянию (речь на ближнем конце или речь на дальнем конце), в котором как пользователь A, так и пользователь B эмитируют голоса, а сигналы одновременно передают в тракт прохождения передаваемого сигнала и тракт прохождения принимаемого сигнала.

[0032]

Например, блок 15 обнаружения одновременного разговора хранит частотную маску, сгенерированную на основании обучающего сигнала. Обучающий сигнал представляет собой сигнал, передаваемый через тракт прохождения передаваемого сигнала во время односторонней речи (одиночный разговор) на стороне дальнего конца, где на микрофон 51 попадает только звук, выводимый из динамика 52. Частотная маска получает максимальное значение из числа значений спектров мощности множества входных обучающих сигналов.

[0033]

Блок 15 обнаружения одновременного разговора сравнивает значение спектра мощности уловленного звукового сигнала со значением частотной маски для каждой полосы частот. Когда количество полос частот, в которых значение уловленного звукового сигнала превышает значение частотной маски, равно постоянному значению или превышает его, происходит обнаружение подачи звука с микрофона 51, и сигнал передают (присутствует речь на ближнем конце) через тракт прохождения передаваемого сигнала. Блок 15 обнаружения одновременного разговора сравнивает значение спектра мощности принимаемого сигнала со значением частотной маски для каждой полосы частот. Когда количество полос частот, в которых значение принимаемого сигнала превышает значение частотной маски, равно постоянному значению или превышает его, происходит обнаружение передачи сигнала (присутствует речь на дальнем конце) через тракт прохождения принимаемого сигнала.

[0034]

Однако блок 15 обнаружения одновременного разговора может определять нахождение сигнала в состоянии одиночного разговора или в состоянии одновременного разговора с использованием других различных известных способов.

[0035]

Компрессор 112 будет подробно описан ниже. Результаты поступают на компрессор 112 от блока 15 обнаружения одновременного разговора. Компрессор 112 осуществляет различные процессы в зависимости от того, находится ли сигнал в состоянии одновременного разговора.

[0036]

На ФИГ. 3 представлена схема, схематически иллюстрирующая процесс, осуществляемый компрессором 112 при определении состояния одновременного разговора. Если блок 15 обнаружения одновременного разговора определяет состояние одновременного разговора, компрессор 112 осуществляет процесс сжатия для сигнала, превышающего порог I, из числа принимаемых сигналов.

[0037]

На ФИГ. 4 представлена схема, схематически иллюстрирующая процесс, осуществляемый компрессором 112 при необнаружении состояния одновременного разговора. Если блок 15 обнаружения одновременного разговора не определяет состояние одновременного разговора, компрессор 112 осуществляет процесс сжатия для сигнала, превышающего порог II, из числа принимаемых сигналов. Порог II больше порога I.

[0038]

При наличии состояния одновременного разговора операция, осуществляемая блоком 13 удаления эха, как правило, является нестабильной. Таким образом, порог I уменьшается, и пик голосового сигнала, поступающего от динамика 52, уменьшается таким образом, что блок 13 удаления эха надежно срабатывает. Напротив, при отсутствии состояния одновременного разговора, поскольку ощущение дискомфорта, вероятно, будет ощущаться в голосе из-за слишком низкого пика голосового сигнала, для поддержания качества голоса используют порог II, превышающий порог I.

[0039]

На ФИГ. 3 и 4, сплошной линией показан сигнал перед осуществлением компрессором 112 процесса сжатия, а пунктирной линией показан сигнал после осуществления компрессором 112 процесса сжатия. В процессе сжатия компрессор 112 умножает принятый сигнал, превышающий порог I или порог II, из числа принимаемых сигналов, вводимых с регулятора 111 усиления, на коэффициент 1 или менее, который задают для принимаемого сигнала, таким образом можно уменьшить уровень выходного сигнала.

[0040]

В результате можно уменьшить искаженный звук, создаваемый сильной вибрацией динамика 52, корпусом, удерживающим динамик 52, компонентом, предусмотренным в корпусе, или т.п. В частности, если эффективность динамика 52 или усилителя динамика 55 является низкой, терминал 50 небольшой и т.п., искаженный звук, скорее всего, будет генерироваться вследствие вибраций динамика 52 или т.п., но понижение уровня голоса значительно уменьшает искаженный звук.

[0041]

За счет уменьшения искаженного звука на динамике 52 сигналы, генерируемые путем захвата звуков микрофоном 51 с подачей в блок 13 удаления эха вряд ли содержат нелинейные эхосигналы, и блок 13 удаления эха может в достаточной степени устранять эхосигналы.

[0042]

Кроме того, компрессор 112 не осуществляет процесс сжатия для принятого сигнала, который меньше порога I или порога II, и выводит входной сигнал как есть. В результате значительно снижается неприятное ощущение из-за изменения громкости звука динамика 52 и прерывания голоса.

[0043]

В соответствии с настоящим вариантом осуществления процесс сжатия для сигнала, превышающего порог I или порог II, позволяет предотвратить нелинейные эхосигналы и стабилизировать режим работы блока 13 удаления эха. Это позволяет снижать ухудшение качества голоса при одновременном уменьшении некомпенсированных эхосигналов.

[0044]

Кроме того, в соответствии с настоящим вариантом осуществления нелинейное эхо будет возникать с меньшей вероятностью, поэтому необходимо предусмотреть только блок 13 удаления эха, который удаляет линейное эхо, и можно уменьшить количество вычислений, необходимых для удаления эхосигналов.

[0045]

Например, в отсутствие компрессора 112, если нелинейное эхо велико и эхо следует компенсировать, необходим эхоподавитель, как и в предшествующем уровне техники. Таким образом, всегда требуется большое количество расчетов, что замедляет осуществление процессов. Например, также понятно применение блока удаления эха с использованием нелинейного адаптивного фильтра, такого как фильтр Вольтерра (Volterra), для подавления нелинейных эхосигналов. Однако требуется огромное количество расчетов (в 10 или более раз больше, чем в случае линейного эхокомпенсатора).

[0046]

Напротив, в соответствии с настоящим вариантом осуществления за счет уменьшения вибрации динамика 52 или т.п. уменьшается разница между принимаемым сигналом, принятым приемной стороной, и голосовым сигналом, выводимым с динамика 52, таким образом можно уменьшить нелинейные эхосигналы и обеспечить достаточное удаление эхосигналов только блоком 13 удаления эха, который представляет собой линейный эхокомпенсатор.

[0047]

Следует отметить, что в настоящем варианте осуществления при определении состояния одновременного разговора компрессор 112 осуществляет процесс сжатия для принимаемого сигнала, превышающего порог I, а при необнаружении состояния одновременного разговора процесс сжатия выполняют для принимаемого сигнала, превышающего порог II (который превышает порог I). Однако при необнаружении состояния одновременного разговора выполнение процесса сжатия для принимаемого сигнала, превышающего порог II, не является обязательным. Однако для предотвращения ухудшения качества голоса при уменьшении нелинейных эхосигналов желательно выполнять процесс сжатия в обоих случаях - при обнаружении состояния одновременного разговора и при необнаружении состояния одновременного разговора.

[0048]

Кроме того, в настоящем варианте осуществления, если блок 15 обнаружения одновременного разговора определяет состояние одновременного разговора, компрессор 112 осуществляет процесс сжатия для сигнала, превышающего порог I, из числа принимаемых сигналов, но порог, применяемый в состоянии одновременного разговора, может изменяться в зависимости от ситуации.

[0049]

Например, при определении переменного порога в качестве порога I, компрессор 112 устанавливает порог Ia, когда коэффициент усиления для усиления принимаемого сигнала в регуляторе 111 усиления представляет собой определенное значение (заданное как значение a) в качестве порога Ia. Когда коэффициент усиления становится больше значения a, порог I устанавливают меньше порога Ia, а когда коэффициент усиления становится меньше значения a, порог I устанавливают больше порога Ia. Однако максимальное значение порога I устанавливают меньше порога II. В результате, даже если из регулятора 111 усиления выходит большой голосовой сигнал, нелинейные эхосигналы можно уменьшить за счет уменьшения пика голосового сигнала компрессором 112.

[0050]

Кроме того, в настоящем варианте осуществления, хотя коэффициент (значение меньше 1), используемый компрессором 112 в процессе сжатия, является постоянным, коэффициент, используемый в процессе сжатия, может изменяться в зависимости от ситуации.

[0051]

На ФИГ. 5 представлена схема, схематически иллюстрирующая процесс, осуществляемый компрессором 112 при изменении коэффициента усиления. Например, при определении переменного коэффициента в качестве коэффициента b компрессор 112 задает коэффициент b, когда коэффициент усиления для усиления принимаемого сигнала в регуляторе 111 усиления представляет собой значение a в качестве коэффициента c. По мере того как коэффициент усиления становится больше значения a, коэффициент b устанавливают меньше коэффициента c, а по мере того как коэффициент усиления становится меньше значения a, коэффициент b устанавливают больше коэффициента c. В данном случае, если процентная доля снижения в уровне выходного сигнала в процессе сжатия определяется как степень сжатия, то степень сжатия возрастает с уменьшением коэффициента. Таким образом, по мере увеличения коэффициента усиления степень сжатия возрастает, а по мере уменьшения коэффициента усиления степень сжатия уменьшается. В результате, даже если из регулятора 111 усиления выходит большой голосовой сигнал, нелинейные эхосигналы можно уменьшить за счет уменьшения пика голосового сигнала компрессором 112.

[0052]

Например, компрессор 112 может изменять степень сжатия на основании информации об искажениях динамика 52. В данном случае информация об искажениях динамика 52 представляет собой, например, общий коэффициент гармонических искажений (или коэффициент гармоник), представляющий степень искажения сигнала. Общий коэффициент гармонических искажений при малом значении указывает на небольшие искажения динамика 52 и на большие искажения динамика 52 при большом значении коэффициента. Таким образом, компрессор 112 может повышать степень сжатия при большом общем коэффициенте нелинейных искажений и уменьшать степень сжатия при уменьшении общего коэффициента гармонических искажений. В результате при использовании динамика 52, в котором могут возникать искажения, уменьшение пика голосового сигнала компрессором 112 позволяет уменьшать нелинейные эхосигналы.

[0053]

Второй вариант осуществления

Второй вариант осуществления настоящего изобретения имеет конфигурацию, в которой предусмотрен эхоподавитель. Далее будет описано устройство 2 эхоподавления в соответствии со вторым вариантом осуществления. Устройство 2 эхоподавления особенно подходит для случая, когда окружающая среда встроенного устройства или т.п. может сильно изменяться. Следует отметить, что те же компоненты, что и в устройстве 1 эхоподавления в соответствии с первым вариантом осуществления, обозначены одними и теми же номерами позиций и описание этих компонентов будет опущено.

[0054]

На ФИГ. 6 представлена структурная схема, изображающая общую конфигурацию устройства 2 эхоподавления. Устройство 2 эхоподавления главным образом содержит блок 11 регулировки уровня, эквалайзер 12, блок 13 удаления эха, эхоподавитель 14, блок 15 обнаружения одновременного разговора, блок 16 оценки шума, блок 17 подавления шума и эквалайзер 18.

[0055]

Эквалайзеры 12, 18 поднимают или понижают отдельную полосу частот голосового сигнала. Однако эквалайзеры 12, 18 не являются обязательными.

[0056]

Эхоподавитель 14 осуществляет быстрое преобразование Фурье сигнала после удаления линейного эха блоком 13 удаления эха, осуществляет процесс эхоподавления (процесс сильного подавления эхосигналов) для сигнала после выполнения быстрого преобразования Фурье и осуществляет обратное быстрое преобразование Фурье сигнала после выполнения процесса эхоподавления для удаления нелинейного эха. Обработка для эхоподавления хорошо известна, и, таким образом, подробное описание обработки опущено.

[0057]

Если блок 15 обнаружения одновременного разговора определяет отсутствие передачи сигнала через тракт прохождения передаваемого сигнала, но происходит передача сигнала через тракт прохождения принимаемого сигнала, эхоподавитель 14 может осуществлять процесс подавления эхосигналов для сигнала, из которого остаточное эхо было удалено блоком 13 удаления эха.

[0058]

Однако в настоящем варианте осуществления, поскольку компрессор 112 уменьшает нелинейные эхосигналы, а блок 13 удаления эха в достаточной степени удаляет эхокомпоненты, эхоподавитель 14 фактически работает только тогда, когда уровень громкости звука динамика 52 установлен большим, например в случае, когда голосовой уровень внешнего шума является большим и генерируется множество нелинейных эхосигналов.

[0059]

Следует отметить, что в настоящем варианте осуществления эхоподавитель 14 осуществляет частотный анализ с использованием быстрого преобразования Фурье, но вместо быстрого преобразования Фурье для частотного анализа можно использовать дискретное преобразование Фурье (DFT). Кроме того, эхоподавитель 14 может выполнять обратное дискретное преобразование Фурье вместо быстрого преобразования Фурье.

[0060]

Блок 16 оценки шума оценивает шумовой компонент, содержащийся в сигнале с удаленным эхо, преобразованным в функцию частотной области посредством эхоподавителя 14, а именно оцененный шумовой сигнал, для каждой частотной области и оценивает соотношение сигнал-шум (SN) для сигнала с удаленным эхом на основании спектральной плотности мощности оцененного шумового сигнала, который был оценен. Блок 17 подавления шума подавляет шумовой сигнал в сигнале с удаленным эхом на основании спектральной плотности мощности оцененного шумового сигнала, оцененного блоком 16 оценки шума, и генерирует сигнал с подавленным шумом. Следует отметить, что блок 16 оценки шума и блок 17 подавления шума необязательны.

[0061]

В соответствии с настоящим вариантом осуществления возможно удаление эхокомпонента даже при генерировании множества нелинейных эхосигналов. Например, во встроенном устройстве окружающая среда может сильно изменяться при вождении транспортного средства. При большом внешнем шуме прослушивание исходящего из динамика 52 звука затруднено. Следовательно, приходится увеличивать громкость звука динамика 52 и повышать громкость голоса пользователя B на стороне дальнего конца, в результате чего возрастают линейные эхосигналы и нелинейные эхосигналы. Блок 13 удаления эха может удалять линейные эхосигналы, но не может удалять нелинейные эхосигналы. В настоящем варианте осуществления за счет эхоподавителя 14 возможно удаление эхокомпонентов даже при генерировании множества нелинейных эхосигналов.

[0062]

Третий вариант осуществления

Третий вариант осуществления имеет конфигурацию, в которой работа компрессора отличается в зависимости от каждой полосы частот. Далее будет описано устройство 3 эхоподавления в соответствии с третьим вариантом осуществления. Следует отметить, что те же компоненты, что и в устройстве 1 эхоподавления в соответствии с первым вариантом осуществления, обозначены одними и теми же номерами позиций и описание этих компонентов будет опущено.

[0063]

На ФИГ. 7 представлена структурная схема, изображающая общую конфигурацию устройства 3 эхоподавления. Устройство 3 эхоподавления главным образом содержит блок 11 регулировки уровня, блок 13 удаления эха и блок 15 обнаружения одновременного разговора. Блок 11A регулировки уровня главным образом включает в себя регулятор 111 усиления и компрессор 112A.

[0064]

Компрессор 112A сравнивает уровень голоса с порогом для каждой полосы частот и осуществляет процесс сжатия для принимаемого сигнала в полосе частот, в которой уровень голоса превышает порог. Компрессор 112A включает в себя блок обработки, который осуществляет преобразование Фурье и обратное преобразование Фурье.

[0065]

Компрессор 112A осуществляет преобразование Фурье принимаемого сигнала для разделения мощности, которая представляет собой среднюю энергию в единицу времени, на мощность для каждой полосы частот и вычисляет спектр мощности, который выражает мощность для каждой полосы частот в зависимости от частоты для каждого единичного интервала времени. Компрессор 112A сравнивает значение принимаемого сигнала с порогом для каждой полосы частот и осуществляет процесс сжатия для сигнала, который превышает порог или равен ему в полосе частот.

[0066]

На ФИГ. 8 представлена схема, схематически иллюстрирующая процесс, осуществляемый компрессором 112A. Сплошная линия на ФИГ. 8 обозначает принимаемый сигнал. Если блок 15 обнаружения одновременного разговора определяет состояние одновременного разговора, компрессор 112A осуществляет процесс сжатия для сигнала в полосе частот, в которой значение сигнала превышает порог III. Пунктирная линия на ФИГ. 8 обозначает сигнал после выполнения компрессором 112A процесса сжатия для сигнала, превышающего порог III. Более того, если блок 15 обнаружения одновременного разговора не определяет состояние одновременного разговора, компрессор 112A осуществляет процесс сжатия для сигнала в полосе частот, в которой значение сигнала превышает порог IV. Пунктирная линия на ФИГ. 8 обозначает сигнал после выполнения компрессором 112A процесса сжатия для сигнала, превышающего порог IV. Порог IV больше порога III.

[0067]

Компрессор 112A выдает сигнал, полученный путем выполнения обратного преобразования Фурье с сигналом после сжатия.

[0068]

В соответствии с настоящим вариантом осуществления путем изменения наличия или отсутствия процесса сжатия для каждой полосы частот можно снизить долю сигналов, сжимаемых компрессором 112, чтобы получить еще более естественный голос, что позволяет повысить качество телефонного разговора.

[0069]

Следует отметить, что в настоящем варианте осуществления, хотя компрессор 112A осуществляет в полосе частот процесс сжатия для сигнала, который превышает порог III или порог IV, вне зависимости от полосы частот, порог можно изменять и в зависимости от полосы частот. Например, голосовой компонент на низкой частоте, вероятно, вызовет искажения, и поэтому порог можно уменьшать по мере понижения частоты, а по мере повышения частоты порог можно увеличивать.

[0070]

Выше подробно описаны варианты осуществления изобретения со ссылкой на графические материалы. Однако конкретные конфигурации не ограничиваются представленными вариантами осуществления, а также включают в себя изменения в конструкции или т.п., не выходящие за рамки сущности изобретения.

Перечень условных обозначений

[0071]

1, 2, 3 - Устройство эхоподавления

11, 11A - Блок регулировки уровня

12 - Эквалайзер

13 - Блок удаления эха

14 - Эхоподавитель

15 - Блок обнаружения одновременного разговора

16 - Блок оценки шума

17 - Блок подавления шума

18 - Эквалайзер

50 - Терминал

51 - Микрофон

52 - Динамик

53 - Сотовый телефон

54 - Сотовый телефон

55 - Усилитель динамика

100 - Система голосовой связи

111 - Регулятор усиления

112, 112A - Компрессор.

Похожие патенты RU2799561C2

название год авторы номер документа
УСТРОЙСТВО ЭХОПОДАВЛЕНИЯ, СПОСОБ ЭХОПОДАВЛЕНИЯ И ПРОГРАММА ЭХОПОДАВЛЕНИЯ 2018
  • Сатоми, Юки
RU2732362C1
УСТРОЙСТВО ЭХОПОДАВЛЕНИЯ, СПОСОБ ЭХОПОДАВЛЕНИЯ И ПРОГРАММА ЭХОПОДАВЛЕНИЯ 2019
  • Сатоми, Юки
RU2767297C1
УСТРОЙСТВО ЭХОПОДАВЛЕНИЯ, СПОСОБ ЭХОПОДАВЛЕНИЯ И ПРОГРАММА ЭХОПОДАВЛЕНИЯ 2019
  • Сатоми, Юки
RU2786157C2
СЕТЕВОЙ ЭХОПОДАВИТЕЛЬ 1993
  • Гилберт С.Сих[Us]
RU2109408C1
МНОГОКАНАЛЬНОЕ АКУСТИЧЕСКОЕ ЭХОПОДАВЛЕНИЕ 2010
  • Трики Махди
  • Янсе Корнелис Питер
RU2546717C2
УСТРОЙСТВО И СПОСОБ РАСЧЕТА КОЭФФИЦИЕНТОВ ФИЛЬТРА ЭХОПОДАВЛЕНИЯ 2009
  • Кюх Фабиан
  • Каллингер Маркус
  • Фаллер Кристоф
  • Фаврот Алексис
RU2485607C2
ЭХОПОДАВЛЕНИЕ, СОДЕРЖАЩЕЕ МОДЕЛИРОВАНИЕ КОМПОНЕНТОВ ПОЗДНЕЙ РЕВЕРБЕРАЦИИ 2011
  • Кюх Фабиан
  • Шмидт Маркус
  • Фаллер Кристоф
  • Фавро Алексис
RU2569006C2
УСТРОЙСТВО ПОДАВЛЕНИЯ АКУСТИЧЕСКОГО ЭХА И ФРОНТАЛЬНОЕ УСТРОЙСТВО КОНФЕРЕНЦСВЯЗИ 2009
  • Кюх Фабиан
  • Каллингер Маркус
  • Шмидт Маркус
  • Зоуруб Мерай
  • Диатшук Марко
  • Мозер Оливер
RU2520359C2
УСТРОЙСТВО И СПОСОБ РАСЧЕТА ПАРАМЕТРОВ УПРАВЛЕНИЯ ФИЛЬТРА ЭХОПОДАВЛЕНИЯ И УСТРОЙСТВО И СПОСОБ РАСЧЕТА ВЕЛИЧИНЫ ЗАДЕРЖКИ 2009
  • Кюх Фабиан
  • Каллингер Маркус
  • Фаллер Кристоф
  • Фаврот Алексис
RU2495506C2
УЛУЧШЕННАЯ СИСТЕМА И СПОСОБ РЕАЛИЗАЦИИ ЭХОПОДАВИТЕЛЯ 2001
  • Гупта Самир К.
RU2277301C2

Иллюстрации к изобретению RU 2 799 561 C2

Реферат патента 2023 года УСТРОЙСТВО ЭХОПОДАВЛЕНИЯ, СПОСОБ ЭХОПОДАВЛЕНИЯ И ПРОГРАММА ЭХОПОДАВЛЕНИЯ

Изобретение относится к акустике, в частности, к устройствам для эхоподавления. Устройство эхоподавления для подавления эха, генерируемого при поступлении выходного голосового сигнала из динамика в микрофон содержит блок регулировки уровня, предусмотренный в тракте прохождения принимаемого сигнала для передачи принимаемого сигнала со стороны дальнего конца на динамик; блок удаления эха, предусмотренный в тракте прохождения передаваемого сигнала для передачи сигнала, вводимого с микрофона, причем блок удаления эха удаляет остаточное эхо из уловленного звукового сигнала, выводимого с микрофона; и блок обнаружения одновременного разговора, который определяет нахождение сигналов в состоянии одновременного разговора, при котором сигналы одновременно передают в тракт прохождения передаваемого сигнала и в тракт прохождения принимаемого сигнала. Блок регулировки уровня включает в себя компрессор, который осуществляет процесс сжатия для сигнала, превышающего первый порог, из числа принимаемых сигналов, если блок обнаружения одновременного разговора определяет состояние одновременного разговора. Технические результаты – уменьшение нелинейных эхосигналов, уменьшение некомпенсированных эхосигналов и улучшение качества разговорной речи. 3 н. и 6 з.п. ф-лы, 8 ил.

Формула изобретения RU 2 799 561 C2

1. Устройство эхоподавления для подавления эха, генерируемого при поступлении выходного голосового сигнала из динамика в микрофон, содержащее:

блок регулировки уровня, предусмотренный в тракте прохождения принимаемого сигнала для передачи принимаемого сигнала со стороны дальнего конца на динамик;

блок удаления эха, предусмотренный в тракте прохождения передаваемого сигнала для передачи сигнала, вводимого с микрофона, причем блок удаления эха удаляет остаточное эхо из уловленного звукового сигнала, выводимого с микрофона; и

блок обнаружения одновременного разговора, который определяет нахождение сигналов в состоянии одновременного разговора, при котором сигналы одновременно передают в тракт прохождения передаваемого сигнала и в тракт прохождения принимаемого сигнала, причем

блок регулировки уровня включает в себя компрессор, который осуществляет процесс сжатия для сигнала, превышающего первый порог, из числа принимаемых сигналов, если блок обнаружения одновременного разговора определяет состояние одновременного разговора.

2. Устройство эхоподавления по п. 1, в котором

если блок обнаружения одновременного разговора не определяет состояние одновременного разговора, компрессор осуществляет процесс сжатия для сигнала, превышающего второй порог, который превышает первый порог, из числа принимаемых сигналов.

3. Устройство эхоподавления по п. 1 или 2, в котором

блок регулировки уровня включает в себя блок регулировки коэффициента усиления, который регулирует коэффициент усиления принимаемого сигнала, а

компрессор регулирует порог таким образом, что первый порог становится небольшим по мере увеличения коэффициента усиления, и компрессор осуществляет процесс сжатия для выходного сигнала, поступающего от блока регулировки коэффициента усиления.

4. Устройство эхоподавления по п. 3, в котором

компрессор повышает степень сжатия по мере увеличения коэффициента усиления.

5. Устройство эхоподавления по любому из пп. 1-3, в котором

компрессор изменяет степень сжатия на основании информации об искажениях динамика.

6. Устройство эхоподавления по любому из пп. 1-5, дополнительно содержащее:

эхоподавитель, который осуществляет процесс для подавления эха в сигнале, из которого остаточное эхо было удалено блоком удаления эха.

7. Устройство эхоподавления по любому из пп. 1-6, в котором

компрессор сравнивает значение принимаемого сигнала с третьим порогом для каждой полосы частот, и в случае, если блок обнаружения одновременного разговора определяет состояние одновременного разговора, компрессор осуществляет процесс сжатия для принимаемого сигнала со значением, превышающим третий порог.

8. Способ эхоподавления для подавления эха в терминале ближнего конца, содержащем динамик и микрофон, включающий:

определение нахождения сигналов в состоянии одновременного разговора, при котором сигналы одновременно передают в тракт прохождения передаваемого сигнала для передачи входного сигнала с микрофона и в тракт прохождения принимаемого сигнала для передачи сигнала на динамик;

выполнение процесса сжатия для сигнала, превышающего первый порог, из числа принимаемых сигналов со стороны дальнего конца при определении состояния одновременного разговора;

выведение сигнала после процесса сжатия из динамика; и

удаление остаточного эха из уловленного звукового сигнала, выводимого с микрофона.

9. Съемный носитель данных, на котором хранится программа эхоподавления для подавления эха в терминале ближнего конца, содержащем динамик и микрофон, причем программа эхоподавления заставляет компьютер функционировать в качестве:

блока обнаружения одновременного разговора, который определяет нахождение сигналов в состоянии одновременного разговора, при котором сигналы одновременно передают в тракт прохождения передаваемого сигнала для передачи сигнала, вводимого с микрофона, и в тракт прохождения принимаемого сигнала для передачи сигнала на динамик;

компрессора, который осуществляет процесс сжатия для сигнала, превышающего первый порог, из числа принимаемых сигналов со стороны дальнего конца при определении состояния одновременного разговора; и

блока удаления эха, который удаляет остаточное эхо из уловленного звукового сигнала, выводимого с микрофона.

Документы, цитированные в отчете о поиске Патент 2023 года RU2799561C2

US 3973086 A, 03.08.1976
US 3305646 A1, 21.02.1967
US 3313893 A, 11.04.1967
US 20080205632 A1, 28.08.2008
EP 2822263 B1, 27.03.2019
US 8600037 B2, 03.12.2013
WO 1995023477 A1, 31.08.1995
DE 3724346 A1, 24.11.1988
US 20030174847 A1, 18.09.2003.

RU 2 799 561 C2

Авторы

Сатоми, Юки

Даты

2023-07-06Публикация

2020-03-17Подача