Перекрестные ссылки на родственные заявки
[0001] Заявка притязает на приоритет предварительной заявки на патент (США) 62/993149, поданной 23 марта 2020 года, и предварительной заявки на патент (США) 63/153523, поданной 25 февраля 2021 года, каждая из которых настоящим полностью содержится в данном документе по ссылке.
Область техники, к которой относится изобретение
[0002] Настоящее раскрытие сущности относится к аудиообработке и, в частности, к эхоподавлению.
Уровень техники
[0003] Если не указано иное в данном документе, подходы, описанные в этом разделе, не представляют собой предшествующий уровень техники по отношению к формуле изобретения в этой заявке и не признаются предшествующим уровнем техники посредством включения в этот раздел.
[0004] Устройство связи, такое как система проведения аудиоконференций, в общем, включает в себя и громкоговоритель и микрофон. Две стороны в связи могут называться "стороной на ближнем конце" и "стороной на дальнем конце". Сторона на ближнем конце является ближайшей к первому устройству связи, и сторона на дальнем конце находится в местоположении, отличном от местоположения стороны на ближнем конце, и обменивается данными с использованием второго устройства связи через сеть проводной или беспроводной связи. Микрофон устройства на ближнем конце захватывает не только речь стороны на ближнем конце, но и также может захватывать речь стороны на дальнем конце, которая выведена из громкоговорителя на ближнем конце. Вывод из громкоговорителя, который захватывается посредством микрофона, в общем, называется "эхо-сигналом". Устройство связи на ближнем конце, в общем, включает в себя систему управления эхо-сигналом для уменьшения эхо-сигнала до передачи аудио, захваченного на ближнем конце, в дальний конец.
[0005] Система управления эхо-сигналом, в общем, включает в себя систему эхокомпенсации и последующую систему эхоподавления. Система эхокомпенсации представляет собой линейную систему и типично может включать в себя адаптивный фильтр. Эхо-сигнал, остающийся в аудиосигнале после эхокомпенсации, в общем, называется "остаточным эхо". Система эхоподавления представляет собой нелинейную систему, которая применяет дополнительное затухание к аудиосигналу, чтобы уменьшать остаточное эхо. Затухание, выполняемое посредством системы эхоподавления, называется "нелинейным" в том, что оно может применять различные усиления к различным частотам или полосам частот.
[0006] Устройства связи, в общем, реализуют приблизительно агрегированные 50 дБ для эхоуменьшения на основе долей физических потерь на отражение эхо-сигнала (например, вследствие расстояния между громкоговорителем и микрофоном), эхокомпенсации и эхоподавления.
Сущность изобретения
[0007] Одна проблема существующих систем управления эхо-сигналом заключается в том, что переносные компьютеры все в большей степени используются для связи, к примеру, для аудиоконференц-связи или видеоконференц-связи. В переносном компьютере, громкоговоритель и микрофон находятся в непосредственной близости, затрудняя достижения цели в 50 дБ для эхоуменьшения. С учетом вышеизложенного, существует потребность в том, чтобы улучшать систему эхоподавления, чтобы уменьшать остаточное эхо.
[0008] Согласно варианту осуществления, машинореализованный способ аудиообработки включает в себя прием опорного сигнала и остаточного эхо-сигнала. Способ дополнительно включает в себя формирование полосового опорного сигнала и полосового остаточного эхо-сигнала посредством выполнения формирования полос частот для опорного сигнала и остаточного эхо-сигнала, соответственно. Способ дополнительно включает в себя вычисление оцененного профиля усилений по мощности и мощности обратной связи на основе полосового опорного сигнала и полосового остаточного эхо-сигнала. Способ дополнительно включает в себя вычисление оцененной мощности остаточного эха на основе полосового остаточного эхо-сигнала, мощности обратной связи и оцененного профиля усилений по мощности. Способ дополнительно включает в себя вычисление множества полосовых усилений на основе полосового остаточного эхо-сигнала и оцененной мощности остаточного эхо. Способ дополнительно включает в себя формирование модифицированного остаточного эхо-сигнала посредством применения множества полосовых усилений к остаточному эхо-сигналу.
[0009] Согласно другому варианту осуществления, устройство включает в себя громкоговоритель, микрофон и процессор. Процессор выполнен с возможностью управлять устройством таким образом, чтобы реализовывать один или более способов, описанных в данном документе. Устройство дополнительно может включать в себя подробности, аналогичные подробностям одного или более способов, описанных в данном документе.
[0010] Согласно другому варианту осуществления, невременный считываемый компьютером носитель хранит компьютерную программу, которая, при выполнении процессором, управляет устройством таким образом, чтобы выполнять обработку, включающую в себя один или более способов, описанных в данном документе.
[0011] Нижеприведенное подробное описание и прилагаемые чертежи предоставляют дополнительное понимание характера и преимуществ различных реализаций.
Краткое описание чертежей
[0012] Фиг. 1 является блок-схемой системы 100 управления эхо-сигналом.
[0013] Фиг. 2 является блок-схемой модуля 201 эхокомпенсации (см. фиг. 1).
[0014] Фиг. 3 является блок-схемой модуля 301 эхоподавления (см. фиг. 1).
[0015] Фиг. 4 является блок-схемой модуля 400 вычисления мощности обратной связи.
[0016] Фиг. 5 является гистограммой взаимосвязи между мощностью обратной связи и передаточной функцией
ошибок (остаточных эхо) адаптивного фильтра.
[0017] Фиг. 6 является графиком, который иллюстрирует функцию плотности распределения вероятностей.
[0018] Фиг. 7 является архитектурой 700 мобильного устройства для реализации признаков и процессов, описанных в данном документе, согласно варианту осуществления.
[0019] Фиг. 8 является блок-схемой последовательности операций способа 800 аудиообработки.
Подробное описание изобретения
[0020] В данном документе описываются технологии, связанные с эхоподавлением. В нижеприведенном описании, для целей пояснения, множество примеров и конкретных подробностей поясняются для того, чтобы предоставлять полное понимание настоящего раскрытия сущности. Тем не менее, специалистам в данной области техники должно быть очевидным, что настоящее раскрытие сущности, заданное посредством формулы изобретения, может включать в себя некоторые или все признаки в этих примерах отдельно или в комбинации с другими признаками, описанными ниже, и дополнительно может включать в себя модификации и эквиваленты признаков и концепций, описанных в данном документе.
[0021] В нижеприведенном описании, подробно указываются различные способы, процессы и процедуры. Хотя конкретные этапы могут описываться в определенном порядке, такой порядок главным образом служит для удобства и ясности. Конкретный этап может повторяться несколько раз, может возникать до или после других этапов (даже если эти этапы в иных случаях описываются в другом порядке) и может возникать параллельно с другими этапами. Второй этап должен выполняться после первого этапа только тогда, когда первый этап должен завершаться до того, как второй этап начинается. Эта ситуация должна конкретно указываться в случае, если она не является очевидной из контекста.
[0022] В этом документе, термины "и", "или" и "и/или" используются. Такие термины должны читаться как имеющие охватывающий смысл. Например, "A и B" может означать, по меньшей мере, следующее: "как A, так и B", "по меньшей мере, как A, так и B". В качестве другого примера, "A или B" может означать, по меньшей мере, следующее: "по меньшей мере, A", "по меньшей мере, B", "как A, так и B", "по меньшей мере, как A, так и B". В качестве другого примера, "A и/или B" может означать, по меньшей мере, следующее: "A и B", "A или B". Когда подразумевается "исключающее OR", это конкретно отмечается (например, "либо A, либо B", "самое большее, одно из A и B").
[0023] Этот документ описывает различные функции обработки, которые ассоциированы с такими структурами, как блоки, элементы, компоненты, схемы и т.д. В общем, эти структуры могут реализовываться посредством процессора, который управляется посредством одной или более компьютерных программ.
[0024] Ниже приводится краткая сущность, описывающая различные варианты осуществления для управления эхо-сигналом. Система сначала оценивает мощность остаточного эхо в каждой полосе частот входного сигнала посредством моделирования усиления по мощности модуля эхокомпенсации для каждой полосы частот в качестве распределенной гауссовой случайной величины, среднее и дисперсия которой зависят от мощности обратной связи и оценки профиля усилений. Затем, система оценивает статистический профиль усилений для каждой полосы частот и для каждого различного входного уровня. Система использует статистический профиль усилений, чтобы квантовать входной уровень в несколько сегментов. Затем, система моделирует широкополосный остаточное эхо в качестве гауссовой смешанной модели и вычисляет правдоподобие локального разговора. В завершение, в зависимости от правдоподобия локального разговора, система применяет различные максимальные подавления к полосам частот входного сигнала. Ниже предоставляются дополнительные сведения.
[0025] Фиг. 1 является блок-схемой системы 100 управления эхо-сигналом. Система 100 управления эхо-сигналом, в общем, удаляет эхо-сигнал из аудио, захваченного посредством устройства на ближнем конце, до передачи в устройство на дальнем конце. Например, когда аудио из дальнего конца принимается посредством устройства на ближнем конце и выводится посредством громкоговорителя устройства на ближнем конце, "эхо-сигнал" соответствует этому выводу из громкоговорителя, который захватывается посредством микрофона устройства на ближнем конце. Система 100 управления эхо-сигналом включает в себя гребенку 101 аналитических фильтров, модуль 201 эхокомпенсации, модуль 301 эхоподавления и гребенку 111 синтезирующих фильтров.
[0026] Гребенка 101 аналитических фильтров принимает опорный сигнал 120 (также обозначается как x(t)) и захваченный сигнал 122 (также обозначается как y(t)), выполняет преобразование и формирует преобразованный опорный сигнал 130 (также обозначается как X(k, t')) и преобразованный захваченный сигнал 132 (также обозначается как Y(k, t')). Опорный сигнал 120 соответствует сигналу, принимаемому из устройства на дальнем конце, который выводится посредством громкоговорителя устройства на ближнем конце. Захваченный сигнал 122 соответствует аудио, захваченному посредством микрофона устройства на ближнем конце, которое может включать в себя локальный разговор (например, речь человека, ассоциированного с устройством на ближнем конце), а также эхо-сигнал вывода громкоговорителя (например, речь человека, ассоциированного с устройством на дальнем конце).
[0027] Преобразование, в общем, соответствует преобразованию входного сигнала из одной области в другую область (например, преобразование из временной области в частотную область). Гребенка 101 аналитических фильтров выполняет фильтрацию и прореживание опорного сигнала 120 и захваченного сигнала 122, чтобы формировать преобразованный опорный сигнал 130 и преобразованный захваченный сигнал 132. Например, гребенка 101 аналитических фильтров выполняет фильтрацию и прореживание x(t), с тем чтобы формировать X(k, t'), где k указывает индекс подполосового фильтра, и t' указывает новую переменную времени после прореживания. Аналогично, гребенка 101 аналитических фильтров выполняет фильтрацию и прореживание y(t), с тем чтобы формировать Y(k, t').
[0028] Параметр k может регулироваться требуемым образом, чтобы регулировать точность элементов разрешения преобразования для данной полосы пропускания входного сигнала. Например, общие полосы пропускания опорного сигнала 120 (или захваченного сигнала 122) могут быть равны 4 кГц, 8 кГц, 12 кГц, 16 кГц, 24 кГц и т.д., с соответствующими частотами дискретизации в 8 кГц, 16 кГц, 24 кГц, 32 кГц, 48 кГц и т.д. Для полосы пропускания элементов разрешения преобразования в 25 Гц, k может составлять 160 элементов разрешения для сигнала в 4 кГц, 960 элементов разрешения для сигнала в 24 кГц и т.д. при выполнении преобразования (например, быстрого преобразования Фурье).
[0029] Модуль 201 эхокомпенсации принимает преобразованный опорный сигнал 130 и преобразованный захваченный сигнал 132, выполняет эхокомпенсацию и формирует остаточный эхо-сигнал 140 (также обозначается как V(k, t')). В общем, эхокомпенсация означает применение линейной фильтрации в Y(k, t') на основе X(k, t'), с тем чтобы формировать V(k, t'). Модуль 201 эхокомпенсации типично реализует адаптивный фильтр. Дополнительные сведения относительно модуля 201 эхокомпенсации предоставляются со ссылкой на фиг. 2. Остаточный эхо-сигнал 140 называется "остаточным эхо-сигналом", поскольку он получается в результате применения эхокомпенсации к преобразованному захваченному сигналу 132; оставшийся эхо-сигнал в сигнале после эхокомпенсации и до эхоподавления представляет собой "остаточный эхо-сигнал".
[0030] Модуль 301 эхоподавления принимает преобразованный опорный сигнал 130 и остаточный эхо-сигнал 140, выполняет эхоподавление и формирует модифицированный остаточный эхо-сигнал 150 (также обозначается как ). В общем, эхоподавление означает применение нелинейного затухания к V(k, t') на основе X(k, t'), чтобы формировать модифицированный остаточный эхо-сигнал
в качестве подавленного сигнала. Дополнительные сведения относительно модуля 301 эхоподавления предоставляются со ссылкой на фиг. 3.
[0031] Гребенка 111 синтезирующих фильтров принимает модифицированный остаточный эхо-сигнал 150, выполняет обратное преобразование и формирует модифицированный захваченный сигнал 160 (также обозначается как , который представляет собой сигнал временной области). Обратное преобразование, в общем, соответствует инверсии преобразования, выполняемого посредством гребенки 101 аналитических фильтров. Модифицированный захваченный сигнал 160 затем может передаваться из устройства на ближнем конце в устройство на дальнем конце.
[0032] Для системы 100 управления эхо-сигналом, эхо-сигнал может моделироваться в качестве применения линейного фильтра к сигналу воспроизведения, например, с использованием уравнения (1):
(1)
[0033] В уравнении (1), соответствует эхо-сигналу, который должен компенсироваться, h(t) соответствует модели импульсного отклика в помещении с динамиком и микрофоном (для помещения, в котором расположено устройство на ближнем конце с динамиком и микрофоном), x(t) соответствует опорному сигналу 120, и n(t) соответствует шуму.
[0034] Когда отсутствует голос в восходящей линии связи (например, отсутствует локальный разговор на ближнем конце, и микрофон захватывает только эхо-сигнал вывода громкоговорителя; голос в восходящей линии связи также может называться "голосом на ближнем конце"), предусмотрено уравнение (2):
(2)
[0035] В уравнениях (1) и (2), h(t) может оцениваться посредством различных технологий, включающих в себя процесс на основе метода наименьших квадратов (LMS), процесс на основе нормализованного метода наименьших квадратов (NLMS), процесс на основе рекурсивного метода наименьших квадратов (RLS) и т.д.
[0036] Вследствие акустического характера, типичный импульсный отклик в помещении имеет более тысяч отводов, и адаптивный фильтр в силу этого должен требовать большого объема вычислительных ресурсов. Это является очень нежелательным для переносных и настольных компьютеров, и гребенка 101 фильтров используется для того, чтобы реализовывать подполосовой адаптивный фильтр, чтобы уменьшать вычисление.
[0037] Фиг. 2 является блок-схемой модуля 201 эхокомпенсации (см. фиг. 1). Модуль 201 эхокомпенсации включает в себя множество адаптивных фильтров (например, k адаптивных фильтров), соответствующих числу аналитических элементов разрешения. Показаны два адаптивных фильтра 251 и 252. Адаптивный фильтр 251 принимает X(0,t') и Y(0,t'), применяет адаптивный фильтр H0 и формирует V(0,t'). Адаптивный фильтр 252 принимает X(k, t') и Y(k, t'), применяет адаптивный фильтр Hk и формирует V(k, t'). Другие адаптивные фильтры в модуле 201 эхокомпенсации, которые не показаны, формируют оставшиеся k-1 компонентов. X, Y и V, надлежащим образом соответствуют преобразованному опорному сигналу 130, преобразованному захваченному сигналу 132 и остаточному эхо-сигналу 140 (см. фиг. 1), причем сигналы, соответствующие соответствующим элементам разрешения, обозначаются с суффиксом, соответствующим элементу разрешения (например, "130-0" для нулевого элемента разрешения опорного сигнала 130, "130-k" для k-ого элемента разрешения и т.д.). Отклик H фильтра соответствует импульсному отклику h(t) в помещении в области преобразования.
[0038] Хотя подполосовой адаптивный фильтр, реализованный посредством гребенки 101 фильтров, может значительно уменьшать сложность алгоритма, производительность модуля 201 эхокомпенсации ухудшается вследствие перекрытия спектра между фильтрами. Предлагается подполосовой адаптивный фильтр с обратной связью (с замкнутым контуром) для того, чтобы снижать остроту проблемы, но вследствие того факта, что сложность существенно увеличивается, подполосовой адаптивный фильтр без обратной связи (с незамкнутым контуром) по фиг. 2 по-прежнему представляет собой обычно приспосабливаемую технологию для акустической эхокомпенсации.
[0039] Фиг. 3 является блок-схемой модуля 301 эхоподавления (см. фиг. 1). Как упомянуто выше, подполосовой адаптивный фильтр без обратной связи (с незамкнутым контуром) представляет собой практическое (но не адекватное) решение для того, чтобы компенсировать эхо-сигнал в величине в 50 дБ, чтобы обеспечивать хорошее восприятие голосовой связи. Даже если большую часть времени в течение голосового вызова полнодуплексная связь (например, одновременный разговор, когда оба конца разговаривают) происходит редко, и когда это происходит, ни один из активных говорящих предположительно не должен понимать речь другой стороны; вместо этого, их намерение состоит только в том, чтобы выполнять прерывание. На основе этого, нелинейное эхоподавление может применяться после эхокомпенсации, чтобы дополнительно подавлять эхо-сигнал, но обеспечивать возможность голосу в восходящей линии связи стороны на ближнем конце прерывать сторону на дальнем конце.
[0040] С учетом этого, в ходе многостороннего вызова с тремя участниками, третья сторона (которая не представляет собой двух активных говорящих в дуплексном сценарии) должна иметь неудачное восприятие, если модуль подавления пропускает слишком много остаточного эхо, даже если прерываемый человек не позволяет этого. Таким образом, хороший модуль подавления должен подавлять в максимально возможной степени остаточного эхо при прохождении в максимально возможной степени голоса в восходящей линии связи. Эта цель является возможной, для линейного режима работы, только посредством адаптивного фильтра, такого как модуль 201 эхокомпенсации.
[0041] Чтобы разрешать эти проблемы и предоставлять дополнительное управление эхо-сигналом, модуль 301 эхоподавления использует внутреннюю статистику остаточного эхо для того, чтобы выполнять эхоподавление. Модуль 301 эхоподавления включает в себя компонент 311 формирования полос частот, модуль 312 оценки профилей усилений по мощности, модуль 313 оценки остаточных эхо, модуль 314 вычисления усиления и модуль 310 комбинирования сигналов.
[0042] Компонент 311 формирования полос частот принимает преобразованный опорный сигнал 130 (также обозначается как X(k, t')) и остаточный эхо-сигнал 140 (также обозначается как V(k, t')), выполняет формирование полос частот и формирует полосовой опорный сигнал 320 (также обозначается как ) и полосовой остаточный эхо-сигнал 322 (также обозначается как
). В общем, "формирование полос частот" означает группировку или агрегирование нескольких подполос частот или элементов разрешения по частоте сигнала для того, чтобы формировать полосу частот, причем результирующее число полос частот меньше исходного числа подполос частот или элементов разрешения по частоте. Например, формирование полос частот может выполняться посредством суммирования нескольких подполос частот или элементов разрешения по частоте, чтобы формировать полосу частот, и может включать в себя дополнительные операции, такие как умножение, вычисление абсолютных значений, вычисление абсолютных величин и т.д. Компонент 311 формирования полос частот может выполнять формирование полос частот остаточного эхо-сигнала 140, чтобы формировать полосовой остаточный эхо-сигнал 322 согласно уравнению (3):
(3)
[0043] Компонент 311 формирования полос частот может выполнять формирование полос частот преобразованного опорного сигнала 130, чтобы формировать полосовой опорный сигнал 320 согласно уравнению (4):
(4)
[0044] В уравнениях (3) и (4), B(b) соответствует набору элементов k разрешения, которые ассоциированы с полосой b частот, и вывод формирования полос частот соответствует мощности сигнала для каждой конкретной полосы частот. Формирование полос частот может представлять собой формирование полос частот в эквивалентной прямоугольной полосе пропускания (ERB), которое соответствует психоакустической модели человеческого слуха и ассоциирует большие полосы пропускания с нижними частотами. Например, число элементов k разрешения может составлять 960 элементов разрешения, число полос b частот может составлять 61, и каждая полоса b частот ассоциирована с числом элементов k разрешения, причем большее количество элементов разрешения ассоциировано с полосами нижних частот, чем с полосами верхних частот.
[0045] Модуль 312 оценки профилей усилений по мощности принимает полосовой опорный сигнал 320 и полосовой остаточный эхо-сигнал 322, оценивает профиль усилений по мощности и формирует оцененный профиль 324 усилений по мощности и мощность 420 обратной связи (также обозначается как ; см. фиг. 4). Оцененный профиль 324 усилений по мощности соответствует оценке профиля усилений по мощности модуля акустической эхокомпенсации, такого как модуль 201 эхокомпенсации (см. фиг. 1). Модуль 312 оценки профилей усилений по мощности также может принимать управляющий сигнал 326, который указывает присутствие одновременного разговора. Одновременный разговор означает ситуацию, когда как сторона на дальнем конце, так и сторона на ближнем конце говорят одновременно (например, если речь на дальнем конце указывается согласно опорному сигналу 120, и речь на ближнем конце указывается посредством захваченного сигнала 122, который также включает в себя эхо-сигнал речи на дальнем конце, выведенный посредством громкоговорителя и захваченный посредством микрофона на ближнем конце).
[0046] Когда модуль 201 эхокомпенсации достигает установившегося состояния, и когда отсутствует голос в восходящей линии связи (например, указывается посредством отсутствия одновременного разговора согласно управляющему сигналу 326 и присутствия эхо-сигнала согласно опорному сигналу 120), имеется остаточный эхо-сигнал 140 (также обозначаемый в качестве V(k, t')), как представлено согласно уравнению (5):
(5)
[0047] В уравнении (5), представляет собой отклик с ошибкой адаптивного фильтра, не совпадающий с реальным откликом в помещении с динамиком и микрофоном. Следует отметить, что поскольку
зависит от ввода X(k, t),
также должен зависеть от ввода. Кроме того, поскольку адаптивный фильтр
имеет несколько отводов, текущая остаточная мощность
может зависеть не только от текущей входной мощности, но также и от предыдущей входной мощности. Другими словами, остаточное эхо V(k, t') не должно представлять собой время-инвариантный (LTI) системный вывод.
[0048] Для простоты и практической реализации, мощность остатка моделируется согласно уравнению (6):
(6)
[0049] Дополнительные подробности модуля 312 оценки профилей усилений по мощности предоставляются на фиг. 4-5.
[0050] Фиг. 4 является блок-схемой модуля 400 вычисления мощности обратной связи. Модуль 400 вычисления мощности обратной связи может представлять собой компонент модуля 312 оценки профилей усилений по мощности (см. фиг. 3). Модуль 400 вычисления мощности обратной связи, в общем, вычисляет мощность 420 обратной связи (также обозначается как ; см. также фиг. 3) полосового опорного сигнала 320 (см. фиг. 3; также обозначается как
). В общем, мощность 420 обратной связи соответствует комбинированию со взвешиванием статистических значений полосового опорного сигнала 320, как подробнее указано ниже. Модуль 400 вычисления мощности обратной связи включает в себя модуль 410 нахождения доминирующих отводов адаптивного фильтра, запоминающее устройство 412, умножители 414 и 416 и сумматор 418.
[0051] Модуль 410 нахождения доминирующих отводов адаптивного фильтра принимает коэффициенты 402 фильтрации (соответствующие коэффициентам фильтрации адаптивных фильтров Hk в модуле 201 эхокомпенсации по фиг. 2), определяет два доминирующих отвода и предоставляет весовые коэффициенты w0 и w1 доминирующих отводов в умножители 414 и 416. Доминирующий отвод представляет собой отвод, который обеспечивает больший вклад в весовой коэффициент в адаптивном фильтре, чем другой отвод. Модуль 410 нахождения доминирующих отводов адаптивного фильтра использует коэффициенты 402 фильтрации, соответствующие Hk, по всем подполосам частот. Весовые коэффициенты w0 и w1 могут представлять собой относительные весовые коэффициенты.
[0052] Запоминающее устройство 412 сохраняет предысторию полосового опорного сигнала . Запоминающее устройство 412 имеет несколько запоминающих элементов для того, чтобы сохранять текущие значения полосового опорного сигнала
и одно или более предыдущих значений полосового опорного сигнала
,
...,
. В качестве конкретного примера, фиг. 2 показывает запоминающее устройство 412, содержащее 4 запоминающих элемента.
[0053] Умножитель 414 умножает одно из статистических значений полосового опорного сигнала 320, сохраненных в запоминающем устройстве 412, на весовой коэффициент w0, и умножитель 416 умножает другое из статистических значений полосового опорного сигнала 320, сохраненных в запоминающем устройстве 412, на весовой коэффициент w1. Сумматор 418 суммирует результаты умножителей 414 и 416. Как результат, мощность обратной связи может вычисляться согласно уравнению (7):
(7)
[0054] В уравнении (7), n0 и n1 являются индексами задержки, надлежащим образом соответствующими доминирующим отводам w0 и w1. В примере, показанном на фиг. 4, n0 равен 2, и n1 равен 0.
[0055] Когда входная мощность больше в конкретной полосе частот (соответствующей мощности обратной связи),
также имеет тенденцию быть большим по абсолютному значению. Эта взаимосвязь указывается подробнее на фиг. 5.
[0056] Фиг. 5 является гистограммой взаимосвязи между мощностью обратной связи (также называется "мощностью 420 обратной связи" на фиг. 3-4) и передаточной функцией
ошибок (остаточных эхо) адаптивного фильтра. Как видно из фиг. 5, когда входная мощность больше в конкретной полосе частот (соответствующей мощности
обратной связи в конкретной полосе частот),
также имеет тенденцию быть большим по абсолютному значению. С другой стороны, когда полоса частот содержит главным образом шум,
зачастую является небольшим, поскольку шум не должен компенсироваться.
[0057] Возвращаясь к фиг. 3, модуль 312 оценки профилей усилений по мощности использует взаимосвязь по фиг. 5 в качестве гистограммы, чтобы оценивать профиль усилений для каждой полосы частот. Оцененный профиль 324 усилений по мощности может представляться как среднее значение и дисперсия
для
. (Среднее и дисперсия обозначается как
и
в следующих параграфах, для простоты). В общих словах, модуль 312 оценки профилей усилений по мощности использует статистику остаточного эхо-сигнала (например, остаточного эхо-сигнала 140) в комбинации с предысторией входного сигнала (например, опорного сигнала 130), чтобы оценивать профиль усилений по мощности.
[0058] Модуль 312 оценки профилей усилений по мощности использует управляющий сигнал 326 (например, индикатор одновременного разговора), чтобы обновлять профиль усилений. В частности, модуль 312 оценки профилей усилений по мощности обновляет профиль усилений только тогда, когда он имеет уверенность в том, что отсутствует голос в восходящей линии связи (на ближнем конце), как указано посредством управляющего сигнала 326. Управляющий сигнал 326 может формироваться различными способами, в том числе посредством детектора одновременного разговора либо с использованием стохастического способа. Пример стохастического способа заключается в том, чтобы обновлять оценку в случайное время после того как, опорный сигнал превышает первое пороговое значение в течение определенной длительности, большей второго порогового значения.
[0059] Модуль 313 оценки остаточных эхо принимает полосовой остаточный эхо-сигнал 322 (также обозначается как ), мощность 420 обратной связи (также обозначается как
) и оцененный профиль 324 усилений по мощности (среднее и дисперсию
, обозначаемые как
и
) и вычисляет оцененную мощность 328 остаточного эхо (также обозначается как
). Модуль 313 оценки остаточных эхо может вычислять оцененную мощность 328 остаточного эхо на основе комбинации оцененного профиля 324 усилений по мощности и мощности 420 обратной связи. Модуль 313 оценки остаточных эхо может вычислять оцененную мощность 328 остаточного эхо с использованием минимального оператора, применяемого к комбинации полосового остаточного эхо-сигнала 322, мощности 420 обратной связи и оцененного профиля 324 усилений по мощности. Модуль 313 оценки остаточных эхо-сигналов может вычислять оцененную мощность 328 остаточного эхо согласно уравнению (8):
(8)
[0060] В уравнении (8), β является коэффициентом, определенным посредством настройки. Минимальный оператор обеспечивает то, что оцененная мощность 328 остаточного эхо никогда не должна превышать , который представляет собой составной объект из мощности остаточного эхо и мощности локального разговора. Оцененная мощность 328 остаточного эхо может моделироваться в качестве гауссовой случайной величины с центроидом в
. В общих словах, модуль 313 оценки остаточных эхо вычисляет оцененную мощность 328 остаточного эхо согласно мощности 420 обратной связи для каждой полосы частот посредством моделирования усиления по мощности модуля 201 эхокомпенсации (см. фиг. 1-2) для каждой полосы частот в качестве гауссовой случайной величины, параметризованной посредством оцененного профиля 324 усилений по мощности.
[0061] Модуль 314 вычисления усиления принимает полосовой остаточный эхо-сигнал 322 и оцененную мощность 328 остаточного эхо и вычисляет полосовые усиления 330 (также обозначаются как ). Одна цель вычисления полосовых усилений 330 состоит в том, чтобы применять, к каждой конкретной полосе частот, различные величины подавления для полудуплексного сценария по сравнению с полнодуплексным сценарием. (Полудуплексный сценарий описывает то, когда только одна сторона разговаривает, например, ближний конец или дальний конец. Полнодуплексный сценарий описывает то, когда обе стороны разговаривают, например, одновременный разговор). Другими словами, вычисление полосовых усилений 330 включает в себя избирательное вычисление множества полосовых усилений на основе правдоподобия локального разговора в остаточном эхо-сигнале. В качестве части вычисления полосовых усилений 330, модуль 314 вычисления усиления вычисляет признак, чтобы направлять вычисление усиления между двумя сценариями.
[0062] Вследствие характера шума помещения, электронного шума и случайности голосового сигнала, предполагается, что оцененная мощность 328 остаточного эхо в дБ имеет гауссово распределение со средним и дисперсией
, которые соответствует оцененному профилю 324 усилений по мощности, вычисленному посредством модуля 312 оценки профилей усилений по мощности. Также предполагается, что оцененная мощность 328 остаточного эхо в дБ не имеет взаимной корреляции (в первом допущении является независимой) между полосами частот. Пусть Ec представляет собой событие, когда отсутствует голос в восходящей линии связи; функция плотности распределения вероятностей для мощности остаточного эхо в дБ в конкретной полосе частот задается посредством уравнения (9):
(9)
[0063] В уравнении (9), x является оцененной мощностью 328 остаточного эхо в дБ, и соответствует центроиду оцененной мощности 328 остаточного эхо.
[0064] Фиг. 6 является графиком, который иллюстрирует функцию плотности распределения вероятностей уравнения (9). На фиг. 6, ось X соответствует x, и ось Y соответствует
.
[0065] Посредством моделирования широкополосного остаточного эхо в качестве гауссовой смешанной модели, логарифмическое правдоподобие L отсутствия голоса в восходящей линии связи по всем полосам b частот задается посредством уравнения (10):
(10)
[0066] В уравнении (10), логарифмическое правдоподобие L является суммой по всем полосам b частот экспоненциального компонента из уравнения (9). Другими словами, правдоподобие локального разговора в остаточном эхо-сигнале 140 представляет собой логарифмическое правдоподобие на основе среднего и дисперсии оцененного профиля усилений по мощности, суммированного по множеству полос частот. В общих словах, логарифмическое правдоподобие L вычисляется посредством моделирования остаточного эхо-сигнала 140 в качестве гауссовой смешанной модели, применяемой по всем полосам b частот.
[0067] Когда отсутствует голос в восходящей линии связи (например, локальный разговор не захватывается посредством устройства), L(Ec) должен быть низким; иначе L(E) является высоким, и логарифмическое правдоподобие L уравнения (10) должно представлять собой сигнал, чтобы направлять вычисление усиления.
[0068] Логарифмическое правдоподобие L уравнения (10) используется для того, чтобы вычислять глобальное максимальное усиление Gmax при подавлении по всем полосам частот согласно уравнению (11):
(11)
[0069] В уравнении (11), G0 является усилением в дБ, когда имеется голос в восходящей линии связи, и G1 является предварительно заданным усилением в дБ, когда отсутствует голос в восходящей линии связи. Lth является предварительно заданным пороговым значением, которое может получаться для каждого устройства во время начальной настройки через априорные знания того, присутствует локальный разговор или нет.
[0070] Другими словами, вычисление полосовых усилений 330 включает в себя вычисление глобального максимального усиления Gmax при подавлении по множеству полос частот. Глобальное максимальное усиление при подавлении основано на первом усилении G0, соответствующем присутствию локального разговора, втором усилении G1, соответствующем отсутствию локального разговора, и правдоподобии L локального разговора.
[0071] По каждой полосе частот, модуль 314 вычисления усиления может вычислять усиление для каждой полосы частот с использованием одного или более процессов вычисления усиления. Примерные процессы вычисления усиления, которые являются подходящими, включают в себя процессы вычисления усиления, описанные в патенте (США) номер 9173025, в патенте (США) номер 8712076 и в патенте (США) номер 8804977, которые содержатся в данном документе по ссылке.
[0072] Модуль 310 комбинирования сигналов принимает остаточный эхо-сигнал 140 (также обозначается как V(k, t')) и полосовые усиления 330 (также обозначаются как ) и формирует модифицированный остаточный эхо-сигнал 150 (также обозначается как
). Усиление, вычисленное для данной полосы b частот, применяется ко всем подполосам k частот, которые принадлежат этой данной ERB-полосе частот. Модуль 310 комбинирования сигналов может формировать модифицированный остаточный эхо-сигнал 150 согласно уравнению (12):
(12)
[0073] Другими словами, остаточный эхо-сигнал 140 имеет определенное число элементов k разрешения по частоте, при этом данное полосовое усиление из полосовых усилений 330 соответствует данному элементу разрешения по частоте (например, каждая полоса b частот может быть ассоциирована с числом элементов k разрешения), и формирование модифицированного остаточного эхо-сигнала 150 включает в себя, для каждого из элементов k разрешения остаточного эхо-сигнала 140, применение соответствующего полосового усиления
, чтобы формировать модифицированный остаточный эхо-сигнал 150.
[0074] Фиг. 7 является архитектурой 700 мобильного устройства для реализации признаков и процессов, описанных в данном документе, согласно варианту осуществления. Архитектура 700 может реализовываться в любом электронном устройстве, включающем в себя, но не только: настольный компьютер, потребительское аудиовизуальное (AV) устройство, широковещательное радиоустройство, мобильные устройства (например, смартфон, планшетный компьютер, переносной компьютер, носимое устройство) и т.д. В показанном примерном варианте осуществления, архитектура 700 служит для переносного компьютера и включает в себя процессор(ы) 701, периферийный интерфейс 702, аудиоподсистему 703, громкоговорители 704, микрофон 705, датчики 706 (например, акселерометры, гироскопы, барометр, магнитометр, камера), процессор 707 определения местоположения (например, приемное GNSS-устройство), подсистемы 708 беспроводной связи (например, Wi-Fi-, Bluetooth-, сотовую) и подсистему(ы) 709 ввода-вывода, которая включает в себя сенсорный контроллер 710 и другие контроллеры 711 ввода, сенсорную поверхность 712 и другие устройства 713 ввода/управления. Другие архитектуры с большим или меньшим числом компонентов также могут использоваться для того, чтобы реализовывать раскрытые варианты осуществления.
[0075] Интерфейс 714 запоминающего устройства соединяется с процессорами 701, периферийным интерфейсом 702 и запоминающим устройством 715 (например, флэш-памятью, RAM, ROM). Запоминающее устройство 715 сохраняет компьютерные программные инструкции и данные, в том числе, но не только: инструкции 716 операционной системы, инструкции 717 связи, GUI-инструкции 718, инструкции 719 обработки датчиков, телефонные инструкции 720, инструкции 721 обмена электронными сообщениями, инструкции 722 для просмотра веб-страниц, инструкции 723 аудиообработки, GNSS-/навигационные инструкции 724 и приложения/данные 725. Инструкции 723 аудиообработки включают в себя инструкции для выполнения аудиообработки, описанной в данном документе.
[0076] Фиг. 8 является блок-схемой последовательности операций способа 800 аудиообработки. Способ 800 может осуществляться посредством устройства (например, переносного компьютера, мобильного телефона и т.д.) с компонентами архитектуры 700 по фиг. 7, чтобы реализовывать функциональность системы 100 управления эхо-сигналом (см. фиг. 1), модуля 201 эхокомпенсации (см. фиг. 2), модуля 301 эхоподавления (см. фиг. 3), модуля 400 вычисления мощности обратной связи (см. фиг. 4) и т.д., например, посредством выполнения одной или более компьютерных программ.
[0077] На 802, принимаются опорный сигнал и остаточный эхо-сигнал. Например, модуль 301 эхоподавления (см. фиг. 3) может принимать преобразованный опорный сигнал 130 и остаточный эхо-сигнал 140. Преобразованный опорный сигнал 130 соответствует опорному сигналу 120, как можно видеть на фиг. 1.
[0078] На 804, полосовой опорный сигнал и полосовой остаточный эхо-сигнал формируются посредством выполнения формирования полос частот для опорного сигнала и остаточного эхо-сигнала. Например, компонент 311 формирования полос частот (см. фиг. 3) может выполнять формирование полос частот для преобразованного опорного сигнала 130 и остаточного эхо-сигнала 140, чтобы формировать полосовой опорный сигнал 320 и полосовой остаточный эхо-сигнал 322, соответственно.
[0079] На 806, оцененный профиль усилений по мощности и мощность обратной связи вычисляются на основе полосового опорного сигнала и полосового остаточного эхо-сигнала. Оцененный профиль 324 усилений по мощности соответствует оценке профиля усилений по мощности модуля акустической эхокомпенсации, такого как модуль 201 эхокомпенсации (см. фиг. 1). Например, модуль 312 оценки профилей усилений по мощности (см. фиг. 3) может вычислять оцененный профиль 324 усилений по мощности на основе полосового опорного сигнала 320 и полосового остаточного эхо-сигнала 322. Модуль 400 вычисления мощности обратной связи (см. фиг. 4) может вычислять мощность 420 обратной связи на основе полосового опорного сигнала 320. Оцененный профиль 324 усилений по мощности может указывать долговременную величину эхокомпенсации, вычисленную посредством модуля 400 вычисления мощности обратной связи, например, посредством использования предыстории полосового опорного сигнала 320, сохраненной в запоминающем устройстве 412.
[0080] На 808, оцененная мощность остаточного эхо вычисляется на основе полосового остаточного эхо-сигнала, мощности обратной связи и оцененного профиля усилений по мощности. Например, модуль 313 оценки остаточных эхо (см. фиг. 3) может вычислять оцененную мощность 328 остаточного эхо на основе полосового остаточного эхо-сигнала 322, мощности 420 обратной связи и оцененного профиля 324 усилений по мощности.
[0081] На 810, множество полосовых усилений вычисляются на основе полосового остаточного эхо-сигнала и оцененной мощности остаточного эхо. Например, модуль 314 вычисления усиления (см. фиг. 3) может вычислять полосовые усиления 330 на основе полосового остаточного эхо-сигнала 322 и оцененной мощности 328 остаточного эхо.
[0082] На 812, модифицированный остаточный эхо-сигнал формируется посредством применения множества полосовых усилений к остаточному эхо-сигналу. Например, модуль 310 комбинирования сигналов (см. фиг. 3) может формировать модифицированный остаточный эхо-сигнал 150 посредством применения полосовых усилений 330 к остаточному эхо-сигналу 140.
[0083] Способ 800 может включать в себя дополнительные этапы, соответствующие другим функциональностям системы 100 управления эхо-сигналом, модуля 201 эхокомпенсации, модуля 301 эхоподавления, модуля 400 вычисления мощности обратной связи и т.д., как описано в данном документе. Например, опорный сигнал может выводиться посредством громкоговорителя, к примеру, громкоговорителей 704 (см. фиг. 7). В качестве другого примера, аудио на ближнем конце может захватываться посредством микрофона (например, микрофона 705 по фиг. 5), аудиосигнал на ближнем конце может формироваться, и остаточный эхо-сигнал может формироваться посредством выполнения эхокомпенсации для аудиосигнала на ближнем конце (например, посредством модуля 201 эхокомпенсации по фиг. 1). Аудио на ближнем конце может включать в себя локальный разговор (например, речь, сформированную посредством человека на ближнем конце), эхо-сигнал (например, речь на дальнем конце, выведенную посредством громкоговорителя на ближнем конце) и т.д. В качестве другого примера, модифицированное остаточное эхо может передаваться посредством устройства на ближнем конце в устройство на дальнем конце, например, в качестве части телеконференции, видеоконференции и т.д.
[0084] Подробности реализации
[0085] Вариант осуществления может реализовываться в аппаратных средствах, в исполняемых модулях, сохраненных на машиночитаемом носителе, либо в комбинации вышеозначенного (например, в программируемых логических матрицах). Если не указано иное, этапы, выполняемые посредством вариантов осуществления, не должны внутренне относиться к какому-либо конкретному компьютеру или другому устройству, хотя в конкретных вариантах осуществления они могут относиться. В частности, различные машины общего назначения могут использоваться с программами, написанными в соответствии с идеями в данном документе, или может быть более удобным конструировать более специализированное устройство (к примеру, интегральные схемы) для того, чтобы выполнять требуемые этапы способа. Таким образом, варианты осуществления могут реализовываться в одной или более компьютерных программ, выполняющихся на одной или более программируемых компьютерных систем, каждая из которых содержит, по меньшей мере, один процессор, по меньшей мере, одну систему хранения данных (включающую в себя энергозависимые и энергонезависимые запоминающие элементы и/или элементы хранения данных), по меньшей мере, одно устройство или порт ввода и, по меньшей мере, одно устройство или порт вывода. Программный код применяется к входным данным для того, чтобы выполнять функции, описанные в данном документе, и формировать выходную информацию. Выходная информация применяется к одному или более устройств вывода известным способом.
[0086] Каждая такая компьютерная программа предпочтительно сохраняется или загружается на носители или устройства хранения данных (к примеру, на полупроводниковые запоминающие устройства или носители либо на магнитные или оптические носители), считываемые посредством программируемого компьютера общего или специального назначения, для конфигурирования и работы с компьютером, когда носители или устройства хранения данных считываются посредством компьютерной системы, чтобы выполнять процедуры, описанные в данном документе. Изобретаемая система также может рассматриваться как реализованная в качестве машиночитаемого носителя хранения данных, сконфигурированного с помощью компьютерной программы, при этом носитель хранения данных, сконфигурированный таким образом, инструктирует компьютерной системе работать конкретным и заранее заданным способом для того, чтобы выполнять функции, описанные в данном документе. (Программное обеспечение по сути и нематериальные или энергозависимые сигналы исключаются до такой степени, в которой они представляют собой непатентоспособный предмет изобретения).
[0087] Аспекты систем, описанных в данном документе, могут реализовываться в надлежащем компьютерном сетевом окружении звуковой обработки для обработки цифровых или оцифрованных аудиофайлов. Части адаптивной аудиосистемы могут включать в себя одну или более сетей, которые содержат любое требуемое число отдельных машин, включающих в себя один или более маршрутизаторов (не показаны), которые служат для того, чтобы буферизовать и маршрутизировать данные, передаваемые между компьютерами. Эта сеть может быть основана на различных специальных сетевых протоколах и может представлять собой Интернет, глобальную вычислительную сеть (WAN), локальную вычислительную сеть (LAN) или любую комбинацию вышеозначенного.
[0088] Один или более компонентов, блоков, процессов или других функциональных компонентов могут реализовываться через компьютерную программу, которая управляет выполнением процессорного вычислительного устройства системы. Также следует отметить, что различные функции, раскрытые в данном документе, могут описываться с использованием любого числа комбинаций аппаратных средств, микропрограммного обеспечения и/или в качестве данных и/или инструкций, осуществленных на различных машиночитаемых или считываемых компьютером носителях, с точки зрения их поведения, межрегистровых пересылок, логических компонентов и/или других характеристик. Машиночитаемые носители, на которых могут быть осуществлены такие отформатированные данные и/или инструкции, включают в себя, но не только, физические (невременные), энергонезависимые носители хранения данных в различных формах, такие как оптические, магнитные или полупроводниковые носители хранения данных.
[0089] Вышеприведенное описание иллюстрирует различные варианты осуществления настоящего раскрытия сущности наряду с примерами того, как могут реализовываться аспекты настоящего раскрытия сущности. Вышеприведенные примеры и варианты осуществления не должны считаться единственными вариантами осуществления и представляются для того, чтобы иллюстрировать гибкость и преимущества настоящего раскрытия сущности, заданные посредством прилагаемой формулы изобретения. На основе вышеописанного раскрытия сущности и прилагаемой формулы изобретения, другие компоновки, варианты осуществления, реализации и эквиваленты должны становиться очевидными для специалистов в данной области техники и могут использоваться без отступления от сущности и объема раскрытия сущности, заданных посредством формулы изобретения.
Библиографический список
Патенты (США) номера 10115411; 8111833; 9338551; 9363600; 10382092; 10313789; 10477031; 9503815; 9185506; 8462958; 6163608; 9420390; 9173025; 8712076; 8804977.
Публикации заявки на патент (США) номера 2016/0241955; 2019/0349471.
C. Yemdji, M. M. Idrissa, N. W. D. Evans и C. Beaugeant "Efficient low delay filtering for residual echo suppression", in 2010 18th European Signal Processing Conference, Aalborg, 2010, стр. 16-20.
Изобретение относится к аудиообработке и, в частности, к эхоподавлению. Техническим результатом является улучшение системы эхоподавления, уменьшение остаточного эхо-сигнала. Заявленный способ аудиообработки включает в себя вычисление оцененной мощности остаточного эхо на основе долговременной величины эхокомпенсации, указанной посредством оцененного профиля усилений по мощности, причем оцененный профиль усилений по мощности основан на опорном сигнале и остаточном эхо-сигнале. Эхоподавление остаточного эхо затем может выполняться на основе оцененной мощности остаточного эхо. Заявлены также считываемый компьютером носитель и устройство для выполнения способа. 3 н. и 12 з.п. ф-лы, 8 ил.
1. Машинореализованный способ аудиообработки, при этом упомянутый способ содержит этапы, на которых:
принимают (802) опорный сигнал (130) и остаточный эхо-сигнал (140);
формируют (804) полосовой опорный сигнал (320) и полосовой остаточный эхо-сигнал (322) посредством выполнения формирования полос частот для опорного сигнала и остаточного эхо-сигнала, соответственно;
вычисляют (806) оцененный профиль (324) усилений по мощности модуля (201) акустической эхокомпенсации и мощность (420) обратной связи, при этом мощность обратной связи соответствует комбинации со взвешиванием статистических значений мощности полосового опорного сигнала, оцененный профиль усилений по мощности вычисляют с использованием статистики полосового остаточного эхо-сигнала в комбинации со статистическими значениями мощности полосового опорного сигнала;
вычисляют (808) оцененную мощность (328) остаточного эхо для каждой полосы частот на основе полосового остаточного эхо-сигнала, мощности обратной связи и оцененного профиля усилений по мощности;
вычисляют (810) множество полосовых усилений (330) на основе полосового остаточного эхо-сигнала и оцененной мощности остаточного эхо; и
формируют (812) модифицированный остаточный эхо-сигнал (150) посредством применения множества полосовых усилений к остаточному эхо-сигналу.
2. Способ по п. 1, дополнительно содержащий этап, на котором:
выводят посредством громкоговорителя опорный сигнал.
3. Способ по любому из пп. 1, 2, дополнительно содержащий этапы, на которых:
захватывают посредством микрофона аудио на ближнем конце;
формируют аудиосигнал на ближнем конце, соответствующий аудио на ближнем конце; и
формируют остаточный эхо-сигнал посредством выполнения эхокомпенсации для аудиосигнала на ближнем конце.
4. Способ по любому из пп. 1-3, дополнительно содержащий этап, на котором:
передают, в устройство на дальнем конце, модифицированный остаточный эхо-сигнал.
5. Способ по любому из пп. 1-4, в котором остаточный эхо-сигнал имеет множество элементов разрешения по частоте, при этом полосовой остаточный эхо-сигнал имеет множество полос частот, и при этом формирование полосового остаточного эхо-сигнала содержит этап, на котором:
формируют полосовой остаточный эхо-сигнал посредством выполнения формирования полос частот в эквивалентной прямоугольной полосе пропускания для остаточного эхо-сигнала, при этом формирование эквивалентной прямоугольной полосы частот агрегирует множество элементов разрешения по частоте во множество полос частот согласно психоакустической модели человеческого слуха.
6. Способ по любому из пп. 1-5, в котором вычисление оцененного профиля усилений по мощности включает в себя этапы, на которых:
для каждого из множества адаптивных фильтров вычисляют посредством модуля нахождения доминирующих отводов адаптивного фильтра два доминирующих отвода, при этом множество адаптивных фильтров соответствует количеству аналитических элементов опорного сигнала (130), и каждый из множества адаптивных фильтров принимает опорный сигнал (130) и преобразованный захваченный сигнал (132), которые соответствуют соответственным упомянутым элементам, и формирует остаточный эхо-сигнал (140), соответствующий соответственным упомянутым элементам, при этом доминирующие отводы обеспечивают больший вклад в весовые коэффициенты в текущем адаптивном фильтре из множества адаптивных фильтров по сравнению с другими отводами текущего адаптивного фильтра из множества адаптивных фильтров;
вычисляют мощность обратной связи полосового опорного сигнала с использованием двух доминирующих отводов и статистических значений мощности полосового опорного сигнала; и
вычисляют оцененный профиль усилений по мощности с использованием гистограммы на основе полосового опорного сигнала, при этом гистограмма на основе полосового опорного сигнала является гистограммой взаимосвязи между мощностью обратной связи и передаточной функцией остаточных эхо адаптивного фильтра.
7. Способ по п. 6, в котором оцененный профиль усилений по мощности включает в себя среднее и дисперсию.
8. Способ по любому из пп. 1-7, в котором мощность обратной связи вычисляется по множеству полос частот, сформированных формированием полос частот для опорного сигнала и остаточного эхо-сигнала, при этом вычисление оцененной мощности остаточного эхо включает в себя этап, на котором:
вычисляют оцененную мощность остаточного эхо согласно мощности обратной связи для каждой полосы частот из множества полос частот посредством моделирования усиления по мощности модуля эхокомпенсации для каждой полосы частот в качестве гауссовой случайной величины, параметризованной посредством оцененного профиля усилений по мощности.
9. Способ по любому из пп. 1-8, в котором вычисление множества полосовых усилений включает в себя этап, на котором избирательно вычисляют множество полосовых усилений на основе правдоподобия локального разговора в остаточном эхо-сигнале, при этом локальный разговор соответствует аудио, захваченному посредством устройства, которое реализует способ по любому из пп. 1-5.
10. Способ по п. 9, в котором правдоподобие локального разговора в остаточном эхо-сигнале является либо
вычисленным посредством моделирования остаточного эхо-сигнала в качестве гауссовой смешанной модели, применяемой по множеству полос частот, сформированных формированием полос частот для опорного сигнала и остаточного эхо-сигнала, либо
логарифмическим правдоподобием на основе среднего и дисперсии оцененного профиля усилений по мощности, суммированного по множеству полос частот, сформированных формированием полос частот для опорного сигнала и остаточного эхо-сигнала.
11. Способ по п. 9, в котором вычисление множества полосовых усилений включает в себя этап, на котором вычисляют глобальное максимальное усиление при подавлении по множеству полос частот.
12. Способ по п. 11, в котором вычисление глобального максимального усиления при подавлении основано на первом усилении, соответствующем присутствию локального разговора, втором усилении, соответствующем отсутствию локального разговора, и правдоподобии локального разговора.
13. Способ по любому из пп. 1-12, в котором остаточный эхо-сигнал имеет множество элементов разрешения по частоте, при этом данное полосовое усиление из множества полосовых усилений соответствует данному элементу разрешения по частоте из множества элементов разрешения по частоте, и при этом формирование модифицированного остаточного эхо-сигнала включает в себя этап, на котором:
для каждого из множества элементов разрешения по частоте остаточного эхо-сигнала применяют соответствующее полосовое усиление из множества полосовых усилений, чтобы формировать модифицированный остаточный эхо-сигнал.
14. Невременный считываемый компьютером носитель, хранящий компьютерную программу, которая, при выполнении процессором, управляет устройством таким образом, чтобы выполнять обработку, включающую в себя способ по любому из пп. 1-13.
15. Устройство для аудиообработки, причем упомянутое устройство содержит:
процессор,
при этом процессор выполнен с возможностью управлять упомянутым устройством таким образом, чтобы выполнять способ по любому из пп. 1-13.
EP 1978649 A2, 08.10.2008 | |||
US 8712076 B2, 29.04.2014 | |||
CHEN K., XU P.Y., LU J., XU B.L | |||
An improved post-filter of acoustic echo canceller based on subband implementation // APPLIED ACOUSTICS, 01.06.2009, Vol | |||
Деревянный торцевой шкив | 1922 |
|
SU70A1 |
Способ консервирования растений и трупов животных или их частей | 1921 |
|
SU886A1 |
US 10477031 B2, 12.11.2019 | |||
СПОСОБЫ И УСТРОЙСТВА ДЛЯ ОБЕСПЕЧЕНИЯ КОМФОРТНОГО ШУМА В СИСТЕМАХ СВЯЗИ | 1998 |
|
RU2220510C2 |
Авторы
Даты
2025-02-04—Публикация
2021-03-19—Подача