ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ
Изобретение относится к способу и устройству для обработки аудиосигнала и, в частности, но не исключительно, к обработке речевых аудиосигналов.
УРОВЕНЬ ТЕХНИКИ
Цифровая обработка аудиосигналов стала все более превалирующей и теперь является частью многих практических применений. На самом деле она в настоящее время выполняется во многих повседневных потребительских электронных устройствах, включающих в себя, например, мобильные телефоны, распространение и воспроизведение музыки, телевизор и т.д.
Для того, чтобы предоставить улучшенную, новую или более гибкую обработку, используемые алгоритмы обработки аудио имеют тенденцию становиться все более сложными, и на самом деле во многих сценариях обработка сигналов ограничивается доступным вычислительным ресурсом. Примером является обработка речевого сигнала для устройств голосовой связи, где кодирование речи вместе с улучшениями речи обычно потребляет очень существенную часть вычислительного ресурса. Вследствие этого есть общее желание повысить вычислительную эффективность алгоритмов обработки аудио.
В некоторых применениях и сценариях, обработка цифрового аудиосигнала может предпочтительно выполняться в параллельных подполосах. Так как подполосы имеют уменьшенную ширину полосы, такая обработка может быть выполнена в отношении прореженных сигналов подполос, т.е. частота выборки может быть уменьшена. Например, аудиосигнал может быть разделен на две равные подполосы с сигналами подполос, прореженными в два раза, перед индивидуальной обработкой.
В качестве конкретного примера речевой сигнал может быть разделен на два отдельных компонента, соответствующих соответственно полосе более низких частот и полосе более высоких частот. Кодирование затем может быть выполнено индивидуально в каждой полосе, т.е. может быть выполнено посредством применения индивидуальной и раздельной обработки аудио к двум сигналам подполос. В качестве другого примера, процесс подавления эха может быть выполнен индивидуально в разных подполосах.
Следом за обработкой индивидуальных подполос, они могут быть снова скомбинированы, чтобы сгенерировать единый сигнал, обработанный в полной полосе с такой же частотой осуществления выборки, как для входного сигнала.
Обработка аудиосигнала посредством деления сигнала на подполосы и применения обработки индивидуально в разных подполосах может обеспечить существенную пользу во многих сценариях.
Например, для многих алгоритмов обработки использование вычислительного ресурса не масштабируется линейно с шириной полосы частот или частотой осуществления выборки. На самом деле, для многих алгоритмов обработки, вычислительное требование может увеличиться, например, с квадратом ширины полосы частот/частоты осуществления выборки.
Другое преимущество обработки подполос состоит в том, что она может обеспечить возможность более близкой адаптации обработки к разным характеристикам аудиосигнала. Например, речевой сигнал имеет очень разные свойства в частотном диапазоне, скажем, до 4 кГц, чем он имеет в частотном диапазоне выше 4 кГц. Вследствие этого, улучшенное кодирование речи может часто достигаться посредством алгоритма кодирования, нацеленного на конкретные характеристики в разных полосах частот, и таким образом для подполосы ниже 4 кГц может применяться кодирование иное, чем для подполосы выше 4 кГц. Например, могут быть использованы разные речевые модели.
Кроме того, посредством функционирования в разных подполосах может быть возможно оптимизировать вычислительную эффективность посредством адаптирования обработки к разным характеристикам. Например, известно, что реверберация длится гораздо дольше для более низких частот, чем для более высоких частот. Вследствие этого, фильтр оценки реверберации (который, например, используется в блоке подавления эха) для низких частот должен иметь достаточно коэффициентов (для FIR-фильтра), чтобы обеспечить импульсную характеристику, достаточную для моделирования продолжительного эффекта реверберации. Однако, посредством разбиения аудиосигналов, например, на полосу низких частот и высоких частот, длинный фильтр должен быть применен только к полосе низких частот (с прореженной периодичностью выборки), тогда как гораздо более короткий фильтр (отражающий короткую высокочастотную реверберацию) может быть применен в полосе высоких частот (с прореженной периодичностью выборки). Общее использование вычислительного ресурса может таким образом быть существенно уменьшено по сравнению с фильтрацией сигнала с полной шириной полосы с полной периодичностью выборки с использованием длинного фильтра реверберации.
В настоящее время есть тенденция к увеличению ширины полосы аудиосигналов (например, для речевого или музыкального аудио), и это имеет тенденцию к существенно повышенному использованию вычислительного ресурса из-за учащенной периодичности выборки. Важность использования обработки подполос может увеличиться для увеличенной ширины полосы аудиосигнала, и на самом деле, во многих случаях может быть обеспечена возможность выполнения обработки аудио, которая из-за ресурсных ограничений в устройстве не может быть выполнена для сигналов с большей шириной полосы и полноценной периодичностью выборки.
Например, ширина полосы устройств передачи речи (с возможностью громкой связи) быстро увеличивается. Широко используются узкополосные (ширина полосы 4 кГц) и широкополосные (8 кГц) системы, но на рынок входят суперширокополосные (16 кГц) и даже полнополосные (24 кГц) системы (особенно для применений VoIP).
В качестве конкретного примера, алгоритмы улучшения речи должны соответствовать этому увеличению ширины полосы. Использование одинакового алгоритма улучшения речи для всей полосы частот представляет некоторые проблемы. Проблемы улучшения речи, которые должны быть решены, являются разными для высоких и низких частот. Возьмем, например, суперширокополосный алгоритм, с шириной полосы в 16 кГц. Речевой сигнал в диапазоне 0-8 кГц совершенно отличается от речевого сигнала в диапазоне 8-16 кГц. Гласные с их важными первыми тремя формантами преимущественно существуют в нижней полосе, тогда как некоторые согласные значительно выходят за 8 кГц. Также частотная избирательность человеческого слуха гораздо выше при более низких частотах.
В качестве другого примера, акустика комнаты обычно изменяется с частотой, в основном из-за увеличения абсорбции воздуха при увеличении частоты. В результате, время реверберации при высоких частотах будет ниже для более высоких частот. Как следствие, дереверберация особенно важна для более низких частот. Длина адаптивного фильтра, например, для подавления акустического эха может соответственно быть короче для более высоких частот, так как реверберация обычно гораздо короче для более высоких частот.
Например, для подавления акустического эха, расширение ширины полосы, и таким образом частоты выборки, в два раза и затем применение одинакового алгоритма приводит к увеличению длины адаптивного фильтра в два раза, для того, чтобы реализовать такую же компенсацию эха для полосы низких частот.
Для подавления эха в сверхширокополосной речи, обычно нужны длины фильтров 4096 или больше. Адаптивным фильтрам требуются хорошие декорреляционные свойства для обеспечения возможности быстрой адаптации. По сути, это означает, что составляющая обновления адаптивного фильтра должна быть восстановлена из свертки с помощью автокорреляции входного сигнала (сигнала громкоговорителя). Из-за низких уровней речи в полосах высоких частот, эта автокорреляция имеет длинную поддержку во временной области и приводит к неидеальной декорреляции и таким образом более низким скоростям адаптации для высоких частот.
Привлекательным решением для таких применений является разбиение сигналов на отдельные полосы частот, посредством применения группы фильтров. В такой группе фильтров, сигналы могут быть разделены, например, на две (для суперширокой полосы) или три (для полной полосы) подполосы, которые последовательно подвергаются понижению частоты выборки (прореживаются) и затем обрабатываются раздельно. После раздельной обработки, результирующие обработанные сигналы подвергаются повышению частоты выборки и комбинируются повторно.
Как упомянуто, разбиение на две отличные полосы предлагает преимущество, что каждая полоса может быть обработана независимо, отражая конкретные характеристики в каждой полосе. Например, обработка полосы 0-8 кГц может быть точно такой же как для случая с широкой полосой, и для более высоких частот возможна другая обработка. В частности, для подавления акустического эха может все равно использоваться адаптивный фильтр обычно из 2048 коэффициентов для полосы 0-8 кГц, тогда как, например, для полосы 8-16 кГц может быть использовано 1024 коэффициента. Это можно сравнить с решением единой полосы, обычно использующим 4096 коэффициентов для суперширокой полосы или даже 6144 коэффициентов для полной полосы.
Однако, проблема при такой обработке подполос состоит в том, что аудиосигнал в принципе должен быть разделен на подполосы с использованием идеальных фильтров (т.е. неперекрывающихся фильтров с бесконечно резкими переходами). Так как это невозможно, некоторое перекрытие между фильтрами обычно приводит к тому, что некоторые частоты сигнала первоначального сигнала присутствуют в сигналах двух соседних подполос.
Конкретная проблема неидеальной фильтрации состоит в том, что искажения могут обычно возникать как часть прореживания. Прореженная частота является предпочтительно как можно более низкой, и обычно она задается такой, чтобы соответствовать первоначальной частоте осуществления выборки, разделенной на число подполос. Однако, при использовании неидеальных фильтров в таких ситуациях, некоторые искажения частотных компонентов для одной подполосы в другую подполосу являются неизбежными.
Однако, эти искажения могут быть исправлены посредством блока синтеза (генерирующего выходной цифровой аудиосигнал из обработанных сигналов подполос), включающего в себя комплементарные фильтры, которые подавляют искаженные компоненты. Вследствие этого, искажения, возникающие из-за неидеальных фильтров, обычно исправляются посредством выбора фильтров в синтезирующей функциональности для генерирования сигнала с полной шириной полосы, который приводит к подавлению искажений.
Обработка подполосы может вносить задержки. EP0721251 A1 уменьшает задержку при обработке подполосы аудиосистемы посредством использования минимально-фазовых фильтров как в анализирующей, так и синтезирующей группах фильтров.
Однако, несмотря на такую компенсацию, изобретатели поняли, что все еще желательно предоставить улучшенную обработку аудиосигнала. В частности, улучшенная обработка аудиосигнала будет предпочтительной, и в частности будет предпочтительна обработка аудио, обеспечивающая возможность повышенной гибкости, уменьшенной сложности, уменьшенного использования вычислительных ресурсов и/или улучшенных эксплуатационных характеристик.
СУЩНОСТЬ ИЗОБРЕТЕНИЯ
Соответственно, данное изобретение ориентировано на предпочтительное ослабление, смягчение или устранение одного или более из вышеупомянутых недостатков по одиночке или в любой комбинации.
Согласно аспекту изобретения предусматривается устройство обработки аудиосигнала, содержащее: приемник для приема аудиосигнала с выборкой с первой частотой осуществления выборки, причем аудиосигнал, имеющий максимальную частоту, не превышающую пороговую частоту, являющуюся ниже, чем половина первой частоты осуществления выборки на предел первой частоты; группу фильтров для генерирования сигналов подполос для цифрового аудиосигнала, причем группа фильтров, содержащая набор перекрывающихся подфильтров, предоставляющих набор подполос; первый блок сдвига частоты для применения частотного сдвига по меньшей мере к одной подполосе из набора подполос; прореживатель для прореживания сигналов подполос на показатель прореживания, приводящего к тому, что прореженные сигналы подполос имеют прореженную частоту осуществления выборки, равную первой частоте осуществления выборки, деленной на показатель прореживания, причем прореженная частота осуществления выборки по меньшей мере в два раза больше ширины полосы каждого из перекрывающихся подфильтров; и
при этом частотный сдвиг для подполосы предусматривается для сдвига подполосы в частотный интервал, являющийся кратным частотному интервалу от нуля до половины прореженной частоты выборки.
Изобретение может обеспечить улучшенную обработку и/или способствовать обработке аудиосигналов для многих применений, и может во многих сценариях обеспечить улучшенное качество аудио. Данный подход может конкретно обеспечить возможность обработки подполос аудиосигнала с уменьшенными искаженными компонентами подполос, в то же время обеспечивая возможность деления подполосы для представления всего частотного спектра аудиосигнала без промежутков. Конкретно, во многих вариантах осуществления, данный подход может способствовать, улучшать или обеспечивать возможность обработки подполос без искаженных компонентов подполос, в то же время предоставляя по существу плоскую общую частотную характеристику для деления на подполосы.
Обработка подполос может, например, обеспечить возможность адаптации обработки к конкретным характеристикам аудиосигнала в разных частотных интервалах. Например, длины фильтров можно настроить для отражения конкретных требований в отдельной подполосе, вместо общего требования для худшего случая для аудиосигнала. Обработка сигнала в подполосах может обычно существенно уменьшить сложность и требования к вычислительным ресурсам. Уменьшение искажений подполос может обеспечить улучшенное разделение между индивидуальными подполосами, что во многих вариантах осуществления может дать в результате улучшенные эксплуатационные характеристики, такие как, например, улучшенная адаптация адаптивных фильтров индивидуальных подполос.
Точный порядок или последовательность индивидуальных операций может варьироваться в разных вариантах осуществления. Например, в большинстве вариантов осуществления, прореживатель размещается для выполнения прореживания после частотного сдвига. Однако, в некоторых вариантах осуществления, частотный сдвиг может быть выполнен как часть, или даже в некоторых ситуациях, после прореживания.
Сдвигом подполосы в частотный интервал, являющийся кратным частотному интервалу от нуля до половины прореженной частоты выборки, может конкретно быть сдвиг ширины полосы подфильтра для подполосы, которая должна быть в пределах величины, кратной частотному интервалу от нуля до половины прореженной частоты выборки. Шириной полосы может, например, быть ширина полосы в 6 дБ, 10 дБ, 20 дБ или 30 дБ. Рассмотренная ширина полосы может зависеть от индивидуального варианта осуществления и, например, от допустимого уровня искаженных компонентов и от требований обработки.
Каждая подполоса ассоциируется с частотным интервалом входного аудиосигнала. Индивидуальная подполоса может быть перемещена/сдвинута по частоте, в том смысле, что частота сигнала подполосы может быть изменена. Однако, хотя частота подполосы или сигнал подполосы могут быть изменены, подполоса все еще соответствует/представляет тот же частотный интервал аудиосигнала.
Указание на частоты относится к положительным частотам. Специалисту в данной области техники будет понятно, как для реальных физических сигналов временной области с эрмитовостью в частотной области такие частоты относятся к отрицательным частотам.
Частотный интервал, являющийся кратным частотному интервалу от нуля до половины прореженной частоты выборки, включает в себя величину, кратную одному, т.е. он включает в себя частотный интервал от нуля до половины прореженной частоты выборки.
Число подполос может во многих вариантах осуществления предпочтительно составлять две подполосы. Обычно используется относительно низкое число подполос, и часто число составляет не более, чем пять. Пороговая частота может во многих вариантах осуществления быть не более, чем 20 кГц, 14 кГц, 12 кГц, 10 кГц, 8 кГц или 6 кГц. Во многих вариантах осуществления, ширина полосы каждой подполосы составляет предпочтительно не меньше, чем 1 кГц, 2 кГц, 4 кГц, 6 кГц или 8 кГц.
В соответствии с опциональным признаком изобретения, устройство обработки аудиосигнала дополнительно содержит процессор сигналов, размещенный для применения алгоритма обработки сигналов к аудиосигналу посредством применения раздельной обработки сигналов подполос в каждой подполосе.
Изобретение может обеспечить улучшенную и/или облегченную обработку подполос сигнала с уменьшенными искажениями между подполосами. Обработка подполос может включать в себя обработку других сигналов, которые могут или не могут быть преобразованы в соответствующие подполосы с использованием того же подхода.
В соответствии с опциональным признаком изобретения, алгоритмом обработки сигналов является алгоритм обработки речи, и процессор сигналов размещен для применения разных алгоритмов в разных подполосах.
Изобретение может предоставить особенно предпочтительную обработку речи, где обработка в каждой подполосе может быть адаптирована к конкретным характеристикам речи в разных полосах частот. Свойства речи существенно варьируются между разными подполосами, и обработка подполос без искаженных компонентов может обеспечить особенно эффективную обработку с улучшенным качеством и/или уменьшенной сложностью/использованием ресурсов.
Обработка речи может в частности быть кодированием речи или улучшением речи.
В соответствии с опциональным признаком изобретения, алгоритм обработки сигналов содержит применение адаптивного фильтра, и процессор сигналов размещен для адаптации адаптивного фильтра отдельно в разных подполосах.
Данный подход может обеспечить особенно эффективную адаптацию к варьирующимся свойствам аудио в разных частотных интервалах. Адаптивный фильтр может содержать адаптивный подфильтр для каждой подполосы, и устройство может быть размещено для генерирования сигнала обновления фильтра для каждой подполосы, при этом соответствующий адаптивный фильтр подполос обновляется в ответ на сигнал обновления фильтра для этой подполосы.
В соответствии с опциональным признаком изобретения, аудиосигнал и адаптивный фильтр является фильтром подавления эха для оценивания эха аудиосигнала, причем фильтр подавления эха, содержащий подфильтр подавления эха для каждой подполосы; и процессор сигналов размещен для: определения оцененных эхо-сигналов для каждой подполосы посредством применения подфильтра подавления эха к прореженному сигналу подполосы в каждой подполосе; определения сигнала ошибки для каждой подполосы посредством сравнения оцененного эхо-сигнала в каждой подполосе с захваченным аудиосигналом, содержащим эхо аудиосигнала; и обновления каждого подфильтра подавления эха в ответ на сигнал ошибки для соответствующей подполосы.
Данный подход может дать высокие эксплуатационные характеристики и эффективное подавление эха, при этом обеспечивая низкую сложность и использование ресурсов.
В соответствии с опциональным признаком изобретения, обработка аудиосигнала содержит синтезатор для синтезирования выходного аудиосигнала с первой частотой осуществления выборки из обработанных сигналов подполос, сгенерированных посредством обработки сигналов подполос в каждой подполосе; причем синтезатор, содержащий: блок повышения частоты выборки для повышения частоты выборки обработанных сигналов подполос до первой частоты осуществления выборки, чтобы сгенерировать обработанные сигналы подполос с повышенной частотой выборки; второй блок сдвига частоты для применения обратного частотного сдвига к обработанным сигналам подполос с повышенной частотой выборки, причем обратный частотный сдвиг для первой подполосы приводит к тому, что первая подполоса сдвигается в частотный диапазон подфильтра для первой подполосы; блок объединения подполос для объединения, вслед за применением обратного частотного сдвига, обработанных сигналов подполос с повышенной частотой выборки, чтобы сгенерировать обработанный аудиосигнал; набор фильтров подполос для фильтрации обработанных сигналов подполос с повышенной частотой выборки для ослабления спектра искажений повышенной частоты выборки для каждой подполосы, причем каждый фильтр из набора фильтров, имеющий ширину полосы, не превышающую половину первой частоты осуществления выборки.
Данный подход может обеспечить очень предпочтительный подход, где полнополосный аудиосигнал может быть обработан посредством обработки подполос с уменьшением артефактов или ухудшений, вызванных обработкой подполос. В частности, эффект искажения подполос может быть уменьшен очень существенно.
В соответствии с опциональным признаком изобретения, блок объединения подполос содержит по меньшей мере один из набора фильтров подполос, и блок комбинирования для генерирования обработанного аудиосигнала посредством комбинирования подполос обработанных сигналов с повышенной частотой выборки вслед за фильтрацией подполос.
Это может обеспечить особенно эффективную обработку во многих вариантах осуществления.
В соответствии с опциональным признаком изобретения, частотный сдвиг для первой подполосы по существу задается как:
где fd - прореженная частота выборки, fm - центральная частота первой подполосы до частотного сдвига и n - целое число (n ≥ 1).
Это может предоставить очень эффективный подход и может во многих вариантах осуществления привести к повышенному ослаблению искаженных компонентов подполосы.
Во многих вариантах осуществления, частотный сдвиг для подполосы может быть таким, что центральная частота подполосы сдвигается к частоте по существу прореженной частоты выборки плюс величина, кратная половине прореженной частоте выборки.
В соответствии с опциональным признаком изобретения, ослабление подфильтра для первой подполосы не меньше, чем 6 дБ, при частоте, кратной половине прореженной частоты выборки, сдвинутой на значение, соответствующее частотному сдвигу.
Это может обеспечить возможность очень эффективного ослабления искаженных компонентов подполосы в сигналах подполос. Во многих вариантах осуществления, ослабление подфильтра для первой подполосы может быть не меньше, чем 10 дБ, 20 дБ или 30 дБ при частоте, кратной половине прореженной частоты выборки, сдвинутой на значение, соответствующее частотному сдвигу.
В соответствии с опциональным признаком изобретения, группа фильтров образована набором по существу комплементарных по мощности подфильтров.
Это может снизить искажение полнополосного аудиосигнала. По существу комплементарные по мощности подфильтры могут во многих вариантах осуществления быть комплементарными по мощности с точностью 1 дБ - 2 дБ. Таким образом, во многих вариантах осуществления, группа фильтров предоставляет общую скомбинированную характеристику, которая является плоской с точностью до 1 дБ или 2 дБ.
Во многих вариантах осуществления, скомбинированный фильтр, образованный посредством комбинации перекрывающихся фильтров, имеют вариацию амплитуды полосы пропускания не более, чем 2 дБ (или во многих вариантах осуществления не более, чем 1 дБ).
В соответствии с опциональным признаком изобретения, каждый фильтр из набора подфильтров имеет ширину полосы 6 дБ, не превышающую половину частоты прореживания.
Это может обеспечить эффективное функционирование с эффективным ослаблением искаженных компонентов подполосы. Во многих вариантах осуществления, каждый фильтр из набора подфильтров может иметь ширину полосы в 10 дБ, 20 дБ или 30 дБ, не превышающую половину частоты прореживания
В соответствии с опциональным признаком изобретения, пороговая частота не меньше, чем на 10% меньше, чем половина первой частоты осуществления выборки.
Это может обеспечить практическое ограничение во многих вариантах осуществления и может обеспечить возможность эффективной фильтрации посредством практических фильтров для ослабления искаженных компонентов для полосы до достаточных уровней. Во многих вариантах осуществления, пороговая частота не более, чем 90% первой частоты осуществления выборки. Во многих вариантах осуществления, пороговая частота не меньше, чем 60% первой частоты осуществления выборки. Это может обеспечивать низкую сложность посредством неиспользования слишком высоких частот осуществления выборки.
Согласно аспекту изобретения предусматривается устройство обработки аудиосигнала, содержащее: приемник для приема набора прореженных сигналов подполос с прореженной периодичностью выборки, представляющего аудиосигнал с первой частотой осуществления выборки и имеющего максимальную частоту, не превышающую пороговую частоту, являющуюся ниже, чем половина первой частоты осуществления выборки на предел первой частоты, причем прореженные сигналы подполос имеют частотный сдвиг в частотный интервал, являющийся кратным частотному интервалу от нуля до половины прореженной частоты выборки, и впоследствии прореженные на показатель прореживания; и синтезатор для синтеза выходного аудиосигнала с первой частотой осуществления выборки из набора прореженных сигналов подполос; причем синтезатор, содержащий: блок повышения частоты выборки для повышения частоты выборки прореженных сигналов подполос до первой частоты осуществления выборки, чтобы сгенерировать сигналы подполос с повышенной частотой выборки; второй блок сдвига частоты для применения обратного частотного сдвига к сигналам подполос с повышенной частотой выборки, причем обратный частотный сдвиг для первого прореженного сигнала подполосы, приводящий к сдвигу первого прореженного сигнала подполосы в частотный диапазон, соответствующий частотному диапазону прореженного сигнала подполосы в аудиосигнале до частотного сдвига и прореживания; блок объединения подполос для объединения, вслед за применением обратного частотного сдвига, сигналов подполос с повышенной частотой выборки, чтобы сгенерировать объединенный аудиосигнал; набор фильтров подполос для фильтрации обработанных сигналов подполос с повышенной частотой выборки для ослабления спектра искажений повышенной частоты выборки для каждой подполосы, причем каждый фильтр из набора фильтров, имеющий ширину полосы, не превышающую половину первой частоты осуществления выборки.
Согласно аспекту данного изобретения, способ обработки аудиосигнала, содержащий: прием аудиосигнала с выборкой с первой частотой осуществления выборки, причем аудиосигнал, имеющий максимальную частоту, не превышающую пороговую частоту, являющуюся ниже, чем половина первой частоты осуществления выборки на предел первой частоты; группу фильтров, генерирующую сигналы подполос для цифрового аудиосигнала, причем группа фильтров, содержащая набор перекрывающихся подфильтров, предоставляющих набор подполос; применение частотного сдвига по меньшей мере к одной подполосе из набора подполос; прореживание сигналов подполос на показатель прореживания, приводящее к тому, что прореженные сигналы подполос имеют прореженную частоту выборки, равную первой частоте осуществления выборки, деленной на показатель прореживания, причем прореженная частота выборки по меньшей мере в два раза больше ширины полосы каждого из перекрывающихся подфильтров; и при этом частотный сдвиг для подполосы сдвигает подполосу в частотный интервал, являющийся кратным частотному интервалу от нуля до половины прореженной частоты выборки.
Эти и другие аспекты, признаки и преимущества данного изобретения будут понятны исходя из варианта(ов) осуществления, описанного(ых) в дальнейшем в этом документе, и объяснены со ссылкой на них.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
Варианты осуществления данного изобретения будут описаны, только в качестве примера со ссылкой на чертежи, в которых
Фиг. 1 иллюстрирует пример подхода обработки подполос звуковых частот;
Фиг. 2 иллюстрирует пример частотного спектра сигналов для подхода обработки подполос звуковых частот по Фиг. 1;
Фиг. 3 иллюстрирует пример системы подавления эха;
Фиг. 4 иллюстрирует пример генератора подполос для системы обработки подполос звуковых частот в соответствии с некоторыми вариантами осуществления изобретения;
Фиг. 5 иллюстрирует пример частотного спектра сигналов для подхода обработки подполос звуковых частот по Фиг. 4;
Фиг. 6 иллюстрирует пример системы обработки подполос звуковых частот в соответствии с некоторыми вариантами осуществления изобретения;
Фиг. 7 иллюстрирует пример синтезатора аудиосигнала из системы обработки подполос звуковых частот в соответствии с некоторыми вариантами осуществления изобретения;
Фиг. 8 иллюстрирует пример системы обработки подполос звуковых частот в соответствии с некоторыми вариантами осуществления изобретения;
Фиг. 9 иллюстрирует пример группы фильтров для системы обработки подполос звуковых частот в соответствии с некоторыми вариантами осуществления изобретения;
Фиг. 10 иллюстрирует пример группы фильтров для системы обработки подполос звуковых частот в соответствии с некоторыми вариантами осуществления изобретения;
Фиг. 11 иллюстрирует пример блока сдвига частоты для системы обработки подполос звуковых частот в соответствии с некоторыми вариантами осуществления изобретения;
Фиг. 12 иллюстрирует пример группы фильтров для системы обработки подполос звуковых частот в соответствии с некоторыми вариантами осуществления изобретения;
Фиг. 13 иллюстрирует пример блока подавления эха с использованием системы обработки подполос в соответствии с некоторыми вариантами осуществления изобретения.
ОСУЩЕСТВЛЕНИЕ ИЗОБРЕТЕНИЯ
Нижеследующее описание фокусируется на вариантах осуществления изобретения, применяемого для эффективной обработки оцифрованного речевого сигнала, и в частности для подавления эха для речевого приложения. Однако, будет понятно, что изобретение не ограничивается этим применением, но может быть применено ко многим другим аудиосигналам и аудиоприложениям.
Как упомянуто, известно, что аудиосигнал делится на несколько сигналов подполос, соответствующих разным полосам частот аудиосигнала. Деление происходит обычно на две подполосы, и нижеследующее описание сфокусируется на вариантах осуществления, в которых аудиосигнал делится на две подполосы, которые затем обрабатываются индивидуально и раздельно.
Вслед за делением на подполосы (и конкретно на две подполосы) сигналы могут быть прорежены, для того, чтобы уменьшить сложность и потребность в ресурсах для последующей обработки. Из-за фильтров, делящих аудиосигналы на подполосы, это прореживание будет обычно вносить искажения, где недостаточно ослабленные компоненты сигнала других подполос сворачиваются в текущую подполосу. Эти искажения обычно исправляются посредством компенсации и устранения искаженных компонентов, при синтезировании полнополосного выходного сигнала, т.е. когда обработанные подполосы объединяются для образования выходного аудиосигнала с полной шириной полосы. Однако, изобретатели поняли, что тогда как такая компенсация может устранить эффект искажений во многих системах, искажения могут в других вариантах осуществления ухудшить эксплуатационные характеристики. К тому же, изобретатели поняли, что в отличие от обыкновенного подхода компенсации искажений как части синтеза, целесообразен подход, который уменьшает искажения в индивидуальных подполосах, и что это может обеспечить существенно улучшенные эксплуатационные характеристики во многих вариантах осуществления, и более того, что такой подход может даже обеспечить существенно улучшенные эксплуатационные характеристики для систем, которые также включают в себя компенсацию искажений как часть операции синтеза.
Более подробно может быть рассмотрен подход предшествующего уровня техники по Фиг. 1. Фигура иллюстрирует обычный подход предшествующего уровня техники, который использует группы фильтров с критической частотой выборки с анализирующими и синтезирующими фильтрами полос, которые сопоставлены так, что искажения в группе анализа компенсируются в группе синтеза. К тому же описание может, например, можно найти, например, в P.P. Vaidyanathan, "Multirate systems and filter banks", Prentice Hall 1993.
Система по Фиг. 1 использует группу анализирующих фильтров с анализирующими фильтрами ALP (ω) и AHP(ω) и группу синтезирующих фильтров с синтезирующими фильтрами F0(ω) и F1(ω). К тому же, пересечение между анализирующими фильтрами происходит при половине периодичности осуществления выборки аудиосигнала X(ω), и выход фильтров прореживается на показатель 2. Прореженные сигналы подполос могут быть обработаны индивидуально, но в примере по Фиг. 1 показаны подающимися непосредственно на блоки повышения частоты выборки, являющиеся частью операции синтеза. Показатель повышения частоты выборки соответствует показателю прореживания анализирующих блоков прореживания, тем самым восстанавливая частоту осуществления выборки до входной частоты осуществления выборки.
Пример амплитудных характеристик анализирующих фильтров показан на Фиг. 2, который сперва показывает амплитудные характеристики, за которыми идут результирующие характеристики, следующие за прореживанием. Сплошные линии представляют участки без искажений, тогда как пунктирные линии представляют распределения с искажениями. Частота представлена нормализованной угловой частотой для периодичности осуществления выборки входного сигнала (т.е. fs1=2π, где fs1 - частота осуществления выборки входного аудиосигнала, также называемая первой частотой осуществления выборки).
Как проиллюстрировано на Фиг. 2, часть частотной характеристики анализирующего фильтра низких частот ALP(ω) ниже π/2 не подвергается воздействию, так как π/2 соответствует частоте Найквиста для прореженного сигнала. Однако, из-за прореживания, амплитудная характеристика выше π/2 сворачивается обратно в полосу частот ниже частоты Найквиста, т.е. она сворачивается около частоты Найквиста π/2. В результате, сигнал подполосы будет включать в себя значительные искаженные компоненты сигнала.
Аналогично, для подполосы высоких частот, часть частотной характеристики анализирующего фильтра высоких частот AHP(ω) ниже π/2 не подвергается воздействию, тогда как амплитудная характеристика выше π/2 сворачивается обратно в полосу частот ниже частоты Найквиста, т.е. она сворачивается около частоты Найквиста π/2. В результате, сигнал подполосы высоких частот будет также включать в себя значительные искаженные компоненты сигнала. Следует отметить, что выход полосы высоких частот после понижения частоты выборки в основном состоит из искаженных составляющих, которые сворачиваются обратно в неискаженные составляющие после повышения частоты выборки.
Также следует отметить, что Фиг. 2 иллюстрирует только компоненты сигнала соответствующих подполос в полосах частот [0, π/2].
Таким образом, так как деление на подполосы требует перекрытия между фильтрами (для того, чтобы не игнорировать компоненты сигнала в области перекрытия), сгенерированные прореженные подполосы будут по существу включать в себя существенное количество искаженных компонентов из других подполос. На самом деле, группы фильтров спроектированы, чтобы иметь комплементарную характеристику по мощности, дающую в результате плоскую общую амплитудную характеристику. Ослабление при частоте Найквиста для прореженных сигналов подполос составляет соответственно только 3 дБ, и таким образом искаженные компоненты вокруг этой частоты по существу ослабляются только почти на 3дБ.
Аналитически, прореженные выходы анализирующих фильтров при подаче сигнала X(ω) могут быть выражены как:
и
После выполнения повышения частоты выборки и суммирования при синтезе, результирующий выходной сигнал задается как:
Как может быть видно из этого, возможно задать и , что дает в результате подавление искаженных составляющих. Это дает в результате:
Таким образом, посредством проектирования фильтров ALP(ω) и AHP(ω) соответствующим образом, может быть достигнута желаемая линейная характеристика (см. например, P.P. Vaidyanathan, "Multirate systems and filter banks", Prentice Hall 1993).
Например, с использованием полуполосного эллиптического низкочастотного фильтра с нечетным порядком ALP(ω) и его комплементарного по мощности высокочастотного фильтра AHP(ω), выходной сигнал может быть задан как:
,
где A(ω) является всечастотным фильтром.
Соответственно, в этом случае амплитудная характеристика для входного сигнала, например, желаемой речи, остается постоянной. Обычно присутствуют фазовые искажения (вокруг частоты разделения), но это допустимо для многих применений, таких как конкретно многие алгоритмы обработки речи. Однако, при частоте разделения низкочастотный и высокочастотный фильтр только обеспечивают ослабление в 3 дБ и в результате, будут присутствовать значительные искажения в подполосах. Однако, это эффективно компенсируется или подавляется на стадии синтеза, и вследствие этого данный подход используется для многих практических применений.
Однако, изобретатели поняли, что тогда как компенсация помех, выполняемая как часть синтеза, может обеспечить допустимые эксплуатационные характеристики во многих сценариях, присутствие искаженных компонентов в сигналах подполос может во многих применениях все равно ухудшать эксплуатационные характеристики, и в некоторых случаях даже до недопустимой степени, что делает данный подход не пригодным к использованию.
Один конкретный пример служит для блоков подавления эха. Фиг. 3 иллюстрирует пример блока подавления эха, при этом принятый сигнал может содержать как желаемый речевой сигнал S(ω), так и нежелательный эхо-компонент E(ω), который возникает из-за воспроизведения сигнала громкоговорителя X(ω). Эхо-компонент E(ω) задается как сигнал громкоговорителя X(ω), модифицированный посредством характеристики тракта сигнала от громкоговорителя к микрофону (и в том числе характеристик громкоговорителя и микрофона, так же как и любой ассоциированной сигнальной схемы). Таким образом,
,
где Hlm(ω) является акустическим трактом между громкоговорителем и микрофоном.
Адаптивный фильтр пытается оценить акустический тракт Hlm(ω), так чтобы когда сигнал громкоговорителя X(ω) применялся к нему, он обеспечивал оценку эха . Остаточный сигнал получается посредством вычитания оцененного эха из сигнала микрофона т.е.
.
Остаточный сигнал используется для обновления фильтра во время временных интервалов, в которых нет речи, т.е. где S(ω)=0.
Обычно для подавления акустического эха адаптивный фильтр должен быть спроектирован так, чтобы так называемое улучшение потерь на отражение эха (ERLE) составляло по меньшей мере 20 дБ. ERLE задается как
.
При обычной акустической обстановке, это будет, как обычный пример, требовать длину фильтра по меньшей мере в 2048 коэффициента во временной области для ширины полосы 8 кГц. Это значит, что разрешение по частоте должно быть по меньшей мере 4 Гц, что указывает, что могут быть значительные изменения в Hlm(ω) свыше 4 Гц. Для более высоких величин ширины полосы речи требуются существенно более длинные фильтры. Например, для ширины полосы 16 кГц, и таким образом с удвоенной шириной полосы и удвоенной периодичностью выборки, требуется длина фильтра по меньшей мере в 4096 коэффициентов во временной области, для того, чтобы соответствовать той же продолжительности эха. Однако, обычно эхо гораздо короче в диапазоне от 8 кГц до 16 кГц, чем от 0 до 8 кГц. Вследствие этого, если обработка вместо этого выполняется в двух раздельных полосах, одна от 0 до 8 кГц и другая от 8 кГц до 16 кГц, адаптивный фильтр из 2048 коэффициентов может быть использован для первой полосы, и фильтр обычно из 512 коэффициентов может быть использован для второй полосы. Таким образом, может быть достигнуто значительное уменьшение сложности.
Вследствие этого, в системе по Фиг. 3, сигнал громкоговорителя X(ω) и захваченный сигнал микрофона S(ω)+E(ω) может быть поделен на две подполосы с использованием подхода по Фиг. 1 и 2. Адаптивный фильтр может аналогичным образом быть разделен на фильтр низких частот, применяемый к подполосе низких частот, и фильтр высоких частот, применяемый к подполосе высоких частот. Результирующий выходной сигнал R(ω) соответственно генерируется в двух индивидуальных подполосах, и обновление каждого подфильтра может быть основано на остаточном сигнале в этой подполосе. К тому же, выходной сигнал с полноценной периодичностью выборки и с подавленным эхо может быть предоставлен посредством применения синтезирующей части по Фиг. 1 к сгенерированным двум подполосам R(ω).
Как стало понятно изобретателям, воздействия искаженных составляющих на адаптивные фильтры, применяемые в индивидуальных полосах после понижения частоты выборки, могут привести к ухудшению, несмотря на компенсацию искажений, включенных при синтезировании выходного аудиосигнала.
Используя индексы LP и HP для указания соответственно подполосы низких частот и подполосы высоких частот, нижеследующие выражения могут быть получены для ситуации, где произошла конвергенция адаптивного фильтра (в соответствии с тем, что остаточный сигнал равен нулю, и таким образом выход адаптивного фильтра равен захваченному сигналу). Конкретно, задание:
приводит к
таким образом:
при
.
Таким образом, оценка эхо в подполосе низких частот состоит из взвешенной суммы участка без искажений Hlm(ω) и участка с искажениями Hlm(π-ω). Следует отметить, что в конкретном примере, как только ω и π-ω отличаются на более, чем 4 Гц, могут быть значительные различия между Hlm(ω) и Hlm(π-ω).
Проблема состоит в том, что α(ω) зависит от данных и (для типичных речевых приложений) быстро варьируется во времени. В действительности, на практике α(ω) варьируется гораздо быстрее, чем адаптивный фильтр может отследить. В результате, оптимальное решение не будет достигнуто, и искаженные и неискаженные компоненты не будут подавлены.
Те же выводы могут быть сделаны для подполосы более высоких частот посредством замены ALP(ω) на AHP(ω). Таким образом, как и для полосы более низких частот, могут подавляться либо искаженные, либо неискаженные составляющие. Как следствие будет тенденция к очень существенным участкам с эхо в выходном сигнале около частоты разделения (обычно несколько сотен Гц). Эти участки с эхо будут включать в себя как участки с искажениями, так и без искажений. (Последнее, так как адаптивные фильтры для обоих полос работают независимо, и участки искажений подавляют друг друга неидеально). Таким образом, в этом случае посредством обработки подполос может быть внесено существенное ухудшение.
В качестве другого примера, индивидуальное кодирование речи может быть применено к речевому сигналу в разных подполосах. Например, CELP-кодирование полосы частот может быть выполнено вплоть до 8 кГц, тогда как кодирование компонента речи в полосе частот от 8 кГц для 16 кГц может осуществляться посредством спектрального кодирования низкой сложности. При таком сценарии, искажения между подполосами приведут к артефактам кодирования из-за нелинейной природы CELP-кодирования, и соответственно искажения не могут быть полностью подавлены на стороне декодирования.
Фиг. 4 иллюстрирует подход, в котором описанные проблемы могут быть устранены. Фиг. 4 конкретно иллюстрирует генератор 401 подполос для устройства обработки аудио. Генератор 401 подполос соответствует анализирующей части системы по Фиг. 1, кроме разностей, описанных в нижеследующем.
Генератор 401 подполос содержит приемник 403, который принимает аудиосигнал. Аудиосигнал подвергается выборке с частотой, в нижеследующем называемой первой частотой осуществления выборки. В отличие от системы по Фиг. 2, компоненты сигнала для аудиосигнала ограничены полосой частот, которая ниже пороговой частоты, которая ниже, чем частота Найквиста для первой частоты осуществления выборки, т.е. максимальная частота аудиосигнала ниже частоты Найквиста на заданный предел. Точный предел может зависеть от конкретных предпочтений и требований отдельного варианта осуществления. Однако, во многих вариантах осуществления, максимальная частота аудиосигнала ограничена, чтобы быть ниже пороговой частоты, которая составляет не более, чем 10%, или в некоторых вариантах осуществления даже, например, 20% ниже половины первой частоты осуществления выборки.
Будет понятно, что максимальная частота, которая может рассматриваться как частота выше энергии сигнала частотных компонентов, является достаточно низкой. Например, во многих вариантах осуществления, максимальная частота может считаться частотой, выше которой компоненты сигнала составляют по меньшей мере 20 дБ или 30 дБ ниже максимальной амплитуды. В некоторых сценариях максимальная частота может считаться частотой, для которой скомбинированная энергия компонентов сигнала выше частоты является меньше, чем заданная пропорция общей энергии сигнала для аудиосигнала. Пропорция может зависеть от уровня допустимых искажений и может обычно составлять 5%, 1%, 0,5%, 0,1% или даже ниже.
Во многих вариантах осуществления, аудиосигнал может быть отфильтрованным аудиосигналом, и максимальная частота может быть частотой, для которой ослабление превышает заданный порог. Например, максимальная частота может быть частотой, при которой (предыдущая) фильтрация аудиосигнала обеспечивает ослабление по меньшей мере, например, в 20 дБ, 30 дБ или 40 дБ.
Будет понятно, что фильтрация может быть аналоговой или цифровой фильтрацией. Например, фильтрация может быть аналоговой низкочастотной фильтрацией, выполняемой до осуществления выборки. Конкретно, фильтрация может быть фильтрацией для подавления искажений, выполняемой до осуществления выборки с первой частотой осуществления выборки. Максимальная частота аудиосигнала может соответственно быть частотой, при которой аналоговая фильтрация для подавления искажений превышает ослабление по меньшей мере, например, в 10 дБ, 20 дБ, 30 дБ или 40 дБ.
В некоторых вариантах осуществления, приемник 403 может включать в себя цифровой фильтр, который применяется к аудиосигналу, подверженному выборке, для того, чтобы уменьшить максимальную частоту сигнала, чтобы предоставить предел для частоты Найквиста. Например, может быть применен цифровой фильтр, который ослабляет частотные компоненты, скажем, на 90% частоты Найквиста по меньшей мере, например, на 20 дБ. Таким образом, в некоторых вариантах осуществления это может быть частота, при которой цифровой (низкочастотный) фильтр превышает ослабление по меньшей мере, например, в 10 дБ, 20 дБ, 30 дБ или 40 дБ. Будет понятно, что такой фильтр может быть скомбинирован с группой фильтров, например, посредством фильтра группы фильтров для самой высокой подполосы, обеспечивая ослабление частот выше максимальных частот.
Таким образом, в отличие от обыкновенных систем, где могут предоставляться сигналы, имеющие ширину полосы вплоть до частоты Найквиста, система по Фиг. 4 ограничивает максимальную частоту, чтобы она была ниже пороговой частоты, которая меньше, чем частота Найквиста, часто на около 10%. Таким образом, система создает предел или ограничение в частотном спектре. Например, для периодичности осуществления выборки 32 тыс.в/с (тысяч выборок в секунду) и ширины полосы 16 кГц для принятого речевого сигнала, система может создать запас около частоты Найквиста посредством применения низкочастотного фильтра, который обеспечивает сильное ослабление (скажем, 20 дБ) сверх пороговой частоты ниже частоты Найквиста. Например, может быть использована пороговая частота, скажем, 14 кГц.
Таким образом, аудиосигнал, подвергнутый выборке, для которого подполосы генерируются как максимальная частота, которая не превышает пороговую частоту, которая ниже частоты Найквиста на подходящий предел (например 10%).
Фиг. 5 иллюстрирует спектр для различных сигналов при обработке генератора 401 подполос по Фиг. 1. Она иллюстрирует первый этап выполнения фильтрации, чтобы гарантировать, что максимальная частота сигнала находится ниже частоты Найквиста входного аудиосигнала на заданный подходящий предел.
Приемник 403 соединен с группой 405 фильтров, которая размещена для генерирования сигналов подполос для аудиосигнала, где группа фильтров содержит набор перекрывающихся подфильтров, предоставляющих набор подполос. Каждая подполоса представляет частотный интервал (входного) аудиосигнала.
В конкретном примере, группа 405 фильтров включает в себя два фильтра, и аудиосигнал разбит на две подполосы. однако, будет понятно, что в других вариантах осуществления, сигнал может быть разбит на больше подполос. Тем не менее, обычно, наилучший компромисс найден для относительно небольшого числа подполос, и конкретно число подполос не превышает пяти в большинстве вариантов осуществления.
Группа 405 фильтров содержит множество перекрывающихся фильтров, которые делят полосу частот (аудиосигнала) на множество подполос. Фильтры перекрываются так, что фильтры вместе включают в себя все компоненты сигнала аудиофильтра по меньшей мере в одной из подполос (при ослаблении, которое превышает порог обычно не более, чем 4-5 дБ). Пересечение между разными фильтрами, которое задано как частота, для которой ослабление двух соседних фильтров является одинаковым, в большинстве вариантов осуществления удерживается с ослаблением как можно ближе к 3 дБ (в соответствии с равномерным разбиением компонента сигнала при этой частоте на две подполосы), и обычно не отклоняется от этого более, чем, скажем, на 1 или 2 дБ.
Соседние фильтры группы 405 фильтров во многих вариантах осуществления сгенерированы по существу комплементарными по мощности. Таким образом, скомбинированное ослабление фильтров является предпочтительно по существу плоским во многих вариантах осуществления, и может конкретно быть плоским с точностью обычно 1дБ или 2 дБ. Таким образом, обозначение амплитудная характеристика двух фильтров в группе 405 фильтров по Фиг. 4 как ALp (ω) и AHp (ω), величина:
является по существу постоянной для частот вплоть до пороговой частоты/максимальной частоты входного аудиосигнала.
Будет понятно, что в практических вариантах осуществления может возникать некоторая вариация, но обычно отклонение меньше, чем 1-2 дБ на полосе частот. Будет понятно, что эти соображения легко распространяются на больше подполос, т.е. для n подполос/фильтров величина
является по существу постоянной на полосе частот.
Группа 405 фильтров соединена с блоком 407 сдвига частоты и с прореживателем 409. Блок 407 сдвига частоты дополнительно соединен с прореживателем 409.
Прореживатель 409 размещен для прореживания частоты выборки каждой подполосы, произведенной группой 405 фильтров. Конкретно, прореживатель 409 может прореживать сигналы подполос, сгенерированные группой 405 фильтров, на показатель прореживания, что приводит к тому, что прореженные сигналы подполос, которые имеют прореженную частоту выборки, равняются первой частоте осуществления выборки, деленной на показатель прореживания. В большинстве вариантов осуществления, показатель прореживания является целочисленным значением, но будет понятно, что это необязательно.
На самом деле, в большинстве вариантов осуществления, показатель прореживания равняется числу подполос, сгенерированных группой 405 фильтров. Таким образом, в конкретном примере, по Фиг. 4, где генерируются две подполосы, прореживатель 409 использует показатель прореживания два. Таким образом, прореживатель генерирует некоторое число подполос, каждая из которых имеет частоту выборки, равную первой периодичности осуществления выборки, деленной на показатель прореживания, и конкретно на Фиг. 4 прореживатель 409 генерирует две подполосы, каждая с частотой осуществления выборки в половину первой частоты осуществления выборки.
В примере по Фиг. 4, подполоса самых низких частот (поэтому называемая нижней подполосой) подается прямо в прореживатель 409 для прореживания. Однако, подполоса самых высоких частот (поэтому называемая верхней подполосой) сдвигается по частоте блоком 407 сдвига частоты до подачи в прореживатель 409 для прореживания. Таким образом, прореживание выполняется в отношении версии верхней подполосы с частотным сдвигом.
В системе, фильтры подполос группы 405 фильтров имеют ширину полосы, которая ниже половины прореженной периодичности выборки, т.е. которая ниже, чем частота Найквиста для прореженных полос частот. Таким образом, в системе, прореженная частота осуществления выборки, т.е. первая частота осуществления выборки, деленная на показатель прореживания, больше, чем ширина полосы каждого фильтра подполос. Шириной полосы может конкретно быть ширина полосы в 6 дБ, 10 дБ, 20 дБ или даже 30 дБ.
Соответственно, частота разделения между фильтрами подполос в примере их двух фильтров, меньше, чем частота Найквиста прореженного сигнала, и конкретно меньше, чем четверть первой частоты осуществления выборки. На самом деле, частота разделения ниже на достаточную пороговую величину, такую, что она обеспечивает возможность достижения ослаблением сигнала достаточно высокого значения при прореженной частоте Найквиста (первой частоте осуществления выборки, деленной на четыре).
Это проиллюстрировано на Фиг. 5, которая показывает низкочастотную фильтрацию с частотой среза ниже прореженной частоты Найквиста (соответствующей π/2 для первой частоты осуществления выборки) и с очень сильным ослаблением при прореженной частоте Найквиста. На самом деле, данное ослабление достаточно для искаженных компонентов, ослабление которых должно быть осуществлено в достаточной степени. Обычно ослабление составляет не меньше, чем 10 дБ, 20 дБ или даже выше.
В результате этой фильтрации, сигнал более низкой подполосы генерируется с первой частотой осуществления выборки, которая может быть легко прорежена прореживателем 409 без внесения (значительных) искаженных компонентов. Это проиллюстрировано на Фиг. 5, которая показывает результирующий низкочастотный фильтр (нормализованный относительно прореженной частоты осуществления выборки, вслед за понижением частоты выборки/прореживанием).
Однако, из-за более низкой частоты разделения, и таким образом использования фильтров, не критично подвергнутых выборке, полоса более высоких частот будет генерировать очень существенные искажения, если прореживаются напрямую. Однако, как проиллюстрировано на Фиг. 5, более высокая подполоса имеет частотный сдвиг, такой, что она попадает в частотный интервал от π/2 для π, когда нормализована до первой частоты осуществления выборки. К тому же, так как ширина полосы фильтра высоких подполос ниже, чем прореженная частота Найквиста, ослабление как при частоте Найквиста для первой частоты осуществления выборки, так и частоты Найквиста для прореженной частоты осуществления выборки, может быть очень высокой. На самом деле, обычно фильтр будет спроектирован, чтобы ослабление при этих частотах было не меньше, чем 10 дБ, 20 дБ или даже выше.
К тому же, когда более высокая подполоса с частотным сдвигом впоследствии прореживается, полоса будет вносить искажения в частотный интервал от 0 до прореженной частоты Найквиста. Таким образом, генерируется представление основной полосы для более высокой подполосы. К тому же, из-за ослабления фильтра высоких подполос при частотах, которые сдвинуты соответственно к частоте Найквиста первой частоты осуществления выборки и частоте Найквиста прореженной частоты осуществления выборки, это прореживание не приводит к каким-либо (значительным) искаженным компонентам от других полос, внесенных в представление основной полосы.
На самом деле, фильтры подполос группы 405 фильтров обеспечивают сильное ослабление при частотах, которые вслед за частотным сдвигом будут кратны половине прореженной частоты выборки. Ослабление в большинстве вариантов осуществления составляет по меньшей мере 6 дБ для этих частот, и часто 10 дБ, 20 дБ или даже 30 дБ.
Следует отметить, что из-за представления основной полосы, возникшего в результате прореживания и вносящего искажения в основную полосу, спектр сигнала более высокой подполосы будет обращен в представлении базовой полосы. Следует дополнительно отметить, что Фиг. 5 иллюстрирует только спектр в рассмотренных интервалах (а не, например, версии с искажениями для того же сигнала, сигнал подполосы или характеристика фильтра и неотрицательные частоты).
Таким образом, в результате обработки в системе по Фиг. 4, генерируются два сигнала подполос, которые имеют очень низкие уровни искаженных компонентов от других подполос. Эти сигналы могут соответственно быть обработаны индивидуально и раздельно без ухудшения эксплуатационных характеристик такими искаженными компонентами.
Будет понятно, что тогда как описанная система по Фиг. 4 сдвигает верхнюю подполосу частот в частотный диапазон от π/2 до π (нормализованный для первой частоты осуществления выборки), в принципе она может быть сдвинута в другие величины, кратные ширине полосы основной полосы от 0 до π/2. На самом деле, в некоторых вариантах осуществления, частотный сдвиг может непосредственно сдвинуть сигнал верхней подполосы в основную полосу от 0 до π/2.
Также следует понимать, что данный подход не ограничивается двумя подполосами, но может быть применен к большему количеству подполос. В таких случаях, частотный сдвиг может стараться сдвинуть ширину полосы подполосы, чтобы попасть в пределы величины, кратной основной полосе, заданной прореженной частотой Найквиста, т.е. fs1/d, где fs1 - первая частота осуществления выборки, и d - показатель прореживания. Например, для трех подполос, две более высокие подполосы могут быть сдвинуты в частотный интервал, имеющий конечные точки, кратные первой частоте осуществления выборки, деленной на 3. Например, средняя подполоса может быть сдвинута в диапазон от π/3 до 2 π/3, и верхняя подполоса может быть сдвинута в диапазон от 2 π/3 до π; или на самом деле, обе подполосы могут быть сдвинуты в интервал от 0 до π/3.
Таким образом, в данном подходе, для того, чтобы ограничить искажения в индивидуальных подполосах вместо критической выборки, используется выборка с повышенной частотой. Это кажется противоречивым тому требованию, что
желательна плоская амплитудная характеристика. Однако, данный подход генерирует некоторый запас/предел в верхнем конце спектра, который затем используется. Например, сверхширокополосного речевого сигнала с частотой выборки 32 кГц, полная полоса пропускания может быть ограничена 14 кГц, и для полной полосы с частотой выборки 48 кГц полоса пропускания может быть ограничена на 20 кГц. Этот запас, в комбинации с частотным сдвигом, обеспечивает возможность выборки с повышенной частотой каждой подполосы и по существу уменьшает искажения подполос, при этом все равно обеспечивая возможность плоской общей амплитудной характеристики.
Таким образом, в конкретном примере, блок разбиения полос создается с частотой разделения ниже π/2, такой что при ω= π/2 низкочастотное пропускание имеет достаточное ослабление (более, чем 20 дБ). Вследствие этого выборка с пониженной частотой может быть безопасно осуществлена. Прямое понижение частоты выборки более высокой подполосы будет испытывать значительные искажения. Однако до понижения частоты выборки, сигнал более высокой подполосы подается в блок сдвига частоты, такой что полоса частот сдвигается по частоте, и ослабление при ω= π/2 и ω=π является достаточным (по меньшей мере 20 дБ), чтобы избежать искажений после понижения частоты выборки (или по меньшей мере сохранять их достаточно низкими).
Соответственно, генерируются подполосы без искаженных компонентов подполос. Обработка аудио, такая как алгоритмы улучшения речи, в частности алгоритмы с адаптивным фильтром, может теперь применяться в отношении сигналов подполос, не имеющих искажений.
Фиг. 6 иллюстрирует пример системы обработки аудио. Система содержит генератор 401 подполос, который описан относительно Фиг. 4. Таким образом, генератор 401 подполос принимает аудиосигнал и генерирует два сигнала подполос с прореженной частотой в половину первой частоты осуществления выборки. Каждая из двух подполос подается в отдельные аудиопроцессоры 601, 603, каждый из которых выполняет отдельную и индивидуальную обработку аудиосигнала. Например, аудиопроцессоры 601, 603 могут выполнять процесс улучшения речи. Обработанные сигналы подполос подаются в синтезатор 605, который размещен для генерирования единого полнополосного выходного аудиосигнала из обработанных сигналов подполос. Таким образом, синтезатор 605 объединяет подполосы для генерирования единого выходного сигнала.
Синтезатор 605 может по существу представлять собой перестановку генератора 401 подполос. Пример синтезатора 605, комплементарного генератору 401 подполос по Фиг. 4, проиллюстрирован на Фиг. 7.
В примере, частота выборки сигналов подполос, принятых синтезатором 605, т.е. обработанных сигналов подполос, сначала повышается до первой частоты осуществления выборки блоком 701 повышения частоты выборки. Таким образом, блок повышения частоты выборки 701 выполняет повышение частоты выборки индивидуальных подполос посредством показателя повышения частоты выборки, соответствующего показателю прореживания, используемому прореживателем 409. В конкретном примере, соответственно выполняется повышение частоты выборки на показатель 2.
Повышение частоты выборки может, например, выполняться посредством вставки нулей, например, в конкретном примере дополнительная нулевая выборка может быть вставлена между каждой принятой выборкой. В обыкновенных блоках повышения частоты выборки, за вставкой нулей следует подходящий фильтр, который выбирает соответствующую копию частоты для сигнала с повышенной частотой выборки.
Конкретно, при повышении частоты выборки посредством вставки нулей или заполнения нулями, результат дополнительных выборок состоит в том, что базовый частотный спектр повторяется в частотной области с показателем повторения, соответствующим прореженной частоте выборки. Таким образом, в конкретном примере, повышение частоты выборки до первой частоты осуществления выборки посредством вставки нулей приводит к повторению прореженного спектра с частотой повторения, соответствующей первой частоте осуществления выборки, деленной на показатель повышения частоты выборки (соответствующий показателю прореживания на анализирующей стороне).
Таким образом, в примере, где показатель прореживания составляет два, спектр с повышенной частотой выборки будет повторен с частотой π (нормализованной до первой частоты осуществления выборки).
Для более низкой подполосы, это приведет к тому, что спектр основной полосы в частотном диапазоне от 0 до π/2 будет рядом с копией спектра от π/2 до π (или если рассматривать отрицательные частоты в частотном диапазоне от - π/2 до π/2, будет рядом с копией спектра от π/2 до 3 π/2). Для того, чтобы обеспечить компоненты подполосы в соответствующей полосе частот (т.е. полосе до прореживания), может быть применен низкочастотный фильтр, который выбирает частотный спектр от 0 до π/2. Так как более низкая подполоса не продолжается полностью до π/2 (из-за выборки с повышенной частотой, а не критической выборки фильтров), хорошие результаты могут быть достигнуты от практических фильтров без чрезмерной вычислительной нагрузки.
Однако, для более высокой подполосы, это копия спектра от π/2 до π, которая выбирается, так как она соответствует частоте спектра до прореживания. Таким образом, вместо низкочастотного фильтра, для выбора соответствующей копии используется высокочастотный фильтр. Этот полосовой фильтр имеет ширину полосы от π/2 до π (в интервале основной полосы от 0 до π), тем самым удаляя копию с искажениями с повышенной частотой выборки из интервала от 0 до π/2. В результате, сигнал подполосы от генератора 401 подполос (до прореживания, но после частотного сдвига) восстанавливается посредством простого повышения частоты выборки и фильтрации.
Будет понятно, что описанный принцип повышения частоты выборки и фильтрации (при величине, кратной первой частоте осуществления выборки, деленной на показатель прореживания) в основном применим к любому показателю прореживания и любой подполосе. Конкретно, для показателя осуществления выборки более высокого, чем два, нижняя и верхняя подполосы могут быть восстановлены с использованием низкочастотного и высокочастотного фильтра соответственно, тогда как промежуточные полосы могут быть восстановлены с использованием полосовых фильтров. На самом деле, так как низкочастотный фильтр и высокочастотный фильтр могут считаться конкретными примерами полосовых фильтров, данный подход повышения частоты выборки, за которой идет полосовая фильтрация, осуществляющая выбор копии с искажениями, соответствующей полосе частот подполосы до прореживания, может считаться пригодным для всех подполос.
Будет понятно, что тогда как такие фильтры могут быть частью блока 701 повышения частоты выборки, это не является обязательным, и что в других вариантах осуществления фильтры могут быть применены к другим частям тракта сигнала. Например, фильтры могут быть частью последующего объединения подполос, выполняемого после частотного сдвига. Также будет понятно, что фильтры предпочтительно выбираются, чтобы обеспечить по существу плоскую амплитудную характеристику/характеристику по мощности. Конкретно, посредством выбора фильтров как комплементарных по мощности фильтров, может быть получено плоское поведение на всех частотах.
Синтезатор дополнительно содержит второй блок 703 сдвига частоты , который размещен для применения обратного частотного сдвига к обработанным сигналам подполос с повышенной частотой выборки, которые были сдвинуты по частоте как часть генерирования подполос. В конкретном примере, сигнал более высокой подполосы соответственно подается во второй блок 703 сдвига частоты.
Второй блок 703 сдвига частоты применяет частотный сдвиг (называемый обратным частотным сдвигом), который для заданной подполосы применяет сдвиг, который приводит к тому, что подполоса перемещается в частотный диапазон, который представлен подполосой, т.е. он восстанавливает компоненты сигнала подполосы до той же частоты, какую они первоначально имели во входящем аудиосигнале. Таким образом, обратный частотный сдвиг является таким, что подполоса сдвигается в диапазон подфильтра, который создал подполосу.
Например, в конкретном примере, первая подполоса может покрыть диапазон от 0-7 кГц, тогда как вторая подполоса может покрыть диапазон от 7-14 кГц. Так как и прореженный и обработанный сигналы подполос представлены сигналами основной полосы, второй блок 703 сдвига частоты может применить обратный частотный сдвиг, который перемещает сигнал более высокой подполосы из представления базовой полосы в соответствующий диапазон 7-14 кГц.
Обратный частотный сдвиг устроен для обращения скомбинированного частотного сдвига, возникшего в результате частотного сдвига первым блоком 407 сдвига частоты. Как рассмотрено ранее, частотный сдвиг, возникающий в результате прореживания (т.е. сдвиг в основную полосу), компенсируется посредством выбора фильтрами соответствующей копии частоты.
Например, если первый блок 407 сдвига частоты перемещает более высокую подполосу в диапазон от π/2 до π (нормализованную до первой частоты осуществления выборки) посредством применения частотного сдвига fsh, и искажения от прореживателя сдвигают это в полосу пропускания от 0 до π/2 (нормализованную до первой частоты осуществления выборки), то второй блок 703 сдвига частоты может выполнить частотный сдвиг -fsh.
Выход второго блока 703 сдвига частоты подается в блок 705 объединения подполос, который также соединен с блоком 701 повышения частоты выборки, от которого он принимает сигнал нижней подполосы. Блок 705 объединения подполос размещен для объединения обработанных сигналов подполос с повышенной частотой выборки, чтобы сгенерировать обработанный выходной аудиосигнал с периодичностью выборки, соответствующей входному сигналу.
Блок 705 объединения подполос может непосредственно объединить принятые сигналы подполос, так как они теперь расположены на соответствующих частотах, т.е. частоты подполосы соответствуют частотному диапазону выходного сигнала, представленного каждым сигналом подполосы.
На самом деле, в некоторых вариантах осуществления, блок 705 объединения подполос может быть просто реализован как сумматор, суммирующий принятые сигналы подполос. Конкретно, простое сложение может быть выполнено, если в блоке повышения частоты выборки были использованы соответствующие фильтры (например, фильтры искажений для полосовой фильтрации сигналов со вставленными нулями для выбора соответствующих копий частоты для индивидуальной подполосы). В других вариантах осуществления, может выполняться более сложное объединение, например, включающее в себя фильтры, которые выполняют выбор полосы.
Например, могут быть использованы фильтры, которые также компенсируют фильтрацию фильтров подполос из группы 405 фильтров. Конкретно, блок объединения может включать в себя набор фильтров подполос, которые применяются к обработанным сигналам подполос с повышенной частотой выборки. Блок комбинирования может затем скомбинировать результирующие отфильтрованные сигналы подполос. В таком примере, подфильтры могут быть размещены так, что каскад из фильтра подполос в группе 405 фильтров и соответствующего фильтра подполос в блоке 705 объединения подполос является по существу одинаковым для всех подполос.
Выход блока 705 объединения подполос в примере подается в низкочастотный фильтр 707, который имеет ширину полосы (например, ширину полосы 6дБ, 10 дБ или 20 дБ), которая меньше, чем половина первой частоты осуществления выборки. Таким образом, низкочастотный фильтр 707 может выполнить фильтрацию для подавления искажений с повышенной частотой выборки, приводящую к тому, что повышение частоты выборки не генерирует высокочастотные компоненты сигнала не смотря на выполнение повышения частоты выборки со вставкой нулей.
Выход низкочастотного фильтра 707 является соответственно обработанным аудиосигналом, который имеет такую же периодичность выборки, как и входной аудиосигнал. Однако, обработка аудиосигнала была выполнена индивидуально и раздельно в отношении каждой подполосы без внесения (недопустимого) ухудшения из-за искажения подполос.
Как описано, первый блок 407 сдвига частоты размещен для сдвига более высоких подполос, так чтобы переместить их в интервалы, которые кратны частотному интервалу от нуля до половины прореженной частоты выборки. Точный сдвиг может варьироваться между разными применениями и вариантами осуществления (или даже для разных сигналов или разных подполос). Однако, во многих вариантах осуществления, сдвиг предпочтительно является таким, что подполоса располагается по центру внутри такого частотного интервала.
Таким образом, во многих вариантах осуществления, первый блок 407 сдвига частоты может быть размещен для выбора сдвига частоты, такого что центральная частота подполосы сдвигается по существу в центр интервала, являющегося кратным фундаментальному интервалу от нуля до половины прореженной частоты выборки.
Конкретно, частотный сдвиг для заданной подполосы может по существу быть задан как:
где fd - прореженная частота выборки, fm - центральная частота подполосы до частотного сдвига, и n - целое число (n ≥ 1).
Во многих вариантах осуществления, частотный сдвиг может быть задан по существу так как выше с максимальным отклонением от частоты fs на 10%, или даже 5% или 1%, ширины полосы подполосы.
Конкретный пример реализации описанного подхода проиллюстрирован на Фиг. 8, который показывает анализирующую сторону (соответствующую генератору 401 подполос) и синтезирующую сторону (соответствующую синтезатору 605). Примером является сверхширокополосная система обработки речи с частотой выборки 32 кГц
В примере, анализирующая часть, соответствующая генератору 401 подполос, включает в себя нижеследующий конкретный подход:
Изначальная низкочастотная фильтрация с частотой среза при 14 кГц. Этим фильтром может, например, быть эллиптический фильтр.
Блок разбиения полос (реализующий группу 405 фильтров) с частотой разделения на 7,5 кГц.
Частотный сдвиг 1250 Гц для того, чтобы сдвинуть центральную частоту более высокой подполосы (14 кГц-7,5 кГц)/2)=10,750 кГц к центральной частоте частотного интервала от 8 кГц до 16 кГц (соответствующего интервалу π/2 - π), т.е. в 12 кГц.
Блоки понижения частоты выборки, прореживающие сигналы подполос на показатель 2.
В синтезирующей части, выполняется обратная операция:
Принятые сигналы подвергаются повышению частоты выборки на показатель 2.
Для высокой полосы частотный сдвиг -1250 Гц применяется как прямой частотный сдвиг.
Применяется блок объединения полос с пересечением на 7,5 кГц.
Применяется низкочастотный фильтр около частоты Найквиста с частотой среза в 14 кГц.
Будет понятно, что индивидуальные объекты и процессоры могут быть реализованы посредством любого подходящего подхода.
Например, для группы 405 фильтров, может быть использован эллиптический низкочастотный фильтр с нечетным порядком при 7,5 кГц и комплементарный ему по мощности высокочастотный фильтр, как показано на Фиг. 9.
Такие фильтры могут, например, быть реализованы с помощью всечастотных фильтров. В случае, когда два фильтра являются комплементарными по мощности фильтрами, они совместно используют одинаковые всечастотные фильтры. Структура по Фиг. 10 может, например, быть реализована с помощью всечастотных секций A0(z) и A1(z).
Блоки сдвига частоты могут быть реализованы с использованием аналитического сигнала как проиллюстрировано на Фиг. 11. Аналитический сигнал является комплексным (временным) сигналом с первоначальным сигналом, образующим вещественную часть и часть с преобразованием Гилберта, образующую мнимый сигнал. В частотной области, такой сигнал имеет только участки для положительных частот. Умножение этого сигнала на сдвигает спектр на ωs. Взятие вещественной части этого сигнала дает первоначальный сигнал, сдвинутый на ωs. Комплексный фильтр может быть спроектирован как с FIR-, так и IIR-фильтрами.
В синтезирующей части, могут быть использованы те же блоки построения. Блок 705 объединения подполос может, например, быть реализован как проиллюстрировано на Фиг. 12.
Данный подход может быть использован во многих разных применениях и может предоставить преимущества для многих разных типов аудиосигналов и обработки аудио.
Однако, данный подход может в частности очень подходить для обработки речи. На самом деле, для речи, характеристики как правило оказываются очень разными в разных полосах, и описанный подход обеспечивает возможность обработки подполос, которая может отражать и быть адаптированной для таких вариаций характеристик. Эффект становится все более значительным по мере увеличения полосы частот, используемой для представления речи, какой тенденция является в настоящее время.
Таким образом, в качестве примера, алгоритм, применяемый процессорами 601, 603 сигналов по Фиг. 6, может быть алгоритмом обработки речи, и конкретно может быть алгоритмом обработки для улучшения речи. Из-за существенно разных свойств речи в двух подполосах (например, от 0-7,5 кГц и от 7,5-14 кГц), процессоры 601, 603 сигналов могут быть размещены для применения разных алгоритмов в разных подполосах.
В качестве конкретного примера, возьмем подавление стационарного шума. При подавлении стационарного шума часто пытаются оценить спектральную амплитуду фонового шума во время тишины и изменить спектральную амплитуду входного сигнала, так чтобы спектральная амплитуда очищенного сигнала имела сходство со спектральной амплитудой желаемого сигнала, тогда как фаза остается неизмененной. Спектры часто вычисляются посредством краткосрочного быстрого преобразования Фурье (STFFT) перекрывающихся временных сигналов, обработанных с помощью окна Хеннинга. Требуемое разрешение по частоте определяется разрешением по частоте человеческого слуха, которое является высоким при низких частотах и низким при высоких частотах. Разбиение полос обеспечивает нам возможность применения алгоритма подавления стационарного шума в более низкой полосе со значительной длиной STFFT для обеспечения достаточного разрешения по частоте и алгоритма подавления стационарного шума в более высокой полосе с помощью STFFT меньшего размера, которое обеспечивает более низкое разрешение по частоте, но следовательно высокое разрешение во временной области.
В некоторых вариантах осуществления, алгоритмом обработки сигналов может быть подавление эха. Фиг. 13 иллюстрирует пример подавления эха по Фиг. 3, но модифицированный для выполнения индивидуальной обработки подполос.
Как может быть видно, в примере, сигнал громкоговорителя X(ω) подается первому генератору 1301 подполос, соответствующему генератору 401 подполос по Фиг. 4. Два результирующих сигнала подполос подаются в фильтр 1303 подавления эха, который в этом примере образован двумя подфильтрами 1305, 1307 подавления эха, каждый из которых функционирует с прореженной частотой (т.е. с половиной первой частоты осуществления выборки). Таким образом, в примере для каждой полосы предусматривается один подфильтр подавления эха.
Аналогично, принятый сигнал S(ω)+E(ω) делится на два сигнала подполос посредством второго генератора 1309 подполос, соответствующего генератору 401 подполос по Фиг. 4. Остаточный сигнал генерируется индивидуально для двух подполос посредством сравнения оцененного и принятого сигналов отдельно в каждой подполосе.
К тому же, каждый адаптивный подфильтр 1305, 1307 подавления эха обновляется на основе остаточного сигнала в каждой подполосе (например, с использованием адаптивного алгоритма минимальной среднеквадратичной ошибки, чтобы минимизировать мощность остаточного сигнала). Таким образом, обновление подфильтров 1305, 1307 подавления эха выполняется индивидуально в каждой подполосе, и на самом деле, подавление эха выполняется как два отдельных процесса в двух подполосах. Это в частности обеспечивает возможность разной длины адаптивных подфильтров 1305, 1307 подавления эха, тем самым обеспечивая возможность существенного снижения сложности.
В примере, остаточный сигнал кроме того подается в синтезатор 1311 в соответствии с примером по Фиг. 7. Синтезатор 1311 может объединить подполосы остаточного сигнала, тем самым генерируя полнополосный речевой сигнал с подавленным эхо.
В вышеуказанном были описаны различные примерные варианты осуществления с конкретным потоком сигналов и порядком операций. Однако, будет понятно, что могут быть вариации в конкретной обработке, и в действительности, что порядок или последовательность выполняемых операций может быть разной в разных вариантах осуществления. Например, как описано ранее, фильтрация подполосы синтеза может быть выполнена как часть повышения частоты выборки или как часть объединения подполос.
В качестве другого примера, Фиг. 4 иллюстрирует пример, в котором прореживание выполняется после частотного сдвига. Однако, в некоторых вариантах осуществления, прореживание возможно может быть выполнено до частотного сдвига или на самом деле как часть частотного сдвига.
Для того, чтобы проиллюстрировать данный подход, может быть рассмотрен FIR-фильтр, за которым следует прореживатель, достигающий показателя прореживания два посредством удержания только выборок с четными номерами. Такой FIR-фильтр возможно может быть спроектирован так, что с точки зрения импульсной характеристики все коэффициенты с нечетными номерами являются нулевыми. В этом случае, возможно создать новый FIR-фильтр, который только включает в себя ненулевые коэффициенты, и при этом прореживатель находится перед фильтром. Это даст в результате точно такой же выход FIR-фильтра, но с меньшей сложностью.
Например, для числа коэффициентов N=5, коэффициенты h0, h2, h4 являются ненулевыми, тогда как h1=h3=0. Обозначая вход как x и выход как y, может быть сгенерирован нижеследующий выход фильтра:
y(n)=h(0)×(n)+h(1)×(n-1)+h(2)×(n-2)+h(3)×(n-3)+h(4)×(n-4)
y(n+1)=h(0)×(n+1)+h(1)×(n)+h(2)×(n-1)+h(3)×(n-2)+h(4)×(n-3)
y(n+2)=h(0)×(n+2)+h(1)×(n+1)+h(2)×(n)+h(3)×(n-1)+h(4)×(n-2)
y(n+3)=h(0)×(n+3)+h(1)×(n+2)+h(2)×(n+1)+h(3)×(n)+h(4)×(n-1)
и после прореживателя:
y(n)=h(0)×(n)+h(1)×(n-1)+h(2)×(n-2)+h(3)×(n-3)+h(4)×(n-4)
y(n+2)=h(0)×(n+2)+h(1)×(n+1)+h(2)×(n)+h(3)×(n-1)+h(4)×(n-2)
так как h1=h3=0 можно написать:
y(n)=h(0)×(n)+h(2)×(n-2)+h(4)×(n-4)
y(n+2)=h(0)×(n+2)+h(2)×(n)+h(4)×(n-2)
Это эквивалентно прореживателю перед фильтром с коэффициентами h(0), h(2), h(4). Таким образом, в примере, прореживание может быть выполнено до FIR-фильтрации.
В некоторых вариантах осуществления, аналогичный подход может быть использован для частотного сдвига. Конкретно, если частоты выбраны, чтобы предоставлять периодически повторяющиеся нулевые коэффициенты, оставшиеся коэффициенты могут быть применены к прореженному сигналу (возможно частично прореженному сигналу, т.е. прореживание может быть выполнено в два этапа).
В качестве конкретного примера прореживания, выполняемого как часть частотного сдвига, может быть рассмотрен блок сдвига частоты по Фиг. 11. В примере за блоком сдвига частоты следует прореживатель, но можно легко увидеть, что вместо прореживания, выбирающего поднабор выборок на выходе блока сдвига частоты, прореживание может вместо этого быть выполнено в индивидуальных трактах. Например, прореживание может быть выполнено в отношении индивидуальных трактов на входе в сумматор или на самом деле на входе в блоки умножения (таким образом, будут нужны два прореживателя, по одному на каждом тракте).
Будет понятно, что вышеуказанное описание для ясности описывает варианты осуществления данного изобретения со ссылкой на разные функциональные схемы, блоки и процессоры. Однако, будет понятно, что любое подходящее распределение функциональности между разными функциональными схемами, блоками или процессорами может быть использовано без ущерба изобретению. Например, функциональность, проиллюстрированная для выполнения отдельными процессорами или контроллерами, может быть выполнена одним процессором или контроллерами. Поэтому ссылки на конкретные функциональные блоки или схемы следует рассматривать как ссылки на подходящие средства для обеспечения описанной функциональности, а не указывающими строгую логическую или физическую структуру или организацию.
Данное изобретение может быть реализовано в любой подходящей форме, включающей в себя аппаратные средства, программное обеспечение, программно-аппаратные средства или любую их комбинацию. Данное изобретение может быть опционально реализовано по меньшей мере частично как компьютерное программное обеспечение, выполняющееся на одном или более процессорах обработки данных и/или процессорах цифровой обработки сигналов. Элементы и компоненты варианта осуществления данного изобретения могут быть физически, функционально и логически реализованы любым подходящим образом. Фактически, функциональность может быть реализована в одиночном блоке, во множестве блоков или как часть других функциональных блоков. В связи с этим, данное изобретение может быть реализовано в одиночном блоке или может быть физически и функционально распределено между разными блоками, схемами и процессорами.
Хотя настоящее изобретение было описано в связи с некоторыми вариантами осуществления, оно не предназначено для ограничения конкретными формами изложенными в настоящем документе. Скорее, объем настоящего изобретения ограничен только прилагающейся формулой изобретения. Кроме того, хотя признак может оказаться описанным в связи с конкретными вариантами осуществления, специалисты в данной области техники поймут, что различные признаки описанных вариантов осуществления могут быть скомбинированы в соответствии с данным изобретением. В формуле изобретения термин "содержащий" не исключает присутствия других элементов или этапов.
Кроме того, хотя перечислены индивидуально, множество средств, элементов, схем или этапов способа могут быть реализованы, например, посредством одиночной схемы, блока или процессора. Дополнительно, хотя индивидуальные признаки могут быть включены в разные пункты формулы изобретения, они возможно могут быть предпочтительным образом скомбинированы, и включение в разные пункты формулы изобретения не предполагает, что комбинация этих признаков не выполнима и/или предпочтительна. Также данное включение признака в одну категорию формулы изобретения не предполагает ограничение этой категорией, а скорее указывает, что признак в равной степени применим к другим категориям формулы изобретения в соответствующих случаях. Кроме того, порядок признаков в формуле изобретения не предполагает какого-либо конкретного порядка, в котором признаки должны работать, и в частности, порядок индивидуальных этапов в формуле изобретения на способ не предполагает, что этапы должны быть выполнены в этом порядке. Скорее, данные этапы могут быть выполнены в любом подходящем порядке. В добавление, ссылки на единственное число не исключают множественности. Таким образом, указание единственности, "первый", "второй" и т.д., не устраняют множественности. Ссылки в формуле изобретения предоставлены лишь как разъясняющий пример, и не должны быть истолкованы в качестве ограничения объема формулы изобретения каким-либо образом.
Изобретение относится к средствам для обработки аудиосигналов. Технический результат заключается в повышении эффективности обработки аудио. Устройство обработки аудиосигнала содержит приемник, принимающий аудиосигнал с выборкой с первой частотой осуществления выборки, причем аудиосигнал, имеющий максимальную частоту ниже половины первой частоты осуществления выборки на предел первой частоты. Группа фильтров генерирует сигналы подполос для цифрового аудиосигнала с использованием перекрывающихся подфильтров. Первый блок сдвига частоты применяет частотный сдвиг по меньшей мере к одной подполосе из набора подполос, и прореживатель прореживает сигналы подполос на показатель прореживания, приводя к тому, что прореженная частота осуществления выборки по меньшей мере в два раз больше ширины полосы каждого из перекрывающихся подфильтры. Частотный сдвиг для подполосы предусматривается для сдвига подполосы в частотный интервал, являющийся кратным частотному интервалу от нуля до половины прореженной частоты выборки. Подполоса может быть индивидуально обработана, и обработанные подполосы могут последовательно быть объединены для генерирования полнополосного выходного сигнала. 3 н. и 11 з.п. ф-лы, 13 ил.
1. Устройство обработки аудиосигнала, содержащее:
приемник (403) для приема аудиосигнала с выборкой с первой частотой осуществления выборки, причем аудиосигнал, имеющий максимальную частоту, не превышающую пороговую частоту, которая ниже, чем половина первой частоты осуществления выборки на предел первой частоты;
группу (405) фильтров для генерирования сигналов подполос для цифрового аудиосигнала, причем группа фильтров, содержащая набор перекрывающихся подфильтров, предоставляющих набор подполос;
первый блок (407) сдвига частоты для применения частотного сдвига по меньшей мере к одной подполосе из набора подполос;
прореживатель (409) для прореживания сигналов подполос на показатель прореживания, приводящего к тому, что прореженные сигналы подполос имеют прореженную частоту осуществления выборки, равную первой частоте осуществления выборки, деленной на показатель прореживания, причем прореженная частота осуществления выборки по меньшей мере в два раза больше ширины полосы каждого из перекрывающихся подфильтров; и
при этом частотный сдвиг для подполосы предусматривается для сдвига подполосы в частотный интервал, являющийся кратным частотному интервалу от нуля до половины прореженной частоты выборки.
2. Устройство обработки аудиосигнала по п. 1, дополнительно содержащее процессор (601, 603) сигналов, размещенный для применения алгоритма обработки сигналов к аудиосигналу посредством применения отдельной обработки сигнала подполосы в каждой подполосе.
3. Устройство обработки аудиосигнала по п. 2, при этом алгоритмом обработки сигналов является алгоритм обработки речи и процессор (601, 603) сигналов размещен для применения разных алгоритмов в разных подполосах.
4. Устройство обработки аудиосигнала по п. 2, при этом алгоритм обработки сигналов содержит применение адаптивного фильтра и процессор (601, 603) сигналов размещен для адаптирования адаптивного фильтра отдельно в разных подполосах.
5. Устройство обработки аудиосигнала по п. 4, при этом аудиосигнал и адаптивный фильтр являются фильтром подавления эха для оценивания эха аудиосигнала, причем фильтр подавления эха содержит подфильтр подавления эха для каждой подполосы; и процессор (601, 603) сигналов выполнен с возможностью:
определения оцененных эхо-сигналов для каждой подполосы посредством применения подфильтра подавления эха к прореженному сигналу подполосы в каждой подполосе;
определения сигнала ошибки для каждой подполосы посредством сравнения оцененного эхо-сигнала в каждой подполосе с захваченным аудиосигналом, содержащим эхо аудиосигнала; и
обновления каждого подфильтра подавления эха в ответ на сигнал ошибки для соответствующей подполосы.
6. Устройство обработки аудиосигнала по п. 2, дополнительно содержащее синтезатор (605) для синтезирования выходного аудиосигнала с первой частотой осуществления выборки из обработанных сигналов подполос, сгенерированных посредством обработки сигнала подполосы в каждой подполосе; причем синтезатор (605) содержит:
блок (701) повышения частоты выборки для повышения частоты выборки обработанных сигналов подполос до первой частоты осуществления выборки, чтобы сгенерировать обработанные сигналы подполос с повышенной частотой выборки;
второй блок (703) сдвига частоты для применения обратного частотного сдвига к обработанным сигналам подполос с повышенной частотой выборки, причем обратный частотный сдвиг для первой подполосы приводит к тому, что первая подполоса сдвигается в частотный диапазон подфильтра для первой подполосы;
блок (705) объединения подполос для объединения, вслед за применением обратного частотного сдвига, обработанных сигналов подполос с повышенной частотой выборки, для генерирования обработанного аудиосигнала;
набор (707) фильтров подполос для фильтрации обработанных сигналов подполос с повышенной частотой выборки для ослабления спектра искажений повышенной частоты выборки для каждой подполосы, причем каждый фильтр из набора фильтров, имеющий ширину полосы, не превышающую половину первой частоты осуществления выборки.
7. Устройство обработки аудиосигнала по п. 6, при этом блок объединения подполос (705) содержит по меньшей мере один из набора фильтров подполос, и
блок комбинирования для генерирования обработанного аудиосигнала посредством комбинирования подполосы обработанных сигналов с повышенной частотой выборки вслед за фильтрацией подполос.
8. Устройство обработки аудиосигнала по п. 1, при этом частотный сдвиг для первой подполосы задан как:
где fd - прореженная частота выборки, fm - центральная частота первой подполосы до частотного сдвига и n - целое число (n ≥ 1).
9. Устройство обработки аудиосигнала по п. 1, при этом ослабление подфильтра для первой подполосы не меньше, чем 6 дБ при частоте, кратной половине прореженной частоты выборки, сдвинутой на значение, соответствующее частотному сдвигу.
10. Устройство обработки аудиосигнала по п. 1, при этом группа фильтров образована набором комплементарных по мощности подфильтров.
11. Устройство обработки аудиосигнала по п. 1, при этом каждый фильтр из набора подфильтров имеет ширину полосы 6 дБ, не превышающую половину частоты прореживания.
12. Устройство обработки аудиосигнала по п. 1, при этом пороговая частота не меньше, чем на 10% ниже, чем половина первой частоты осуществления выборки.
13. Устройство обработки аудиосигнала, содержащее:
приемник (403) для приема набора прореженных сигналов подполос с прореженной периодичностью выборки, представляющего аудиосигнал с первой частотой осуществления выборки и имеющего максимальную частоту, не превышающую пороговую частоту, являющуюся ниже, чем половина первой частоты осуществления выборки на предел первой частоты, причем прореженные сигналы подполос имеют частотный сдвиг в частотный интервал, являющийся кратным частотному интервалу от нуля до половины прореженной частоты выборки, и впоследствии прореженные на показатель прореживания; и
синтезатор (605) для синтеза выходного аудиосигнала с первой частотой осуществления выборки из набора прореженных сигналов подполос; причем синтезатор (605) содержит:
блок (701) повышения частоты выборки для повышения частоты выборки прореженных сигналов подполос до первой частоты осуществления выборки для генерирования сигналов подполос с повышенной частотой выборки;
второй блок (703) сдвига частоты для применения обратного частотного сдвига к сигналам подполос с повышенной частотой выборки, причем обратный частотный сдвиг для первого прореженного сигнала подполосы приводит к сдвигу первого прореженного сигнала подполосы в частотный диапазон, соответствующий частотному диапазону прореженного сигнала подполосы в аудиосигнале до частотного сдвига и прореживания;
блок (705) объединения подполос для объединения, вслед за применением обратного частотного сдвига, сигналов подполос с повышенной частотой выборки для генерирования объединенного аудиосигнала;
набор (707) фильтров подполос для фильтрации обработанных сигналов подполос с повышенной частотой выборки для ослабления спектра искажений повышенной частоты выборки для каждой подполосы, причем каждый фильтр из набора фильтров имеет ширину полосы, не превышающую половину первой частоты осуществления выборки.
14. Способ обработки аудиосигнала, содержащий этапы, на которых:
принимают аудиосигнал с выборкой с первой частотой осуществления выборки, причем аудиосигнал имеет максимальную частоту, не превышающую пороговую частоту, которая ниже, чем половина первой частоты осуществления выборки на предел первой частоты;
генерируют посредством группы фильтров сигналы подполос для цифрового аудиосигнала, причем группа фильтров содержит набор перекрывающихся подфильтров, предоставляющих набор подполос;
применяют частотный сдвиг по меньшей мере к одной подполосе из набора подполос;
осуществляют прореживание сигналов подполос на показатель прореживания, приводящее к тому, что прореженные сигналы подполос имеют прореженную частоту выборки, равную первой частоте осуществления выборки, деленной на показатель прореживания, причем прореженная частота выборки по меньшей мере в два раза больше ширины полосы каждого из перекрывающихся подфильтров; и
при этом частотный сдвиг для подполосы сдвигает подполосу в частотный интервал, являющийся кратным частотному интервалу от нуля до половины прореженной частоты выборки.
Резцедержатель | 1977 |
|
SU721251A1 |
US 9148126 B2, 29.09.2015 | |||
Пломбировальные щипцы | 1923 |
|
SU2006A1 |
Устройство для выдергивания форм с утфелем из разливных вагонеток | 1929 |
|
SU20040A1 |
МАСШТАБИРУЕМЫЙ АУДИОКОДЕР БЕЗ ПОТЕРЬ И АВТОРСКОЕ ИНСТРУМЕНТАЛЬНОЕ СРЕДСТВО | 2005 |
|
RU2387022C2 |
Авторы
Даты
2020-07-28—Публикация
2016-09-19—Подача