УСТРОЙСТВО И СПОСОБ ДЛЯ РАЗРЕШЕНИЯ НЕОДНОЗНАЧНОСТИ ИЗ ОЦЕНКИ НАПРАВЛЕНИЯ ПРИХОДА Российский патент 2015 года по МПК G01S3/802 

Описание патента на изобретение RU2552129C2

Настоящее изобретение в общем относится к устройству и способу для разрешения неоднозначности из оценки направления прихода. Дополнительные варианты осуществления настоящего изобретения относятся к улучшению неоднозначного оценивания параметра пространственного аудио.

Настоящее изобретение создано в контексте пространственного аудиокодирования с внешним интерфейсом микрофона. Мы фокусируемся на параметрических методах, т.е. пространственный звук описывается посредством одного или более аудиосигналов, сопровождаемых параметрической дополнительной информацией. Дополнительная информация получается на основании по меньшей мере двух микрофонов. Компоновки микрофонов и архитектуры обработки сигналов обычно проектируются, чтобы покрывать определенный частотный диапазон, представляющий интерес, где желаемые спецификации строго соблюдены. Вне этой области, представляющей интерес, могут возникнуть заметные отклонения из-за требуемой пространственной избирательности. Сильное отклонение состоит в так называемом пространственном искажении. В контексте анализа звукового поля самым важным эффектом пространственного искажения является то, что оценки направления прихода звука становятся неоднозначными. Следовательно, определенное поведение, которое является ожидаемым или желаемым только для определенного направления, также наблюдается в одном или более других направлениях.

Цель пространственного аудиокодирования состоит в воспроизведении пространственных акустических сцен посредством нескольких аудиоканалов, сопровождаемых параметрической дополнительной информацией. Следовательно, основной проблемой является то, что неточные оценки параметров вызовут нежелательные результаты процедуры воспроизведения или любого другого блока обработки (например, для направленной фильтрации), который использует пространственные параметры. Этот учет применяется к вышеупомянутым затронутым частотным диапазонам, особенно, где возникает пространственное искажение.

Вследствие этого, целью настоящего изобретения является предоставить улучшенный концепт для обработки пространственного параметра.

Эта цель достигается посредством устройства по п. 1, способу по п. 14 или компьютерной программы по п. 15.

Согласно варианту осуществления настоящего изобретения, устройство для разрешения неоднозначности из оценки направления прихода (DOA) содержит анализатор оценки DOA и блок разрешения неоднозначности. Анализатор оценки DOA выполнен с возможностью анализирования оценки DOA для получения множества неоднозначных параметров анализа посредством использования информации смещения. Здесь информация смещения представляет отношение между смещенной и несмещенной оценками DOA. Более того, блок разрешения неоднозначности выполнен с возможностью разрешения неоднозначности во множестве неоднозначных параметров анализа для получения однозначного разрешенного параметра.

Основной идеей, лежащей в основе настоящего изобретения, является то, что улучшенная обработка пространственного параметра может быть достигнута, если оценка DOA анализируется для получения множества неоднозначных параметров анализа посредством использования информации смещения, причем информация смещения представляет отношение между смещенной и несмещенной оценками DOA, и если неоднозначность во множестве неоднозначных параметров анализа разрешается для получения однозначного разрешенного параметра. Эта мера обеспечивает возможность разрешения неоднозначности, возникающей в результате неточной оценки параметра DOA, вызванной пространственным искажением.

Согласно дополнительным вариантам осуществления, анализатор оценки DOA выполнен с возможностью отнесения оценки DOA к множеству неоднозначных несмещенных оценок DOA на основе функции смещения, в котором функция смещения указана посредством информации смещения. Здесь множество неоднозначных несмещенных оценок DOA соответствует множеству неоднозначных параметров анализа. Более того, блок разрешения неоднозначности выполнен с возможностью определения однозначного разрешенного параметра из множества неоднозначных несмещенных оценок DOA посредством использования предварительной информации локализации одного или более активных источников. Это особенно обеспечивает возможность получения конкретного или скорректированного параметра DOA из предварительной информации о положении источника звука.

Согласно дополнительным вариантам осуществления, анализатор оценки DOA выполнен с возможностью генерирования множества ответвлений для каждого неоднозначного параметра анализа из множества неоднозначных параметров анализа, в котором множество ответвлений отражает неоднозначность во множестве неоднозначных параметров анализа. Здесь анализатор оценки DOA выполнен с возможностью получения множества ответвлений из оценки DOA или дополнительной обработки множества неоднозначных несмещенных оценок DOA для получения множества ответвлений. К тому же анализатор оценки DOA выполнен с возможностью вычисления параметров усиления для операции спектрального взвешивания. В качестве альтернативы, анализатор оценки DOA может быть также выполнен с возможностью вызова спектральной модификации дополнительными средствами, например сложением, вычитанием или взятием логарифма, что является аналогичным операции спектрального взвешивания. Более того, блок разрешения неоднозначности выполнен с возможностью определения однозначного разрешенного параметра из множества ответвлений, представляющих неоднозначные параметры анализа. Вследствие этого, возможно получить подходящий параметр усиления для операции спектрального взвешивания, такой как операция рендеринга или направленной фильтрации в области направленного аудиокодирования. Более того, посредством такой меры не требуется получать предварительную информацию локализации.

В дополнительном варианте осуществления, анализатор оценки DOA выполнен с возможностью получения множества ответвлений за один этап обработки, так что предоставляется результат обработки, который был бы получен, если два этапа обработки были выполнены последовательно. В частности, анализатор оценки DOA может содержать, для каждого ответвления из множества ответвлений, блок обработки параметров, в котором блок обработки параметров может быть выполнен с возможностью отнесения оценки DOA к предварительно определенному неоднозначному параметру анализа, как указано результатом обработки. Таким образом, более высокая эффективность или уменьшение вычислительной работы может быть достигнута, когда неоднозначность во множестве неоднозначных параметров анализа разрешена.

Дополнительный вариант осуществления настоящего изобретения предоставляет способ для разрешения неоднозначности из оценки DOA.

В дальнейшем, варианты осуществления настоящего изобретения будут разъяснены со ссылкой на прилагаемые чертежи, на которых:

на Фиг. 1 показана блок-схема варианта осуществления устройства для разрешения неоднозначности из оценки DOA;

на Фиг. 2 показана блок-схема дополнительного варианта осуществления устройства для разрешения неоднозначности из оценки DOA посредством использования предварительной информации локализации;

на Фиг. 3 показана блок-схема дополнительного варианта осуществления устройства для разрешения неоднозначности из оценки DOA с помощью селектора для выбора однозначного разрешенного параметра;

на Фиг. 4 показана блок-схема дополнительного варианта осуществления устройства для разрешения неоднозначности из оценки DOA с помощью блока отображения для отображения множества неоднозначных несмещенных оценок DOA на однозначный разрешенный параметр;

на Фиг. 5 показана блок-схема варианта осуществления блока отображения в соответствии по фиг. 4 с генератором чисел;

на Фиг. 6 показана блок-схема дополнительного варианта осуществления устройства для разрешения неоднозначности из оценки DOA с помощью поставщика информации локализации для предоставления предварительной информации локализации;

на Фиг. 7 показана блок-схема дополнительного варианта осуществления устройства для разрешения неоднозначности из оценки DOA с помощью вычисления параметра усиления;

на Фиг. 8 показана блок-схема дополнительного варианта осуществления устройства для разрешения неоднозначности из оценки DOA, включающего в себя генератор неоднозначных несмещенных оценок DOA и процессор параметров;

на Фиг. 9 показана блок-схема дополнительного варианта осуществления устройства для разрешения неоднозначности из оценки DOA с помощью множества блоков обработки параметров для получения результата обработки за один этап;

на Фиг. 10 показана схематичная иллюстрация параметрического пространственного аудиокодера;

на Фиг. 11 показана схематичная иллюстрация параметрического пространственного аудиодекодера;

на Фиг. 12 показана схематичная иллюстрация квадратной решетки всенаправленных микрофонов с пятым всенаправленным микрофоном в центре;

на фиг. 13 показан примерный график оценок азимутального угла при частотах между 4 и 7 кГц согласно варианту осуществления настоящего изобретения;

на Фиг. 14 показаны примерные графики для панорамирования усилений как функции DOA для установки из 3 громкоговорителей согласно варианту осуществления настоящего изобретения;

на Фиг. 15 показана примерная диаграмма направленности функций усиления направленной фильтрации согласно варианту осуществления настоящего изобретения;

на Фиг. 16 показана общая структура варианта осуществления устройства для разрешения неоднозначности оценок пространственных параметров;

на Фиг. 17 показана структура для корректирования смещенных оценок DOA согласно варианту осуществления настоящего изобретения;

на Фиг. 18 показан примерный график оцененного DOA как функции несмещенного DOA выше частоты пространственного искажения согласно варианту осуществления настоящего изобретения;

на Фиг. 19 показан примерный график оцененного DOA как функции несмещенного DOA согласно дополнительному варианту осуществления настоящего изобретения;

на фиг. 20 показан примерный график двух источников с их соответствующими функциями плотности вероятностей согласно варианту осуществления настоящего изобретения;

на Фиг. 21 показана примерная функция проектирования для направленной фильтрации, как функция DOA, согласно варианту осуществления настоящего изобретения;

на Фиг. 22 показана структура для регулирования блоков обработки, которые работают как функция неоднозначного DOA, для генерирования скорректированных выходных параметров согласно варианту осуществления настоящего изобретения.

На Фиг. 1 показана блок-схема варианта осуществления устройства 100 для разрешения неоднозначности из оценки 105 DOA. Оценка 105 DOA может быть получена из пространственного аудиосигнала посредством использования блока оценивания DOA. Здесь пространственный аудиосигнал может содержать всенаправленный или множество разных направленных дипольных сигналов. Оценка 105 DOA, полученная из пространственного аудиосигнала, может соответствовать параметру DirAC и может быть представлена углом ϕ ^ amb для DOA звука. В частности, оценка 105 DOA может быть зависимой от времени и от частоты, ϕ ^ amb = ϕ ^ amb (k, m), где k указывает временной блок и m - частотный диапазон. К тому же оценка 105 DOA, ϕ ^ amb, по существу, соответствует неточной или неоднозначной оценке DOA, возникающей от одного или более активных источников звука. Ссылаясь на Фиг. 1, устройство 100 содержит анализатор 110 оценки DOA и блок 120 разрешения неоднозначности. Как может быть видно на Фиг. 1, анализатор 110 оценки DOA выполнен с возможностью анализирования оценки 105 DOA для получения множества неоднозначных параметров анализа посредством использования информации 101 смещения. Здесь информация 101 смещения представляет отношение, ϕ ^ ↔ φ между смещенной, ϕ ^ , и несмещенной оценкой DOA, φ. Особенно обращается внимание, что оценки DOA могут представлять смещенные и несмещенные оценки DOA. Более того, блок 120 разрешения неоднозначности выполнен с возможностью разрешения неоднозначности во множестве 115 неоднозначных параметров анализа для получения однозначного разрешенного параметра 125.

На Фиг. 2 показана блок-схема дополнительного варианта осуществления устройства 200 для разрешения неоднозначности из-за оценки 105 DOA посредством использования предварительной информации локализации или пространственной информации 211. Как показано на Фиг. 2, устройство 200 содержит анализатор 210 оценки DOA, который выполнен с возможностью отнесения оценки 105 DOA, ϕ ^ amb, к множеству 215 неоднозначных несмещенных оценок DOA, ϕ ˜ I... ϕ ˜ N, на основе функции 201 смещения, ϕ ^ =f(φ). Анализатор 210 оценки DOA устройства 200, показанного на Фиг. 2, может соответствовать анализатору 110 оценки DOA устройства 100, показанного на Фиг. 1. Здесь функция 201, используемая анализатором 210 оценки DOA на Фиг. 2, может быть указана посредством информации 101 смещения на Фиг. 1, тогда как множество 215 неоднозначных несмещенных оценок DOA, ϕ ˜ I... ϕ ˜ N, на выходе анализатора 210 оценки DOA на Фиг. 2 соответствует множеству 115 неоднозначных параметров анализа на Фиг. 1. В варианте осуществления по фиг. 2, блок 120 разрешения неоднозначности выполнен с возможностью определения однозначного разрешенного параметра 125, ϕ ˜ r e s , из множества 215 неоднозначных несмещенных оценок DOA, ϕ ˜ I... ϕ ˜ N, посредством использования предварительной информации 211 локализации одного или более активных источников. Здесь предварительная информация локализации может представлять DOA 211, ϕ ˜ Q 1 , ϕ ˜ Q 2 ,... одного или более активных источников.

Кроме того, следует отметить, что оценка 105 DOA, ϕ ˜ amb, полученная от оценивания DOA, может возникать от одного или более активных источников.

Также здесь обращается внимание на то, что, в общем, имеется два типа DOA. В вариантах осуществления, DOA ϕ ˜ Q 1 , ϕ ˜ Q 2 ,..., могут соответствовать положениям отдельных источников, тогда как оценки DOA ϕ ˜ I... ϕ ˜ N могут соответствовать "мгновенным" DOA (т.е. DOA, относящимся к отдельным временным/частотным ячейкам).

На Фиг. 3 показана блок-схема дополнительного варианта осуществления устройства 300 для разрешения неоднозначности из-за оценки 105 DOA с помощью селектора 320. Здесь устройство 300 по Фиг. 3, по существу, содержит те же блоки, как и устройство 200 по Фиг. 2. Вследствие этого, идентичные блоки, имеющие аналогичные реализации и/или функции, обозначены теми же номерами. Однако, в варианте осуществления по Фиг. 3, блок 120 разрешения неоднозначности сконфигурирован как селектор 320 для выбора однозначного разрешенного параметра 325, ϕ ˜ r e s , из множества 215 неоднозначных несмещенных оценок DOA. В вариантах осуществления, селектор 320 может быть выполнен с возможностью выполнения выбора однозначного разрешенного параметра 325, ϕ ˜ r e s , на основе меры расстояния между оценкой локализации, соответствующей неоднозначной оценке несмещенного DOA из множества 215 неоднозначных несмещенных оценок DOA, и предварительными оценками 311 локализации одного или более активных источников. Здесь однозначный разрешенный параметр 325 на выходе селектора 320, показанного на Фиг. 3, может соответствовать однозначному разрешенному параметру 125 на выходе блока 120 разрешения неоднозначности, показанного на Фиг. 2. Предварительные оценки 311 локализации, показанные на Фиг. 3, могут соответствовать любому из DOA ϕ ˜ Q 2 , ϕ ˜ Q z ,... одного или более активных источников. Вследствие этого, в вариантах осуществления, однозначный разрешенный параметр 325, ϕ ˜ r e s , может соответствовать оценке выбранного DOA, ϕ ˜ S , выбранной из множества 215 неоднозначных несмещенных оценок DOA, для которых мера расстояния касательно одного или более активных источников является наименьшей.

На Фиг. 4 показана блок-схема дополнительного варианта осуществления устройства 400 для разрешения неоднозначности из-за оценки 105 DOA с помощью блока 420 отображения. Так как устройство 400 по Фиг. 4, по существу, содержит те же блоки, что и устройство 200 по Фиг. 2, идентичные блоки, имеющие аналогичные реализации и/или функции, снова обозначаются теми же номерами.

В варианте осуществления по Фиг. 4, блок 120 разрешения неоднозначности сконфигурировано как блока 420 отображения для отображения множества 215 неоднозначных несмещенных оценок DOA на однозначный разрешенный параметр 425, ϕ ˜ r e s . В частности, блок 420 отображения может быть выполнен с возможностью выполнения отображения множества 215 неоднозначных несмещенных оценок DOA на основе меры расстояния между оценкой локализации, соответствующей неоднозначной несмещенной оценке DOA из множества 215 неоднозначных несмещенных оценок DOA, или выбранной оценкой локализации, соответствующей выбранной оценке 515 DOA, ϕ ˜ S , выбранной из множества 215 неоднозначных несмещенных оценок DOA, и предварительными оценками 311 локализации одного или более активных источников. Как в варианте осуществления по Фиг. 3, предварительные оценки 311 локализации, показанные на Фиг. 311, могут соответствовать любому из DOA ϕ ˜ Q 2 , ϕ ˜ Q z ,... одного или более активных источников.

На Фиг. 5 показана блок-схема варианта осуществления блока 420 отображения в соответствии по Фиг. 4 с генератором 540 чисел. В частности, на Фиг. 5, показаны больше деталей блока 420 отображения. Может быть видно на Фиг. 5, что блок 420 отображения может содержать селектор 510 ϕ ˜ S , определитель 520 ϕ ˜ Q S и блок 530 объединения. Селектор 510 ϕ ˜ S может быть выполнен с возможностью выбора несмещенной оценки 515 DOA, ϕ ˜ S , из множества 215 неоднозначных несмещенных оценок DOA, для которых мера расстояния касательно одного или более активных источников является наименьшей. Определитель 520 ϕ ˜ Q S может быть выполнен с возможностью определения DOA 525, ϕ ˜ Q S , одного или более активных источников, для которых мера расстояния касательно выбранной несмещенной оценки 515 DOA, ϕ ˜ S , является минимальной. Здесь однозначный разрешенный параметр ϕ ˜ r e s может соответствовать определенному DOA, ϕ ˜ Q S , одного или более активных источников.

Генератор 540 чисел блока 420 отображения, показанного на Фиг. 5, может быть реализован для генерирования переменных чисел 525 во времени, тогда как блок 530 объединения блока 420 отображения, показанного на Фиг. 5, может быть реализован для объединения числа из переменных чисел 545, предоставленных генератором 540 чисел и определенной предварительной оценки локализации, соответствующей определенному DOA 525, ϕ ˜ Q S , одного или более активных источников для получения модифицированного относящегося к DOA значения 535, ϕ ˜ d i t h . Здесь однозначный разрешенный параметр 125, ϕ ˜ r e s , может соответствовать модифицированному относящемуся к DOA значению 535, ϕ ˜ d i t h . Генератор 540 чисел, который используется для генерирования переменных чисел 545 во времени, может, например, быть реализован как генератор псевдослучайных чисел, такой как регистр сдвига с линейной обратной связью.

На Фиг. 6 показана блок-схема дополнительного варианта осуществления устройства 600 для разрешения неоднозначности из оценки 105 DOA с помощью поставщика 610 информации локализации или пространственной информации. Здесь устройство 600 по фиг. 6, по существу, содержит те же блоки, как и устройство 200 по фиг. 2. Вследствие этого, идентичные блоки, имеющие аналогичные реализации и/или функции, обозначены теми же номерами. Как показано на Фиг. 6, поставщик 610 информации локализации может быть выполнен с возможностью предоставления предварительной информации 211 локализации для одного или более активных источников. В варианте осуществления по фиг. 6 показано, что поставщик 610 информации локализации может быть выполнен с возможностью предоставления предварительной информации 211 локализации на основе входного параметра 611, который отличается от оценки 105 DOA, ϕ ^ amb. Это означает, что предварительная информация 211 локализации, такая как в форме DOA ϕ ˜ Q 2 , ϕ ˜ Q z ,... одного или более активных источников, по существу, извлекается из других данных, чем оценка 105 DOA, ϕ ^ amb.

На Фиг. 7 показана блок-схема дополнительного варианта осуществления устройства 700 для разрешения неоднозначности из оценки 105 DOA с помощью вычисления параметра усиления. Как может быть видно на Фиг. 7, устройство 700 содержит анализатор 710 оценки DOA, который может быть выполнен с возможностью генерирования множества ответвлений 715 для каждого неоднозначного параметра анализа из множества 115 неоднозначных параметров анализа, в котором множество ответвлений 715 отражает неоднозначность во множестве 115 неоднозначных параметров анализа. В варианте осуществления по фиг. 7 анализатор 710 оценки DOA может быть выполнен с возможностью прямого получения множества ответвлений 715 из оценки 105 DOA или дополнительной обработки множества 813 неоднозначных несмещенных оценок DOA для получения множества ответвлений 715. В частности, анализатор 710 оценки DOA выполнен с возможностью вычисления параметров усиления для операции спектрального взвешивания, такой как операция рендеринга или направленной фильтрации в контексте направленного аудиокодирования. Как изображено на Фиг. 7, анализатор 710 оценки DOA, включающий в себя вычисление параметра усиления, может принимать информацию 101 смещения, чтобы генерировать множество ответвлений 715 посредством рассмотрения неоднозначности из оценки 105 DOA. Как показано на Фиг. 7, блок 720 разрешения неоднозначности устройства 700 может быть выполнен с возможностью определения однозначного разрешенного параметра 725, fres, из множества ответвлений 715, представляющих неоднозначные параметры 115 анализа.

Согласно дополнительным вариантам осуществления, блок 720 разрешения неоднозначности устройства 700 может быть сконфигурирован как блок объединения для объединения множества неоднозначных параметров анализа, представленных множеством ответвлений 715, для получения объединенного параметра, представляющего однозначный разрешенный параметр 725, fres.

Согласно дополнительным вариантам осуществления, блок 720 разрешения неоднозначности устройства 700 может быть также сконфигурирован как селектор для выбора однозначного разрешенного параметра 725, fres, из множества 115 неоднозначных параметров анализа, представленных множеством 715 ответвлений.

В частности, анализатор 710 оценки DOA для выполнения вычисления параметра усиления и блок 720 разрешения неоднозначности в форме блока объединения или селектора устройства 700, показанного на Фиг. 7, могут соответствовать анализатору 110 оценки DOA и блоку 120 разрешения неоднозначности устройства 100, показанного на Фиг. 1, соответственно.

В основном, устройство 700 по фиг. 7 может быть особенно использовано для задания однозначного разрешенного параметра из множества неоднозначных параметров анализа без требования работать с предварительной информацией локализации. В варианте осуществления по фиг. 7, блок 720 разрешения неоднозначности, который сконфигурирован как блок объединения или селектор, может, например, быть реализован с возможностью выбора минимального или максимального значения параметров усиления или для объединения параметров усиления посредством вычисления среднего значения.

На Фиг. 8 показана блок-схема дополнительного варианта осуществления устройства 800 для разрешения неоднозначности из оценки 105 DOA, включающего в себя генератор 812 неоднозначных несмещенных оценок DOA и процессор 814 параметров. Здесь устройство 800 по фиг. 8, по существу, соответствует устройству 700 по фиг. 7, в котором идентичные блоки, имеющие аналогичные реализации и/или функции, обозначаются теми же номерами. Как показано на Фиг. 8, анализатор 810 оценки DOA устройства 800 может содержать генератор 812 неоднозначных несмещенных оценок DOA и процессор 814 параметров. Здесь генератор 812 неоднозначных несмещенных оценок DOA реализован с возможностью отнесения оценки 105 DOA к множеству 813 неоднозначных несмещенных оценок DOA на основе функции 201 смещения, в котором функция 201 смещения указана посредством информации 101 смещения. Более того, процессор 814 параметров может быть реализован с возможностью дополнительной обработки множества 813 неоднозначных несмещенных оценок DOA для получения множества 815 ответвлений, представляющих неоднозначные параметры 115 анализа. Согласно вариантам осуществления, множество 815 ответвлений, представляющих неоднозначные параметры 115 анализа, могут соответствовать набору параметров усиления (gp), которые следует использовать для операции рендеринга, такие как параметры панорамирования усиления в трех направлениях, или параметру усиления (D), который может быть применен для направленной фильтрации внутри схемы кодирования DirAC, соответственно. В вариантах осуществления соответствующие параметры усиления gp для операции рендеринга или параметры усиления (D) для операции направленной фильтрации разных ответвлений 815 могут, например, быть линейно объединены, чтобы получить их среднее значение, или конкретный параметр усиления (например, минимальное или минимального значение) может быть выбран посредством использования блока 720 разрешения неоднозначности. На выходе блока 720 разрешения неоднозначности будет получен однозначный разрешенный параметр 725, fres.

На Фиг. 9 показана блок-схема дополнительного варианта осуществления устройства 900 для разрешения неоднозначности из оценки 105 DOA с помощью множества 913 блоков обработки. Здесь устройство 900 по фиг. 9 может соответствовать устройству 700 по фиг. 7, в котором идентичные блоки, имеющие аналогичные реализации и/или функции, обозначаются теми же номерами. Конкретно, в варианте осуществления по фиг. 9 устройство 900 содержит анализатор 910 оценки DOA, который может быть выполнен с возможностью получения множества 915 ответвлений за один этап обработки, так что будет предоставлен результат обработки, представляющий неоднозначные параметры 115 анализа, который был бы получен, если два этапа обработки были выполнены последовательно.

Следует обратить внимание, что результат обработки, полученный анализатором 910 оценки DOA, по существу, соответствует результату обработки или множеству 815 ответвлений, полученным анализатором 810 оценки DOA, показанным на Фиг. 8. Здесь каждый обработанный параметр или выходной параметр, полученный множеством блоков 913 обработки параметров, является, по существу, равным соответствующему параметру усиления gp; D, выведенный процессором 814 параметров. Однако в варианте осуществления по фиг. 9 эти идентичные параметры могут эффективно быть получены посредством использования только одного этапа обработки. Анализатор 910 оценки DOA устройства 900 может вследствие этого также быть назван как расширенный процессор для обработки оценки 105 DOA расширенным образом, чтобы получить результат обработки, не требуя промежуточного этапа обработки.

В варианте осуществления по фиг. 9 анализатор 910 оценки DOA и блок 720 разрешения неоднозначности могут также быть выполнены с возможностью получения однозначного разрешенного параметра 725 за один этап обработки, так что будет предоставлен результат обработки, представляющий однозначный разрешенный параметр 725, который был бы получен, если два этапа обработки были выполнены последовательно.

В вариантах осуществления однозначный разрешенный параметр 725 может быть предварительно определен или предварительно вычислен в зависимости от соответствующей оценки 105 DOA. Таким образом, полученные параметры и соответствующие оценки DOA могут быть вставлены в таблицу соответствия. Таблица соответствия, включающая в себя эту предварительно определенную информацию, может быть эффективно использована во избежание или по меньшей мере для уменьшения вычислительной нагрузки, генерируемой во время действительной обработки.

В частности, оценка 105 DOA, которая оценена из пространственного аудиосигнала посредством использования блока оценивания DOA, может сначала выступать как входное значение в таблице соответствия, и затем соответствующий однозначный разрешенный параметр 725, которой связан с входным значением в таблице соответствия, может быть выведен как выходное значение.

В качестве альтернативы, ссылаясь на Фиг. 9, анализатор 910 оценки DOA устройства 900 может содержать, для каждого ответвления из множества 915 ответвлений, блок обработки параметров. В частности, каждый блок 914 обработки параметров из множества блоков 913 обработки параметров может быть выполнен с возможностью отнесения оценки 105 DOA к соответствующему неоднозначному параметру анализа. Более того, блок 720 разрешения неоднозначности устройства 900 может впоследствии быть использован для разрешения неоднозначности в результате обработки, представляющем неоднозначные 915 параметры анализа, чтобы в конечном счете получить однозначный разрешенный параметр 725.

Варианты осуществления настоящего изобретения относятся к параметрическому пространственному аудиокодированию и некоторым блокам обработки Направленного аудиокодирования (DirAC). Схема кодирования DirAC является эффективным методом пространственного кодирования, который основывается на вводе микрофона и который служит в качестве примерного основания для дополнительных рассмотрений. Данный подход настоящего изобретения, чтобы справиться с неточными оценками пространственных параметров, представлен еще более подробно в дальнейшем.

Контекстом настоящего изобретения является параметрическое пространственное аудиокодирование. Сначала описываются некоторые важные примеры параметрического пространственного аудиопредставления. В основном рассматривается подход DirAC: как описано в публикации: V. Pulkki. Воспроизведение пространственного звука с направленным аудиокодированием. J. Audio Eng. Soc., 55(6):503-516, июнь 2007, в качестве примера для пространственного аудиокодека, который основывается на сигналах микрофона. Однако основные принципы настоящего изобретения могут также быть применены к другим схемам пространственного аудиокодирования, где неоднозначности в оценках пространственных параметров в определенных спектральных областях могут, например, быть разрешены посредством оценок параметров из разный областей или посредством рассмотрения других дополнительных источников информации, таких как видеоизображения. Прежде чем остановиться на конкретных деталях DirAC, рассмотрим основные структуры кодирования/декодирования, которые являются общими для всех схем параметрического пространственного кодирования.

Главная структура параметрического пространственного аудиокодера 10 согласно вариантам осуществления настоящего изобретения проиллюстрирована на Фиг. 10. На Фиг. 10 показана иллюстрация параметрического пространственного аудиокодера. Кодер 10 берет в качестве входных множественных аудиоканалов 2, например, сигналы микрофона, как описано в публикациях: V. Pulkki. Воспроизведение пространственного звука с направленным аудиокодированием. J. Audio Eng. Soc., 55(6):503-516, июнь 2007, и C. Faller. Внешние интерфейсы микрофонов для пространственных аудиокодеров. 125-ая Конвенция AES, Сан-Франциско, США, октябрь 2008. Выходом кодера 10 является сигнал 3, полученный понижающим микшированием, и соответствующая дополнительная информация. Сигнал 3, полученный понижающим микшированием, состоит из одного или более аудиоканалов. Дополнительная информация 4 включает в себя параметрические метаданные, представляющие наблюдаемое звуковое поле. Выход кодера 10, т.е. объединение сигнала 3, полученного понижающим микшированием, и дополнительной информации, в дальнейшем называется пространственным аудиопотоком или пространственным аудиопредставлением.

Главная структура соответствующего параметрического пространственного аудиодекодера 20 проиллюстрирована на Фиг. 11. На Фиг. 11 показана иллюстрация параметрического пространственного аудиодекодера. Декодер 20 использует пространственный аудиопоток в качестве входа. На основе сигнала 7, полученного понижающим микшированием, и метаданных, включенных в дополнительную информацию 6, декодер 20 вычисляет сигналы громкоговорителя или наушников, соответствующие желаемой конфигурации проигрывания. Типичные установки громкоговорителя, например, описаны в ISO/IEC 23003-1:2007. Информационная технология - технологии MPEG Audio - Часть 1: MPEG Surround. Международная Организация Стандартов, Женева, Швейцария, 2007.

Направленное аудиокодирование (DirAC) использует параметрическое представление звукового поля, используя мгновенное направление прихода (DOA) и диффузность звука в частотных поддиапазонах, т.е. оно принимает в расчет те характеристики, которые являются релевантными для человеческого слуха. Подход DirAC основан на предположении, что интерауральные разности времени (ITD) и интерауральные разности уровней частот (ILD) воспринимаются корректно, если DOA звукового поля корректно воспроизводится. Соответственно, предполагается, что интерауральная когерентность (IC) воспринимается корректно, если диффузность звукового поля воспроизводится корректно. Таким образом, стороне воспроизведения требуются только направление и параметры диффузности и монофонический сигнал микрофона, чтобы сгенерировать признаки, которые являются релевантными для человеческого восприятия пространственного аудио в заданном положении прослушивания с произвольным набором громкоговорителей.

Следует отметить, что в нижеследующем предполагается, что точечные источники звука вызывают определенное DOA звука в широком частотном диапазоне. В качестве примера, ожидается, что одиночная активная говорящая сторона вызывает определенное DOA звука для всего спектра речи. В случае когда две говорящие стороны являются активными в одно время, ожидается, что DOA для каждого частотного диапазона определяется посредством DOA, соответствующим наиболее доминантному источнику, который "испускает наивысшую звуковую энергию" в этом конкретном частотном диапазоне.

В дальнейшем описывается анализ DirAC для оценивания параметра при DirAC. При DirAC, желаемые параметры, т.е. DOA звука eDOA(k, m) (или, в качестве альтернативы, представленные соответствующим углом φ(k, m)) и диффузность ψ(k, m) в каждом частотном диапазоне m и индексе k временного блока, могут быть оценены посредством энергетического анализа звукового поля, как описано в публикации: V. Pulkki. Воспроизведение пространственного звука с направленным аудиокодированием. J. Audio Eng. Soc., 55(6):503-516, июнь 2007, на основе сигналов микрофона B-формата. Сигналы микрофона B-формата состоят из всенаправленного сигнала W(k, m) и двух дипольных сигналов (Ux(k, m) и Uy(k, m)), соответствующих x-, y-направлению системы декартовых координат. Сигналы B-формата могут быть напрямую измерены используя, например, конкретный микрофон B-формата как описано в публикации: E. Benjamin and T. Chen. Нативный микрофон B-формата: Часть I. 119-ая Конвенция AES, доклад 6621, Нью-Йорк, октябрь 2005, или в качестве альтернативы используя решетку однонаправленных микрофонов как описано в публикации: J. Merimaa. Применения 3-D микрофонной решетки. 112-ая Конвенция AES, доклад 5501, Мюнхен, май 2002. Для последнего, есть фундаментальное предположение, что длина волны акустического сигнала намного больше, чем интервал между всенаправленными микрофонами. При высоких частотах, где это предположение не выполняется, существует систематическое смещение касательно оценки DOA. При очень низких частотах, существует увеличивающееся влияние собственного шума микрофона. Вследствие этого, проблемы при высоких частотах не могут быть просто решены посредством проектирования очень близко расположенных решеток. Подробности об оценивании DOA и ранее описанной проблемы при высоких частотах рассматриваются в следующих параграфах.

Одним базовым принципом при пространственном аудиокодировании, например, при DirAC, является то, что DOA оценивается корректно. Для выполнения этой задачи, исследуется направление активного вектора интенсивности в представлении временной/частотной области:

Надстрочный индекс H обозначает сопряженное транспонирование, ρ0 представляет среднюю плотность воздуха и c является скоростью звука. Наконец, обратное направление Ia(k, m) указывает на DOA звука:

где φ(k, m) обозначает азимутальный угол DOA. Надстрочный индекс T обозначает транспонирование.

Два дипольных сигнала Ux(k, m) и Uy(k, m) могут быть предоставлены микрофонами с направленностью в форме восьмерки. Снижающей расходы альтернативой было бы использовать дифференциальные решетки первого порядка всенаправленных микрофонов, как описано в G. W. Elko. Сверхнаправленные микрофонные решетки, в монографии под ред. S.L. Gay and J. Benesty, Обработка акустических сигналов для телекоммуникации, глава 10, страницы 181-235, изд. Kluwer Academic, 2000. Однако при обоих вариантах выбора есть отклонения от желаемой направленности в форме восьмерки; обычно при очень низких и высоких частотах. С помощью высококачественных направленных микрофонов это отклонение может быть намного меньше по сравнению с дифференциальными решетками первого порядка. Тогда как отклонения в направленных микрофонах должны быть описаны посредством измерений, смещение в случае оценивания DOA на основании решеток может быть сформулировано аналитически. Исследования для конкретных геометрий решеток может быть найдено в M. Kallinger, F. Kuech, R. Schultz-Amling, G. Del Galdo, J. Ahonen и V. Pulkki. Анализ и регулирование планарных микрофонных решеток для применения при направленном аудиокодировании. 124-ая Конвенция AES, доклад 7374, Амстердам, Нидерланды, май 2008. В качестве примера, на Фиг. 13 показана неточная оценка 105 DOA как функция действительного DOA для решетки из пяти микрофонов с интервалом d=4 см (см. Фиг. 12). Для этого примера, смещение может быть выражено посредством:

При низких частотах f мы можем применить аппроксимацию sin x≈x, получая едва смещенные оценки E{ ϕ ^ }≈φ. Близко к определенному пределу, например, при 5 кГц наблюдаются явные отклонения от несмещенных оценок, которые могут быть выражены, используя уравнение (3). Как может быть отмечено из Фиг. 13, смещение может быть удалено посредством инвертирования кривой 201 смещения до так называемой частоты искажения falias. В рассмотренном примере, falias ≈ 6 кГц. За этим пределом, т.е. для f>falias, оценка ϕ ^ I (оценка 105 DOA, ϕ ^ amb) не может быть больше присвоена одиночному несмещенному DOA φ. В этом примере, есть три кандидата 115, с ϕ ˜ I по ϕ ˜ III, из которых только один является корректным DOA. Согласно M. Kallinger, F. Kuech, R. Schultz-Amling, G. Del Galdo, J. Ahonen, and V. Pulkki. Анализ и регулирование планарных микрофонных решеток для применения при направленном аудиокодировании, 124-ая Конвенция AES, доклад 7374, Амстердам, Нидерланды, май 2008, частота верхнего предела для неоднозначной оценки DOA установлена посредством:

Мы ссылаемся на это как на частоту пространственного искажения DirAC. Компенсация систематического смещения ниже falias описана в M. Kallinger, F. Kuech, R. Schultz-Amling, G. Del Galdo, J. Ahonen, и V. Pulkki. Анализ и регулирование планарных микрофонных решеток для применения при направленном аудиокодировании, 124-ая Конвенция AES, доклад 7374, Амстердам, Нидерланды, май 2008. Однако настоящее изобретение содержит подходы для разрешения неоднозначности выше falias. Следует отметить, что неоднозначность предполагает также коррекцию любого систематического смещения.

Конкретно, на Фиг. 12 показана квадратная решетка всенаправленных микрофонов с пятым всенаправленным микрофоном в центре. Интервал смежных микрофонов составляет d/2. Более того, на Фиг. 13 показаны оценки азимутальных углов ϕ ^ при частотах между 4 и 7 кГц. Серая линия 9 представляет несмещенную оценку угла. При 7 кГц мы можем ясно наблюдать неоднозначность из-за пространственного искажения, т.е. одна примерная оценка, ϕ ^ I, не может быть присвоена одиночной несмещенной оценке. Есть три кандидата 115, с ϕ ˜ I по ϕ ˜ III, из которых следует выбирать несмещенную оценку.

Далее описано спектральное взвешивание как принцип обработки для направленной фильтрации и осуществления рендеринга при DirAC. После анализа DirAC, т.е. после того, как были вычислены все параметры DirAC (DOA, выраженное посредством φ(k, m) и диффузности звука ψ(k, m), сопровождаемого сигналом, полученным понижающим микшированием, W(k, m)), можно использовать три параметра, чтобы осуществить рендеринг сигналов громкоговорителей для произвольной компоновки громкоговорителя. По выбору, можно выполнить направленную фильтрацию в области параметра DirAC. Как рендеринг, так и направленная фильтрация основаны на принципе спектрального взвешивания. На них воздействуют возможные неоднозначные оценки DOA. Основная функциональность каждого блока обработки и, особенно, вычисление функций спектрального взвешивания схематично описаны в следующих абзацах.

Ссылаясь на синтез DirAC, на стороне воспроизведения, разные сигналы громкоговорителей вычисляются на основе моносигнала, полученного понижающим микшированием, вместе с DOA и параметрами диффузности DirAC. Сигналы громкоговорителей составлены из компонентов сигнала, соответствующих прямому, т.е. когерентному, и диффузному звуку, соответственно. Диффузная компонента звука не зависит от DOA. Следовательно, она здесь не подвергается обработке. Когерентный участок сигнала p-го громкоговорителя Sp(k, m) вычисляется согласно

Sp(k,m)=gp(k,m)W(k, m) (5)

Усиление панорамирования gp(k, m) или параметр усиления (815) зависит от DOA звука φ(k, m) или ϕ ^ amb (105), числа громкоговорителей и положения p-го громкоговорителя относительно желаемого положения прослушивания. На Фиг. 14 изображены некоторые примерные функции усиления как функции DOA для установки с тремя громкоговорителями при -60° (g1(k, m)), 0° (g2(k, m)) и 60° (g3(k, m)). Другими словами, на Фиг. 14 изображены примеры панорамирования усилений как функции DOA φ(k, m) для установки трех громкоговорителей при -60° (g1(k, m)), 0° (g2(k, m)), и 60° (g3(k, m)), соответственно. Каждая функция усиления определяет назначение DOA спектральному усилению. Использование искаженных DOA могло бы повлечь за собой искаженное пространственное изображение.

Ссылаясь на направленную фильтрацию, в цепочке обработки между синтезом и анализом DirAC есть вариант выбора применить дополнительные этапы обработки, например, для выполнения пространственной фильтрации. Целью является предотвратить приход звука с определенных направлений, при этом ослабляя звук из других направлений. В принципе, этот метод может быть рассмотрен как вид "формирование диаграммы направленности" в области параметра DirAC. В публикации: M. Kallinger, H. Ochsenfeld, G. Del Galdo, F. Kuech, D. Mahne, R. Schultz-Amling и O. Thiergart. Подход пространственной фильтрации для направленного аудиокодирования, 126-й Конвенция AES, доклад 7653, Мюнхен, Германия, май 2009, описано предложение для такого метода, называемого направленной фильтрацией: в основном, направленная фильтрация применяет функцию усиления к сигналу, полученному понижающим микшированием, W (k, m) во временном/частотном представлении, чтобы получить спектр выходного сигнала.

Wdf(k, m) = D(k, m)W(k, m) (6)

Подстрочный индекс df обозначает "направленно отфильтрован". Функция усиления D(k, m) или параметр усиления (815) спроектированы как функция DOA или ϕ ^ amb (105) и диффузность. Принцип проектирования может быть разъяснен посредством Фиг. 15.

Конкретно, на Фиг. 15 показана диаграмма направленности функций усиления направленной фильтрации. Проектирование функции усиления может быть проведено посредством присвоения мгновенного DOA φ(k, m) (азимут на графике в полярных координатах) соответствующему усилению (радиус на графике в полярных координатах). Направленность расширяется, если диффузность увеличивается. Предполагается, что желаемый источник расположен при 30°, где функция усиления равняется единице.

График в полярных координатах представляет функцию проектирования для время- и частотно-зависимого усиления D(k, m) как функцию DOA, φ(k, m), в каждом временном блоке k и частотном диапазоне m. Функция проектирования расширяется, если диффузность ψ(k, m) увеличивается. Следует отметить, что сама функция проектирования, согласно В. M. Kallinger, H. Ochsenfeld, G. Del Galdo, F. Kuech, D. Mahne, R. Schultz-Amling и O. Thiergart «Подход пространственной фильтрации для направленного аудиокодирования», 126-ая Конвенция AES, доклад 7653, Мюнхен, Германия, май 2009, является неизменяемой по частоте.

Далее описывается метод локализации источника. Для направленной фильтрации и вариантов осуществления настоящего изобретения обязательно знать число и местоположение желаемых источников. На двумерном виде с компактной компоновкой микрофонов информация о местоположении может быть представлена посредством азимутального угла. В публикации Thiergart et al. (O. Thiergart, R. Schultz-Amling, G. Del Galdo, D. Mahne, и F. Kuech. Локализация источников звука в реверберирующих средах на основе параметров направленного аудиокодирования, 128-ая Конвенция AES, доклад 7853, г. Нью-Йорк, шт. Нью-Йорк, США, октябрь 2009, предложен надежный способ для подсчета и локализации акустических источников посредством параметров DirAC. Данный принцип основан на предположении, что каждое мгновенное DOA, т.е. время- и частотно-зависимое DOA, представляет возможное направление действительного источника плюс неопределенность, которая возникает из-за определенной дисперсии оценок. DOA подвергается обработке как случайная переменная. Посредством операций усреднения и кластеризации мы можем уменьшить дисперсию и получить знание о положении активного источника, соответственно.

Данный способ основан на гистограмме DOA, взвешенных посредством спектральной плотности мощности (PSD) и вычисленных только в временных/частотных ячейках с низкой диффузностью. В действительности, параметр низкой диффузности может быть интерпретирован как мера надежности для DOA. Данный метод полагается на редкости сигналов речи во временном/частотном представлении. К тому же подход Thiergart'а может также обеспечивать статистическую информацию о параметрах, которые используются для локализации. Дисперсия DOA, например, может представлять интерес в варианте осуществления по фиг. 5, как описано ранее.

Следует отметить, что в вариантах осуществления, разные методы локализации источника могут эксплуатировать в связи с DirAC и направленной фильтрацией, в равной степени. Существует большое многообразие способов локализации источника, которые могут также рассматривать другие частотно-временные характеристики фонемы, чем акустические частотно-временные характеристики фонемы, таких как локализация лица или тела на основе входных данных изображения или видео.

Варианты осуществления настоящего изобретения представляют эффективный способ для разрешения неуникальности, которая возникает при оценивании пространственных параметров методов пространственного аудиокодирования. В некоторых блоках оценивания параметров, таких как блок оценивания DOA DirAC, неоднозначность соединена со смещением. В случаях подобных этому, разрешение неоднозначности неявно задействует компенсацию смещения, как описано в предыдущих вариантах осуществления.

Концептуальная структура патентоспособного подхода изображена на Фиг. 16. Оценка параметра DOA, например, обозначенная оценкой 105 азимутального угла, ϕ ˜ , анализируется касательно неоднозначностей. Это может быть проведено на основании измерений или информации о геометрии решетки. Пример для последнего задан посредством отношения согласно Ур. (3). В качестве результата мы получаем большое число кандидатов для желаемого DOA, с ϕ ˜ I по ϕ ˜ N. Обычно текущая оценка DOA служит в качестве входного параметра для последующих этапов обработки. Функция f(·) представляет такой блок в общих чертах. Так как правильный кандидат DOA еще не выбран, можно рассматривать N блоков обработки параллельно. Наконец, можно объединить выходные параметры с f( ϕ ˜ I) по f( ϕ ˜ N) соответственным образом, т.е. можно выбрать только один из выходных параметров или вычислить их подходящее объединение. Если применимо, можно дополнительно ввести предварительную информацию в этап "выбора или объединения" для улучшения разрешения неоднозначности. Эта информация может, например, быть знанием потенциальных положений источников звука.

Конкретно, на Фиг. 16 показана общая структура данного изобретения для разрешения неоднозначности оценок пространственных параметров с ϕ ˜ I по ϕ ˜ N. Разрешение может быть проведено либо посредством выбора самого подходящего кандидата, либо посредством объединения последующих параметров с f( ϕ ˜ I) по f( ϕ ˜ N). Если доступно, предварительная информация вступает в работу для поддержки выбора.

Если рассмотреть более конкретные реализации концептуальной структуры по фиг. 16, можно вывести две стратегии, согласно вариантам осуществления настоящего изобретения. В одном варианте осуществления, можно задать f( ϕ ˜ I)= ϕ ˜ I для корректирования параметров DOA независимо от какой-либо последующей обработки. Следовательно, можно выбрать соответствующее DOA на последующей стадии. Здесь объединение большого числа DOA, например, путем определения среднего, едва ли приведет к желаемому результату. Выбор правильного DOA основывается на предварительной информации о положении источника. В действительности, можно выбрать DOA из большого числа DOA, которые имеют наименьшее расстояние до положения активного источника. Более конкретное описание этой процедуры было представлено в вариантах осуществления по фиг. 2-4.

Вторая стратегия основывается на факте, что DOA обычно анализируется, чтобы служить в качестве входного параметра для последующих блоков обработки. Как описано ранее, такие блоки часто генерируют параметры спектрального усиления в качестве их выхода. Используя неоднозначные DOA, получаем большое число выходных параметров. На Фиг. 16 эти параметры изображены посредством f( ϕ ˜ I) по f( ϕ ˜ N). В отличие от самих DOA, в зависимости от применения, было выявлено, что возможно объединить выходные параметры, например, взять максимум, минимум, среднее и т.д. Преимущество этой процедуры состоит в том факте, что не нужно получать предварительную информацию. Эта стратегия формирует другой вариант осуществления, который был разъяснен более подробно на Фиг. 7-9.

Обзор функциональности всех процедур, которые нацелены на корректирование оценок DOA, дан на Фиг. 17. Оценка 105 DOA, ϕ ˜ amb, получена из соответствующего блока 11 оценивания. После учета неоднозначности получаем большое число кандидатов для действительного скорректированного DOA, с ϕ ˜ I по ϕ ˜ N, за пределами частоты пространственного искажения. Выбор "правильного" кандидата основывается на близости к физическим DOA активных источников. Здесь имеются две стратегии для определения итогового скорректированного DOA 125, ϕ ˜ . Можно либо выбрать один из кандидатов с ϕ ˜ I по ϕ ˜ N, который имеет наименьшее расстояние до одного из DOA активного источника (см. Фиг. 3), либо напрямую назначить "ближайшего кандидата" для DOA активного источника. Этот вариант выбора был разъяснен в варианте осуществления по фиг. 4.

Конкретно, на Фиг. 17 показана структура для корректирования смещенных оценок DOA, если инверсия усложняется неоднозначностью скорректированных оценок. Выбор правильного кандидата из большого числа скорректированных оценок основан на локализации активных источников звука. Постобработка на основании скорректированных DOA, ϕ ˜ , является необязательной.

Вариант осуществления по фиг. 3 относится к выбору одного кандидата из большого числа DOA. Здесь рассматриваются текущие DOA активных источников звука. Эти DOA являются широкополосными параметрами, и обычно они не меняются часто по сравнению с мгновенным DOA. Чтобы разрешить неуникальность оценки DOA во временной/частотной ячейке за пределами falias, предполагаем, что наблюдаемое/оцениваемое мгновенное DOA в отдельной временной/частотной ячейке вызвано источником, чье местоположение уже известно посредством предварительного знания 311 или посредством метода локализации.

Примерная процедура для корректирования неоднозначных и смещенных оценок параметров за пределами частоты пространственного искажения показана на Фиг. 18. Согласно Фиг. 18, анализируется мгновенное DOA 105, например, ϕ ^ I=35°. Рассматривая неоднозначность, получаем три кандидата 215, ϕ ˜ I, ϕ ˜ II и ϕ ˜ III, для действительного мгновенного DOA. Параллельно, методом локализации источника анализируется один активный источник при Q1=75° (оценка 311 локализации). Из трех кандидатов в пространстве скорректированных DOA, ϕ ˜ III, имеет самое короткое Евклидово расстояние до Q1 в [°]. Вследствие этого, мгновенное DOA ϕ ˜ I может быть скорректировано до ϕ ˜ = ϕ ˜ III. Следует отметить, что ϕ ˜ все еще может наблюдаться как случайная переменная.

Конкретно, на Фиг. 18 показано оцененное DOA ϕ ^ как функция несмещенного DOA φ выше частоты пространственного искажения. Мгновенная оценка присваивается трем скорректированным, мгновенным DOA, с ϕ ˜ I по ϕ ˜ III. Методом локализации найден активный источник Qi. Вследствие этого, один из трех кандидатов с ϕ ˜ I по ϕ ˜ III присваивается скорректированному мгновенному DOA, ϕ ˜ I, который имеет наименьшее расстояние до Q1: ϕ ˜ I= ϕ ˜ III.

Согласно дополнительным вариантам осуществления, также есть возможность для выполнения мгновенного корректирования с более чем одним активным источником. Может иметься случай, когда более одного источника являются активными одновременно. Примерный метод локализации, описанный ранее, способен подсчитывать и локализовывать множество источников. Процедура смещения и разрешения неуникальности, как описано ранее, может быть расширена для работы с более чем одним активным источником. Вследствие этого, сначала выполняется процедура, как описано в варианте осуществления по фиг. 3. Получаем большое число кандидатов для скорректированного DOA для одного оцененного DOA ϕ ^ . Теперь можно проанализировать расстояния этих кандидатов не до одного действительного источника, а до более чем одного. На Фиг. 19 показано схематичное изображение примера с двумя активными источниками Q1 и Q2. Так как предполагается, что оцененное DOA за пределами пространственного искажения соответствует одному из активных источников, можно присвоить скорректированное DOA тем кандидатам, которые лежат ближе всего к какому-либо активному источнику в пространстве скорректированных DOA.

Конкретно, на Фиг. 19 показано оцененное DOA ϕ ^ как функция несмещенного DOA φ. В случае когда метод локализации источника анализирует более одного активного источника, присваиваем одно из возможных скорректированных, мгновенных DOA несмещенному, мгновенному DOA, которое лежит ближе всего к какому-либо из активных источников (здесь: Q1).

Рассмотрим оценку DOA источника как случайную переменную. Тогда эта процедура является оптимальной в случае независимых, идентичных и симметричных распределений оценки DOA каждого источника. Если распределение DOA каждого источника не отвечает этим требованиям, можно использовать более подходящие меры расстояния. Этот случай подвергается обработке в дальнейшем.

Описано характерное распределение DOA активного источника. Метод локализации, предложенный в публикации: O. Thiergart, R. Schultz-Amling, G. Del Galdo, D. Mahne, and F. Kuech. Локализация источников звука в реверберирующих средах на основе параметров направленного аудиокодирования, 128-й Конвенция AES, доклад 7853, г. Нью-Йорк, шт. Нью-Йорк, США, октябрь 2009, использует функцию плотности вероятностей (pdf) мгновенных DOA на всех частотных диапазонах, на которые незначительно воздействует шум и смещение. Вышеупомянутые схематично изображенные примеры возвращают соответственные присвоения неоднозначных DOA, если соответствующие распределения являются независимыми, идентичными и симметричными. Нормальные распределения могут служить в качестве допустимых аппроксимаций для pdf каждого источника. На Фиг. 20 схематично изображена примерная сцена с двумя активными источниками Q1 и Q2 (311). Их DOA неидентично распределены. После учета неоднозначности получаем три кандидата для скорректированного мгновенного DOA, с ϕ ˜ I по ϕ ˜ III. Согласно дополнительным вариантам осуществления, ϕ ˜ II может быть выбрано в качестве правильного кандидата, так как оно имеет наименьшее расстояние Махаланобиса до любого активного источника. Даже хотя Евклидово расстояние до Q2 является ближе в этом случае, Q1 является самым близким источником в статистическом смысле.

Конкретно, на Фиг. 20 показаны два активных источника при Q1=60° и Q2=100° и их соответствующими pdf. Есть три кандидата для скорректированного мгновенного DOA, с ϕ ˜ I по ϕ ˜ III. ϕ ˜ II выбрано в качестве правильного кандидата, так как оно имеет наименьшее расстояние Махаланобиса до любого активного источника (Q1 в этом случае).

Расстояние Махаланобиса является одним примером для более общей меры расстояния; оно является оптимальным при нормальном распределении. Другая соответствующая мера расстояния может эксплуатироваться, в равной степени, если DOA распределены другим образом.

Вариант осуществления по фиг. 4 относится к назначению мгновенных DOA для DOA активного источника. Как отмечено ранее, мгновенные DOA могут быть смоделированы как случайные переменные из стохастического процесса с определенной дисперсией вокруг определенного среднего. Учитывая смещение мгновенных DOA, можно модифицировать среднее и дисперсию связанного процесса, но сохранить его стохастический характер. При разрешении неоднозначности, альтернативный подход для выбора правильного кандидата состоит из замены оценок мгновенного DOA на DOA ближайшего активного источника, например Qi. Это означает, что стохастический характер мгновенного DOA значительно изменяется посредством этого вида этапа квантования. Если последовательное применение требует восстановить более реалистичный стохастический характер пространственного параметра, предлагается добавить случайную переменную к DOA активного источника. В качестве примера: Оказывается, что воспринимаемое качество пространственного аудио после синтеза DirAC улучшается, если некоторая случайность вносится в оценки параметров DOA (см. Фиг. 5). Без потери общности, определим эту случайную переменную η(k, m), имеющую нулевое среднее и единичную дисперсию. Определим направляющую дисперсию σ s t 2 , для того чтобы восстановить дисперсию мгновенного DOA:

ϕ ˜ dith,i(k, m)=Qist( ϕ ˜ , ψ)η(k, m) (7)

Направляющая дисперсия может быть задана как функция мгновенного DOA и параметр диффузности DirAC ψ. Оба параметра являются время- и частотно-зависимыми, сами по себе. Индексы времени и частоты были просто опущены для лучшей читаемости. Наконец, среднее и дисперсия ϕ ˜ dith,i и ϕ ˜ i должны совпадать. Здесь ϕ ˜ dith,i, Qi и σst; η из Ур. 7 могут соответствовать ϕ ˜ dith 535, ϕ ˜ Q S 525 и переменным числам 545, соответственно, показанным в варианте осуществления по фиг. 5.

Следует отметить, что дисперсия оценок DOA анализируется определенными алгоритмами локализации, например, как описано в O. Thiergart, R. Schultz-Amling, G. Del Galdo, D. Mahne, and F. Kuech «Определение местоположения источников звука в реверберирующих средах на основе параметров направленного аудиокодирования», 128-ая Конвенции AES, доклад 7853, г. Нью-Йорк, шт. Нью-Йорк, США, октябрь 2009, и вследствие этого она может быть использована для регулирования величины размывания (подмешивания случайного сигнала).

Варианты осуществления по фиг. 7-9 относятся к регулированию последующих блоков обработки. Все параметры пространственных аудиокодеков могут быть использованы для оперирования последовательными стадиями обработки, например, синтезом DirAC или направленной фильтрацией, как было описано ранее. Если параметры, подобные мгновенному DOA, искажены каким-либо образом, то корректирование этих параметров перед последующими стадиями обработки является одним путем для достижения итогового высококачественного выхода. Способы для корректирования пространственных параметров были подвергнуты обработке в вариантах осуществления по фиг. 2-4. В качестве альтернативы, можно отрегулировать последующие стадии обработки до ожидаемого смещения и неоднозначности. Связанные процедуры резюмируются на основе типовой структуры на Фиг. 16. В этом случае, функция f(·) представляет, например, операцию направленной фильтрации.

В основном, направленная фильтрация работает посредством перемножения спектральных усилений со спектром сигнала (смотри уравнение (6)). Структура нуль-фазовой передаточной функции может быть проиллюстрирована посредством Фиг. 21. Мгновенное DOA назначается усилению между нулем и единицей. Эта процедура может быть исполнена для каждого временного блока k и частотного диапазона m.

Конкретно, на Фиг. 21 показана примерная функция проектирования для направленной фильтрации как функция DOA. Эта функция может быть использована при каждом временном блоке k и частотном диапазоне m. Функция проектирования является "направляемой" при предположении иметь желаемый активный источник при Q1=280°.

Важно отметить, что правило проектирования основывается полагается на скорректированные DOA ϕ ˜ (k, m). Однако, без учета неоднозначности, можно использовать правило проектирования на основании первичных оценок ϕ ^ (k, m).

Как изображено на Фиг. 16, оценка параметра DOA, ϕ ^ , анализируется относительно неоднозначностей. В результате получаем большое число кандидатов для желаемого DOA, с ϕ ˜ I по ϕ ˜ N. Для каждого кандидата ϕ ˜ i вычисляется соответствующая функция усиления или параметр усиления 815, f( ϕ ˜ i). Желаемая функция усиления f( ϕ ˜ ), например, используемая для действительной операции направленной фильтрации, может быть получена посредством соответственного объединения значений, предоставленных функциями разных кандидатов с f( ϕ ˜ I) по f( ϕ ˜ N). Это представлено блоком "выбор или объединение" (блок 120 разрешения неоднозначности, сконфигурированный как селектор или блок объединения). Подходящие правила объединения включают в себя линейные объединения (например, среднее) или нелинейные объединения, соответствующие выбору (например, максимум или минимум) разных значений усиления.

Из рассмотрения выше следует, что при применении направленной фильтрации или стадии синтеза пространственного аудио, не требуется предварительная информация о местоположениях текущих источников. Оказывается, что в этом случае операция фильтрации и учет неоднозначности могут быть совмещены эффективным образом. Этот подход изображен на Фиг. 22 и будет резюмирован в дальнейшем.

Как ранее, функция f(·) описывает конструкцию функции усиления направленной фильтрации как функции правильного DOA φ(k, m):

D(k,m)=f(φ(k,m)) (8)

Поскольку уже известно, что φ(k, m) следует заменить на соответствующую оценку ϕ ^ (k, m), можно ожидать некорректного поведения функции усиления направленной фильтрации за пределами частоты пространственного искажения. Чтобы учесть эту неоднозначность оценки DOA, можно ввести расширенные функции 910 проектирования, с fenh,I( ϕ ^ ) по fenh,N( ϕ ^ ), которые выбраны так, чтобы они отражали неоднозначность и потенциальное смещение оценки DOA. Принимая во внимание Фиг. 16 и 22, имеем

fenh,i( ϕ ^ )=f( ϕ ˜ i) (9)

для i = I,..., N.

В вариантах осуществления изобретения, желаемая расширенная функция усиления fenh( ϕ ^ ) = f( ϕ ˜ ) может быть получена посредством соответственного объединения значения усиления разных кандидатов с fenh,I( ϕ ^ ) по fenh,N( ϕ ^ ).

Конкретно, на Фиг. 22 показана структура для регулирования блоков обработки, которые работают как функция неоднозначного DOA, для генерирования выходных параметров fenh( ϕ ^ ). Неоднозначности разрешены относительно желаемого применения, в не относительно действительного DOA. В отличие от системы, схематично изображенной на Фиг. 17, блок локализации источника не требуется.

Далее приведен пример для иллюстрации того, как разрешение неоднозначности на стадии обработки, которая следует за блоком 11 оценивания DOA, позволяет опустить блок определения местоположения источника. Рассмотрим Фиг. 21: предполагаем, что активный источник расположен при Q1; он назначен усилению, равному единице. ϕ ˜ I, который назначен примерно 0,8, лежит ближе всего к нему - он будет выбранным кандидатом, если продолжить, как описано в варианте осуществления по фиг. 3. Здесь можно объединить возможные выходные усиления. В вариантах осуществления, если первичной целью направленной фильтрации является сохранить желаемое качество сигнала источника, всегда можно выбрать самое большое из возможных усилений:

Наоборот, согласно дополнительным вариантам осуществления, можно выбрать наименьшее усиление, если желательно подавлять помехи в максимально возможной степени:

В зависимости от действительного сценария применения, разные стратегии для объединения N функций fenh,i(·), например, взятие среднего, могли бы также быть вариантом выбора. Рассматривая пример по фиг. 21, следует обратить внимание, что объединение кандидатов действительного DOA с ϕ ˜ I по ϕ ˜ III не представляет надлежащего подхода для разрешения неоднозначностей DOA в контексте направленной фильтрации.

Следует отметить, что объединение функций fenh,i(·) может быть эффективно предварительно вычислено на основании геометрии решетки и желаемых диаграмм направленности (см. Фиг. 15). Таким образом, во время периода выполнения алгоритма дополнительная вычислительная нагрузка не генерируется, так как выход настоящего подхода состоит из функции оцененного DOA, а не из соответствующей скорректированной версии.

В кратком изложении предыдущих вариантов осуществления, представленный метод/концепция может содержать следующие этапы. Сначала сигналы из микрофонной решетки могут быть записаны. Затем, направление прихода (DOA) может быть оценено, исходя из этих микрофонных сигналов. Затем неоднозначность DOA может быть разрешена с помощью информации о положениях активных источников звука. Эта информация может быть доступна заранее и/или может быть оценена во время периода работы. В качестве альтернативы, неоднозначность может быть разрешена не относительно DOA, а параметров последующих стадий обработки, например, спектральных усилений. Наконец, последующие стадии обработки, например, направленная фильтрация, могут быть применены.

Хотя некоторые аспекты были описаны в контексте устройства, ясно, что эти аспекты также представляют описание соответствующего способа, где блок или устройство соответствует этапу способа или признаку этапа способа. Аналогично, аспекты, описанные в контексте этапа способа, также представляют описание соответствующего блока или элемента или признака соответствующего устройства. Некоторые или все из этапов способа могут быть исполнены посредством (или используя) аппаратного устройства, как например, микропроцессора, программируемого компьютера или электронной схемы. В некоторых вариантах осуществления, некоторый один или более из наиболее важных этапов способа могут быть исполнены таким устройством.

Соответствующие изобретению параметры могут быть сохранены в цифровой среде хранения или могут быть переданы в среде передачи, такой как среда беспроводной передачи или среда проводной передачи, такой как Интернет.

В зависимости от определенных требований реализации, варианты осуществления данного изобретения могут быть реализованы в аппаратном обеспечении или программном обеспечении. Данная реализация может быть выполнена используя цифровую среду хранения, например, floppy-диск, DVD, Blue-Ray, CD, ROM, PROM, EPROM, EEPROM или flash-память, имеющий электронно-считываемые сигналы управления, хранящиеся на нем, которые взаимодействуют (или способны взаимодействовать) с программируемой компьютерной системой, так чтобы выполнялся соответствующий способ. Вследствие этого, цифровая среда хранения может быть считываемым компьютером.

Некоторые варианты осуществления согласно данному изобретению содержат носитель данных, имеющий электронно-считываемые сигналы управления, которые способны взаимодействовать с программируемой компьютерной системой, так чтобы выполнялся один из способов, описанных в настоящем документе.

В общем, варианты осуществления настоящего изобретения могут быть реализованы как компьютерный программный продукт с программным кодом, причем программный код действует для выполнения одного из способов, когда компьютерный программный продукт выполняется на компьютере. Программный код может, например, храниться на считываемом машиной носителе.

Другие варианты осуществления содержат компьютерную программу для выполнения одного из способов, описанных в настоящем документе, хранящихся на считываемом машиной носителе.

Другими словами, вариант осуществления патентоспособного способа, вследствие этого, является компьютерной программой, имеющей программный код для выполнения одного из способов, описанных в настоящем документе, когда компьютерная программа выполняется на компьютере.

Дополнительный вариант осуществления патентоспособных способов, вследствие этого, является носителем данных (или цифровой средой хранения или считываемой компьютером средой), содержащим записанную на нем компьютерную программу для выполнения одного из способов, описанных в настоящем документе. Носитель данных, цифровая среда хранения или записывающая среда обычно материальны и/или постоянны.

Дополнительный вариант осуществления патентоспособного способа, вследствие этого, является потоком данных или последовательностью сигналов, представляющих компьютерную программу для выполнения одного из способов, описанных в настоящем документе. Поток данных или последовательность сигналов могут, например, быть выполненными с возможностью переноса через соединение передачи данных, например через Интернет.

Дополнительный вариант осуществления содержит средство обработки, например компьютер, или программируемое логическое устройство, выполненный с возможностью или адаптированный для выполнения одного из способов, описанных в настоящем документе.

Дополнительный вариант осуществления содержит компьютер, имеющий установленную на нем компьютерную программу для выполнения одного из способов, описанных в настоящем документе.

Дополнительный вариант осуществления согласно данному изобретению содержит устройство или систему, выполненные с возможностью переноса (например, электронным способом или оптически) компьютерной программы для выполнения одного из способов, описанных в настоящем документе, в приемник. Приемник может, например, быть компьютером, мобильным устройством, запоминающим устройством или тому подобным. Устройство или система могут, например, содержать файл-сервер для переноса компьютерной программы на приемник.

В некоторых вариантах осуществления, программируемое логическое устройство (например, программируемая пользователем вентильная матрица) может быть использовано для выполнения некоторой или всех функциональных возможностей способов, описанных в настоящем документе. В некоторых вариантах осуществления, программируемая пользователем вентильная матрица может взаимодействовать с микропроцессором для выполнения одного из способов, описанных в настоящем документе. В общем, способы предпочтительно выполняются любым аппаратным устройством.

Вышеописанные варианты осуществления являются лишь иллюстративными для принципов настоящего изобретения. Следует понимать, что модификации и вариации данных компоновок и подробности, описанные в настоящем документе, будут очевидны специалистам в данной области техники. Поэтому предусматривается ограничение только объемом пунктов формулы изобретения, а не конкретными подробностями, представленными с целью описания и разъяснения вариантов осуществления в настоящем документе.

В заключение, настоящее изобретение содержит стратегию для разрешения неоднозначностей, вызванных пространственным искажением. Неоднозначности могут быть разрешены либо относительно пространственных параметров, либо последующих блоков обработки, которые используют пространственные параметры в качестве их входа.

Похожие патенты RU2552129C2

название год авторы номер документа
УСТРОЙСТВО, СИСТЕМА (ВАРИАНТЫ), СПОСОБ ПОЛУЧЕНИЯ ИНФОРМАЦИИ О НАПРАВЛЕНИИ И КОМПЬЮТЕРНЫЙ ПРОГРАММНЫЙ ПРОДУКТ 2011
  • Кюх, Фабиан
  • Дель, Гальдо, Джованни
  • Тиргарт, Оливер
  • Пулкки, Вилле
  • Ахонен, Юкка
RU2555188C2
УСТРОЙСТВО И СПОСОБ ДЛЯ СОВМЕЩЕНИЯ ПОТОКОВ ПРОСТРАНСТВЕННОГО АУДИОКОДИРОВАНИЯ НА ОСНОВЕ ГЕОМЕТРИИ 2012
  • Дель Гальдо Джованни
  • Тиргарт Оливер
  • Херре Юрген
  • Кюх Фабиан
  • Хабест Эмануэль
  • Крачун Александра
  • Кунтц Ахим
RU2609102C2
УСТРОЙСТВО И СПОСОБ ДЛЯ КОДИРОВАНИЯ ПРОСТРАНСТВЕННОГО ЗВУКОВОГО ПРЕДСТАВЛЕНИЯ ИЛИ УСТРОЙСТВО И СПОСОБ ДЛЯ ДЕКОДИРОВАНИЯ ЗАКОДИРОВАННОГО АУДИОСИГНАЛА С ИСПОЛЬЗОВАНИЕМ ТРАНСПОРТНЫХ МЕТАДАННЫХ И СООТВЕТСТВУЮЩИЕ КОМПЬЮТЕРНЫЕ ПРОГРАММЫ 2020
  • Кюх, Фабиан
  • Тиргарт, Оливер
  • Фукс, Гийом
  • Дёла, Штефан
  • Бутеон, Александр
  • Херре, Юрген
  • Байер, Штефан
RU2792050C2
УСТРОЙСТВО И СПОСОБ ПРЕОБРАЗОВАНИЯ ПЕРВОГО ПАРАМЕТРИЧЕСКОГО ПРОСТРАНСТВЕННОГО АУДИОСИГНАЛА ВО ВТОРОЙ ПАРАМЕТРИЧЕСКИЙ ПРОСТРАНСТВЕННЫЙ АУДИОСИГНАЛ 2010
  • Шултц-Амлинг Рихард
  • Кюх Фабиан
  • Каллингер Маркус
  • Дел Галдо Джованни
  • Тиергарт Оливер
  • Махне Дирк
  • Кунтц Ахим
RU2586842C2
ПРИЕМ ЗВУКА ПОСРЕДСТВОМ ВЫДЕЛЕНИЯ ГЕОМЕТРИЧЕСКОЙ ИНФОРМАЦИИ ИЗ ОЦЕНОК НАПРАВЛЕНИЯ ЕГО ПОСТУПЛЕНИЯ 2011
  • Херре Юрген
  • Кюх Фабиан
  • Каллингер Маркус
  • Дель Гальдо Джованни
  • Тиргарт Оливер
  • Мане Дирк
  • Кунтц Ахим
  • Крачмер Михаэль
  • Крачун Александра
RU2570359C2
УСТРОЙСТВО И СПОСОБ ДЛЯ ПОЗИЦИОНИРОВАНИЯ МИКРОФОНА, ОСНОВЫВАЯСЬ НА ПРОСТРАНСТВЕННОЙ ПЛОТНОСТИ МОЩНОСТИ 2012
  • Дель Гальдо Джованни
  • Тиргарт Оливер
  • Кюх Фабиан
  • Хабетс Эманюэль
  • Крачун Александра
RU2589469C2
УСТРОЙСТВО, СПОСОБ И КОМПЬЮТЕРНАЯ ПРОГРАММА ДЛЯ КОДИРОВАНИЯ, ДЕКОДИРОВАНИЯ, ОБРАБОТКИ СЦЕНЫ И ДРУГИХ ПРОЦЕДУР, ОТНОСЯЩИХСЯ К ОСНОВАННОМУ НА DirAC ПРОСТРАНСТВЕННОМУ АУДИОКОДИРОВАНИЮ 2018
  • Фукс, Гийом
  • Херре, Юрген
  • Кюх, Фабиан
  • Дёла, Штефан
  • Мультрус, Маркус
  • Тиргарт, Оливер
  • Вюббольт, Оливер
  • Гидо, Флорин
  • Байер, Штефан
  • Егерс, Вольфганг
RU2759160C2
УСТРОЙСТВО И СПОСОБ ФОРМИРОВАНИЯ МНОЖЕСТВА ПАРАМЕТРИЧЕСКИХ ЗВУКОВЫХ ПОТОКОВ И УСТРОЙСТВО И СПОСОБ ФОРМИРОВАНИЯ МНОЖЕСТВА СИГНАЛОВ АКУСТИЧЕСКОЙ СИСТЕМЫ 2013
  • Кюх Фабиан
  • Дель Гальдо Джованни
  • Кунтц Ахим
  • Пулкки Вилле
  • Политис Арсхонтис
RU2633134C2
УСТРОЙСТВО, СПОСОБ И КОМПЬЮТЕРНАЯ ПРОГРАММА ДЛЯ КОДИРОВАНИЯ, ДЕКОДИРОВАНИЯ, ОБРАБОТКИ СЦЕНЫ И ДРУГИХ ПРОЦЕДУР, СВЯЗАННЫХ С ПРОСТРАНСТВЕННЫМ АУДИОКОДИРОВАНИЕМ НА ОСНОВЕ DIRAC С ИСПОЛЬЗОВАНИЕМ КОМПЕНСАЦИИ ПРЯМЫХ КОМПОНЕНТ 2019
  • Фукс, Гийом
  • Тиргарт, Оливер
  • Корсе, Срикантх
  • Дёла, Штефан
  • Мультрус, Маркус
  • Кюх, Фабиан
  • Бутеон, Александр
  • Айхензер, Андреа
  • Байер, Штефан
RU2782511C1
УСТРОЙСТВО, СПОСОБ И КОМПЬЮТЕРНАЯ ПРОГРАММА ДЛЯ КОДИРОВАНИЯ, ДЕКОДИРОВАНИЯ, ОБРАБОТКИ СЦЕНЫ И ДРУГИХ ПРОЦЕДУР, СВЯЗАННЫХ С ПРОСТРАНСТВЕННЫМ АУДИОКОДИРОВАНИЕМ НА ОСНОВЕ DIRAC С ИСПОЛЬЗОВАНИЕМ ДИФФУЗНОЙ КОМПЕНСАЦИИ 2019
  • Фукс, Гийом
  • Тиргарт, Оливер
  • Корсе, Срикантх
  • Дёла, Штефан
  • Мультрус, Маркус
  • Кюх, Фабиан
  • Бутеон, Александр
  • Айхензер, Андреа
  • Байер, Штефан
RU2779415C1

Иллюстрации к изобретению RU 2 552 129 C2

Реферат патента 2015 года УСТРОЙСТВО И СПОСОБ ДЛЯ РАЗРЕШЕНИЯ НЕОДНОЗНАЧНОСТИ ИЗ ОЦЕНКИ НАПРАВЛЕНИЯ ПРИХОДА

Устройство (100) для разрешения неоднозначности из оценки (105) DOA ( φ ^ amb) содержит анализатор (110) оценки DOA для анализирования оценки (105) DOA ( φ ^ amb) для получения множества (115) неоднозначных параметров анализа ( φ ˜ I... φ ˜ N; f( φ ˜ I)...f( φ ˜ N); fenh,I( φ ^ amb)...fenh,N( φ ^ amb); gP( φ ˜ I)...gp( φ ˜ N); D( φ ˜ I)...D( φ ˜ N)) посредством использования информации (101) смещения, причем информация (101) смещения представляет отношение ( φ ^ ↔φ) между смещенной ( φ ^ ) и несмещенной оценкой DOA (φ), и блок (120) разрешения неоднозначности для разрешения неоднозначности в множестве (115) неоднозначных параметров анализа ( φ ˜ I... φ ˜ N; f( φ ˜ I)...f( φ ˜ N); fenh,I( φ ^ amb)...fenh,N( φ ^ amb); gP( φ ˜ I)...gp( φ ˜ N); D( φ ˜ I)...D( φ ˜ N)) для получения однозначного разрешенного параметра ( φ ˜ res; fres, 125). 3 н. и 12 з.п. ф-лы, 22 ил.

Формула изобретения RU 2 552 129 C2

1. Устройство (100) для разрешения неоднозначности из оценки (105) DOA ( ϕ a m b ) , причем устройство содержит:
анализатор (110) оценки DOA для анализирования оценки (105) DOA ( ϕ a m b ) для получения множества (115) неоднозначных параметров анализа ( ϕ ˜ I ϕ ˜ N ; f ( ϕ ˜ I ) f ( ϕ ˜ N ) ; f e n h , I ( ϕ a m b ) f e n h , N ( ϕ a m b ) ; g p ( ϕ ˜ I ) g p ( ϕ ˜ N ) ; D ( ϕ ˜ I ) D ( ϕ ˜ N ) ) посредством использования информации (101) смещения, причем информация (101) смещения представляет отношение ( ϕ ϕ ) между смещенной ( ϕ ) и несмещенной оценкой DOA (φ); и
блок (120) разрешения неоднозначности для разрешения неоднозначности в множестве (115) неоднозначных параметров анализа ( ϕ ˜ I ϕ ˜ N ; f ( ϕ ˜ I ) f ( ϕ ˜ N ) ; f e n h , I ( ϕ a m b ) f e n h , N ( ϕ a m b ) ; g p ( ϕ ˜ I ) g p ( ϕ ˜ N ) ; D ( ϕ ˜ I ) D ( ϕ ˜ N ) ) для получения однозначного разрешенного параметра ( ϕ ˜ r e s ; fres, 125).

2. Устройство (200) по п. 1, в котором анализатор (210) оценки DOA выполнен с возможностью отнесения оценки (105) DOA ( ϕ a m b ) к множеству (215) неоднозначных оценок DOA ( ϕ ˜ I ϕ ˜ N ) на основе функции (201) смещения ( ϕ a m b = f ( ϕ ) ) , в котором функция (201) смещения ( ϕ a m b = f ( ϕ ) ) указана посредством информации (101) смещения и в котором множество (215) неоднозначных оценок DOA ( ϕ ˜ I ϕ ˜ N ) соответствует множеству (115) неоднозначных параметров анализа, в котором блок (120) разрешения неоднозначности выполнен с возможностью определения однозначного разрешенного параметра (125) ( ϕ ˜ r e s ) из множества (215) неоднозначных оценок DOA ( ϕ ˜ I ϕ ˜ N ) посредством использования предварительной пространственной информации (211) одного или более активных источников.

3. Устройство (300) по п. 1, в котором блок (120) разрешения неоднозначности сконфигурирован как селектор (320) для выбора однозначного разрешенного параметра (325) ( ϕ ˜ r e s ) из множества (215) неоднозначных оценок DOA ( ϕ ˜ I ϕ ˜ N ) , в котором селектор (320) выполнен с возможностью выполнения выбора однозначного разрешенного параметра (325) ( ϕ ˜ r e s ) на основе меры расстояния между оценкой локализации, соответствующей неоднозначной оценке DOA из множества (215) неоднозначных оценок DOA ( ϕ ˜ I ϕ ˜ N ) , и предварительными оценками (311) локализации одного или более активных источников.

4. Устройство (400) по п. 1, в котором блок (120) разрешения неоднозначности сконфигурирован как блок (420) отображения для отображения множества (215) неоднозначных оценок DOA ( ϕ ˜ I ϕ ˜ N ) на однозначный разрешенный параметр (425) ( ϕ ˜ r e s ) , в котором блок (420) отображения выполнен с возможностью выполнения отображения множества (215) неоднозначных оценок DOA ( ϕ ˜ I ϕ ˜ N ) на основе меры расстояния между оценкой локализации, соответствующей неоднозначной оценке DOA из множества (215) неоднозначных оценок DOA ( ϕ ˜ I ϕ ˜ N ) , или выбранной оценке локализации, соответствующей выбранной оценке (515) DOA ( ϕ ˜ S ) , выбранной из множества (215) неоднозначных оценок DOA ( ϕ ˜ I ϕ ˜ N ) , и предварительными оценками (311) локализации одного или более активных источников.

5. Устройство (400) по п. 4, в котором блок (420) отображения содержит генератор (540) чисел для генерирования переменных чисел (545) во времени, и блок (530) объединения для объединения некоторого числа переменных чисел (545) и определенной предварительной оценки локализации, соответствующей определенному DOA (525) ( ϕ ˜ Q S ) одного или более активных источников, для получения модифицированного относящегося к DOA значения (535) ( ϕ ˜ d i t h ) , в котором однозначный разрешенный параметр (125) ( ϕ ˜ r e s ) соответствует модифицированному относящемуся к DOA значению (535) ( ϕ ˜ d i t h ) .

6. Устройство (600) по п. 2, дополнительно содержащее поставщик (610) пространственной информации для предоставления предварительной пространственной информации (211) одного или более активных источников, в котором поставщик (610) пространственной информации выполнен с возможностью предоставления предварительной пространственной информации (211) на основе входного параметра (611), который отличается от оценки (105) DOA ( ϕ a m b ) .

7. Устройство (700) по п. 1, в котором анализатор (710) оценки DOA выполнен с возможностью генерирования множества (715) ответвлений для каждого неоднозначного параметра анализа из множества (115) неоднозначных параметров анализа ( f ( φ ˜ I ) f ( φ ˜ N ) ; f e n h , I ( φ a m b ) f e n h , N ( φ a m b ) ) , в котором множество (715) ответвлений отражает неоднозначность в множестве (115) неоднозначных параметров анализа ( f ( φ ˜ I ) f ( φ ˜ N ) ; f e n h , I ( φ a m b ) f e n h , N ( φ a m b ) ) и в котором анализатор (710) оценки DOA выполнен с возможностью прямого получения множества (715) ответвлений из оценки (105) DOA ( ϕ a m b ) или дополнительной обработки множества (813) неоднозначных оценок DOA ( ϕ ˜ I ϕ ˜ N ) для получения множества (715) ответвлений, в котором анализатор (710) оценки DOA выполнен с возможностью вычисления параметров усиления ( g p ( ϕ ˜ I ) g p ( ϕ ˜ N ) ; D ( ϕ ˜ I ) D ( ϕ ˜ N ) ) для операции спектрального взвешивания, в котором блок (720) разрешения неоднозначности выполнен с возможностью определения однозначного разрешенного параметра (725) (fres) из множества (715) ответвлений, представляющих неоднозначные параметры (115) анализа ( f ( ϕ ˜ I ) f ( ϕ ˜ N ) ; f e n h , I ( ϕ a m b ) f e n h , N ( ϕ a m b ) ; g p ( ϕ ˜ I ) g p ( ϕ ˜ N ) ; D ( ϕ ˜ I ) D ( ϕ ˜ N ) ).

8. Устройство (700) по п .7, в котором блок (720) разрешения неоднозначности сконфигурирован как блок объединения для объединения множества (115) неоднозначных параметров анализа ( f ( φ ˜ I ) f ( φ ˜ N ) ; f e n h , I ( φ a m b ) f e n h , N ( φ a m b ) ) , представленных множеством (715) ответвлений, для получения объединенного параметра, представляющего однозначный разрешенный параметр (725) (fres).

9. Устройство (700) по п. 7, в котором блок (720) разрешения неоднозначности сконфигурирован как селектор для выбора однозначного разрешенного параметра (725) (fres) из множества (115) неоднозначных параметров анализа ( f ( φ ˜ I ) f ( φ ˜ N ) ; f e n h , I ( φ a m b ) f e n h , N ( φ a m b ) ) , представленных множеством (715) ответвлений.

10. Устройство (800) по п. 7, в котором анализатор (810) оценки D0A выполнен с возможностью отнесения оценки (105) DOA ( ϕ a m b ) к множеству (813) неоднозначных оценок DOA ( ϕ ˜ I ϕ ˜ N ) на основе функции (201) смещения ( ϕ = f ( ϕ ) ) , в котором функция (201) смещения ( ϕ = f ( ϕ ) ) указывается посредством информации (101) смещения, и для дополнительной обработки множества (813) неоднозначных оценок DOA для получения множества (815) ответвлений, представляющих неоднозначные параметры (115) анализа ( f ( ϕ ˜ I ) f ( ϕ ˜ N ) ; g p ( ϕ ˜ I ) g p ( ϕ ˜ N ) ; D ( ϕ ˜ I ) D ( ϕ ˜ N ) ).

11. Устройство (900) по п. 7, в котором анализатор (910) оценки DOA и блок (720) разрешения неоднозначности выполнены с возможностью получения однозначного разрешенного параметра (725) (fres) за один этап обработки, так что предоставляется результат обработки, представляющий однозначный разрешенный параметр (725) (fres), который был бы получен, если по меньшей мере два этапа обработки были выполнены последовательно.

12. Устройство (900) по п. 7, в котором анализатор (910) оценки DOA содержит, для каждого ответвления из множества (915) ответвлений, блок обработки параметров, причем блок (914) обработки параметров выполнен с возможностью отнесения оценки (105) DOA ( ϕ a m b ) к соответствующему неоднозначному параметру анализа (915) ( f e n h , I ( φ a m b ) f e n h , N ( φ a m b ) ) .

13. Устройство по п. 1, дополнительно содержащее блок (11) оценивания DOA для оценивания оценки (105) DOA ( ϕ a m b ) из пространственного аудиосигнала, в котором пространственный аудиосигнал содержит всенаправленный (W) и множество разных направленных дипольных сигналов (Ux, Uy…).

14. Способ для разрешения неоднозначности из оценки (105) DOA ( ϕ a m b ) , причем способ содержит:
анализ оценки (105) DOA ( ϕ a m b ) для получения множества (115) неоднозначных параметров анализа ( ϕ ˜ I ϕ ˜ N ; f ( ϕ ˜ I ) f ( ϕ ˜ N ) ; f e n h , I ( ϕ a m b ) f e n h , N ( ϕ a m b ) ; g p ( ϕ ˜ I ) g p ( ϕ ˜ N ) ; D ( ϕ ˜ I ) D ( ϕ ˜ N ) ) посредством использования информации (101) смещения, причем информация (101) смещения представляет отношение ( ϕ ϕ ) между смещенной ( ϕ ) и несмещенной оценкой DOA (φ); и
разрешение неоднозначности в множестве (115) неоднозначных параметров анализа ( ϕ ˜ I ϕ ˜ N ; f ( ϕ ˜ I ) f ( ϕ ˜ N ) ; f e n h , I ( ϕ a m b ) f e n h , N ( ϕ a m b ) ; g p ( ϕ ˜ I ) g p ( ϕ ˜ N ) ; D ( ϕ ˜ I ) D ( ϕ ˜ N ) ) для получения однозначного разрешенного параметра ( ϕ ˜ r e s ; fres, 125).

15. Считываемый компьютером носитель, содержащий сохраненную на нем компьютерную программу, имеющую программный код для выполнения способа по п. 14, когда компьютерная программа исполняется на компьютере.

Документы, цитированные в отчете о поиске Патент 2015 года RU2552129C2

M
Kallinger et.al
ENHANCED DIRECTION ESTIMATION USING MICROPHONE ARRAYS FOR DIRECTIONAL AUDIO CODING
Станок для изготовления деревянных ниточных катушек из цилиндрических, снабженных осевым отверстием, заготовок 1923
  • Григорьев П.Н.
SU2008A1
Proccedings
Топка с несколькими решетками для твердого топлива 1918
  • Арбатский И.В.
SU8A1
Trento
Italy
Приспособление для точного наложения листов бумаги при снятии оттисков 1922
  • Асафов Н.И.
SU6A1
M
Kallinger et.al
ENHANCED DIRECTION ESTIMATION USING MICROPHONE ARRAYS FOR DIRECTIONAL AUDIO

RU 2 552 129 C2

Авторы

Каллингер Маркус

Дель Гальдо Джованни

Кюх Фабиан

Тиргарт Оливер

Мане Дирк

Кунтц Ахим

Шультц-Амлинг Рихард

Даты

2015-06-10Публикация

2011-08-23Подача