Настоящее изобретение в общем относится к устройству и способу для разрешения неоднозначности из оценки направления прихода. Дополнительные варианты осуществления настоящего изобретения относятся к улучшению неоднозначного оценивания параметра пространственного аудио.
Настоящее изобретение создано в контексте пространственного аудиокодирования с внешним интерфейсом микрофона. Мы фокусируемся на параметрических методах, т.е. пространственный звук описывается посредством одного или более аудиосигналов, сопровождаемых параметрической дополнительной информацией. Дополнительная информация получается на основании по меньшей мере двух микрофонов. Компоновки микрофонов и архитектуры обработки сигналов обычно проектируются, чтобы покрывать определенный частотный диапазон, представляющий интерес, где желаемые спецификации строго соблюдены. Вне этой области, представляющей интерес, могут возникнуть заметные отклонения из-за требуемой пространственной избирательности. Сильное отклонение состоит в так называемом пространственном искажении. В контексте анализа звукового поля самым важным эффектом пространственного искажения является то, что оценки направления прихода звука становятся неоднозначными. Следовательно, определенное поведение, которое является ожидаемым или желаемым только для определенного направления, также наблюдается в одном или более других направлениях.
Цель пространственного аудиокодирования состоит в воспроизведении пространственных акустических сцен посредством нескольких аудиоканалов, сопровождаемых параметрической дополнительной информацией. Следовательно, основной проблемой является то, что неточные оценки параметров вызовут нежелательные результаты процедуры воспроизведения или любого другого блока обработки (например, для направленной фильтрации), который использует пространственные параметры. Этот учет применяется к вышеупомянутым затронутым частотным диапазонам, особенно, где возникает пространственное искажение.
Вследствие этого, целью настоящего изобретения является предоставить улучшенный концепт для обработки пространственного параметра.
Эта цель достигается посредством устройства по п. 1, способу по п. 14 или компьютерной программы по п. 15.
Согласно варианту осуществления настоящего изобретения, устройство для разрешения неоднозначности из оценки направления прихода (DOA) содержит анализатор оценки DOA и блок разрешения неоднозначности. Анализатор оценки DOA выполнен с возможностью анализирования оценки DOA для получения множества неоднозначных параметров анализа посредством использования информации смещения. Здесь информация смещения представляет отношение между смещенной и несмещенной оценками DOA. Более того, блок разрешения неоднозначности выполнен с возможностью разрешения неоднозначности во множестве неоднозначных параметров анализа для получения однозначного разрешенного параметра.
Основной идеей, лежащей в основе настоящего изобретения, является то, что улучшенная обработка пространственного параметра может быть достигнута, если оценка DOA анализируется для получения множества неоднозначных параметров анализа посредством использования информации смещения, причем информация смещения представляет отношение между смещенной и несмещенной оценками DOA, и если неоднозначность во множестве неоднозначных параметров анализа разрешается для получения однозначного разрешенного параметра. Эта мера обеспечивает возможность разрешения неоднозначности, возникающей в результате неточной оценки параметра DOA, вызванной пространственным искажением.
Согласно дополнительным вариантам осуществления, анализатор оценки DOA выполнен с возможностью отнесения оценки DOA к множеству неоднозначных несмещенных оценок DOA на основе функции смещения, в котором функция смещения указана посредством информации смещения. Здесь множество неоднозначных несмещенных оценок DOA соответствует множеству неоднозначных параметров анализа. Более того, блок разрешения неоднозначности выполнен с возможностью определения однозначного разрешенного параметра из множества неоднозначных несмещенных оценок DOA посредством использования предварительной информации локализации одного или более активных источников. Это особенно обеспечивает возможность получения конкретного или скорректированного параметра DOA из предварительной информации о положении источника звука.
Согласно дополнительным вариантам осуществления, анализатор оценки DOA выполнен с возможностью генерирования множества ответвлений для каждого неоднозначного параметра анализа из множества неоднозначных параметров анализа, в котором множество ответвлений отражает неоднозначность во множестве неоднозначных параметров анализа. Здесь анализатор оценки DOA выполнен с возможностью получения множества ответвлений из оценки DOA или дополнительной обработки множества неоднозначных несмещенных оценок DOA для получения множества ответвлений. К тому же анализатор оценки DOA выполнен с возможностью вычисления параметров усиления для операции спектрального взвешивания. В качестве альтернативы, анализатор оценки DOA может быть также выполнен с возможностью вызова спектральной модификации дополнительными средствами, например сложением, вычитанием или взятием логарифма, что является аналогичным операции спектрального взвешивания. Более того, блок разрешения неоднозначности выполнен с возможностью определения однозначного разрешенного параметра из множества ответвлений, представляющих неоднозначные параметры анализа. Вследствие этого, возможно получить подходящий параметр усиления для операции спектрального взвешивания, такой как операция рендеринга или направленной фильтрации в области направленного аудиокодирования. Более того, посредством такой меры не требуется получать предварительную информацию локализации.
В дополнительном варианте осуществления, анализатор оценки DOA выполнен с возможностью получения множества ответвлений за один этап обработки, так что предоставляется результат обработки, который был бы получен, если два этапа обработки были выполнены последовательно. В частности, анализатор оценки DOA может содержать, для каждого ответвления из множества ответвлений, блок обработки параметров, в котором блок обработки параметров может быть выполнен с возможностью отнесения оценки DOA к предварительно определенному неоднозначному параметру анализа, как указано результатом обработки. Таким образом, более высокая эффективность или уменьшение вычислительной работы может быть достигнута, когда неоднозначность во множестве неоднозначных параметров анализа разрешена.
Дополнительный вариант осуществления настоящего изобретения предоставляет способ для разрешения неоднозначности из оценки DOA.
В дальнейшем, варианты осуществления настоящего изобретения будут разъяснены со ссылкой на прилагаемые чертежи, на которых:
на Фиг. 1 показана блок-схема варианта осуществления устройства для разрешения неоднозначности из оценки DOA;
на Фиг. 2 показана блок-схема дополнительного варианта осуществления устройства для разрешения неоднозначности из оценки DOA посредством использования предварительной информации локализации;
на Фиг. 3 показана блок-схема дополнительного варианта осуществления устройства для разрешения неоднозначности из оценки DOA с помощью селектора для выбора однозначного разрешенного параметра;
на Фиг. 4 показана блок-схема дополнительного варианта осуществления устройства для разрешения неоднозначности из оценки DOA с помощью блока отображения для отображения множества неоднозначных несмещенных оценок DOA на однозначный разрешенный параметр;
на Фиг. 5 показана блок-схема варианта осуществления блока отображения в соответствии по фиг. 4 с генератором чисел;
на Фиг. 6 показана блок-схема дополнительного варианта осуществления устройства для разрешения неоднозначности из оценки DOA с помощью поставщика информации локализации для предоставления предварительной информации локализации;
на Фиг. 7 показана блок-схема дополнительного варианта осуществления устройства для разрешения неоднозначности из оценки DOA с помощью вычисления параметра усиления;
на Фиг. 8 показана блок-схема дополнительного варианта осуществления устройства для разрешения неоднозначности из оценки DOA, включающего в себя генератор неоднозначных несмещенных оценок DOA и процессор параметров;
на Фиг. 9 показана блок-схема дополнительного варианта осуществления устройства для разрешения неоднозначности из оценки DOA с помощью множества блоков обработки параметров для получения результата обработки за один этап;
на Фиг. 10 показана схематичная иллюстрация параметрического пространственного аудиокодера;
на Фиг. 11 показана схематичная иллюстрация параметрического пространственного аудиодекодера;
на Фиг. 12 показана схематичная иллюстрация квадратной решетки всенаправленных микрофонов с пятым всенаправленным микрофоном в центре;
на фиг. 13 показан примерный график оценок азимутального угла при частотах между 4 и 7 кГц согласно варианту осуществления настоящего изобретения;
на Фиг. 14 показаны примерные графики для панорамирования усилений как функции DOA для установки из 3 громкоговорителей согласно варианту осуществления настоящего изобретения;
на Фиг. 15 показана примерная диаграмма направленности функций усиления направленной фильтрации согласно варианту осуществления настоящего изобретения;
на Фиг. 16 показана общая структура варианта осуществления устройства для разрешения неоднозначности оценок пространственных параметров;
на Фиг. 17 показана структура для корректирования смещенных оценок DOA согласно варианту осуществления настоящего изобретения;
на Фиг. 18 показан примерный график оцененного DOA как функции несмещенного DOA выше частоты пространственного искажения согласно варианту осуществления настоящего изобретения;
на Фиг. 19 показан примерный график оцененного DOA как функции несмещенного DOA согласно дополнительному варианту осуществления настоящего изобретения;
на фиг. 20 показан примерный график двух источников с их соответствующими функциями плотности вероятностей согласно варианту осуществления настоящего изобретения;
на Фиг. 21 показана примерная функция проектирования для направленной фильтрации, как функция DOA, согласно варианту осуществления настоящего изобретения;
на Фиг. 22 показана структура для регулирования блоков обработки, которые работают как функция неоднозначного DOA, для генерирования скорректированных выходных параметров согласно варианту осуществления настоящего изобретения.
На Фиг. 1 показана блок-схема варианта осуществления устройства 100 для разрешения неоднозначности из оценки 105 DOA. Оценка 105 DOA может быть получена из пространственного аудиосигнала посредством использования блока оценивания DOA. Здесь пространственный аудиосигнал может содержать всенаправленный или множество разных направленных дипольных сигналов. Оценка 105 DOA, полученная из пространственного аудиосигнала, может соответствовать параметру DirAC и может быть представлена углом
На Фиг. 2 показана блок-схема дополнительного варианта осуществления устройства 200 для разрешения неоднозначности из-за оценки 105 DOA посредством использования предварительной информации локализации или пространственной информации 211. Как показано на Фиг. 2, устройство 200 содержит анализатор 210 оценки DOA, который выполнен с возможностью отнесения оценки 105 DOA,
Кроме того, следует отметить, что оценка 105 DOA,
Также здесь обращается внимание на то, что, в общем, имеется два типа DOA. В вариантах осуществления, DOA
На Фиг. 3 показана блок-схема дополнительного варианта осуществления устройства 300 для разрешения неоднозначности из-за оценки 105 DOA с помощью селектора 320. Здесь устройство 300 по Фиг. 3, по существу, содержит те же блоки, как и устройство 200 по Фиг. 2. Вследствие этого, идентичные блоки, имеющие аналогичные реализации и/или функции, обозначены теми же номерами. Однако, в варианте осуществления по Фиг. 3, блок 120 разрешения неоднозначности сконфигурирован как селектор 320 для выбора однозначного разрешенного параметра 325,
На Фиг. 4 показана блок-схема дополнительного варианта осуществления устройства 400 для разрешения неоднозначности из-за оценки 105 DOA с помощью блока 420 отображения. Так как устройство 400 по Фиг. 4, по существу, содержит те же блоки, что и устройство 200 по Фиг. 2, идентичные блоки, имеющие аналогичные реализации и/или функции, снова обозначаются теми же номерами.
В варианте осуществления по Фиг. 4, блок 120 разрешения неоднозначности сконфигурировано как блока 420 отображения для отображения множества 215 неоднозначных несмещенных оценок DOA на однозначный разрешенный параметр 425,
На Фиг. 5 показана блок-схема варианта осуществления блока 420 отображения в соответствии по Фиг. 4 с генератором 540 чисел. В частности, на Фиг. 5, показаны больше деталей блока 420 отображения. Может быть видно на Фиг. 5, что блок 420 отображения может содержать селектор 510
Генератор 540 чисел блока 420 отображения, показанного на Фиг. 5, может быть реализован для генерирования переменных чисел 525 во времени, тогда как блок 530 объединения блока 420 отображения, показанного на Фиг. 5, может быть реализован для объединения числа из переменных чисел 545, предоставленных генератором 540 чисел и определенной предварительной оценки локализации, соответствующей определенному DOA 525,
На Фиг. 6 показана блок-схема дополнительного варианта осуществления устройства 600 для разрешения неоднозначности из оценки 105 DOA с помощью поставщика 610 информации локализации или пространственной информации. Здесь устройство 600 по фиг. 6, по существу, содержит те же блоки, как и устройство 200 по фиг. 2. Вследствие этого, идентичные блоки, имеющие аналогичные реализации и/или функции, обозначены теми же номерами. Как показано на Фиг. 6, поставщик 610 информации локализации может быть выполнен с возможностью предоставления предварительной информации 211 локализации для одного или более активных источников. В варианте осуществления по фиг. 6 показано, что поставщик 610 информации локализации может быть выполнен с возможностью предоставления предварительной информации 211 локализации на основе входного параметра 611, который отличается от оценки 105 DOA,
На Фиг. 7 показана блок-схема дополнительного варианта осуществления устройства 700 для разрешения неоднозначности из оценки 105 DOA с помощью вычисления параметра усиления. Как может быть видно на Фиг. 7, устройство 700 содержит анализатор 710 оценки DOA, который может быть выполнен с возможностью генерирования множества ответвлений 715 для каждого неоднозначного параметра анализа из множества 115 неоднозначных параметров анализа, в котором множество ответвлений 715 отражает неоднозначность во множестве 115 неоднозначных параметров анализа. В варианте осуществления по фиг. 7 анализатор 710 оценки DOA может быть выполнен с возможностью прямого получения множества ответвлений 715 из оценки 105 DOA или дополнительной обработки множества 813 неоднозначных несмещенных оценок DOA для получения множества ответвлений 715. В частности, анализатор 710 оценки DOA выполнен с возможностью вычисления параметров усиления для операции спектрального взвешивания, такой как операция рендеринга или направленной фильтрации в контексте направленного аудиокодирования. Как изображено на Фиг. 7, анализатор 710 оценки DOA, включающий в себя вычисление параметра усиления, может принимать информацию 101 смещения, чтобы генерировать множество ответвлений 715 посредством рассмотрения неоднозначности из оценки 105 DOA. Как показано на Фиг. 7, блок 720 разрешения неоднозначности устройства 700 может быть выполнен с возможностью определения однозначного разрешенного параметра 725, fres, из множества ответвлений 715, представляющих неоднозначные параметры 115 анализа.
Согласно дополнительным вариантам осуществления, блок 720 разрешения неоднозначности устройства 700 может быть сконфигурирован как блок объединения для объединения множества неоднозначных параметров анализа, представленных множеством ответвлений 715, для получения объединенного параметра, представляющего однозначный разрешенный параметр 725, fres.
Согласно дополнительным вариантам осуществления, блок 720 разрешения неоднозначности устройства 700 может быть также сконфигурирован как селектор для выбора однозначного разрешенного параметра 725, fres, из множества 115 неоднозначных параметров анализа, представленных множеством 715 ответвлений.
В частности, анализатор 710 оценки DOA для выполнения вычисления параметра усиления и блок 720 разрешения неоднозначности в форме блока объединения или селектора устройства 700, показанного на Фиг. 7, могут соответствовать анализатору 110 оценки DOA и блоку 120 разрешения неоднозначности устройства 100, показанного на Фиг. 1, соответственно.
В основном, устройство 700 по фиг. 7 может быть особенно использовано для задания однозначного разрешенного параметра из множества неоднозначных параметров анализа без требования работать с предварительной информацией локализации. В варианте осуществления по фиг. 7, блок 720 разрешения неоднозначности, который сконфигурирован как блок объединения или селектор, может, например, быть реализован с возможностью выбора минимального или максимального значения параметров усиления или для объединения параметров усиления посредством вычисления среднего значения.
На Фиг. 8 показана блок-схема дополнительного варианта осуществления устройства 800 для разрешения неоднозначности из оценки 105 DOA, включающего в себя генератор 812 неоднозначных несмещенных оценок DOA и процессор 814 параметров. Здесь устройство 800 по фиг. 8, по существу, соответствует устройству 700 по фиг. 7, в котором идентичные блоки, имеющие аналогичные реализации и/или функции, обозначаются теми же номерами. Как показано на Фиг. 8, анализатор 810 оценки DOA устройства 800 может содержать генератор 812 неоднозначных несмещенных оценок DOA и процессор 814 параметров. Здесь генератор 812 неоднозначных несмещенных оценок DOA реализован с возможностью отнесения оценки 105 DOA к множеству 813 неоднозначных несмещенных оценок DOA на основе функции 201 смещения, в котором функция 201 смещения указана посредством информации 101 смещения. Более того, процессор 814 параметров может быть реализован с возможностью дополнительной обработки множества 813 неоднозначных несмещенных оценок DOA для получения множества 815 ответвлений, представляющих неоднозначные параметры 115 анализа. Согласно вариантам осуществления, множество 815 ответвлений, представляющих неоднозначные параметры 115 анализа, могут соответствовать набору параметров усиления (gp), которые следует использовать для операции рендеринга, такие как параметры панорамирования усиления в трех направлениях, или параметру усиления (D), который может быть применен для направленной фильтрации внутри схемы кодирования DirAC, соответственно. В вариантах осуществления соответствующие параметры усиления gp для операции рендеринга или параметры усиления (D) для операции направленной фильтрации разных ответвлений 815 могут, например, быть линейно объединены, чтобы получить их среднее значение, или конкретный параметр усиления (например, минимальное или минимального значение) может быть выбран посредством использования блока 720 разрешения неоднозначности. На выходе блока 720 разрешения неоднозначности будет получен однозначный разрешенный параметр 725, fres.
На Фиг. 9 показана блок-схема дополнительного варианта осуществления устройства 900 для разрешения неоднозначности из оценки 105 DOA с помощью множества 913 блоков обработки. Здесь устройство 900 по фиг. 9 может соответствовать устройству 700 по фиг. 7, в котором идентичные блоки, имеющие аналогичные реализации и/или функции, обозначаются теми же номерами. Конкретно, в варианте осуществления по фиг. 9 устройство 900 содержит анализатор 910 оценки DOA, который может быть выполнен с возможностью получения множества 915 ответвлений за один этап обработки, так что будет предоставлен результат обработки, представляющий неоднозначные параметры 115 анализа, который был бы получен, если два этапа обработки были выполнены последовательно.
Следует обратить внимание, что результат обработки, полученный анализатором 910 оценки DOA, по существу, соответствует результату обработки или множеству 815 ответвлений, полученным анализатором 810 оценки DOA, показанным на Фиг. 8. Здесь каждый обработанный параметр или выходной параметр, полученный множеством блоков 913 обработки параметров, является, по существу, равным соответствующему параметру усиления gp; D, выведенный процессором 814 параметров. Однако в варианте осуществления по фиг. 9 эти идентичные параметры могут эффективно быть получены посредством использования только одного этапа обработки. Анализатор 910 оценки DOA устройства 900 может вследствие этого также быть назван как расширенный процессор для обработки оценки 105 DOA расширенным образом, чтобы получить результат обработки, не требуя промежуточного этапа обработки.
В варианте осуществления по фиг. 9 анализатор 910 оценки DOA и блок 720 разрешения неоднозначности могут также быть выполнены с возможностью получения однозначного разрешенного параметра 725 за один этап обработки, так что будет предоставлен результат обработки, представляющий однозначный разрешенный параметр 725, который был бы получен, если два этапа обработки были выполнены последовательно.
В вариантах осуществления однозначный разрешенный параметр 725 может быть предварительно определен или предварительно вычислен в зависимости от соответствующей оценки 105 DOA. Таким образом, полученные параметры и соответствующие оценки DOA могут быть вставлены в таблицу соответствия. Таблица соответствия, включающая в себя эту предварительно определенную информацию, может быть эффективно использована во избежание или по меньшей мере для уменьшения вычислительной нагрузки, генерируемой во время действительной обработки.
В частности, оценка 105 DOA, которая оценена из пространственного аудиосигнала посредством использования блока оценивания DOA, может сначала выступать как входное значение в таблице соответствия, и затем соответствующий однозначный разрешенный параметр 725, которой связан с входным значением в таблице соответствия, может быть выведен как выходное значение.
В качестве альтернативы, ссылаясь на Фиг. 9, анализатор 910 оценки DOA устройства 900 может содержать, для каждого ответвления из множества 915 ответвлений, блок обработки параметров. В частности, каждый блок 914 обработки параметров из множества блоков 913 обработки параметров может быть выполнен с возможностью отнесения оценки 105 DOA к соответствующему неоднозначному параметру анализа. Более того, блок 720 разрешения неоднозначности устройства 900 может впоследствии быть использован для разрешения неоднозначности в результате обработки, представляющем неоднозначные 915 параметры анализа, чтобы в конечном счете получить однозначный разрешенный параметр 725.
Варианты осуществления настоящего изобретения относятся к параметрическому пространственному аудиокодированию и некоторым блокам обработки Направленного аудиокодирования (DirAC). Схема кодирования DirAC является эффективным методом пространственного кодирования, который основывается на вводе микрофона и который служит в качестве примерного основания для дополнительных рассмотрений. Данный подход настоящего изобретения, чтобы справиться с неточными оценками пространственных параметров, представлен еще более подробно в дальнейшем.
Контекстом настоящего изобретения является параметрическое пространственное аудиокодирование. Сначала описываются некоторые важные примеры параметрического пространственного аудиопредставления. В основном рассматривается подход DirAC: как описано в публикации: V. Pulkki. Воспроизведение пространственного звука с направленным аудиокодированием. J. Audio Eng. Soc., 55(6):503-516, июнь 2007, в качестве примера для пространственного аудиокодека, который основывается на сигналах микрофона. Однако основные принципы настоящего изобретения могут также быть применены к другим схемам пространственного аудиокодирования, где неоднозначности в оценках пространственных параметров в определенных спектральных областях могут, например, быть разрешены посредством оценок параметров из разный областей или посредством рассмотрения других дополнительных источников информации, таких как видеоизображения. Прежде чем остановиться на конкретных деталях DirAC, рассмотрим основные структуры кодирования/декодирования, которые являются общими для всех схем параметрического пространственного кодирования.
Главная структура параметрического пространственного аудиокодера 10 согласно вариантам осуществления настоящего изобретения проиллюстрирована на Фиг. 10. На Фиг. 10 показана иллюстрация параметрического пространственного аудиокодера. Кодер 10 берет в качестве входных множественных аудиоканалов 2, например, сигналы микрофона, как описано в публикациях: V. Pulkki. Воспроизведение пространственного звука с направленным аудиокодированием. J. Audio Eng. Soc., 55(6):503-516, июнь 2007, и C. Faller. Внешние интерфейсы микрофонов для пространственных аудиокодеров. 125-ая Конвенция AES, Сан-Франциско, США, октябрь 2008. Выходом кодера 10 является сигнал 3, полученный понижающим микшированием, и соответствующая дополнительная информация. Сигнал 3, полученный понижающим микшированием, состоит из одного или более аудиоканалов. Дополнительная информация 4 включает в себя параметрические метаданные, представляющие наблюдаемое звуковое поле. Выход кодера 10, т.е. объединение сигнала 3, полученного понижающим микшированием, и дополнительной информации, в дальнейшем называется пространственным аудиопотоком или пространственным аудиопредставлением.
Главная структура соответствующего параметрического пространственного аудиодекодера 20 проиллюстрирована на Фиг. 11. На Фиг. 11 показана иллюстрация параметрического пространственного аудиодекодера. Декодер 20 использует пространственный аудиопоток в качестве входа. На основе сигнала 7, полученного понижающим микшированием, и метаданных, включенных в дополнительную информацию 6, декодер 20 вычисляет сигналы громкоговорителя или наушников, соответствующие желаемой конфигурации проигрывания. Типичные установки громкоговорителя, например, описаны в ISO/IEC 23003-1:2007. Информационная технология - технологии MPEG Audio - Часть 1: MPEG Surround. Международная Организация Стандартов, Женева, Швейцария, 2007.
Направленное аудиокодирование (DirAC) использует параметрическое представление звукового поля, используя мгновенное направление прихода (DOA) и диффузность звука в частотных поддиапазонах, т.е. оно принимает в расчет те характеристики, которые являются релевантными для человеческого слуха. Подход DirAC основан на предположении, что интерауральные разности времени (ITD) и интерауральные разности уровней частот (ILD) воспринимаются корректно, если DOA звукового поля корректно воспроизводится. Соответственно, предполагается, что интерауральная когерентность (IC) воспринимается корректно, если диффузность звукового поля воспроизводится корректно. Таким образом, стороне воспроизведения требуются только направление и параметры диффузности и монофонический сигнал микрофона, чтобы сгенерировать признаки, которые являются релевантными для человеческого восприятия пространственного аудио в заданном положении прослушивания с произвольным набором громкоговорителей.
Следует отметить, что в нижеследующем предполагается, что точечные источники звука вызывают определенное DOA звука в широком частотном диапазоне. В качестве примера, ожидается, что одиночная активная говорящая сторона вызывает определенное DOA звука для всего спектра речи. В случае когда две говорящие стороны являются активными в одно время, ожидается, что DOA для каждого частотного диапазона определяется посредством DOA, соответствующим наиболее доминантному источнику, который "испускает наивысшую звуковую энергию" в этом конкретном частотном диапазоне.
В дальнейшем описывается анализ DirAC для оценивания параметра при DirAC. При DirAC, желаемые параметры, т.е. DOA звука eDOA(k, m) (или, в качестве альтернативы, представленные соответствующим углом φ(k, m)) и диффузность ψ(k, m) в каждом частотном диапазоне m и индексе k временного блока, могут быть оценены посредством энергетического анализа звукового поля, как описано в публикации: V. Pulkki. Воспроизведение пространственного звука с направленным аудиокодированием. J. Audio Eng. Soc., 55(6):503-516, июнь 2007, на основе сигналов микрофона B-формата. Сигналы микрофона B-формата состоят из всенаправленного сигнала W(k, m) и двух дипольных сигналов (Ux(k, m) и Uy(k, m)), соответствующих x-, y-направлению системы декартовых координат. Сигналы B-формата могут быть напрямую измерены используя, например, конкретный микрофон B-формата как описано в публикации: E. Benjamin and T. Chen. Нативный микрофон B-формата: Часть I. 119-ая Конвенция AES, доклад 6621, Нью-Йорк, октябрь 2005, или в качестве альтернативы используя решетку однонаправленных микрофонов как описано в публикации: J. Merimaa. Применения 3-D микрофонной решетки. 112-ая Конвенция AES, доклад 5501, Мюнхен, май 2002. Для последнего, есть фундаментальное предположение, что длина волны акустического сигнала намного больше, чем интервал между всенаправленными микрофонами. При высоких частотах, где это предположение не выполняется, существует систематическое смещение касательно оценки DOA. При очень низких частотах, существует увеличивающееся влияние собственного шума микрофона. Вследствие этого, проблемы при высоких частотах не могут быть просто решены посредством проектирования очень близко расположенных решеток. Подробности об оценивании DOA и ранее описанной проблемы при высоких частотах рассматриваются в следующих параграфах.
Одним базовым принципом при пространственном аудиокодировании, например, при DirAC, является то, что DOA оценивается корректно. Для выполнения этой задачи, исследуется направление активного вектора интенсивности в представлении временной/частотной области:
Надстрочный индекс H обозначает сопряженное транспонирование, ρ0 представляет среднюю плотность воздуха и c является скоростью звука. Наконец, обратное направление Ia(k, m) указывает на DOA звука:
где φ(k, m) обозначает азимутальный угол DOA. Надстрочный индекс T обозначает транспонирование.
Два дипольных сигнала Ux(k, m) и Uy(k, m) могут быть предоставлены микрофонами с направленностью в форме восьмерки. Снижающей расходы альтернативой было бы использовать дифференциальные решетки первого порядка всенаправленных микрофонов, как описано в G. W. Elko. Сверхнаправленные микрофонные решетки, в монографии под ред. S.L. Gay and J. Benesty, Обработка акустических сигналов для телекоммуникации, глава 10, страницы 181-235, изд. Kluwer Academic, 2000. Однако при обоих вариантах выбора есть отклонения от желаемой направленности в форме восьмерки; обычно при очень низких и высоких частотах. С помощью высококачественных направленных микрофонов это отклонение может быть намного меньше по сравнению с дифференциальными решетками первого порядка. Тогда как отклонения в направленных микрофонах должны быть описаны посредством измерений, смещение в случае оценивания DOA на основании решеток может быть сформулировано аналитически. Исследования для конкретных геометрий решеток может быть найдено в M. Kallinger, F. Kuech, R. Schultz-Amling, G. Del Galdo, J. Ahonen и V. Pulkki. Анализ и регулирование планарных микрофонных решеток для применения при направленном аудиокодировании. 124-ая Конвенция AES, доклад 7374, Амстердам, Нидерланды, май 2008. В качестве примера, на Фиг. 13 показана неточная оценка 105 DOA как функция действительного DOA для решетки из пяти микрофонов с интервалом d=4 см (см. Фиг. 12). Для этого примера, смещение может быть выражено посредством:
При низких частотах f мы можем применить аппроксимацию sin x≈x, получая едва смещенные оценки E{
Мы ссылаемся на это как на частоту пространственного искажения DirAC. Компенсация систематического смещения ниже falias описана в M. Kallinger, F. Kuech, R. Schultz-Amling, G. Del Galdo, J. Ahonen, и V. Pulkki. Анализ и регулирование планарных микрофонных решеток для применения при направленном аудиокодировании, 124-ая Конвенция AES, доклад 7374, Амстердам, Нидерланды, май 2008. Однако настоящее изобретение содержит подходы для разрешения неоднозначности выше falias. Следует отметить, что неоднозначность предполагает также коррекцию любого систематического смещения.
Конкретно, на Фиг. 12 показана квадратная решетка всенаправленных микрофонов с пятым всенаправленным микрофоном в центре. Интервал смежных микрофонов составляет d/2. Более того, на Фиг. 13 показаны оценки азимутальных углов
Далее описано спектральное взвешивание как принцип обработки для направленной фильтрации и осуществления рендеринга при DirAC. После анализа DirAC, т.е. после того, как были вычислены все параметры DirAC (DOA, выраженное посредством φ(k, m) и диффузности звука ψ(k, m), сопровождаемого сигналом, полученным понижающим микшированием, W(k, m)), можно использовать три параметра, чтобы осуществить рендеринг сигналов громкоговорителей для произвольной компоновки громкоговорителя. По выбору, можно выполнить направленную фильтрацию в области параметра DirAC. Как рендеринг, так и направленная фильтрация основаны на принципе спектрального взвешивания. На них воздействуют возможные неоднозначные оценки DOA. Основная функциональность каждого блока обработки и, особенно, вычисление функций спектрального взвешивания схематично описаны в следующих абзацах.
Ссылаясь на синтез DirAC, на стороне воспроизведения, разные сигналы громкоговорителей вычисляются на основе моносигнала, полученного понижающим микшированием, вместе с DOA и параметрами диффузности DirAC. Сигналы громкоговорителей составлены из компонентов сигнала, соответствующих прямому, т.е. когерентному, и диффузному звуку, соответственно. Диффузная компонента звука не зависит от DOA. Следовательно, она здесь не подвергается обработке. Когерентный участок сигнала p-го громкоговорителя Sp(k, m) вычисляется согласно
Sp(k,m)=gp(k,m)W(k, m)
Усиление панорамирования gp(k, m) или параметр усиления (815) зависит от DOA звука φ(k, m) или
Ссылаясь на направленную фильтрацию, в цепочке обработки между синтезом и анализом DirAC есть вариант выбора применить дополнительные этапы обработки, например, для выполнения пространственной фильтрации. Целью является предотвратить приход звука с определенных направлений, при этом ослабляя звук из других направлений. В принципе, этот метод может быть рассмотрен как вид "формирование диаграммы направленности" в области параметра DirAC. В публикации: M. Kallinger, H. Ochsenfeld, G. Del Galdo, F. Kuech, D. Mahne, R. Schultz-Amling и O. Thiergart. Подход пространственной фильтрации для направленного аудиокодирования, 126-й Конвенция AES, доклад 7653, Мюнхен, Германия, май 2009, описано предложение для такого метода, называемого направленной фильтрацией: в основном, направленная фильтрация применяет функцию усиления к сигналу, полученному понижающим микшированием, W (k, m) во временном/частотном представлении, чтобы получить спектр выходного сигнала.
Wdf(k, m) = D(k, m)W(k, m)
Подстрочный индекс df обозначает "направленно отфильтрован". Функция усиления D(k, m) или параметр усиления (815) спроектированы как функция DOA или
Конкретно, на Фиг. 15 показана диаграмма направленности функций усиления направленной фильтрации. Проектирование функции усиления может быть проведено посредством присвоения мгновенного DOA φ(k, m) (азимут на графике в полярных координатах) соответствующему усилению (радиус на графике в полярных координатах). Направленность расширяется, если диффузность увеличивается. Предполагается, что желаемый источник расположен при 30°, где функция усиления равняется единице.
График в полярных координатах представляет функцию проектирования для время- и частотно-зависимого усиления D(k, m) как функцию DOA, φ(k, m), в каждом временном блоке k и частотном диапазоне m. Функция проектирования расширяется, если диффузность ψ(k, m) увеличивается. Следует отметить, что сама функция проектирования, согласно В. M. Kallinger, H. Ochsenfeld, G. Del Galdo, F. Kuech, D. Mahne, R. Schultz-Amling и O. Thiergart «Подход пространственной фильтрации для направленного аудиокодирования», 126-ая Конвенция AES, доклад 7653, Мюнхен, Германия, май 2009, является неизменяемой по частоте.
Далее описывается метод локализации источника. Для направленной фильтрации и вариантов осуществления настоящего изобретения обязательно знать число и местоположение желаемых источников. На двумерном виде с компактной компоновкой микрофонов информация о местоположении может быть представлена посредством азимутального угла. В публикации Thiergart et al. (O. Thiergart, R. Schultz-Amling, G. Del Galdo, D. Mahne, и F. Kuech. Локализация источников звука в реверберирующих средах на основе параметров направленного аудиокодирования, 128-ая Конвенция AES, доклад 7853, г. Нью-Йорк, шт. Нью-Йорк, США, октябрь 2009, предложен надежный способ для подсчета и локализации акустических источников посредством параметров DirAC. Данный принцип основан на предположении, что каждое мгновенное DOA, т.е. время- и частотно-зависимое DOA, представляет возможное направление действительного источника плюс неопределенность, которая возникает из-за определенной дисперсии оценок. DOA подвергается обработке как случайная переменная. Посредством операций усреднения и кластеризации мы можем уменьшить дисперсию и получить знание о положении активного источника, соответственно.
Данный способ основан на гистограмме DOA, взвешенных посредством спектральной плотности мощности (PSD) и вычисленных только в временных/частотных ячейках с низкой диффузностью. В действительности, параметр низкой диффузности может быть интерпретирован как мера надежности для DOA. Данный метод полагается на редкости сигналов речи во временном/частотном представлении. К тому же подход Thiergart'а может также обеспечивать статистическую информацию о параметрах, которые используются для локализации. Дисперсия DOA, например, может представлять интерес в варианте осуществления по фиг. 5, как описано ранее.
Следует отметить, что в вариантах осуществления, разные методы локализации источника могут эксплуатировать в связи с DirAC и направленной фильтрацией, в равной степени. Существует большое многообразие способов локализации источника, которые могут также рассматривать другие частотно-временные характеристики фонемы, чем акустические частотно-временные характеристики фонемы, таких как локализация лица или тела на основе входных данных изображения или видео.
Варианты осуществления настоящего изобретения представляют эффективный способ для разрешения неуникальности, которая возникает при оценивании пространственных параметров методов пространственного аудиокодирования. В некоторых блоках оценивания параметров, таких как блок оценивания DOA DirAC, неоднозначность соединена со смещением. В случаях подобных этому, разрешение неоднозначности неявно задействует компенсацию смещения, как описано в предыдущих вариантах осуществления.
Концептуальная структура патентоспособного подхода изображена на Фиг. 16. Оценка параметра DOA, например, обозначенная оценкой 105 азимутального угла,
Конкретно, на Фиг. 16 показана общая структура данного изобретения для разрешения неоднозначности оценок пространственных параметров с
Если рассмотреть более конкретные реализации концептуальной структуры по фиг. 16, можно вывести две стратегии, согласно вариантам осуществления настоящего изобретения. В одном варианте осуществления, можно задать f(
Вторая стратегия основывается на факте, что DOA обычно анализируется, чтобы служить в качестве входного параметра для последующих блоков обработки. Как описано ранее, такие блоки часто генерируют параметры спектрального усиления в качестве их выхода. Используя неоднозначные DOA, получаем большое число выходных параметров. На Фиг. 16 эти параметры изображены посредством f(
Обзор функциональности всех процедур, которые нацелены на корректирование оценок DOA, дан на Фиг. 17. Оценка 105 DOA,
Конкретно, на Фиг. 17 показана структура для корректирования смещенных оценок DOA, если инверсия усложняется неоднозначностью скорректированных оценок. Выбор правильного кандидата из большого числа скорректированных оценок основан на локализации активных источников звука. Постобработка на основании скорректированных DOA,
Вариант осуществления по фиг. 3 относится к выбору одного кандидата из большого числа DOA. Здесь рассматриваются текущие DOA активных источников звука. Эти DOA являются широкополосными параметрами, и обычно они не меняются часто по сравнению с мгновенным DOA. Чтобы разрешить неуникальность оценки DOA во временной/частотной ячейке за пределами falias, предполагаем, что наблюдаемое/оцениваемое мгновенное DOA в отдельной временной/частотной ячейке вызвано источником, чье местоположение уже известно посредством предварительного знания 311 или посредством метода локализации.
Примерная процедура для корректирования неоднозначных и смещенных оценок параметров за пределами частоты пространственного искажения показана на Фиг. 18. Согласно Фиг. 18, анализируется мгновенное DOA 105, например,
Конкретно, на Фиг. 18 показано оцененное DOA
Согласно дополнительным вариантам осуществления, также есть возможность для выполнения мгновенного корректирования с более чем одним активным источником. Может иметься случай, когда более одного источника являются активными одновременно. Примерный метод локализации, описанный ранее, способен подсчитывать и локализовывать множество источников. Процедура смещения и разрешения неуникальности, как описано ранее, может быть расширена для работы с более чем одним активным источником. Вследствие этого, сначала выполняется процедура, как описано в варианте осуществления по фиг. 3. Получаем большое число кандидатов для скорректированного DOA для одного оцененного DOA
Конкретно, на Фиг. 19 показано оцененное DOA
Рассмотрим оценку DOA источника как случайную переменную. Тогда эта процедура является оптимальной в случае независимых, идентичных и симметричных распределений оценки DOA каждого источника. Если распределение DOA каждого источника не отвечает этим требованиям, можно использовать более подходящие меры расстояния. Этот случай подвергается обработке в дальнейшем.
Описано характерное распределение DOA активного источника. Метод локализации, предложенный в публикации: O. Thiergart, R. Schultz-Amling, G. Del Galdo, D. Mahne, and F. Kuech. Локализация источников звука в реверберирующих средах на основе параметров направленного аудиокодирования, 128-й Конвенция AES, доклад 7853, г. Нью-Йорк, шт. Нью-Йорк, США, октябрь 2009, использует функцию плотности вероятностей (pdf) мгновенных DOA на всех частотных диапазонах, на которые незначительно воздействует шум и смещение. Вышеупомянутые схематично изображенные примеры возвращают соответственные присвоения неоднозначных DOA, если соответствующие распределения являются независимыми, идентичными и симметричными. Нормальные распределения могут служить в качестве допустимых аппроксимаций для pdf каждого источника. На Фиг. 20 схематично изображена примерная сцена с двумя активными источниками Q1 и Q2 (311). Их DOA неидентично распределены. После учета неоднозначности получаем три кандидата для скорректированного мгновенного DOA, с
Конкретно, на Фиг. 20 показаны два активных источника при Q1=60° и Q2=100° и их соответствующими pdf. Есть три кандидата для скорректированного мгновенного DOA, с
Расстояние Махаланобиса является одним примером для более общей меры расстояния; оно является оптимальным при нормальном распределении. Другая соответствующая мера расстояния может эксплуатироваться, в равной степени, если DOA распределены другим образом.
Вариант осуществления по фиг. 4 относится к назначению мгновенных DOA для DOA активного источника. Как отмечено ранее, мгновенные DOA могут быть смоделированы как случайные переменные из стохастического процесса с определенной дисперсией вокруг определенного среднего. Учитывая смещение мгновенных DOA, можно модифицировать среднее и дисперсию связанного процесса, но сохранить его стохастический характер. При разрешении неоднозначности, альтернативный подход для выбора правильного кандидата состоит из замены оценок мгновенного DOA на DOA ближайшего активного источника, например Qi. Это означает, что стохастический характер мгновенного DOA значительно изменяется посредством этого вида этапа квантования. Если последовательное применение требует восстановить более реалистичный стохастический характер пространственного параметра, предлагается добавить случайную переменную к DOA активного источника. В качестве примера: Оказывается, что воспринимаемое качество пространственного аудио после синтеза DirAC улучшается, если некоторая случайность вносится в оценки параметров DOA (см. Фиг. 5). Без потери общности, определим эту случайную переменную η(k, m), имеющую нулевое среднее и единичную дисперсию. Определим направляющую дисперсию
Направляющая дисперсия может быть задана как функция мгновенного DOA и параметр диффузности DirAC ψ. Оба параметра являются время- и частотно-зависимыми, сами по себе. Индексы времени и частоты были просто опущены для лучшей читаемости. Наконец, среднее и дисперсия
Следует отметить, что дисперсия оценок DOA анализируется определенными алгоритмами локализации, например, как описано в O. Thiergart, R. Schultz-Amling, G. Del Galdo, D. Mahne, and F. Kuech «Определение местоположения источников звука в реверберирующих средах на основе параметров направленного аудиокодирования», 128-ая Конвенции AES, доклад 7853, г. Нью-Йорк, шт. Нью-Йорк, США, октябрь 2009, и вследствие этого она может быть использована для регулирования величины размывания (подмешивания случайного сигнала).
Варианты осуществления по фиг. 7-9 относятся к регулированию последующих блоков обработки. Все параметры пространственных аудиокодеков могут быть использованы для оперирования последовательными стадиями обработки, например, синтезом DirAC или направленной фильтрацией, как было описано ранее. Если параметры, подобные мгновенному DOA, искажены каким-либо образом, то корректирование этих параметров перед последующими стадиями обработки является одним путем для достижения итогового высококачественного выхода. Способы для корректирования пространственных параметров были подвергнуты обработке в вариантах осуществления по фиг. 2-4. В качестве альтернативы, можно отрегулировать последующие стадии обработки до ожидаемого смещения и неоднозначности. Связанные процедуры резюмируются на основе типовой структуры на Фиг. 16. В этом случае, функция f(·) представляет, например, операцию направленной фильтрации.
В основном, направленная фильтрация работает посредством перемножения спектральных усилений со спектром сигнала (смотри уравнение (6)). Структура нуль-фазовой передаточной функции может быть проиллюстрирована посредством Фиг. 21. Мгновенное DOA назначается усилению между нулем и единицей. Эта процедура может быть исполнена для каждого временного блока k и частотного диапазона m.
Конкретно, на Фиг. 21 показана примерная функция проектирования для направленной фильтрации как функция DOA. Эта функция может быть использована при каждом временном блоке k и частотном диапазоне m. Функция проектирования является "направляемой" при предположении иметь желаемый активный источник при Q1=280°.
Важно отметить, что правило проектирования основывается полагается на скорректированные DOA
Как изображено на Фиг. 16, оценка параметра DOA,
Из рассмотрения выше следует, что при применении направленной фильтрации или стадии синтеза пространственного аудио, не требуется предварительная информация о местоположениях текущих источников. Оказывается, что в этом случае операция фильтрации и учет неоднозначности могут быть совмещены эффективным образом. Этот подход изображен на Фиг. 22 и будет резюмирован в дальнейшем.
Как ранее, функция f(·) описывает конструкцию функции усиления направленной фильтрации как функции правильного DOA φ(k, m):
D(k,m)=f(φ(k,m))
Поскольку уже известно, что φ(k, m) следует заменить на соответствующую оценку
fenh,i(
для i = I,..., N.
В вариантах осуществления изобретения, желаемая расширенная функция усиления fenh(
Конкретно, на Фиг. 22 показана структура для регулирования блоков обработки, которые работают как функция неоднозначного DOA, для генерирования выходных параметров fenh(
Далее приведен пример для иллюстрации того, как разрешение неоднозначности на стадии обработки, которая следует за блоком 11 оценивания DOA, позволяет опустить блок определения местоположения источника. Рассмотрим Фиг. 21: предполагаем, что активный источник расположен при Q1; он назначен усилению, равному единице.
Наоборот, согласно дополнительным вариантам осуществления, можно выбрать наименьшее усиление, если желательно подавлять помехи в максимально возможной степени:
В зависимости от действительного сценария применения, разные стратегии для объединения N функций fenh,i(·), например, взятие среднего, могли бы также быть вариантом выбора. Рассматривая пример по фиг. 21, следует обратить внимание, что объединение кандидатов действительного DOA с
Следует отметить, что объединение функций fenh,i(·) может быть эффективно предварительно вычислено на основании геометрии решетки и желаемых диаграмм направленности (см. Фиг. 15). Таким образом, во время периода выполнения алгоритма дополнительная вычислительная нагрузка не генерируется, так как выход настоящего подхода состоит из функции оцененного DOA, а не из соответствующей скорректированной версии.
В кратком изложении предыдущих вариантов осуществления, представленный метод/концепция может содержать следующие этапы. Сначала сигналы из микрофонной решетки могут быть записаны. Затем, направление прихода (DOA) может быть оценено, исходя из этих микрофонных сигналов. Затем неоднозначность DOA может быть разрешена с помощью информации о положениях активных источников звука. Эта информация может быть доступна заранее и/или может быть оценена во время периода работы. В качестве альтернативы, неоднозначность может быть разрешена не относительно DOA, а параметров последующих стадий обработки, например, спектральных усилений. Наконец, последующие стадии обработки, например, направленная фильтрация, могут быть применены.
Хотя некоторые аспекты были описаны в контексте устройства, ясно, что эти аспекты также представляют описание соответствующего способа, где блок или устройство соответствует этапу способа или признаку этапа способа. Аналогично, аспекты, описанные в контексте этапа способа, также представляют описание соответствующего блока или элемента или признака соответствующего устройства. Некоторые или все из этапов способа могут быть исполнены посредством (или используя) аппаратного устройства, как например, микропроцессора, программируемого компьютера или электронной схемы. В некоторых вариантах осуществления, некоторый один или более из наиболее важных этапов способа могут быть исполнены таким устройством.
Соответствующие изобретению параметры могут быть сохранены в цифровой среде хранения или могут быть переданы в среде передачи, такой как среда беспроводной передачи или среда проводной передачи, такой как Интернет.
В зависимости от определенных требований реализации, варианты осуществления данного изобретения могут быть реализованы в аппаратном обеспечении или программном обеспечении. Данная реализация может быть выполнена используя цифровую среду хранения, например, floppy-диск, DVD, Blue-Ray, CD, ROM, PROM, EPROM, EEPROM или flash-память, имеющий электронно-считываемые сигналы управления, хранящиеся на нем, которые взаимодействуют (или способны взаимодействовать) с программируемой компьютерной системой, так чтобы выполнялся соответствующий способ. Вследствие этого, цифровая среда хранения может быть считываемым компьютером.
Некоторые варианты осуществления согласно данному изобретению содержат носитель данных, имеющий электронно-считываемые сигналы управления, которые способны взаимодействовать с программируемой компьютерной системой, так чтобы выполнялся один из способов, описанных в настоящем документе.
В общем, варианты осуществления настоящего изобретения могут быть реализованы как компьютерный программный продукт с программным кодом, причем программный код действует для выполнения одного из способов, когда компьютерный программный продукт выполняется на компьютере. Программный код может, например, храниться на считываемом машиной носителе.
Другие варианты осуществления содержат компьютерную программу для выполнения одного из способов, описанных в настоящем документе, хранящихся на считываемом машиной носителе.
Другими словами, вариант осуществления патентоспособного способа, вследствие этого, является компьютерной программой, имеющей программный код для выполнения одного из способов, описанных в настоящем документе, когда компьютерная программа выполняется на компьютере.
Дополнительный вариант осуществления патентоспособных способов, вследствие этого, является носителем данных (или цифровой средой хранения или считываемой компьютером средой), содержащим записанную на нем компьютерную программу для выполнения одного из способов, описанных в настоящем документе. Носитель данных, цифровая среда хранения или записывающая среда обычно материальны и/или постоянны.
Дополнительный вариант осуществления патентоспособного способа, вследствие этого, является потоком данных или последовательностью сигналов, представляющих компьютерную программу для выполнения одного из способов, описанных в настоящем документе. Поток данных или последовательность сигналов могут, например, быть выполненными с возможностью переноса через соединение передачи данных, например через Интернет.
Дополнительный вариант осуществления содержит средство обработки, например компьютер, или программируемое логическое устройство, выполненный с возможностью или адаптированный для выполнения одного из способов, описанных в настоящем документе.
Дополнительный вариант осуществления содержит компьютер, имеющий установленную на нем компьютерную программу для выполнения одного из способов, описанных в настоящем документе.
Дополнительный вариант осуществления согласно данному изобретению содержит устройство или систему, выполненные с возможностью переноса (например, электронным способом или оптически) компьютерной программы для выполнения одного из способов, описанных в настоящем документе, в приемник. Приемник может, например, быть компьютером, мобильным устройством, запоминающим устройством или тому подобным. Устройство или система могут, например, содержать файл-сервер для переноса компьютерной программы на приемник.
В некоторых вариантах осуществления, программируемое логическое устройство (например, программируемая пользователем вентильная матрица) может быть использовано для выполнения некоторой или всех функциональных возможностей способов, описанных в настоящем документе. В некоторых вариантах осуществления, программируемая пользователем вентильная матрица может взаимодействовать с микропроцессором для выполнения одного из способов, описанных в настоящем документе. В общем, способы предпочтительно выполняются любым аппаратным устройством.
Вышеописанные варианты осуществления являются лишь иллюстративными для принципов настоящего изобретения. Следует понимать, что модификации и вариации данных компоновок и подробности, описанные в настоящем документе, будут очевидны специалистам в данной области техники. Поэтому предусматривается ограничение только объемом пунктов формулы изобретения, а не конкретными подробностями, представленными с целью описания и разъяснения вариантов осуществления в настоящем документе.
В заключение, настоящее изобретение содержит стратегию для разрешения неоднозначностей, вызванных пространственным искажением. Неоднозначности могут быть разрешены либо относительно пространственных параметров, либо последующих блоков обработки, которые используют пространственные параметры в качестве их входа.
Устройство (100) для разрешения неоднозначности из оценки (105) DOA (
1. Устройство (100) для разрешения неоднозначности из оценки (105) DOA
анализатор (110) оценки DOA для анализирования оценки (105) DOA
блок (120) разрешения неоднозначности для разрешения неоднозначности в множестве (115) неоднозначных параметров анализа (
2. Устройство (200) по п. 1, в котором анализатор (210) оценки DOA выполнен с возможностью отнесения оценки (105) DOA
3. Устройство (300) по п. 1, в котором блок (120) разрешения неоднозначности сконфигурирован как селектор (320) для выбора однозначного разрешенного параметра (325)
4. Устройство (400) по п. 1, в котором блок (120) разрешения неоднозначности сконфигурирован как блок (420) отображения для отображения множества (215) неоднозначных оценок DOA
5. Устройство (400) по п. 4, в котором блок (420) отображения содержит генератор (540) чисел для генерирования переменных чисел (545) во времени, и блок (530) объединения для объединения некоторого числа переменных чисел (545) и определенной предварительной оценки локализации, соответствующей определенному DOA (525)
6. Устройство (600) по п. 2, дополнительно содержащее поставщик (610) пространственной информации для предоставления предварительной пространственной информации (211) одного или более активных источников, в котором поставщик (610) пространственной информации выполнен с возможностью предоставления предварительной пространственной информации (211) на основе входного параметра (611), который отличается от оценки (105) DOA
7. Устройство (700) по п. 1, в котором анализатор (710) оценки DOA выполнен с возможностью генерирования множества (715) ответвлений для каждого неоднозначного параметра анализа из множества (115) неоднозначных параметров анализа
8. Устройство (700) по п .7, в котором блок (720) разрешения неоднозначности сконфигурирован как блок объединения для объединения множества (115) неоднозначных параметров анализа
9. Устройство (700) по п. 7, в котором блок (720) разрешения неоднозначности сконфигурирован как селектор для выбора однозначного разрешенного параметра (725) (fres) из множества (115) неоднозначных параметров анализа
10. Устройство (800) по п. 7, в котором анализатор (810) оценки D0A выполнен с возможностью отнесения оценки (105) DOA
11. Устройство (900) по п. 7, в котором анализатор (910) оценки DOA и блок (720) разрешения неоднозначности выполнены с возможностью получения однозначного разрешенного параметра (725) (fres) за один этап обработки, так что предоставляется результат обработки, представляющий однозначный разрешенный параметр (725) (fres), который был бы получен, если по меньшей мере два этапа обработки были выполнены последовательно.
12. Устройство (900) по п. 7, в котором анализатор (910) оценки DOA содержит, для каждого ответвления из множества (915) ответвлений, блок обработки параметров, причем блок (914) обработки параметров выполнен с возможностью отнесения оценки (105) DOA
13. Устройство по п. 1, дополнительно содержащее блок (11) оценивания DOA для оценивания оценки (105) DOA
14. Способ для разрешения неоднозначности из оценки (105) DOA
анализ оценки (105) DOA
разрешение неоднозначности в множестве (115) неоднозначных параметров анализа (
15. Считываемый компьютером носитель, содержащий сохраненную на нем компьютерную программу, имеющую программный код для выполнения способа по п. 14, когда компьютерная программа исполняется на компьютере.
M | |||
Kallinger et.al | |||
ENHANCED DIRECTION ESTIMATION USING MICROPHONE ARRAYS FOR DIRECTIONAL AUDIO CODING | |||
Станок для изготовления деревянных ниточных катушек из цилиндрических, снабженных осевым отверстием, заготовок | 1923 |
|
SU2008A1 |
Proccedings | |||
Топка с несколькими решетками для твердого топлива | 1918 |
|
SU8A1 |
Trento | |||
Italy | |||
Приспособление для точного наложения листов бумаги при снятии оттисков | 1922 |
|
SU6A1 |
M | |||
Kallinger et.al | |||
ENHANCED DIRECTION ESTIMATION USING MICROPHONE ARRAYS FOR DIRECTIONAL AUDIO |
Авторы
Даты
2015-06-10—Публикация
2011-08-23—Подача