Нижеследующее изобретение относится к области акустического анализа, записи пространственного звука, обработке сигналов микрофонных массивов, и пространственной фильтрации. Некоторые варианты осуществления настоящего изобретения относятся к способу, который может использоваться для определения коэффициентов фильтрации фильтра рассеянного звука, т.е. фильтра для извлечения рассеянного звука (реверберирующего звука) из записей с использованием микрофонного массива. Некоторые варианты осуществления относятся к соответствующей компьютерной программе. Некоторые варианты осуществления относятся к устройству, которое может быть использовано для определения коэффициентов фильтрации фильтра рассеянного звука.
Захват звука с использованием микрофонного массива в реверберирующих средах обычно направлен на захват прямого звука от источников звука, при ослаблении шума и реверберации. Для многих применений было бы выгодным, если бы можно было также извлекать реверберирующий звук, при подавлении прямого звука и шума. Например, в пространственном воспроизведении звука [Pulkki2007, Thiergart2013, Kowalczyk2013], реверберация, присутствующая на стороне записи, должна быть воспроизведена на стороне воспроизведения для воссоздания необходимого стереофонического эффекта. Кроме того, при обеспечении оценки реверберирующего звука, мы можем вычислить параметры, такие как отношение сигнал-реверберация или мощность реверберирующего звука, которые представляют важную информацию для различных других применений.
В то время как оценка компонентов прямого звука (например, с использованием разделения источников, дереверберации, или подавления шума) хорошо освещена в литературе, существует лишь небольшое количество методик для извлечения реверберирующего звука. Обычно реверберация моделируется в виде (изменяющегося во времени) рассеянного звукового поля. Для извлечения рассеянного звука, в последнее время использовались одноканальные фильтры (например, в [Pulkki2007, Thiergart2013]), которые имеют плохую производительность, когда активно множество источников, или для сигналов, подобных сигналам переходных процессов. Лучшая производительность может быть достигнута с использованием многоканальных фильтров (например, [Kowalczyk2013, Thiergart2013b]). К сожалению, существующие в настоящее время многоканальные фильтры являются неоптимальными и не обеспечивают подходящую диаграмму направленности для захвата рассеянного звука.
Поэтому желательно обеспечить фильтр рассеянного звука, имеющий улучшенную производительность в отношении извлечения рассеянного звука и/или подавления прямого звука. Также, может быть желательным, чтобы фильтр рассеянного звука имел диаграмму направленности, которая является в высшей степени всенаправленной, за исключением направлений поступления компонентов прямого звука. В высшей степени всенаправленная характеристика направленности является желательной, поскольку рассеянный звук поступает на микрофонный массив со всех направлений.
Предложен способ, который содержит определение линейного ограничения для коэффициентов фильтрации фильтра рассеянного звука. Линейное ограничение основано на пространственной когерентности между первым участком рассеянного звука в первом микрофонном сигнале и вторым участком рассеянного звука во втором микрофонном сигнале. Первый микрофонный сигнал захвачен первым микрофоном, а второй микрофонный сигнал захвачен вторым микрофоном, расположенным на расстоянии от первого микрофона, известным способом. Способ также содержит вычисление по меньшей мере одного из направления поступления по меньшей мере одного прямого звука, статистики сигналов в отношении первого и второго микрофонных сигналов и статистики шумов в отношении первого и второго микрофонных сигналов. Способ дополнительно содержит определение коэффициентов фильтрации фильтра рассеянного звука путем решения оптимизационной задачи в отношении по меньшей мере одного из направления поступления по меньшей мере одного прямого звука, статистики сигналов и статистики шумов, с учетом линейного ограничения для коэффициентов фильтрации.
Варианты осуществления обеспечивают компьютерную программу для реализации вышеописанного способа, когда обеспечивается ее исполнение на компьютере или процессоре обработки сигналов.
Дополнительные варианты осуществления обеспечивают устройство, содержащее вычислитель линейного ограничения, выполненный с возможностью определения линейного ограничения для коэффициентов фильтрации фильтра рассеянного звука. Линейное ограничение основано на пространственной когерентности между первым участком рассеянного звука в первом микрофонном сигнале и вторым участком рассеянного звука во втором микрофонном сигнале. Первый микрофонный сигнал захвачен или был захвачен первым микрофоном, а второй микрофонный сигнал захвачен или был захвачен вторым микрофоном, расположенным на расстоянии от первого микрофона, известным способом. Устройство также содержит вычислитель статистики, выполненный с возможностью вычисления по меньшей мере одного из направления поступления по меньшей мере одного прямого звука, статистики сигналов в отношении первого и второго микрофонных сигналов и статистики шумов в отношении первого и второго микрофонных сигналов и второго микрофонного сигнала. Устройство дополнительно содержит вычислитель коэффициентов фильтрации, выполненный с возможностью определения коэффициентов фильтрации фильтра рассеянного звука, путем решения оптимизационной задачи в отношении по меньшей мере одного из направления поступления по меньшей мере одного прямого звука, статистики сигналов и статистики шумов, с учетом линейного ограничения для коэффициентов фильтрации.
Варианты осуществления основаны на понимании того, что фильтр рассеянного звука может быть определен с учетом по меньшей мере одного линейного ограничения, которое относится к участкам рассеянного звука микрофонных сигналов.
Далее варианты осуществления настоящего изобретения описаны более подробно со ссылкой на чертежи, на которых:
Фиг. 1 показывает схематичную блок-схему методики для извлечения рассеянного звука с использованием одноканального фильтра;
Фиг. 2 показывает схематичную блок-схему методики для извлечения рассеянного звука с использованием многоканального фильтра;
Фиг. 3 показывает схематичную блок-схему предлагаемого изобретения согласно первому примеру для реализации;
Фиг. 4 показывает схематичную блок-схему предлагаемого изобретения согласно второму примеру для реализации;
Фиг. 5 показывает схематичную блок-схему предлагаемого изобретения согласно третьему примеру для реализации;
Фиг. 6 показывает пример диаграммы направленности захвата, полученной в результате применения методики для извлечения рассеянного звука с использованием фильтра, согласно фиг. 2;
Фиг. 7 показывает пример диаграммы направленности захвата, полученной в результате применения методики для извлечения рассеянного звука с использованием фильтра, согласно фиг. 4; и
Фиг. 8 схематично показывает микрофонный массив и разные звуковые сигналы, которые захвачены микрофонным массивом.
Термины «прямой звук» и «рассеянный звук» определены следующим образом.
Прямой звук: звуки, которые поступают в микрофоны, главным образом, по конкретному выраженному направлению. Прямой звук может представлять собой, например, звук, поступающий прямо от источника звука к микрофону, или отдельное отражение помещения. Прямые звуки могут быть, например, плоскими волнами или сферическими волнами с конкретным направлением поступления. Когда направление поступления прямого звука известно, можно вычислить относительную передаточную функцию прямого звука между микрофонами при условии, что геометрия микрофонов известна.
Рассеянный звук: звук, который поступает в микрофоны со всех направлений. Рассеянный звук может представлять собой, например, позднюю реверберацию, присутствующую в помещении. Обычно, никакие выраженные направления поступления не могут быть связаны с рассеянным звуком (изотропное звуковое поле), т.е. звук поступает с одинаковой средней мощностью со всех направлений. Кроме того, необходимо предположить, что относительные передаточные функции рассеянного звука между микрофонами являются случайными и ненаблюдаемыми. Однако, средние относительные передаточные функции рассеянного звука между микрофонами обычно известны для конкретных расположений микрофонов и моделей рассеянного поля или могут быть измерены.
Нижеследующие подсекции являются кратким изложением существующих методик для извлечения рассеянного звука (или реверберирующего звука) из микрофонной записи. Далее, М означает количество используемых микрофонов. Мы предполагаем, что все микрофонные сигналы были преобразованы в частотно-временную область, где k является индексом частоты, а n является индексом времени (следует отметить, что обычно фильтры могут также применяться во временной области). Микрофоны захватывают L плоских волн (называемых прямым звуком), распространяющихся в рассеянном поле. DOA l-ой плоской волны представлено единичным вектором нормали . В частотно-временной области, сигнал m-го (всенаправленного) микрофона может быть представлен следующим образом:
Здесь,
Целью настоящего изобретения является оценка
Одноканальные фильтры извлекают рассеянный звук из единственного микрофонного сигнала (
Оценка рассеянного звука определяется путем умножения одного из микрофонных сигналов, например, микрофонного сигнала первого микрофона
Обычно, фильтр
где
Пример системы для извлечения рассеянного звука с использованием одноканального фильтра показан на фиг. 1. Во-первых, SDR (или, альтернативно, диффузность) оценивается на основании множества микрофонных сигналов. Во-вторых, вычисляется фильтр
Многоканальные фильтры учитывают
где
Непосредственным способом нахождения подходящего фильтра является вычисление весов
с учетом линейных ограничений
Здесь,
Для преодоления этой проблемы и предотвращения нулевых весов фильтра, [Thiergart2013b, Kowalczyk2013] предлагает использовать тот же фильтр, но с дополнительным ограничением, представленным в виде
где
Пример полученной диаграммы направленности захвата показан на фиг. 6. Здесь, два прямых звука поступают с двух азимутальных направлений 51° и 97°. Чертеж показывает полученную диаграмму направленности захвата при частоте 2,8 кГц при использовании однородного линейного массива с 16 микрофонами с интервалами 5 см между микрофонами. Диаграмма направленности захвата имеет нули точно для 51° и 97° и высокий коэффициент усиления для 180°, что соответствует направлению
Замкнутое по форме решение для вычисления весов фильтра
Пример системы для извлечения рассеянного звука с использованием представленного многоканального фильтра показан на фиг. 2. После преобразования микрофонных сигналов в частотно-временную область, мы оцениваем стационарный шум и DOA L плоских волн. Затем, на основании DOA-информации, достигается
В настоящем изобретении, мы предлагаем новый многоканальный фильтр для извлечения реверберирующего звука, который преодолевает ограничения вышеупомянутых фильтров. Предлагаемый пространственный фильтр характеризуется диаграммой направленности, которая приближается к всенаправленной диаграмме направленности, за исключением направлений поступления (direction-of-arrival - DOA) прямого звука, для которых она показывает пространственные нули. Это представляет в высшей степени необходимую способность захвата рассеянного звука со всех направлений с низкими искажениями.
Далее, мы предлагаем многоканальный фильтр для оценки рассеянного звука
Весовой вектор
Однако, в отличие от многоканальных фильтров, описанных выше, мы предлагаем использовать линейное ограничение, которое не зависит от прямого звука (т.е. от L плоских волн). Точнее, предлагаемое новое ограничение не является функцией DOA плоских волн или соответствующих относительных передаточных функций плоских волн между микрофонами, соответственно.
Напротив, предлагаемое новое ограничение зависит от статистической информации о рассеянном звуке, т.е. предлагаемое новое ограничение зависит от относительных передаточных функций рассеянного звука между микрофонами. Мы покажем далее, что предлагаемое новое ограничение является функцией когерентности или корреляции рассеянного звука между микрофонами. Эта когерентность соответствует средней относительной передаточной функции рассеянного звука между микрофонами.
Предлагаемый пространственный фильтр достигается минимизацией конкретной целевой функции, удовлетворяя ограничение отсутствия искажений для рассеянного звука. Это ограничение соответствует относительной передаточной функции рассеянного звука между микрофонами. В математическом выражении, фильтр вычисляется следующим образом
с учетом линейного ограничения
Здесь, J является целевой функцией, подлежащей минимизации фильтром. Целевая функция может быть, например, мощностью стационарного шума на выходе фильтра, энергией помехи на выходе фильтра, или квадратичной ошибкой оцененного рассеянного звука. Примеры для J будут обеспечены в вариантах осуществления. Вектор ограничения
Следует отметить, что m-ый элемент
Рассеянный звук на выходе фильтра можно представить в виде выражения
Эта средняя относительная передаточная функция
,
где (.)* означает комплексно сопряженную величину. Эта пространственная когерентность описывает корреляцию рассеянного звука между микрофонами m и m' в частотной области. Эта когерентность зависит от конкретного рассеянного звукового поля. Когерентность может быть измерена заранее для данного помещения. Альтернативно, когерентность известна из теории конкретных рассеянных звуковых полей [Elko2001]. Например, для сферически изотропного рассеянного звукового поля, которое часто рассматривается на практике, мы имеем
где sinc означает sinc-функцию, f является акустической частотой для данного частотного диапазона k, и c является скоростью звука. Кроме того,
С использованием ограничения рассеянного звука, введенного выше, мы получаем пространственный фильтр, который захватывает рассеянный звук одинаково хорошо со всех направлений. Это является отличием от многоканальных фильтров, описанных выше, которые захватывают звук, главным образом, по одному направлению, а именно, по направлению, которому соответствует выбранный вектор распространения
Следует отметить, что ограничение рассеянного звука
Блок-схема предложенного изобретения показана на фиг. 3. Во-первых, M микрофонные сигналы преобразуются в частотно-временную область (или другую подходящую область для обработки сигналов) с использованием банка (101) фильтров (filterbank - FB). Во-вторых, мы вычисляем вектор линейного ограничения рассеянного звука
МИНИМИЗАЦИЯ ВЫХОДНОЙ МОЩНОСТИ, УДОВЛЕТВОРЯЮЩЕЙ ОГРАНИЧЕНИЮ РАССЕЯННОГО ЗВУКА
В этом варианте осуществления, мы определяем пространственный фильтр, который минимизирует всю выходную мощность фильтра с учетом ограничения рассеянного звука. Ограничение рассеянного звука обеспечивает, то что рассеянный звук сохраняется пространственным фильтром, в то время как остальные части сигнала (нежелательный стационарный шум и плоские волны) минимизируются. Веса фильтра
с учетом линейного ограничения
Замкнутое по форме решение для этого фильтра приведено в [VanTrees2002] в виде
Здесь,
где
Фактически, пространственная когерентность
либо может быть представлена в виде априорной информации, предполагающей конкретное рассеянное звуковое поле. В последнем случае, мы используем, например, пространственную когерентность для сферически изотропного рассеянного звукового поля, т.е.
Следует отметить, что sinc-функция может быть заменена другими функциями, в зависимости от предполагаемого звукового поля. Для разных рассеянных звуковых полей существуют разные функции когерентности, которые априори известны. Примеры могут быть найдены в [Elko2001].
Блок-схема этого варианта осуществления показана на фиг. 3. После преобразования микрофонных сигналов с использованием банка (101) фильтров, мы вычисляем сигнальную PSD-матрицу
Фильтр, вычисленный в этом варианте осуществления, имеет следующие преимущества по сравнению с другим пространственным фильтром (например, фильтрами, описанными в предшествующем уровне техники):
- Поскольку мы минимизируем весь выходной сигнал, фильтр обеспечивает оптимальное соотношение между затуханием L плоских волн и стационарным шумом.
- Необходимую сигнальную PSD-матрицу
- Не требуется никакой информации о DOA L плоских волн.
ЛИНЕЙНО ОГРАНИЧЕННЫЙ ФИЛЬТР С МИНИМАЛЬНОЙ ДИСПЕРСИЕЙ
Этот вариант осуществления представляет собой комбинацию новой методики и методики предшествующего уровня техники в отношении многоканальных фильтров, описанных выше в соответствии с фиг. 2. В этом варианте осуществления, мы определяем линейно ограниченный пространственный фильтр, который минимизирует стационарный шум на выходе фильтра, с учетом рассеянного ограничения и дополнительных направленных ограничений. Веса фильтра
с учетом линейных ограничений
и
Ясно, что фильтр минимизирует только стационарный шум на выходе. Нежелательные плоские волны подавляются с использованием вторых линейных ограничений (как объяснено выше для многоканальных фильтров, фиг. 2). Эти дополнительные ограничения, по сравнению с фильтром, минимизирующим выходную мощность, в соответствии с фиг. 3, обеспечивают еще более сильное подавление создающих помехи плоских волн. Полученный в результате фильтр, тем не менее, сохраняет рассеянный звук благодаря первому линейному ограничению. Замкнутое по форме решение для этого фильтра, которое может быть вычислено на практике, может быть представлено в виде
Здесь, вектор
Блок-схема этого варианта осуществления показана на фиг. 4. После преобразования микрофонных сигналов с использованием банка (101) фильтров, мы вычисляем PSD-матрицу
Пример полученной диаграммы направленности захвата для этого фильтра показан на фиг. 7. Здесь, два прямых звука поступают с двух азимутальных направлений 51° и 97°. Чертеж показывает полученную диаграмму направленности захвата при частоте 2,8 кГц при использовании однородного линейного массива с 16 микрофонами с интервалами 5 см между микрофонами. Диаграмма направленности захвата имеет нули точно для 51° и 97°. В противном случае она является почти всенаправленной. Это является главным преимуществом перед пространственным фильтром предшествующего уровня техники, показанным на фиг. 2, который создает пространственный фильтр на фиг. 6.
Фильтр, вычисленный в этом варианте осуществления, имеет следующие преимущества по сравнению с другим пространственным фильтром (например, фильтрами, описанными в предшествующем уровне техники):
- Сильное затухание плоских волн благодаря ограничениям прямого звука.
- Почти всенаправленная диаграмма направленности захвата, которая необходима для захвата рассеянного звука.
КОМБИНИРОВАННАЯ МЕТОДИКА
Пространственные фильтры, показанные на фиг. 3 и 4, в общем, обеспечивают хорошую производительность на практике. Однако, они также страдают от конкретных недостатков. Например, фильтр, показанный на фиг. 3, обычно не подавляет прямой звук полностью. Оставшаяся мощность прямого звука может привести к нежелательным эффектам во время воспроизведения пространственного звука. Напротив, пространственный фильтр фиг. 4 обеспечивает сравнительно плохую устойчивость к стационарному шуму при низких частотах. Далее, мы объединяем пространственные фильтры на фиг. 3 и 4 для использования преимуществ обоих пространственных фильтров одновременно смягчая недостатки. В результате, мы получаем пространственный фильтр, который характеризуется хорошим подавлением помех (подавлением прямого звука) и высокой устойчивостью к стационарному шуму.
Методика, предлагаемая ниже, представляет собой так называемый Параметрический многоканальный фильтр Винера (parametric multi-channel Wiener filter - PMWF), который может быть масштабирован между так называемым пространственным фильтром с Минимальной среднеквадратичной погрешностью (minimum mean square error - MMSE) и пространственным фильтром на фиг. 3. Дополнительно, пространственный фильтр на фиг. 4 используется для оценки конкретных необходимых величин.
Весовой вектор предлагаемого PMWF вычисляется в виде
с учетом
где
где мы определяем как
Здесь,
или с использованием методики с управлением по решению, как объяснено в [Kowalczyk2013]. В предшествующей формуле, является матрицей пространственной когерентности
Блок-схема этого варианта осуществления показана на фиг. 5. После преобразования микрофонных сигналов с использованием банка (101) фильтров, мы вычисляем микрофонную PSD-матрицу
Фиг. 8 схематично показывает микрофонный массив, содержащий M микрофонов. Микрофонный массив подвергается воздействию звукового поля, содержащего участки прямого звука и участки рассеянного звука. Участки прямого звука представлены на фиг. 8 посредством L источников звука от Xl=1 до Xl=L, каждый из которых, как предполагается, генерирует, по существу, плоскую волну в месте расположения микрофонного массива. Направление распространения каждой плоской волны (в месте расположения микрофонного массива) указано на фиг. 8 посредством векторов n1-nL. Участки прямого звука являются обычно функцией местоположения dm. Рассеянный звук Xd(k, n, dm) может моделировать, например, реверберацию в помещении. Рассеянный звук, как предполагается, генерируется посредством бесконечной суммы плоских волн со случайными фазами, случайной амплитудой, и случайными DOA. Это означает, что рассеянный звук генерируется посредством бесконечного количества источников, случайно распределенных по звуковой сцене. Эти источники звука моделируют бесконечное количество отражений помещения, которые генерируют позднюю реверберацию.
Отдельный микрофонный сигнал, например, для m-ого микрофона, Xm(k, n), является комбинацией L участков прямого звука от Xl=1 до Xl=L, участка рассеянного звука Xd, и шума Xn, т.е.
Относительные передаточные функции B1,m, B2,m,..., Bm’,m,..., BM,m для рассеянного звука между другими микрофонами и m-ым микрофоном схематично показаны на фиг. 8. Относительная передаточная функция Bm,m от m-ого микрофона к самому себе (не показана на фиг. 8) является обычно равной 1.
Нижеследующий список обеспечивает краткий обзор некоторых аспектов, которые были описаны выше:
- Прием по меньшей мере двух микрофонных сигналов.
- Преобразование микрофонных сигналов в частотно-временную область или другую подходящую область.
- Вычисление линейного ограничения рассеянного звука в виде функции корреляции или когерентности рассеянного звука между микрофонами.
- Вычисление статистики сигналов/шумов.
- В некоторых вариантах осуществления: оценка DOA прямых звуков и вычисление ограничений прямого звука, которые представляют собой относительные передаточные функции прямых звуков между микрофонами.
- В некоторых вариантах осуществления: вычисление вспомогательного фильтра и оценка мощности рассеянного звука.
- Вычисление весов пространственного фильтра для извлечения рассеянного звука с использованием полученной статистики сигналов/шумов и необязательной информации о мощности рассеянного звука, с учетом ограничения рассеянного звука.
- Выполнение линейной комбинации микрофонных сигналов с использованием вычисленных весов пространственного фильтра.
Хотя некоторые аспекты были описаны в контексте устройства, должно быть ясно, что эти аспекты также представляют собой описание соответствующего способа, где блок или устройство соответствует этапу способа или признаку этапа способа. Аналогично, аспекты, описанные в контексте способа, также представляют собой описание соответствующего блока или элемента или признака соответствующего устройства.
В зависимости от конкретных требований к реализации, варианты осуществления настоящего изобретения могут быть реализованы в аппаратном обеспечении или программном обеспечении. Реализация может быть выполнена с использованием цифровой запоминающей среды, например, гибкого диска, DVD, CD, ROM, PROM, EPROM, EEPROM или FLASH-памяти, на которой сохранены электронным способом считываемые управляющие сигналы, которые взаимодействуют (или способны взаимодействовать) с программируемой вычислительной системой таким образом, чтобы соответствующий способ выполнялся.
Некоторые варианты осуществления согласно настоящему изобретению содержат постоянный носитель данных, на котором находятся считываемые электронными средствами управляющие сигналы, которые способны взаимодействовать с программируемой вычислительной системой таким образом, чтобы один из способов, описанных здесь, выполнялся.
В общем, варианты осуществления настоящего изобретения могут быть реализованы в виде компьютерного программного продукта с использованием программного кода, причем программный код действует для выполнения одного из способов, когда компьютерный программный продукт выполняется на компьютере. Программный код может, например, храниться на машиночитаемом носителе.
Другие варианты осуществления содержат компьютерную программу для выполнения одного или более способов, описанных в материалах настоящей заявки, хранящуюся на машиночитаемом носителе.
Другими словами, вариант осуществления способа согласно изобретению является, таким образом, компьютерной программой, имеющей программный код для выполнения одного из способов, описанных в материалах настоящей заявки, когда компьютерная программа выполняется на компьютере.
Дополнительный вариант осуществления способов согласно изобретению является, таким образом, носителем данных (или цифровым запоминающим носителем, или машиночитаемым носителем), содержащим записанную на нем компьютерную программу для выполнения одного из способов, описанных в материалах настоящей заявки.
Дополнительный вариант осуществления способов согласно изобретению является, таким образом, потоком данных или последовательностью сигналов, представляющими компьютерную программу для выполнения одного из способов, описанных в материалах настоящей заявки. Поток данных или последовательность сигналов могут быть, например, выполнены с возможностью их переноса через соединение для передачи данных, например, через интернет.
Дополнительный вариант осуществления содержит средство обработки, например, компьютер или программируемое логическое устройство, выполненное с возможностью или адаптированное для выполнения одного из способов, описанных в материалах настоящей заявки.
Дополнительный вариант осуществления содержит компьютер, на котором установлена компьютерная программа для выполнения одного из способов, описанных в материалах настоящей заявки.
В некоторых вариантах осуществления может быть использовано программируемое логическое устройство (например, массив программируемых логических вентилей) для выполнения некоторых или всех функциональностей способов, описанных в материалах настоящей заявки. В некоторых вариантах осуществления, массив программируемых логических вентилей может взаимодействовать с микропроцессором для выполнения одного или более способов, описанных в материалах настоящей заявки. В общем, данные способы предпочтительно выполняются любым устройством, относящимся к аппаратному обеспечению.
Описанные выше варианты осуществления являются лишь иллюстрацией принципов настоящего изобретения. Следует понимать, что модификации и варианты схем и элементов, описанных в материалах настоящей заявки, будут понятны специалистам в данной области техники. Таким образом, предполагается, что объем данного изобретения ограничен только объемом нижеследующих пунктов формулы изобретения, а не конкретными подробностями, представленными для описания и объяснения вариантов осуществления в материалах настоящей заявки.
СПИСОК ЛИТЕРАТУРЫ
[Pulkki2007] - V. Pulkki, «Spatial sound reproduction with directional audio coding», J. Audio Eng. Soc, Том 55, № 6, страницы 503-516, июнь 2007.
[Thiergart2013] - O. Thiergart, G. Del Galdo, M. Taseska, and E. Habets, «Geometry-based spatial sound acquisition using distributed microphone arrays», Audio, Speech, and Language Processing, IEEE Transactions on, Том 21, № 12, страницы 2583-2594, декабрь 2013.
[Kowalczyk2013] - K. Kowalczyk, O. Thiergart, A. Craciun, and E. A. P. Habets, «Sound acquisition in noisy and reverberant environments using virtual», in Applications of Signal Processing to Audio and Acoustics (WASPAA), 2013 IEEE Workshop on, октябрь 2013.
[Thiergart2013b] - O. Thiergart and E. A. P. Habets, «An informed LCMV filter based on multiple instantaneous direction-of-arrival estimates», in Acoustics Speech and Signal Processing (ICASSP), 2013 IEEE International Conference on, 2013, страницы 659-663.
[Thiergart2012] - O. Thiergart, G. D. Galdo, and E. A. P. Habets, «On the spatial coherence in mixed sound fields and its application to signal-to-diffuse ratio estimation», The Journal of the Acoustical Society of America, Том 132, № 4, страницы. 2337– 2346, 2012.
[VanTrees2002] - H. L. Van Trees, Detection, Estimation, and Modulation Theory: Part IV: Array Processing. John Wiley & Sons, апрель 2002, том 1.
[Elko2001] - G. W. Elko, «Spatial coherence functions for differential micro- phones in isotropic noise fields», in Microphone Arrays: Signal Processing Techniques and Applications, под редакцией M. Brandstein и D. Ward, глава 4, 61–85 (Springer, Berlin) (2001).
Изобретение относится к области акустического анализа. Технический результат – обеспечение захвата рассеянного звука, поступающего на микрофонный массив со всех направлений, путем получения лучшей диаграммы направленности фильтра рассеянного звука. Способ содержит этап, на котором оценивают пространственную когерентность между первым участком рассеянного звука в первом микрофонном сигнале и вторым участком рассеянного звука во втором микрофонном сигнале. Первый микрофонный сигнал захватывается первым микрофоном, а второй микрофонный сигнал захватывается вторым микрофоном, который расположен на расстоянии от первого микрофона. Способ дополнительно содержит этап, на котором определяют линейное ограничение для коэффициентов фильтрации фильтра рассеянного звука, причем линейное ограничение основано на пространственной когерентности. Способ также содержит этап, на котором вычисляют по меньшей мере одно из статистики сигналов и статистики шумов в отношении первого микрофонного сигнала и второго микрофонного сигнала. Способ также содержит этап, на котором определяют коэффициенты фильтрации фильтра рассеянного звука путем решения оптимизационной задачи в отношении по меньшей мере одного из статистики сигналов и статистики шумов, с учетом линейного ограничения для коэффициентов фильтрации. 3 н. и 12 з.п. ф-лы, 8 ил.
1. Способ получения коэффициентов фильтрации для фильтра рассеянного звука, причём способ содержит этапы, на которых:
определяют линейное ограничение для коэффициентов фильтрации фильтра рассеянного звука, причем линейное ограничение основано на пространственной когерентности между первым участком рассеянного звука в первом микрофонном сигнале и вторым участком рассеянного звука во втором микрофонном сигнале, причем первый микрофонный сигнал захвачен первым микрофоном, а второй микрофонный сигнал захвачен вторым микрофоном, расположенным на расстоянии от первого микрофона, известным способом;
вычисляют по меньшей мере одно из направления поступления по меньшей мере одного прямого звука, статистику сигналов в отношении первого и второго микрофонных сигналов и статистику шумов в отношении первого и второго микрофонных сигналов; и
определяют коэффициенты фильтрации фильтра рассеянного звука путем решения оптимизационной задачи в отношении по меньшей мере одного из направления поступления по меньшей мере одного прямого звука, статистики сигналов и статистики шумов, с учетом линейного ограничения для коэффициентов фильтрации.
2. Способ по п. 1, дополнительно содержащий этап, на котором
обеспечивают пространственную когерентность на основании относительной передаточной функции или корреляции рассеянного звука между первым микрофоном и вторым микрофоном.
3. Способ по п. 1,
в котором пространственная когерентность основана на предшествующем измерении относительной передаточной функции или корреляции рассеянного звука для данной среды в течение периодов времени, когда никакой прямой звук не присутствует в среде.
4. Способ по п. 1,
в котором пространственная когерентность основана на теоретическом соотношении для рассеянного звука, причем соответствующее предполагаемое рассеянное звуковое поле предполагает теоретические характеристики, относящиеся к корреляции рассеянного звука между первым микрофоном и вторым микрофоном.
5. Способ по п. 1, в котором оптимизационная задача выражена посредством
с учетом линейного ограничения
где
w(k,n) является вектором коэффициентов фильтрации фильтра рассеянного звука;
w m(k,n) является решением оптимизационной задачи на основе оценки микрофонного сигнала в m-ом микрофоне;
J(w) является целевой функцией;
b m(k,n) является вектором оцененных пространственных когерентностей, причем m´-ый элемент этого вектора является оцененной пространственной когерентностью рассеянного звука между m-ым микрофоном и m´-ым микрофоном;
k является индексом частотной области; и
n является индексом временной области.
6. Способ по п. 5, в котором целевая функция J(w) основана на одном из статистики шумов, матрицы спектральной плотности мощности (PSD) шумов, статистики сигналов, или матрицы спектральной плотности мощности (PSD) микрофона.
7. Способ по п. 1, дополнительно содержащий этапы, на которых:
оценивают по меньшей мере одно из направления поступления по меньшей мере одного прямого звука или относительной передаточной функции по меньшей мере одного прямого звука между первым микрофоном и вторым микрофоном;
вычисляют по меньшей мере одно ограничение прямого звука с использованием направления поступления или относительной передаточной функции по меньшей мере одного прямого звука, причем по меньшей мере одно ограничение прямого звука приводит к подавлению по меньшей мере одного прямого звука.
8. Способ по п. 1, в котором решением оптимизационной задачи является
где
причем
w m(k,n) является решением оптимизационной задачи на основании оценки микрофонного сигнала в m-ом микрофоне;
b m(k,n) является вектором оцененных пространственных когерентностей, причем m’-ый элемент вектора является оцененной пространственной когерентностью рассеянного звука между m-ым микрофоном и m’-ым микрофоном;
9. Способ по п. 8, дополнительно содержащий этап, на котором
оценивают мощность рассеянного звука
10. Способ по п. 9, в котором оценку мощности рассеянного звука
причем
w 1 является вектором коэффициентов фильтрации вспомогательного фильтра рассеянного звука;
11. Способ по п. 1, дополнительно содержащий этап, на котором
выполняют линейную комбинацию первого микрофонного сигнала и второго микрофонного сигнала с использованием коэффициентов фильтрации фильтра рассеянного звука.
12. Машиночитаемый носитель, на котором сохранена компьютерная программа для реализации способа по п. 1 при ее исполнении на компьютере или в процессоре обработки сигналов.
13. Устройство для получения коэффициентов фильтрации для фильтра рассеянного звука, причём устройство содержит:
вычислитель линейного ограничения, выполненный с возможностью определения линейного ограничения для коэффициентов фильтрации фильтра рассеянного звука, причем линейное ограничение основано на пространственной когерентности между первым участком рассеянного звука в первом микрофонном сигнале и вторым участком рассеянного звука во втором микрофонном сигнале, причем первый микрофонный сигнал захвачен первым микрофоном, а второй микрофонный сигнал захвачен вторым микрофоном, расположенным на расстоянии от первого микрофона, известным способом;
вычислитель, выполненный с возможностью вычисления по меньшей мере одного из направления поступления по меньшей мере одного прямого звука, статистики сигналов в отношении первого и второго микрофонных сигналов и статистики шумов в отношении первого и второго микрофонных сигналов; и
вычислитель коэффициентов фильтрации, выполненный с возможностью определения коэффициентов фильтрации фильтра рассеянного звука, путем решения оптимизационной задачи в отношении по меньшей мере одного из направления поступления по меньшей мере одного прямого звука, статистики сигналов и статистики шумов, с учетом линейного ограничения для коэффициентов фильтрации.
14. Устройство по п. 13, в котором пространственная когерентность основана на относительной передаточной функции рассеянного звука между первым микрофоном и вторым микрофоном.
15. Устройство по п. 13, дополнительно содержащее:
вспомогательный вычислитель коэффициентов фильтрации, выполненный с возможностью определения вспомогательных коэффициентов фильтрации вспомогательного фильтра рассеянного звука, путем решения другой оптимизационной задачи, с учетом другого линейного ограничения для вспомогательных коэффициентов фильтрации, отличного от линейного ограничения, учитываемого вычислителем коэффициентов фильтрации;
вспомогательный фильтр рассеянного звука, выполненный с возможностью оценки оцененной мощности рассеянного звука;
причем вычислитель коэффициентов фильтрации выполнен с возможностью учета оцененной мощности рассеянного звука при определении коэффициентов фильтрации фильтра рассеянного звука.
Колосоуборка | 1923 |
|
SU2009A1 |
Изложница с суживающимся книзу сечением и с вертикально перемещающимся днищем | 1924 |
|
SU2012A1 |
Колосоуборка | 1923 |
|
SU2009A1 |
СПОСОБ И ЭЛЕКТРОННОЕ УСТРОЙСТВО ОПТИМИЗАЦИИ ВРЕМЕНИ РЕВЕРБЕРАЦИИ ПРИ ПЕРЕДАЧЕ ЗВУКОВЫХ СИГНАЛОВ | 2007 |
|
RU2343562C1 |
Станок для изготовления деревянных ниточных катушек из цилиндрических, снабженных осевым отверстием, заготовок | 1923 |
|
SU2008A1 |
Станок для изготовления деревянных ниточных катушек из цилиндрических, снабженных осевым отверстием, заготовок | 1923 |
|
SU2008A1 |
Изложница с суживающимся книзу сечением и с вертикально перемещающимся днищем | 1924 |
|
SU2012A1 |
Авторы
Даты
2018-01-11—Публикация
2014-12-02—Подача