УЛУЧШЕНИЕ ЗВУКОВОГО СИГНАЛА ПРИ ПОМОЩИ ОЦЕНОЧНЫХ ПРОСТРАНСТВЕННЫХ ПАРАМЕТРОВ Российский патент 2017 года по МПК G10L19/08 

Описание патента на изобретение RU2620714C2

ОБЛАСТЬ ТЕХНИЧЕСКОГО ПРИМЕНЕНИЯ

[001] Данное раскрытие относится к обработке сигналов.

ПРЕДПОСЫЛКИ ИЗОБРЕТЕНИЯ

[002] Развитие процессов цифрового кодирования и декодирования аудио- и видеоданных продолжает оказывать значительное влияние на доставку развлекательного содержимого. Несмотря на повышенную емкость запоминающих устройств и широкодоступную доставку данных со всевозрастающей шириной полос пропускания, продолжается давление, направленное на сведение к минимуму количества данных, подлежащих хранению и/или передаче. Аудио- и видеоданные часто доставляются совместно, и ширина полосы пропускания для аудиоданных часто ограничена требованиями части, относящейся к видеоданным.

[003] Соответственно, аудиоданные часто кодируют с высокими коэффициентами сжатия, иногда – с коэффициентами сжатия 30:1 или выше. Поскольку искажение сигнала увеличивается с величиной приложенного сжатия, можно достигать компромиссов между точностью воспроизведения декодируемых аудиоданных и эффективностью хранения и/или передачи кодированных данных.

[004] Более того, желательно уменьшить сложность алгоритмов кодирования и декодирования. Кодирование дополнительных данных, касающихся процесса кодирования, может упрощать процесс декодирования, но ценой хранения и/или передачи дополнительных кодированных данных. И хотя существующие способы кодирования и декодирования аудиоданных являются, в целом, удовлетворительными, желательными могли бы быть и усовершенствованные способы.

КРАТКОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ

[005] Некоторые особенности предмета изобретения, описываемые в данном раскрытии, могут быть реализованы в способах обработки аудиоданных. Некоторые такие способы могут включать этап приема аудиоданных, соответствующих ряду звуковых каналов. Эти аудиоданные могут содержать представление в частотной области, соответствующее коэффициентам набора фильтров системы кодирования или обработки аудиоданных. Способ может включать этап применения процесса декорреляции, по меньшей мере, к некоторым из аудиоданных. В некоторых реализациях процесс декорреляции можно выполнять с теми же коэффициентами набора фильтров, что коэффициенты, использованные системой кодирования или обработки аудиоданных.

[006] В некоторых реализациях процесс декорреляции можно выполнять без преобразования коэффициентов представления в частотной области в представление в другой частотной области или во временной области. Представление в частотной области может представлять собой результат применения набора фильтров с критической дискретизацией и с совершенным восстановлением. Процесс декорреляции может включать генерирование сигналов реверберации, или сигналов декорреляции, путем применения линейных фильтров, по меньшей мере, к части представления в частотной области. Это представление в частотной области может представлять собой результат применения к аудиоданным во временной области модифицированного дискретного синусного преобразования, модифицированного дискретного косинусного преобразования или ортогонального преобразования с перекрытием. Процесс декорреляции может включать применение алгоритма декорреляции, действующего полностью на вещественнозначных коэффициентах.

[007] В соответствии с некоторыми реализациями, этот процесс декорреляции может включать избирательную, или адаптивную к сигналу, декорреляцию конкретных каналов. Альтернативно или дополнительно процесс декорреляции может включать избирательную, или адаптивную к сигналу, декорреляцию конкретных полос частот. Процесс декорреляции может включать применение декорреляционного фильтра к части принятых аудиоданных для выработки фильтрованных аудиоданных. Процесс декорреляции может включать использование неиерархического микшера для объединения прямой части принятых аудиоданных с фильтрованными аудиоданными в соответствии с пространственными параметрами.

[008] В некоторых реализациях сведения о декорреляции могут быть приняты либо вместе с аудиоданными, либо иначе. Процесс декорреляции может включать декорреляцию, по меньшей мере, некоторых из аудиоданных в соответствии с принимаемыми сведениями о декорреляции. Эти принимаемые сведения о декорреляции могут содержать коэффициенты корреляции между отдельными обособленными каналами и каналом связывания, коэффициенты корреляции между отдельными обособленными каналами, явные сведения о тональности и/или сведения о кратковременных событиях.

[009] Способ может включать этап определения сведений о декорреляции на основе принятых аудиоданных. Процесс декорреляции может включать декорреляцию, по меньшей мере, некоторых аудиоданных в соответствии с определяемыми сведениями о декорреляции. Способ может включать этап приема сведений о декорреляции, закодированных вместе с аудиоданными. Процесс декорреляции может включать декорреляцию, по меньшей мере, некоторых аудиоданных в соответствии с по меньшей мере одним из следующего: принимаемыми сведениями о декорреляции или определяемыми сведениями о декорреляции.

[0010] В соответствии с некоторыми реализациями, система кодирования или обработки аудиоданных может представлять собой унаследованную систему кодирования или обработки аудиоданных. Способ может включать этап приема элементов механизма управления в битовом потоке, выработанном этой унаследованной системой кодирования или обработки аудиоданных. Процесс декорреляции может, по меньшей мере, частично основываться на этих элементах механизма управления.

[0011] В некоторых реализациях устройство может содержать интерфейс и логическую систему, сконфигурированную для приема через интерфейс аудиоданных, соответствующих ряду звуковых каналов. Эти аудиоданные могут содержать представление в частотной области, соответствующее коэффициентам набора фильтров системы кодирования или обработки аудиоданных. Логическая система может быть сконфигурирована для применения процесса декорреляции, по меньшей мере, к некоторым из аудиоданных. В некоторых реализациях процесс декорреляции можно выполнять с теми же коэффициентами набора фильтров, что коэффициенты, использованные системой кодирования или обработки аудиоданных. Логическая система может содержать по меньшей мере одно из следующего: одно- или многокристальный процессор общего назначения, процессор цифровой обработки сигналов (DSP), проблемно-ориентированную интегральную микросхему (ASIC), программируемую вентильную матрицу (FPGA) или другое программируемое логическое устройство, схему на дискретных компонентах или транзисторную логическую схему, или компоненты дискретного аппаратного обеспечения.

[0012] В некоторых реализациях процесс декорреляции можно выполнять без преобразования коэффициентов представления в частотной области в представление в другой частотной области или во временной области. Представление в частотной области может представлять собой результат применения набора фильтров с критической дискретизацией. Процесс декорреляции может включать генерирование сигналов реверберации, или сигналов декорреляции, путем применения линейных фильтров, по меньшей мере, к части представления в частотной области. Это представление в частотной области может представлять собой результат применения к аудиоданным во временной области модифицированного дискретного синусного преобразования, модифицированного дискретного косинусного преобразования или ортогонального преобразования с перекрытием. Процесс декорреляции может включать применение алгоритма декорреляции, действующего полностью на вещественнозначных коэффициентах.

[0013] Процесс декорреляции может включать избирательную, или адаптивную к сигналу, декорреляцию конкретных каналов. Процесс декорреляции может включать избирательную, или адаптивную к сигналу, декорреляцию конкретных полос частот. Процесс декорреляции может включать применение декорреляционного фильтра к части принятых аудиоданных для выработки фильтрованных аудиоданных. В некоторых реализациях процесс декорреляции может включать использование неиерархического микшера для объединения прямой части принятых аудиоданных с фильтрованными аудиоданными в соответствии с пространственными параметрами.

[0014] Устройство может содержать запоминающее устройство. В некоторых реализациях интерфейс может представлять собой интерфейс между логической системой и этим запоминающим устройством. Альтернативно интерфейс может представлять собой сетевой интерфейс.

[0015] Система кодирования или обработки аудиоданных может представлять собой унаследованную систему кодирования или обработки аудиоданных. В некоторых реализациях логическая система может быть также сконфигурирована для приема через интерфейс элементов механизма управления в битовом потоке, выработанном унаследованной системой кодирования или обработки аудиоданных. Процесс декорреляции может, по меньшей мере, частично основываться на этих элементах механизма управления.

[0016] Некоторые особенности данного раскрытия могут быть реализованы на постоянном носителе данных, содержащем хранящееся на нем программное обеспечение. Это программное обеспечение может содержать команды для управления устройством с целью приема аудиоданных, соответствующих ряду звуковых каналов. Эти аудиоданные могут содержать представление в частотной области, соответствующее коэффициентам набора фильтров системы кодирования или обработки аудиоданных. Программное обеспечение может содержать команды для управления устройством с целью применения процесса декорреляции, по меньшей мере, к некоторым из аудиоданных. В некоторых реализациях процесс декорреляции выполняется с такими же коэффициентами набора фильтров, что и коэффициенты, использованные системой кодирования или обработки аудиоданных.

[0017] В некоторых реализациях процесс декорреляции можно выполнять без преобразования коэффициентов представления в частотной области в представление в другой частотной области или во временной области. Представление в частотной области может представлять собой результат применения набора фильтров с критической дискретизацией. Процесс декорреляции может включать генерирование сигналов реверберации, или сигналов декорреляции, путем применения линейных фильтров, по меньшей мере, к части представления в частотной области. Это представление в частотной области может представлять собой результат применения к аудиоданным во временной области модифицированного дискретного синусного преобразования, модифицированного дискретного косинусного преобразования или ортогонального преобразования с перекрытием. Процесс декорреляции может включать применение алгоритма декорреляции, действующего полностью на вещественнозначных коэффициентах.

[0018] Некоторые способы могут включать этапы приема аудиоданных, соответствующих ряду звуковых каналов, и определения звуковых характеристик этих аудиоданных. Эти звуковые характеристики могут содержать сведения о кратковременных событиях. Эти способы могут включать этапы определения величины декорреляции для аудиоданных, по меньшей мере, частично на основе звуковых характеристик и обработки этих аудиоданных в соответствии с определяемой величиной декорреляции.

[0019] В некоторых случаях, явные сведения о кратковременных событиях могут не быть приняты вместе с аудиоданными. В некоторых реализациях процесс определения сведений о кратковременных событиях может включать обнаружение мягкого кратковременного события.

[0020] Процесс определения сведений о кратковременных событиях может включать оценивание правдоподобия и/или жесткости кратковременного события. Процесс определения сведений о кратковременных событиях может включать оценивание временного изменения мощности в аудиоданных.

[0021] Процесс определения звуковых характеристик может включать прием вместе с аудиоданными явных сведений о кратковременных событиях. Эти явные сведения о кратковременных событиях могут содержать по меньшей мере одно из следующего: контрольное значение кратковременного события, соответствующее четко выраженному кратковременному событию, контрольное значение кратковременного события, соответствующее четко выраженному некратковременному событию, или промежуточное контрольное значение кратковременного события. Явные сведения о кратковременных событиях могут содержать промежуточное контрольное значение кратковременного события или контрольное значение кратковременного события, соответствующее четко выраженному кратковременному событию. Это контрольное значение кратковременного события может быть подвергнуто действию функции экспоненциального затухания.

[0022] Явные сведения о кратковременных событиях могут указывать четко выраженное кратковременное событие. Обработка аудиоданных может включать временный останов или замедление процесса декорреляции. Явные сведения о кратковременных событиях могут содержать контрольное значение кратковременного события, соответствующее четко выраженному некратковременному событию, или промежуточному значению кратковременного события. Процесс определения сведений о кратковременных событиях может включать обнаружение мягкого кратковременного события. Процесс обнаружения мягкого кратковременного события может включать оценивание по меньшей мере одного из следующего: правдоподобия или жесткости кратковременного события.

[0023] Определяемые сведения о кратковременных событиях могут представлять собой определяемое контрольное значение кратковременного события, соответствующее мягкому кратковременному событию. Способ может включать этап объединения определяемого контрольного значения кратковременного события с принимаемым контрольным значением кратковременного события для получения нового контрольного значения кратковременного события. Процесс объединения определяемого контрольного значения кратковременного события и принимаемого контрольного значения кратковременного события может включать определение максимального значения среди определяемого контрольного значения кратковременного события и принимаемого контрольного значения кратковременного события.

[0024] Процесс обнаружения мягкого кратковременного события может включать обнаружение временного изменения мощности аудиоданных. Обнаружение этого временного изменения мощности может включать определение изменения среднего логарифмической мощности. Это среднее логарифмической мощности может представлять собой взвешенное по полосам частот среднее логарифмической мощности. Определение изменения в среднем логарифмической мощности может включать определение временной асимметричной разности мощностей. Эта асимметричная разность мощностей может выделять повышение мощности и приуменьшать понижение мощности. Способ может включать этап определения на основе асимметричной разности мощностей необработанной меры кратковременного события. Определение этой необработанной меры кратковременного события может включать вычисление функции правдоподобия кратковременных событий на основе предположения о том, что временная асимметричная разность мощностей является распределенной в соответствии с гауссовым распределением. Способ может включать этап определения контрольного значения кратковременного события на основе необработанной меры кратковременного события. Способ может включать этап применения функции экспоненциального затухания к контрольному значению кратковременного события.

[0025] Некоторые способы могут включать этапы применения декорреляционного фильтра к части аудиоданных для выработки фильтрованных аудиоданных и микширования этих фильтрованных аудиоданных с частью принятых аудиоданных в соответствии с отношением микширования. Процесс определения величины декорреляции может включать модификацию отношения микширования, по меньшей мере, частично на основе контрольного значения кратковременного события.

[0026] Некоторые способы могут включать этап применения декорреляционного фильтра к части аудиоданных для выработки фильтрованных аудиоданных. Определение величины декорреляции для аудиоданных может включать ослабление ввода в декорреляционный фильтр на основе сведений о кратковременных событиях. Процесс определения величины декорреляции для аудиоданных может включать уменьшение величины декорреляции в ответ на обнаружение мягкого кратковременного события.

[0027] Обработка аудиоданных может включать применение декорреляционного фильтра к части аудиоданных для выработки фильтрованных аудиоданных и микширование этих фильтрованных аудиоданных с частью принятых аудиоданных в соответствии с отношением микширования. Процесс уменьшения величины декорреляции может включать модификацию отношения микширования.

[0028] Обработка аудиоданных может включать применение декорреляционного фильтра к части аудиоданных для выработки фильтрованных аудиоданных, оценивание коэффициента усиления, подлежащего применению к этим фильтрованным аудиоданным, применение этого коэффициента усиления к фильтрованным аудиоданным и микширование этих фильтрованных аудиоданных с частью принятых аудиоданных.

[0029] Процесс оценивания может включать приведение мощности фильтрованных аудиоданных в соответствие с мощностью принятых аудиоданных. В некоторых реализациях процессы оценивания и применения коэффициента усиления можно выполнять посредством набора дакеров. Набор дакеров может содержать буферы. К фильтрованным аудиоданным может применяться фиксированная задержка, и такая же задержка может применяться к буферам.

[0030] По меньшей мере, одно из следующего: окно сглаживания оценки мощности для дакеров или коэффициент усиления, подлежащий применению к фильтрованным аудиоданным, – может, по меньшей мере, частично основываться на определяемых сведениях о кратковременных событиях. В некоторых реализациях, если кратковременное событие является относительно более правдоподобным, или обнаружено относительно более сильное кратковременное событие, может применяться более короткое окно сглаживания, и более длинное окно сглаживания может применяться, если кратковременное событие является относительно менее правдоподобным, или обнаружено относительно более слабое кратковременное событие, или кратковременное событие не обнаружено.

[0031] Некоторые способы могут включать этапы применения декорреляционного фильтра к части аудиоданных для выработки фильтрованных аудиоданных, оценивания коэффициента усиления дакера, подлежащего применению к этим фильтрованным аудиоданным, применения этого коэффициента усиления дакера к фильтрованным аудиоданным и микширования этих фильтрованных аудиоданных с частью принятых аудиоданных в соответствии с отношением микширования. Процесс определения величины декорреляции может включать модификацию отношения микширования на основе по меньшей мере одного из следующего: сведений о кратковременных событиях или коэффициента усиления дакера.

[0032] Процесс определения звуковых характеристик может включать определение одного из следующего: канала, являющегося каналом с коммутацией блоков, канала, являющегося каналом вне связывания, или отсутствия использования связывания каналов. Определение величины декорреляции для аудиоданных может включать определение того, что процесс декорреляции следует замедлить или временно остановить.

[0033] Обработка аудиоданных может включать процесс размывания в декорреляционном фильтре. Способ может включать этап определения, по меньшей мере, частично на основе сведений о кратковременных событиях, того, что процесс размывания в декорреляционном фильтре следует модифицировать или временно остановить. В соответствии с некоторыми способами, можно определить, что процесс размывания в декорреляционном фильтре будет модифицирован путем изменения значения максимального шага для полюсов размывания в декорреляционном фильтре.

[0034] В соответствии с некоторыми реализациями, устройство может содержать интерфейс и логическую систему. Эта логическая система может быть сконфигурирована для приема из интерфейса аудиоданных, соответствующих ряду звуковых каналов, и определения звуковых характеристик этих аудиоданных. Эти звуковые характеристики могут содержать сведения о кратковременных событиях. Логическая система может быть сконфигурирована для определения величины декорреляции для аудиоданных, по меньшей мере, частично на основе звуковых характеристик и для обработки аудиоданных в соответствии с определяемой величиной декорреляции.

[0035] В некоторых реализациях явные сведения о кратковременных событиях могут не быть приняты вместе с аудиоданными. Процесс определения сведений о кратковременных событиях может включать обнаружение мягкого кратковременного события. Процесс определения сведений о кратковременных событиях может включать оценивание по меньшей мере одного из следующего: правдоподобия или жесткости кратковременного события. Процесс определения сведений о кратковременных событиях может включать оценивание временного изменения мощности в аудиоданных.

[0036] В некоторых реализациях определение звуковых характеристик может включать прием вместе с аудиоданными явных сведений о кратковременных событиях. Эти явные сведения о кратковременных событиях могут указывать по меньшей мере одно из следующего: контрольное значение кратковременного события, соответствующее четко выраженному кратковременному событию, контрольное значение кратковременного события, соответствующее четко выраженному некратковременному событию, или промежуточное контрольное значение кратковременного события. Явные сведения о кратковременных событиях могут содержать промежуточное контрольное значение кратковременного события или контрольное значение кратковременного события, соответствующее четко выраженному кратковременному событию. Это контрольное значение кратковременного события может быть подвергнуто действию функции экспоненциального затухания.

[0037] Если явные сведения о кратковременных событиях указывают четко выраженное кратковременное событие, то обработка аудиоданных может включать временное замедление или останов процесса декорреляции. Если явные сведения о кратковременных событиях содержат контрольное значение кратковременного события, соответствующее выраженному некратковременному событию, или промежуточное значение кратковременного события, то процесс определения сведений о кратковременных событиях может включать обнаружение мягкого кратковременного события. Определяемые сведения о кратковременных событиях могут представлять собой определяемое контрольное значение кратковременного события, соответствующее мягкому кратковременному событию.

[0038] Логическая система может быть также сконфигурирована для объединения определяемого контрольного значения кратковременного события с принимаемым контрольным значением кратковременного события для получения нового контрольного значения кратковременного события. В некоторых реализациях процесс объединения определяемого контрольного значения кратковременного события и принимаемого контрольного значения кратковременного события может включать определение максимального значения среди определяемого контрольного значения кратковременного события и принимаемого контрольного значения кратковременного события.

[0039] Процесс обнаружения мягкого кратковременного события может включать оценивание по меньшей мере одного из следующего: правдоподобия или жесткости кратковременного события. Процесс обнаружения мягкого кратковременного события может включать обнаружение временного изменения мощности аудиоданных.

[0040] В некоторых реализациях логическая система может быть также сконфигурирована для применения декорреляционного фильтра к части аудиоданных для выработки фильтрованных аудиоданных и микширования этих фильтрованных аудиоданных с частью принятых аудиоданных в соответствии с отношением микширования. Процесс определения величины декорреляции может включать модификацию отношения микширования, по меньшей мере, частично на основе сведений о кратковременных событиях.

[0041] Процесс определения величины декорреляции для аудиоданных может включать уменьшение величины декорреляции в ответ на обнаружение мягкого кратковременного события. Обработка аудиоданных может включать применение декорреляционного фильтра к части аудиоданных для выработки фильтрованных аудиоданных и микширование этих фильтрованных аудиоданных с частью принятых аудиоданных в соответствии с отношением микширования. Процесс уменьшения величины декорреляции может включать модификацию отношения микширования.

[0042] Обработка аудиоданных может включать применение декорреляционного фильтра к части аудиоданных для выработки фильтрованных аудиоданных, оценивание коэффициента усиления, подлежащего применению к этим фильтрованным аудиоданным, применение этого коэффициента усиления к фильтрованным аудиоданным и микширование этих фильтрованных аудиоданных с частью принятых аудиоданных. Процесс оценивания может включать приведение мощности фильтрованных аудиоданных в соответствие с мощностью принятых аудиоданных. Логическая система может содержать набор дакеров, сконфигурированных для выполнения процессов оценивания и применения коэффициента усиления.

[0043] Некоторые особенности данного раскрытия могут быть реализованы на постоянном носителе данных, содержащем хранящееся на нем программное обеспечение. Это программное обеспечение может содержать команды для управления устройством с целью приема аудиоданных, соответствующих ряду звуковых каналов, и для определения звуковых характеристик этих аудиоданных. В некоторых реализациях эти звуковые характеристики могут содержать сведения о кратковременных событиях. Программное обеспечение может содержать команды для управления устройством с целью определения величины декорреляции для аудиоданных, по меньшей мере, частично на основе звуковых характеристик и для обработки аудиоданных в соответствии с определяемой величиной декорреляции.

[0044] В некоторых случаях, явные сведения о кратковременных событиях могут не быть приняты вместе с аудиоданными. Процесс определения сведений о кратковременных событиях может включать обнаружение мягкого кратковременного события. Процесс определения сведений о кратковременных событиях может включать оценивание по меньшей мере одного из следующего: правдоподобия или жесткости кратковременного события. Процесс определения сведений о кратковременных событиях может включать оценивание временного изменения мощности в аудиоданных.

[0045] Однако в некоторых реализациях определение звуковых характеристик может включать прием вместе с аудиоданными явных сведений о кратковременных событиях. Эти явные сведения о кратковременных событиях могут содержать промежуточное контрольное значение кратковременного события, соответствующее четко выраженному кратковременному событию, контрольное значение кратковременного события, соответствующее четко выраженному некратковременному событию, или промежуточное контрольное значение кратковременного события. Если явные сведения о кратковременных событиях указывают четко выраженное кратковременное событие, то обработка аудиоданных может включать временный останов или замедление процесса декорреляции.

[0046] Если явные сведения о кратковременных событиях содержат контрольное значение кратковременного события, соответствующее выраженному некратковременному событию, или промежуточное значение кратковременного события, то процесс определения сведений о кратковременных событиях может включать обнаружение мягкого кратковременного события. Определяемые сведения о кратковременных событиях могут представлять собой определяемое контрольное значение кратковременного события, соответствующее мягкому кратковременному событию. Процесс определения сведений о кратковременных событиях может включать объединение определяемого контрольного значения кратковременного события с принимаемым контрольным значением кратковременного события для получения нового контрольного значения кратковременного события. Процесс объединения определяемого контрольного значения кратковременного события и принимаемого контрольного значения кратковременного события может включать определение максимального значения среди определяемого контрольного значения кратковременного события и принимаемого контрольного значения кратковременного события.

[0047] Процесс обнаружения мягкого кратковременного события может включать оценивание по меньшей мере одного из следующего: правдоподобия или жесткости кратковременного события. Процесс обнаружения мягкого кратковременного события может включать обнаружение временного изменения мощности аудиоданных.

[0048] Программное обеспечение может содержать команды для управления устройством с целью применения декорреляционного фильтра к части аудиоданных для выработки фильтрованных аудиоданных и для микширования этих фильтрованных аудиоданных с частью принятых аудиоданных в соответствии с отношением микширования. Процесс определения величины декорреляции может включать модификацию отношения микширования, по меньшей мере, частично на основе сведений о кратковременных событиях. Процесс определения величины декорреляции для аудиоданных может включать уменьшение величины декорреляции в ответ на обнаружение мягкого кратковременного события.

[0049] Обработка аудиоданных может включать применение декорреляционного фильтра к части аудиоданных для выработки фильтрованных аудиоданных и микширование этих фильтрованных аудиоданных с частью принятых аудиоданных в соответствии с отношением микширования. Процесс уменьшения величины декорреляции может включать модификацию отношения микширования.

[0050] Обработка аудиоданных может включать применение декорреляционного фильтра к части аудиоданных для выработки фильтрованных аудиоданных, оценивание коэффициента усиления, подлежащего применению к этим фильтрованным аудиоданным, применение этого коэффициента усиления к фильтрованным аудиоданным и микширование этих фильтрованных аудиоданных с частью принятых аудиоданных. Процесс оценивания может включать приведение мощности фильтрованных аудиоданных в соответствие с мощностью принятых аудиоданных.

[0051] Некоторые способы могут включать этапы приема аудиоданных, соответствующих ряду звуковых каналов, и определения звуковых характеристик этих аудиоданных. Эти звуковые характеристики могут содержать сведения о кратковременных событиях. Сведения о кратковременных событиях могут содержать промежуточное контрольное значение кратковременного события, указывающее значение кратковременного события между четко выраженным кратковременным событием и четко выраженным некратковременным событием. Такие способы также могут включать этап формирования кадров кодированных аудиоданных, содержащих кодированные сведения о кратковременных событиях.

[0052] Эти кодированные сведения о кратковременных событиях могут содержать один или несколько управляющих флагов. Способ может включать этап связывания, по меньшей мере, части из двух или большего количества каналов аудиоданных в по меньшей мере один канал связывания. Управляющие флаги могут содержать по меньшей мере один из следующих флагов: флаг коммутации блоков канала, флаг канала вне связывания или флаг связывания в использовании. Способ может включать этап определения комбинации одного или нескольких из этих управляющих флагов для формирования кодированных сведений о кратковременных событиях, указывающих по меньшей мере одно из следующего: четко выраженное кратковременное событие, четко выраженное некратковременное событие, правдоподобие кратковременного события или жесткость кратковременного события.

[0053] Процесс определения сведений о кратковременных событиях может включать оценивание по меньшей мере одного из следующего: правдоподобия или жесткости кратковременного события. Кодированные сведения о кратковременных событиях могут указывать по меньшей мере одно из следующего: четко выраженное кратковременное событие, четко выраженное некратковременное событие, правдоподобие кратковременного события или жесткость кратковременного события. Процесс определения сведений о кратковременных событиях может включать оценивание временного изменения мощности в аудиоданных.

[0054] Кодированные сведения о кратковременных событиях могут содержать контрольное значение кратковременного события, соответствующее кратковременному событию. Это контрольное значение кратковременного события может быть подвергнуто действию функции экспоненциального затухания. Сведения о кратковременных событиях могут указывать, что процесс декорреляции следует временно замедлить или остановить.

[0055] Сведения о кратковременных событиях могут указывать, что следует модифицировать отношение микширования процесса декорреляции. Например, сведения о кратковременных событиях могут указывать, что величину декорреляции в процессе декорреляции следует временно уменьшить.

[0056] Некоторые способы могут включать этапы приема аудиоданных, соответствующих ряду звуковых каналов, и определения звуковых характеристик этих аудиоданных. Эти звуковые характеристики могут содержать данные пространственных параметров. Способы могут включать этап определения по меньшей мере двух процессов декорреляционной фильтрации для аудиоданных, по меньшей мере, частично на основе этих звуковых характеристик. Эти процессы декорреляционной фильтрации могут вызывать специфичную когерентность между сигналами декорреляции («IDC») между специфичными для каналов сигналами декорреляции для по меньшей мере одной пары каналов. Процессы декорреляционной фильтрации могут включать применение декорреляционного фильтра, по меньшей мере, к части аудиоданных для выработки фильтрованных аудиоданных. Специфичные для каналов сигналы декорреляции могут быть выработаны путем выполнения операций на этих фильтрованных аудиоданных.

[0057] Способы могут включать этапы применения процессов декорреляционной фильтрации, по меньшей мере, к части аудиоданных для выработки специфичных для каналов сигналов декорреляции, определения параметров микширования, по меньшей мере, частично на основе звуковых характеристик и микширования этих специфичных для каналов сигналов декорреляции с прямой частью аудиоданных в соответствии с этими параметрами микширования. Прямая часть может соответствовать части, к которой применяется декорреляционный фильтр.

[0058] Способ также может включать этап приема сведений в отношении количества выходных каналов. Процесс определения по меньшей мере двух процессов декорреляционной фильтрации для аудиоданных может, по меньшей мере, частично основываться на этом количестве выходных каналов. Процесс приема может включать прием аудиоданных, соответствующих N входных звуковых каналов. Способ может включать этапы определения того, что аудиоданные для N входных звуковых каналов будут подвергнуты понижающему или повышающему микшированию в аудиоданные для K выходных звуковых каналов, и выработки декоррелированных аудиоданных, соответствующих K выходных звуковых каналов.

[0059] Способ может включать этапы понижающего или повышающего микширования аудиоданных для N входных звуковых каналов в аудиоданные для М промежуточных звуковых каналов, выработки декоррелированных аудиоданных для этих М промежуточных звуковых каналов и понижающего или повышающего микширования этих декоррелированных аудиоданных для М промежуточных звуковых каналов в декоррелированные аудиоданные для K выходных звуковых каналов. Определение двух процессов декорреляционной фильтрации для аудиоданных может, по меньшей мере, частично основываться на количестве М промежуточных звуковых каналов. Процессы декорреляционной фильтрации можно определить, по меньшей мере, частично на основе уравнений микширования N-в-K, М-в-K или N-в-K.

[0060] Способ также может включать этап управления межканальной когерентностью («ICC») между рядом пар звуковых каналов. Процесс управления ICC может включать по меньшей мере одно из следующего: прием значения ICC или определение значения ICC, по меньшей мере, частично на основе данных пространственных параметров.

[0061] Процесс управления ICC может включать по меньшей мере одно из следующего: прием набора значений ICC или определение набора значений ICC, по меньшей мере, частично на основе данных пространственных параметров. Способ также может включать этапы определения набора значений IDC, по меньшей мере, частично на основе набора значений ICC и синтеза набора специфичных для каналов сигналов декорреляции, соответствующих этому набору значений IDC, путем выполнения операций на фильтрованных аудиоданных.

[0062] Способ также может включать этап обработки преобразования между первым представлением данных пространственных параметров и вторым представлением данных пространственных параметров. Первое представление данных пространственных параметров может содержать представление когерентности между отдельными обособленными каналами и каналом связывания. Второе представление данных пространственных параметров может содержать представление когерентности между отдельными обособленными каналами.

[0063] Процесс применения процессов декорреляционной фильтрации, по меньшей мере, к части аудиоданных может включать применение одного и того же декорреляционного фильтра к аудиоданным для ряда каналов с целью выработки фильтрованных аудиоданных и умножение фильтрованных аудиоданных, соответствующих левому каналу или правому каналу, на –1. Способ также может включать этапы обращения полярности фильтрованных аудиоданных, соответствующих левому окружающему каналу, относительно фильтрованных аудиоданных, соответствующих левому каналу, и обращения полярности фильтрованных аудиоданных, соответствующих правому окружающему каналу, относительно фильтрованных аудиоданных, соответствующих правому каналу.

[0064] Процесс применения процессов декорреляционной фильтрации, по меньшей мере, к части аудиоданных может включать применение первого декорреляционного фильтра к аудиоданным для первого и второго каналов с целью выработки фильтрованных данных первого канала и фильтрованных данных второго канала и применения второго декорреляционного фильтра к аудиоданным для третьего и четвертого каналов с целью выработки фильтрованных данных третьего канала и фильтрованных данных четвертого канала. Первый канал может представлять собой левый канал, второй канал может представлять собой правый канал, третий канал может представлять собой левый окружающий канал, и четвертый канал может представлять собой правый окружающий канал. Способ также может включать этапы обращения полярности фильтрованных данных первого канала относительно фильтрованных данных второго канала и обращения полярности фильтрованных данных третьего канала относительно фильтрованных данных четвертого канала. Процессы определения по меньшей мере двух процессов декорреляционной фильтрации для аудиоданных могут включать либо определение того, что к аудиоданным для центрального канала будет применен другой декорреляционный фильтр, либо определение того, что декорреляционный фильтр не будет применяться к аудиоданным для центрального канала.

[0065] Способ также может включать этап приема специфичных для каналов масштабных коэффициентов и сигнала канала связывания, соответствующего ряду связанных каналов. Процесс применения может включать применение по меньшей мере одного из процессов декорреляционной фильтрации к каналу связывания для генерирования специфичных для каналов фильтрованных аудиоданных и применение специфичных для каналов масштабных коэффициентов к этим специфичным для каналов фильтрованным аудиоданным для выработки специфичных для каналов сигналов декорреляции.

[0066] Способ также может включать этап определения параметров синтеза сигналов декорреляции, по меньшей мере, частично на основе данных пространственных параметров. Параметры синтеза сигналов декорреляции могут представлять собой параметры синтеза специфичных для выходных каналов сигналов декорреляции. Способ также может включать этап приема сигнала канала связывания, соответствующего ряду связанных каналов, и специфичных для каналов масштабных коэффициентов. По меньшей мере, один из процессов определения по меньшей мере двух процессов декорреляционной фильтрации для аудиоданных и применения этих процессов декорреляционной фильтрации к части аудиоданных может включать генерирование набора затравочных сигналов декорреляции путем применения набора декорреляционных фильтров к сигналу канала связывания, отправку этих затравочных сигналов декорреляции в синтезатор, применение параметров синтеза специфичных для выходных каналов сигналов декорреляции к затравочным сигналам декорреляции, принятым синтезатором, для выработки специфичных для каналов синтезированных сигналов декорреляции, умножение этих специфичных для каналов синтезированных сигналов декорреляции на специфичные для каналов масштабные коэффициенты, соответствующие каждому из каналов, для выработки масштабированных специфичных для каналов синтезированных сигналов декорреляции и вывод этих масштабированных специфичных для каналов синтезированных сигналов декорреляции в микшер прямых сигналов и сигналов декорреляции.

[0067] Способ также может включать этап приема специфичных для каналов масштабных коэффициентов. По меньшей мере, один из процессов определения по меньшей мере двух процессов декорреляционной фильтрации для аудиоданных и применения этих процессов декорреляционной фильтрации к части аудиоданных может включать: генерирование набора специфичных для каналов затравочных сигналов декорреляции путем применения набора декорреляционных фильтров к аудиоданным; отправку этих специфичных для каналов затравочных сигналов декорреляции в синтезатор; определение набора специфичных для пар каналов параметров регулировки уровня, по меньшей мере, частично на основе специфичных для каналов масштабных коэффициентов; применение параметров синтеза специфичных для выходных каналов сигналов декорреляции и этих специфичных для пар каналов параметров регулировки уровня к специфичным для каналов затравочным сигналам декорреляции, принятым синтезатором, для выработки специфичных для каналов синтезированных сигналов декорреляции; и вывод этих специфичных для каналов синтезированных сигналов декорреляции в микшер прямых сигналов и сигналов декорреляции.

[0068] Определение параметров синтеза специфичных для выходных каналов сигналов декорреляции может включать определение набора значений IDC, по меньшей мере, частично на основе данных пространственных параметров и определение параметров синтеза специфичных для выходных каналов сигналов декорреляции, соответствующих набору значений IDC. Набор значений IDC можно определить, по меньшей мере, частично в соответствии с когерентностью между отдельными обособленными каналами и каналом связывания, и когерентностью между парами отдельных обособленных каналов.

[0069] Процесс микширования может включать использование неиерархического микшера для объединения специфичных для каналов сигналов декорреляции с прямой частью аудиоданных. Определение звуковых характеристик может включать прием вместе с аудиоданными явных сведений о звуковых характеристиках. Определение звуковых характеристик может включать определение сведений о звуковых характеристиках на основе одного или нескольких определяющих признаков аудиоданных. Данные пространственных параметров могут содержать представление когерентности между отдельными обособленными каналами и каналом связывания и/или представление когерентности между парами отдельных обособленных каналов. Звуковые характеристики могут содержать по меньшей мере одно из следующего: сведения о тональности или сведения о кратковременных событиях.

[0070] Определение параметров микширования может, по меньшей мере, частично основываться на данных пространственных параметров. Способ также может включать этап предоставления параметров микширования микшеру прямых сигналов и сигналов декорреляции. Параметры микширования могут представлять собой специфичные для выходных каналов параметры микширования. Способ также может включать этап определения модифицированных специфичных для выходных каналов параметров микширования, по меньшей мере, частично на основе специфичных для выходных каналов параметров микширования и управляющей информации кратковременных событий.

[0071] В соответствии с некоторыми реализациями, устройство может содержать интерфейс и логическую систему, сконфигурированную для приема аудиоданных, соответствующих ряду звуковых каналов, и определения звуковых характеристик этих аудиоданных. Эти звуковые характеристики могут содержать данные пространственных параметров. Логическая система может быть сконфигурирована для определения по меньшей мере двух процессов декорреляционной фильтрации для аудиоданных, по меньшей мере, частично на основе звуковых характеристик. Процессы декорреляционной фильтрации могут вызывать специфичную IDC между специфичными для каналов сигналами декорреляции для по меньшей мере одной пары каналов. Процессы декорреляционной фильтрации могут включать применение декорреляционного фильтра, по меньшей мере, к части аудиоданных для выработки фильтрованных аудиоданных. Специфичные для каналов сигналы декорреляции могут быть выработаны путем выполнения операций на этих фильтрованных аудиоданных.

[0072] Логическая система может быть сконфигурирована для: применения процессов декорреляционной фильтрации, по меньшей мере, к части аудиоданных для выработки специфичных для каналов сигналов декорреляции; определения параметров микширования, по меньшей мере, частично на основе звуковых характеристик; и микширования этих специфичных для каналов сигналов декорреляции с прямой частью аудиоданных в соответствии с этими параметрами микширования. Прямая часть может соответствовать части, к которой применяется декорреляционный фильтр.

[0073] Процесс приема может включать прием сведений в отношении количества выходных каналов. Процесс определения по меньшей мере двух процессов декорреляционной фильтрации для аудиоданных может, по меньшей мере, частично основываться на этом количестве выходных каналов. Например, процесс приема может включать прием аудиоданных, соответствующих N входных звуковых каналов, а логическая система может быть сконфигурирована для: определения того, что аудиоданные для N входных звуковых каналов будут подвергнуты понижающему или повышающему микшированию в аудиоданные для K выходных звуковых каналов, и выработки декоррелированных аудиоданных, соответствующих K выходных звуковых каналов.

[0074] Логическая система может быть также сконфигурирована для: понижающего или повышающего микширования аудиоданных для N входных звуковых каналов в аудиоданные для М промежуточных звуковых каналов; выработки декоррелированных аудиоданных для этих М промежуточных звуковых каналов; и понижающего или повышающего микширования этих декоррелированных аудиоданных для М промежуточных звуковых каналов в декоррелированные аудиоданные для K выходных звуковых каналов.

[0075] Процессы декорреляционной фильтрации можно определить, по меньшей мере, частично на основе уравнений микширования N-в-K. Определение двух процессов декорреляционной фильтрации для аудиоданных может, по меньшей мере, частично основываться на количестве М промежуточных звуковых каналов. Процессы декорреляционной фильтрации можно определить, по меньшей мере, частично на основе уравнений микширования М-в-K или N-в-М.

[0076] Логическая система может быть также сконфигурирована для управления ICC между рядом пар звуковых каналов. Процесс управления ICC может включать по меньшей мере одно из следующего: прием значения ICC или определение значения ICC, по меньшей мере, частично на основе данных пространственных параметров. Логическая система может быть также сконфигурирована для определения набора значений IDC, по меньшей мере, частично на основе набора значений ICC и синтеза набора специфичных для каналов сигналов декорреляции, соответствующих набору значений IDC, путем выполнения операций на фильтрованных аудиоданных.

[0077] Логическая система может быть также сконфигурирована для обработки преобразования между первым представлением данных пространственных параметров и вторым представлением данных пространственных параметров. Первое представление данных пространственных параметров может содержать представление когерентности между отдельными обособленными каналами и каналом связывания. Второе представление данных пространственных параметров может содержать представление когерентности между отдельными обособленными каналами.

[0078] Процесс применения процессов декорреляционной фильтрации, по меньшей мере, к части аудиоданных может включать применение одного и того же декорреляционного фильтра к аудиоданным для ряда каналов с целью выработки фильтрованных аудиоданных и умножение фильтрованных аудиоданных, соответствующих левому каналу или правому каналу, на –1. Логическая система может быть также сконфигурирована для обращения полярности фильтрованных аудиоданных, соответствующих левому окружающему каналу, относительно фильтрованных аудиоданных, соответствующих левому каналу, и обращения полярности фильтрованных аудиоданных, соответствующих правому окружающему каналу, относительно фильтрованных аудиоданных, соответствующих правому каналу.

[0079] Процесс применения процессов декорреляционной фильтрации, по меньшей мере, к части аудиоданных может включать применение первого декорреляционного фильтра к аудиоданным для первого и второго каналов с целью выработки фильтрованных данных первого канала и фильтрованных данных второго канала и применения второго декорреляционного фильтра к аудиоданным для третьего и четвертого каналов с целью выработки фильтрованных данных третьего канала и фильтрованных данных четвертого канала. Первый канал может представлять собой левый канал, второй канал может представлять собой правый канал, третий канал может представлять собой левый окружающий канал, и четвертый канал может представлять собой правый окружающий канал.

[0080] Логическая система может быть также сконфигурирована для обращения полярности фильтрованных данных первого канала относительно фильтрованных данных второго канала и обращения полярности фильтрованных данных третьего канала относительно фильтрованных данных четвертого канала. Процессы определения по меньшей мере двух процессов декорреляционной фильтрации для аудиоданных могут включать либо определение того, что к аудиоданным для центрального канала будет применен другой декорреляционный фильтр, либо определение того, что декорреляционный фильтр не будет применяться к аудиоданным для центрального канала.

[0081] Логическая система может быть также сконфигурирована для приема из интерфейса специфичных для каналов масштабных коэффициентов и сигнала канала связывания, соответствующего ряду связанных каналов. Процесс применения может включать применение по меньшей мере одного из процессов декорреляционной фильтрации к каналу связывания для генерирования специфичных для каналов фильтрованных аудиоданных и применение специфичных для каналов масштабных коэффициентов к этим специфичным для каналов фильтрованным аудиоданным для выработки специфичных для каналов сигналов декорреляции.

[0082] Логическая система может быть также сконфигурирована для определения параметров синтеза сигналов декорреляции, по меньшей мере, частично на основе данных пространственных параметров. Параметры синтеза сигналов декорреляции могут представлять собой параметры синтеза специфичных для выходных каналов сигналов декорреляции. Логическая система может быть также сконфигурирована для приема из интерфейса сигнала канала связывания, соответствующего ряду связанных каналов, и специфичных для каналов масштабных коэффициентов.

[0083] По меньшей мере один из процессов определения по меньшей мере двух процессов декорреляционной фильтрации для аудиоданных и применения этих процессов декорреляционной фильтрации к части аудиоданных может включать: генерирование набора затравочных сигналов декорреляции путем применения набора декорреляционных фильтров к сигналу канала связывания; отправку этих затравочных сигналов декорреляции в синтезатор; применение параметров синтеза специфичных для выходных каналов сигналов декорреляции к затравочным сигналам декорреляции, принятым синтезатором, для выработки специфичных для каналов синтезированных сигналов декорреляции; умножение этих специфичных для каналов синтезированных сигналов декорреляции на специфичные для каналов масштабные коэффициенты, соответствующие каждому из каналов, для выработки масштабированных специфичных для каналов синтезированных сигналов декорреляции; и вывод этих масштабированных специфичных для каналов синтезированных сигналов декорреляции в микшер прямых сигналов и сигналов декорреляции.

[0084] По меньшей мере, один из процессов определения по меньшей мере двух процессов декорреляционной фильтрации для аудиоданных и применения этих процессов декорреляционной фильтрации к части аудиоданных может включать: генерирование набора специфичных для каналов затравочных сигналов декорреляции путем применения набора декорреляционных фильтров к аудиоданным; отправку этих специфичных для каналов затравочных сигналов декорреляции в синтезатор; определение набора специфичных для пар каналов параметров регулировки уровня, по меньшей мере, частично на основе специфичных для каналов масштабных коэффициентов; применение параметров синтеза специфичных для выходных каналов сигналов декорреляции и этих специфичных для пар каналов параметров регулировки уровня к специфичным для каналов затравочным сигналам декорреляции, принятым синтезатором, для выработки специфичных для каналов синтезированных сигналов декорреляции; и вывод этих специфичных для каналов синтезированных сигналов декорреляции в микшер прямых сигналов и сигналов декорреляции.

[0085] Определение параметров синтеза специфичных для выходных каналов сигналов декорреляции может включать определение набора значений IDC, по меньшей мере, частично на основе данных пространственных параметров и определение параметров синтеза специфичных для выходных каналов сигналов декорреляции, соответствующих набору значений IDC. Набор значений IDC можно определить, по меньшей мере, частично в соответствии с когерентностью между отдельными обособленными каналами и каналом связывания, и когерентностью между парами отдельных обособленных каналов.

[0086] Процесс микширования может включать использование неиерархического микшера для объединения специфичных для каналов сигналов декорреляции с прямой частью аудиоданных. Определение звуковых характеристик может включать прием вместе с аудиоданными явных сведений о звуковых характеристиках. Определение звуковых характеристик может включать определение сведений о звуковых характеристиках на основе одного или нескольких определяющих признаков аудиоданных. Звуковые характеристики могут содержать сведения о тональности и/или сведения о кратковременных событиях.

[0087] Данные пространственных параметров могут содержать представление когерентности между отдельными обособленными каналами и каналом связывания и/или представление когерентности между парами отдельных обособленных каналов. Определение параметров микширования может, по меньшей мере, частично основываться на данных пространственных параметров.

[0088] Логическая система может быть также сконфигурирована для предоставления параметров микширования микшеру прямых сигналов и сигналов декорреляции. Параметры микширования могут представлять собой специфичные для выходных каналов параметры микширования. Логическая система может быть также сконфигурирована для определения модифицированных специфичных для выходных каналов параметров микширования, по меньшей мере, частично на основе специфичных для выходных каналов параметров микширования и управляющей информации кратковременных событий.

[0089] Устройство может содержать запоминающее устройство. Интерфейс может представлять собой интерфейс между логической системой и этим запоминающим устройством. Однако интерфейс может представлять собой и сетевой интерфейс.

[0090] Некоторые особенности данного раскрытия могут быть реализованы на постоянном носителе данных, содержащем хранящееся на нем программное обеспечение. Это программное обеспечение может содержать команды для управления устройством с целью приема аудиоданных, соответствующих ряду звуковых каналов, и для определения звуковых характеристик этих аудиоданных. Эти звуковые характеристики могут содержать данные пространственных параметров. Программное обеспечение может содержать команды для управления устройством с целью определения по меньшей мере двух процессов декорреляционной фильтрации для аудиоданных, по меньшей мере, частично на основе этих звуковых характеристик. Процессы декорреляционной фильтрации могут вызывать специфичную IDC между специфичными для каналов сигналами декорреляции для по меньшей мере одной пары каналов. Процессы декорреляционной фильтрации могут включать применение декорреляционного фильтра, по меньшей мере, к части аудиоданных для выработки фильтрованных аудиоданных. Специфичные для каналов сигналы декорреляции могут быть выработаны путем выполнения операций на этих фильтрованных аудиоданных.

[0091] Программное обеспечение может содержать команды для управления устройством с целью применения процессов декорреляционной фильтрации, по меньшей мере, к части аудиоданных для выработки специфичных для каналов сигналов декорреляции; определения параметров микширования, по меньшей мере, частично на основе звуковых характеристик; и микширования этих специфичных для каналов сигналов декорреляции с прямой частью аудиоданных в соответствии с этими параметрами микширования. Прямая часть может соответствовать части, к которой применяется декорреляционный фильтр.

[0092] Программное обеспечение может содержать команды для управления устройством с целью приема сведений в отношении количества выходных каналов. Процесс определения по меньшей мере двух процессов декорреляционной фильтрации для аудиоданных может, по меньшей мере, частично основываться на этом количестве выходных каналов. Например, процесс приема может включать прием аудиоданных, соответствующих N входных звуковых каналов. Программное обеспечение может содержать команды для управления устройством с целью определения того, что аудиоданные для N входных звуковых каналов будут подвергнуты понижающему или повышающему микшированию в аудиоданные для K выходных звуковых каналов, и выработки декоррелированных аудиоданных, соответствующих K выходных звуковых каналов.

[0093] Программное обеспечение может содержать команды для управления устройством с целью: понижающего или повышающего микширования аудиоданных для N входных звуковых каналов в аудиоданные для М промежуточных звуковых каналов; выработки декоррелированных аудиоданных для этих М промежуточных звуковых каналов; и понижающего или повышающего микширования этих декоррелированных аудиоданных для М промежуточных звуковых каналов в декоррелированные аудиоданные для K выходных звуковых каналов.

[0094] Определение двух процессов декорреляционной фильтрации для аудиоданных может, по меньшей мере, частично основываться на количестве М промежуточных звуковых каналов. Процессы декорреляционной фильтрации можно определить, по меньшей мере, частично на основе уравнений микширования N-в-K, М-в-K или N-в-М.

[0095] Программное обеспечение может содержать команды для управления устройством с целью выполнения процесса управления ICC между рядом пар звуковых каналов. Процесс управления ICC может включать по меньшей мере одно из следующего: прием значения ICC или определение значения ICC, по меньшей мере, частично на основе данных пространственных параметров. Процесс управления ICC может включать по меньшей мере одно из следующего: прием набора значений ICC или определение набора значений ICC, по меньшей мере, частично на основе данных пространственных параметров. Программное обеспечение может содержать команды для управления устройством с целью выполнения процессов определения набора значений IDC, по меньшей мере, частично на основе набора значений ICC и синтеза набора специфичных для каналов сигналов декорреляции, соответствующих набору значений IDC, путем выполнения операций на фильтрованных аудиоданных.

[0096] Процесс применения процессов декорреляционной фильтрации, по меньшей мере, к части аудиоданных может включать применение одного и того же декорреляционного фильтра к аудиоданным для ряда каналов с целью выработки фильтрованных аудиоданных и умножение фильтрованных аудиоданных, соответствующих левому каналу или правому каналу, на –1. Программное обеспечение может содержать команды для управления устройством с целью выполнения процессов обращения полярности фильтрованных аудиоданных, соответствующих левому окружающему каналу, относительно фильтрованных аудиоданных, соответствующих левому каналу, и обращения полярности фильтрованных аудиоданных, соответствующих правому окружающему каналу, относительно фильтрованных аудиоданных, соответствующих правому каналу.

[0097] Процесс применения процессов декорреляционной фильтрации, по меньшей мере, к части аудиоданных может включать применение первого декорреляционного фильтра к аудиоданным для первого и второго каналов с целью выработки фильтрованных данных первого канала и фильтрованных данных второго канала и применения второго декорреляционного фильтра к аудиоданным для третьего и четвертого каналов с целью выработки фильтрованных данных третьего канала и фильтрованных данных четвертого канала. Первый канал может представлять собой левый канал, второй канал может представлять собой правый канал, третий канал может представлять собой левый окружающий канал, и четвертый канал может представлять собой правый окружающий канал.

[0098] Программное обеспечение может содержать команды для управления устройством с целью выполнения процессов обращения полярности фильтрованных данных первого канала относительно фильтрованных данных второго канала и обращения полярности фильтрованных данных третьего канала относительно фильтрованных данных четвертого канала. Процессы определения по меньшей мере двух процессов декорреляционной фильтрации для аудиоданных могут включать либо определение того, что к аудиоданным для центрального канала будет применен другой декорреляционный фильтр, либо определение того, что декорреляционный фильтр не будет применяться к аудиоданным для центрального канала.

[0099] Программное обеспечение может содержать команды для управления устройством с целью приема специфичных для каналов масштабных коэффициентов и сигнала канала связывания, соответствующего ряду связанных каналов. Процесс применения может включать применение по меньшей мере одного из процессов декорреляционной фильтрации к каналу связывания для генерирования специфичных для каналов фильтрованных аудиоданных и применение специфичных для каналов масштабных коэффициентов к этим специфичным для каналов фильтрованным аудиоданным для выработки специфичных для каналов сигналов декорреляции.

[00100] Программное обеспечение может содержать команды для управления устройством с целью определения параметров синтеза сигналов декорреляции, по меньшей мере, частично на основе данных пространственных параметров. Параметры синтеза сигналов декорреляции могут представлять собой параметры синтеза специфичных для выходных каналов сигналов декорреляции. Программное обеспечение может содержать команды для управления устройством с целью приема сигнала канала связывания, соответствующего ряду связанных каналов и специфичных для каналов масштабных коэффициентов. По меньшей мере один из процессов определения по меньшей мере двух процессов декорреляционной фильтрации для аудиоданных и применения этих процессов декорреляционной фильтрации к части аудиоданных может включать: генерирование набора затравочных сигналов декорреляции путем применения набора декорреляционных фильтров к сигналу канала связывания; отправку этих затравочных сигналов декорреляции в синтезатор; применение параметров синтеза специфичных для выходных каналов сигналов декорреляции к затравочным сигналам декорреляции, принятым синтезатором, для выработки специфичных для каналов синтезированных сигналов декорреляции; умножение этих специфичных для каналов синтезированных сигналов декорреляции на специфичные для каналов масштабные коэффициенты, соответствующие каждому из каналов, для выработки масштабированных специфичных для каналов синтезированных сигналов декорреляции; и вывод этих масштабированных специфичных для каналов синтезированных сигналов декорреляции в микшер прямых сигналов и сигналов декорреляции.

[00101] Программное обеспечение может содержать команды для управления устройством с целью приема сигнала канала связывания, соответствующего ряду связанных каналов и специфичных для каналов масштабных коэффициентов. По меньшей мере, один из процессов определения по меньшей мере двух процессов декорреляционной фильтрации для аудиоданных и применения этих процессов декорреляционной фильтрации к части аудиоданных может включать: генерирование набора специфичных для каналов затравочных сигналов декорреляции путем применения набора декорреляционных фильтров к аудиоданным; отправку этих специфичных для каналов затравочных сигналов декорреляции в синтезатор; определение набора специфичных для пар каналов параметров регулировки уровня, по меньшей мере, частично на основе специфичных для каналов масштабных коэффициентов; применение параметров синтеза специфичных для выходных каналов сигналов декорреляции и этих специфичных для пар каналов параметров регулировки уровня к специфичным для каналов затравочным сигналам декорреляции, принятым синтезатором, для выработки специфичных для каналов синтезированных сигналов декорреляции; и вывод этих специфичных для каналов синтезированных сигналов декорреляции в микшер прямых сигналов и сигналов декорреляции.

[00102] Определение параметров синтеза специфичных для выходных каналов сигналов декорреляции может включать определение набора значений IDC, по меньшей мере, частично на основе данных пространственных параметров и определение параметров синтеза специфичных для выходных каналов сигналов декорреляции, соответствующих набору значений IDC. Набор значений IDC можно определить, по меньшей мере, частично в соответствии с когерентностью между отдельными обособленными каналами и каналом связывания, и когерентностью между парами отдельных обособленных каналов.

[00103] В некоторых реализациях способ может включать этапы: приема аудиоданных, содержащих первый набор частотных коэффициентов и второй набор частотных коэффициентов; оценивания, по меньшей мере, частично на основе этого первого набора частотных коэффициентов, пространственных параметров для, по меньшей мере, части второго набора частотных коэффициентов; и применения этих оценочных пространственных параметров к второму набору частотных коэффициентов для генерирования модифицированного второго набора частотных коэффициентов. Первый набор частотных коэффициентов может соответствовать первому диапазону частот, а второй набор частотных коэффициентов может соответствовать второму диапазону частот. Первый диапазон частот может находиться ниже второго диапазона частот.

[00104] Аудиоданные могут содержать данные, соответствующие отдельным каналам и связанному каналу. Первый диапазон частот может соответствовать диапазону частот отдельных каналов, а второй диапазон частот может соответствовать диапазону частот связанных каналов. Процесс применения может включать применение оценочных пространственных параметров на поканальной основе.

[00105] Аудиоданные могут содержать частотные коэффициенты в первом диапазоне частот для двух или большего количества каналов. Процесс оценивания может включать вычисление комбинированных частотных коэффициентов составного канала связывания на основе частотных коэффициентов двух или большего количества каналов и вычисление для по меньшей мере первого канала коэффициентов взаимной корреляции между частотными коэффициентами первого канала и комбинированными частотными коэффициентами. Эти комбинированные частотные коэффициенты могут соответствовать первому диапазону частот.

[00106] Коэффициенты взаимной корреляции могут представлять собой нормированные коэффициенты взаимной корреляции. Первый набор частотных коэффициентов может содержать аудиоданные для ряда каналов. Процесс оценивания может включать оценивание нормированных коэффициентов взаимной корреляции для нескольких каналов из ряда каналов. Процесс оценивания может включать разделение, по меньшей мере, части первого диапазона частот на полосы первого диапазона частот и вычисление нормированного коэффициента взаимной корреляции для каждой полосы первого диапазона частот.

[00107] В некоторых реализациях процесс оценивания может включать усреднение нормированных коэффициентов взаимной корреляции по всем полосам первого диапазона частот канала и применение масштабного коэффициента к среднему нормированных коэффициентов взаимной корреляции для получения оценочных пространственных параметров для этого канала. Процесс усреднения нормированных коэффициентов взаимной корреляции может включать усреднение по временному отрезку канала. Масштабный коэффициент может уменьшаться при повышении частоты.

[00108] Способ может включать этап внесения шума для моделирования дисперсии оценочных пространственных параметров. Эта дисперсия вносимого шума может, по меньшей мере, частично основываться на дисперсии в нормированных коэффициентах взаимной корреляции. Дисперсия вносимого шума может, по меньшей мере, частично зависеть от предсказания пространственных параметров по полосам, причем эта зависимость дисперсии от предсказания основывается на опытных данных.

[00109] Способ может включать этап приема или определения сведений о тональности, касающихся второго набора частотных коэффициентов. Вносимый шум может изменяться в соответствии с этими сведениями о тональности.

[00110] Способ может включать этап измерения отношений энергий, приходящихся на полосу, между полосами из первого набора частотных коэффициентов и полосами из второго набора частотных коэффициентов. Оценочные пространственные параметры могут изменяться в соответствии с этими отношениями энергий, приходящихся на полосу. В некоторых реализациях оценочные пространственные параметры могут изменяться в соответствии с временными изменениями входных звуковых сигналов. Процесс оценивания может включать операции только на вещественнозначных частотных коэффициентах.

[00111] Процесс применения оценочных пространственных параметров ко второму набору частотных коэффициентов может составлять часть процесса декорреляции. В некоторых реализациях процесс декорреляции может включать генерирование сигнала реверберации, или сигнала декорреляции, и его применение к второму набору частотных коэффициентов. Процесс декорреляции может включать применение алгоритма декорреляции, действующего полностью на вещественнозначных коэффициентах. Процесс декорреляции может включать избирательную, или адаптивную к сигналу, декорреляцию конкретных каналов. Процесс декорреляции может включать избирательную, или адаптивную к сигналу, декорреляцию конкретных полос частот. В некоторых реализациях первый и второй наборы частотных коэффициентов могут представлять собой результаты применения к аудиоданным во временной области модифицированного дискретного синусного преобразования, модифицированного дискретного косинусного преобразования или ортогонального преобразования с перекрытием.

[00112] Процесс оценивания может, по меньшей мере, частично основываться на теории оценивания. Например, процесс оценивания может, по меньшей мере, частично основываться на, по меньшей мере, одном из следующего: метод максимального правдоподобия, байесово правило оценивания, метод оценки минимальной среднеквадратичной ошибки или метод несмещенной оценки наименьшей дисперсии.

[00113] В некоторых реализациях аудиоданные могут быть приняты в битовом потоке, кодированном в соответствии с унаследованным процессом кодирования. Этот унаследованный процесс кодирования может, например, представлять собой процесс аудиокодека АС-3 или аудиокодека Enhanced AC-3. Применение пространственных параметров может приводить к большей пространственной точности воспроизведения звука, чем точность, получаемая путем декодирования битового потока в соответствии с унаследованным процессом декодирования, соответствующим унаследованному процессу кодирования.

[00114] Некоторые реализации включают устройство, содержащее интерфейс и логическую систему. Эта логическая система может быть сконфигурирована для: приема аудиоданных, содержащих первый набор частотных коэффициентов и второй набор частотных коэффициентов; оценивания, по меньшей мере, частично на основе этого первого набора частотных коэффициентов, пространственных параметров для, по меньшей мере, части второго набора частотных коэффициентов; и применения этих оценочных пространственных параметров к второму набору частотных коэффициентов для генерирования модифицированного второго набора частотных коэффициентов.

[00115] Устройство может содержать запоминающее устройство. Интерфейс может представлять собой интерфейс между логической системой и этим запоминающим устройством. Однако интерфейс может представлять собой и сетевой интерфейс.

[00116] Первый набор частотных коэффициентов может соответствовать первому диапазону частот, а второй набор частотных коэффициентов может соответствовать второму диапазону частот. Первый диапазон частот может находиться ниже второго диапазона частот. Аудиоданные могут содержать данные, соответствующие отдельным каналам и связанному каналу. Первый диапазон частот может соответствовать диапазону частот отдельных каналов, а второй диапазон частот может соответствовать диапазону частот связанных каналов.

[00117] Процесс применения может включать применение оценочных пространственных параметров на поканальной основе. Аудиоданные могут содержать частотные коэффициенты в первом диапазоне частот для двух или большего количества каналов. Процесс оценивания может включать вычисление комбинированных частотных коэффициентов составного канала связывания на основе частотных коэффициентов двух или большего количества каналов и вычисление для по меньшей мере первого канала коэффициентов взаимной корреляции между частотными коэффициентами первого канала и комбинированными частотными коэффициентами.

[00118] Эти комбинированные частотные коэффициенты могут соответствовать первому диапазону частот. Коэффициенты взаимной корреляции могут представлять собой нормированные коэффициенты взаимной корреляции. Первый набор частотных коэффициентов может содержать аудиоданные для ряда каналов. Процесс оценивания может включать оценивание нормированных коэффициентов взаимной корреляции для нескольких каналов из ряда каналов.

[00119] Процесс оценивания может включать разделение, по меньшей мере, части второго диапазона частот на полосы второго диапазона частот и вычисление нормированного коэффициента взаимной корреляции для каждой полосы второго диапазона частот. Процесс оценивания может включать усреднение нормированных коэффициентов взаимной корреляции по всем полосам первого диапазона частот канала и применение масштабного коэффициента к среднему нормированных коэффициентов взаимной корреляции для получения оценочных пространственных параметров для этого канала.

[00120] Процесс усреднения нормированных коэффициентов взаимной корреляции может включать усреднение по временному отрезку канала. Логическая система может быть также сконфигурирована для внесения шума в модифицированный второй набор частотных коэффициентов. Это внесение шума может быть внесено для моделирования дисперсии оценочных пространственных параметров. Эта дисперсия шума, вносимого логической системой, может, по меньшей мере, частично основываться на дисперсии в нормированных коэффициентах взаимной корреляции. Логическая система может быть также сконфигурирована для приема или определения сведений о тональности, касающихся второго набора частотных коэффициентов, и изменения вносимого шума в соответствии с сведениями о тональности.

[00121] В некоторых реализациях аудиоданные могут быть приняты в битовом потоке, кодированном в соответствии с унаследованным процессом кодирования. Например, этот унаследованный процесс кодирования может представлять собой процесс аудиокодека АС-3 или аудиокодека Enhanced АС-3.

[00122] Некоторые особенности данного раскрытия могут быть реализованы на постоянном носителе данных, содержащем хранящееся на нем программное обеспечение. Это программное обеспечение может содержать команды для: приема аудиоданных, содержащих первый набор частотных коэффициентов и второй набор частотных коэффициентов; оценивания, по меньшей мере, частично на основе этого первого набора частотных коэффициентов, пространственных параметров для, по меньшей мере, части второго набора частотных коэффициентов; и применения этих оценочных пространственных параметров к второму набору частотных коэффициентов для генерирования модифицированного второго набора частотных коэффициентов.

[00123] Первый набор частотных коэффициентов может соответствовать первому диапазону частот, а второй набор частотных коэффициентов может соответствовать второму диапазону частот. Аудиоданные могут содержать данные, соответствующие отдельным каналам и связанному каналу. Первый диапазон частот может соответствовать диапазону частот отдельных каналов, а второй диапазон частот может соответствовать диапазону частот связанных каналов. Первый диапазон частот может находиться ниже второго диапазона частот.

[00124] Процесс применения может включать применение оценочных пространственных параметров на поканальной основе. Аудиоданные могут содержать частотные коэффициенты в первом диапазоне частот для двух или большего количества каналов. Процесс оценивания может включать вычисление комбинированных частотных коэффициентов составного канала связывания на основе частотных коэффициентов двух или большего количества каналов и вычисление для по меньшей мере первого канала коэффициентов взаимной корреляции между частотными коэффициентами первого канала и комбинированными частотными коэффициентами.

[00125] Эти комбинированные частотные коэффициенты могут соответствовать первому диапазону частот. Коэффициенты взаимной корреляции могут представлять собой нормированные коэффициенты взаимной корреляции. Первый набор частотных коэффициентов может содержать аудиоданные для ряда каналов. Процесс оценивания может включать оценивание нормированных коэффициентов взаимной корреляции для нескольких каналов из ряда каналов. Процесс оценивания может включать разделение, по меньшей мере, части второго диапазона частот на полосы второго диапазона частот и вычисление нормированного коэффициента взаимной корреляции для каждой полосы второго диапазона частот.

[00126] Процесс оценивания может включать: разделение, по меньшей мере, части первого диапазона частот на полосы первого диапазона частот; усреднение нормированных коэффициентов взаимной корреляции по всем полосам первого диапазона частот; и применение масштабного коэффициента к среднему нормированных коэффициентов взаимной корреляции для получения оценочных пространственных параметров. Процесс усреднения нормированных коэффициентов взаимной корреляции может включать усреднение по временному отрезку канала.

[00127] Программное обеспечение также может содержать команды для управления декодирующим устройством с целью: внесения шума в модифицированный второй набор частотных коэффициентов для моделирования дисперсии оценочных пространственных параметров. Эта дисперсия вносимого шума может, по меньшей мере, частично основываться на дисперсии в нормированных коэффициентах взаимной корреляции. Программное обеспечение также может содержать команды для управления декодирующим устройством с целью: приема или определения сведений о тональности, касающихся второго набора частотных коэффициентов. Вносимый шум может изменяться в соответствии с этими сведениями о тональности.

[00128] В некоторых реализациях аудиоданные могут быть приняты в битовом потоке, кодированном в соответствии с унаследованным процессом кодирования. Например, этот унаследованный процесс кодирования может представлять собой процесс аудиокодека АС-3 или аудиокодека Enhanced АС-3.

[00129] В соответствии с некоторыми реализациями, способ может включать этапы: приема аудиоданных, соответствующих ряду звуковых каналов; определения звуковых характеристик этих аудиоданных; определения параметров декорреляционного фильтра для этих аудиоданных, по меньшей мере, частично на основе этих звуковых характеристик; формирования декорреляционного фильтра в соответствии с этими параметрами декорреляционного фильтра; и применения этого декорреляционного фильтра, по меньшей мере, к некоторым из аудиоданных. Например, звуковые характеристики могут содержать сведения о тональности и/или сведения о кратковременных событиях.

[00130] Определение звуковых характеристик может включать прием вместе с аудиоданными явных сведений о тональности или сведений о кратковременных событиях. Определение звуковых характеристик может включать определение сведений о тональности или сведений о кратковременных событиях на основе одного или нескольких определяющих признаков аудиоданных.

[00131] В некоторых реализациях декорреляционный фильтр может содержать линейный фильтр с по меньшей мере одним элементом задержки. Декорреляционный фильтр может содержать фазовый фильтр.

[00132] Параметры декорреляционного фильтра могут содержать параметры размывания, или выбираемые случайным образом местоположения полюсов, для по меньшей мере одного полюса фазового фильтра. Например, параметры размывания, или местоположения полюсов, могут содержать значение максимального шага при движении полюсов. Это значение максимального шага может быть, по существу, нулевым для высокотональных сигналов аудиоданных. Параметры размывания, или местоположения полюсов, могут быть ограничены ограничительными зонами, в пределах которых ограничены передвижения полюсов. В некоторых реализациях эти ограничительные зоны могут представлять собой круги или кольца. В некоторых реализациях эти ограничительные зоны могут быть фиксированными. В некоторых реализациях одни и те же ограничительные зоны могут совместно использоваться разными каналами аудиоданных.

[00133] В соответствии с некоторыми реализациями, полюса могут размываться независимо для каждого канала. В некоторых реализациях движения полюсов могут быть не ограничены ограничительными зонами. В некоторых реализациях полюса могут сохранять, по существу, согласованную пространственную или угловую взаимосвязь друг с другом. В соответствии с некоторыми реализациями, расстояние от полюса до центра круга в z-плоскости может зависеть от частоты аудиоданных.

[00134] В некоторых реализациях устройство может содержать интерфейс и логическую систему. В некоторых реализациях эта логическая система может представлять собой одно- или многокристальный процессор общего назначения, процессор цифровой обработки сигналов (DSP), проблемно-ориентированную интегральную микросхему (ASIC), программируемую вентильную матрицу (FPGA) или другое программируемое логическое устройство, схему на дискретных компонентах или транзисторную логическую схему, или компоненты дискретного аппаратного обеспечения.

[00135] Логическая система может быть сконфигурирована для приема из интерфейса аудиоданных, соответствующих ряду звуковых каналов, и определения звуковых характеристик этих аудиоданных. В некоторых реализациях эти звуковые характеристики могут содержать сведения о тональности и/или сведения о кратковременных событиях. Логическая система может быть сконфигурирована для определения параметров декорреляционного фильтра для аудиоданных, по меньшей мере, частично на основе звуковых характеристик, формирования декорреляционного фильтра в соответствии с параметрами декорреляционного фильтра и применения этого декорреляционного фильтра, по меньшей мере, к некоторым из аудиоданных.

[00136] Декорреляционный фильтр может содержать линейный фильтр с по меньшей мере одним элементом задержки. Параметры декорреляционного фильтра могут содержать параметры размывания, или выбираемые случайным образом местоположения полюсов, для по меньшей мере одного полюса фазового фильтра. Параметры размывания, или местоположения полюсов, могут быть ограничены ограничительными зонами, в пределах которых ограничены передвижения полюсов. Параметры размывания, или местоположения полюсов, можно определить относительно значения максимального шага при движении полюсов. Это значение максимального шага может быть, по существу, нулевым для высокотональных сигналов аудиоданных.

[00137] Устройство может содержать запоминающее устройство. Интерфейс может представлять собой интерфейс между логической системой и этим запоминающим устройством. Однако интерфейс может представлять собой и сетевой интерфейс.

[00138] Некоторые особенности данного раскрытия могут быть реализованы на постоянном носителе данных, содержащем хранящееся на нем программное обеспечение. Это программное обеспечение может содержать команды для управления устройством с целью: приема аудиоданных, соответствующих ряду звуковых каналов; определения звуковых характеристик этих аудиоданных, причем эти звуковые характеристики содержат по меньшей мере одно из следующего: сведения о тональности или сведения о кратковременных событиях; определения параметров декорреляционного фильтра для аудиоданных, по меньшей мере, частично на основе звуковых характеристик; формирования декорреляционного фильтра в соответствии с этими параметрами декорреляционного фильтра; и применения этого декорреляционного фильтра, по меньшей мере, к некоторым из аудиоданных. Декорреляционный фильтр может содержать линейный фильтр с по меньшей мере одним элементом задержки.

[00139] Параметры декорреляционного фильтра могут содержать параметры размывания, или выбираемые случайным образом местоположения полюсов, для по меньшей мере одного полюса фазового фильтра. Параметры размывания, или местоположения полюсов, могут быть ограничены ограничительными зонами, в пределах которых ограничены передвижения полюсов. Параметры размывания, или местоположения полюсов, можно определить относительно значения максимального шага при движении полюсов. Это значение максимального шага может быть, по существу, нулевым для высокотональных сигналов аудиоданных.

[00140] В соответствии с некоторыми реализациями, способ может включать этапы: приема аудиоданных, соответствующих ряду звуковых каналов; определения управляющей информации декорреляционных фильтров, соответствующей максимальному перемещению полюсов декорреляционного фильтра; определения параметров декорреляционного фильтра для аудиоданных, по меньшей мере, частично на основе этой управляющей информации декорреляционных фильтров; формирования этого декорреляционного фильтра в соответствии с этими параметрами декорреляционного фильтра; и применения этого декорреляционного фильтра, по меньшей мере, к некоторым из аудиоданных.

[00141] Аудиоданные могут находиться во временной области или в частотной области. Определение управляющей информации декорреляционных фильтров может включать прием экспресс-указателя максимального перемещения полюсов.

[00142] Определение управляющей информации декорреляционных фильтров может включать определение сведений о звуковых характеристиках и определение максимального перемещения полюсов, по меньшей мере, частично на основе этих сведений о звуковых характеристиках. В некоторых реализациях сведения о звуковых характеристиках могут содержать по меньшей мере одно из следующего: сведения о тональности или сведения о кратковременных событиях.

[00143] Подробности одной или нескольких реализаций предмета изобретения, описываемого в данном описании, изложены в сопроводительных графических материалах и в приведенном ниже описании. Другие характерные признаки, особенности и преимущества будут очевидны из описания, графических материалов и формулы изобретения. Следует отметить, что относительные размеры на нижеследующих фигурах могут не являться вычерченными в масштабе.

КРАТКОЕ ОПИСАНИЕ ГРАФИЧЕСКИХ МАТЕРИАЛОВ

[00144] Фиг. 1А и 1В – графики, показывающие примеры связывания каналов в ходе процесса звукового кодирования.

[00145] Фиг. 2А – блок-схема, иллюстрирующая элементы одной из систем обработки аудиоданных.

[00146] Фиг. 2В – общий вид операций, которые могут выполняться системой обработки аудиоданных по фиг. 2А.

[00147] Фиг. 2С – блок-схема, показывающая элементы одной из альтернативных систем обработки аудиоданных.

[00148] Фиг. 2D – блок-схема, показывающая один из примеров того, как в системе обработки аудиоданных можно использовать декоррелятор.

[00149] Фиг. 2Е – блок-схема, иллюстрирующая элементы одной из альтернативных систем обработки аудиоданных.

[00150] Фиг. 2F – блок-схема, показывающая примеры элементов декоррелятора.

[00151] Фиг. 3 – схема последовательности операций, иллюстрирующая один из примеров процесса декорреляции.

[00152] Фиг. 4 – блок-схема, иллюстрирующая примеры компонентов декоррелятора, которые можно сконфигурировать для выполнения процесса декорреляции по фиг. 3.

[00153] Фиг. 5А – график, показывающий один из примеров движения полюсов фазового фильтра.

[00154] Фиг. 5В и 5С – графики, показывающие альтернативные примеры движения полюсов фазового фильтра.

[00155] Фиг. 5D и 5E – графики, показывающие альтернативные примеры ограничительных зон, которые можно применять при движении полюсов фазового фильтра.

[00156] Фиг. 6А – блок-схема, иллюстрирующая одну из альтернативных реализаций декоррелятора.

[00157] Фиг. 6В – блок-схема, иллюстрирующая другую реализацию декоррелятора.

[00158] Фиг. 6С – блок-схема, иллюстрирующая одну из альтернативных реализаций системы обработки аудиоданных.

[00159] Фиг. 7A и 7B – векторные диаграммы, представляющие упрощенную иллюстрацию пространственных параметров.

[00160] Фиг. 8А – схема последовательности операций, иллюстрирующая блоки некоторых способов декорреляции, представленных в настоящем описании.

[00161] Фиг. 8В – схема последовательности операций, иллюстрирующая блоки способа поперечного зеркального отображения знаков.

[00162] Фиг. 8С и 8D – блок-схемы, иллюстрирующие компоненты, которые можно использовать для реализации некоторых способов зеркального отображения знаков.

[00163] Фиг. 8Е – схема последовательности операций, иллюстрирующая блоки одного из способов определения коэффициентов синтеза и коэффициентов микширования исходя из данных пространственных параметров.

[00164] Фиг. 8F – блок-схема, показывающая примеры компонентов микшера.

[00165] Фиг. 9 – схема последовательности операций, описывающая процесс синтеза сигналов декорреляции в многоканальных случаях.

[00166] Фиг. 10А – схема последовательности операций, представляющая общий вид одного из способов оценивания пространственных параметров.

[00167] Фиг. 10В – схема последовательности операций, представляющая общий вид одного из альтернативных способов оценивания пространственных параметров.

[00168] Фиг. 10С представляет собой график, указывающий взаимосвязь между масштабным членом VB и индексом полосы l.

[00169] Фиг. 10D – график, указывающий взаимосвязь между переменными VM и q.

[00170] Фиг. 11А – схема последовательности операций, описывающая некоторые способы определения кратковременных событий и элементов управления, относящихся к кратковременным событиям.

[00171] Фиг. 11В – блок-схема, содержащая примеры различных компонентов для определения кратковременных событий и элементов управления, относящихся к кратковременным событиям.

[00172] Фиг. 11С – схема последовательности операций, описывающая некоторые способы определения контрольных значений кратковременных событий, по меньшей мере, частично на основе временных изменений мощности аудиоданных.

[00173] Фиг. 11D – график, иллюстрирующий один из примеров отображения необработанных значений кратковременных событий в контрольные значения кратковременных событий.

[00174] Фиг. 11Е – схема последовательности операций, описывающая один из способов кодирования сведений о кратковременных событиях.

[00175] Фиг. 12 – блок-схема, представляющая примеры компонентов одного из устройств, которое можно сконфигурировать для реализации особенностей процессов, описываемых в настоящем описании.

[00176] Подобные ссылочные позиции и обозначения в разных графических материалах указывают подобные элементы.

ОПИСАНИЕ ИЛЛЮСТРАТИВНЫХ ВАРИАНТОВ ОСУЩЕСТВЛЕНИЯ ИЗОБРЕТЕНИЯ

[00177] Нижеследующее описание направлено на некоторые реализации в целях описания некоторых новаторских особенностей данного раскрытия, а также примеров контекстов, в которых могут применяться эти новаторские особенности. Однако описанные идеи данного раскрытия могут применяться и другими различными способами. Несмотря на то, что примеры, представленные в данной заявке, описаны, главным образом, в выражениях аудиокодека АС-3 и аудиокодека Enhanced AC-3 (также известного как E-AC-3), концепции, предусматриваемые настоящим описанием, применимы и к другим аудиокодекам, в том числе, без ограничения, MPEG-2 AAC и MPEG-4 AAC. Более того, описываемые реализации могут быть воплощены в различных устройствах обработки аудиоданных, в том числе, без ограничения, в кодерах и/или декодерах, которые могут быть заключены в мобильных телефонах, смартфонах, настольных компьютерах, переносных или портативных компьютерах, нетбуках, ноутбуках, смартбуках, планшетах, стереосистемах, телевизорах, проигрывателях DVD, цифровых записывающих устройствах и во множестве других устройств. Соответственно, идеи данного раскрытия не подразумеваются как ограниченные реализациями, показанными на фигурах и/или описанными в данном раскрытии, но вместо этого имеют широкую применимость.

[00178] Некоторые аудиокодеки, в том числе аудиокодеки АС-3 и Е-АС-3 (защищенные правами собственности, реализации которых лицензированы как «Dolby Digital» и «Dolby Digital Plus»), используют какую-либо форму связывания каналов для эксплуатации избыточностей между каналами, более эффективного кодирования данных и уменьшения битовой скорости передачи данных при кодировании. Например, в случае кодеков АС-3 и Е-АС-3, в диапазон частот каналов связывания за определенной «частотой начала связывания» коэффициенты модифицированного дискретного косинусного преобразования (MDCT) обособленных каналов (также именуемых в настоящем описании «отдельными каналами») низводятся в монофонический канал, который в настоящем описании может именоваться «составным каналом» или «каналом связывания». Некоторые кодеки могут формировать два или большее количество каналов связывания.

[00179] Декодеры АС-3 и Е-АС-3 подвергают этот монофонический сигнал канала связывания повышающему микшированию в обособленные каналы, используя масштабные коэффициенты на основе координат связывания, пересылаемых в битовом потоке. Таким образом, декодер восстанавливает высокочастотную огибающую, но не фазу аудиоданных в диапазоне частот каналов связывания каждого канала.

[00180] Фиг. 1А и 1В – графики, показывающие примеры связывания каналов в ходе процесса звукового кодирования. График 102 по фиг. 1А указывает звуковой сигнал, соответствующий левому каналу, перед связыванием каналов. График 104 указывает звуковой сигнал, соответствующий правому каналу, перед связыванием каналов. Фиг. 1В показывает левый и правый каналы после кодирования, включающего связывание каналов, и декодирования. В этом упрощенном примере график 106 указывает, что аудиоданные для левого канала являются, по существу, неизменными, в то время как график 108 указывает, что аудиоданные для правого канала теперь находятся в фазе с аудиоданными для левого канала.

[00181] Как показано на фиг. 1А и 1В, декодированный сигнал за частотой начала связывания может быть когерентным между каналами. Соответственно, этот декодированный сигнал за частотой начала связывания может звучать пространственно свернуто по сравнению с первоначальным сигналом. Когда декодированные каналы подвергают понижающему микшированию, например, в бинауральное представление посредством виртуализации наушников или воспроизведения через стереофонические громкоговорители, связанные каналы могут складываться когерентно. Это может приводить к тембральному несоответствию по сравнению с первоначальным опорным сигналом. Эти отрицательные последствия связывания каналов могут быть особенно очевидны, когда декодированный сигнал представляется бинаурально через наушники.

[00182] Различные реализации, описываемые в настоящем описании, могут, по меньшей мере, частично ослаблять эти последствия. Некоторые такие реализации включают новаторские инструментальные средства звукового кодирования и/или декодирования. Такие реализации могут быть сконфигурированы для восстановления разнесения фаз выходных каналов в диапазонах частот, кодированных посредством связывания каналов. В соответствии с различными реализациями, декоррелированный сигнал можно синтезировать из декодированных спектральных коэффициентов в диапазоне частот каналов связывания каждого выходного канала.

[00183] Однако в настоящем описании описано и множество других типов устройств и способов обработки аудиоданных. Фиг. 2А – блок-схема, иллюстрирующая элементы одной из систем обработки аудиоданных. В этой реализации система 200 обработки аудиоданных содержит буфер 201, коммутатор 203, декоррелятор 205 и модуль 255 обратного преобразования. Коммутатор 203 может, например, представлять собой матричный коммутатор. Буфер 201 принимает элементы 220а–220n аудиоданных, направляет элементы 220а–220n аудиоданных в коммутатор 203 и пересылает копии этих элементов 220а–220n аудиоданных в декоррелятор 205.

[00184] В данном примере элементы 220а–220n аудиоданных соответствуют ряду звуковых каналов 1–N. Здесь элементы 220а–220n аудиоданных содержат представления в частотной области, соответствующие коэффициентам набора фильтров системы кодирования или обработки аудиоданных, которая может представлять собой унаследованную систему кодирования или обработки аудиоданных. Однако в альтернативных реализациях эти элементы 220а–220n аудиоданных могут соответствовать ряду полос частот 1–N.

[00185] В этой реализации все эти элементы 220а–220n аудиоданных принимаются как коммутатором 203, так и декоррелятором 205. Здесь все эти элементы 220а–220n аудиоданных обрабатываются декоррелятором 205 для выработки элементов 230а–230n декоррелированных аудиоданных. Более того, все эти элементы 230а–230n декоррелированных аудиоданных принимаются коммутатором 203.

[00186] Однако не все из этих элементов 230а–230n декоррелированных аудиоданных принимаются модулем 255 обратного преобразования и преобразовываются в аудиоданные 260 во временной области. Вместо этого коммутатор 203 выбирает, какие из элементов 230а–230n декоррелированных аудиоданных будут приняты модулем 255 обратного преобразования. В этом примере коммутатор 203 выбирает, в соответствии с каналом, какие из элементов 230а–230n аудиоданных будут приняты модулем 255 обратного преобразования. Здесь, например, элемент 230а аудиоданных принимается модулем 255 обратного преобразования, в то время как элемент 230n аудиоданных – нет. Вместо этого коммутатор 203 отправляет в модуль 255 обратного преобразования элемент 220n аудиоданных, который не был обработан декоррелятором 205.

[00187] В некоторых реализациях коммутатор 203 может определять, пересылать в модуль 255 обратного преобразования элемент 220 прямых аудиоданных или элемент 230 декоррелированных аудиоданных, в соответствии с предварительно определенными установками, соответствующими каналам 1–N. Альтернативно или дополнительно коммутатор 203 может определять, пересылать в модуль 255 обратного преобразования элемент 220 аудиоданных или элемент 230 декоррелированных аудиоданных, в соответствии со специфичными для каналов компонентами сведений 207 о выборе, которые могут генерироваться или храниться на месте, или могут приниматься вместе с аудиоданными 220. Соответственно, система 200 обработки аудиоданных может обеспечивать избирательную декорреляцию конкретных звуковых каналов.

[00188] Альтернативно или дополнительно коммутатор 203 может определять, пересылать элемент 220 прямых аудиоданных или элемент 230 декоррелированных аудиоданных, в соответствии с изменениями в аудиоданных 220. Например, коммутатор 203 может определять, какой из элементов 230 декоррелированных аудиоданных, если таковые есть в наличии, отправлять в модуль 255 обратного преобразования, в соответствии с адаптивными к сигналу компонентами сведений 207 о выборе, которые могут указывать кратковременные события или изменения тональности в аудиоданных 220. В альтернативных воплощениях коммутатор 203 может принимать такие адаптивные к сигналу сведения из декоррелятора 205. В других воплощениях коммутатор 203 может быть сконфигурирован для определения таких изменений в аудиоданных, как кратковременные события или изменения тональности. Соответственно, система 200 обработки аудиоданных может предусматривать адаптивную к сигналу декорреляцию конкретных звуковых каналов.

[00189] Как указывалось выше, в некоторых реализациях элементы 220a–220n аудиоданных могут соответствовать ряду полос частот 1–N. В некоторых таких реализациях коммутатор 203 может определять, пересылать в модуль 255 обратного преобразования элемент 220 аудиоданных или элемент 230 декоррелированных аудиоданных, в соответствии с предварительно определенными установками, соответствующими этим полосам частот и/или в соответствии с принятыми сведениями 207 о выборе. Соответственно, система 200 обработки аудиоданных может предусматривать избирательную декорреляцию конкретных полос частот.

[00190] Альтернативно или дополнительно коммутатор 203 может определять, пересылать в модуль 255 обратного преобразования элемент 220 прямых аудиоданных или элемент 230 декоррелированных аудиоданных, в соответствии с изменениями в аудиоданных 220, которые могут указываться сведениями 207 о выборе или информацией, принятой из декоррелятора 205. В некоторых реализациях коммутатор 203 может быть сконфигурирован для определения изменений в аудиоданных. Поэтому система 200 обработки аудиоданных может предусматривать адаптивную к сигналу декорреляцию конкретных полос частот.

[00191] Фиг. 2В – общий вид операций, которые могут выполняться системой обработки аудиоданных по фиг. 2А. В этом примере способ 270 начинается с процесса приема аудиоданных, соответствующих ряду звуковых каналов (блок 272). Эти аудиоданные могут содержать представление в частотной области, соответствующее коэффициентам набора фильтров системы кодирования или обработки аудиоданных. Эта система кодирования или обработки аудиоданных может, например, представлять собой унаследованную систему кодирования или обработки аудиоданных, такую как АС-3 или Е-АС-3. Некоторые реализации могут включать прием элементов механизма управления, таких как указатели коммутации блоков и т. д., в битовом потоке, выработанном унаследованной системой кодирования или обработки аудиоданных. Процесс декорреляции может, по меньшей мере, частично основываться на этих элементах механизма управления. Ниже представлены подробные примеры. В этом примере способ 270 также включает применение процесса декорреляции, по меньшей мере, к некоторым из аудиоданных (блок 274). Этот процесс декорреляции можно выполнять с теми же коэффициентами набора фильтров, что и коэффициенты, используемые системой кодирования или обработки аудиоданных.

[00192] Снова со ссылкой на фиг. 2А, в зависимости от конкретной реализации, декоррелятор 205 может выполнять операции декорреляции различных типов. В настоящем описании представлено множество примеров. В некоторых реализациях процесс декорреляции выполняется без преобразования коэффициентов представления в частотной области элементов 220 аудиоданных в представление в другой частотной области или во временной области. Процесс декорреляции может включать генерирование сигналов реверберации, или сигналов декорреляции, путем применения линейных фильтров, по меньшей мере, к части представления в частотной области. В некоторых реализациях этот процесс декорреляции может включать применение алгоритма декорреляции, действующего полностью на вещественнозначных коэффициентах. В рамках настоящего описания, «вещественнозначный» означает использование только одного из следующего: набора косинусных или синусных модулированных фильтров.

[00193] Процесс декорреляции может включать применение декорреляционного фильтра к части принятых элементов 220а220n аудиоданных для выработки элементов фильтрованных аудиоданных. Этот процесс декорреляции может включать использование неиерархического микшера для объединения прямой части принятых аудиоданных (к которым не был применен декорреляционный фильтр) с фильтрованными аудиоданными в соответствии с пространственными параметрами. Например, прямая часть элемента 220а аудиоданных может быть смикширована с фильтрованной частью элемента 220а аудиоданных специфичным для выходного канала образом. Некоторые реализации могут содержать специфичный для выходных каналов объединитель (например, линейный объединитель) сигналов декорреляции, или сигналов реверберации. Ниже описаны различные примеры.

[00194] В некоторых реализациях пространственные параметры могут быть определены системой 200 обработки аудиоданных в соответствии с анализом принятых аудиоданных 220. Альтернативно или дополнительно эти пространственные параметры могут быть приняты в битовом потоке наряду с аудиоданными 220 как часть сведений 240 о декорреляции или как все эти сведения. В некоторых реализациях сведения 240 о декорреляции могут содержать коэффициенты корреляции между отдельными обособленными каналами и каналом связывания, коэффициенты корреляции между отдельными обособленными каналами, явные сведения о тональности и/или сведения о кратковременных событиях. Процесс декорреляции может включать декорреляцию, по меньшей мере, части аудиоданных 220, по меньшей мере, частично на основе сведений 240 о декорреляции. Некоторые реализации могут быть сконфигурированы для использования как определяемых на месте, так и принимаемых пространственных параметров и/или других сведений о декорреляции. Ниже описаны различные примеры.

[00195] Фиг. 2С – блок-схема, показывающая элементы одной из альтернативных систем обработки аудиоданных. В этом примере элементы 220а–220n аудиоданных содержат аудиоданные для N звуковых каналов. Эти элементы 220а–220n аудиоданных содержат представления в частотной области, соответствующие коэффициентам набора фильтров системы кодирования или обработки аудиоданных. В данной реализации эти представления в частотной области являются результатом применения набора фильтров с критической дискретизацией и с совершенным восстановлением. Например, эти представления в частотной области могут являться результатом применения к аудиоданным во временной области модифицированного дискретного синусного преобразования, модифицированного дискретного косинусного преобразования или ортогонального преобразования с перекрытием.

[00196] Декоррелятор 205 применяет процесс декорреляции, по меньшей мере, к части элементов 220а–220n аудиоданных. Например, этот процесс декорреляции может включать генерирование сигналов реверберации, или сигналов декорреляции, путем применения линейных фильтров, по меньшей мере, к части элементов 220а–220n аудиоданных. Этот процесс декорреляции может выполняться, по меньшей мере, частично в соответствии со сведениями 240 о декорреляции, принимаемыми декоррелятором 205. Например, сведения 240 о декорреляции могут быть приняты в битовом потоке наряду с представлениями в частотной области элементов 220а–220n аудиоданных. Альтернативно или дополнительно по меньшей мере некоторые сведения о декорреляции можно определить на месте, например, посредством декоррелятора 205.

[00197] Модуль 255 обратного преобразования применяет обратное преобразование для выработки аудиоданных 260 во временной области. В этом примере модуль 255 обратного преобразования применяет обратное преобразование, эквивалентное набору фильтров с критической дискретизацией и с совершенным восстановлением. Набор фильтров с критической дискретизацией и с совершенным восстановлением может соответствовать набору фильтров, примененному к аудиоданным во временной области (например, посредством кодирующего устройства) для выработки представлений элементов 220а–220n аудиоданных в частотной области.

[00198] Фиг. 2D – блок-схема, показывающая один из примеров того, как в системе обработки аудиоданных можно использовать декоррелятор. В этом примере система 200 обработки аудиоданных представляет собой декодер, содержащий декоррелятор 205. В некоторых реализациях этот декодер может быть сконфигурирован для функционирования в соответствии с аудиокодеком AC-3 или E-AC-3. Однако в некоторых реализациях система обработки аудиоданных может быть сконфигурирована для обработки аудиоданных для других аудиокодеков. Декоррелятор 205 может содержать различные субкомпоненты, такие как описываемые в других местах настоящего описания. В этом примере повышающий микшер 225 принимает аудиоданные 210, содержащие представления в частотной области аудиоданных канала связывания. В данном примере эти представления в частотной области представляют собой коэффициенты MDCT.

[00199] Повышающий микшер 225 также принимает координаты 212 связывания для каждого канала и диапазон частот каналов связывания. В этой реализации сведения о масштабировании в форме координат 212 связывания были вычислены в кодере Dolby Digital или Dolby Digital Plus в форме экспонента-мантисса. Повышающий микшер 225 может вычислять частотные коэффициенты для каждого выходного канала путем умножения координат частот каналов связывания на координаты связывания для этого канала.

[00200] В этой реализации повышающий микшер 225 выводит раздельные коэффициенты MDCT отдельных каналов в диапазоне частот каналов связывания в декоррелятор 205. Соответственно, в этом примере аудиоданные 220, представляющие собой ввод в декоррелятор 205, содержат коэффициенты MDCT.

[00201] В примере, показанном на фиг. 2D, декоррелированные аудиоданные 230, выводимые декоррелятором 205, содержат декоррелированные коэффициенты MDCT. В этом примере не все аудиоданные, принимаемые системой 200 обработки аудиоданных, также декоррелируются декоррелятором 205. Например, представления в частотной области аудиоданных 245а для частот ниже диапазона частот каналов связывания, а также представления в частотной области аудиоданных 245b для частот выше диапазона частот каналов связывания, не декоррелируются декоррелятором 205. Эти данные наряду с декоррелированными коэффициентами 230 MDCT являются выводом из декоррелятора 205 и вводом в процесс 255 обратного преобразования MDCT. В этом примере аудиоданные 245b содержат коэффициенты MDCT, определенные инструментальным средством Spectral Extension – инструментальным средством расширения полосы пропускания аудиоданных аудиокодека Е-АС-3.

[00202] В этом примере сведения 240 о декорреляции принимаются декоррелятором 205. Тип принятых сведений 240 о декорреляции может изменяться в соответствии с реализацией. В некоторых реализациях сведения 240 о декорреляции могут содержать явную, специфичную для декоррелятора управляющую информацию и/или явные сведения, способные формировать основу такой управляющей информации. Сведения 240 о декорреляции могут, например, содержать пространственные параметры, такие как коэффициенты корреляции между отдельными обособленными каналами и каналом связывания, и/или коэффициенты корреляции между отдельными обособленными каналами. Такие явные сведения 240 о декорреляции также могут содержать явные сведения о тональности и/или сведения о кратковременных событиях. Эти сведения можно использовать для, по меньшей мере, частичного определения параметров декорреляционного фильтра для декоррелятора 205.

[00203] Однако в альтернативных реализациях такие явные сведения 240 о декорреляции декоррелятор 205 не принимает. В соответствии с такими реализациями, сведения 240 о декорреляции могут содержать сведения из битового потока унаследованного аудиокодека. Например, сведения 240 о декорреляции могут содержать сведения о временной сегментации, доступные в битовом потоке, кодированном в соответствии с аудиокодеком АС-3 или аудиокодеком Е-АС-3. Эти сведения 240 о декорреляции могут содержать сведения о связывании в использовании, сведения о коммутации блоков, сведения об экспонентах, сведения о долгосрочном поведении экспонент и т. д. Такие сведения могли быть приняты системой обработки аудиоданных в битовом потоке наряду с аудиоданными 210.

[00204] В некоторых реализациях декоррелятор 205 (или другой элемент системы 200 обработки аудиоданных) может определять пространственные параметры, сведения о тональности и/или сведения о кратковременных событиях на основе одного или нескольких определяющих признаков аудиоданных. Например, система 200 обработки аудиоданных может определять пространственные параметры для частот в диапазоне частот каналов связывания на основе аудиоданных 245а или 245b вне диапазона частот каналов связывания. Альтернативно или дополнительно система 200 обработки аудиоданных может определять сведения о тональности на основе сведений из битового потока унаследованного аудиокодека. Некоторые такие реализации будут описаны ниже.

[00205] Фиг. 2Е – блок-схема, иллюстрирующая элементы одной из альтернативных систем обработки аудиоданных. В этой реализации система 200 обработки аудиоданных содержит повышающий/понижающий микшер 262 N-в-M и повышающий/понижающий микшер 264 М-в-K. Здесь элементы 220a–220n аудиоданных, содержащие коэффициенты преобразования для N звуковых каналов, принимаются повышающим/понижающим микшером 262 N-в-M и декоррелятором 205.

[00206] В этом примере повышающий/понижающий микшер 262 N-в-M может быть сконфигурирован для повышающего или понижающего микширования аудиоданных для N каналов в аудиоданные для М каналов в соответствии со сведениями 266 о микшировании. Однако в некоторых реализациях повышающий/понижающий микшер 262 N-в-M может представлять собой ретранслирующий элемент. В таких реализациях N=M. Сведения 266 о микшировании могут содержать уравнения микширования N-в-M. Сведения 266 о микшировании могут, например, приниматься системой 200 обработки аудиоданных в битовом потоке наряду со сведениями 240 о декорреляции, представлениями в частотной области, соответствующими каналу связывания, и т.д. В этом примере сведения 240 о декорреляции, принимаемые декоррелятором 205, указывают, что декоррелятор 205 должен выводить в коммутатор 203 М каналов декоррелированных аудиоданных 230.

[00207] Коммутатор 203 может определять в соответствии со сведениями 207 о выборе, какие данные будут направлены в повышающий/понижающий микшер 264 М-в-K: прямые данные из повышающего/понижающего микшера 262 N-в-M или декоррелированные аудиоданные 230. Повышающий/понижающий микшер 264 М-в-K может быть сконфигурирован для повышающего или понижающего микширования аудиоданных для М каналов в аудиоданные для K каналов в соответствии со сведениями 268 о микшировании. В таких реализациях сведения 268 о микшировании могут содержать уравнения микширования М-в-K. Для реализаций, в которых N=M, повышающий/понижающий микшер 264 М-в-K может подвергать аудиоданные для N каналов повышающему или понижающему микшированию в аудиоданные для K каналов в соответствии со сведениями 268 о микшировании. В таких реализациях сведения 268 о микшировании могут содержать уравнения микширования N-в-K. Сведения 268 о микшировании могут, например, приниматься системой 200 обработки аудиоданных наряду со сведениями 240 о декорреляции и другими данными.

[00208] Уравнения микширования N-в-M, M-в-K или N-в-K могут представлять собой уравнения повышающего микширования или понижающего микширования. Эти уравнения микширования N-в-M, M-в-K или N-в-K могут представлять собой набор коэффициентов линейной комбинации, отображающих входные звуковые сигналы в выходные звуковые сигналы. В соответствии с некоторыми такими реализациями, уравнения микширования M-в-K могут представлять собой уравнения стереофонического понижающего микширования. Например, повышающий/понижающий микшер 264 М-в-K может быть сконфигурирован для понижающего микширования аудиоданных для 4, 5, 6 или большего количества каналов в аудиоданные для 2 каналов в соответствии с уравнениями микширования M-в-K в сведениях 268 о микшировании. В некоторых таких реализациях аудиоданные для левого канала («L»), центрального канала («С») и левого окружающего канала («Ls») могут комбинироваться в соответствии с уравнениями микширования M-в-K в левый стереофонический выходной канал Lо. Аудиоданные для правого канала («R»), центрального канала и правого окружающего канала («Rs») могут комбинироваться в соответствии с уравнениями микширования M-в-K в правый стереофонический выходной канал Rо. Например, уравнения микширования M-в-K могут быть следующими:

Lo=L+0,707C+0,707Ls

Ro=R+0,707C+0,707Rs

[00209] Альтернативно уравнения микширования M-в-K могут быть следующими:

Lo=L+(–3 дБ)×C + att×Ls

Ro=R+(–3 дБ)×C + att×Rs,

где att может, например, представлять такое значение, как –3 дБ, –6 дБ, – 9дБ или нуль. Для реализаций, в которых N=M, приведенные выше уравнения можно считать уравнениями микширования N-в-K.

[00210] В этом примере сведения 240 о декорреляции, принимаемые декоррелятором 205, указывают, что аудиоданные для М каналов будут впоследствии подвергнуты повышающему или понижающему микшированию в K каналов. Декоррелятор 205 может быть сконфигурирован для использования разных процессов декорреляции в зависимости от того, будут данные для М каналов впоследствии подвергнуты повышающему микшированию или понижающему микшированию в аудиоданные для K каналов. Соответственно, декоррелятор 205 может быть сконфигурирован для определения процессов декорреляционной фильтрации, по меньшей мере, частично на основе уравнений микширования М-в-K. Например, если М каналов будут впоследствии подвергнуты понижающему микшированию в K каналов, для каналов, которые будут комбинироваться в последующий низведенный сигнал, могут быть использованы разные декорреляционные фильтры. В соответствии с одним таким примером, если сведения 240 о декорреляции указывают, что аудиоданные для каналов L, R, Ls и Rs будут подвергнуты понижающему микшированию в 2 каналов, для каналов L и R может быть использован один декорреляционный фильтр, а для каналов Ls и Rs может быть использован другой декорреляционный фильтр.

[00211] В некоторых реализациях M=K. В таких реализациях повышающий/понижающий микшер 264 М-в-K может представлять собой ретранслирующий элемент.

[00212] Однако в других реализациях M>K. В таких реализациях повышающий/понижающий микшер 264 М-в-K может выполнять функцию понижающего микшера. В соответствии с некоторыми такими реализациями, можно использовать способ генерирования декоррелированного низведенного сигнала с меньшим объемом вычислений. Например, декоррелятор 205 может быть сконфигурирован для генерирования декоррелированных аудиоданных 230 только для тех каналов, которые коммутатор 203 будет пересылать в модуль 255 обратного преобразования. Например, если N=6 и M=2, то декоррелятор 205 может быть сконфигурирован для генерирования декоррелированных аудиоданных 230 только для 2 низведенных каналов. В этом процессе декоррелятор 205 может использовать декорреляционные фильтры только для 2 каналов, а не для 6, что понижает сложность. Соответствующие сведения о микшировании могут содержаться в сведениях 240 о декорреляции, сведениях 266 о микшировании и сведениях 268 о микшировании. Соответственно, декоррелятор 205 может быть сконфигурирован для определения процессов декорреляционной фильтрации, по меньшей мере, частично на основе уравнений микширования N-в-M, N-в-K или М-в-K.

[00213] Фиг. 2F – блок-схема, показывающая примеры элементов декоррелятора. Элементы, показанные на фиг. 2F, могут, например, быть реализованы в логической системе такого декодирующего устройства, как устройство, описываемое ниже со ссылкой на фиг. 12. Фиг. 2F изображает декоррелятор 205, содержащий генератор 218 сигналов декорреляции и микшер 215. В некоторых воплощениях декоррелятор 205 может содержать и другие элементы. Примеры других элементов декоррелятора 205 и того, как они могут функционировать, изложены в других местах настоящего описания.

[00214] В этом примере аудиоданные 220 представляют собой ввод в генератор 218 сигналов декорреляции и микшер 215. Аудиоданные 220 могут соответствовать ряду звуковых каналов. Например, аудиоданные 220 могут содержать данные, являющиеся результатом связывания каналов в ходе процесса звукового кодирования, которые были подвергнуты повышающему микшированию перед приемом декоррелятором 205. В некоторых воплощениях аудиоданные 220 могут находиться во временной области, в то время как в других воплощениях аудиоданные 220 могут находиться в частотной области. Например, аудиоданные 220 могут содержать временные последовательности коэффициентов преобразования.

[00215] Генератор 218 сигналов декорреляции может формировать один или несколько декорреляционных фильтров, применять эти декорреляционные фильтры к аудиоданным 220 и предоставлять результирующие сигналы 227 декорреляции микшеру 215. В этом примере микшер объединяет аудиоданные 220 с сигналами 227 декорреляции для выработки декоррелированных аудиоданных 230.

[00216] В некоторых воплощениях генератор 218 сигналов декорреляции может определять управляющую информацию декорреляционных фильтров для декорреляционного фильтра. В соответствии с некоторыми такими воплощениями, эта управляющая информация декорреляционных фильтров может соответствовать максимальному перемещению полюсов декорреляционного фильтра. Генератор 218 сигналов декорреляции может определять параметры декорреляционного фильтра для аудиоданных 220, по меньшей мере, частично на основе управляющей информации декорреляционных фильтров.

[00217] В некоторых реализациях определение этой управляющей информации декорреляционных фильтров может включать прием вместе с аудиоданными 220 экспресс-указателя управляющей информации декорреляционного фильтра (например, экспресс-указателя максимального перемещения полюсов). В альтернативных реализациях определение управляющей информации декорреляционных фильтров может включать определение сведений о звуковых характеристиках и определение параметров декорреляционного фильтра (таких как максимально перемещение полюсов), по меньшей мере, частично на основе этих сведений о звуковых характеристиках. В некоторых реализациях сведения о звуковых характеристиках могут содержать пространственные сведения, сведения о тональности и/или сведения о кратковременных событиях.

[00218] Некоторые реализации декоррелятора 205 ниже будут описаны более подробно со ссылкой на фиг. 3–5Е. Фиг. 3 – схема последовательности операций, иллюстрирующая один из примеров процесса декорреляции. Фиг. 4 – блок-схема, иллюстрирующая примеры компонентов декоррелятора, которые можно сконфигурировать для выполнения процесса декорреляции по фиг. 3. Процесс 300 декорреляции по фиг. 3 можно, по меньшей мере, частично выполнить в таком декодирующем устройстве, как устройство, описываемое ниже со ссылкой на фиг. 12.

[00219] В этом примере процесс 300 начинается тогда, когда декоррелятор принимает аудиоданные (блок 305). Как описывалось выше со ссылкой на фиг. 2F, эти аудиоданные могут быть приняты генератором 218 сигналов декорреляции и микшером 215 декоррелятора 205. Здесь, по меньшей мере, некоторые аудиоданные приняты из такого повышающего микшера, как повышающий микшер 225 по фиг. 2D. Как таковые, эти аудиоданные соответствуют ряду звуковых каналов. В некоторых реализациях эти принятые декоррелятором аудиоданные могут содержать временную последовательность представлений аудиоданных в частотной области (таких как коэффициенты MDCT) в диапазоне частот каналов связывания каждого канала. В альтернативных реализациях эти аудиоданные могут находиться во временной области.

[00220] В блоке 310 определяется управляющая информация декорреляционных фильтров. Эту управляющую информацию декорреляционных фильтров можно определить, например, в соответствии со звуковыми характеристиками аудиоданных. В некоторых реализациях, таких как пример, показанный на фиг. 4, такие звуковые характеристики могут содержать явные пространственные сведения, сведения о тональности и/или сведения о кратковременных событиях, кодированные вместе с аудиоданными.

[00221] В варианте осуществления, показанном на фиг. 4, декорреляционный фильтр 410 содержит фиксированную задержку 415 и изменяющуюся во времени часть 420. В этом примере генератор 218 сигналов декорреляции содержит модуль 405 управления декорреляционными фильтрами для управления изменяющейся во времени частью 420 декорреляционного фильтра 410. В этом примере модуль 405 управления декорреляционными фильтрами принимает явные сведения 425 о тональности в форме флага тональности. В этой реализации модуль 405 управления декорреляционными фильтрами также принимает явные сведения 430 о кратковременных событиях. В некоторых реализациях явные сведения 425 о тональности и/или явные сведения 430 о кратковременных событиях могут быть приняты вместе с аудиоданными, например, как часть сведений 240 о декорреляции. В некоторых реализациях явные сведения 425 о тональности и/или явные сведения 430 о кратковременных событиях могут генерироваться на месте.

[00222] В некоторых реализациях декоррелятор 205 не принимает какие-либо явные пространственные сведения, сведения о тональности или сведения о кратковременных событиях. В некоторых таких реализациях модуль управления кратковременными событиями декоррелятора 205 (или другой элемент системы обработки аудиоданных) может быть сконфигурирован для определения сведений о кратковременных событиях на основе одного или нескольких определяющих признаков аудиоданных. Модуль пространственных параметров декоррелятора 205 может быть сконфигурирован для определения пространственных параметров на основе одного или нескольких определяющих признаков аудиоданных. Некоторые примеры описываются в других местах настоящего описания.

[00223] В блоке 315 по фиг. 3 параметры декорреляционного фильтра для аудиоданных определяются, по меньшей мере, частично на основе управляющей информации декорреляционных фильтров, определяемой в блоке 310. Затем, как показано в блоке 320, в соответствии с параметрами декорреляционного фильтра можно сформировать декорреляционный фильтр. Этот фильтр может, например, представлять собой линейный фильтр с по меньшей мере одним элементом задержки. В некоторых реализациях этот фильтр может, по меньшей мере, частично основываться на мероморфной функции. Например, этот фильтр может содержать фазовый фильтр.

[00224] В реализации, показанной на фиг. 4, модуль 405 управления декорреляционными фильтрами может управлять изменяющейся во времени частью 420 декорреляционного фильтра 410, по меньшей мере, частично на основе флагов 425 тональности и/или явных сведений 430 о кратковременных событиях, принятых декоррелятором 205 в битовом потоке. Ниже описываются некоторые примеры. В этом примере декорреляционный фильтр 410 применяется только к аудиоданным в диапазоне частот каналов связывания.

[00225] В этом варианте осуществления декорреляционный фильтр 410 содержит фиксированную задержку 415, за которой следует изменяющаяся во времени часть 420, в данном примере представляющая собой фазовый фильтр. В некоторых вариантах осуществления генератор 218 сигналов декорреляции может содержать набор фазовых фильтров. Например, в некоторых вариантах осуществления, где аудиоданные 220 находятся в частотной области, генератор 218 сигналов декорреляции может содержать фазовый фильтр для каждого из ряда элементов разрешения по частоте. Однако в альтернативных реализациях к каждому элементу разрешения по частоте может применяться один и тот же фильтр. Альтернативно элементы разрешения по частоте могут быть сгруппированы, и к каждой группе может применяться один и тот же фильтр. Например, элементы разрешения по частоте могут быть сгруппированы в полосы частот, могут быть сгруппированы по каналу и/или сгруппированы по полосе частот и по каналу.

[00226] Величина фиксированной задержки может выбираться, например, логическим устройством и/или в соответствии с пользовательским вводом. Для того чтобы ввести управляемый хаос в сигналы 227 декорреляции, элемент 405 управления декорреляционными фильтрами может применять параметры декорреляционного фильтра для управления полюсами фазового фильтра (фильтров) так, чтобы один или несколько из полюсов двигались в ограниченной области случайным или псевдослучайным образом.

[00227] Соответственно, параметры декорреляционного фильтра могут содержать параметры для движения по меньшей мере одного полюса фазового фильтра. Такие параметры могут содержать параметры для размывания одного или нескольких полюсов фазового фильтра. Альтернативно параметры декорреляционного фильтра могут содержать параметры для выбора для каждого полюса фазового фильтра местоположения этого полюса среди ряда предварительно определенных местоположений полюсов. В предварительно определенном промежутке времени (например, один раз в каждом блоке Dolby Digital Plus) для каждого полюса фазового фильтра может случайным или псевдослучайным образом выбираться новое местоположение.

[00228] Некоторые такие реализации будут описаны ниже со ссылкой на фиг. 5А–5Е. Фиг. 5А – график, показывающий один из примеров движения полюсов фазового фильтра. График 500 представляет собой полярную диаграмму фазового фильтра 3го порядка. В этом примере фильтр содержит два комплексных полюса (полюса 505а и 505с) и один вещественный полюс (полюс 505b). Большой круг представляет собой единичный круг 515. С течением времени местоположения полюсов могут размываться (или иначе изменяться) так, чтобы они двигались в пределах ограничительных зон 510a, 510b и 510c, ограничивающих возможные траектории полюсов, соответственно, 505a, 505b и 505c.

[00229] В этом примере ограничительные зоны 510a, 510b и 510c являются круглыми. Исходные (или «затравочные») местоположения полюсов 505a, 505b и 505c указаны кругами с центрами в ограничительных зонах 510a, 510b и 510c. В примере по фиг. 5А ограничительные зоны 510a, 510b и 510c представляют собой круги с радиусом 0,2, центрированные в исходных местоположениях полюсов. Полюса 505а и 505с соответствуют комплексно сопряженной паре, в то время как полюс 505b является вещественным полюсом.

[00230] Однако другие реализации могут содержать больше или меньше полюсов. Альтернативные реализации также могут содержать ограничительные зоны других размеров или форм. Некоторые примеры показаны на фиг. 5D и 5Е и описываются ниже.

[00231] В некоторых реализациях разные каналы аудиоданных совместно используют одни и те же ограничительные зоны. Однако в альтернативных реализациях каналы аудиоданных совместно не используют одни и те же ограничительные зоны. Используют каналы аудиоданных одни и те же ограничительные зоны совместно или нет, полюса могут размываться (или иначе двигаться) независимо для каждого звукового канала.

[00232] Образец траектории полюса 505а указан стрелками внутри ограничительной зоны 510а. Каждая стрелка представляет передвижение, или «шаг» 520, полюса 505а. И хотя это не показано на фиг. 5А, два полюса комплексно сопряженной пары, полюса 505а и 505с, движутся совместно так, что эти полюса сохраняют их сопряженную взаимосвязь.

[00233] В некоторых реализациях движением полюса можно управлять, изменяя значение максимального шага. Это значение максимального шага может соответствовать максимальному перемещению полюса из самого последнего местоположения полюса. Значение максимального шага может определять круг, имеющий радиус, равный значению максимального шага.

[00234] Один такой пример показан на фиг. 5А. Полюс 505а перемещается из его исходного положения посредством шага 520а в местоположение 505а’. Шаг 520а может быть ограничен в соответствии с предыдущим значением максимального шага, например, исходным значением максимального шага. После передвижения полюса 505а из его исходного местоположения в местоположение 505a’, определяется новое значение максимального шага. Это значение максимального шага ограничивает круг 525 максимального шага, имеющий радиус, равный значению максимального шага. В примере, показанном на фиг. 5А, следующий шаг (шаг 520b) оказывается равным значению максимального шага. Поэтому шаг 520b передвигает полюс в местоположение 505a’’ на окружности круга 525 максимального шага. Однако шаги 520, в целом, могут быть меньше значения максимального шага.

[00235] В некоторых реализациях значение максимального шага может сбрасываться после каждого шага. В других реализациях значение максимального шага может сбрасываться после нескольких шагов и/или в соответствии с изменениями в аудиоданных.

[00236] Значение максимального шага можно определять и/или управлять им различными способами. В некоторых реализациях значение максимального шага может, по меньшей мере, частично основываться на одном или нескольких определяющих признаках аудиоданных, к которым будет применяться этот декорреляционный фильтр.

[00237] Например, значение максимального шага может, по меньшей мере, частично основываться на сведениях о тональности и/или на сведениях о кратковременных событиях. В соответствии с некоторыми такими реализациями, значение максимального шага может быть нулевым или находиться около нуля для высокотональных сигналов аудиоданных (таких как аудиоданные для камертон-дудки, клавесина и т. д.), что вызывает возникновение небольшого изменения в полюсах или отсутствие изменения. В некоторых реализациях значение максимального шага может быть нулевым или находиться около нуля в случае атаки в кратковременном сигнале (таком как аудиоданные для взрыва, хлопка двери и т. д.). Впоследствии (например, в течение промежутка времени нескольких блоков) это значение максимального шага может быть линейно изменено до большего значения.

[00238] В некоторых реализациях сведения о тональности и/или кратковременных событиях могут обнаруживаться в декодере на основе одного или нескольких определяющих признаков аудиоданных. Например, сведения о тональности и/или кратковременных событиях можно определять в соответствии с одним или несколькими определяющими признаками аудиоданных посредством такого модуля, как приемник/генератор 640 управляющей информации, описываемый ниже со ссылкой на фиг. 6В и 6С. Альтернативно явные сведения о тональности и/или кратковременных событиях могут быть переданы из кодера и приняты в битовом потоке, принимаемом декодером, например, посредством флагов тональности и/или кратковременных событий.

[00239] В этой реализации движением полюса можно управлять в соответствии с параметрами размывания. Соответственно, в то время как движение полюса может быть ограничено в соответствии со значением максимального шага, направление и/или протяженность этого движения полюса может включать случайную или псевдослучайную составляющую. Например, движение полюса может, по меньшей мере, частично основываться на выводе алгоритма генератора случайных чисел или генератора псевдослучайных чисел, реализованного в программном обеспечении. Такое программное обеспечение может храниться на постоянном носителе данных и исполняться логической системой.

[00240] Однако в альтернативных реализациях параметры декорреляционного фильтра могут не содержать параметры размывания. Вместо этого движение полюсов может быть ограничено предварительно определенными местоположениями полюсов. Например, в пределах радиуса, ограниченного значением максимального шага, может лежать несколько предварительно определенных местоположений полюсов. Логическая система может случайным или псевдослучайным образом выбирать в качестве следующего местоположения одно из этих предварительно определенных местоположений.

[00241] Для управления движением полюсов можно использовать и различные другие способы. В некоторых реализациях, если полюс приближается к границе ограничительной зоны, то выбор передвижений полюсов может смещаться к новым местоположениям полюсов, более близким к центру ограничительной зоны. Например, если полюс 505а движется к границе ограничительной зоны 510а, то центр круга 525 максимального шага можно сместить внутрь к центру ограничительной зоны 510а так, чтобы круг 525 максимального шага всегда лежал в пределах границы этой ограничительной зоны 510а.

[00242] В некоторых таких реализациях для создания смещения, склонного отодвигать местоположение полюса от границы ограничительной зоны, можно применить весовую функцию. Например, предварительно определенным местоположениям полюсов в пределах круга 525 максимального шага могут не присваиваться равные вероятности их выбора в качестве следующего местоположения полюса. Вместо этого предварительно определенным местоположениям полюсов, более близким к центру ограничительной зоны, может присваиваться более высокая вероятность, чем местоположениям полюсов, относительно более отдаленным от центра ограничительной зоны. В соответствии с некоторыми такими реализациями, когда полюс 505а находится близко к границе ограничительной зоны 510а, более вероятным является то, что следующее движение полюса будет происходить в направлении к центру ограничительной зоны 510а.

[00243] В этом примере, местоположения полюса 505b также изменяются, но они управляются так, чтобы полюс 505b продолжал оставаться вещественным. Соответственно, местоположения полюса 505b ограничены так, чтобы они лежали вдоль диаметра 530 ограничительной зоны 510b. В альтернативных реализациях, однако, полюс 505b можно передвинуть в местоположения, содержащие мнимую составляющую.

[00244] В других реализациях местоположения всех полюсов могут быть ограничены так, чтобы они двигались только по радиусам. В некоторых таких реализациях изменения в местоположении полюса только увеличивает или уменьшает полюса (в выражении абсолютного значения), но не влияет на их фазу. Такие реализации могут быть полезны, например, для передачи выбранной постоянной времени реверберации.

[00245] Полюса для частотных коэффициентов, соответствующих более высоким частотам, могут находиться относительно ближе к центру единичного круга 515, чем полюса для частотных коэффициентов, соответствующих менее высоким частотам. Для иллюстрации одной из иллюстративных реализаций мы используем фиг. 5В, изменение фиг. 5А. Здесь в данный момент времени треугольники 505a’’’, 505b’’’ и 505c’’’ указывают местоположения полюсов с частотой f0, полученной после размывания или некоторых других процессов, описывающих их изменение во времени. Пусть полюс при 505a’’’ будет указан посредством z1, а полюс при 505b’’’ будет указан посредством z2. Полюс при 505с’’’ является комплексно сопряженным с полюсом при 505a’’’ и поэтому представлен посредством QUOTE , где звездочка указывает комплексное сопряжение.

[00246] Полюса для фильтра, используемого при какой-либо другой частоте f, в этом примере получают, масштабируя полюса z1, z2 и QUOTE посредством коэффициента a(f)/a(f0), где a(f) – функция, убывающая с частотой f аудиоданных. Когда f=f0, масштабный коэффициент равен 1, и полюса находятся в ожидаемых местоположениях. В соответствии с некоторыми такими реализациями, к частотным коэффициентам, соответствующим более высоким частотам, могут применяться меньшие групповые задержки, чем к частотным коэффициентам с менее высокими частотами. В описываемом здесь варианте осуществления полюса размываются при одной частоте и масштабируются для получения местоположений полюсов для других частот. Частота f0 может представлять собой, например, частоту начала связывания. В альтернативных реализациях полюса можно размывать по отдельности при каждой частоте, а ограничительные зоны (510a, 510b и 510c) могут находиться существенно ближе к началу координат при более высоких частотах по сравнению с менее высокими частотами.

[00247] В соответствии с различными реализациями, описываемыми в настоящем описании, полюса 505 могут быть подвижными, но могут сохранять, по существу, согласованную пространственную или угловую взаимосвязь друг относительно друга. В некоторых таких реализациях передвижения полюсов 505 могут не ограничиваться ограничительными зонами.

[00248] Фиг. 5С показывает один такой пример. В этом примере комплексно сопряженные полюса 505а и 505с могут быть подвижны в направлении по часовой стрелке или против часовой стрелки в пределах единичного круга 515. Когда полюса 505а и 505с движутся (например, в предварительно определенном промежутке времени), оба эти полюса могут поворачиваться на угол θ, выбранный случайным или квазислучайным образом. В некоторых воплощениях это угловое движение может быть ограничено в соответствии со значением углового шага. В примере, показанном на фиг. 5С, полюс 505а был передвинут на угол θ в направлении по часовой стрелке. Соответственно, полюс 505с был передвинут на угол θ в направлении против часовой стрелки, для того чтобы сохранить комплексно сопряженную взаимосвязь между полюсом 505а и полюсом 505с.

[00249] В этом примере полюс 505b ограничен перемещением вдоль вещественной оси. В некоторых таких реализациях полюса 505а и 505с также могут быть подвижны в направлении к центру или от центра единичного круга 515, например, как описано выше со ссылкой на фиг. 5В. В альтернативных реализациях полюс 505b может не двигаться. В других реализациях полюс 505b может отодвигаться от вещественной оси.

[00250] В примерах, показанных на фиг. 5А и 5В, ограничительные зоны 510а, 510b и 510с являются круглыми. Однако авторами изобретения предполагаются и другие различные формы ограничительных зон. Например, ограничительная зона 510d по фиг. 5D является, по существу, овальной по форме. Полюс 505d может быть расположен в различных местоположениях в пределах этой овальной ограничительной зоны 510d. В примере по фиг. 5Е ограничительная зона 510е представляет собой кольцо. Полюс 505е может быть расположен в различных местоположениях в пределах этого кольца ограничительной зоны 510d.

[00251] Вновь возвращаясь к фиг. 3, в блоке 325, по меньшей мере, к некоторым из аудиоданных применяется декорреляционный фильтр. Например, декорреляционный фильтр, по меньшей мере, к некоторым из входных аудиоданных 220 может применять генератор 218 сигналов декорреляции по фиг. 4. Вывод декорреляционного фильтра 227 может быть некоррелированным с входными аудиоданными 220. Более того, вывод декорреляционного фильтра может обладать, по существу, такой же спектральной плотностью мощности, как и входной сигнал. Поэтому вывод декорреляционного фильтра 227 может звучать естественно. В блоке 330 вывод декорреляционного фильтра микшируется с входными аудиоданными. В блоке 335 выводятся декоррелированные аудиоданные. В примере по фиг. 4 в блоке 330 микшер 215 объединяет вывод декорреляционного фильтра 227 (который может именоваться в настоящем описании «фильтрованными аудиоданными») с входными аудиоданными 220 (которые могут именоваться в настоящем описании «прямыми аудиоданными»). В блоке 335 микшер 215 выводит декоррелированные аудиоданные 230. Если в блоке 340 определяется, что будут обрабатываться следующие аудиоданные, то процесс 300 декорреляции возвращается в блок 305. Иначе процесс 300 декорреляции завершается. (Блок 345).

[00252] Фиг. 6А – блок-схема, иллюстрирующая одну из альтернативных реализаций декоррелятора. В этом примере микшер 215 и генератор 218 сигналов декорреляции принимают элементы 220 аудиоданных, соответствующие ряду каналов. По меньшей мере, некоторые из элементов аудиоданных 220 могут, например, представлять собой вывод из повышающего микшера, такого как повышающий микшер 225 по фиг. 2D.

[00253] Здесь микшер 215 и генератор 218 сигналов декорреляции также принимают сведения о декорреляции различных типов. В некоторых реализациях, по меньшей мере, некоторые сведения о декорреляции могут быть приняты в битовом потоке наряду с элементами 220 аудиоданных. Альтернативно или дополнительно, по меньшей мере, некоторые сведения о декорреляции могут быть определены на месте, например, посредством других компонентов декоррелятора 205 или одного или нескольких других компонентов системы 200 обработки аудиоданных.

[00254] В этом примере принятые сведения о декорреляции содержат управляющую информацию 625 генератора сигналов декорреляции. Эта управляющая информация 625 генератора сигналов декорреляции может содержать сведения о декорреляционном фильтре, сведения о коэффициентах усиления, управляющую информацию ввода и т.д. Генератор сигналов декорреляции вырабатывает сигналы 227 декорреляции, по меньшей мере, частично на основе этой управляющей информации 625 генератора сигналов декорреляции.

[00255] Здесь принятые сведения о декорреляции также содержат управляющую информацию 430 кратковременных событий. Различные примеры того, как декоррелятор 205 может использовать и/или генерировать управляющую информацию 430 кратковременных событий, представлены в других местах настоящего описания.

[00256] В данной реализации микшер 215 содержит синтезатор 605 и микшер 610 прямых сигналов и сигналов декорреляции. В этом примере синтезатор 605 представляет собой специфичный для выходных каналов объединитель сигналов декорреляции, или реверберации, таких как сигналы 227 декорреляции, принятых из генератора 218 сигналов декорреляции. В соответствии с некоторыми такими реализациями, синтезатор 605 может представлять собой линейный объединитель сигналов декорреляции, или реверберации. В этом примере сигналы 227 декорреляции соответствуют элементам 220 аудиоданных для ряда каналов, к которым генератором сигналов декорреляции был применен один или несколько декорреляционных фильтров. Соответственно, сигналы 227 декорреляции также могут именоваться в настоящем описании «фильтрованными аудиоданными» или «элементами фильтрованных аудиоданных».

[00257] Здесь микшер 610 прямых сигналов и сигналов декорреляции представляет собой специфичный для выходных каналов объединитель элементов фильтрованных аудиоданных с элементами 220 «прямых» аудиоданных, соответствующими ряду каналов, для выработки декоррелированных аудиоданных 230. Соответственно, декоррелятор 205 может предусматривать специфичную для каналов и неиерархическую декорреляцию аудиоданных.

[00258] В этом примере синтезатор 605 объединяет сигналы 227 декорреляции в соответствии с параметрами 615 синтеза сигналов декорреляции, которые также могут именоваться в настоящем описании «коэффициентами синтеза сигналов декорреляции». Аналогично, микшер 610 прямых сигналов и сигналов декорреляции объединяет элементы прямых и фильтрованных аудиоданных в соответствии с коэффициентами 620 микширования. Параметры 615 синтеза сигналов декорреляции и коэффициенты 620 микширования могут, по меньшей мере, частично основываться на принимаемых сведениях о декорреляции.

[00259] Здесь принимаемые сведения о декорреляции содержат сведения 630 о пространственных параметрах, являющиеся в данном примере специфичными для каналов. В некоторых реализациях микшер 215 может быть сконфигурирован для определения параметров 615 синтеза сигналов декорреляции и/или коэффициентов 620 микширования, по меньшей мере, частично на основе этих сведений 630 о пространственных параметрах. В этом примере принимаемые сведения о декорреляции также содержат сведения 635 о понижающем/повышающем микшировании. Например, сведения 635 о понижающем/повышающем микшировании могут указывать, сколько каналов аудиоданных было объединено для выработки низведенных аудиоданных, которые могут соответствовать одному или нескольким каналам связывания в диапазоне частот каналов связывания. Сведения 635 о понижающем/повышающем микшировании также могут указывать количество требуемых выходных каналов и/или характеристики этих выходных каналов. Как описывалось выше со ссылкой на фиг. 2Е, в некоторых реализациях сведения 635 о понижающем/повышающем микшировании могут содержать сведения, соответствующие сведениям 266 о микшировании, принимаемым повышающим/понижающим микшером 262 N-в-M, и/или сведениям 268 о микшировании, принимаемым повышающим/понижающим микшером 264 М-в-K.

[00260] Фиг. 6В – блок-схема, иллюстрирующая другую реализацию декоррелятора. В этом примере декоррелятор 205 содержит приемник/генератор 640 управляющей информации. Здесь приемник/генератор 640 управляющей информации принимает элементы 220 и 245 аудиоданных. В этом примере соответствующие элементы 220 аудиоданных также принимает микшер 215 и генератор 218 сигналов декорреляции. В некоторых реализациях элементы 220 аудиоданных могут соответствовать аудиоданным в диапазоне частот каналов связывания, в то время как элементы 245 аудиоданных могут соответствовать аудиоданным, находящимся в одном или нескольких диапазонах частот вне диапазона частот каналов связывания.

[00261] В этой реализации приемник/генератор 640 управляющей информации определяет управляющую информацию 625 генератора сигналов декорреляции и управляющую информацию 645 микшера в соответствии со сведениями о декорреляции и/или элементами 220 и/или 245 аудиоданных. Ниже описываются некоторые примеры приемника/генератора 640 управляющей информации и его функциональных возможностей.

[00262] Фиг. 6С – блок-схема, иллюстрирующая одну из альтернативных реализаций системы обработки аудиоданных. В этом примере система 200 обработки аудиоданных содержит декоррелятор 205, коммутатор 203 и модуль 255 обратного преобразования. В некоторых реализациях коммутатор 203 и модуль 255 обратного преобразования могут быть, по существу, такими же, как модули, описанные со ссылкой на фиг. 2А. Аналогично, микшер 215 и генератор сигналов декорреляции могут быть, по существу, такими же, как описано в других местах настоящего описания.

[00263] Приемник/генератор 640 управляющей информации может обладать разными функциональными возможностями в соответствии с конкретной реализацией. В этой реализации приемник/генератор 640 управляющей информации содержит модуль 650 управления фильтрами, модуль 655 управления кратковременными событиями, модуль 660 управления микшером и модуль 665 пространственных параметров. Как и для других компонентов системы 200 обработки аудиоданных, эти элементы приемника/генератора 640 управляющей информации могут быть реализованы посредством аппаратного обеспечения, программно-аппаратного обеспечения, программного обеспечения, хранящегося на постоянном носителе данных, и/или их комбинаций. В некоторых реализациях эти компоненты могут быть реализованы посредством такой логической системы, как система, описанная в других местах данного раскрытия.

[00264] Модуль 650 управления фильтрами может быть, например, сконфигурирован для управления генератором сигналов декорреляции, описанным выше со ссылкой на фиг. 2Е–5Е и/или описываемым ниже со ссылкой на фиг. 11В. Ниже представлены различные примеры функциональных возможностей модуля 655 управления кратковременными событиями и модуля 660 управления микшером.

[00265] В этом примере приемник/генератор 640 управляющей информации принимает элементы 220 и 245 аудиоданных, которые могут включать, по меньшей мере, часть аудиоданных, принятых коммутатором 203 и/или декоррелятором 205. Элементы 220 аудиоданных принимаются микшером 215 и генератором 218 сигналов декорреляции. В некоторых реализациях элементы 220 аудиоданных могут соответствовать аудиоданным в диапазоне частот каналов связывания, в то время как элементы 245 аудиоданных могут соответствовать аудиоданным в диапазоне частот вне диапазона частот каналов связывания. Например, элементы 245 аудиоданных могут соответствовать аудиоданным, находящимся в диапазоне частот выше и/или ниже диапазона частот каналов связывания.

[00266] В этой реализации приемник/генератор 640 управляющей информации определяет управляющую информацию 625 генератора сигналов декорреляции и управляющую информацию 645 микшера в соответствии со сведениями 240 о декорреляции, элементами 220 аудиоданных и/или элементами 245 аудиоданных. Приемник/генератор 640 управляющей информации предоставляет управляющую информацию 625 генератора сигналов декорреляции и управляющую информацию 645 микшера, соответственно, генератору 218 сигналов декорреляции и микшеру 215.

[00267] В некоторых реализациях приемник/генератор 640 управляющей информации может быть сконфигурирован для определения сведений о тональности и для определения управляющей информации 625 генератора сигналов декорреляции и/или управляющей информации 645 микшера, по меньшей мере, частично на основе этих сведений о тональности. Например, приемник/генератор 640 управляющей информации может быть сконфигурирован для приема явных сведений о тональности посредством таких явных сведений о тональности, как флаги тональности, являющихся частью сведений 240 о декорреляции. Приемник/генератор 640 управляющей информации может быть сконфигурирован для обработки принятых явных сведений о тональности и определения управляющей информации тональности.

[00268] Например, если приемник/генератор 640 управляющей информации определяет, что аудиоданные в диапазоне частот каналов связывания являются высокотональными, то приемник/генератор 640 управляющей информации может быть сконфигурирован для создания управляющей информации 625 генератора сигналов декорреляции, указывающей, что значение максимального шага следует установить на нуль или около нуля, что вызывает возникновение небольшого изменения в полюсах или отсутствие таких изменений. Впоследствии (например, в течение промежутка времени нескольких блоков) это значение максимального шага может быть линейно изменено до большего значения. В некоторых реализациях, если приемник/генератор 640 управляющей информации определяет, что аудиоданные в диапазоне частот каналов связывания являются высокотональными, то приемник/генератор 640 управляющей информации может быть сконфигурирован для указания модулю 665 пространственных параметров, что при вычислении различных количественных величин, таких как энергии, используемые при оценивании пространственных параметров, можно применять относительно более высокую степень сглаживания. Другие примеры откликов на определение высокотональных аудиоданных представлены в других местах настоящего описания.

[00269] В некоторых реализациях приемник/генератор 640 управляющей информации может быть сконфигурирован для определения сведений о тональности в соответствии с одним или несколькими определяющими признаками аудиоданных 220 и/или в соответствии со сведениями из битового потока унаследованного аудиокода, принимаемыми посредством таких сведений 240 о декорреляции, как сведения об экспонентах и/или сведения о долгосрочном поведении экспонент.

[00270] Например, в битовом потоке аудиоданных, кодированном в соответствии с аудиокодеком Е-АС-3, экспоненты для коэффициентов преобразования являются разностно кодированными. Сумма абсолютных разностей экспонент в диапазоне частот является мерой расстояния, пройденного вдоль огибающей спектра сигнала в области логарифмических амплитуд. Такие сигналы, как камертон-дудка и клавесин, имеют спектр в форме частокола, и поэтому путь, мерой которого является это расстояние, характеризуется множеством пиков и долин. Поэтому для таких сигналов расстояние, пройденное вдоль огибающей спектра в том же диапазоне частот, является бóльшим, чем для сигналов, имеющих относительно равномерный спектр.

[00271] Поэтому в некоторых реализациях приемник/генератор 640 управляющей информации может быть сконфигурирован для определения метрики тональности, по меньшей мере, частично в соответствии с разностями экспонент в диапазоне частот каналов связывания. Например, приемник/генератор 640 управляющей информации может быть сконфигурирован для определения метрики тональности на основе средней абсолютной разности экспонент в диапазоне частот каналов связывания. В соответствии с некоторыми такими реализациями, метрика тональности вычисляется только тогда, когда долгосрочное поведение экспонент связывания является общим для всех блоков в кадре и не указывает совместное использование частот экспонент, так как в этом случае имеет смысл определять разность экспонент от одного элемента разрешения по частоте к следующему. В соответствии с некоторыми реализациями, метрику тональности вычисляют только в том случае, если для канала связывания установлен флаг адаптивного гибридного преобразования («АНТ») Е-АС-3.

[00272] Если метрику тональности определяют, как абсолютную разность экспонент аудиоданных Е-АС-3, то в некоторых реализациях эта метрика тональности может принимать значения от 0 до 2, поскольку –2, –1, 0, 1 и 2 являются единственными разностями экспонент, допустимыми в соответствии с Е-АС-3. Для проведения различий между тональными и нетональными сигналами можно задать одно или несколько пороговых значений тональности. Например, некоторые реализации включают задание одного порогового значения для входа в тональное состояние и еще одного порогового значения – для выхода из тонального состояния. Пороговое значение для входа в тональное состояние может быть ниже порогового значения для выхода из тонального состояния. Такие реализации обеспечивают некоторую степень гистерезиса, такую, чтобы значения тональности немного ниже верхнего порогового значения не вызывали непредусмотренного вызова изменения тонального состояния. В одном примере пороговое значение для входа в тональное состояние составляет 0,40, в то время как пороговое значение для выхода из тонального состояния составляет 0,45. Однако другие реализации могут содержать большее или меньшее количество пороговых значений, и эти пороговые значения могут иметь другие значения.

[00273] В некоторых реализациях вычисление метрики тональности может быть взвешено в соответствии с энергией, присутствующей в сигнале. Эту энергию можно вывести непосредственно из экспонент. Логарифмическая метрика энергии может быть обратно пропорциональна экспонентам, поскольку в Е-АС-3 экспоненты представлены как отрицательные степени двойки. В соответствии с такими реализациями, те части спектра, которые имеют низкую энергию, будут вносить меньший вклад в общую метрику тональности, чем те части спектра, которые имеют более высокую энергию. В некоторых реализациях вычисление метрики тональности может быть выполнено только на нулевом блоке кадра.

[00274] В примере, показанном на фиг. 6С, декоррелированные аудиоданные 230 из микшера 215 доставляются в коммутатор 203. В некоторых реализациях коммутатор 203 может определять, какие составляющие прямых аудиоданных 220 и декоррелированных аудиоданных 230 будут отправлены в модуль 255 обратного преобразования. Соответственно, в некоторых реализациях система 200 обработки аудиоданных может предусматривать избирательную, или адаптивную к сигналу, декорреляцию составляющих аудиоданных. Например, в некоторых реализациях система 200 обработки аудиоданных может обеспечивать адаптивную к сигналу декорреляцию конкретных каналов аудиоданных. Альтернативно или дополнительно в некоторых реализациях система 200 обработки аудиоданных может обеспечивать избирательную, или адаптивную к сигналу, декорреляцию конкретных полос частот аудиоданных.

[00275] В различных реализациях системы 200 обработки аудиоданных приемник/генератор 640 управляющей информации может быть сконфигурирован для определения параметров аудиоданных 220 одного или нескольких типов. В некоторых реализациях, по меньшей мере, некоторые такие функциональные возможности могут быть обеспечены модулем 665 пространственных параметров, показанным на фиг. 6С. Некоторые такие пространственные параметры могут представлять собой коэффициенты корреляции между отдельными обособленными каналами и каналом связывания, которые в настоящем описании также могут именоваться «коэффициентами alpha». Например, если канал связывания содержит аудиоданные для четырех каналов, может иметься четыре коэффициента alpha – по одному alpha для каждого канала. В некоторых реализациях этими четырьмя каналами могут быть левый канал («L»), правый канал («R»), левый окружающий канал («Ls») и правый окружающий канал («Rs»). В некоторых реализациях канал связывания может содержать аудиоданные для вышеописанных каналов и для центрального канала. Коэффициент alpha можно вычислять или не вычислять для центрального канала в зависимости от того, будет ли центральный канал подвергаться декорреляции. Другие реализации могут содержать большее или меньшее количество каналов.

[00276] Другие пространственные параметры могут представлять собой межканальные коэффициенты корреляции, указывающие корреляцию между парами отдельных обособленных каналов. Такие параметры могут иногда именоваться в настоящем описании как отражающие «межканальную когерентность» или «ICC». В вышеупомянутом четырехканальном примере, может существовать шесть привлеченных значений ICC: для пары L–R, пары L–Ls, пары L–Rs, пары R–Ls, пары R–Rs и пары Ls–Rs.

[00277] В некоторых реализациях определение приемником/генератором 640 управляющей информации пространственных параметров может включать прием явных пространственных параметров в битовом потоке посредством сведений 240 о декорреляции. Альтернативно или дополнительно приемник/генератор 640 управляющей информации может быть сконфигурирован для оценки, по меньшей мере, некоторых пространственных параметров. Приемник/генератор 640 управляющей информации может быть сконфигурирован для определения параметров микширования, по меньшей мере, частично на основе пространственных параметров. Соответственно, в некоторых реализациях функции, относящиеся к определению и обработке пространственных параметров, могут, по меньшей мере, частично выполняться модулем 660 управления микшером.

[00278] Фиг. 7A и 7B – векторные диаграммы, представляющие упрощенную иллюстрацию пространственных параметров. Фиг. 7А и 7В можно рассматривать как трехмерное отвлеченное представление сигналов в N-мерном векторном пространстве. Каждый N-мерный вектор может представлять вещественно- или комплекснозначную случайную переменную, N координат которой соответствуют любым N независимых испытаний. Например, N координат могут соответствовать набору из N коэффициентов сигнала в частотной области в пределах одного из диапазонов частот и/или в пределах некоторого промежутка времени (например, в течение нескольких аудиоблоков).

[00279] Со ссылкой, в первую очередь, на фиг. 7А, эта векторная диаграмма представляет пространственные взаимосвязи между левым входным каналом lin, правым входным каналом rin и каналом связывания xmono – монофоническим низведенным сигналом, сформированным путем суммирования lin и rin. Фиг. 7А представляет собой упрошенный пример формирования канала связывания, которое может выполняться кодирующим устройством. Коэффициентом корреляции между левым входным каналом lin и каналом связывания xmono является αL, а коэффициентом корреляции между правым входным каналом rin и каналом связывания является αR. Соответственно, угол θL между векторами, представляющими левый входной канал lin и канал связывания xmono, равен arccos(αL), а угол θR между векторами, представляющими правый входной канал rin и канал связывания xmono, равен arccos(αR).

[00280] Правая панель фиг. 7А показывает упрощенный пример декорреляции отдельного выходного канала из канала связывания. Процесс декорреляции этого типа может выполняться, например, декодирующим устройством. При генерировании сигнала декорреляции yL, являющегося некоррелированным с каналом связывания xmono (перпендикулярным каналу), и его микшировании с каналом связывания xmono с использованием надлежащих весовых коэффициентов, амплитуда отдельного выходного канала (в этом примере – lout) и ее угловое расстояние от канала связывания xmono может точно отражать амплитуду отдельного входного канала и его пространственную взаимосвязь с каналом связывания. Сигнал декорреляции yL должен обладать таким же распределением мощности (представленным здесь длиной вектора), как и канал связывания xmono. В этом примере, lout = αL xmono + QUOTE yL. Обозначая = βL, lout = αL xmono + βL yL.

[00281] Однако восстановление пространственной взаимосвязи между отдельными обособленными каналами и каналом связывания не гарантирует восстановление пространственных взаимосвязей между обособленными каналами (представляемых значениями ICC). Этот факт проиллюстрирован на фиг. 7В. Две панели фиг. 7В показывают два крайних случая. Расстояние между lout и rout является максимальным, когда сигналы декорреляции yL и yR разнесены на 180°, как показано на левой панели фиг. 7B. В этом случае ICC между левым и правым каналом является минимальным, а разнесение фаз между lout и rout является максимальным. Напротив, как показано на правой панели фиг. 7В, расстояние между lout и rout является минимальным тогда, когда сигналы декорреляции yL и yR разнесены на 0°. В этом случае ICC между левым и правым каналами является максимальным, а разнесение фаз между lout и rout является минимальным.

[00282] В примерах, показанных на фиг. 7В, все проиллюстрированные векторы находятся в одной и той же плоскости. В других примерах yL и yR могут быть расположены под другими углами один относительно другого. Однако предпочтительно, чтобы yL и yR были перпендикулярны, или, по меньшей мере, по существу, перпендикулярны, каналу связывания xmono. В некоторых примерах любой из сигналов yL и yR может, по меньшей мере, частично проходить в плоскость, ортогональную плоскости по фиг. 7В.

[00283] Так как обособленные каналы, в конечном счете, воспроизводятся и представляются слушателям, надлежащее восстановление пространственных взаимосвязей между обособленными каналами (когерентностей ICC) может значительно улучшать восстановление пространственных характеристик аудиоданных. Как видно из примеров по фиг. 7В, точное восстановление когерентностей ICC зависит от создания сигналов декорреляции (здесь – yL и yR), обладающих надлежащими пространственными взаимосвязями друг с другом. Эта корреляция между сигналами декорреляции может именоваться в настоящем описании «когерентностью между сигналами декорреляции», или «IDC».

[00284] На левой панели фиг. 7В IDC между yL и yR равна –1. Как указывалось выше, IDC соответствует минимальной ICC между левым и правым каналами. Сравнивая левую панель фиг. 7В с левой панелью фиг. 7А, можно наблюдать, что в этом примере с двумя связанными каналами пространственная взаимосвязь между lout и rout точно отражает пространственную взаимосвязь между lin и rin. На левой панели фиг. 7В IDC между yL и yR равна 1 (полная корреляция). При сравнении правой панели фиг. 7В с левой панелью фиг. 7А видно, что в этом примере пространственная взаимосвязь между lout и rout неточно отражает пространственную взаимосвязь между lin и rin.

[00285] Соответственно, приравнивая IDC между соседними в пространстве отдельными каналами –1, можно свести к минимуму ICC между этими каналами и близко восстановить пространственную взаимосвязь между этими каналами тогда, когда эти каналы являются преобладающими. Эти результаты во всем звуковом образе в восприятии приближаются к звуковому образу первоначального звукового сигнала. Такие способы могут именоваться в настоящем описании способами «зеркального отображения знаков». В таких способах требуется знание фактических когерентностей ICC.

[00286] Фиг. 8А – схема последовательности операций, иллюстрирующая блоки некоторых способов декорреляции, представленных в настоящем описании. Как и для других способов, описываемых в настоящем описании, блоки способа 800 необязательно выполняются в порядке. Более того, некоторые реализации способа 800 и других способов могут содержать большее или меньшее количество блоков, чем это указывается или описывается. Способ 800 начинается с блока 802, где принимаются аудиоданные, соответствующие ряду звуковых каналов. Эти аудиоданные могут, например, быть приняты одним из компонентов системы звукового декодирования. В некоторых реализациях эти аудиоданные могут быть приняты таким декоррелятором системы звукового декодирования, как одна из реализаций декоррелятора 205, раскрываемого в настоящем описании. Аудиоданные могут содержать аудиоданные для ряда звуковых каналов, выработанные путем повышающего микширования аудиоданных, соответствующих каналу связывания. В соответствии с некоторыми реализациями, эти аудиоданные могли быть подвергнуты повышающему микшированию путем применения специфичных для каналов, зависящих от времени масштабных коэффициентов к аудиоданным, соответствующим каналу связывания. Ниже представлены некоторые примеры.

[00287] В этом примере блок 804 включает определение звуковых характеристик аудиоданных. Здесь эти звуковые характеристики содержат данные пространственных параметров. Эти данные пространственных параметров могут содержать коэффициенты alpha – коэффициенты корреляции между отдельными звуковыми каналами и каналом связывания. Блок 804 может включать прием данных пространственных параметров, например, посредством сведений 240 о декорреляции, описанных выше со ссылкой на фиг. 2А et seq. Альтернативно или дополнительно блок 804 может включать оценивание пространственных параметров на месте, например, посредством приемника/генератора 640 управляющей информации (см., например, фиг. 6В или 6С). В некоторых реализациях блок 804 может включать определение других звуковых характеристик, таких как характеристики кратковременных событий или характеристики тональности.

[00288] Здесь блок 806 включает определение по меньшей мере двух процессов декорреляционной фильтрации для аудиоданных, по меньшей мере, частично на основе звуковых характеристик. Эти процессы декорреляционной фильтрации могут представлять собой специфичные для каналов процессы декорреляционной фильтрации. В соответствии с некоторыми реализациями, каждый из процессов декорреляционной фильтрации, определяемых в блоке 806, содержит последовательность операций, относящихся к декорреляции.

[00289] Применение по меньшей мере двух процессов декорреляционной фильтрации, определяемых в блоке 806, может вырабатывать специфичные для каналов сигналы декорреляции. Например, применение процессов декорреляционной фильтрации, определяемых в блоке 806, может приводить к специфичной когерентности между сигналами декорреляции («IDC») между специфичными для каналов сигналами декорреляции для по меньшей мере одной пары каналов. Некоторые такие процессы декорреляционной фильтрации могут включать применение по меньшей мере одного декорреляционного фильтра, по меньшей мере, к части аудиоданных (например, как описывается ниже со ссылкой на блок 820 по фиг. 8В или фиг. 8Е) для выработки фильтрованных аудиоданных, также именуемых в настоящем описании сигналами декорреляции. Дальнейшие операции могут выполняться на этих фильтрованных аудиоданных для выработки специфичных для каналов сигналов декорреляции. Некоторые такие процессы декорреляционной фильтрации могут включать процесс поперечного зеркального отображения знаков, такой как один из процессов зеркального отображения знаков, описываемых ниже со ссылкой на фиг. 8В–8D.

[00290] В некоторых реализациях в блоке 806 может быть определено, что для выработки фильтрованных аудиоданных, соответствующих всем каналам, которые будут подвергаться декорреляции, будет использован один и тот же декорреляционный фильтр, в то время как в других реализациях в блоке 806 может быть определено, что с целью выработки фильтрованных аудиоданных для, по меньшей мере, некоторых каналов, которые будут подвергаться декорреляции, будет использован другой декорреляционный фильтр. В некоторых реализациях в блоке 806 может быть определено, что аудиоданные, соответствующие центральному каналу, не будут подвергаться декорреляции, в то время как в других реализациях блок 806 может включать определение отличающегося декорреляционного фильтра к аудиоданным центрального канала. Более того, несмотря на то, что в некоторых реализациях каждый из процессов декорреляционной фильтрации, определяемых в блоке 806, содержит последовательность операций, относящихся к декорреляции, в альтернативных реализациях каждый из процессов декорреляционной фильтрации, определяемых в блоке 806, может соответствовать определенной ступени процесса декорреляции в целом. Например, в альтернативных реализациях каждый из процессов декорреляционной фильтрации, определяемых в блоке 806, может соответствовать определенной операции (или группе связанных операций) в последовательности операций, относящихся к генерированию сигнала декорреляции для по меньшей мере двух каналов.

[00291] В блоке 808 будут реализовываться процессы декорреляционной фильтрации, определенные в блоке 806. Например, блок 808 может включать применение декорреляционного фильтра, или фильтров, по меньшей мере, к части принятых аудиоданных для выработки фильтрованных аудиоданных. Эти фильтрованные аудиоданные могут, например, соответствовать сигналам 227 декорреляции, вырабатываемым генератором 218 сигналов декорреляции, описанным выше со ссылкой на фиг. 2F, 4 и/или 6А–6С. Блок 808 также может включать различные другие операции, примеры которых представлены ниже.

[00292] Здесь блок 810 включает определение параметров микширования, по меньшей мере, частично на основе звуковых характеристик. Блок 810 может, по меньшей мере, частично быть выполнен модулем 660 управления микшером приемника/генератора 640 управляющей информации (см. фиг. 6С). В некоторых реализациях эти параметры микширования могут представлять собой специфичные для выходных каналов параметры микширования. Например, блок 810 может включать прием или оценивание значений коэффициентов alpha для каждого из звуковых каналов, которые будут подвергаться декорреляции, и определение параметров микширования, по меньшей мере, частично на основе этих коэффициентов alpha. В некоторых реализациях коэффициенты alpha могут быть модифицированы в соответствии со сведениями о кратковременных событиях, которые могут определяться модулем 655 управления кратковременными событиями (см. фиг. 6С). В блоке 812 фильтрованные аудиоданные могут подвергаться микшированию с прямой частью аудиоданных в соответствии с параметрами микширования.

[00293] Фиг. 8В – схема последовательности операций, иллюстрирующая блоки способа поперечного зеркального отображения знаков. В некоторых реализациях блоки, показанные на фиг. 8В, представляют собой примеры блока 806 «определения» и блока 808 «применения» по фиг. 8А. Соответственно, эти блоки помечены на фиг. 8В как «806a» и «808a». В этом примере блок 806а включает определение декорреляционных фильтров и полярности сигналов декорреляции для по меньшей мере двух соседних каналов с целью вызова специфичной IDC между сигналами декорреляции для этой пары каналов. В этой реализации блок 820 включает применение одного или нескольких декорреляционных фильтров, определенных в блоке 806а, по меньшей мере, к части принятых аудиоданных для выработки фильтрованных аудиоданных. Эти фильтрованные аудиоданные могут, например, соответствовать сигналам 227 декорреляции, вырабатываемым генератором 218 сигналов декорреляции, описанным выше со ссылкой на фиг. 2Е и 4.

[00294] В некоторых четырехканальных примерах блок 820 может включать применение первого декорреляционного фильтра к аудиоданным для первого и второго каналов с целью выработки фильтрованных данных первого канала и фильтрованных данных второго канала и применение второго декорреляционного фильтра к аудиоданным для третьего и четвертого каналов с целью выработки фильтрованных данных третьего канала и фильтрованных данных четвертого канала. Например, первым каналом может быть левый канал, вторым каналом может быть правый канал, третьим каналом может быть левый окружающий канал, и четвертым каналом может быть правый окружающий канал.

[00295] В зависимости от конкретной реализации, декорреляционные фильтры можно применять либо перед, либо после повышающего микширования аудиоданных. Например, в некоторых реализациях декорреляционный фильтр можно применять к каналу связывания аудиоданных. Впоследствии можно применить коэффициент масштабирования, соответствующий каждому каналу. Некоторые примеры описаны ниже со ссылкой на фиг. 8С.

[00296] Фиг. 8С и 8D – блок-схемы, иллюстрирующие компоненты, которые можно использовать для реализации некоторых способов зеркального отображения знаков. Со ссылкой, в первую очередь, на фиг. 8В, в этой реализации декорреляционный фильтр применяется к каналу связывания для входных аудиоданных в блоке 820. В примере, показанном на фиг. 8С, генератор 218 сигналов декорреляции принимает управляющую информацию 625 генератора сигналов декорреляции и аудиоданные 210, содержащие представления в частотной области, соответствующие каналу связывания. В этом примере генератор 218 сигналов декорреляции выводит сигналы 227 декорреляции, являющиеся одинаковыми для всех каналов, которые будут подвергаться декорреляции.

[00297] Процесс 808а по фиг. 8В может включать выполнение операций на фильтрованных аудиоданных для выработки сигналов декорреляции, обладающих специфичной когерентностью между сигналами декорреляции IDC между сигналами декорреляции для по меньшей мере одной пары каналов. В этой реализации блок 825 включает применение полярности к фильтрованным аудиоданным, выработанным в блоке 820. В этом примере полярность, применяемая в блоке 820, была определена в блоке 806а. В некоторых реализациях блок 825 включает обращение полярности между фильтрованными аудиоданными для соседних каналов. Например, блок 825 может включать умножение фильтрованных аудиоданных, соответствующих левому каналу или правому каналу, на –1. Блок 825 может включать обращение полярности фильтрованных аудиоданных, соответствующих левому окружающему каналу, относительно фильтрованных аудиоданных, соответствующих левому каналу. Блок 825 также может включать обращение полярности фильтрованных аудиоданных, соответствующих правому окружающему каналу, относительно фильтрованных аудиоданных, соответствующих правому каналу. В вышеописанном четырехканальном примере блок 825 может включать обращение полярности фильтрованных данных первого канала относительно фильтрованных данных второго канала и обращение полярности фильтрованных данных третьего канала относительно фильтрованных данных четвертого канала.

[00298] В примере, показанном на фиг. 8С, сигналы 227 декорреляции, также обозначаемые как y, принимаются модулем 840 обращения полярности. Модуль 840 обращения полярности сконфигурирован для обращения полярности сигналов декорреляции соседних каналов. В этом примере модуль 840 обращения полярности сконфигурирован для обращения полярности сигналов декорреляции для правого канала и левого окружающего канала. Однако в других реализациях модуль 840 обращения полярности может быть сконфигурирован для обращения полярности сигналов декорреляции и для других каналов. Например, модуль 840 обращения полярности может быть сконфигурирован для обращения полярности сигналов декорреляции для левого канала и правого окружающего канала. Другие реализации могут включать обращение полярности сигналов декорреляции и для других каналов в зависимости от количества привлеченных каналов и их пространственных взаимосвязей.

[00299] Модуль 840 обращения полярности создает сигналы 227 декорреляции, содержащие сигналы 227 декорреляции с зеркально отображенными знаками, в специфичные для каналов микшеры 215а–215d. Специфичные для каналов микшеры 215а–215d также принимают прямые, нефильтрованные аудиоданные 210 для канала связывания и сведения 630а–630d о специфичных для выходных каналов пространственных параметрах. Альтернативно или дополнительно в некоторых реализациях специфичные для каналов микшеры 215a–215d могут принимать модифицированные коэффициенты микширования 890, описываемые ниже со ссылкой на фиг. 8F. В этом примере сведения 630a–630d о специфичных для выходных каналов пространственных параметрах были модифицированы в соответствии с данными кратковременных событий, например, в соответствии с вводом из такого модуля управления кратковременными событиями, как модуль, изображенный на фиг. 6С. Ниже представлены примеры модификации пространственных параметров в соответствии с данными кратковременных событий.

[00300] В этой реализации специфичные для каналов микшеры 215a–215d микшируют сигналы 227 декорреляции с прямыми аудиоданными 210 из канала связывания в соответствии со сведениями 630a–630d о специфичных для выходных каналов пространственных параметрах и выводят результирующие специфичные для выходных каналов микшированные аудиоданные 845a–845d в модули управления усилением 850a–850d. В этом примере модули 850a–850d управления усилением сконфигурированы для применения специфичных для выходных каналов коэффициентов усиления, также именуемых в настоящем описании масштабными коэффициентами, к специфичным для выходных каналов микшированным аудиоданным 845a–845d.

[00301] Один из альтернативных способов зеркального отображения знаков будет описан ниже со ссылкой на фиг. 8D. В этом примере специфичные для каналов декорреляционные фильтры, по меньшей мере, частично основанные на управляющей информации 847a–847d специфичной для каналов декорреляции, применяются генераторами 218a–218d сигналов декорреляции к аудиоданным 210а–210d. В некоторых реализациях управляющая информация 847a–847d генератора сигналов декорреляции может быть принята в битовом потоке наряду с аудиоданными, в то время как в других реализациях управляющая информация 847a–847d генератора сигналов декорреляции может генерироваться на месте, например, (по меньшей мере, частично) модулем 405 управления декорреляционными фильтрами. Здесь генераторы 218a–218d сигналов декорреляции также могут генерировать специфичные для каналов декорреляционные фильтры в соответствии со сведениями о коэффициентах декорреляционных фильтров, принятыми из модуля 405 управления декорреляционными фильтрами. В некоторых реализациях модуль 405 управления декорреляционными фильтрами может генерировать единственное описание фильтра, совместно используемое всеми каналами.

[00302] В этом примере специфичный для каналов коэффициент усиления/масштабный коэффициент был применен к аудиоданным 210а–210d перед приемом аудиоданных 210а–210d генераторами 218а–218d сигналов декорреляции. Например, если аудиоданные были закодированы в соответствии с аудиокодеками АС-3 или Е-АС-3, то эти масштабные коэффициенты могут представлять собой координаты связывания, или «cplcoords», которые были закодированы вместе с остальными аудиоданными и приняты в битовом потоке такой системой обработки аудиоданных, как декодирующее устройство. В некоторых реализациях координаты cplcoords также могут представлять собой основу для специфичных для выходных каналов масштабных коэффициентов, применяемых модулями 850а–850d управления усилением к специфичным для выходных каналов микшированным аудиоданным 845a–845d (см. фиг. 8С).

[00303] Соответственно, генераторы 218а–218d сигналов декорреляции выводят специфичные для выходных каналов сигналы 227a–227d декорреляции для всех каналов, которые будут подвергаться декорреляции. Сигналы 227a–227d декорреляции также именуются на фиг. 8D, соответственно, как yL, yR, yLS и yRS.

[00304] Сигналы 227a–227d декорреляции принимаются модулем 840 обращения полярности. Модуль 840 обращения полярности сконфигурирован для обращения полярности сигналов декорреляции соседних каналов. В этом примере модуль 840 обращения полярности сконфигурирован для обращения полярности сигналов декорреляции для правого канала и левого окружающего канала. Однако в других реализациях модуль 840 обращения полярности может быть сконфигурирован для обращения полярности сигналов декорреляции и для других каналов. Например, модуль 840 обращения полярности может быть сконфигурирован для обращения полярности сигналов декорреляции для левого и правого окружающего каналов. Другие реализации могут включать обращение полярности сигналов декорреляции и для других каналов в зависимости от количества привлеченных каналов и их пространственных взаимосвязей.

[00305] Модуль 840 обращения полярности предоставляет сигналы 227a–227d декорреляции, содержащие сигналы 227b и 227с декорреляции с зеркально отображенными знаками, специфичным для каналов микшерам 215a–215d. Здесь специфичные для каналов микшеры 215a–215d также принимают прямые аудиоданные 210a–210d и сведения 630a–630d о специфичных для выходных каналов пространственных параметрах. В этом примере сведения 630a–630d о специфичных для выходных каналов пространственных параметрах были модифицированы в соответствии с данными кратковременных событий.

[00306] В этой реализации специфичные для каналов микшеры 215a–215d микшируют сигналы 227 декорреляции с прямыми аудиоданными 210a–210d в соответствии со сведениями 630a–630d о специфичных для выходных каналов пространственных параметрах и выводят специфичные для выходных каналов микшированные аудиоданные 845a–845d.

[00307] В настоящем описании предусмотрены и альтернативные способы восстановления пространственной взаимосвязи между обособленными входными каналами. Эти способы могут включать систематическое определение коэффициентов синтеза для определения того, каким образом будут синтезированы сигналы декорреляции, или реверберации. В соответствии с некоторыми такими способами, исходя из коэффициентов alpha и целевых когерентностей ICC, определяют оптимальные когерентности IDC. Такие способы могут включать систематический синтез набора специфичных для каналов сигналов декорреляции в соответствии с когерентностями IDC, определенными как являющиеся оптимальными.

[00308] Общий вид некоторых таких систематических способов будет описан ниже со ссылкой на фиг. 8Е и 8F. Ниже будут описаны дальнейшие подробности, в том числе математические формулы, лежащие в основе некоторых примеров.

[00309] Фиг. 8Е – схема последовательности операций, иллюстрирующая блоки одного из способов определения коэффициентов синтеза и коэффициентов микширования исходя из данных пространственных параметров. Фиг. 8F – блок-схема, показывающая примеры компонентов микшера. В этом примере способ 851 начинается после блоков 802 и 804 по фиг. 8А. Соответственно, блоки, показанные на фиг. 8Е, можно считать дальнейшими примерами блока 806 «определения» и блока 808 «применения» по фиг. 8А. Поэтому блоки 855–865 по фиг. 8Е помечены как «806b», а блоки 820 и 870 помечены как «808b».

[00310] Однако в этом примере процессы декорреляции, определяемые в блоке 806, могут включать выполнение операции на фильтрованных аудиоданных в соответствии с коэффициентами синтеза. Ниже представлены некоторые примеры.

[00311] Необязательный блок 855 может включать преобразование из одной формы пространственных параметров в одно из эквивалентных представлений. Со ссылкой на фиг. 8F, например, модуль 880 генерирования коэффициентов синтеза и микширования может принимать сведения 630b о пространственных параметрах, содержащие сведения, описывающие пространственные взаимосвязи между N входных каналов или подмножество этих пространственных взаимосвязей. Модуль 880 может быть сконфигурирован для преобразования, по меньшей мере, некоторых из сведений 630b о пространственных параметрах из одной формы пространственных параметров в одно из эквивалентных представлений. Например, коэффициенты alpha могут быть преобразованы в когерентности ICC или наоборот.

[00312] В альтернативных реализациях системы обработки аудиоданных, по меньшей мере, некоторые из функциональных возможностей модуля 880 генерирования коэффициентов синтеза и микширования могут выполнять и иные, чем микшер 215, элементы. Например, в некоторых альтернативных реализациях, по меньшей мере, некоторые из функциональных возможностей модуля 880 генерирования коэффициентов синтеза и микширования могут выполняться приемником/генератором 640 управляющей информации, таким как приемник/генератор, показанный на фиг. 6С и описанный выше.

[00313] В этой реализации блок 860 включает определение требуемой пространственной взаимосвязи между выходными каналами в выражении представления пространственных параметров. Как показано на фиг. 8F, в некоторых реализациях модуль 880 генерирования коэффициентов синтеза и микширования может принимать сведения 635 о понижающем/повышающем микшировании, которые могут содержать сведения, соответствующие сведениям 266 о микшировании, принимаемым повышающим/понижающим микшером 262 N-в-M, и/или сведениям 268 о микшировании, принимаемым повышающим/понижающим микшером 264 М-в-K, по фиг. 2Е. Модуль 880 генерирования коэффициентов синтеза и микширования также может принимать сведения 630а о пространственных параметрах, содержащие сведения, описывающие пространственные взаимосвязи между K выходных каналов или подмножество этих пространственных взаимосвязей. Как было описано выше со ссылкой на фиг. 2Е, количество входных каналов может быть равно, или может быть не равно количеству выходных каналов. Модуль 880 может быть сконфигурирован для вычисления требуемой пространственной взаимосвязи (например, ICC) между, по меньшей мере, некоторыми парами из K выходных каналов.

[00314] В этом примере блок 865 включает определение коэффициентов синтеза на основе требуемых пространственных взаимосвязей. Коэффициенты микширования также могут быть, по меньшей мере, частично определены на основе требуемых пространственных взаимосвязей. Снова со ссылкой на фиг. 8F, в блоке 865 модуль 880 генерирования коэффициентов синтеза и микширования может определять параметры 615 синтеза сигналов декорреляции в соответствии с требуемыми пространственными взаимосвязями между выходными каналами. Модуль 880 генерирования коэффициентов синтеза и микширования также может определять коэффициенты 620 микширования в соответствии с требуемыми пространственными взаимосвязями между выходными каналами.

[00315] Модуль 880 генерирования коэффициентов синтеза и микширования может предоставлять параметры 615 синтеза сигналов декорреляции синтезатору 605. В некоторых реализациях параметры 615 синтеза сигналов декорреляции могут являться специфичными для выходных каналов. В этом примере синтезатор 605 также принимает сигналы 227 декорреляции, которые могут вырабатываться таким генератором 218 сигналов декорреляции, как генератор, показанный на фиг. 6А.

[00316] В этом примере блок 820 включает применение одного или нескольких декорреляционных фильтров, по меньшей мере, к части принятых аудиоданных для выработки фильтрованных аудиоданных. Эти фильтрованные аудиоданные могут, например, соответствовать сигналам 227 декорреляции, вырабатываемым генератором 218 сигналов декорреляции, описанным выше со ссылкой на фиг. 2Е и 4.

[00317] Блок 870 может включать синтез сигналов декорреляции в соответствии с коэффициентами синтеза. В некоторых реализациях блок 870 может включать синтез сигналов декорреляции путем выполнения операций на фильтрованных аудиоданных, вырабатываемых в блоке 820. Как таковые, синтезированные сигналы декорреляции можно считать модифицированной версией фильтрованных аудиоданных. В примере, показанном на фиг. 8F, синтезатор 605 может быть сконфигурирован для выполнения операций на сигналах 227 декорреляции в соответствии с параметрами 615 синтеза сигналов декорреляции и вывода синтезированных сигналов 886 декорреляции в микшер 610 прямых сигналов и сигналов декорреляции. Здесь синтезированные сигналы 886 декорреляции представляют собой специфичные для каналов синтезированные сигналы декорреляции. В некоторых таких реализациях блок 870 может включать умножение специфичных для каналов синтезированных сигналов декорреляции на масштабные коэффициенты, соответствующие каждому из каналов, для выработки масштабированных специфичных для каналов синтезированных сигналов 886 декорреляции. В этом примере синтезатор 605 создает линейные комбинации сигналов 227 декорреляции в соответствии с параметрами 615 синтеза сигналов декорреляции.

[00318] Модуль 880 генерирования коэффициентов синтеза и масштабирования может предоставлять коэффициенты 620 микширования модулю 888 управления кратковременными событиями в микшере. В этой реализации коэффициенты 620 микширования представляют собой специфичные для выходных каналов коэффициенты микширования. Модуль 888 управления кратковременными событиями в микшере может принимать управляющую информацию 430 кратковременных событий. Управляющая информация 430 кратковременных событий может быть принята наряду с аудиоданными или может быть определена на месте, например, таким модулем управления кратковременными событиями, как модуль 655 управления кратковременными событиями, показанный на фиг. 6С. Модуль 888 управления кратковременными событиями в микшере может вырабатывать модифицированные коэффициенты 890 микширования, по меньшей мере, частично на основе управляющей информации 430 кратковременных событий и может предоставлять модифицированные коэффициенты 890 микширования микшеру 610 прямых сигналов и сигналов декорреляции.

[00319] Микшер 610 прямых сигналов и сигналов декорреляции может микшировать синтезированные сигналы 886 декорреляции с прямыми, нефильтрованными аудиоданными 220. В этом примере аудиоданные 220 содержат элементы аудиоданных, соответствующие N входных каналов. Микшер 610 прямых сигналов и сигналов декорреляции микширует элементы аудиоданных и специфичные для каналов синтезированные сигналы 886 декорреляции на специфичной для выходных каналов основе и, в зависимости от конкретной реализации (см., например, фиг. 2Е и соответствующее описание), выводит декоррелированные аудиоданные 230 для N или М выходных каналов.

[00320] Ниже следуют подробные примеры некоторых из процессов способа 851. Несмотря на то, что эти способы описываются, по меньшей мере, частично со ссылкой на характерные признаки аудиокодеков АС-3 и Е-АС-3, эти способы имеют широкую применимость ко многим другим аудиокодекам.

[00321] Целью некоторых таких способов является точное воспроизведение всех когерентностей ICC (или выбранного набора когерентностей ICC) с целью восстановления пространственных характеристик исходных аудиоданных, которые могли быть утеряны из-за связывания каналов. Функциональные возможности микшера можно сформулировать как:

(Уравнение 1)

[00322] В уравнении 1 x представляет сигнал канала связывания, αi представляет пространственный параметр alpha для канала I, gi представляет координату «cplcoord» (соответствующую масштабному коэффициенту) для канала I, yi представляет декоррелированный сигнал, и Di(x) представляет сигнал декорреляции, генерируемый декорреляционным фильтром Di. Желательно, чтобы вывод декорреляционного фильтра обладал таким же распределением спектральной мощности, как и входные аудиоданные, но был некоррелированным с этими входными аудиоданными. В соответствии с аудиокодеками АС-3 и Е-АС-3, координаты cplcoords и коэффициенты alpha являются относящимися к полосе частот каналов связывания, тогда как сигналы и фильтр относятся к элементу разрешения по частоте. Кроме того, дискретные значения этих сигналов соответствуют блокам коэффициентов набора фильтров. Ради простоты здесь опущены временные и частотные индексы.

[00323] Значения коэффициентов alpha представляют корреляцию между обособленными каналами исходных аудиоданных и каналом связывания, что можно выразить следующим образом:

(Уравнение 2)

[00324] В уравнении 2 E представляет математическое ожидание члена (членов) в фигурных скобках, x* представляет комплексно сопряженное x, и si представляет обособленный сигнал для канала I.

[00325] Межканальную когерентность, или ICC, между парой декоррелированных сигналов можно получить следующим образом:

(Уравнение 3)

[00326] В уравнении 3, IDCi1,i2 когерентность между сигналами декорреляции («IDC») между Di1(x) и Di2(x). При фиксированных коэффициентах alpha ICC является максимальной, когда IDC равна +1, и минимальной – когда IDC равна –1. Когда ICC исходных аудиоданных известна, оптимальную IDC, необходимую для ее дублирования, можно найти как:

(Уравнение 4)

[00327] ICC между декоррелированными сигналами можно управлять, выбирая сигналы декорреляции, удовлетворяющие оптимальным условиям IDC по уравнению 4. Ниже будут обсуждаться некоторые способы генерирования таких сигналов декорреляции. Перед этим обсуждением может быть полезным описать взаимосвязи между некоторыми из этих пространственных параметров, особенно между когерентностями ICC и коэффициентами alpha.

[00328] Как было указано выше со ссылкой на необязательный блок 855 способа 851, некоторые представленные в настоящем описании реализации могут включать преобразование из одной формы пространственных параметров в эквивалентное представление. В некоторых таких реализациях необязательный блок 855 может включать преобразование из коэффициентов alpha в когерентности ICC или наоборот. Например, коэффициенты alpha могут быть однозначно определены, если известны как координаты cplcoords (или сопоставимые масштабные коэффициенты), так и когерентности ICC.

[00329] Канал связывания можно генерировать следующим образом:

(Уравнение 5)

[00330] В уравнении 5 si представляет обособленный сигнал для канала i, вовлеченного в связывание, а gx представляет произвольную регулировку усиления, применяемую к x. Путем замены члена x по уравнению 2 на эквивалентное выражение по уравнению 5, alpha для канала i можно выразить следующим образом:

[00331] Мощность каждого обособленного канала можно представить посредством мощности канала связывания и мощности соответствующей координаты cplcoord следующим образом:

[00332] Члены взаимной корреляции можно заменить следующим образом:

[00333] Поэтому коэффициенты alpha можно выразить следующим образом:

[00334] На основе уравнения 5 мощность x можно выразить следующим образом:

[00335] Поэтому регулировку усиления gx можно выразить следующим образом:

[00336] Соответственно, если известны все координаты cplcoords и когерентности ICC, коэффициенты alpha можно вычислить в соответствии со следующим выражением:

(Уравнение 6)

[00337] Как было указано выше, когерентностью ICC между декоррелированными сигналами можно управлять путем выбора сигналов декорреляции, удовлетворяющих уравнению 4. В стереофоническом случае, можно сформировать единственный декорреляционный фильтр, генерирующий сигналы декорреляции, некоррелированные с сигналом канала связывания. Оптимальной когерентности IDC, равной –1, можно добиться путем простого зеркального отображения знаков, например, в соответствии с одним из вышеописанных способов зеркального отображения знаков.

[00338] Однако задача управления когерентностями ICC для многоканальных случаев является более сложной. В дополнение к обеспечению того, чтобы все сигналы декорреляции являлись, по существу, некоррелированными с каналом связывания, когерентности IDC из числа сигналов декорреляции также должны удовлетворять уравнению 4.

[00339] Для того чтобы генерировать сигналы декорреляции с требуемыми когерентностями IDC, в первую очередь, можно генерировать набор взаимно некоррелированных «затравочных» сигналов декорреляции. Например, в соответствии со способами, описываемыми в других местах настоящего описания, можно генерировать, сигналы 227 декорреляции. Впоследствии требуемые сигналы декорреляции можно синтезировать путем линейной комбинации этих затравок с надлежащими весовыми коэффициентами. Общий вид некоторых примеров описан выше со ссылкой на фиг. 8Е и 8F.

[00340] Генерирование множества высококачественных и взаимно некоррелированных (например, ортогональных) сигналов декорреляции из одного низведенного сигнала может потребовать усилий. Кроме того, вычисление надлежащих весовых коэффициентов комбинации может включать обращение матриц, что может проходить непросто в выражениях сложности и устойчивости.

[00341] Соответственно, в некоторых примерах, представляемых в настоящем описании, можно реализовать процесс «привязки и распространения». В некоторых реализациях некоторые когерентности IDC (и ICC) могут быть более значимыми, чем другие. Например, поперечные когерентности ICC могут быть более важными для восприятия, чем диагональные когерентности ICC. В 5.1-канальном примере Dolby 5.1 когерентности ICC для пар каналов L–R, L–Ls, R–Rs и Ls–Rs могут быть более важными для восприятия, чем когерентности ICC для пар каналов L–Rs и R–Ls. Передние каналы могут быть более важны для восприятия, чем задние, или окружающие, каналы.

[00342] В некоторых таких реализациях, условия уравнения 4 для наиболее важных когерентностей IDC могут быть, в первую очередь, удовлетворены путем объединения двух ортогональных (затравочных) сигналов декорреляции с целью синтеза сигналов декорреляции для двух вовлеченных каналов. Затем, используя эти синтезированные сигналы декорреляции в качестве привязок и добавляя новые затравки, можно удовлетворить условия уравнения 4 для вторичных когерентностей IDC и синтезировать соответствующие сигналы декорреляции. Этот процесс можно повторять до тех пор, пока уравнение 4 не будет удовлетворяться для всех когерентностей IDC. Такие реализации позволяют использовать сигналы декорреляции более высокого качества для управления относительно менее критичными когерентностями ICC.

[00343] Фиг. 9 – схема последовательности операций, описывающая процесс синтеза сигналов декорреляции в многоканальных случаях. Блоки способа 900 можно считать дальнейшими примерами процесса «определения» из блока 806 по фиг. 8А и процесса «применения» из блока 808 по фиг. 8А. Соответственно, на фиг. 9 блоки 905–915 помечены как «806с», а блоки 920 и 925 способа 900 помечены как «808с». Способ 900 представляет один из примеров в контексте 5.1. Однако способ 900 имеет широкую применимость и в других контекстах.

[00344] В этом примере блоки 905–915 включают вычисление параметров синтеза, подлежащих применению к набору взаимно некоррелированных затравочных сигналов декорреляции Dni(x), генерируемых блоком 920. В некоторых 5.1-канальных реализациях i = {1, 2, 3, 4}. Если центральный канал будет подвергаться декорреляции, можно привлечь пятый затравочный сигнал декорреляции. В некоторых реализациях некоррелированные (ортогональные) сигналы декорреляции Dni(x) можно генерировать путем ввода монофонического низведенного сигнала в несколько разных декорреляционных фильтров. Альтернативно исходные подвергнутые повышающему микшированию сигналы можно ввести в единственный декорреляционный фильтр. Ниже представлены различные примеры.

[00345] Как было указано выше, передние каналы могут быть более важными для восприятия, чем задние, или окружающие, каналы. Поэтому в способе 900 сигналы декорреляции для каналов L и R совместно привязывают к первым двум затравкам, а затем с использованием этих привязок и остающихся затравок синтезируют сигналы декорреляции для каналов Ls и Rs.

[00346] В этом примере блок 905 включает вычисление параметров синтеза ρ и ρr для передних каналов L и R. Здесь ρ и ρr получают из IDC для L–R как:

(Уравнение 7)

[00347] Поэтому блок 905 также включает вычисление IDC для L–R по уравнению 4. Соответственно, в этом примере, при вычислении IDC для L-R используют сведения о ICC. Другие процессы способа также могут использовать в качестве ввода значения ICC. Значения ICC можно получать из кодированного битового потока или путем оценивания на стороне декодера, например, на основе несвязанных менее высокочастотных или более высокочастотных полос, координат cplcoords, коэффициентов alpha и т.д.

[00348] Параметры синтеза ρ и ρr можно использовать для синтеза сигналов декорреляции для каналов L и R в блоке 925. Сигналы декорреляции для каналов Ls и Rs можно синтезировать, используя в качестве привязок сигналы декорреляции для каналов L и R.

[00349] В некоторых реализациях может потребоваться управление ICC для Ls–Rs. В соответствии со способом 900, синтез промежуточных сигналов декорреляции DLs(x) и DRs(x) с двумя из затравочных сигналов декорреляции включает вычисление параметров синтеза σ и σr. Поэтому необязательный блок 910 включает вычисление параметров синтеза σ и σr для окружающих каналов. Можно вывести, что требуемый коэффициент корреляции между промежуточными сигналами декорреляции DLs(x) и DRs(x) можно выразить следующим образом:

[00350] Переменные σ и σr можно вывести из их коэффициента корреляции:

[00351] Поэтому DLs(x) и DRs(x) можно определить, как:

[00352] Однако если ICC для Ls–Rs не учитывается, то коэффициент корреляции между DLs(x) и DRs(x) можно приравнять –1. Соответственно, эти два сигнала могут просто представлять собой версии друг друга с зеркально отображенными знаками, сконструированные посредством остальных затравочных сигналов декорреляции.

[00353] В зависимости от конкретной реализации, центральный канал может являться или может не являться декоррелированным. Соответственно, процесс блока 915 по вычислению параметров синтеза t1 и t2 для центрального канала является необязательным. Параметры синтеза для центрального канала можно вычислить, если, например, требуется управление когерентностями ICC для L–C и R–C. Если это так, то можно добавить пятую затравку Dn5(x), а сигнал декорреляции для канала С можно выразить следующим образом:

[00354] Для того чтобы получить требуемые когерентности ICC для L–C и R–C, уравнение 4 должно удовлетворяться для когерентностей IDC для L–C и R–C:

[00355] Звездочки указывают комплексно сопряженные пары. Соответственно, параметры синтеза t1 и t2 для центрального канала можно выразить следующим образом:

[00356] В блоке 920 может генерироваться набор взаимно некоррелированных затравочных сигналов декорреляции Dni(x), i = {1, 2, 3, 4}. Если центральный канал будет подвергаться декорреляции, в блоке 920 может генерироваться пятый затравочный сигнал декорреляции. Эти некоррелированные (ортогональные) сигналы декорреляции, Dni(x), можно генерировать путем ввода монофонического низведенного сигнала в несколько разных декорреляционных фильтров.

[00357] В этом примере блок 925 включает применение выведенных выше условий для синтеза сигналов декорреляции следующим образом:

[00358] В этом примере уравнения для синтеза сигналов декорреляции для каналов Ls и Rs, (DLs(x) и DRs(x)), зависят от уравнений для синтеза сигналов декорреляции для каналов L и R, (DL(x) и DR(x)). В способе 900 сигналы декорреляции для каналов L и R совместно привязываются с целью ослабления потенциального левого-правого смещения по причине несовершенства сигналов декорреляции.

[00359] В приведенном выше примере затравочные сигналы декорреляции генерируют в блоке 920 из монофонического низведенного сигнала x. Альтернативно затравочные сигналы декорреляции можно генерировать путем ввода каждого исходного подвергнутого повышающему микшированию сигнала в единственный декорреляционный фильтр. В этом случае генерируемые затравочные сигналы декорреляции могли бы быть специфичными для каналов: Dni(gix), i = {L, R, Ls, Rs, C}. Эти специфичные для каналов затравочные сигналы декорреляции могли бы, в целом, обладать разными уровнями мощности вследствие процесса повышающего микширования. Соответственно, желательно выровнять уровень мощности среди этих затравок при их комбинировании. Для выполнения этого можно модифицировать уравнения синтеза для блока 925 следующим образом:

[00360] В этих модифицированных уравнениях синтеза все параметры синтеза остаются такими же. Однако для выравнивания уровня мощности при использовании затравочного сигнала декорреляции, генерируемого из канала j, с целью синтеза сигнала декорреляции для канала i, требуются параметры регулировки уровня λi,j. Эти специфичные для пар каналов параметры регулировки уровня можно вычислить на основе оценочных разностей уровней каналов, как, например:

[00361] Кроме того, так как в этом случае специфичные для каналов масштабные коэффициенты уже встроены в синтезированные сигналы декорреляции, то уравнение микшера для блока 812 (фиг. 8А) следует модифицировать исходя из уравнения 1 как:

[00362] Как отмечалось в других местах настоящего описания, в некоторых реализациях пространственные параметры могут быть получены наряду с аудиоданными. Эти пространственные параметры могут, например, быть закодированы вместе с аудиоданными. Эти кодированные пространственные параметры и аудиоданные могут быть получены в битовом потоке такой системой обработки аудиоданных, как декодер, например, описанный выше со ссылкой на фиг. 2D. В этом примере пространственные параметры принимаются декоррелятором 205 посредством явных сведений 240 о декорреляции.

[00363] Однако в альтернативных реализациях декоррелятор 205 не принимает никаких кодированных пространственных параметров (или принимает неполный набор пространственных параметров). В соответствии с некоторыми такими реализациями, приемник/генератор 640 управляющей информации, описанный выше со ссылкой на фиг. 6В и 6С (или другой элемент системы 200 обработки аудиоданных), может быть сконфигурирован для оценки пространственных параметров на основе одного или нескольких определяющих признаков аудиоданных. В некоторых реализациях приемник/генератор 640 управляющей информации может содержать модуль 665 пространственных параметров, сконфигурированный для оценивания пространственных параметров и со связанными функциональными возможностями, описываемыми в настоящем описании. Например, модуль 665 пространственных параметров может оценивать пространственные параметры для частот в диапазоне частот каналов связывания на основе характеристик аудиоданных вне этого диапазона частот каналов связывания. Некоторые такие реализации будут описаны ниже со ссылкой на фиг. 10А et seq.

[00364] Фиг. 10А – схема последовательности операций, представляющая общий вид одного из способов оценивания пространственных параметров. В блоке 1005 система обработки аудиоданных принимает аудиоданные, содержащие первый набор частотных коэффициентов и второй набор частотных коэффициентов. Например, первый и второй наборы частотных коэффициентов могут являться результатами применения к аудиоданным во временной области модифицированного дискретного синусного преобразования, модифицированного дискретного косинусного преобразования или ортогонального преобразования с перекрытием. В некоторых реализациях аудиоданные могли быть закодированы в соответствии с унаследованным процессом кодирования. Например, этот унаследованный процесс кодирования может представлять собой процесс аудиокодека АС-3 или аудиокодека Enhanced АС-3. Соответственно, в некоторых реализациях первый и второй наборы частотных коэффициентов могут представлять собой вещественнозначные частотные коэффициенты. Однако способ 1000 не ограничен его применением к таким кодекам, но является широко применимым ко многим аудиокодекам.

[00365] Первый набор частотных коэффициентов может соответствовать первому диапазону частот, а второй набор частотных коэффициентов может соответствовать второму диапазону частот. Например, первый диапазон частот может соответствовать диапазону частот отдельных каналов, а второй диапазон частот может соответствовать диапазону частот принятого канала связывания. В некоторых реализациях первый диапазон частот может находиться ниже второго диапазона частот. Однако в альтернативных реализациях первый диапазон частот может находиться выше второго диапазона частот.

[00366] Со ссылкой на фиг. 2D, в некоторых реализациях первый набор частотных коэффициентов может соответствовать аудиоданным 254а или 245b, содержащим представления в частотной области аудиоданных вне диапазона частот каналов связывания. Аудиоданные 245а и 245b в этом примере не являются декоррелированными, но, тем не менее, их можно использовать в качестве ввода для оцениваний пространственных параметров, выполняемых декоррелятором 205. Второй набор частотных коэффициентов может соответствовать аудиоданным 210 или 220, содержащим представления в частотной области, соответствующие каналу связывания. Однако, в отличие от примера по фиг. 2D, способ 1000 может не включать прием данных пространственных параметров наряду с частотными коэффициентами для канала связывания.

[00367] В блоке 1010 оцениваются пространственные параметры для, по меньшей мере, части второго набора частотных коэффициентов. В некоторых реализациях это оценивание основывается на одной или нескольких особенностях теории оценивания. Например, этот процесс оценивания может, по меньшей мере, частично основываться на методе максимального правдоподобия, байесовом правиле оценивания, методе оценки моментов, методе оценки минимальной среднеквадратичной ошибки и/или на методе несмещенной оценки с минимальной дисперсией.

[00368] Некоторые такие реализации могут включать оценивание функций совместной плотности вероятностей («функций PDF») пространственных параметров при менее высоких частотах и при более высоких частотах. Например, скажем, мы имеем два канала L и R, и в каждом канале мы имеем низкочастотную полосу в диапазоне частот отдельных каналов и высокочастотную полосу в диапазоне частот каналов связывания. Тогда мы можем получить ICC_lo, описывающую межканальную когерентность между каналами L и R в диапазоне частот отдельных каналов, и ICC_hi, существующую в диапазоне частот каналов связывания.

[00369] Если мы имеем большое обучающее множество звуковых сигналов, мы можем сегментировать его, и для каждого отрезка можно вычислить ICC_lo и ICC_hi. Тогда мы можем получить большое обучающее множество пар когерентностей ICC (ICC_lo, ICC_hi). Совместную PDF этой пары параметров можно вычислить как гистограммы и/или смоделировать при помощи параметрических моделей (например, при помощи смеси гауссовых распределений). Эта модель может представлять собой независящую от времени модель, известную в декодере. Альтернативно параметры модели могут регулярно пересылаться в декодер посредством битового потока.

[00370] В декодере ICC_lo для отдельного отрезка принятых аудиоданных можно вычислить, например, в соответствии с вычисляемыми и описываемыми в настоящем описании коэффициентами взаимной корреляции между отдельными каналами и составным каналом связывания. При наличии значения ICC_lo и модели совместной PDF для параметров, декодер может попытаться оценить, какова ICC_hi. Одной из таких оценок является оценка максимального правдоподобия («ML»), когда декодер может вычислять условную PDF для ICC_hi при заданной ICC_lo. Тогда условная PDF представляет собой, по существу, функцию с положительными вещественными значениями, которую можно представить на осях x–y, при этом ось х представляет континуум значений ICC_hi, а ось y представляет условную вероятность каждого такого значения. Оценка ML может включать выбор оценки ICC_hi, как значения в максимуме этой функции. С другой стороны, оценка минимальной среднеквадратичной ошибки («MMSE») представляет собой среднее этой условной PDF, являющееся еще одной обоснованной оценкой ICC_hi. Теория оценивания предусматривает множество таких инструментальных средств для представления оценки ICC_hi.

[00371] Приведенный выше двухпараметрический пример представляет собой очень простой случай. В некоторых реализациях может иметься большее количество каналов, а также полос. Пространственные параметры могут представлять собой коэффициенты alpha или когерентности ICC. Более того, модель PDF может быть условной по типу сигнала. Например, может существовать отличающаяся модель для кратковременных событий, отличающаяся модель для тональных сигналов и т. д.

[00372] В этом примере оценивание блоком 1010, по меньшей мере, частично основано на первом наборе частотных коэффициентов. Например, первый набор частотных коэффициентов может содержать аудиоданные для двух или большего количества отдельных каналов в первом диапазоне частот, находящемся вне диапазона частот принятого канала связывания. Процесс оценивания может включать вычисление комбинированных частотных коэффициентов составного канала связывания в пределах первого диапазона частот на основе частотных коэффициентов для двух или большего количества каналов. Этот процесс оценивания также может включать вычисление коэффициентов взаимной корреляции между этими комбинированными частотными коэффициентами и частотными коэффициентами отдельных каналов в первом диапазоне частот. Результаты процесса оценивания могут изменяться в соответствии с изменениями входных звуковых сигналов во времени.

[00373] В блоке 1015 оценочные пространственные параметры могут применяться ко второму набору частотных коэффициентов для генерирования модифицированного второго набора частотных коэффициентов. В некоторых реализациях процесс применения оценочных пространственных параметров ко второму набору частотных коэффициентов может составлять часть процесса декорреляции. Этот процесс декорреляции может включать генерирование сигнала реверберации, или сигнала декорреляции, и его применение к второму набору частотных коэффициентов. В некоторых реализациях этот процесс декорреляции может включать применение алгоритма декорреляции, действующего полностью на вещественнозначных коэффициентах. Процесс декорреляции может включать избирательную, или адаптивную к сигналу, декорреляцию конкретных каналов и/или конкретных полос частот.

[00374] Более подробный пример будет описан ниже со ссылкой на фиг. 10В. Фиг. 10В – схема последовательности операций, представляющая общий вид одного из альтернативных способов оценивания пространственных параметров. Способ 1020 может выполняться такой системой обработки аудиоданных, как декодер. Например, способ 1020 может, по меньшей мере, частично выполняться приемником/генератором 640 управляющей информации, таким как приемник/генератор, проиллюстрированный на фиг. 6С.

[00375] В этом примере первый набор частотных коэффициентов представляет собой диапазон частот отдельных каналов. Второй набор частотных коэффициентов соответствует каналу связывания, принятому системой обработки аудиоданных. Этот второй набор частотных коэффициентов находится в диапазоне частот принятого канала связывания, в этом примере расположенном выше диапазона частот отдельных каналов.

[00376] Соответственно, блок 1022 включает прием аудиоданных для отдельных каналов и для принятого канала связывания. В некоторых реализациях аудиоданные могли быть закодированы в соответствии с унаследованным процессом кодирования. Применение пространственных параметров, оцениваемых в соответствии со способом 1000 или со способом 1020, к аудиоданным этого принятого канала связывания может приводить к более пространственно точному воспроизведению звука, чем для звука, получаемого путем декодирования принятых аудиоданных в соответствии с унаследованным процессом декодирования, соответствующим унаследованному процессу кодирования. В некоторых реализациях этот унаследованный процесс кодирования может представлять собой процесс аудиокодека АС-3 или процесс аудиокодека Enhanced АС-3. Соответственно, в некоторых реализациях блок 1022 может включать прием вещественнозначных частотных коэффициентов, но не частотных коэффициентов, имеющих мнимые значения. Однако способ 1020 не ограничен этими кодеками, но является широко применимым ко многим другим аудиокодекам.

[00377] В блоке 1025 способа 1020, по меньшей мере, часть диапазона частот отдельных каналов разделяется на ряд полос частот. Например, диапазон частот отдельных каналов можно разделить на 2, 3, 4 или большее количество полос частот. В некоторых реализациях каждая из этих полос частот может содержать предварительно определенное количество последовательных частотных коэффициентов, например. 6, 8, 10, 12 или большее количество последовательных частотных коэффициентов. В некоторых реализациях на полосы частот может быть разделена только часть диапазона частот отдельных каналов. Например, некоторые реализации могут включать разделение на полосы частот только высокочастотной части диапазона частот отдельных каналов (относительно более близкой к диапазону частот принятого связанного канала). В соответствии с некоторыми примерами на основе Е-АС-3, более высокочастотная часть диапазона частот отдельных каналов может быть разделена на 2 или 3 полосы, каждая из которых содержит 12 коэффициентов MDCT. В соответствии с некоторыми другими реализациями, на полосы частот может быть разделена только та часть диапазона частот отдельных каналов, которая находится выше 1 кГц, выше 1,5 кГц и т. д.

[00378] В этом примере блок 1030 включает вычисление энергии в полосах частот отдельных каналов. В этом примере, если отдельный канал был исключен из связывания, то полосовая энергия этого исключенного канала в блоке 1030 вычисляться не будет. В некоторых реализациях значения энергии, вычисленные в блоке 1030, могут сглаживаться.

[00379] В этой реализации в блоке 1035 создается составной канал связывания, основанный на аудиоданных из отдельных каналов в диапазоне частот отдельных каналов. Блок 1035 может включать вычисление для этого составного канала связывания частотных коэффициентов, которые могут именоваться в настоящем описании «комбинированными частотными коэффициентами». Эти комбинированные частотные коэффициенты можно создавать, используя частотные коэффициенты из двух или большего количества каналов в диапазоне частот отдельных каналов. Например, если аудиоданные были закодированы в соответствии с кодеком Е-АС-3, блок 1035 может включать вычисление на месте низведенного сигнала из коэффициентов MDCT ниже «частоты начала связывания», являющейся низшей частотой в диапазоне частот принятого канала связывания.

[00380] В блоке 1040 может определяться энергия составного канала связывания в пределах каждой полосы частот из диапазона частот отдельных каналов. В некоторых реализациях значения энергии, вычисленные в блоке 1040, могут сглаживаться.

[00381] В этом примере блок 1045 включает определение коэффициентов взаимной корреляции, соответствующих корреляции между полосами частот отдельных каналов и соответствующими полосами частот составного канала связывания. Здесь вычисление коэффициентов взаимной корреляции в блоке 1045 также включает вычисление энергии в полосах частот каждого из отдельных каналов и энергии в соответствующих полосах частот составного канала связывания. Эти коэффициенты взаимной корреляции могут нормироваться. В соответствии с некоторыми реализациями, если отдельный канал был исключен из связывания, то частотные коэффициенты этого исключенного канала не будут использованы в вычислении коэффициентов взаимной корреляции.

[00382] Блок 1050 включает оценивание пространственных параметров для каждого канала, который был связан в принятом канале связывания. В этой реализации блок 1050 включает оценивание пространственных параметров на основе коэффициентов взаимной корреляции. Этот процесс оценивания может включать усреднение нормированных коэффициентов взаимной корреляции по всем полосам частот отдельных каналов. Процесс оценивания также может включать применение масштабного коэффициента к среднему нормированных коэффициентов взаимной корреляции для получения оценочных пространственных параметров для отдельных каналов, которые были связаны в принятом канале связывания. В некоторых реализациях этот масштабный коэффициент может уменьшаться с повышением частоты.

[00383] В этом примере блок 1055 включает внесение шума в оценочные пространственные параметры. Этот шум можно внести для моделирования дисперсии оценочных пространственных параметров. Этот шум можно вносить в соответствии с набором правил, соответствующих ожидаемому предсказанию пространственного параметра по полосам частот. Правила могут основываться на опытных данных. Эти опытные данные могут соответствовать наблюдениям и/или измерениям, полученным для большого набора дискретных значений аудиоданных. В некоторых реализациях дисперсия вносимого шума может основываться на оценочном пространственном параметре для полосы частот, индекса полосы частот и/или дисперсии нормированных коэффициентов взаимной корреляции.

[00384] Некоторые реализации могут включать прием или определение сведений о тональности, касающихся первого или второго набора частотных коэффициентов. В соответствии с некоторыми такими реализациями, процесс блока 1050 и/или 1055 может изменяться в соответствии со сведениями о тональности. Например, если приемник/генератор 640 управляющей информации по фиг. 6В или фиг. 6С определяет, что аудиоданные в диапазоне частот каналов связывания являются высокотональными, то этот приемник/генератор 640 управляющей информации может быть сконфигурирован для временного уменьшения величины шума, вносимого в блоке 1055.

[00385] В некоторых реализациях оценочные пространственные параметры могут представлять собой оценочные коэффициенты alpha для полос частот принятого канала связывания. Некоторые такие реализации могут включать применение коэффициентов alpha к аудиоданным, соответствующим каналу связывания, например, в качестве части процесса декорреляции.

[00386] Ниже будут описаны более подробные примеры способа 1020. Эти примеры представлены в контексте аудиокодека Е-АС-3. Однако концепции, иллюстрируемые этими примерами, не ограничены контекстом аудиокодека Е-АС-3, но, вместе с тем, они являются широко применимыми ко многим аудиокодекам.

[00387] В этом примере составной канал связывания вычисляют как смешение обособленных источников:

(Уравнение 8)

[00388] В уравнении 8 SDi представляет вектор-строку декодированного преобразования MDCT для конкретного диапазона частот (kstart ..kend) канала i, причем kend = KCPL – индексу элемента разрешения, соответствующему частоте начала связывания в E-AC-3 – низшей частоте из диапазона частот принятого канала связывания. Здесь gx представляет нормировочный член, не оказывающий влияния на процесс оценивания. В некоторых реализациях gx может быть приравнен 1.

[00389] Решение в отношении количества элементов разрешения, анализируемых между kstart и kend, может основываться на компромиссе между ограничениями сложности и требуемой точностью оценивания коэффициента alpha. В некоторых реализациях kstart может соответствовать частоте определенного порогового значения или находиться выше этого порогового значения (например, 1 кГц) так, чтобы для улучшения оценивания значений alpha использовались аудиоданные в диапазоне частот, относительно более близком к диапазону частот принятого канала связывания. Диапазон частот (kstart ..kend) можно разделить на полосы частот. В некоторых реализациях коэффициенты взаимной корреляции для этих полос частот можно вычислить следующим образом:

(Уравнение 9)

[00390] В уравнении 9 представляет тот отрезок, который соответствует полосе низкочастотного диапазона, а представляет соответствующий отрезок . В некоторых реализациях математическое ожидание можно аппроксимировать, используя простой фильтр с бесконечной импульсной характеристикой («IIR») и нулевым полюсом, например, следующим образом:

(Уравнение 10)

[00391] В уравнении 10 представляет оценку с использованием дискретных значений вплоть до блока n. В этом примере cci(l) вычисляют только для тех каналов, которые находятся в связывании для текущего блока. В целях сглаживания оценки мощности, заданной только коэффициентами MDCT на вещественной основе было найдено достаточным значение a = 0,2. Для иных преобразований, чем MDCT, в частности, для комплексных преобразований, можно использовать большее значение a. В таких случаях было бы разумным значение a в диапазоне 0,2<a<0,5. Некоторые реализации с меньшей сложностью могут включать временное сглаживание вычисленного коэффициента корреляции cci(l) вместо мощностей и коэффициентов взаимной корреляции. И хотя оно не является математически эквивалентным оцениванию числителя и знаменателя по отдельности, такое сглаживание с низкой сложностью, как было обнаружено, обеспечивает достаточно точную оценку коэффициентов взаимной корреляции. Такая частная реализация функции оценивания как фильтра IIR первого порядка не препятствует этой реализации посредством других схем, таких как схема на основе буфера «первым пришел – последним обслужен» («FILO»). В таких реализациях самое старое дискретное значение в буфере может быть вычтено из текущей оценки E{}, тогда как самое новое значение может быть добавлено к текущей оценке E{}.

[00392] В некоторых реализациях процесс сглаживания принимает во внимание то, находились ли в связывании коэффициенты SDi для предыдущего блока. Например, если в предыдущем блоке канал i не находился в связывании, то для текущего блока a может быть приравнено 1,0, поскольку коэффициенты MDCT для предыдущего блока не были включены в канал связывания. Также предыдущее преобразование MDCT могло не быть закодировано с использованием режима коротких блоков E-AC-3, что также обосновывает приравнивание a к 1,0 в этом случае.

[00393] На этой ступени были определены коэффициенты взаимной корреляции между отдельными каналами и составным каналом связывания. В примере по фиг. 10В был выполнен процесс, соответствующий блокам 1022–1045. Нижеследующие процессы представляют собой примеры оценивания пространственных параметров на основе коэффициентов взаимной корреляции. Эти процессы представляют собой примеры блока 1050 способа 1020.

[00394] В одном примере, используя коэффициенты взаимной корреляции для полос частот ниже KCPL (низшая частота диапазона частот принятого канала связывания), может генерироваться оценка коэффициентов alpha, подлежащих использованию при декорреляции коэффициентов MDCT выше KCPL. Псевдокод для вычисления оценочных коэффициентов alpha исходя из значений cci(l) в соответствии с одной такой реализацией является следующим:

for (reg = 0; reg < numRegions; reg ++)

{

for (chan = 0; chan < numChans; chan ++)

{

Вычислить среднее ICC и дисперсию для текущей области:

CCm = MeanRegion(chan, iCCs, blockStart[reg], blockEnd[reg])

CCv = VarRegion(chan, iCCs, blockStart[reg], blockEnd[reg])

for (block = blockStart[reg]; block < blockEnd[reg]; block ++)

{

Если канал не находится в связывании, то – пропустить блок:

if (chanNotInCpl[block][chan])

continue;

fAlphaRho = CCm * MAPPED_VAR_RHO;

fAlphaRho = (fAlphaRho > -1.0f) ? fAlphaRho : -1.0f;

fAlphaRho = (fAlphaRho < 1.0f) ? fAlphaRho : 0.99999f;

for(band = cplStartBand[blockStart]; band < iBandEnd[blockStart]; band ++)

{

iAlphaRho=floor(fAlphaRho*128)+128;

fEstimatedValue = fAlphaRho + w[iNoiseIndex++] * Vb[band] * Vm[iAlphaRho] * sqrt(CCv);

fAlphaRho = fAlphaRho * MAPPED_VAR_RHO;

EstAlphaArray[block][chan][band] = Smooth(fEstimatedValue);

}

}

} end channel loop

}end region loop

[00395] Главным вводом в вышеописанный процесс экстраполяции, генерирующий коэффициенты alpha, является CCm, представляющий среднее коэффициентов корреляции (cci(l)) по текущей области. «Область» может представлять собой произвольную группировку последовательных блоков E-AC-3. Кадр E-AC-3 может быть составлен из более чем одной области. Однако в некоторых реализациях области не переступают границы кадра. Среднее CCm (в приведенном выше псевдокоде оно указано как функция MeanRegion()) можно вычислить следующим образом:

(Уравнение 11)

[00396] В уравнении 11 i представляет индекс канала, L представляет количество низкочастотных полос (ниже KCPL), использованных для оценивания, и N представляет количество блоков в текущей области. Здесь мы расширим обозначение cci(l) для включения индекса блока n. Средний коэффициент взаимной корреляции можно затем экстраполировать на диапазон частот принимаемого канала связывания посредством повторного применения следующей операции масштабирования для генерирования предсказываемого значения alpha для каждой полосы частот каналов связывания:

fAlphaRho = fAlphaRho * MAPPED_VAR_RHO (Уравнение 12)

[00397] При применении уравнения 12 fAlphaRho для первой полосы частот каналов связывания может представлять собой . В этом примере псевдокода переменная MAPPED_VAR_RHO была получена эвристически путем наблюдения того, что средние значения alpha склонны к уменьшению при увеличении индекса полосы. Как таковой, переменной MAPPED_VAR_RHO присваивается значение менее 1,0. В некоторых реализациях переменную MAPPED_VAR_RHO приравнивают 0,98.

[00398] На этой ступени были оценены пространственные параметры (в данном примере – коэффициенты alpha). В примере по фиг. 10В был выполнен процесс, соответствующий блокам 1022–1050. Нижеследующие процессы представляют собой примеры внесения шума, или «размывания», оценочных пространственных параметров. Эти процессы представляют собой примеры блока 1055 способа 1020.

[00399] На основе анализа того, как ошибка предсказания изменяется с частотой, на большом собрании многоканальных входных сигналов разных типов, авторы изобретения сформулировали эвристические правила, управляющие степенью рандомизации, налагаемой на оценочные значения alpha. Оценочные пространственные параметры в диапазоне частот каналов связывания (полученные путем вычисления корреляции исходя из менее высоких частот с последующей экстраполяцией) могут в конечном счете иметь такую же статистику, как если бы эти параметры были вычислены непосредственно в диапазоне частот каналов связывания исходя из первоначального сигнала, когда все отдельные каналы были доступны без того, чтобы быть связанными. Целью внесения шума является придание статистической изменчивости, аналогичной той, которая наблюдается на опыте. В приведенном выше псевдокоде VB представляет полученный опытным путем масштабный член, диктующий то, каким образом дисперсия меняется в зависимости от индекса полосы. VM представляет полученный опытным путем признак, основанный на предсказании для alpha перед применением синтезированной дисперсии. Это объясняет тот факт, что дисперсия ошибки предсказания фактически зависит от предсказания. Например, если линейное предсказание alpha для полосы близко к 1,0, то дисперсия является очень низкой. Член CCv представляет элемент управления на основе локальной дисперсии вычисленных значений cci для текущей совместно используемой области блока. CCv (указываемый в приведенном выше псевдокоде посредством VarRegion()) можно вычислить следующим образом:

(Уравнение 13)

[00400] В этом примере VB управляет дисперсией размывания в соответствии с индексом полосы. VB был получен опытным путем исследования дисперсии по полосам ошибки предсказания alpha, вычисленной из источника. Авторы изобретения обнаружили, что взаимосвязь между нормированной дисперсией и индексом полосы l можно смоделировать в соответствии со следующим уравнением:

[00401] Фиг. 10С представляет собой график, указывающий взаимосвязь между масштабным членом VB и индексом полосы l. Фиг. 10С показывает, что включение признака VB будет приводить к оценочному коэффициенту alpha, который будет иметь дисперсию, постепенно увеличивающуюся в зависимости от индекса полосы. В уравнении 13 индекс полосы l ≤ 3 соответствует области ниже 3,42 кГц, низшей частоты начала связывания аудиокодека Е-АС-3. Поэтому значения VB для этих индексов полос являются несущественными.

[00402] Параметр VM был получен путем исследования поведения ошибки предсказания alpha в зависимости от самого предсказания. В частности, авторы изобретения путем анализа большого собрания многоканального содержимого обнаружили, что, когда предсказанное значение alpha является отрицательным, дисперсия ошибки предсказания увеличивается с максимумом при alpha=–0,59375. Это подразумевает, что, когда текущий канал, подвергаемый анализу, обладает отрицательной корреляцией с низведенным сигналом xD, оценочный коэффициент alpha, в целом, может быть более беспорядочным. Приведенное ниже уравнение 14 моделирует требуемое поведение:

(Уравнение 14)

[00403] В уравнении 14 q представляет квантованную версию предсказания (обозначаемую в псевдокоде посредством fAlphaRho), и ее можно вычислить следующим образом:

=floor(fAlphaRho*128)

[00404] Фиг. 10D – график, указывающий взаимосвязь между переменными VM и q. Следует отметить, что переменная VM является нормированной на значение при q = 0, поэтому VM модифицирует другие коэффициенты, вносящие вклад в дисперсию ошибки предсказания. Таким образом, член VM оказывает влияние только на общую дисперсию ошибки предсказания для всех значений, кроме q = 0. В псевдокоде символ iAlphaRho приравнен . Это отображение позволяет избежать необходимости в отрицательных значениях iAlphaRho и позволяет считывать значения VM (q) непосредственно из такой структуры данных, как таблица.

[00405] В этой реализации следующим этапом является масштабирование случайной переменной w посредством трех коэффициентов VM, Vb и CCv. В качестве масштабного коэффициента можно вычислить и применить к этой случайной переменной геометрическое среднее между VM и CCv. В некоторых реализациях w можно реализовать как очень большую таблицу случайных чисел с гауссовым распределением с нулевым средним единичной дисперсии.

[00406] После процесса масштабирования можно применить процесс сглаживания. Например, размытые оценочные пространственные параметры можно сгладить по времени, например, путем использования сглаживающего фильтра с нулевым полюсом или сглаживающего фильтра FILO. Коэффициент сглаживания может быть приравнен 1,0, если предыдущий блок не находится в связывании, или если текущий блок представляет собой первый блок в области блоков. Соответственно, масштабированное случайное число из записи шумов w может быть подвергнуто фильтрации прохождения нижних частот, которая, как было обнаружено, приводит дисперсию оценочных значений alpha в лучшее соответствие с дисперсией коэффициентов alpha в источнике. В некоторых реализациях процесс сглаживания может быть менее энергичным, чем сглаживание, используемое для s (т.е. используется IIR с более краткой импульсной характеристикой).

[00407] Как было указано выше, процесс, связанный с оцениванием коэффициентов alpha и/или других пространственных параметров, может, по меньшей мере, частично выполняться таким приемником/генератором 640 управляющей информации, как приемник/генератор 640, проиллюстрированный на фиг. 6С. В некоторых реализациях модуль 655 управления кратковременными событиями приемника/генератора 640 управляющей информации (или один или несколько других компонентов системы обработки аудиоданных) может быть сконфигурирован для обеспечения функциональных возможностей, относящихся к кратковременным событиям. Некоторые примеры обнаружения кратковременных событий и соответствующего управления процессом декорреляции будут описаны ниже со ссылкой на фиг. 11А et seq.

[00408] Фиг. 11А – схема последовательности операций, описывающая некоторые способы определения кратковременных событий и элементов управления, относящихся к кратковременным событиям. В блоке 1105, например, декодирующее устройство или другая такая система обработки аудиоданных принимает аудиоданные, соответствующие ряду звуковых каналов. Как описывается ниже, в некоторых реализациях аналогичные процессы может выполнять и кодирующее устройство.

[00409] Фиг. 11В – блок-схема, содержащая примеры различных компонентов для определения кратковременных событий и элементов управления, относящихся к кратковременным событиям. В некоторых реализациях блок 1105 может включать прием аудиоданных 220 и аудиоданных 245 системой обработки аудиоданных, содержащей модуль 655 управления кратковременными событиями. Аудиоданные 220 и 245 могут содержать представления звуковых сигналов в частотной области. Аудиоданные 220 могут содержать элементы аудиоданных в диапазоне частот каналов связывания, в то время как элементы 245 аудиоданных могут содержать аудиоданные вне диапазона частот каналов связывания. Элементы 220 и/или 245 аудиоданных могут быть направлены в декоррелятор, содержащий модуль 655 управления кратковременными событиями.

[00410] В дополнение к элементам 245 и 220 аудиоданных модуль 655 управления кратковременными событиями в блоке 1105 может принимать и другие связанные сведения об аудиоданных, такие как сведения 240а и 240b о декорреляции. В этом примере сведения 240а о декорреляции могут содержать явную специфичную для декоррелятора управляющую информацию. Например, эти сведения 240а о декорреляции могут содержать явные сведения о кратковременных событиях, такие как сведения, описываемые ниже. Сведения 240b о декорреляции могут содержать сведения из битового потока унаследованного аудиокодека. Например, сведения 240b о декорреляции могут содержать сведения о временном сегментировании, доступные в битовом потоке, кодированном в соответствии с аудиокодеком АС-3 или аудиокодеком Е-АС-3. Например, сведения 240b о декорреляции могут содержать сведения о связывании в использовании, сведения о коммутации блоков, сведения об экспонентах, сведения о долгосрочном поведении экспонент и т.д. Такие сведения могли быть получены системой обработки аудиоданных в битовом потоке наряду с аудиоданными 220.

[00411] Блок 1110 включает определение звуковых характеристик аудиоданных. В различных реализациях блок 1110 включает определение сведений о кратковременных событиях, например, модулем 655 управления кратковременными событиями. Блок 1115 включает определение величины декорреляции для аудиоданных, по меньшей мере, частично на основе звуковых характеристик. Например, блок 1115 может включать определение управляющей информации декорреляции, по меньшей мере, частично на основе сведений о кратковременных событиях.

[00412] В блоке 1115 модуль 655 управления кратковременными событиями по фиг. 11В может предоставлять управляющую информацию 625 генератора сигналов декорреляции генератору 218, описанному в других местах настоящего описания. В блоке 1115 модуль 655 управления кратковременными событиями также может предоставлять управляющую информацию 645 микшера такому микшеру, как микшер 215. В блоке 1120 в аудиоданные могут обрабатываться в соответствии с определениями, осуществленными в блоке 1115. Например, операции генератора 218 сигналов декорреляции и микшера 215 могут выполняться, по меньшей мере, частично в соответствии с управляющей информацией декорреляции, предоставленной модулем 655 управления кратковременными событиями.

[00413] В некоторых реализациях блок 1110 по фиг. 11А может включать прием вместе с аудиоданными явных сведений о кратковременных событиях и определение сведений о кратковременных событиях, по меньшей мере, частично в соответствии с этими явными сведениями о кратковременных событиях.

[00414] В некоторых реализациях явные сведения о кратковременных событиях могут указывать значение кратковременного события, соответствующее четко выраженному кратковременному событию. Такое значение кратковременного события может представлять собой относительно высокое (или максимальное) значение кратковременного события. Высокое значение кратковременного события может соответствовать высокому правдоподобию и/или высокой жесткости кратковременного события. Например, если возможные значения кратковременного события находятся в диапазоне от 0 до 1, то интервал значений кратковременного события между 0,9 и 1 может соответствовать четко выраженному и/или жесткому кратковременному событию. Однако можно использовать любой подходящий интервал значений кратковременного события, например от 0 до 9, от 1 до 100 и т. д.

[00415] Явные сведения о кратковременных событиях могут указывать значение кратковременного события, соответствующее четко выраженному кратковременному событию. Например, если возможные значения кратковременного события находятся в диапазоне от 1 до 100, то значение в диапазоне 1–5 может соответствовать четко выраженному некратковременному событию или очень мягкому кратковременному событию.

[00416] В некоторых реализациях явные сведения о кратковременных событиях могут иметь двоичное представление, например либо 0, либо 1. Например, значение 1 может соответствовать четко выраженному кратковременному событию. Однако значение 0 может не указывать четко выраженное некратковременное событие. Вместо этого в некоторых таких реализациях значение 0 может просто указывать недостаточно четко выраженное и/или недостаточно жесткое кратковременное событие.

[00417] Однако в некоторых реализациях явные сведения о кратковременных событиях могут содержать промежуточные значения кратковременного события между минимальным значением кратковременного события (например, 0) и максимальным значением кратковременного события (например, 1). Это промежуточное значение кратковременного события может соответствовать промежуточному правдоподобию и/или жесткости кратковременного события.

[00418] Модуль 1125 управления вводом декорреляционного фильтра по фиг. 11В может определять сведения о кратковременных событиях в блоке 1110 в соответствии с явными сведениями о кратковременных событиях, принимаемыми посредством сведений 240а о декорреляции. Альтернативно или дополнительно модуль 1125 управления вводом декорреляционного фильтра может определять сведения о кратковременных событиях в блоке 1110 в соответствии со сведениями из битового потока унаследованного аудиокодека. Например, на основе сведений 240b о декорреляции модуль 1125 управления вводом декорреляционного фильтра может определять, что для текущего блока связывание каналов не используется, что в текущем блоке канал находится вне связывания, и/или что в текущем блоке канал подвергнут коммутации блоков.

[00419] На основе сведений 240а и/или 240b о декорреляции модуль 1125 управления вводом декорреляционного фильтра иногда может определять в блоке 1110 значение кратковременного события, соответствующее четко выраженному кратковременному событию. Если это так, то в некоторых реализациях модуль 1125 управления вводом декорреляционного фильтра может определять в блоке 1115, что процесс декорреляции (и/или процесс размывания в декорреляционном фильтре) следует временно остановить. Соответственно, в блоке 1120 модуль 1125 управления вводом декорреляционного фильтра может генерировать управляющую информацию 625е генератора сигналов декорреляции, указывающую, что процесс декорреляции (и/или процесс размывания в декорреляционном фильтре) следует временно остановить. Альтернативно или дополнительно в блоке 1120 вычислитель 1130 мягких кратковременных событий может генерировать управляющую информацию 625f генератора сигналов декорреляции, указывающую, что процесс размывания в декорреляционном фильтре следует временно остановить или замедлить.

[00420] В альтернативных реализациях блок 1110 может включать отсутствие приема каких-либо явных сведений о кратковременных событиях. Однако принимаются эти явные сведения о кратковременных событиях или нет, некоторые реализации способа 1100 могут включать обнаружение кратковременного события в соответствии с анализом аудиоданных 220. Например, в некоторых реализациях кратковременное событие может быть обнаружено в блоке 1110 даже тогда, когда явные сведения о кратковременных событиях не указывают кратковременное событие. Кратковременное событие, определяемое, или обнаруживаемое, декодером или аналогичной системой обработки аудиоданных в соответствии с анализом аудиоданных 220, может именоваться в настоящем описании «мягким кратковременным событием».

[00421] В некоторых реализациях, является кратковременное событие предоставляемым как явное значение кратковременного события или определяемым как мягкое кратковременное событие, это кратковременное событие может быть подвергнуто действию функции экспоненциального затухания. Например, эта функция экспоненциального затухания может вызывать плавное затухание значения кратковременного события от исходного значения до нуля в течение некоторого промежутка времени. Подвергание кратковременного события действию функции экспоненциального затухания может предотвращать артефакты, связанные с резким переключением.

[00422] В некоторых реализациях обнаружение мягкого кратковременного события может включать оценивание правдоподобия и/или жесткости кратковременного события. Такие оценивания могут включать вычисление временного изменения мощности в аудиоданных 220.

[00423] Фиг. 11С – схема последовательности операций, описывающая некоторые способы определения контрольных значений кратковременных событий, по меньшей мере, частично на основе временных изменений мощности аудиоданных. В некоторых реализациях способ 1150 может, по меньшей мере, частично выполняться вычислителем 1130 мягких кратковременных событий модуля 655 управления кратковременными событиями. Однако в некоторых реализациях способ 1150 может выполняться и кодирующим устройством. В некоторых таких реализациях явные сведения о кратковременных событиях могут определяться кодирующим устройством в соответствии со способом 1150 и включаться в битовый поток наряду с аудиоданными.

[00424] Способ 1150 начинается с блока 1152, где принимаются подвергнутые повышающему микшированию аудиоданные в диапазоне частот каналов связывания. На фиг. 11В, например, элементы 220 подвергнутых повышающему микшированию аудиоданных могут быть приняты в блоке 1152 вычислителем 1130 мягких кратковременных событий. В блоке 1154 принятый диапазон частот каналов связывания разделяют на одну или несколько частотных полос, которые также могут именоваться в настоящем описании «полосами мощности».

[00425] Блок 1156 включает вычисление взвешенной по полосам частот логарифмической мощности («WLP») для каждого канала и блока подвергнутых повышающему микшированию аудиоданных. Для вычисления WLP можно определить мощность каждой полосы мощности. Эти мощности можно преобразовать в логарифмические значения, а затем усреднить по полосам мощности. В некоторых реализациях блок 1156 можно выполнить в соответствии со следующим выражением:

(Уравнение 15)

[00426] В уравнении 15 представляет взвешенную логарифмическую мощность для канала и блока, представляет полосу частот, или «полосу мощности», на которую был разделен диапазон частот принятого канала связывания, и представляет среднее логарифмов мощности по полосам мощности канала и блока.

[00427] Разделение на полосы может вносить предыскажения в изменение мощности при более высоких частотах по следующим причинам. Если бы весь диапазон частот каналов связывания представлял собой одну полосу, то P[ch][blk][pwr_bnd] представляло бы собой арифметическое среднее мощности на каждой частоте в диапазоне частот каналов связывания, а менее высокие частоты, как правило, обладающие более высокой мощностью, обладали бы склонностью к переполнению значения P[ch][blk][pwr_bnd] и, поэтому, значения log(P[ch][blk][pwr_bnd]). (В этом случае log(P[ch][blk][pwr_bnd]) мог бы иметь такое же значение, как среднее log(P[ch][blk][pwr_bnd]), поскольку имелась бы в наличии только одна полоса.) Соответственно, обнаружение кратковременных событий было бы в значительной степени основано на временном изменении при менее высоких частотах. Разделение диапазона частот каналов связывания на, например, менее высокочастотную полосу и более высокочастотную полосу, а затем усреднение мощности этих двух полос в логарифмической области скорее эквивалентно вычислению геометрического среднего мощности менее высоких частот и мощности более высоких частот. Такое геометрическое среднее было бы ближе к мощности более высоких частот, чем могло бы быть арифметическое среднее. Поэтому разделение на полосы, определение логарифмической мощности, а затем определение среднего было бы склонно в результате приводить к количественной величине, более чувствительной к временному изменению при более высоких частотах.

[00428] В этой реализации блок 1158 включает определение на основе WLP асимметричной разности мощностей («APD»). Например, APD можно определить следующим образом:

(Уравнение 16)

[00429] В уравнении 16 dWLP[ch][blk] представляет разностную взвешенную логарифмическую мощность для канала и блока, и WLP[ch][blk][blk–2] представляет взвешенную логарифмическую мощность для канала два блока тому назад. Это пример уравнения 16 полезен для обработки аудиоданных, кодированных такими аудиокодеками, как Е-АС-3 и АС-3, в которых существует перекрытие на 50% между последовательными блоками. Соответственно, WLP текущего блока сравнивается с WLP два блока тому назад. Если перекрытие между последовательными блоками отсутствует, то WLP текущего блока можно сравнить с WLP предыдущего блока.

[00430] Этот пример извлекает выгоду из возможного эффекта временной маскировки предыдущих блоков. Соответственно, если WLP текущего блока больше или равна таковой для предыдущего блока (в этом примере – WLP два блока тому назад), то APD приравнивается текущей разности WLP. Однако если WLP текущего блока меньше таковой для предыдущего блока, то APD приравнивается половине текущей разности WLP. Соответственно, APD выделяет повышение мощности и приуменьшает снижение мощности. В других реализациях можно использовать другую долю разности текущих WLP, например, 1/4 разности текущих WLP.

[00431] Блок 1160 может включать определение на основе APD необработанной меры кратковременного события («RTM»). В этой реализации определение необработанной меры кратковременного события включает вычисление функции правдоподобия кратковременных событий на основе предположения о том, что временная асимметричная разность мощностей распределена в соответствии с гауссовым распределением:

(Уравнение 17)

[00432] В уравнении 17 RTM[ch][blk] представляет необработанную меру кратковременного события для канала и блока, и SAPD представляет параметр настройки. В этом примере, когда SAPD увеличивается, для выработки такого же значения RTM потребуется относительно бóльшая разность мощностей.

[00433] Контрольное значение кратковременного события, которое также может именоваться в настоящем описании «мерой кратковременного события», можно определить в блоке 1162 исходя из RTM. В этом примере контрольное значение кратковременного события определяется в соответствии с уравнением 18:

(Уравнение 18)

[00434] В уравнении 18 TM[ch][blk] представляет меру кратковременного события для канала и блока, TH представляет верхнее пороговое значение, и TL представляет нижнее пороговое значение. Фиг. 11D представляет один из примеров применения уравнения 18 и того, каким образом можно использовать пороговые значения TH и TL. Другие реализации могут включать линейное или нелинейное отображение RTM в TM других типов. В соответствии с некоторыми такими реализациями ТМ представляет собой неубывающую функцию RTM.

[00435] Фиг. 11D – график, иллюстрирующий один из примеров отображения необработанных значений кратковременных событий в контрольные значения кратковременных событий. Здесь как необработанные значения кратковременного события, так и контрольные значения кратковременного события находятся в диапазоне от 0,0 до 1,0, однако другие реализации могут включать и другие интервалы значений. Как показано в уравнении 18 и на фиг. 11D, если необработанное значение кратковременного события больше или равно верхнему пороговому значению TH, то контрольное значение кратковременного события приравнивается его максимальному значению, которое в данном примере составляет 1,0. В некоторых реализациях максимальное контрольное значение кратковременного события может соответствовать четко выраженному кратковременному событию.

[00436] Если необработанное значение кратковременного события меньше или равно нижнему пороговому значению TL, то контрольное значение кратковременного события приравнивается его минимальному значению, которое в данном примере составляет 0,0. В некоторых реализациях минимальное контрольное значение кратковременного события может соответствовать четко выраженному некратковременному событию.

[00437] Однако если необработанное значение кратковременного события находится в пределах интервала 1166 между нижним пороговым значением TL и верхним пороговым значением TH, то контрольное значение кратковременного события можно масштабировать в промежуточное контрольное значение кратковременного события, в этом примере находящееся между 0,0 и 1,0. Это промежуточное контрольное значение кратковременного события может соответствовать некоторому относительному правдоподобию и/или некоторой относительной жесткости кратковременного события.

[00438] Снова со ссылкой на фиг. 11С, в блоке 1164 к контрольному значению кратковременного события, определенному в блоке 1162, может применяться функция экспоненциального затухания. Например, эта функция экспоненциального затухания может вызывать плавное затухание контрольного значения кратковременного события от исходного значения до нуля в течение некоторого промежутка времени. Подвергание контрольного значения кратковременного события действию функции экспоненциального затухания может предотвращать артефакты, связанные с резким переключением. В других реализациях контрольное значение кратковременного события каждого текущего блока можно вычислить и сравнить с экспоненциально затухающей версией контрольного значения кратковременного события из предыдущего блока. Конечное контрольное значение кратковременного события для текущего блока может быть задано как максимальное из этих двух контрольных значений кратковременного события.

[00439] Сведения о кратковременных событиях, принимаемые наряду с другими аудиоданными или определяемые декодером, можно использовать для управления процессами декорреляции. Эти сведения о кратковременных событиях могут содержать такие контрольные значения кратковременных событий, как контрольные значения, описанные выше. В некоторых реализациях величину декорреляции для аудиоданных можно модифицировать (например, уменьшить), по меньшей мере, частично на основе таких сведений о кратковременных событиях.

[00440] Как было описано выше, такие процессы декорреляции могут включать применение декорреляционного фильтра к части аудиоданных для выработки фильтрованных аудиоданных и микширование этих фильтрованных аудиоданных с частью принятых аудиоданных в соответствии с отношением микширования. Некоторые реализации могут включать управление микшером 215 в соответствии со сведениями о кратковременных событиях. Например, такие реализации могут включать модификацию отношения микширования, по меньшей мере, частично на основе сведений о кратковременных событиях. Такие сведения о кратковременных событиях могут, например, быть включены в управляющую информацию 645 микшера модулем 1145 управления кратковременными событиями в микшере (см. фиг. 11B).

[00441] В соответствии с некоторыми такими реализациями, контрольные значения кратковременных событий могут быть использованы микшером 215 для модификации коэффициентов alpha с целью приостановки или уменьшения декорреляции в ходе кратковременных событий. Например, коэффициенты alpha можно модифицировать в соответствии со следующим псевдокодом:

if (alpha[ch][bnd] >=0)

alpha[ch][bnd] = alpha[ch][bnd] + (1-alpha[ch][bnd])

* decorrelationDecayArray[ch];

Else

alpha[ch][bnd] = alpha[ch][bnd] + (-1-alpha[ch][bnd])

* decorrelationDecayArray[ch];

[00442] В предшествующем псевдокоде alpha[ch][bnd] представляет значение alpha полосы частот одного канала. Член decorrelationDecayArray[ch] представляет переменную экспоненциального затухания, принимающую значения в диапазоне от 0 до 1. В некоторых примерах коэффициенты alpha в ходе кратковременных событий могут быть модифицированы к ±1. Степень модификации может быть пропорциональна переменной decorrelationDecayArray[ch], которая может уменьшать весовые коэффициенты микширования для сигналов декорреляции к 0 и, таким образом, приостанавливать или уменьшать декорреляцию. Экспоненциальное затухание decorrelationDecayArray[ch] медленно восстанавливает нормальный процесс декорреляции.

[00443] В некоторых реализациях вычислитель 1130 мягких кратковременных событий может предоставлять сведения о мягких кратковременных событиях модулю 665 пространственных параметров. По меньшей мере, частично на основе этих сведений о мягких кратковременных событиях модуль 665 пространственных параметров может выбирать большую плавность, как для сглаживания пространственных параметров, принимаемых в битовом потоке, так и для сглаживания энергии и других количественных величин, вовлеченных в оценивание пространственных параметров.

[00444] Некоторые реализации могут включать управление генератором 218 сигналов декорреляции в соответствии со сведениями о кратковременных событиях. Например, такие реализации могут включать модификацию или временный останов процесса размывания в декорреляционном фильтре, по меньшей мере, частично на основе сведений о кратковременных событиях. Это может быть преимущественным, поскольку размывание полюсов фазовых фильтров в ходе кратковременных событий может вызывать нежелательные артефакты звона. В некоторых таких реализациях значение максимального шага для размывания полюсов декорреляционного фильтра можно, по меньшей мере, частично модифицировать на основе сведений о кратковременных событиях.

[00445] Например, вычислитель 1130 мягких кратковременных событий может предоставлять модулю 405 управления декорреляционными фильтрами генератора 218 сигналов декорреляции (также см. фиг. 4) управляющую информацию 625f генератора сигналов декорреляции. В ответ на эту управляющую информацию 625f генератора сигналов декорреляции модуль 405 управления декорреляционными фильтрами может генерировать переменные во времени фильтры 1227. В соответствии с некоторыми реализациями, управляющая информация 625f генератора сигналов декорреляции может содержать сведения для управления значением максимального шага в соответствии с максимальным значением переменной экспоненциального затухания, как, например:

[00446] Например, значение максимального шага можно умножить на вышеизложенное выражение, если в каком-либо канале обнаружены кратковременные события. Соответственно, может быть остановлен или замедлен процесс размывания.

[00447] В некоторых реализациях коэффициент усиления может применяться к фильтрованным аудиоданным, по меньшей мере, частично на основе сведений о кратковременных событиях. Например, мощность фильтрованных аудиоданных может быть приведена в соответствие с мощностью прямых аудиоданных. В некоторых реализациях такая функциональная возможность может быть обеспечена дакерным модулем 1135 по фиг. 11В.

[00448] Дакерный модуль 1135 может принимать сведения о кратковременных событиях, такие как контрольные значения кратковременных событий, из вычислителя 1130 мягких кратковременных событий. Дакерный модуль 1135 может определять управляющую информацию 625h генератора сигналов декорреляции в соответствии с этими контрольными значениями кратковременных событий. Дакерный модуль 1135 может предоставлять управляющую информацию 625h генератора сигналов декорреляции генератору 218 сигналов декорреляции. Например, управляющая информация 625h генератора сигналов декорреляции содержит значение коэффициента усиления, который генератор 218 сигналов декорреляции может применить к сигналам 227 декорреляции с целью сохранения мощности фильтрованных аудиоданных на уровне, меньшем или равном мощности прямых аудиоданных. Дакерный модуль 1135 может определять управляющую информацию 625h генератора сигналов декорреляции путем вычисления для каждого принимаемого канала в связывании энергии, приходящейся на полосу частот в диапазоне частот каналов связывания.

[00449] Дакерный модуль 1135 может, например, содержать набор дакеров. В некоторых таких реализациях дакеры могут содержать буферы для временного хранения определяемой дакерным модулем 1135 энергии, приходящейся на полосу частот в диапазоне частот каналов связывания. К фильтрованным аудиоданным может применяться фиксированная задержка, и такая же задержка может применяться к буферам.

[00450] Дакерный модуль 1135 также может определять относящиеся к микшеру сведения и может предоставлять эти относящиеся к микшеру сведения модулю 1145 управления кратковременными событиями в микшере. В некоторых реализациях дакерный модуль 1135 может создавать сведения для управления микшером 215 с целью модификации отношения микширования на основе коэффициента усиления, подлежащего применению к фильтрованным аудиоданным. В соответствии с некоторыми такими реализациями, дакерный модуль 1135 может создавать сведения для управления микшером 215 с целью приостановки или уменьшения декорреляции в ходе кратковременных событий. Например, дакерный модуль 1135 может создавать следующие относящиеся к микшеру сведения:

TransCtrlFlag = max(decorrelationDecayArray[ch], 1-DecorrGain[ch][bnd]);

if (alpha[ch][bnd] >=0)

alpha[ch][bnd] = alpha[ch][bnd] + (1-alpha[ch][bnd])

* TransCtrlFlag;

Else

alpha[ch][bnd] = alpha[ch][bnd] + (-1-alpha[ch][bnd])

* TransCtrlFlag;

[00451] В предшествующем псевдокоде TransCtrlFlag представляет контрольное значение кратковременного события, и DecorrGain[ch][bnd] представляет коэффициент усиления для применения к полосе канала фильтрованных аудиоданных.

[00452] В некоторых реализациях окно сглаживания оценки мощности для дакеров может, по меньшей мере, частично основываться на сведениях о кратковременных событиях. Например, когда кратковременное событие является относительно более правдоподобным или когда обнаружено относительно более жесткое кратковременное событие, может применяться более короткое окно сглаживания оценки мощности. Более длинное окно сглаживания оценки мощности может применяться, когда кратковременное событие является относительно менее правдоподобным, или когда обнаружено относительно более слабое кратковременное событие, или когда кратковременное событие не обнаружено. Например, длина окна сглаживания может динамически регулироваться на основе контрольных значений кратковременных событий так, чтобы длина окна была меньше, когда значение флага близко к максимальному значению (например, 1,0), и больше – когда значение флага близко к минимальному значению (например, 0,0). Некоторые реализации могут помочь избежать смазывания времени в ходе кратковременных событий и в то же время в результате приводить к плавным коэффициентам усиления в ходе некратковременных ситуаций.

[00453] Как было указано выше, в некоторых реализациях сведения о кратковременных событиях могут быть определены в кодирующем устройстве. Фиг. 11Е – схема последовательности операций, описывающая один из способов кодирования сведений о кратковременных событиях. В блоке 1172 принимаются аудиоданные, соответствующие ряду звуковых каналов. В этом примере аудиоданные принимаются кодирующим устройством. В некоторых реализациях аудиоданные могут быть преобразованы из временной области в частотную область (блок 1174).

[00454] В блоке 1176 определяются звуковые характеристики, в том числе сведения о кратковременных событиях. Например, сведения о кратковременных событиях можно определить так, как это описано выше со ссылкой на фиг. 11А–11D. Например, блок 1176 может включать оценивание временного изменения мощности в аудиоданных. Блок 1176 может включать определение контрольных значений аудиоданных в соответствии с временным изменением мощности в аудиоданных. Такие контрольные значения кратковременных событий могут указывать четко выраженное кратковременное событие, четко выраженное некратковременное событие, правдоподобие кратковременного события и/или жесткость кратковременного события. Блок 1176 может включать применение к этим контрольным значениям кратковременных событий функции экспоненциального затухания.

[00455] В некоторых реализациях звуковые характеристики, определяемые в блоке 1176, могут содержать пространственные параметры, которые могут быть определены, по существу, так же, как описано в других местах настоящего описания. Однако вместо вычисления корреляции вне диапазона частот каналов связывания пространственные параметры можно определить путем вычисления корреляций в этом диапазоне частот каналов связывания. Например, коэффициенты alpha для отдельного канала, который будет кодироваться со связыванием, можно определить путем вычисления корреляций между коэффициентами преобразования этого канала и канала связывания на основе полос частот. В некоторых реализациях кодер может определять пространственные параметры, используя комплексные частотные представления аудиоданных.

[00456] Блок 1178 включает связывание, по меньшей мере, части из двух или большего количества каналов аудиоданных в связанный канал. Например, в блоке 1178 могут быть объединены представления в частотной области аудиоданных для связанного канала, находящегося в диапазоне частот каналов связывания. В некоторых реализациях в блоке 1178 может быть сформировано более одного связанного канала.

[00457] В блоке 1180 формируются кадры кодированных аудиоданных. В этом примере кадры кодированных аудиоданных содержат данные, соответствующие связанному каналу(каналам) и кодированным сведениям о кратковременных событиях, определенным в блоке 1176. Например, кодированные сведения о кратковременных событиях могут содержать один или несколько управляющих флагов. Эти управляющие флаги могут содержать флаг коммутации блоков канала, флаг канала вне связывания и/или флаг связывания в использовании. Блок 1180 может включать определение комбинации из одного или нескольких управляющих флагов для формирования кодированных сведений о кратковременных событиях, указывающих четко определенное кратковременное событие, четко определенное некратковременное событие, правдоподобие кратковременного события или жесткость кратковременного события.

[00458] Сформированы они путем комбинирования управляющих флагов или нет, эти сведения о кратковременных событиях могут содержать сведения для управления процессом декорреляции. Например, сведения о кратковременных событиях могут указывать, что процесс декорреляции следует временно остановить. Сведения о кратковременных событиях могут указывать, что величину декорреляции в процессе декорреляции следует временно уменьшить. Сведения о кратковременных событиях могут указывать, что следует модифицировать отношение микширования процесса декорреляции.

[00459] Кадры кодированных аудиоданных также могут содержать различные аудиоданные других типов, в том числе аудиоданные для отдельных каналов вне диапазона частот каналов связывания, аудиоданные для каналов не в связывании и т.д. В некоторых реализациях эти кадры кодированных аудиоданных также могут содержать пространственные параметры, координаты связывания и/или дополнительные сведения других типов, такие как сведения, описанные в других местах настоящего описания.

[00460] Фиг. 12 – блок-схема, представляющая примеры компонентов одного из устройств, которое можно сконфигурировать для реализации особенностей процессов, описываемых в настоящем описании. Устройство 1200 может представлять собой мобильный телефон, смартфон, настольный компьютер, переносной или портативный компьютер, нетбук, ноутбук, смартбук, планшет, стереосистему, телевизор, проигрыватель DVD, цифровое записывающее устройство или любое из множества других устройств. Устройство 1200 может содержать инструментальное средство кодирования и/или декодирования. Однако компоненты, проиллюстрированные на фиг. 12, являются лишь примерами. Конкретное устройство может быть сконфигурировано для реализации различных вариантов осуществления, описанных в настоящем описании, но может содержать или может не содержать все компоненты. Например, некоторые реализации могут не содержать громкоговоритель или микрофон.

[00461] В этом примере устройство содержит систему 1205 интерфейсов. Система 1205 интерфейсов может содержать такой сетевой интерфейс, как беспроводной сетевой интерфейс. Альтернативно или дополнительно система 1205 интерфейсов может содержать интерфейс универсальной последовательной шины (USB) или другой подобный интерфейс.

[00462] Устройство 1200 содержит логическую систему 1210. Логическая система 1210 может содержать процессор, такой как одно- или многокристальный процессор общего назначения. Логическая система 1210 может содержать процессор цифровой обработки сигналов (DSP), проблемно-ориентированную интегральную микросхему (ASIC), программируемую вентильную матрицу (FPGA) или другое программируемое логическое устройство, схему на дискретных компонентах или транзисторную логическую схему, или компоненты дискретного аппаратного обеспечения, или их комбинации. Логическая система 1210 может конфигурироваться для управления другими компонентами устройства 1200. И хотя интерфейсы не показаны между компонентами устройства 1200 на фиг. 12, логическая система может конфигурироваться для сообщения с другими компонентами. При необходимости, другие компоненты могут конфигурироваться или могут не конфигурироваться для сообщения друг с другом.

[00463] Логическая система 1210 может конфигурироваться для выполнения функциональной возможности обработки аудиоданных различных типов, такой как функциональная возможность кодера и/или декодера. Такая функциональная возможность кодера и/или декодера может содержать, без ограничения, функциональную возможность кодера и/или декодера, описанную в настоящем описании. Например, логическая система 1210 может конфигурироваться для обеспечения функциональной возможности, относящейся к декоррелятору, описанному в настоящем описании. В некоторых таких реализациях логическая система 1210 может конфигурироваться для работы (по меньшей мере, частично) в соответствии с программным обеспечением, хранящимся на одном или нескольких постоянных носителях данных. Эти постоянные носители данных могут включать такую связанную с логической системой 1210 память, как память с произвольным доступом (RAM) и/или постоянное запоминающее устройство (ROM). Постоянные носители данных могут содержать память системы 1215 памяти. Система 1215 памяти может содержать один или несколько постоянных носителей данных подходящих типов, такие как флеш-память, накопитель на жестком магнитном диске и т.д.

[00464] Например, логическая система 1210 может конфигурироваться для приема кадров кодированных аудиоданных через систему 1205 интерфейсов и для декодирования этих кодированных аудиоданных в соответствии со способами, описанными в настоящем описании. Альтернативно или дополнительно логическая система 1210 может конфигурироваться для приема кадров кодированных аудиоданных через интерфейс между системой 1215 памяти и логической системой 1210. Логическая система 1210 может конфигурироваться для управления громкоговорителем (громкоговорителями) 1220 в соответствии с декодированными аудиоданными. В некоторых реализациях логическая система 1210 может конфигурироваться для кодирования аудиоданных в соответствии с обычными способами кодирования и/или в соответствии со способами кодирования, описанными в настоящем описании. Логическая система 1210 может конфигурироваться для приема таких аудиоданных через микрофон 1225, через систему 1205 интерфейсов и т.д.

[00465] Дисплейная система 1230 может содержать дисплей одного или нескольких типов в зависимости от раскрытия устройства 1200. Например, дисплейная система 1230 может содержать жидкокристаллический дисплей, плазменный дисплей, бистабильный дисплей и т.д.

[00466] Система 1235 пользовательского ввода может содержать одно или несколько устройств, сконфигурированных для приема ввода от пользователя. В некоторых реализациях, система 1235 пользовательского ввода может содержать сенсорный экран, который накладывается на дисплей дисплейной системы 1230. Система 1235 пользовательского ввода может содержать кнопки, клавиатуру, переключатели и т.д. В некоторых реализациях система 1235 пользовательского ввода содержит микрофон 1225; через микрофон 1225 пользователь может подавать голосовые команды для устройства 1200. Логическая система может конфигурироваться для распознавания речи и для управления, по меньшей мере, некоторыми операциями устройства 1200 в соответствии с этими голосовыми командами.

[00467] Система 1240 питания может содержать один или несколько аккумуляторов энергии, таких как никель-кадмиевый аккумулятор или литий-ионный аккумулятор. Система 1240 питания может конфигурироваться для получения энергии от электрической розетки.

[00468] Различные модификации реализаций, описанных в данном раскрытии, могут быть легко очевидны для средних специалистов в данной области техники. Общие принципы, определенные в данном раскрытии, могут применяться к другим реализациям без отступления от духа и объема данного раскрытия. Например, хотя различные реализации были описаны в выражениях Dolby Digital и Dolby Digital Plus, способы, описанные в настоящем описании, могут быть реализованы в сочетании с другими аудиокодеками. Таким образом, формула изобретения не предполагается как ограниченная реализациями, показанными в данном раскрытии, но подлежит согласованию с наиболее широким объемом, соответствующим данному раскрытию, принципам и новаторским характерным признакам, раскрытым в данном раскрытии.

Похожие патенты RU2620714C2

название год авторы номер документа
СПОСОБЫ УПРАВЛЕНИЯ МЕЖКАНАЛЬНОЙ КОГЕРЕНТНОСТЬЮ ЗВУКОВЫХ СИГНАЛОВ, ПОДВЕРГНУТЫХ ПОВЫШАЮЩЕМУ МИКШИРОВАНИЮ 2014
  • Ен, Куан-Чиэх
  • Мелкоте, Винай
  • Филлерс, Мэтью
  • Дейвидсон, Грант А.
RU2630370C9
ДЕКОРРЕЛЯЦИЯ СИГНАЛОВ В СИСТЕМЕ ОБРАБОТКИ АУДИОДАННЫХ 2014
  • Мелкоте Винай
  • Ен Куан-Чиэх
  • Дейвидсон Грант А.
  • Филлерс Мэтью
  • Винтон Марк С.
  • Кумар Вивек
RU2614381C2
СТЕРЕОФОНИЧЕСКОЕ РАСШИРЕНИЕ 2009
  • Потард Гийом
RU2469497C2
УПРАВЛЯЕМОЕ МОДУЛЕМ РЕНДЕРИНГА ПРОСТРАНСТВЕННОЕ ПОВЫШАЮЩЕЕ МИКШИРОВАНИЕ 2014
  • Эртель Кристиан
  • Хильперт Йоханнес
  • Хельцер Андреас
  • Кунтц Ахим
  • Плогстис Ян
  • Крачмер Михаэль
RU2659497C2
СПОСОБ И УСТРОЙСТВО ДЛЯ ГЕНЕРАЦИИ СТЕРЕОСИГНАЛА С УСОВЕРШЕНСТВОВАННЫМ ПЕРЦЕПЦИОННЫМ КАЧЕСТВОМ 2008
  • Нейгебауэр Бернхард
  • Плогстиес Ян
  • Попп Харальд
RU2444154C2
АДАПТИВНОЕ ГЕНЕРИРОВАНИЕ РАССЕЯННОГО СИГНАЛА В ПОВЫШАЮЩЕМ МИКШЕРЕ 2014
  • Сифелдт Алан Дж.
  • Винтон Марк С.
  • Браун К. Филлип
RU2642386C2
УСТРОЙСТВО ДЛЯ КОДИРОВАНИЯ АУДИО СИГНАЛА, ИМЕЮЩЕГО МНОЖЕСТВО КАНАЛОВ 2011
  • Кунтц Ахим
  • Диш Саша
  • Херре Юрген
  • Кюх Фабиан
  • Хильперт Йоханнес
RU2640650C2
УСТРОЙСТВО ДЛЯ ДЕКОДИРОВАНИЯ СИГНАЛА, СОДЕРЖАЩЕГО ПЕРЕХОДНЫЕ ПРОЦЕССЫ, ИСПОЛЬЗУЯ БЛОК ОБЪЕДИНЕНИЯ И МИКШЕР 2011
  • Кунтц Ахим
  • Диш Саша
  • Херре Юрген
  • Кюх Фабиан
  • Хильперт Йоханнес
RU2573774C2
УСТРОЙСТВО ДЛЯ ГЕНЕРИРОВАНИЯ ДЕКОРРЕЛИРОВАННОГО СИГНАЛА, ИСПОЛЬЗУЯ ПЕРЕДАННУЮ ФАЗОВУЮ ИНФОРМАЦИЮ 2011
  • Кунтц Ахим
  • Диш Саша
  • Херре Юрген
  • Кюх Фабиан
  • Хильперт Йоханнес
RU2580084C2
КОДИРОВАНИЕ ЗВУКА С ИСПОЛЬЗОВАНИЕМ ДЕКОРРЕЛИРОВАННЫХ СИГНАЛОВ 2005
  • Пурнхаген Хейко
  • Энгдегард Йонас
  • Бребарт Ерун
  • Схейерс Эрик
RU2369982C2

Иллюстрации к изобретению RU 2 620 714 C2

Реферат патента 2017 года УЛУЧШЕНИЕ ЗВУКОВОГО СИГНАЛА ПРИ ПОМОЩИ ОЦЕНОЧНЫХ ПРОСТРАНСТВЕННЫХ ПАРАМЕТРОВ

Группа изобретений относится к средствам обработки аудиоданных. Технический результат – создание средств, обеспечивающих улучшенную обработку аудиоданных. Для этого принятые аудиоданные могут включать первый набор частотных коэффициентов и второй набор частотных коэффициентов. Пространственные параметры, по меньшей мере, для части второго набора частотных коэффициентов могут оцениваться, по меньшей мере, частично на основе первого набора частотных коэффициентов. Оценочные пространственные параметры могут применяться ко второму набору частотных коэффициентов для генерирования модифицированного второго набора частотных коэффициентов. Первый набор частотных коэффициентов может соответствовать первому диапазону частот, а второй набор частотных коэффициентов может соответствовать второму диапазону частот. Комбинированные частотные коэффициенты составного канала связывания могут основываться на частотных коэффициентах двух или большего количества каналов. Можно вычислить коэффициенты взаимной корреляции между частотными коэффициентами первого канала и комбинированными частотными коэффициентами. 3 н. и 14 з.п. ф-лы, 37 ил.

Формула изобретения RU 2 620 714 C2

1. Способ обработки аудиоданных, включающий:

прием аудиоданных, включающих первый набор частотных коэффициентов и второй набор частотных коэффициентов;

оценивание на основе, по меньшей мере, части первого набора частотных коэффициентов, пространственных параметров, по меньшей мере, для части второго набора частотных коэффициентов; и

применение оценочных пространственных параметров ко второму набору частотных коэффициентов для генерирования модифицированного второго набора частотных коэффициентов;

при этом первый набор частотных коэффициентов соответствует первому диапазону частот, а второй набор частотных коэффициентов соответствует второму диапазону частот;

при этом аудиоданные содержат данные, соответствующие отдельным каналам и связанному каналу, и при этом первый диапазон частот соответствует диапазону частот отдельных каналов, а второй диапазон частот соответствует диапазону частот связанных каналов;

при этом аудиоданные содержат частотные коэффициенты в первом диапазоне частот для двух или большего количества каналов;

при этом процесс оценивания включает:

создание составного канала связывания, основанного на аудиоданных из отдельных каналов в первом диапазоне частот, которое включает вычисление комбинированных частотных коэффициентов составного канала связывания на основе частотных коэффициентов двух или большего количества каналов в первом частотном диапазоне; и

вычисление, по меньшей мере, для первого канала коэффициентов взаимной корреляции между частотными коэффициентами первого канала и комбинированными частотными коэффициентами.

2. Способ по п. 1, отличающийся тем, что процесс применения включает применение оценочных пространственных параметров на поканальной основе.

3. Способ по п. 1, отличающийся тем, что коэффициенты взаимной корреляции представляют собой нормированные коэффициенты взаимной корреляции.

4. Способ по п. 3, отличающийся тем, что процесс оценивания включает разделение, по меньшей мере, части первого диапазона частот на полосы первого диапазона частот и вычисление нормированного коэффициента взаимной корреляции для каждой полосы первого диапазона частот.

5. Способ по п. 4, отличающийся тем, что процесс оценивания включает:

усреднение нормированных коэффициентов взаимной корреляции по всем полосам первого диапазона частот канала; и

применение масштабного коэффициента к среднему нормированных коэффициентов взаимной корреляции для получения оценочных пространственных параметров для канала.

6. Способ по п. 5, отличающийся тем, что масштабный коэффициент уменьшается с повышением частоты.

7. Способ по любому из пп. 5 и 6, отличающийся тем, что дополнительно включает внесение шума для моделирования дисперсии оценочных пространственных параметров.

8. Способ по п. 7, отличающийся тем, что дисперсия шума, вносимого логической системой, может, по меньшей мере, частично основываться на дисперсии в нормированных коэффициентах взаимной корреляции.

9. Способ по любому из пп. 1-6, отличающийся тем, что дополнительно включает измерение отношений энергий, приходящихся на полосу, между полосами из первого набора частотных коэффициентов и полосами из второго набора частотных коэффициентов, при этом оценочные пространственные параметры изменяются в соответствии с отношениями энергий, приходящихся на полосу.

10. Способ по любому из пп. 1-6, отличающийся тем, что оценочные пространственные параметры изменяются в соответствии с временными изменениями входных звуковых сигналов.

11. Способ по любому из пп. 1-6, отличающийся тем, что процесс применения оценочных пространственных параметров ко второму набору частотных коэффициентов составляет часть процесса декорреляции.

12. Способ по п. 11, отличающийся тем, что процесс декорреляции включает генерирование сигнала реверберации, или сигнала декорреляции, и его применение ко второму набору частотных коэффициентов.

13. Способ по п. 11, отличающийся тем, что процесс декорреляции включает избирательную или адаптивную к сигналу декорреляцию конкретных каналов и/или конкретных полос частот.

14. Способ по любому из пп. 1-6, отличающийся тем, что аудиоданные принимают в битовом потоке, кодированном в соответствии с унаследованным процессом кодирования.

15. Способ по п. 14, отличающийся тем, что применение пространственных параметров приводит к большей пространственной точности воспроизведения звука, чем точность, получаемая путем декодирования битового потока в соответствии с унаследованным процессом декодирования, соответствующим унаследованному процессу кодирования.

16. Устройство для осуществления способа по любому из пп. 1-15, содержащее:

интерфейс; и

логическую систему, сконфигурированную для:

приема аудиоданных, включающих первый набор частотных коэффициентов и второй набор частотных коэффициентов; и

оценивания на основе, по меньшей мере, части первого набора частотных коэффициентов, пространственных параметров, по меньшей мере, для части второго набора частотных коэффициентов; и применение оценочных пространственных параметров ко второму набору частотных коэффициентов для генерирования модифицированного второго набора частотных коэффициентов,

при этом первый набор частотных коэффициентов соответствует первому диапазону частот, а второй набор частотных коэффициентов соответствует второму диапазону частот;

при этом аудиоданные содержат данные, соответствующие отдельным каналам и связанному каналу, и при этом первый диапазон частот соответствует диапазону частот отдельных каналов, а второй диапазон частот соответствует диапазону частот связанных каналов;

при этом аудиоданные содержат частотные коэффициенты в первом диапазоне частот для двух или большего количества каналов; и

при этом процесс оценивания включает:

создание составного канала связывания, основанного на аудиоданных из отдельных каналов в первом диапазоне частот, которое включает вычисление комбинированных частотных коэффициентов составного канала связывания на основе частотных коэффициентов двух или большего количества каналов в первом частотном диапазоне; и

вычисление, по меньшей мере, для первого канала коэффициентов взаимной корреляции между частотными коэффициентами первого канала и комбинированными частотными коэффициентами.

17. Постоянный носитель данных, содержащий хранящееся на нем программное обеспечение, причем программное обеспечение содержит команды для управления устройством для осуществления способа по любому из пп. 1-15.

Документы, цитированные в отчете о поиске Патент 2017 года RU2620714C2

Пресс для выдавливания из деревянных дисков заготовок для ниточных катушек 1923
  • Григорьев П.Н.
SU2007A1
СПОСОБ ПОЛУЧЕНИЯ СОРБЕНТА НА РАСТИТЕЛЬНОЙ ОСНОВЕ ДЛЯ ОЧИСТКИ ВОДНЫХ РАСТВОРОВ ОТ ТЯЖЕЛЫХ МЕТАЛЛОВ 2002
  • Горлов И.Ф.
  • Осадченко И.М.
  • Мосолова Н.И.
  • Древин В.Е.
  • Косенко О.М.
RU2209114C1
СПОСОБЫ И УСТРОЙСТВА ДЛЯ КОДИРОВАНИЯ И ДЕКОДИРОВАНИЯ ОБЪЕКТНО-БАЗИРОВАННЫХ АУДИОСИГНАЛОВ 2010
  • Ким Донг Соо
  • Панг Хее Сук
  • Лим Дзае Хиун
  • Йоон Сунг Йонг
  • Ли Хиун Коок
RU2449388C2
СПОСОБ И УСТРОЙСТВО ДЛЯ ДЕКОДИРОВАНИЯ АУДИОСИГНАЛА 2006
  • Панг Хее Сук
  • Ох Хиеон О.
  • Ким Донг Соо
  • Лим Дзае Хиун
  • Дзунг Йанг Вон
RU2383942C2

RU 2 620 714 C2

Авторы

Филлерс Мэтью

Мелкоте Винай

Ен Куан-Чиэх

Дейвидсон Грант А.

Девис Марк Ф.

Даты

2017-05-29Публикация

2014-01-22Подача