УСТРОЙСТВО И СПОСОБ ГЕНЕРИРОВАНИЯ КОДИРОВАННОГО МНОГОКАНАЛЬНОГО СИГНАЛА И УСТРОЙСТВО И СПОСОБ ДЕКОДИРОВАНИЯ КОДИРОВАННОГО МНОГОКАНАЛЬНОГО СИГНАЛА Российский патент 2010 года по МПК G10L19/00 

Описание патента на изобретение RU2379768C2

Настоящее изобретение относится к методам параметрической многоканальной обработки аудио и, в частности, к эффективному размещению параметрической информации управления декодером, когда имеется несколько различных наборов параметров, доступных для восстановления.

В дополнение к двум стереоканалам рекомендуемое многоканальное окружающее воспроизведение включает в себя центральный канал С и два окружающих канала, т.е. левый окружающий канал Ls и правый окружающий канал Rs, и, дополнительно, если применимо, низкочастотный канал, также упоминаемый как канал улучшения низких частот (улучшение низких частот - УНЧ, LFE). Этот упоминаемый формат звука также упоминается как 3/2 (плюс УНЧ) стерео и недавно также как 5.1 многоканальный, что означает, что имеется три передних канала, два канала окружающего звука и один канал УНЧ. Вообще говоря, для этого рекомендуемого многоканального окружающего воспроизведения требуется пять или шесть каналов передачи. В среде воспроизведения требуется по меньшей мере пять громкоговорителей в соответствующих пяти различных расположениях для получения оптимальной так называемой зоны наилучшего восприятия на определенном расстоянии от пяти правильно расположенных громкоговорителей. Однако в отношении их расположения низкочастотный громкоговоритель может использоваться относительно свободным образом.

Существует несколько методов снижения количества данных, необходимых для передачи многоканального аудиосигнала. Такие методы также называются методами квазистерео. С этой целью ссылка делается на фиг.5. Фиг.5 изображает устройство 60 квазистерео. Это устройство может представлять собой устройство, реализующее, например, метод интенсивного стерео (метод ИС, IS) или бинауральное кодирование управляющих сигналов (БКУС, BCC). Такое устройство, как правило, принимает по меньшей мере два канала (CH1, CH2, … CHn) в качестве входного сигнала и выводит по меньшей мере один-единственный канал несущей (преобразование с уменьшением числа каналов) и параметрические данные, т.е. один или несколько наборов параметров. Параметрические данные определяются так, что аппроксимация каждого исходного канала (CH1, CH2, … CHn) может вычисляться в декодере.

Обычно канал несущей включает в себя выборки поддиапазона, спектральные коэффициенты или выборки временной области и т. д., которые обеспечивают относительно высококачественное представление лежащего в основе сигнала, в то же время параметрические данные и/или наборы параметров не включают в себя никакие такие выборки или спектральные коэффициенты. Вместо этого параметрические данные включают в себя параметры управления для управления установленным алгоритмом восстановления, таким как взвешивание посредством умножения, сдвиг во времени, сдвиг по частоте, …. Параметрические данные, таким образом, включают в себя только сравнительно грубое представление сигнала или связанного с ним канала. Выражаясь в числах, количество данных, требуемое каналом несущей, находится в диапазоне 60-70 Кбит/с, тогда как количество данных, требуемое параметрической информацией управления декодером, составляет порядка от 1,5 Кбит/с на канал. Одним примером параметрических данных являются известные масштабные коэффициенты, информация об интенсивном стерео или параметры бинауральных управляющих сигналов, как описано ниже.

Метод кодирования интенсивного стерео описан в препринте 3799 Общества инженеров-звукотехников (ОИЗ, AES), озаглавленном “Intensity stereo coding” J. Herre, K. H. Brandenburg, D. Lederer, февраль 1994 г., г. Амстердам. В общих чертах, принцип интенсивного стерео основан на преобразовании главной оси, которое должно применяться к данным двух стереофонических аудиоканалов. Если большинство точек данных размещается вокруг первой главной оси, улучшение кодирования может достигаться посредством поворота обоих сигналов на определенный угол до кодирования. Однако это не всегда применяется к реальным методам стереофонического воспроизведения. Восстановленные сигналы для левого и правого каналов состоят из различно взвешенных или масштабированных вариантов одного и того же переданного сигнала. Тем не менее, восстановленные сигналы отличаются по амплитуде, но они идентичны в отношении информации об их фазе. Огибающие энергии во времени обоих исходных аудиоканалов, однако, сохраняются при помощи операции селективного масштабирования, обычно действующей частотно-селективным образом. Это соответствует звуковосприятию человеком на высоких частотах, где преобладающие пространственные управляющие сигналы определяются огибающими энергии.

Кроме того, в практических реализациях переданный сигнал, т.е. канал несущей, формируется из суммарного сигнала левого канала и правого канала вместо поворота обоих компонентов. Кроме того, эта обработка, т.е. генерирование параметров интенсивного стерео для выполнения операции масштабирования, выполняется частотно-селективном образом, т.е. независимо друг от друга для каждого диапазона масштабных коэффициентов, т.е. для каждого частотного разбиения кодера. Предпочтительно, чтобы оба канала объединялись для формирования объединенного канала или канала «несущей». В дополнение к объединенному каналу определяется информация об интенсивном стерео, которая зависит от энергии первого канала, энергии второго канала и энергии объединенного или суммарного канала.

Метод БКУС описан в докладе 5574 на съезде ОИЗ, озаглавленном “Binaural cue coding applied to stereo and multi-channel audio compression”, C. Faller, F. Baumgarte, Май 2002 г., г. Мюнхен. При кодировании БКУС некоторое количество входных аудиоканалов преобразуется в спектральное представление, используя дискретное преобразование Фурье (ДПФ, DFT) с перекрывающимися окнами. Результирующий спектр разделяется на неперекрывающиеся разделы. Каждый раздел имеет ширину полосы частот, пропорциональную эквивалентной прямоугольной ширине полосы частот (ЭПШП, ERB). Так называемые межканальные разности уровней (МКРУ, ICLD), а также так называемые межканальные временные разности (МКВР, ICTD) вычисляются для каждого раздела, т.е. для каждого диапазона и для каждого кадра k, т.е. блока временных выборок. Параметры МКРУ и МКВР квантуются и кодируются для получения потока битов БКУС. Межканальные разности уровней и межканальные временные разности определяются для каждого канала относительно опорного канала. В частности, параметры вычисляются по предварительно определенным формулам в зависимости от конкретных разделений сигнала, подлежащего обработке.

На стороне декодера декодер принимает монофонический сигнал и поток битов БКУС, т.е. первый набор параметров для межканальных временных разностей и второй набор параметров для межканальных разностей уровней. Монофонический сигнал преобразуется в частотную область и вводится в блок синтеза, также принимающий декодированные значения МКРУ и МКВР. В блоке синтеза или блоке восстановления параметры БКУС (МКРУ и МКВР) используются для выполнения операции взвешивания монофонического сигнала для восстановления многоканального сигнала, который затем, после частотно/временного преобразования, представляет восстановление исходного многоканального аудиосигнала.

В случае БКУС модуль 60 квазистерео служит для вывода канальной информации управления декодером, так что параметрические канальные данные представляют собой квантованные и кодированные параметры МКРУ и МКВР, причем один из исходных каналов может использоваться в качестве опорного канала для кодирования канальной информации управления декодером. Обычно канал несущей формируется из суммы участвующих исходных каналов.

Конечно, вышеупомянутый метод обеспечивает только монофоническое представление для декодера, который может декодировать только канал несущей, но который не может генерировать параметрические данные для генерирования одной или нескольких аппроксимаций более чем одного входного канала.

Метод звукового кодирования, упоминаемый как метод БКУС, дополнительно описан в заявках на патент США 2003/0219130 А1, 2003/0026441 А1 и 2003/0035553 А1. Кроме того, дополнительно смотрите “Binaural Cue Coding. Part II: Schemes and Applications”, C. Faller and F. Baumgarte, IEEE: Transactions on Audio and Speech Proc., Vol. 11, No. 6, November 1993. Далее, также смотрите C. Faller and F. Baumgarte “Binaural Cue Coding applied to Stereo and Multi-Channel Audio compression”, препринт 112-ого съезда Общества инженеров-звукотехников (ОИЗ), Май 2002 г., и J. Herre, C. Faller, C. Ertel, J. Hilpert, A. Hoelzer, C. Spenger “MP3 Surround: Efficient and Compatible Coding of Multi-Channel Audio”, 116-ый съезд ОИЗ, г. Берлин, 2004 г., препринт 6049. Ниже более подробно представлена типовая общая схема БКУС для многоканального звукового кодирования в отношении фиг.6-8. Фиг.6 изображает общую схему кодирования БКУС для кодирования/передачи многоканальных аудиосигналов. Многоканальный входной аудиосигнал подается на вход 110 кодера 112 БКУС и «преобразуется с уменьшением числа каналов» в так называемом блоке 114 преобразования с уменьшением числа каналов, т.е. преобразуется в единственный суммарный канал. В настоящем примере сигнал на входе 110 представляет собой 5-канальный окружающий сигнал, имеющий передний левый канал и передний правый канал, левый окружающий канал и правый окружающий канал и центральный канал. Обычно блок преобразования с уменьшением числа каналов генерирует суммарный сигнал простым сложением этих пяти каналов в монофонический сигнал. Известны другие схемы преобразования с уменьшением числа каналов в технике, в которых все приводится к генерированию, используя многоканальный входной сигнал, сигнала с помощью преобразования с уменьшением числа каналов, имеющего единственный канал или имеющего несколько каналов, количество которых, в любом случае, меньше, чем количество исходных входных каналов. В настоящем примере операция преобразования с уменьшением числа каналов уже достигается тогда, когда четыре канала несущей генерировались из пяти входных каналов. Единственный выходной канал и/или несколько выходных каналов выводятся по линии 115 суммарного сигнала.

Информация управления декодером, получаемая блоком 116 анализа БКУС, выводится по линии 117 информации управления декодером. В блоке анализа БКУС могут вычисляться наборы параметров для МКРУ, МКВР или значений межканальной корреляции (МКК, ICC). Таким образом, имеется до трех различных наборов параметров (МКРУ, МКВР и МКК) для восстановления в блоке 122 синтеза БКУС.

Суммарный сигнал и информация управления декодером с наборами параметров обычно передаются на декодер 120 БКУС в квантованном и кодированном формате. Декодер БКУС разделяет переданный суммарный сигнал на несколько поддиапазонов и выполняет масштабирование, задержки и дополнительную обработку для генерирования поддиапазонов нескольких каналов, подлежащих восстановлению. Эта обработка выполняется так, что параметры МКРУ, МКВР и МКК (управляющие сигналы) восстановленного многоканального сигнала на выходе 121 аналогичны соответствующим управляющим сигналам для исходного многоканального сигнала на входе 110 кодера 112 БКУС. С этой целью декодер 120 БКУС включает в себя блок 122 синтеза БКУС и блок 123 обработки информации управления декодером.

Нижеследующее иллюстрирует внутреннюю структуру блока 122 синтеза БКУС в отношении фиг.7. Суммарный сигнал на линии 115 вводится в блок преобразования времени/частоты, обычно выполняемый в виде банка 125 фильтров БФ(FB). На выходе блока 125 присутствует несколько N сигналов поддиапазонов или, в максимальном случае, блок спектральных коэффициентов, если банк 125 звуковых фильтров выполняет преобразование, генерирующее N спектральных коэффициентов из N выборок временной области.

Блок 122 синтеза БКУС дополнительно включает в себя каскад 126 задержки, каскад 127 модифицирования уровня, каскад 128 обработки корреляции и каскад 129 БОФ(IFB) (банк обратных фильтров), представляющий банк обратных фильтров. На выходе каскада 129 восстановленный многоканальный аудиосигнал, имеющий, например, пять каналов в случае 5-канальной окружающей системы, может выводиться на группу громкоговорителей 124, как показано на фиг.6.

Фиг.7 дополнительно изображает, что входной сигнал s(n) преобразуется в частотную область или область банка фильтров посредством элемента 125. Сигнал, выводимый элементом 125, умножается, так что получается несколько версий одного и того же сигнала, как указано узлом 130. Количество версий исходного сигнала равно количеству выходных каналов в выходном сигнале, подлежащем восстановлению. Если каждая версия исходного сигнала подвергается определенной задержке d1, d2, … di, dN в узле 130, то результатом является такой случай на выходе блоков 126, который включает в себя версии одного и того же сигнала, но с различными задержками. Параметры задержки вычисляются блоком 123 обработки информации управления декодером на фиг.6 и выводятся из межканальных временных разностей, которые были определены блоком 116 анализа БКУС.

Это же применимо к параметрам умножения а1, а2 … ai, aN, которые также вычисляются блоком 123 обработки информации управления декодером на основании межканальных разностей уровней, определенных блоком 116 анализа БКУС.

Параметры МКК вычисляются блоком 116 анализа БКУС и используются для управления функциональными возможностями блока 128, так что определенные значения корреляции между задержанными и манипулированными по уровню сигналами получаются на выходе блока 128. Необходимо заметить, что порядок каскадов 126, 127, 128 может отличаться от того, который представлен на фиг.7.

Далее необходимо заметить, что при поблочной обработке аудиосигнала анализ БКУС также выполняется поблочно. Кроме того, анализ БКУС также выполняется по частоте, т.е. частотно-селективным образом. Это означает то, что для каждого спектрального диапазона имеется параметр МКРУ, параметр МКВР и параметр МКК. Параметры МКВР для по меньшей мере одного канала по всем диапазонам, таким образом, представляют набор параметров МКВР. Это же применяется к набору параметров МКРУ, представляющему все параметры МКРУ для всех частотных диапазонов, для восстановления по меньшей мере одного выходного канала. Это же применяется, в свою очередь, к набору параметров МКК, который и в этом случае включает в себя несколько индивидуальных параметров МКК для различных диапазонов для восстановления по меньшей мере одного выходного канала на основе входного канала или суммарного канала.

Ниже ссылка делается на фиг.8, изображающую случай, из которого можно понять определение параметров БКУС. Обычно параметры МКРУ, МКВР и МКК могут определяться между парами каналов. Является типичным, однако, что определение параметров МКРУ и МКВР выполняется между опорным каналом и каждым другим входным каналом, так что существует отдельный набор параметров для каждого входного канала. Это также иллюстрируется на фиг.8В.

Однако параметры МКК могут определяться иным образом. Вообще говоря, параметры МКК могут генерироваться в кодере между любыми парами каналов, что также схематически изображено на фиг.8В. В этом случае декодер будет выполнять синтез МКК так, что получается примерно такой же результат, что и тот, который присутствовал в исходном сигнале между любыми парами каналов. Однако было предположение для вычисления только параметров МКК между двумя самыми сильными каналами в любой момент времени, т.е. для каждого временного кадра. Эта схема представлена на фиг.8С, которая изображает пример, в котором в один момент времени вычисляется и передается параметр МКК между каналами 1 и 2 и в котором в другой момент времени вычисляется параметр МКК между каналами 1 и 5. Декодер тогда синтезирует межканальную корреляцию между двумя самыми сильными каналами в декодере и исполняет дополнительные обычно эвристические правила для синтезирования межканальной когерентности для остальных пар каналов.

В отношении вычисления, например, параметров умножения а1, … aN, основанных на переданных параметрах МКРУ, ссылка делается на противопоставленный доклад 5574 на съезде ОИЗ. Параметры МКРУ представляют распределение энергии в исходном многоканальном сигнале. Без потери всеобщности фиг.8А изображает то, что имеется четыре параметра МКРУ, представляющих разность энергий между всеми другими каналами и передним левым каналом. В блоке 123 обработки информации управления декодером параметры умножения а1, … aN выводятся из параметров МКРУ, так что полная энергия всех восстановленных выходных каналов представляет собой такую же энергию, что и та, которая присутствует для переданного суммарного сигнала, или, по меньшей мере, пропорциональна этой энергии. Одним путем определения этих параметров является двухэтапный процесс, в котором на первом этапе коэффициент умножения для левого переднего канала устанавливается равным 1, в то время как коэффициенты умножения для других каналов на фиг.8С устанавливаются равными переданным значениям МКРУ. Тогда, на втором этапе, энергия всех пяти каналов вычисляется и сравнивается с энергией переданного суммарного сигнала. Затем все каналы масштабируются вниз, а именно используя масштабный коэффициент, который равен для всех каналов, в котором масштабный коэффициент выбирается так, что полная энергия всех восстановленных выходных каналов после масштабирования равна полной энергии переданного суммарного сигнала и/или переданных суммарных сигналов.

В отношении показателя межканальной когерентности МКК, переданного с кодера БКУС на декодер БКУС в качестве дополнительного набора параметров, необходимо отметить, что манипулирование когерентностью может выполняться посредством модифицирования коэффициентов умножения, например, посредством умножения весовых коэффициентов всех поддиапазонов на случайные числа, имеющие значения между 20 log10-6 и 20 log106. Псевдослучайная последовательность обычно выбирается так, что дисперсия для всех критических диапазонов примерно равна и что среднее значение в каждом критическом диапазоне равно нулю. Одинаковая последовательность используется для спектральных коэффициентов каждого различного кадра или блока. Таким образом, ширина звуковой сцены управляется посредством модифицирования дисперсий псевдослучайной последовательности. Большая дисперсия генерирует большую ширину слышимости. Модифицирование дисперсии может выполняться в индивидуальных диапазонах, имеющих ширину критического диапазона. Это делает возможным одновременное существование нескольких объектов в сцене слышимости, в которой каждый объект имеет различную ширину слышимости. Подходящим распределением амплитуды для псевдослучайной последовательности является равномерное распределение по логарифмической шкале, например, представленное в публикации патента США 2002/0219130 А1.

Чтобы передавать пять каналов совместимым образом, например, в формате потока битов, который также подходит для нормального стереофонического декодера, может использоваться так называемый метод матрицирования, описанный в “MUSICAM Surround: A universal multi-channel coding system compatible with ISO/IEC 11172-3”, G. Theile и G. Stoll, препринт ОИЗ, октябрь 1992г., г. Сан-Франциско.

Кроме того, смотрите дополнительные методы многоканального кодирования, описанные в публикации “Improved MPEG 2 Audio multi-channel encoding”, B. Grill, J. Herre, K. H. Brandenburg, I. Eberlein, J. Koller, J. Miller, препринт 3865 ОИЗ, февраль 1994 г., г. Амстердам, в которой используется матрица совместимости для получения каналов, посредством преобразования с уменьшением числа каналов, из исходных входных каналов.

Итак, можно сказать, что метод БКУС делает возможным эффективное и также обратно-совместимое кодирование многоканального звукового материала, как также описано, например, в публикации специалиста E. Schuijer, J. Breebaart, H. Purnhagen, J. Engdegard, озаглавленной “Low-Complexity Parametric Stereo Coding”, 119-ый съезд ОИЗ, г. Берлин, 2004 г., препринт 6073. В этом контексте необходимо также упомянуть стандарт MPEG-4 (Экспертная группа по вопросам движущегося изображения) и, в частности, расширение на методы параметрического аудио, в которых эта часть стандарта также известна по обозначению ISO/IEC 14496-3: 2001/FDAM 2 (Parametric Audio). В этом отношении необходимо упомянуть, в частности, синтаксис в таблице 8.9 стандарта MPEG-4, озаглавленной “syntax of the ps_data()”. В этом примере заявители упоминают элементы синтаксиса “enable_icc” и “enable_ipdopd”, при этом эти элементы синтаксиса используются для включения и выключения передачи параметра МКК и фазы, соответствующей межканальным временным разностям. Также необходимо упомянуть элементы синтаксиса “icc_data()”, “ipd_data()” и “opd_data()”.

Вкратце необходимо отметить, что, как правило, такие параметрические многоканальные методы используются с применением одного или нескольких переданных каналов несущей, причем М переданных каналов формируются из N исходных каналов для восстановления снова N выходных каналов или количества K выходных каналов, причем K равно или меньше, чем количество исходных каналов N.

Во всех описанных до настоящего времени методах является проблематичным вопрос того, как может быть создана совместимость форматов между различными типами декодеров для многоканального декодирования, например, для декодеров БКУС и для других версий параметрической информации управления декодером. В частности, возникают две проблемы, когда на рынке существуют различные многоканальные декодеры наряду с тем, что в то же время на рынке присутствует информация управления декодером, имеющая различные наборы параметров, генерируемые различными многоканальными декодерами, и, таким образом, доступная для пользователя, который имеет только единственный декодер.

Во-первых, желательно иметь декодеры с высокой вычислительной возможностью, обеспечивающие оптимальное качество многоканального звука при декодировании. В то же время, однако, также будут декодеры, которые работают в условиях ограниченных ресурсов, такие как декодеры в мобильных устройствах, таких как мобильные телефоны. Конечно, такие декодеры должны обеспечивать многоканальный выход, имеющий качество, которое все же является максимально хорошим, но также должны иметь только ограниченный объем вычислительной работы. Это приводит к вопросу, могут ли быть форматы потока битов с наборами параметров для пространственного восстановления, которые поддерживают этот вид масштабируемости, т.е. которые предоставляют возможность как декодирования с высокой сложностью и, таким образом, оптимальным качеством, так и декодирования с уменьшенной сложностью, но также с соответствующим пониженным качеством.

Следующим аспектом, который следует рассмотреть при введении новых поколений/версий декодеров БКУС и, таким образом, потоков битов БКУС, является вопрос, как может быть сохранена совместимость между различными версиями потоков битов БКУС и декодерами БКУС. Другими словами, желательно, чтобы новые наборы параметров БКУС и также обновленные старые наборы параметров были обратно-совместимыми. Таким образом, конечно, желательно обеспечить направление обновления для пользователей БКУС, давая возможность представления новых улучшенных многоканальных схем, когда они станут доступны вследствие технического прогресса. С другой стороны, новые форматы потоков битов БКУС обычно приводят к несовместимости между этими потоками битов и различными (более старыми) версиями декодеров БКУС.

В частности, необходимо отметить, что многоканальные кодеры/декодеры должны использоваться во все возрастающем количестве областей применения, в которых необязательно является доступным максимальные вычислительные возможности, но которые также не всегда обязательно требуют полного качества звука.

Задачей настоящего изобретения является предоставление идеи, которая является эффективной и гибкой, т.е. которая дает возможность, например, выполнить интеграцию новых наборов параметров или обновление старых наборов параметров и которая в то же самое время может гибко использоваться в многочисленных различных применениях.

Эта задача достигается устройством для генерирования кодированного многоканального сигнала по п.1 формулы изобретения, устройством для декодирования кодированного многоканального сигнала по п.15 формулы изобретения, способом генерирования кодированного многоканального сигнала по п.21 формулы изобретения, способом декодирования многоканального сигнала по п.22 формулы изобретения или компьютерной программой по п.23 формулы изобретения.

Настоящее изобретение основано на том факте, что эффективное и обратно-совместимое декодирование кодированных многоканальных сигналов достигается тогда, когда кодированный многоканальный сигнал записывается в виде потока данных, который, в дополнение к по меньшей мере одному каналу передачи или каналу несущей, включает в себя по меньшей мере два различных набора параметров, причем два набора параметров записываются в поток данных, так что восстановление выходных каналов может выполняться при помощи менее чем по меньшей мере двух наборов параметров. Согласно изобретению поток данных записывается так, что декодер может идентифицировать, какой из наборов параметров требуется для восстановления и какой набор параметров необязательно является необходимым для восстановления. В этом случае декодер может использовать только набор параметров, который является необходимым (т.е. обязательным) для восстановления, и просто игнорировать необязательные наборы параметров, если этого требуют внешние обстоятельства. В результате этого декодер является быстродействующим и обходится ограниченной вычислительной возможностью при использовании только обязательного набора параметров для восстановления наряду с тем, что в то же самое время другой декодер может выполнять высококачественное многоканальное восстановление на основе этого же потока данных, представляющего кодированный многоканальный сигнал, которое, однако, также требует больше времени и/или большей вычислительной возможности и/или, вообще говоря, больших ресурсов декодера.

В предпочтительном варианте осуществления настоящего изобретения обязательным набором параметров является тот, который включает в себя межканальные разности уровней. Как было обнаружено в соответствии с изобретением, эти межканальные разности уровней являются очень важными для определения базового распределения многоканального звука между выходными каналами для всех типов случаев воспроизведения. Межканальные временные разности могут классифицироваться как необязательные наборы параметров, так как они, главным образом, уместны тогда, когда должно быть представление или при помощи наушников, т.е. два выходных канала из одного переданного канала, или когда происходит многоканальное звуковое представление в так называемой относительно «сухой» акустической ситуации, т.е. акустической ситуации, включающей в себя немногочисленное эхо. Межканальные временные разности, таким образом, уже могут классифицироваться как необязательный набор параметров.

Значения межканальной корреляции важны для предоставления ширины источников звука и для дополнительного создания впечатления у слушателя, что он или она находятся на сцене со смешанными источниками звука, например, классический оркестр, который включает в себя много некоррелированных звуковых компонентов. Набор параметров МКК, таким образом, также может классифицироваться как необязательный набор параметров, так как он очевидно имеет важное влияние на качество, но при восстановлении часто приводит к относительно большому объему работ по вычислению, который, например, не является настолько важным в обязательном наборе параметров межканальных разностей уровней, так как, по существу, требуется только операция взвешивания, т.е. умножения, которая может выполняться эффективно по отношению к вычислению.

Что касается проблемы обратной совместимости кодированных многоканальных сигналов с наборами параметров в потоках данных, то набор параметров, имеющий, например, более высокий номер версии, записывается в поток данных, так что восстановление декодером может выполняться без этого набора параметров, в результате декодер будет использовать только первый набор параметров для восстановления и просто пропустит второй набор параметров, когда он установит, что он не может обрабатывать этот второй набор параметров.

На стороне декодера это означает, что декодер должен полностью считывать набор параметров и обрабатывать его, когда он идентифицирует этот набор параметров как обязательный набор параметров, что, однако, декодер просто пропустит биты в потоке битов, принадлежащие набору параметров, когда он встретит набор параметров, который не является обязательным для восстановления, т.е. который обозначен как необязательный. Декодеру, таким образом, не нужно иметь никаких сведений о синтаксисе второго набора параметров, чтобы он мог иметь дело с кодированным многоканальным сигналом, но он может просто пропустить его и просто перейти к последующим областям кодированного многоканального сигнала, которые могут быть еще необходимы для восстановления.

Предпочтительно, чтобы информация о длине, таким образом, вставлялась в поток данных для наборов параметров, обозначенных как необязательные, которые дают возможность декодеру просто пропустить биты, связанные с этим набором параметров, быстрым и эффективным образом и взять только наборы параметров, обозначенные как обязательные для декодирования. Что касается обратной совместимости, то также предпочтительно, чтобы номер версии ассоциировался с по меньшей мере каждым необязательным набором параметров, который задает, какой версией кодера генерировался этот набор параметров. Таким образом, например, набор параметров для межканальных разностей уровней самой низшей версии будет обозначаться как обязательный в потоке данных, тогда как набор параметров для межканальных разностей уровней более поздней версии кодера получает другой номер версии, так что декодер будет просто использовать соответствующий набор параметров с более низшим номером версии для восстановления, когда он установит, что он не может обрабатывать набор параметров, имеющий более высокий номер версии.

Наконец, необходимо отметить, что поток данных, представляющий многоканальный сигнал, необязательно должен также содержать каналы передачи. Вместо этого они могли генерироваться и передаваться отдельно, как, например, в том случае, когда параметры БКУС записываются впоследствии на компакт-диск в соответствующий канал, причем компакт-диск уже содержит М (= равный или больше 1) каналов передачи.

Предпочтительные варианты осуществления настоящего изобретения подробно объясняются ниже в отношении прилагаемых чертежей, на которых:

фиг.1А представляет собой общий вид кодированного многоканального сигнала, имеющего определенный синтаксис потока данных согласно варианту осуществления настоящего изобретения;

фиг.1B представляет собой подробное представление блока управления по фиг.1A согласно варианту осуществления настоящего изобретения;

фиг.2A представляет собой блок-схему кодера согласно варианту осуществления настоящего изобретения;

фиг.2B представляет собой блок-схему декодера согласно варианту осуществления настоящего изобретения;

фиг.3A-3D изображают предпочтительную реализацию для конфигурации набора параметров согласно настоящему изобретению;

фиг.4A-4C изображают предпочтительную реализацию данных набора параметров согласно настоящему изобретению;

фиг.5 изображает общее представление многоканального кодера;

фиг.6 представляет собой схематическую блок-схему тракта кодера БКУС/декодера БКУС;

фиг.7 представляет собой блок-схему блока синтеза БКУС по фиг.6; и

фиг.8А-8С изображают представление типовых планов действий для вычисления наборов параметров МКРУ, МКВР и МКК.

Фиг.2A изображает предпочтительную реализацию устройства для генерирования кодированного многоканального сигнала, представляющего некодированный многоканальный сигнал, содержащий N исходных каналов, которые подаются на вход 20 средства 22 для предоставления как М каналов передачи, так и параметрической информации с по меньшей мере двумя наборами параметров. В частности, количество М каналов передачи, выводимых на выходе 23 средства 22, меньше количества N исходных аудиоканалов. Индивидуальные наборы параметров, которые вместе представляют параметрическую информацию для восстановления К выходных каналов, подаются на выходы 24а, 24b, 24с средства 22 для предоставления М каналов передачи, причем М равно или больше 1 и меньше N, подаются на средство 25 для записи потока данных на выходной стороне, которые подаются на выход 26, точно как и наборы параметров на выходах 24а, 24b, 24с.

Как описано выше, информация о преобразовании с уменьшением числа каналов (М каналов передачи) также может передаваться/храниться отдельно от параметрической информации.

Средство 25 для записи потока данных, представляющего кодированный многоканальный сигнал, выполнено с возможностью записи М каналов передачи в поток данных и дополнительно записи первого, второго и третьего набора параметров в поток данных, так что восстановление К выходных каналов может выполняться без использования одного из трех наборов параметров и, предпочтительно, даже без использования по меньшей мере двух из трех наборов параметров. В этом отношении наборы параметров на выходах 24а-24с средства 22 для предоставления обозначаются так, что один набор параметров, такой как первый набор параметров, абсолютно необходим для восстановления, тогда как два других набора параметров, т.е. второй набор параметров и третий набор параметров, определяются так, что они только необязательно требуются для восстановления.

Средство 25 для записи затем записывает первый набор параметров в качестве обязательного набора параметров в поток данных и записывает второй набор параметров и третий набор параметров только в качестве необязательных наборов параметров в поток данных, как описано ниже.

Поток данных на выходе 26 на фиг.2A подается на вход 27 потока данных многоканального декодера, изображенного на фиг.2B. Данные потока данных подаются на средство 28 для считывания потока данных, в котором средство 28 для считывания потока данных, точно как и кодер, показанный на фиг.2A, снова содержит логический выход 29 для М каналов передачи, извлеченных из потока данных, и дополнительные логические выходы 30а, 30b для наборов параметров, содержащихся в потоке данных. В предпочтительном варианте осуществления настоящего изобретения, в котором первый набор параметров обозначается как обязательный или абсолютно необходимый для восстановления, средство 28 для считывания подает этот первый набор параметров на средство 31 для восстановления при помощи логического выхода 30а. Если средство 28 для считывания, например, фиксировано установлено на считывание только обязательных наборов параметров и подачи их на средство 31 для восстановления, то средство 28 просто пропустит второй набор параметров в потоке данных на входе 27, что символически представлено логическим выходом 30b с обрывом на фиг.2B.

Сигнал управления, извлекаются ли только обязательные наборы параметров или дополнительно также необязательные наборы параметров из потока данных и подаются ли на средство 31, также может подаваться на средство 28 при помощи управляющего входа 32, причем информация о доступности ресурсов и/или управляющая информация, извлеченная из нее, поступает по управляющему входу 32.

Информация о доступности ресурсов, например, может заключаться в том, что питаемый от батарей декодер устанавливает, что имеется еще достаточное количество доступной энергии батарей, так что средство 28 для считывания потока данных инструктируется на извлечение не только обязательных наборов параметров, но также необязательных наборов параметров и подачу их на средство 31 для восстановления при помощи соответствующих логических выходов, так что, в свою очередь, это средство обеспечивает К выходных каналов на выходе 33, причем К равно или меньше, чем исходное количество N исходных входных каналов на входе 20 на фиг.2A. Необходимо заметить, что предпочтительно, чтобы количество К было равно количеству N, так как декодер, возможно, будет стремиться генерировать все выходные каналы, кодированные в потоке данных.

Средство 28 считывания потока данных для считывания потока данных также служит для считывания по меньшей мере первого набора параметров и для возможности пропуска по меньшей мере одного набора параметров, такого как второй набор параметров, когда используется масштабируемость в потоке данных, т.е. когда набор параметров в потоке данных не используется для восстановления. Средство 31 восстановления тогда служит для восстановления K выходных каналов, используя М каналов передачи и первый набор параметров, но не используя второй набор параметров.

В варианте осуществления настоящего изобретения средство 22 для предоставления представляет собой кодер БКУС, принимающий N исходных каналов и на выходной стороне предоставляющий М каналов передачи и индивидуальные наборы параметров. Альтернативно, средство 22 для предоставления также может представлять собой так называемый транскодер потока битов, который на входной стороне принимает информацию, уже записанную в немасштабируемом формате (только наборы параметров или наборы параметров вместе с каналами передачи), когда они генерируются элементами 114 и 116 на фиг.7, например, и который инструктирует средство 25 для записи соответственно на перезапись потока битов, таким образом записывая наборы параметров в поток данных в масштабируемом виде. Это означает то, что, для того чтобы иметь возможность понимать поток данных, декодеру необязательно считывать и выполнять синтаксический анализ всех данных потока данных, но он может пропустить данные, связанные с необязательным набором параметров при обнаружении необязательного набора параметров.

Таким образом, имеются различные возможности для фактической записи потока данных с масштабируемыми наборами параметров. В одном варианте осуществления начало данных для набора параметров может быть установлено в соответствии с фиксированным растром потока данных. В этом случае передача информации о длине, связанная с необязательным набором параметров, не является обязательной. Этот фиксированный растр, однако, может являться результатом искусственного расширения количества данных в потоке данных посредством битов заполнения. Таким образом, предпочтительно ассоциировать информацию о длине с каждым необязательным набором параметров, так что, когда он имеет информацию, декодер пропускает необязательный набор параметров, т.е. просто пропускает некоторое количество битов в предпочтительно последовательном потоке данных на основе информации о длине, затем возобновляет считывание и анализ в надлежащем месте потока данных, т.е. когда начинаются данные для нового набора параметров и/или для новой информации.

Альтернативная возможность сигнализирования начала нового набора параметров заключается, например, в том, что имеется синхрокомбинация перед фактическими данными, которые имеют некоторую битовую комбинацию, т.е. которые могут идентифицироваться без фактического анализа данных просто на основе поиска битовой комбинации, сигнализируя декодеру, что здесь начинаются данные для набора параметров и заканчиваются при последующей синхрокомбинации. В этом случае, когда набор параметров был идентифицирован как необязательный набор параметров, декодер выполняет поиск синхрокомбинации, связанной с началом необязательного набора параметров, чтобы затем выполнить поиск комбинации с битами, следующими за синхрокомбинацией, без синтаксического анализа до тех пор, пока он не встретит следующую синхрокомбинацию. Биты между двумя синхрокомбинациями тогда не будут использоваться для восстановления, но просто будут игнорироваться, тогда как данные при последующей синхрокомбинации, сигнализирующие окончание необязательного набора параметров, могут использоваться в качестве заданных в соответствии с синтаксисом потока битов, если эти данные не принадлежат другому необязательному набору параметров.

В предпочтительном варианте осуществления настоящего изобретения по меньшей мере два набора параметров, необходимых для восстановления нескольких каналов, классифицируются в отношении их важности для восприятия. Набор параметров, наиболее важный для восприятия, т.е. для качества восстановленного многоканального сигнала, обозначается как обязательный набор параметров в потоке данных, тогда как другие наборы параметров обозначаются только как необязательные наборы параметров. Дальнейшая классификация на обязательный, необязательный и, например, наборы параметров, необходимые только для студийного восстановления, также может выполняться для достижения, например, трех этапов масштабирования вместо только двух этапов масштабирования. Необходимо отметить, что достаточно обозначить или обязательные или, предпочтительно, необязательные наборы параметров, так как тип соответственно необозначенного набора параметров автоматически следует из отсутствия обозначения.

Фиг.1A изображает схематическое представление потока данных, который в варианте осуществления, показанном на фиг.1A, включает в себя, прежде всего, блок 10 управления, блок, в котором находятся данные М каналов передачи, который обозначается 11, и блоки 12а, 12b, … 12с для каждого набора параметров. В предпочтительном варианте осуществления настоящего изобретения блок 10 управления включает в себя различные индивидуальные части информации, схематически изображенные на фиг.1B. Таким образом, введенные данные 100 в блоке 10 управления сигнализируют о количестве обязательных наборов параметров при помощи поля с названием “numBccDataMand”. Кроме того, поле 101 сигнализирует, имеются ли необязательные наборы параметров. Поле, обозначенное “OptBccDataPresent”, используется для этой цели. Другое поле блока 10 управления дополнительно сигнализирует о количестве необязательных наборов параметров с переменной “numBccDataOpt”. Другие блоки 103, 104, 105 сигнализируют тип и/или номер версии набора i параметров для каждого набора параметров. Поле с названием “BccDataId” используется для этого. Дополнительная необязательная последовательность полей 106, 107, 108 дает необязательную информацию о длине, обозначенную “Lengthinfo” для каждого набора параметров, обозначенного как необязательный, т.е. который включается в количество необязательных наборов параметров. Эта информация о длине дает длину в битах соответствующего связанного, например i-ого, набора параметров. Как описано ниже, “Lengthinfo” также может включать в себя информацию о количестве битов, необходимых для сигнализирования о длине или, альтернативно, также о фактическом определении длины.

Фиг.3A-3D изображают предпочтительный вид конфигурации набора параметров. Конфигурация набора параметров может выполняться для каждого кадра, но также может выполняться, например, только один раз для группы кадров, например, в начале файла, содержащего многие кадры. Таким образом, фиг.3A предоставляет определение присутствия и количество необязательных наборов параметров в псевдокоде, в котором “uimsbf” означает «целое число без знака и с самым старшим битом впереди», т.е. целое число, которое не включает в себя никакого знака и самые старшие биты которого находятся впереди в потоке данных. Таким образом, переменная numBccData, задающая количество данных БКУС, представлена первой, например, в поле 100 блока 10 управления.

Кроме того, поле 101 используется для установления, имеются ли вообще какие-либо необязательные наборы параметров (optBccDataPresent). После этого количество (numBccDataOpt) необязательных наборов параметров считывается для получения дополнительной информации по необязательным наборам параметров или так называемые «порции» (OptChunkInfo), когда это будет выполнено. Переменная numBccDataOptM1 содержит суффикс «М1», означающий «минус 1». Это снова уравновешивается добавлением «+1» на фиг.3D.

Фиг.3B изображает общий вид значения, которое, в варианте осуществления, идентификатор данных набора параметров может иметь в полях 103-105. Таким образом, переменная “BccDataId”, прежде всего, может включать в себя имя, т.е. тип параметра, т.е. МКРУ, МКВР и МКК, и одновременно номер V1 или V2 версии соответственно. Таким образом, на фиг.3B должно быть видно, что поток данных фактически может содержать межканальные разности уровней первой версии V1 и более поздней второй версии V2 одновременно, причем выполненный соответствующим образом декодер для первой версии может просто считывать ICLD_V1 в качестве обязательного набора параметров и может игнорировать ICLD_V2, тогда как декодер с более высоким номером версии может просто считывать ICLD_V2 именно в качестве обязательного набора параметров, игнорируя, однако, ICLD_V1 в качестве набора параметров, только необязательно требуемого в данном сценарии. Альтернативно, набор данных может быть записан, так что обязательные наборы данных всегда присутствуют только в одной версии в потоке данных.

Фиг.3C изображает идентификацию необязательных наборов параметров. Таким образом, в информации о необязательных наборах параметров идентификатор 103-105 набора параметров на фиг.1B считывается для каждого набора параметров для получения информации о каждом наборе параметров, который является необязательным. Кроме того, длина набора параметров считывается для каждого необязательного набора параметров, если она была передана в потоке битов, представленная командой “OptChunkLen()” на фиг.3C.

Что касается определения информации о длине для необязательных наборов параметров, смотрите фиг.3D, которая иллюстрирует то, как в предпочтительном варианте осуществления настоящего изобретения длина в битах считывается для каждого набора параметров из данных, связанных с каждым необязательным набором параметров.

Цикл считывания набора параметров, выполняемый декодером, схематически изображается на фиг.4A. Таким образом, фактические данные набора параметров, которые находятся в блоках 12а-12с на фиг.1, считываются при помощи BccData().

Считывание информации о длине иллюстрируется на фиг.4B. Например, BccDataLenBits описывает количество битов, необходимых для сигнализировании о фактической длине битов порции. BccDataLen затем фактически дает длину в битах, которую имеет порция. Эта двухступенчатая система является гибкой, с одной стороны, и экономит данные, с другой стороны, так как она особенно эффективна, когда порции имеют сильно изменяющуюся длину в битах, которая конкретно применяется к наборам параметров очень различающихся типов и, таким образом, длины. Это дает возможность выполнять определение в будущем других порций, имеющих почти любую длину.

Фиг.4C, наконец, представляет переключатель наборов параметров, в котором оценивается идентификатор набора параметров, как изображено на фиг.3B, так что наборы параметров связываются с соответствующими алгоритмами восстановления, так что не имеет место случай, что, например, межканальные разности уровней принимаются за межканальные временные разности, и наоборот.

Фиг.4C также изображает, что, когда набор параметров был идентифицирован как необязательный и не является желательным декодирование с использованием необязательного набора параметров, количество битов этого набора параметров пропускается («пропустить и продолжить») для начала вывода без учета дополнительных необязательных наборов параметров, когда все обязательные наборы параметров были считаны (или имеются данные, неизвестные для декодера, например, наборы параметров) («остановить синтаксический анализ, начать вывод»). Такой декодер, таким образом, начинает вывод, когда он уже считал по меньшей мере одну обязательную порцию, и он не может выполнить синтаксический анализ дальнейшей информации в потоке данных. Таким образом, декодер не склоняется к полной ошибке, выводимой содержимым потока данных, который он не понимает. Это создает очень устойчивый к ошибкам декодер.

Ниже более подробно описываются функциональные возможности настоящего изобретения на основании предпочтительных вариантов осуществления настоящего изобретения. Например, параметрическая информация различных типов, такая как МКРУ, МКВР, МКК и другая информация наборов параметров, которая может быть определена в будущем, размещается в различных и отдельных частях данных, т.е. на различных уровнях масштабирования. С этой целью смотрите снова фиг.4A-4C. Наборы параметров дифференцируются на обязательные (или необходимые) наборы параметров, такие как наборы параметров с межканальными разностями уровней, и необязательные наборы параметров, такие как наборы параметров с межканальными временными разностями и наборы параметров со значениями межканальной корреляции.

Предусматривается информация о количестве обязательных наборов параметров (numBccDataMand) и присутствии (OptBccDataPresent) и о количестве необязательных наборов параметров (numBccDataOpt). Обычно информация о количестве обязательных наборов параметров (numBccDataMand) зависит от технических требований на систему и, таким образом, необязательно ее явно передавать, но она может быть фиксированно установлена между кодером и декодером. В противоположность этому предпочтительно явно передавать количество необязательных наборов параметров (numBccDataOpt). Когда параметр присутствия (OptBccDataPresent) указывает присутствие необязательных наборов параметров, как изображено на фиг.3A, начинается соответствующая оценка информации о необязательных наборах параметров.

В предпочтительном варианте осуществления настоящего изобретения дополнительно предусмотрен идентификатор (BccDataId) для каждого набора параметров. Этот идентификатор предоставляет информацию о типе набора параметров, таком как МКРУ, МКВР или МКК и/или версии синтаксиса некоторого набора параметров, что также изображено на фиг.3B. Обычно идентификатор для обязательных наборов параметров сигнализируется неявно, тогда как идентификатор для необязательных параметров сигнализируется явно. В этом случае, однако, должно быть установлено между кодером и декодером, что, например, первый встреченный набор параметров является обязательным набором параметров, который в фиксировано установленном сценарии включает в себя, например, наборы параметров с межкадровыми разностями уровней. Альтернативно, информация о типе набора параметров также может определяться неявно посредством задания порядка типов наборов параметров.

Наборы параметров предпочтительно включают в себя информацию о длине набора параметров. Предоставление такой информации о длине набора параметров дает возможность декодеру игнорировать этот набор параметров простым пропуском связанных с ним битов даже без необходимости знания декодером точного синтаксиса потока битов набора параметров. С этой целью смотрите фиг.4B.

В предпочтительном варианте осуществления настоящего изобретения обязательные наборы параметров, таким образом, не включают в себя информацию о длине набора параметров, так как декодер так или иначе должен выполнить синтаксический анализ и обработать данные обязательного набора параметров в любом случае вместо возможности простого их отбрасывания. Таким образом, декодер может быть реализован так, чтобы предполагать, когда он находит набор параметров, и он не содержит никакой связанной с ним дополнительной информации, что набор параметров (например, МКРУ) представляет собой из числа установленных доступных наборов параметров и что, вследствие того факта, что он не включает в себя никакую соответствующую информацию, этот набор параметров представляет собой обязательный набор параметров.

Для необязательных наборов параметров информация о длине набора параметров может передаваться или не зависеть от случая применения. Простым примером может быть то, что для повышения возможности взаимодействия между кодером и декодером все необязательные наборы параметров включают в себя информацию о длине набора параметров. Однако для экономии битов информация о длине может не передаваться для последнего набора параметров, так как больше нет необходимости пропускать эти данные и получать доступ к последующему набору параметров, так как набор параметров так или иначе представляет собой последний набор параметров. Эта процедура, очевидно, является полезной, когда блок данных, как изображено на фиг.1A, фактически завершается i-ым набором 12с параметров и когда впоследствии, например, больше нет управляющей информации и т. д. для блока суммарного сигнала и/или М каналов передачи, только что обработанных.

Явное сигнализирование может быть, например, в соответствии с информацией 32 о доступности ресурсов (фиг.2B), передача информации о длине параметров может сигнализироваться кодером при помощи элемента потока битов, который информирует декодер о присутствии/длине информации о длине набора параметров, как уже изображено на основе фиг.3D.

Ниже обсуждается предпочтительный вариант осуществления для процесса декодирования декодера, показанного на фиг.2B. Предпочтительный декодер сначала проверяет доступность обязательного (необходимого) набора параметров, которым, предпочтительно, будет набор параметров с межканальными разностями уровней. Если, кроме того, номер версии синтаксиса набора параметров МКРУ выше номера версии, который сам декодер может декодировать, причем декодер, например, поддерживает версии синтаксиса с 1 по n, восстановление не может быть выполнено средством 31 для восстановления по фиг.2B. Во всех других случаях определенный вид процесса достоверного декодирования может выполняться посредством декодирования обязательного набора параметров, и, когда не используются необязательные наборы параметров, выполнения многоканального синтеза, используя только обязательный набор параметров.

Однако, когда декодер обнаруживает необязательный набор параметров, он может использовать его или отбросить его содержимое. Какая одна из двух возможностей выбирается, зависит, например, от описанного ниже сценария.

Если номер версии синтаксиса необязательного набора параметров выше, чем возможности установленной версии синтаксиса самого декодера для этого типа набора параметров, то этот тип набора параметров не может быть обработан декодером и будет пропущен. В этом случае, однако, все же достигается достоверное декодирование без выполнения улучшенного многоканального восстановления, используя тип необязательного набора параметров. Однако, если содержимое необязательного набора параметров может учитываться, в зависимости от возможностей декодера, восстановление будет более высокого качества.

Например, необходимо отметить, что синтез, использующий значения межканальной когерентности, может занимать значительное количество вычислительных ресурсов. Таким образом, декодер малой сложности, например, может игнорировать этот набор параметров в зависимости от информации об управлении ресурсами, тогда как декодер, который может предоставить более высокое качество вывода, для восстановления будет извлекать и использовать все наборы параметров, т.е. как обязательные, так и необязательные наборы параметров. В предпочтительном варианте осуществления решение об использовании/отбрасывании набора параметров принимается на основе доступности вычислительных ресурсов в соответствующий момент времени, т.е. динамически.

Идея изобретения предоставляет возможность совместимого обновления формата потока битов для необязательных, т.е. дополнительных типов наборов параметров, без создания помех декодируемости существующими декодерами, т.е. обратной совместимости. Кроме того, настоящее изобретение гарантирует в любом случае, что более старые декодеры будут генерировать недостоверный выходной сигнал, который в наихудшем случае даже может приводить к разрушению громкоговорителей, когда обновление синтаксиса выполняется посредством повышения номера версии синтаксиса обязательного набора параметров, т.е. информации МКРУ, или необязательно, как изображено, например, полем “BccDataId” №4 на фиг.3B.

Идея изобретения, таким образом, отличается от классического синтаксиса потока битов, в котором декодер должен знать весь синтаксис каждого набора параметров, который может использоваться в потоке битов, чтобы иметь возможность сначала считать все наборы параметров в первом месте, затем иметь возможность запустить соответствующие элементы процессора, такие как те, которые изображены на фиг.7, с соответствующими параметрами. Обладающий признаками изобретения декодер будет пропускать блоки 126 и 128, когда только межканальные разности уровней были извлечены в качестве обязательного набора параметров, для выполнения многоканального восстановления, хотя и худшего качества.

Итак, ниже еще раз будут представлены существенные признаки кодера, которые могут выгодно использоваться декодером для достижения эффективного и высококачественного декодирования с потоком данных с низкой скоростью передачи данных.

Если набор параметров менее важен, чем другой набор параметров при восстановлении К выходных каналов в отношении качества восстановленного многоканального сигнала, то средство 25 для записи выполняется с возможностью записи набора данных, так что возможно восстановление без использования менее важного набора данных.

Предпочтительно, чтобы средство 25 для записи дополнительно было выполнено с возможностью предоставления набора параметров со связанным с ним идентификатором 100-105, в котором идентификатор для набора параметров указывает, что набор параметров безусловно должен использоваться для восстановления, или в котором идентификатор для другого набора параметров указывает, что набор параметров может использоваться только необязательно для восстановления.

Предпочтительно, чтобы средство 25 для записи дополнительно было выполнено с возможностью записи М каналов передачи в часть 11 каналов передачи набора данных потока данных, записи первого набора параметров в часть 12а первого набора параметров и записи второго набора параметров в часть 12b второго набора параметров, так что декодер может восстанавливать К выходных каналов без считывания и интерпретирования части (12b) второго набора параметров.

Если наборы параметров выбираются из следующей группы, включающей в себя межканальные разности уровней, межканальные временные разности, межканальные разности фаз или информацию о межканальной когерентности, средство 25 для записи выполняется с возможностью обозначения набора параметров с межканальными разностями уровней в качестве обязательного для декодирования и обозначения по меньшей мере одного другого набора параметров из группы в качестве необязательного для декодирования.

Предпочтительно, чтобы средство 25 для записи было выполнено с возможностью предоставления второго набора параметров с информацией 106-108 о длине, указывающей, какое количество данных в наборе данных принадлежит второму набору параметров, так что декодер способен пропустить количество данных, основанное на информации о длине, в котором информация о длине предпочтительно содержит первое поле для сигнализирования о длине в битах поля длины и в котором поле длины содержит длину в битах, посредством которой определяется количество битов второго набора параметров.

Предпочтительно, чтобы средство 25 для записи дополнительно было выполнено с возможностью записи информации 102 о количестве в поток данных, указывающей количество необязательных наборов параметров, без которых декодером может выполняться восстановление К выходных каналов.

Предпочтительно, чтобы средство 25 для записи дополнительно было выполнено с возможностью связывания информации 103-105 о версии синтаксиса с наборами параметров, так что декодер будет выполнять восстановление, используя соответствующий набор параметров только тогда, когда информация о версии синтаксиса имеет предварительно определенное состояние.

Предпочтительно, чтобы имелась информация о версии синтаксиса дополнительно только для второго набора параметров и дополнительных необязательных наборов параметров, если применимо.

Кроме того, последний необязательный набор параметров в последовательности наборов параметров в потоке данных может не содержать никакой связанной с ним информации о длине.

Кроме того, средство 25 для записи может быть выполнено с возможностью сигнализирования о присутствии и длине информации о длине набора параметров динамически в потоке данных.

Средство 25 для предоставления может быть выполнено с возможностью предоставления последовательности блоков данных для М каналов передачи, которая основана на последовательности блоков временных выборок по меньшей мере одного исходного канала.

В зависимости от обстоятельств обладающий признаками изобретения способ генерирования и/или декодирования может быть реализован аппаратными средствами или программными средствами. Реализация может быть выполнена на носителе цифровых данных, в частности на гибком диске или компакт-диске, имеющем сигналы управления, которые могут считываться электронным образом, которые могут взаимодействовать с программируемой компьютерной системой так, что исполняется способ. В общих чертах, изобретение, таким образом, также заключается в компьютерном программном продукте, имеющем программный код, хранимый на считываемом машиной носителе, для выполнения способа, когда компьютерный программный продукт выполняется на компьютере. Другими словами, изобретение, таким образом, может быть реализовано в виде компьютерной программы, имеющей программный код для выполнения способа, когда компьютерная программа выполняется на компьютере.

Похожие патенты RU2379768C2

название год авторы номер документа
УСТРОЙСТВО И СПОСОБ ДЛЯ ФОРМИРОВАНИЯ МНОГОКАНАЛЬНОГО СИГНАЛА ИЛИ НАБОРА ПАРАМЕТРИЧЕСКИХ ДАННЫХ 2005
  • Шпершнайдер Ральф
  • Херре Юрген
  • Хильперт Йоханнес
  • Эртель Христиан
  • Геиэрсбергер Штефан
RU2355046C2
УСТРОЙСТВО И СПОСОБ ДЛЯ СТЕРЕОФОНИЧЕСКОГО ЗАПОЛНЕНИЯ ПРИ МНОГОКАНАЛЬНОМ КОДИРОВАНИИ 2017
  • Дик Саша
  • Хельмрих Кристиан
  • Реттельбах Николаус
  • Шу Флориан
  • Фюг Рихард
  • Нагель Фредерик
RU2710949C1
СОВМЕСТИМОЕ МНОГОКАНАЛЬНОЕ КОДИРОВАНИЕ/ДЕКОДИРОВАНИЕ 2004
  • Херре Юрген
  • Хильперт Йоханнес
  • Геиэрсбергер Штефан
  • Хельцер Андреас
  • Шпенгер Клаус
RU2327304C2
ЗАПОЛНЕНИЕ ШУМОМ ПРИ МНОГОКАНАЛЬНОМ КОДИРОВАНИИ АУДИО 2014
  • Луис Валеро Мария
  • Хельмрих Кристиан
  • Хильперт Йоханнес
RU2661776C2
МНОГОКАНАЛЬНЫЙ КОДИРОВЩИК 2005
  • Бребарт Дирк Й.
  • Схейерс Эрик Г.П.
  • Хото Герард Х.
  • Ван Лон Махиль В.
RU2390857C2
МНОГОКАНАЛЬНЫЙ АУДИОДЕКОДЕР, МНОГОКАНАЛЬНЫЙ АУДИОКОДЕР, СПОСОБЫ И КОМПЬЮТЕРНАЯ ПРОГРАММА С ИСПОЛЬЗОВАНИЕМ РЕГУЛИРОВАНИЯ ДОЛИ ДЕКОРРЕЛИРОВАННОГО СИГНАЛА НА ОСНОВАНИИ ОСТАТОЧНЫХ СИГНАЛОВ 2014
  • Дик Саша
  • Хельмрих Кристиан
  • Хильперт Йоханнес
  • Хельцер Андреас
RU2676233C2
УСТРОЙСТВО И СПОСОБ ДЛЯ ФОРМИРОВАНИЯ СИГНАЛА УПРАВЛЕНИЯ МНОГОКАНАЛЬНЫМ СИНТЕЗАТОРОМ И УСТРОЙСТВО И СПОСОБ МНОГОКАНАЛЬНОГО СИНТЕЗА 2006
  • Нойзингер Маттиас
  • Херре Юрген
  • Диш Саша
  • Пурнхаген Хейко
  • Керлинг Кристофер
  • Энгдегард Йонас
  • Бребарт Ерун
  • Схейерс Эрик
  • Омен Вернер
RU2361288C2
АУДИОКОДЕР ДЛЯ КОДИРОВАНИЯ МНОГОКАНАЛЬНОГО СИГНАЛА И АУДИОДЕКОДЕР ДЛЯ ДЕКОДИРОВАНИЯ КОДИРОВАННОГО АУДИОСИГНАЛА 2016
  • Диш Саша
  • Фукс Гийом
  • Равелли Эммануэль
  • Нойкам Кристиан
  • Шмидт Константин
  • Бенндорф Конрад
  • Нидермайер Андреас
  • Шуберт Беньямин
  • Гайгер Ральф
RU2680195C1
МНОГОКАНАЛЬНЫЙ АУДИОДЕКОДЕР, МНОГОКАНАЛЬНЫЙ АУДИОКОДЕР, СПОСОБЫ, КОМПЬЮТЕРНАЯ ПРОГРАММА И КОДИРОВАННОЕ АУДИОПРЕДСТАВЛЕНИЕ С ИСПОЛЬЗОВАНИЕМ ДЕКОРРЕЛЯЦИИ ПРЕДСТАВЛЕННЫХ ПОСРЕДСТВОМ РЕНДЕРИНГА АУДИОСИГНАЛОВ 2014
  • Диш Саша
  • Фукс Харальд
  • Хелльмут Оливер
  • Херре Юрген
  • Муртаза Адриан
  • Паулус Йоуни
  • Риддербуш Фалько
  • Терентив Леон
RU2665917C2
УСТРОЙСТВО И СПОСОБ КОДИРОВАНИЯ ИЛИ ДЕКОДИРОВАНИЯ МНОГОКАНАЛЬНОГО СИГНАЛА С ИСПОЛЬЗОВАНИЕМ ПАРАМЕТРА ШИРОКОПОЛОСНОГО ВЫРАВНИВАНИЯ И МНОЖЕСТВА ПАРАМЕТРОВ УЗКОПОЛОСНОГО ВЫРАВНИВАНИЯ 2017
  • Байер, Штефан
  • Фотопоулоу, Элени
  • Мультрус, Маркус
  • Фукс, Гийом
  • Равелли, Эммануэль
  • Шнелль, Маркус
  • Дола, Штефан
  • Ягерс, Вольфганг
  • Дитц, Мартин
  • Маркович, Горан
RU2704733C1

Иллюстрации к изобретению RU 2 379 768 C2

Реферат патента 2010 года УСТРОЙСТВО И СПОСОБ ГЕНЕРИРОВАНИЯ КОДИРОВАННОГО МНОГОКАНАЛЬНОГО СИГНАЛА И УСТРОЙСТВО И СПОСОБ ДЕКОДИРОВАНИЯ КОДИРОВАННОГО МНОГОКАНАЛЬНОГО СИГНАЛА

Изобретение относится к методам параметрической многоканальной обработки аудио, в частности к эффективному размещению параметрической информации управления декодером, когда имеется несколько различных наборов параметров, доступных для восстановления. В многоканальном кодере, генерирующем несколько различных наборов параметров для восстановления многоканального выходного сигнала с использованием, по меньшей мере, одного канала передачи, поток данных записывают так, что два набора параметров являются декодируемыми независимо друг от друга, и многоканальному декодеру предоставляется возможность пропуска набора параметров, который обозначается как необязательный и/или имеет более высокий номер версии при считывании потока данных, и все же выполнения достоверного многоканального восстановления с использованием набора данных, обозначенного как обязательный, или набор данных, имеющий достаточно низкий номер версии. Технический результат - обеспечение гибкого принципа кодера/декодера, пригодного для будущих обновлений, характеризуемых обратной совместимостью и надежностью. 6 н. и 13 з.п. ф-лы, 8 ил.

Формула изобретения RU 2 379 768 C2

1. Устройство для генерирования кодированного многоканального сигнала, представляющего некодированный многоканальный сигнал, содержащий N исходных каналов, причем N равно или больше 2, содержащее
средство (22) для предоставления параметрической информации (24а, 24b, 24с) для восстановления К выходных каналов из М каналов (23) передачи, причем М равно или больше 1 и равно или меньше N, причем К больше М и равно или меньше N, при этом параметрическая информация содержит, по меньшей мере, один первый набор параметров и другой второй набор параметров для восстановления одного и того же выходного канала, причем второй набор параметров содержит связанный с ним идентификатор (103-105) набора параметров; и
средство (25) для записи потока (26) данных, причем средство (25) для записи выполнено с возможностью записи первого и второго наборов параметров в поток данных, так что восстановление, по меньшей мере, одного из К выходных каналов выполняют, если декодируют кодированный многоканальный сигнал, с использованием первого набора параметров, с возможностью пропуска второго набора параметров и с использованием, по меньшей мере, одного из М каналов (23) передачи.

2. Устройство для декодирования кодированного многоканального сигнала, представляющего некодированный многоканальный сигнал, содержащий N исходных каналов, причем кодированный многоканальный сигнал представлен потоком данных, содержащим параметрическую информацию для восстановления К выходных каналов из М каналов передачи, причем М равно или больше 1 и равно или меньше N, причем К больше М и равно или меньше N, при этом параметрическая информация содержит, по меньшей мере, два различных набора параметров для восстановления одного и того же выходного канала, и первый и второй наборы параметров записаны в поток данных, так что восстановление К выходных каналов выполняют, если декодируют кодированный многоканальный сигнал, с использованием первого набора параметров и с возможностью пропуска второго набора параметров, причем второй набор параметров содержит связанный с ним идентификатор (103-105) набора параметров, содержащее
средство (28) считывания потока данных, предназначенное для считывания потока данных для считывания первого набора (30а) параметров и пропуска второго набора (30b) параметров, когда идентификатор набора параметров, связанный со вторым набором параметров, не совместим с данным идентификатором набора параметров устройства для декодирования, и для считывания второго набора параметров, когда идентификатор набора параметров совместим с данным идентификатором набора параметров.

3. Устройство по п.2, дополнительно содержащее
средство (31) восстановления, предназначенное для восстановления К выходных каналов с использованием М каналов передачи и первого набора параметров, но с возможностью пропуска второго набора параметров.

4. Устройство по п.2, в котором первый набор параметров содержит связанный с ним идентификатор (103-105) набора параметров, и
в котором средство (28) считывания выполнено с возможностью считывания связанного с ним идентификатора набора параметров и запуска средства (31) восстановления, так что восстановление выполняется посредством средства восстановления только тогда, когда считанный идентификатор набора параметров совместим с данным идентификатором набора параметров устройства для декодирования.

5. Устройство по п.2, в котором второй набор параметров содержит информацию о длине, указывающую количество данных связанного с ней второго набора параметров, и в котором средство (28) считывания выполнено с возможностью пропуска количества данных в наборе данных, указанного информацией о длине, на основании информации о длине, без синтаксического анализа данных второго набора параметров.

6. Устройство по п.2, в котором средство (28) считывания является управляемым (32) для получения информации о доступности ресурсов, и
в котором средство (28) считывания дополнительно выполнено с возможностью считывания второго набора параметров, когда информация о доступности ресурсов указывает достаточные ресурсы, и пропуска второго набора параметров, когда информация о доступности ресурсов указывает недостаточные ресурсы.

7. Устройство по п.2, в котором один набор параметров является менее важным, чем другой набор параметров при восстановлении К выходных каналов в отношении качества восстановленного многоканального сигнала, и в котором средство (28) считывания потока данных выполнено с возможностью пропуска менее важного набора данных.

8. Устройство по п.2, в котором поток данных содержит набор параметров со связанным с ним идентификатором (100-105), причем идентификатор для набора параметров указывает, что набор параметров безусловно используется для восстановления, или идентификатор для другого набора параметров указывает, что набор параметров необязательно используется только для восстановления, при этом средство (28) считывания потока данных выполнено с возможностью обнаружения идентификатора и считывания обязательного набора параметров и пропуска необязательного набора параметров, на основании обнаруженного идентификатора.

9. Устройство по п.2, в котором поток данных содержит первый набор параметров в части (12а) первого набора параметров и второй набор параметров в части (12b) второго набора параметров, при этом средство считывания потока данных выполнено с возможностью интерпретирования потока данных в отношении частей набора параметров и считывания части первого набора параметров и пропуска части второго набора параметров.

10. Устройство по п.2, в котором наборы параметров выбраны из следующей группы, включающей в себя межканальные разности уровней, межканальные временные разности, межканальные разности фазы или информацию о межканальной когерентности, причем в потоке данных набор параметров с межканальными разностями уровней обозначается как безусловно необходимый для декодирования, и при этом, по меньшей мере, один другой набор параметров из группы обозначается как необязательный для декодирования, и в котором средство (28) считывания потока данных выполнено с возможностью считывания набора параметров с межканальными разностями уровней и пропуска другого набора параметров из группы.

11. Устройство по п.2, в котором поток данных содержит информацию (102) о количестве, указывающую количество необязательных наборов параметров, без которых декодером выполняется восстановление К выходных каналов, при этом средство считывания потока данных выполнено с возможностью считывания, по меньшей мере, одного необязательного набора параметров, на основании информации о количестве.

12. Устройство по п.2, в котором в потоке данных имеется связанный с ним идентификатор набора параметров для второго набора параметров и дополнительных необязательных наборов параметров, если применимы, при этом нет идентификатора набора параметров для первого набора параметров.

13. Устройство по п.1 или 2, в котором последний необязательный набор параметров в последовательности наборов параметров в потоке данных не содержит никакой связанной с ним информации о длине, при этом средство (28) считывания потока данных выполнено с возможностью не считывания и интерпретирования никакой информации о длине перед считыванием последнего необязательного набора параметров.

14. Устройство по п.2, в котором присутствие и длина информации о длине набора параметров сигнализированы динамически в потоке данных, и в котором средство (28) считывания потока данных выполнено с возможностью обнаружения сначала присутствия информации о длине набора параметров в потоке данных, а затем извлечения длины информации о длине набора параметров из потока данных на основании обнаруженного присутствия.

15. Устройство по п.3, в котором М каналов передачи представляют собой каналы бинаурального кодирования управляющих сигналов (БКУС) с преобразованием с уменьшением числа каналов, и наборы параметров включают в себя параметры БКУС, и в котором средство (32) восстановления выполнено с возможностью выполнения синтеза БКУС.

16. Способ генерирования кодированного многоканального сигнала, представляющего некодированный многоканальный сигнал, содержащий N исходных каналов, причем N равно или больше 2, заключающийся в том, что:
предоставляют (22) параметрическую информацию (24а, 24b, 24с) для восстановления К выходных каналов из М каналов (23) передачи, причем М равно или больше 1 и равно или меньше N, причем К больше М и равно или меньше N, при этом параметрическая информация содержит, по меньшей мере, два различных набора параметров для восстановления одного и того же выходного канала; и
записывают (25) поток (26) данных посредством записи первого и второго наборов параметров в поток данных, так что восстановление, по меньшей мере, одного из К выходных каналов выполняют, если декодируют кодированный многоканальный сигнал, с использованием первого набора параметров, с возможностью пропуска второго набора параметров и с использованием, по меньшей мере, одного из М каналов (23) передачи, причем второй набор параметров содержит связанный с ним идентификатор (103-105) набора параметров.

17. Способ декодирования кодированного многоканального сигнала, представляющего некодированный многоканальный сигнал, содержащий N исходных каналов, причем кодированный многоканальный сигнал представляют потоком данных, содержащим параметрическую информацию для восстановления К выходных каналов из М каналов передачи, причем М равно или больше 1 и равно или меньше N, причем К больше М и равно или меньше N, при этом параметрическая информация содержит, по меньшей мере, два различных набора параметров для восстановления одного и того же выходного канала, и первый и второй наборы параметров записывают в поток данных, так что восстановление К выходных каналов выполняют, если декодируют кодированный многоканальный сигнал, с использованием первого набора параметров и с возможностью пропуска второго набора параметров, причем второй набор параметров содержит связанный с ним идентификатор (103-105) набора параметров, заключающийся в том, что
считывают (28) поток данных для считывания первого набора (30а) параметров и пропуска второго набора (30b) параметров, когда идентификатор набора параметров, связанный со вторым набором параметров, не является совместимым с данным идентификатором набора параметров устройства для декодирования, и для считывания второго набора параметров, когда идентификатор набора параметров является совместимым с данным идентификатором набора параметров.

18. Машиночитаемый носитель, на котором сохранен программный код, считываемый компьютером для выполнения способа по п.16.

19. Машиночитаемый носитель, на котором сохранен программный код, считываемый компьютером для выполнения способа по п.17.

Документы, цитированные в отчете о поиске Патент 2010 года RU2379768C2

СПОСОБ И УСТРОЙСТВО МАСШТАБИРУЕМОГО КОДИРОВАНИЯ-ДЕКОДИРОВАНИЯ СТЕРЕОФОНИЧЕСКОГО ЗВУКОВОГО СИГНАЛА (ВАРИАНТЫ) 1998
  • Парк Сунг-Хи
  • Ким Еон-Бае
RU2197776C2
US 2002067834 A1, 06.06.2002
СПОСОБ ПЕРЕДАЧИ И/ИЛИ ЗАПОМИНАНИЯ ЦИФРОВЫХ СИГНАЛОВ НЕСКОЛЬКИХ КАНАЛОВ 1993
  • Эрнст Эберляйн
  • Юрген Херре
  • Бернхард Грилл
  • Карл-Хайнц Бранденбург
  • Дитер Зайтцер
RU2129336C1
Способ приготовления мыла 1923
  • Петров Г.С.
  • Таланцев З.М.
SU2004A1
EP 1881486 B1, 22.04.2003
Переносная печь для варки пищи и отопления в окопах, походных помещениях и т.п. 1921
  • Богач Б.И.
SU3A1

RU 2 379 768 C2

Авторы

Херре Юрген

Шпершнайдер Ральф

Хильперт Йоханнес

Линцмайер Карстен

Попп Харальд

Даты

2010-01-20Публикация

2005-08-29Подача