МНОГОКАНАЛЬНЫЙ КОДЕР Российский патент 2010 года по МПК G10L19/02 

Описание патента на изобретение RU2382419C2

ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ

Настоящее изобретение относится к многоканальным кодерам, например к многоканальным звуковым кодерам, использующим параметрическое описание пространственного звука. Кроме того, изобретение также относится к способам обработки сигналов, например пространственных аудиосигналов, в таких многоканальных кодерах. Кроме того, изобретение относится к декодерам, предназначенным для декодирования сигналов, сгенерированных такими многоканальными кодерами.

ПРЕДШЕСТВУЮЩИЙ УРОВЕНЬ ТЕХНИКИ

Звуковая запись и воспроизведение в последние годы прогрессировали от монофонического формата с одним каналом к двухканальному стереоформату и позже к многоканальному формату, например к звуковому формату с пятью каналами, который часто используется в системах «домашнего кинотеатра». Введение таких носителей информации, как звуковой компакт-диск высшего качества (SACD) и цифровой видеодиск (DVD), привело к тому, что интерес к воспроизведению звука с пятью каналами в настоящее время усиливается. Многие пользователи теперь имеют оборудование, способное обеспечивать воспроизведение звука с пятью каналами у них дома; соответственно, программы с пятиканальным звуком на соответствующих носителях информации становятся все более и более доступными, например на указанных выше носителях информации SACD и DVD. Из-за растущего интереса к многоканальным программам более эффективное кодирование многоканальных звуковых программ становится важной проблемой, например, для обеспечения одного или большего количества из улучшенного качества, более продолжительного времени воспроизведения и даже большего количества каналов. Кроме того, этот растущий интерес побудил организации стандартизации, такие как MPEG (экспертная группа по вопросам движущихся изображений), признать, что разработка многоканальных кодеров является важным вопросом.

Известны кодеры, способные представлять пространственную звуковую информацию, такую как содержимое звуковой программы, посредством параметрических описателей (дескрипторов). Например, в опубликованной международной патентной заявке PCT № PCT/IB2003/002858 (WO 2004/008805) описано кодирование многоканального звукового сигнала, включающего в себя по меньшей мере первый компонент сигнала (LF), второй компонент сигнала (LR) и третий компонент сигнала (RF). Данное кодирование использует способ, содержащий этапы:

(a) кодируют первый и второй компоненты сигнала при использовании первого параметрического кодера для генерации первого кодированного сигнала (L) и первого набора параметров кодирования (P2);

(b) кодируют первый кодированный сигнал (L) и дополнительный сигнал (R) при использовании второго параметрического кодера для генерации второго кодированного сигнала (T) и второго набора параметров кодирования (P1), причем дополнительный сигнал (R) получают по меньшей мере из третьего компонента сигнала (RF); и

(c) представляют многоканальный звуковой сигнал по меньшей мере с помощью результирующего кодированного сигнала (T), полученного по меньшей мере из второго кодированного сигнала (T), первого набора параметров кодирования (P2) и второго набора параметров кодирования (P1).

В последние годы интерес к параметрическому описанию звуковых сигналов увеличился, потому что было показано, что передача квантованных параметров, описывающих звуковые сигналы, требует относительно небольшой пропускной способности. Эти квантованные параметры можно принимать и обрабатывать в декодерах для восстановления звуковых сигналов, которые при восприятии по существу не отличаются от соответствующих им исходных звуковых сигналов.

Проблема значительной межканальной интерференции возникает, когда выводимую из современных многоканальных кодеров информацию впоследствии декодируют. Такая интерференция особенно заметна в многоканальных кодерах, настроенных для получения хорошего стереопредставления вместе с двухканальным понижающим микшированием (микшированием с понижением количества каналов). Настоящее изобретение направлено по меньшей мере частично на решение данной проблемы, таким образом улучшая качество соответствующим образом декодированной многоканальной аудиоинформации.

СУЩНОСТЬ ИЗОБРЕТЕНИЯ

Целью настоящего изобретения является обеспечение альтернативного многоканального кодера или блока, который может использоваться в пределах многоканального кодера, которые допускает генерацию кодированных выходных данных, который впоследствии можно декодировать с уменьшенной межканальной интерференцией.

Согласно первому аспекту настоящего изобретения обеспечивают многоканальный кодер, предназначенный для обработки входных сигналов, передаваемых по множеству входных каналов, для генерации соответствующих выходных данных, содержащих выходные сигналы, микшированные с понижением количества каналов (далее - микшированные сигналы), вместе с дополняющими параметрическими данными, данный кодер включает в себя:

(a) средство понижающего микширования, предназначенное для выполнения понижающего микширования входных сигналов для генерации соответствующих выходных микшированных сигналов; и

(b) средство анализа для обработки входных сигналов, указанное средство анализа предназначено для генерации указанных параметрических данных, дополняющих выходные микшированные сигналы,

указанный кодер предназначен для генерации выходных микшированных сигналов для предоставления возможности последующего декодирования выходных микшированных сигналов для предсказания сигналов каналов, которые обрабатываются и затем не используются в пределах кодера.

Данное изобретение имеет преимущество в том, что выходные данные от кодера допускают декодирование с уменьшенной межканальной интерференцией, а именно, позволяют улучшенное последующее восстановление входных сигналов.

Кроме того, количество выводимых данных из многоканального кодера, требуемых для представления входных сигналов, также потенциально уменьшается.

Предпочтительно, кодер предназначен для обработки входных сигналов на основе фрагментов времени/частоты. Более предпочтительно, эти фрагменты определяют или до, или во время обработки входных сигналов в кодере.

Предпочтительно, в кодере средство анализа предназначено для генерации по меньшей мере части параметрических данных (C1,i; C2,i) с помощью применения оптимизации по меньшей мере одного сигнала, полученного из разности между одним или большим количеством входных сигналов и оценкой указанного одного или большего количества входных сигналов, которые могут генерироваться из выходных данных многоканального кодера. Более предпочтительно оптимизация вовлекает минимизацию Евклидовой нормы.

Предпочтительно в кодере существуют N входных каналов, которые средство анализа должно обрабатывать для генерации параметрических данных для каждого фрагмента времени/частоты, данное средство анализа выполнено с возможностью вывода M(N-M) параметров вместе с M выходных микшированных сигналов для представления входных сигналов в выходных данных, M и N являются целыми числами и M<N. Более предпочтительно в случае целого M, равного двум в кодере, средство понижающего микширования предназначено для генерации двух выходных микшированных сигналов, которые допускают воспроизведение в стереофоническом устройстве с двумя каналами и кодирование с помощью стандартного стереокодера. Такая особенность предоставляет возможность при воспроизведении кодеру и связанным с ним выходным данным быть обратно совместимыми с более ранними системами воспроизведения, например со стереофоническими системами воспроизведения с двумя каналами.

Согласно второму аспекту изобретения обеспечивают процессор обработки сигналов, который содержится в многоканальном кодере согласно первому аспекту изобретения, данный процессор предназначен для обработки данных в многоканальном кодере для генерации его выходных микшированных сигналов и параметрических данных.

Согласно третьему аспекту изобретения обеспечивают способ кодирования входных сигналов в многоканальном кодере для генерации соответствующих выходных данных, содержащих выходные микшированные сигналы вместе с дополняющими параметрическими данными, данный способ включает в себя этапы:

(a) обеспечивают входные сигналы на многоканальный кодер через множество (N) входных каналов;

(b) выполняют понижающее микширование входных сигналов для генерации соответствующих (M) выходных микшированных сигналов; и

(c) обрабатывают входные сигналы для генерации указанных параметрических данных, которые являются дополняющими выходные микшированные сигналы,

причем обработка входных сигналов в многоканальном кодере вовлекает определение параметрических данных для предоставления возможности последующего восстановления представлений входных сигналов, указанные микшированные сигналы предоставляют возможность их декодирования для предсказания содержимого сигналов каналов, обработанных в кодере, и затем их не отбрасывают.

Согласно четвертому аспекту изобретения обеспечивают кодированные выходные данные, сгенерированные согласно способу третьего аспекта изобретения, указанные выходные данные сохраняют на носителе информации.

Согласно пятому аспекту изобретения обеспечивают декодер для декодирования выходных данных, сгенерированных кодером согласно первому аспекту изобретения, данный декодер содержит:

(a) средство обработки, предназначенное для приема из кодера выходных микшированных сигналов вместе с параметрическими данными, данное средство обработки предназначено для обработки параметрических данных для определения одного или большего количества коэффициентов или параметров; и

(b) вычислительное средство, предназначенное для вычисления приблизительного представления каждого из входных сигналов, закодированных в выходных данных, используя параметрические данные, и также один или большее количество коэффициентов, определенных на этапе (a) для дальнейшей обработки, чтобы в значительной степени восстановить представления входных сигналов, из которых создают выходные данные, сгенерированные кодером.

Согласно шестому аспекту изобретения обеспечивают процессор обработки сигналов, содержащийся в многоканальном декодере согласно пятому аспекту изобретения, данный процессор обработки сигналов предназначен для оказания помощи при обработке данных вместе с восстановлением представлений входных сигналов.

Согласно седьмому аспекту изобретения обеспечивают способ декодирования кодированных данных в многоканальном декодере, указанные данные имеют форму, сгенерированную многоканальным кодером согласно первому аспекту изобретения, данный способ включает в себя этапы:

(a) обрабатывают выходные микшированные сигналы вместе с параметрическими данными, существующими в кодированных данных, указанная обработка использует параметрические данные для определения одного или большего количества коэффициентов или параметров; и

(b) вычисляют приблизительные представления каждого из входных сигналов, закодированных в кодированных данных, используя параметрические данные и также один или большее количество коэффициентов, определенных на этапе (a), для дополнительной обработки, чтобы в значительной степени восстановить представления входных сигналов, из которых создают кодированные данные, сгенерированным кодером.

Следует признать, что особенности данного изобретения допускают объединение в любой комбинации без выхода из объема изобретения.

ОПИСАНИЕ ЧЕРТЕЖЕЙ

Варианты осуществления изобретения будут теперь описаны только для примера в отношении следующих чертежей, на которых:

фиг.1 - схематическая структурная схема варианта осуществления многоканального кодера, включающего в себя кодер согласно изобретению относительно первого контекста изобретения; и

фиг.2 - схематическая структурная схема варианта осуществления декодера согласно изобретению, совместимого с кодером на фиг.1 относительно первого контекста изобретения;

фиг.3 - предпочтительный вариант осуществления изобретения, в котором кодер используют в пределах многоканального кодера согласно изобретению относительно второго контекста изобретения;

фиг.4 - вариант осуществления декодера, использующего кодер изобретения, совместимого с кодером на фиг.3 относительно второго контекста изобретения; и

фиг.5 - конфигурация, в которой многоканальный кодер и многоканальный декодер согласно изобретению совместно конфигурируют со стандартными стереокодером и -декодером.

ОПИСАНИЕ ВАРИАНТОВ ОСУЩЕСТВЛЕНИЯ ИЗОБРЕТЕНИЯ

Настоящее изобретение будет описано в первом и во втором контекстах. В первом контексте данное изобретение рассматривает кодер, который предназначен для обработки входных исходных сигналов для генерации соответствующих кодированных выходных данных, которые способны, будучи в последующем декодированы в декодере, восстанавливать более точные для восприятия представления исходных входных сигналов, чем было возможно до настоящего времени. Во втором контексте данное изобретение рассматривает конкретные примерные варианты осуществления изобретения.

Первый контекст будут теперь рассматривать относительно фиг.1 и 2. Если говорить кратко, настоящее изобретение рассматривает кодер, обозначенный в общем случае как 5 на фиг.1. Кодер 5 включает в себя N входных каналов для приема соответствующих исходных входных сигналов; например, кодер включает в себя три входных канала CH1, CH2, CH3, когда N=3. Кодер 5 предназначен для обработки исходных входных сигналов N каналов, для генерации:

(a) соответствующих кодированных выходных сигналов на M выходах микшированных каналов, где M<N, например, двух выходных каналах OP1 и OP2, обозначенных 610, 620 соответственно, когда M=2; и

(b) одного или большего количества выходных параметрических сигналов, например выходного параметрического сигнала, обозначенного 600.

Чтобы впоследствии наиболее оптимально декодировать в декодере выходные сигналы, сгенерированные кодером 5, а именно относительно ошибок по методу наименьших квадратов в настоящее время выгодно, чтобы анализ главных компонентов (PCA) использовался в кодере 5 при генерации кодированных выходных сигналов 600, 610, 620. Обработка этих выходных сигналов 600, 610, 620 для возможно лучшего восстановления сигналов в декодере, обозначенном 10 на фиг.2, соответствующих N входным сигналам, передаваемых кодеру 5, потенциально возможна, если учитывать параметры, сгенерированные с помощью PCA кодера 5. Значения параметров PCA в сигналах 600, 610, 620 создаются непосредственно из исходных входных сигналов и поэтому не позволяют никакого управления выполнением понижающего микширования, выполняющимся в кодере 5. Такая нехватка управления делает в настоящее время по существу невозможным получение удовлетворительного качества стереопредставления, когда PCA используют в кодере 5 и в соответствующем ему декодере 10.

Изобретатели поняли в настоящем изобретении, что, когда постоянное понижающее микширование используют вместе с указанными выше M микшированными каналами в кодере 5, по существу превосходное восстановление исходных входных сигналов в дополняющем декодере 10 потенциально возможно, когда эти M микшированных каналов расширяют посредством дополнительного соответствующего набора N-M каналов, передающих дополняющую информацию. Таким образом, выходные сигналы M микшированных каналов, сгенерированные с помощью постоянного понижающего микширования, не могут использоваться для восстановления по существу совершенного представления исходных входных сигналов N каналов, когда от информации, относящейся к таким N-M каналам, по меньшей мере частично отказались (отбросили ее) во время кодирования. Однако изобретатели поняли, что эти N-M каналов могут по меньшей мере частично быть предсказаны, когда соответствующую обработку применяют к M микшированным каналам, например, к выходам 610, 620.

Таким образом, кодер 5, сконфигурированный согласно изобретению, предсказывает из M микшированных каналов по меньшей мере некоторую информацию, соответствующую N-M каналам в декодере, хотя в то же самое время избегая необходимости посылать конкретные параметры от кодера 5 на декодер 10. При таком предсказании используется избыточность сигнала, возникающая между сигналами N каналов, как будет описано более подробно позже. Кроме того, соответствующим образом совместимый декодер 10 восстанавливает данную избыточность, когда декодирует кодированные данные, обеспеченные от кодера 5.

Для дополнительного объяснения настоящего изобретения будет описан примерный вариант осуществления кодера 5, показанный на фиг.1, и затем используемый способ обработки сигналов будет представлен в отношении его математической основы.

Примерный вариант осуществления изобретения в соответствии с указанным выше вторым контекстом будет теперь описан в отношении фиг.3 и 4.

На фиг.3 показан многоканальный кодер, обозначенный в общем случае как 15. Кодер 15 включает в себя три блока обработки 20, 30, 40 для приема шести входных сигналов, обозначенных 400-450; характер этих шести входных сигналов будет объясняться позднее. Эти три блока обработки 20, 30, 40 предназначены для генерации указанных выше N каналов 500-520, описанных в отношении кодера 5. Кодер 15 также содержит блок 180 микширования и извлечения параметров, предназначенный для приема обработанных выводов 500, 510, 520 из блоков 20, 30, 40 обработки соответственно. Выходы блока 180 извлечения содержат указанный выше выход 600 третьего набора параметров и левый и правый промежуточные сигналы 950, 960, соответствующим образом связанные через блок 360 обратного преобразования и OLA (алгоритма сложения с перекрытием), предназначенный для генерации указанных выше микшированных выходов 610, 620 для левого и правого каналов соответственно. Наборы 720, 820, 920, 600 выходов параметров и микшированные выходы 610, 620, соответствующие кодированным выходным данным от кодера 15, подходят для последующей передачи на соответствующий совместимый декодер, где выходные данные декодируют для восстановления представления одного или большего количества из этих шести входных сигналов 400-450. Альтернативно, микшированные выходы 610 и 620 могут доставляться стандартному стерео кодеру.

Шесть исходных входных сигналов, обозначенных 400-450, содержат: левый передний звуковой сигнал 400, левый задний звуковой сигнал 410, звуковой сигнал эффектов 420, центральный звуковой сигнал 430, задний передний звуковой сигнал 440 и правый задний звуковой сигнал 450. Сигнал 420 эффектов предпочтительно имеет ширину диапазона по существу 120 Гц для моделирования эффектов грохота орудий, взрывов и грома, например. Кроме того, входные сигналы 400, 410, 430, 440, 450 предпочтительно соответствуют каналам звукового сопровождения «домашнего кинотеатра» с 5 каналами.

Блоки 20, 30, 40 обработки предпочтительно осуществляют способом, объясненным в опубликованной европейской патентной заявке № EP 1107232, которая представлена для справки относительно блоков 20, 30, 40.

Блок 20 обработки содержит блок 100 сегментации и преобразования, блок 110 анализа параметров, блок 120 параметра для угла PCA и блок 130 вращения PCA. Блок 100 преобразования включает в себя преобразованные лево-передний и лево-задний выходы 700, 710, соответствующим образом связанные с блоком 130 вращения PCA и блоком 110 анализа параметров. Выход 720 первого набора параметров связан через блок 120 угла PCA с блоком 120 вращения PCA. Блок 120 вращения предназначен для обработки выходов 700, 710 и выхода первого набора параметров для генерации обработанного выхода 500. Обработку в пределах блока 20 выполняют на основе фрагментов времени/частоты.

Точно так же блок 30 обработки содержит блок 200 сегментации и преобразования, блок 210 анализа параметров, блок 220 параметра для угла PCA и блок 230 вращения PCA. Блок 200 преобразования включает в себя преобразованные лево-передний и лево-задний выходы 800, 810, соответствующим образом связанные с блоком 230 вращения PCA и блоком 210 анализа параметров. Выход 820 четвертого набора параметров связан через блок 220 угла PCA с блоком 220 вращения PCA. Блок 220 вращения предназначен для обработки выходов 800, 810 и выхода четвертого набора параметров для генерации обработанного выхода 510. Обработку в пределах блока 30 также выполняют на основе фрагментов времени/частоты.

Точно так же блок 40 обработки содержит блок 300 сегментации и преобразования, блок 310 анализа параметров, блок 320 параметра для угла PCA и блок 330 вращения PCA. Блок 300 преобразования включает в себя преобразованные лево-передний и лево-задний выходы 900, 910, соответствующим образом связанные с блоком 330 вращения PCA и блоком 310 анализа параметров. Выход 920 второго набора параметров связан через блок 320 угла PCA с блоком 320 вращения PCA. Блок 320 вращения предназначен для обработки выходов 900, 910 и выхода второго набора параметров для генерации обработанного выхода 520. Обработку в пределах блока 40 выполняют на основе фрагментов времени/частоты.

Обработанные выходы 500, 510, 520 соответствуют левому, центральному и правому обрабатываемым сигналам соответственно. Кроме того, микшированные выходы 610, 620 допускают воспроизведение через современные устройства стерео воспроизведения с двумя каналами, таким образом поддерживая совместимость вниз с более ранними стерео звуковыми системами. Выход 600 третьего набора параметров включает в себя дополняющие параметрические данные, которые могут обрабатываться в декодере, например в декодере 10, показанном на фиг.2, вместе с набором 720, 820, 920 выходных параметров и микшированными выходами 610, 620 для восстановления представлений этих шести входных сигналов 400-450. Способ, которым происходит понижающее микширование для генерации микшированных выходов 610, 620 и параметрических данных на выходе 600 третьего набора параметров, будет описан далее.

Обращаясь снова к первому контексту изобретения относительно фиг.1 и 2, исходные входные сигналы N каналов с CH1 по CH3, а именно z1[n], z2[n]..., zN[n], описывают дискретные сигналы во временной области N каналов. Эти сигналы с z1[n] по zN[n] сегментируют на трех блоках 20, 30, 40 обработки, такая сегментация, использующая взаимную обычную сегрегацию, предпочтительно использует окна анализа временного наложения. Впоследствии каждый сегмент преобразуют из временного формата в частотный формат, а именно из временной области в частотную область посредством применения соответствующего преобразования, например быстрого преобразования Фурье (БПФ, FFT) или подобного эквивалентного преобразования. Такое преобразование формата предпочтительно осуществляют в вычислительных аппаратных средствах, выполняющих соответствующее программное обеспечение. Альтернативно, преобразование может осуществляться, используя структуры блока фильтров для получения фрагментов времени/частоты. Кроме того, данное преобразование приводит к сегментированным поддиапазонным представлениям входных сигналов для каналов с CH1 по CH3. Для удобства, эти сегментированные поддиапазонные представления входных сигналов с z1[n] по zN[n] обозначают с Z1[k] по ZN[k] соответственно, где k - индекс частоты.

Для удобства рассмотрели два микшированных канала, как показано для кодера 15, хотя возможно расширение до другого количества микшированных каналов. Из исходных входных сигналов, передаваемых по N каналам с CH1 по CH3, кодер 5 вырабатывает указанные выше поддиапазонные представления

с Z1[k] по ZN[k] для генерации двух микшированных каналов L0[k] и R0[k], как обеспечивают в уравнениях 1 и 2 (ур.1 и 2):

причем параметры αi и βi предпочтительно устанавливают так, как требуется для хорошего стерео представления в этих двух микшированных каналах L0[k] и R0[k]. Как объясняется ранее, последовательный декодер, например декодер 10, восстанавливающий представления исходных входных сигналов для каналов с CH1 по CH3, способен генерировать только по существу совершенные представления, когда эти два микшированных канала, L0[k] и R0[k], дополняют соответствующим набором параметров для в значительной степени восстановления N-2 недостающих каналов. Когда используют постоянное понижающее микширование, до некоторой степени информация отброшенных каналов N-2 может предсказываться из этих двух микшированных каналов L0[k] и R0[k], таким образом обеспечивая способ увеличения точности восстановления указанного выше представления исходных входных сигналов каналов с CH1 по CH3 в соответствующем декодере, например в декодере 10.

В ситуации, когда от информации, относящейся к некоторым N каналам, отказываются (отбрасывают) при генерации выходных сигналов 600, 610, 620, а именно каналы, от которых отказываются, обозначены C0,i[k], эти каналы, от которых отказываются, могут быть предсказаны из микшированных каналов

L0[k] и R0[k], применяя уравнение 3 (ур.3):

причем параметры и выбирают согласно одному или большему количеству критериев оптимизации. Предпочтительно критерием оптимизации, используемым в кодере 5, является минимальная Евклидова норма сигнала С0,i[k] и его оценки

Для учета обработки согласно уравнению 3, для использования в декодере, дополняющем кодер 5, параметры и предпочтительно включают в третий набор 600 параметров, выводимый из кодера 5.

Изобретатели поняли, что параметры и в уравнении 3 относятся к параметрам, которые генерируют в кодере 5, минимизируя Евклидову норму разности сигнала Zi[k] и его оценки сгенерированной в декодере 10. Кодер 5 предпочтительно конфигурируют, чтобы использовать эти последние параметры Zi[k], Квадрат Евклидовой нормы разности исходных входных сигналов Zi[k] затем вычисляют в кодере 5, применяя уравнение 4 (ур.4):

причем

Минимизацию уравнения 4 предпочтительно достигают с помощью применения уравнений 6 и 7 (ур.6 и 7):

причем

Таким образом, для параметров C1,zi и C2,zi, которые определяют из уравнений 6 и 7, следующие зависимости получают из уравнений 10-13 (ур.10-13) относительно коэффициентов αi и βi, например, как соответствует уравнениям 1 и 2 (ур.1 и 2):

Таким образом, в кодере 5, применяя операции по обработке, которые описаны уравнениями 1-13 (ур.1-13), можно преобразовывать входные сигналы, соответствующие N каналам, а именно входные сигналы для каналов с CH1 по CH3, когда N=3, с двумя параметрами на канал и двумя микшированными каналами, для генерации сигналов для выходов 610, 620, и выхода 600 третьего набора параметров; этими двумя параметрами для i-того канала являются C1,zi и C2,zi. Если понижающее микширование является постоянным для каждого фрагмента времени/частоты, то понижающее микширование известно в декодере 10, так что отношения между параметрами априорно известны. Если, с другой стороны, выбирают изменить данное понижающее микширование, то информацию относительно фактического понижающего микширования нужно посылать декодеру 10.

В кодере 5 входные сигналы с CH1 по CH3 обрабатывают в канальных блоках 100, 200, 300 для получения представлений входных сигналов в фрагментах времени/частоты. Операции по обработке, которые показаны уравнениями 1-13, повторяют для каждого из этих фрагментов. Сигналы L0[k] всех фрагментов частоты объединяют в кодере 5 и преобразуют к временной области для формирования сигнала для текущего сегмента, и этот сигнал по меньшей мере частично объединяют с сигналом, относящимся по меньшей мере к предыдущему сегменту, для генерации кодированного выходного сигнала 620. Сигналы R0[k] обрабатывают подобным образом, как сигналы L0[k], для генерации кодированного выходного сигнала 610.

В сущности, кодер 5, и аналогично кодер 15, который является конкретным примерным вариантом осуществления изобретения, предназначен для кодирования этих трех входных сигналов с CH1 по CH3, как два микшированных канала 610, 620, а именно lo[n], ro[n] и 2N-4 параметров для каждого фрагмента времени/частоты, применяемого при обработке входных сигналов с CH1 по CH3.

Дополняющим к кодеру 5, показанному на фиг.1, точно так же, как к кодеру 15, показанному на фиг.3, является дополняющий декодер, представленный схематично на фиг.2 и обозначенный в общем случае как 10. Декодер 10 включает в себя процессор (блок обработки) 1000, который предназначен для приема выходных микшированных сигналов 610, 620 от кодера 5, а также выход 600 третьего набора параметров, передающего параметрическую информацию, например значения для указанных выше параметров C1,zi и C2,zi. Декодер 10 предназначен для обработки сигналов с выходов 600, 610, 620, которые он принимает, для генерации декодированных выходных сигналов 1500, 1510, 1520, которые являются соответственно декодированными представлениями входных сигналов CH1, CH2, CH3.

В декодере 10, когда принимают выходы 600, 610, 620 от кодера 5, например, передаваемые посредством сети связи, такой как Интернет, и/или с помощью носителя информации, такого как цифровой видеодиск (DVD) или подобный носитель данных, для каждого фрагмента времени/частоты выполняют следующие функции обработки:

(a) вычисляют коэффициенты C1,zi и C2,zi для всех N каналов, используя 2N-4 коэффициентов и эти четыре уравнения, а именно информацию, относящуюся к уравнениям 10-13, описывающим зависимость между коэффициентами; и затем

(b) вычисляют приблизительное представление каждого из входных сигналов Zi[k], используя уравнение 14 (ур.14):

причем L0[k] и R0[k] - сигналы, представляющие фрагменты времени/частоты двух микшированных каналов, принятых в декодере 10, а именно выходов 610, 620 соответственно.

Конкретный примерный вариант осуществления декодера 10, показанный на фиг.2 в первом контексте, будет теперь описан в отношении фиг.4 во втором контексте. На фиг.4 показан декодер, обозначенный в общем случае как 18. Декодер 18 содержит блок 1600 сегментации и преобразования для преобразования указанных выше микшированных выходов 610, 620, обозначенных ro, lо, для генерации соответствующих преобразованных сигналов 1650, 1660, обозначенных Ro, Lо соответственно. Кроме того, декодер 18 также включает в себя процессор 1610 декодирования, предназначенный для приема сигналов 600, 1650, 1660 и их обработки для генерации соответствующих обработанных сигналов 1700, 1710, 1720, относящихся к левому каналу (L), центральному каналу (C) и правому каналу (R) соответственно.

Сигнал 1700 связан непосредственно и также через декоррелятор 1750, как показано, с блоком 1800 обратного PCA, который предназначен для генерации двух промежуточных выходов Lf, Ls, которые связаны с блоком 1900 обратного преобразования и OLA. Блок 1900 обратного преобразования предназначен для обработки промежуточных выходов Lf, Ls для генерации выходов 2000, 2010 декодера, соответствующих выходу 1500 на фиг.2, а именно восстановленных версий входных сигналов 400, 410.

Точно так же сигнал 1710 связан непосредственно и также через декоррелятор 1760, как показано, с блоком 1810 обратного PCA, который предназначен для генерации двух промежуточных выходов Cs, LFE, которые связаны с блоком 1910 обратного преобразования и OLA. Блок 1910 обратного преобразования предназначен для обработки промежуточных выходов Cs, LFE для генерации выходов 2020, 2030 декодера, соответствующих выходу 1510 на фиг.2, а именно восстановленных версий входных сигналов 420, 430.

Точно так же сигнал 1720 связан непосредственно и также через декоррелятор 1770, как показано, с блоком 1820 обратного PCA, который предназначен для генерации двух промежуточных выходов Rf, Rs, которые связаны с блоком 1920 обратного преобразования и OLA. Блок 1920 обратного преобразования предназначен для обработки промежуточных выходов Rf, Rs для генерации выходов 2040, 2050 декодера, соответствующих выходу 1520 на фиг.2, а именно восстановленных версий входных сигналов 440, 450.

Блоки 1800, 1810, 1820 требуют вводимых параметров 920, 820, 720 во время работы для получения данных, достаточных для правильной работы.

Операции по обработке, выполняемые в пределах процессора 1610 декодирования, также известного как декодер согласно изобретению, вовлекают математические операции, которые описаны ранее в отношении декодера 10, показанного на фиг.2.

Следует признать, что описанные ранее варианты осуществления изобретения допускают изменения без отхода от объема изобретения, который определяется в соответствии с прилагаемой формулой изобретения.

Например, кодер 5, аналогично кодеру 15, предпочтительно предназначен для генерации хорошего стерео представления на микшированных выходах, применяя уравнения 15 и 16 (ур.15 и 16) во время обработки:

В такой ситуации N=3, следовательно только два параметра на фрагмент, как определено с помощью 2N-4, должны передаваться от кодера 5 на декодер 10. Такая структура имеет преимущество в том, эти два параметра или коэффициента C1,Z и C2,Z находятся номинально в подобном числовом диапазоне так, что к ним может применяться подобное квантование.

Соответственно, в декодере 10, когда обеспечивают три или большее количество каналов воспроизведения, вычисляют для каждого фрагмента шесть параметров, а именно C1,L, C2,L, C1,R, C2,R, C1,Cs и C2,Cs. Такое вычисление основано на двух передаваемых параметрах и на информации об отношениях между этими шестью параметрами.

В качестве примера, коэффициенты C1,L и C2,R передают от кодера 5 на декодер 10. Декодер 10 затем способен получать из них другие коэффициенты посредством уравнений 17 (ур.17), а именно:

Когда эти шесть коэффициентов получены для каждого фрагмента, представления выходных сигналов в пределах кодера 5, а именно и можно восстанавливать в пределах декодера 10 с помощью использования уравнения 18 (ур.18) в вычислениях, выполняемых в пределах декодера 10:

Эти сигналы и затем преобразуют из частотной области во временную область для генерации сигналов 1500-1520 для вывода из декодера 10 для пользовательской оценки, например, во время представления «домашнего кинотеатра».

В самом прямом использовании многоканальных кодеров 5, 15, стандартный стерео кодер, а именно и кодер, и декодер, где M=2, используют между многоканальным кодером 5, 15 и многоканальным декодером 10, 18, описанными ранее. Другими словами, обращаясь к фиг.3 и 4, выходные сигналы 610, 620 на фиг.3 непосредственно подают на стандартный стерео кодер 3000 и после этого через мультиплексор 3002, как показано на фиг.5. Выходы 3005 мультиплексора 3002, которые включают в себя параметрические данные (600; 600, 720, 820, 920), затем передают через тракт 3010 передачи данных, например, через носитель информации или сеть связи, на демультиплексор 3012 и после этого на стерео декодер 3020, который дополняет стерео кодер 3000. Декодированные выходные сигналы 3030 от декодера 3020 вместе с параметрическими данными (600; 600, 720, 820, 920) от демультиплексора 3012 подают на многоканальный декодер 10, 18. Выходы 3030 декодера 3020 - восстановленные версии выходных сигналов 610, 620 многоканальных кодеров 5, 15. Конфигурация, которая показана на фиг.5, является примером способа, с помощью которого допускают взаимное соединение многоканальных кодеров 5, 15 и многоканальных декодеров 10, 18.

В прилагаемой формуле изобретения цифры и другие символы, размещенные в скобках, приведены для того, чтобы помочь пониманию данной формулы изобретения, и они не предназначены для ограничения объема притязаний формулы изобретения.

Такие выражения, как "содержат", "включают в себя", "является" и "имеют" должны рассматриваться неисключающим образом при интерпретации описания и связанной с ним формулы изобретения, а именно рассматриваться так, чтобы предоставить возможность присутствовать другим элементам или компонентам, которые явно не определены. Ссылка к единственному числу должна также рассматриваться как ссылка к множественному числу, и наоборот.

Похожие патенты RU2382419C2

название год авторы номер документа
АУДИОДЕКОДИРОВАНИЕ 2007
  • Виллемоес Ларс Ф.
  • Схейерс Эрик Г. П.
RU2420814C2
МНОГОКАНАЛЬНЫЙ ДЕКОРРЕЛЯТОР, МНОГОКАНАЛЬНЫЙ АУДИОДЕКОДЕР, МНОГОКАНАЛЬНЫЙ АУДИОКОДЕР, СПОСОБЫ И КОМПЬЮТЕРНАЯ ПРОГРАММА С ИСПОЛЬЗОВАНИЕМ ПРЕДВАРИТЕЛЬНОГО МИКШИРОВАНИЯ ВХОДНЫХ СИГНАЛОВ ДЕКОРРЕЛЯТОРА 2014
  • Диш Саша
  • Фукс Харальд
  • Хелльмут Оливер
  • Херре Юрген
  • Муртаза Адриан
  • Паулус Йоуни
  • Риддербуш Фалько
  • Терентив Леон
RU2666640C2
МНОГОКАНАЛЬНОЕ ИЕРАРХИЧЕСКОЕ АУДИОКОДИРОВАНИЕ С КОМПАКТНОЙ ДОПОЛНИТЕЛЬНОЙ ИНФОРМАЦИЕЙ 2006
  • Хельцер Андреас
  • Херре Юрген
  • Реден Йонас
  • Пурнхаген Хейко
  • Керлинг Кристофер
  • Энгдегард Йонас
  • Бребарт Йероен
  • Суйерс Эрик
  • Омен Вернер
  • Виллемоес Ларс
RU2367033C2
КОДИРОВАНИЕ И ДЕКОДИРОВАНИЕ ЗВУКОВЫХ ОБЪЕКТОВ 2007
  • Бребарт Дирк Й.
RU2460155C2
УСТРОЙСТВО ПОДАВЛЕНИЯ АКУСТИЧЕСКОГО ЭХА И ФРОНТАЛЬНОЕ УСТРОЙСТВО КОНФЕРЕНЦСВЯЗИ 2009
  • Кюх Фабиан
  • Каллингер Маркус
  • Шмидт Маркус
  • Зоуруб Мерай
  • Диатшук Марко
  • Мозер Оливер
RU2520359C2
МНОГОКАНАЛЬНЫЙ АУДИОДЕКОДЕР, МНОГОКАНАЛЬНЫЙ АУДИОКОДЕР, СПОСОБЫ, КОМПЬЮТЕРНАЯ ПРОГРАММА И КОДИРОВАННОЕ АУДИОПРЕДСТАВЛЕНИЕ С ИСПОЛЬЗОВАНИЕМ ДЕКОРРЕЛЯЦИИ ПРЕДСТАВЛЕННЫХ ПОСРЕДСТВОМ РЕНДЕРИНГА АУДИОСИГНАЛОВ 2014
  • Диш Саша
  • Фукс Харальд
  • Хелльмут Оливер
  • Херре Юрген
  • Муртаза Адриан
  • Паулус Йоуни
  • Риддербуш Фалько
  • Терентив Леон
RU2665917C2
ГИБРИДНОЕ УСИЛЕНИЕ РЕЧИ С КОДИРОВАНИЕМ ФОРМЫ СИГНАЛА И ПАРАМЕТРИЧЕСКИМ КОДИРОВАНИЕМ 2014
  • Коппенс, Йерун
  • Муеш, Ханнес
RU2639952C2
ДЕКОДЕР АУДИОСИГНАЛА, КОДЕР АУДИОСИГНАЛА, СПОСОБ ФОРМИРОВАНИЯ ПРЕДСТАВЛЕНИЯ СИГНАЛА ПОВЫШАЮЩЕГО МИКШИРОВАНИЯ, СПОСОБ ФОРМИРОВАНИЯ ПРЕДСТАВЛЕНИЯ СИГНАЛА ПОНИЖАЮЩЕГО МИКШИРОВАНИЯ, КОМПЬЮТЕРНАЯ ПРОГРАММА И БИСТРИМ, ИСПОЛЬЗУЮЩИЙ ЗНАЧЕНИЕ ОБЩЕГО ПАРАМЕТРА МЕЖОБЪЕКТНОЙ КОРРЕЛЯЦИИ 2010
  • Херре Юрген
  • Хилперт Йоханес
  • Хёлцер Андреас
  • Эндергард Йонас
  • Пурнхаген Хеико
RU2576476C2
УСТРОЙСТВО И СПОСОБ ДЛЯ КОДИРОВАНИЯ ПРОСТРАНСТВЕННОГО ЗВУКОВОГО ПРЕДСТАВЛЕНИЯ ИЛИ УСТРОЙСТВО И СПОСОБ ДЛЯ ДЕКОДИРОВАНИЯ ЗАКОДИРОВАННОГО АУДИОСИГНАЛА С ИСПОЛЬЗОВАНИЕМ ТРАНСПОРТНЫХ МЕТАДАННЫХ И СООТВЕТСТВУЮЩИЕ КОМПЬЮТЕРНЫЕ ПРОГРАММЫ 2020
  • Кюх, Фабиан
  • Тиргарт, Оливер
  • Фукс, Гийом
  • Дёла, Штефан
  • Бутеон, Александр
  • Херре, Юрген
  • Байер, Штефан
RU2792050C2
УСТРОЙСТВО И СПОСОБ ОБРАБОТКИ КОДИРОВАННОГО АУДИОСИГНАЛА 2016
  • Муртаза Адриан
  • Паулус Йоуни
  • Фукс Харальд
  • Камиллери Роберта
  • Терентив Леон
  • Диш Саша
  • Херре Юрген
  • Хелльмут Оливер
RU2678136C1

Иллюстрации к изобретению RU 2 382 419 C2

Реферат патента 2010 года МНОГОКАНАЛЬНЫЙ КОДЕР

Изобретение относится к многоканальным кодерам, например к многоканальным звуковым кодерам, использующим параметрическое описание пространственного звука. Описан способ кодирования входных сигналов (с СН1 по СН3; 400-450) в многоканальном кодере (5; 15) для генерации соответствующих выходных данных, содержащих выходные микшированные сигналы (610, 620) вместе с дополняющими параметрическими данными (600). Способ включает в себя первый этап выполнения понижающего микширования входных сигналов (с СН1 по СН3; 400-450) для генерации соответствующих выходных микшированных сигналов (610, 620), и второй этап обработки входных сигналов (с СН1 по СНЗ; 400-450) во время выполнения понижающего микширования для генерации указанных параметрических данных (600), дополняющих выходные микшированные сигналы (610, 620). Обработка входных сигналов (с СН1 по СН3; 400-450) вовлекает включение в микшированные сигналы (610, 620) информации, которую используют во время последующего декодирования выходных микшированных сигналов (610, 620) и параметрических данных (600) для определения, по меньшей мере, параметрических данных и таким образом предоставления возможности впоследствии восстанавливать представления входных сигналов (с СН1 по СН3; 400-450). Представлены кодеры для использования в кодере (5; 15) для выполнения операций обработки сигналов. Технический результат - улучшение качества декодированной многоканальной аудиоинформации. 4 н. и 6 з.п. ф-лы, 5 ил.

Формула изобретения RU 2 382 419 C2

1. Многоканальный кодер (5; 15), предназначенный для обработки входных сигналов, передаваемых по множеству входных каналов (с СН1 по СН3; 400-450) для генерации соответствующих выходных данных, содержащих выходные микшированные сигналы (610, 620) вместе с дополняющими параметрическими данными (600), данный кодер (5; 15) включает в себя три блока обработки 20, 30, 40 для приема шести входных сигналов, предназначенные для генерации N каналов 500-520, а также наборов параметров 720, 820, 920,
блок 180 микширования и извлечения параметров, предназначенный для приема обработанных каналов 500, 510, 520 из блоков 20, 30, 40 обработки соответственно, причем выходы блока 180 микширования и извлечения содержат сигнал 600 набора параметров, а также левый и правый промежуточные сигналы 950, 960, соответствующим образом связанные через блок 360 обратного преобразования и алгоритм сложения с перекрытием (OLA), предназначенный для генерации указанных выше микшированных сигналов 610, 620 для левого и правого каналов, соответственно, причем выходные сигналы с выходов наборов 720, 820, 920 параметров блока обработки 20, 30, 40 и микшированных сигналов с выходов 600, 610, 620 соответствующие кодированным выходным данным предназначены для последующей передачи с предоставлением при генерации выходных микшированных сигналов и выходных сигналов наборов параметров возможности последующего декодирования этих сигналов для предсказания сигналов каналов, которые обрабатывают и затем отбрасывают в кодере.

2. Многоканальный кодер (5; 15) по п.1, выполненный с возможностью обработки входных сигналов (с СН1 по СН3; 400-450) на основе фрагментов времени/частоты.

3. Многоканальный кодер (5; 15) по п.2, в котором упомянутые фрагменты определяют или до, или во время обработки входных сигналов (с СН1 по СН3; 400-450) в кодере (5; 15).

4. Многоканальный кодер (5; 15) по п.1, в котором средство анализа выполнено с возможностью генерации, по меньшей мере, части параметрических данных (C1,i; C2,i) с помощью применения оптимизации, по меньшей мере, одного сигнала, полученного из разности между одним или большим количеством входных сигналов и оценкой указанных одного или большего количества входных сигналов, которые могут генерироваться из выходных данных (600, 610, 620) многоканального кодера (5; 15).

5. Многоканальный кодер (5; 15) по п.4, в котором оптимизация содержит минимизацию Евклидовой нормы.

6. Многоканальный кодер (5; 15) по п.1, в котором существуют N входных каналов, которые данное средство анализа может обрабатывать для генерации параметрических данных для каждого фрагмента времени/частоты, данное средство анализа выполнено с возможностью вывода M(N-M) параметров вместе с М выходными микшированными сигналами для представления входных сигналов (с СН1 по СН3; 400-450) в выходных данных (600, 610, 620); М и N являются целыми числами и M<N.

7. Многоканальный кодер (5; 15) по п.6, в котором целое число М равно двум, так что выходные сигналы предоставляют возможность воспроизведения на стереофоническом устройстве с двумя каналами и кодирования с помощью стандартного стереокодера.

8. Способ обработки входных сигналов в многоканальном кодере, передаваемых по множеству входных каналов (с СН1 по СН3; 400-500) для генерации соответствующих выходных данных, содержащих выходные микшированные сигналы (610, 620) вместе с дополняющими параметрическими данными (600), содержащий этапы, на которых принимают шесть входных сигналов, предназначенных для генерации N каналов 500-520, а также наборов параметров 720, 820, 920, принимают обработанные каналы 500, 510, 520, генерируют указанные выше микшированные сигналы 610,620 для левого и правого каналов соответственно, причем выходные сигналы и микшированные сигналы соответствуют кодированным выходным данным, предназначенным для последующей передачи с предоставлением при генерации выходных микшированных сигналов и выходных сигналов наборов параметров возможности последующего декодирования этих сигналов для предсказания сигналов каналов, которые обрабатывают и затем отбрасывают.

9. Многоканальный декодер (10; 18) для декодирования выходных данных, сгенерированных многоканальным кодером (5; 15) по п.1, содержащий
блок 1600 сегментации и преобразования для преобразования микшированных сигналов (610 и 620), предназначенный для генерации соответствующих преобразованных сигналов (1650, 1660) соответственно, процессор 1610 декодирования, предназначенный для приема сигнала с параметрическими данными 600 и преобразованных сигналов (1650, 1660) и их обработки для генерации соответствующих обработанных сигналов 1700, 1710, 1720, причем каждый из сигналов 1700 (1710, 1720) связан непосредственно и также через декоррелятор 1750 (1760, 1770) с блоком 1800 (1810, 1820) обратного анализа главных компонентов (РСА), который предназначен для генерации двух промежуточных сигналов, которые связаны с блоком 1900 обратного преобразования, и алгоритм сложения с перекрытием (OLA), который предназначен для обработки промежуточных сигналов для генерирования выходных сигналов 2000, 2010 (2020, 2030, 2040, 2050) декодера, восстановленных версий сигналов 400 и 410 (420, 430, 440, 450) соответственно.

10. Способ декодирования выходных данных, сгенерированных многоканальным кодером (5; 15) по п.1, в многоканальном декодере (10; 18), содержащий этапы, на которых преобразуют микшированные сигналы (610 и 620) и генерируют соответствующие преобразованные сигналы (1659,1660), принимают сигнал с параметрическими данными 600 и преобразованные сигналы (1650, 1660) и обрабатывают их для генерации соответствующих обработанных сигналов 1700, 1710, 1720, генерируют два промежуточных сигнала и обрабатывают эти промежуточные сигналы для генерирования выходных сигналов 2000, 2010 (2020, 2030, 2040, 2050) декодера, восстановленных версий сигналов 400 и 410 (420, 430, 440, 450) соответственно.

Документы, цитированные в отчете о поиске Патент 2010 года RU2382419C2

Переносная печь для варки пищи и отопления в окопах, походных помещениях и т.п. 1921
  • Богач Б.И.
SU3A1
US 5870480 A, 1999.02.09
СПОСОБ ПЕРЕДАЧИ И/ИЛИ ЗАПОМИНАНИЯ ЦИФРОВЫХ СИГНАЛОВ НЕСКОЛЬКИХ КАНАЛОВ 1993
  • Эрнст Эберляйн
  • Юрген Херре
  • Бернхард Грилл
  • Карл-Хайнц Бранденбург
  • Дитер Зайтцер
RU2129336C1
Регулируемый преобразователь напряжения 1982
  • Вольвач Дмитрий Александрович
  • Нежевенко Юрий Иванович
SU1107232A1
US 5859826 A, 1999.01.12.

RU 2 382 419 C2

Авторы

Хото Герард Х.

Бребарт Дирк Й.

Вербицкий Евгений А.

Ден Бринкер Альбертус С.

Даты

2010-02-20Публикация

2005-03-25Подача