СОВМЕСТИМОЕ МНОГОКАНАЛЬНОЕ КОДИРОВАНИЕ/ДЕКОДИРОВАНИЕ Российский патент 2008 года по МПК H04S3/00 

Описание патента на изобретение RU2327304C2

Область техники, к которой относится изобретение

Настоящее изобретение относится к устройству и способу обработки многоканального звукового сигнала и, в частности, к устройству и способу обработки многоканального звукового сигнала в совместимом стереоформате.

Уровень техники

В последнее время методика воспроизведения многоканального звука становится все более важной. Это может быть обусловлено тем фактом, что методики сжатия/кодирования звука, такие как широко распространенная методика MP3, сделали возможным распространять звукозаписи посредством Интернета или других каналов передачи, имеющих ограниченную полосу пропускания.

Методика кодирования MP3 стала такой известной из-за того, что она позволяет распространение всех записей в стереоформате, т.е. цифровом представлении звуковой записи, включающем в себя первый, или левый, стереоканал и второй, или правый, стереоканал.

Тем не менее, в традиционных двухканальных звуковых системах существуют основные недостатки. Поэтому разработана методика объемного звучания. Рекомендованное многоканальное представление объемного звучания включает в себя, помимо двух стереоканалов L и R, дополнительный центральный канал C и два канала объемного звучания Ls, Rs. Этот эталонный формат звука также указывается как три/два-стерео, что означает, что предусмотрено три фронтальных канала и два канала объемного звучания. Как правило, требуется пять каналов передачи. В окружении воспроизведения требуется, по меньшей мере, пять динамиков в соответствующих пяти различных местах для получения оптимальной зоны наилучшего восприятия на определенном расстоянии от пяти правильно размещенных громкоговорителей.

В данной области техники известно несколько методик уменьшения объема данных, требуемого для передачи многоканального звукового сигнала. Эти методики называются методиками объединенного стерео. С этой целью делается ссылка на фиг.10, которая показывает объединенное стереоустройство 60. Это устройство может быть устройством, реализующим, к примеру, стереокодирование по интенсивности (IS) или стереокодирование по меткам (BCC). Это устройство, как правило, принимает в качестве входа, по меньшей мере, два канала (CH1, CH2,..., CHn) и выводит один канал несущей частоты и параметрические данные. Параметрические данные задаются таким образом, чтобы в декодере аппроксимация исходного канала (CH1, CH2,..., CHn) могла быть вычислена.

Обычно канал несущей частоты включает в себя выборки поддиапазонов, спектральные коэффициенты, выборки временной области и т.д., которые предоставляют сравнительно точное представление базового сигнала, тогда как параметрические данные не включают в себя такие выборки спектральных коэффициентов, но включают в себя управляющие параметры для управления определенным алгоритмом восстановления, таким как взвешивание посредством умножения, временной манипуляции, частотной манипуляции и т.д. Параметрические данные, таким образом, включают в себя только сравнительно грубое представление сигнала или ассоциативно связанного канала. Если в числах, то объем данных, требуемый каналом несущей частоты, находится в диапазоне 60-70 Кбит/с, тогда как объем данных, требуемый параметрической информацией для одного канала, находится в диапазоне 1,5-2,5 Кбит/с. Примером параметрических данных являются широко распространенные масштабные коэффициенты, информация о стереокодировании по интенсивности или параметры стереокодирования по меткам, как описано ниже.

Стереокодирование по интенсивности описано в препринте AES 3799, "Intensity Stereo Coding", J. Herre, K. H. Brandenburg, D. Lederer, февраль 1994 года, Амстердам. Как правило, понятие стереокодирования по интенсивности основано на преобразовании основных осей, которое должно быть применено к данным обоих стереофонических звуковых каналов. Если большинство точек данных сконцентрировано вокруг первой принципиальной оси, кодирование может быть выполнено посредством поворота обоих сигналов на определенный угол перед кодированием. Тем не менее, это не всегда правильно для методик реального стереофонического генерирования. Поэтому эта методика изменена посредством исключения второго ортогонального компонента из передачи в потоке битов. Таким образом, восстановленные сигналы для левых и правых каналов состоят из по-разному взвешенных или масштабированных версий одного и того же передаваемого сигнала. Тем не менее, восстановленные сигналы отличаются по амплитуде, но идентичны в отношении фазовой информации. Энергетические временные огибающие обоих исходных звуковых каналов, тем не менее, сохраняются посредством операции выборочного масштабирования, которое типично выполняется частотно-селективным способом. Это соответствует человеческому восприятию звука на высоких частотах, когда доминирующие пространственные метки определяются посредством энергетических огибающих.

Помимо этого, в практических реализациях передаваемый сигнал, т.е. сигнал несущей частоты генерируется из суммирующего сигнала левого канала и правого канала вместо вращения обоих компонентов. Более того, эта обработка, т.е. генерирование параметров стереокодирования по интенсивности для выполнения операции масштабирования, выполняется частотно-селективно, т.е. независимо для каждой полосы масштабных коэффициентов, т.е. частотного разбиения кодера. Предпочтительно оба канала объединяются для формирования объединенного канала или канала несущей частоты, и помимо объединенного канала определяется информация о стереокодировании по интенсивности, которая зависит от энергии первого канала, энергии второго канала или энергии объединенного канала.

Методика BCC описана в документе по соглашению AES 5574, "Binaural cue coding applied to stereo and multi-channel audio compression", C. Faller, F. Baumgarte, май 2002 года, Мюнхен. При BCC-кодировании число входных звуковых каналов преобразуется в спектральное представление с использованием основанного на DFT преобразования с помощью перекрывающихся окон. Результирующий равномерный спектр делится на неперекрывающиеся сегменты, каждый из которых имеет индекс. Каждый сегмент имеет полосу пропускания, пропорциональную эквивалентной прямоугольной полосе пропускания (ERB). Межканальные разности уровней (ICLD) и межканальные разности времен (ICTD) оцениваются для каждого сегмента по каждому кадру k. ICLD и ICTD квантуются и кодируются, что приводит к потоку битов BCC. Межканальные разности уровней и межканальные разности времени даны для каждого канала относительно опорного канала. Затем вычисляются параметры в соответствии с заданной формулой, которая зависит от конкретных сегментов сигнала, который должен быть обработан.

На стороне декодера декодер принимает моносигнал и поток битов BCC. Моносигнал преобразуется в частотную область и сходит в блок пространственного синтеза, который также принимает декодированные значения ICLD и ICTD. В блоке пространственного синтеза значения параметров BCC (ICLD и ICTD) используются, чтобы выполнить операцию взвешивания моносигнала, чтобы синтезировать многоканальные сигналы, которые после частотно-временного преобразования представляют восстановление оригинального многоканального звукового сигнала.

В случае BCC объединенный стереомодуль 60 предназначен для вывода дополнительной канальной информации, с тем чтобы параметрическими канальными данными были квантованные и кодированные параметры ICLD или ICTD, при этом один из исходных каналов используется в качестве опорного канала для кодирования дополнительной канальной информации.

Обычно канал несущей частоты формируется из суммы участвующих исходных каналов.

Разумеется, вышеуказанные методики предоставляют только монофоническое представление декодеру, который может обрабатывать только канал несущей частоты, но не может обрабатывать параметрические данные для генерирования одного или более приближений нескольких входных каналов.

Чтобы передавать пять каналов совместимым способом, т.е. в формате потока битов, который также понятен для обычного стереодекодера, использована так называемая методика матрицирования, описанная в документе "MUSICAM surround: a universal multi-channel coding system compatible with ISO 11172-3", G. Theile и G. Stoll, препринт AES 3403, октябрь 1992 года, Сан-Франциско. Пять входных каналов L, R, C, Ls и Rs подаются в устройство матрицирования, выполняющее операцию матрицирования для рассчета базовых или совместимых стереоканалов Lo, Ro из пяти входных каналов. В частности, эти базовые стереоканалы вычисляются, как изложено ниже:

Lo = L+xC+yLs;

Ro = R+xC+yRs,

x и y - константы.

Другие три канала C, Ls, Rs передаются так, как если они находятся на уровне расширения, помимо базового стереоуровня, который включает в себя кодированную версию базовых стереосигналов Lo/Ro. В отношении потока битов этот базовый стереоуровень Lo/Ro включает в себя заголовок, такую информацию, как масштабные коэффициенты и выборки поддиапазонов. Многоканальный уровень расширения, т.е. центральный канал и два канала объемного звучания включены в поле многоканального расширения, которое также называется полем служебных данных.

На стороне декодера выполняется операция обратного матрицирования для формирования восстановлений левого и правого каналов в пятиканальном представлении, использующем базовые стереоканалы Lo, Ro и три дополнительных канала. Дополнительно, три дополнительных канала декодированы из служебной информации, чтобы получить декодированное пятиканальное или представление объемного звучания исходного многоканального звукового сигнала.

Другой подход к многоканальному кодированию описан в публикации "Improved MPEG-2 audio multi-channel encoding", B. Grill, J. Herre, K. H. Brandenburg, E. Eberlein, J. Koller, J. Mueller, препринт AES 3865, февраль 1994 года, Амстердам, в которой, чтобы достичь обратной совместимости, рассматриваются обратно-совместимые режимы. С этой целью используется матрица совместимости, чтобы получить два так называемых канала сведения Lc, Rc из исходных пяти входных каналов. Более того, можно динамически выбирать три дополнительных канала, передаваемых как служебные данные.

Чтобы использовать стереонерелевантность, методика объединенного стерео применяется к группам каналов, к примеру, трем фронтальным каналам, т.е. левому каналу, правому каналу и центральному каналу. С этой целью эти три канала объединены для получения объединенного канала. Этот объединенный канал квантуется и упаковывается в поток битов. Далее этот объединенный канал вместе с соответствующей информацией по объединенному стерео входит в модуль декодирования объединенного стерео для получения декодированных объединенных стереоканалов, т.е. декодированный объединенный левый стереоканал, декодированный объединенный правый стереоканал и декодированный объединенный центральный стереоканал. Эти декодированные объединенные стереоканалы вместе с левым каналом объемного звучания и правым каналом объемного звучания входят в блок матрицы совместимости для формирования первого и второго каналов сведения Lc, Rc. Далее квантованные версии обоих каналов сведения и квантованная версия объединенного канала упаковываются в поток битов вместе с параметрами объединенного стереокодирования.

Следовательно, с помощью стереокодирования по интенсивности группа независимых сигналов исходных каналов передается в рамках одной части данных несущей. Декодер далее восстанавливает связанные сигналы как идентичные данные, которые заново масштабируются согласно исходным энергетическим временным огибающим. Следовательно, линейная комбинация передаваемых каналов приводит к результатам, которые отличаются от исходного сведения. Это применяется к любому типу объединенного стереокодирования, основанного на концепции стереокодирования по интенсивности. Для системы кодирования, предоставляющей совместимые каналы сведения, есть прямое следствие. Восстановление посредством обратного матрицирования, как описано в предыдущей публикации, имеет недостатки, обусловленные неполным восстановлением. Использование так называемой схемы предыскажения объединенного стерео, в которой объединенное стереокодирование левого, правого и центрального канала выполняется для матрицирования в кодере, уменьшает эту проблему. Таким образом, схема обратного матрицирования для восстановления предоставляет меньше недостатков, поскольку на стороне кодера декодированные объединенные стереосигналы используются для генерирования каналов сведения. Таким образом, процесс неполного восстановления сдвигается в совместимые каналы сведения Lc и Rc, где он с гораздо большей вероятностью маскируется самим звуковым сигналом.

Хотя эта система привела к меньшему количеству недостатков из-за обратного матрицирования на стороне декодера, тем не менее, она имеет некоторые изъяны. Изъян состоит в том, что стереосовместимые каналы сведения Lc и Rc получаются не из исходных каналов, а из закодированных/декодированных с помощью стереокодирования по интенсивности версий исходных каналов. Поэтому потери данных вследствие системы стереокодирования по интенсивности включены в совместимые каналы сведения. Декодер только для стерео, который декодирует только совместимые каналы, а не кодированные с помощью стереокодирования по интенсивности каналы расширения, следовательно, предоставляет выходной сигнал, на который оказывают влияние вынужденные потери данных вследствие стереокодирования по интенсивности.

Дополнительно, полный дополнительный канал должен быть передан помимо двух каналов сведения. Этот канал является объединенным каналом, который сформирован посредством объединенного стереокодирования левого канала, правого канала и центрального канала. Дополнительно, информация о стереокодировании по интенсивности, чтобы восстанавливать исходные каналы L, R, C из объединенного канала, также должна быть передана декодеру. В декодере выполняется обратное матрицирование, т.е. операция обратного матрицирования, чтобы извлечь каналы объемного звучания из двух каналов сведения. Дополнительно, исходный левый, правый и центральный каналы аппроксимируются посредством объединенного стереодекодирования с помощью передаваемого объединенного канала и передаваемых параметров объединенного стерео. Следует отметить, что исходный левый, правый и центральный каналы извлекаются из объединенного стереодекодирования объединенного канала.

Сущность изобретения

Задача настоящего изобретения - предоставить концепцию эффективной по битам и с меньшим числом недостатков обработки или обратной обработки многоканального звукового сигнала.

В соответствии с первым аспектом настоящего изобретения эта задача решается посредством устройства для обработки многоканального звукового сигнала, причем многоканальный звуковой сигнал имеет, по меньшей мере, три исходных канала, содержащего средство предоставления первого канала сведения и второго канала сведения, при этом первый и второй каналы сведения извлекаются из исходных каналов; средство вычисления дополнительной канальной информации для выбранного исходного канала исходных сигналов, причем средство для вычисления предназначено для вычисления дополнительной канальной информации, так чтобы канал сведения или объединенный канал сведения, включающий в себя первый и второй канал сведения, при взвешивании с помощью дополнительной канальной информации приводили к аппроксимации выбранного исходного канала; и средство генерирования выходных данных, причем выходные данные включают в себя дополнительную канальную информацию, первый канал сведения или сигнал, извлеченный из первого канала сведения, и второй канал сведения или сигнал, извлеченный из второго канала сведения.

В соответствии со вторым аспектом настоящего изобретения эта задача решается посредством способа обработки многоканального звукового сигнала, причем многоканальный звуковой сигнал имеет, по меньшей мере, три исходных канала, заключающегося в том, что предоставляют первый канал сведения и второй канал сведения, причем первый и второй каналы сведения извлекают из исходных каналов; вычисляют дополнительную канальную информацию для выбранного исходного канала исходных сигналов, так чтобы канал сведения или объединенный канал сведения, включающий в себя первый и второй канал сведения, при взвешивании с помощью дополнительной канальной информации приводили к аппроксимации выбранного исходного канала; и генерируют выходные данные, причем выходные данные включают в себя дополнительную канальную информацию, первый канал сведения или сигнал, извлеченный из первого канала сведения, и второй канал сведения или сигнал, извлеченный из второго канала сведения.

В соответствии с третьим аспектом настоящего изобретения эта задача решается посредством устройства для обратной обработки входных данных, причем входные данные включают в себя дополнительную канальную информацию, первый канал сведения или сигнал, извлеченный из первого канала сведения, и второй канал сведения или сигнал, извлеченный из второго канала сведения, причем первый канал сведения и второй канал сведения извлекаются из, по меньшей мере, трех исходных каналов многоканального звукового сигнала, дополнительная канальная информация вычисляется, так чтобы канал сведения или объединенный канал сведения, включающий в себя первый канал сведения и второй канал сведения, при взвешивании с помощью дополнительной канальной информации приводили к аппроксимации выбранного исходного канала, при этом устройство содержит устройство считывания входных данных для считывания входных данных, предназначенное для получения первого канала сведения или сигнала, извлеченного из первого канала сведения, и второго канала сведения или сигнала, извлеченного из второго канала сведения, и дополнительной канальной информации; и устройство восстановления канала для восстановления аппроксимации выбранного исходного канала с помощью дополнительной канальной информации и канала сведения или объединенного канала сведения для получения аппроксимации выбранного исходного канала.

В соответствии с четвертым аспектом настоящего изобретения эта задача решается посредством способа обратной обработки входных данных, причем входные данные включают в себя дополнительную канальную информацию, первый канал сведения или сигнал, извлеченный из первого канала сведения, и второй канал сведения или сигнал, извлеченный из второго канала сведения, причем первый канал сведения и второй канал сведения извлекают из, по меньшей мере, трех исходных каналов многоканального звукового сигнала, и при этом дополнительную канальную информацию вычисляют, так чтобы канал сведения или объединенный канал сведения, включающий в себя первый канал сведения и второй канал сведения, при взвешивании с помощью дополнительной канальной информации приводили к аппроксимации выбранного исходного канала, при этом способ заключается в том, что считывают входные данные для получения первого канала сведения или сигнала, извлеченного из первого канала сведения, и второго канала сведения или сигнала, извлеченного из второго канала сведения, и дополнительной канальной информации; и восстанавливают аппроксимацию выбранного исходного канала с помощью дополнительной канальной информации и канала сведения или объединенного канала сведения, для получения аппроксимации выбранного исходного канала.

В соответствии с пятым аспектом и шестым аспектом настоящего изобретения эта задача решается посредством компьютерной программы, включающей в себя способ обработки или способ обратной обработки.

Настоящее изобретение основано на обнаружении того, что эффективное кодирование многоканального звукового сигнала с меньшим числом недостатков получается, когда каналы сведения, предпочтительно представляющие левый и правый стереоканалы, упакованы в выходные данные.

Параметрическая дополнительная канальная информация для одного или нескольких исходных каналов извлекается так, чтобы они относились к одному из каналов сведения, а не (как в предшествующем уровне техники) к дополнительному "объединенному" стереоканалу. Это означает, что параметрическая дополнительная канальная информация вычисляется таким образом, чтобы на стороне декодера устройство восстановления канала использовало дополнительную канальную информацию и один из каналов сведения или комбинация каналов сведения для восстановления аппроксимации исходного звукового канала, которому назначена дополнительная канальная информация.

Изобретательская концепция является выгодной в том, что она предоставляет эффективное по битам многоканальное расширение, так чтобы многоканальный звуковой сигнал мог воспроизводиться в декодере.

Дополнительно, изобретательская концепция является обратно совместимой, поскольку декодер меньшего масштаба, который адаптирован только для двухканальной обработки, может просто игнорировать информацию о расширении, т.е. дополнительную канальную информацию. Декодер меньшего масштаба может воспроизводить только два канала сведения для получения стереопредставления исходного многоканального звукового сигнала. Декодер большего масштаба, тем не менее, который поддерживает многоканальную работу, может использовать передаваемую дополнительную канальную информацию, чтобы восстанавливать аппроксимации исходных каналов.

Настоящее изобретение имеет преимущество в том, что оно является эффективным по битам, поскольку, в отличие от предшествующего уровня техники, не требуется дополнительных каналов несущей частоты помимо первого и второго каналов сведения Lc, Rc. Вместо этого дополнительная канальная информация относится к одному или обоим каналам сведения. Это означает, что каналы сведения сами выступают в качестве канала несущей частоты, с которым объединяется дополнительная канальная информация для восстановления исходного звукового канала. Это означает, что дополнительная канальная информация предпочтительно является параметрической информацией, т.е. информацией, которая не включает в себя какие-либо выборки поддиапазонов или спектральные коэффициенты. Наоборот, параметрическая информация - это информация, используемая для взвешивания (по времени и/или частоте) соответствующего канала сведения или комбинации соответствующих каналов сведения для получения восстановленной версии выбранного исходного канала.

В предпочтительном варианте осуществления настоящего изобретения получено обратно совместимое кодирование многоканального сигнала на основе совместимого стереосигнала. Предпочтительно, совместимый стереосигнал (сигнал сведения) генерируется с помощью матрицирования исходных каналов многоканального звукового сигнала.

Информация о выбранном исходном канале получается на основе методик объединенного стерео, таких как стереокодирование по интенсивности или стереокодирование по меткам. Таким образом, на стороне декодера операцию обратного матрицирования не требуется выполнять. Проблемы, связанные с обратным матрицированием, т.е. определенные недостатки, относящиеся к нежелательному распространению шума квантования при операциях обратного матрицирования, устраняются. Это обусловлено тем фактом, что декодер использует устройство восстановления канала, которое восстанавливает исходный сигнал посредством использования одного из каналов сведения или комбинации каналов сведения и передаваемой дополнительной канальной информации.

Предпочтительно, изобретательская концепция применяется к многоканальному звуковому сигналу, имеющему пять каналов. Этими пятью каналами являются левый канал L, правый канал R, центральный канал C, левый канал объемного звучания Ls и правый канал объемного звучания Rs. Предпочтительно, каналы сведения - это стереосовместимые каналы сведения Ls и Rs, которые предоставляют стереопредставление исходного многоканального звукового сигнала.

В соответствии с предпочтительным вариантом осуществления настоящего изобретения для каждого исходного канала дополнительная канальная информация вычисляется на стороне декодера, упакованная в выходные данные. Дополнительная канальная информация для исходного левого канала извлекается с помощью левого канала сведения. Дополнительная канальная информация для исходного левого объемного канала извлекается с помощью левого канала сведения. Дополнительная канальная информация для исходного правого канала извлекается с помощью правого канала сведения. Дополнительная канальная информация для исходного правого объемного канала извлекается с помощью правого канала сведения.

В соответствии с предпочтительным вариантом осуществления настоящего изобретения дополнительная канальная информация для исходного центрального канала извлекается с помощью первого канала сведения, а также второго канала сведения, т.е. комбинации двух каналов сведения. Предпочтительно, эта комбинация является суммированием.

Таким образом, группировки, т.е. отношение между дополнительной канальной информацией и сигналом несущей частоты, т.е. используемом канале сведения для предоставления информации о выбранном исходном канале, таковы, что для оптимального качества выбирается определенный канал сведения, который содержит наибольшую возможную величину соответствующего исходного многоканального сигнала, которая представляется посредством дополнительной канальной информации. В качестве такого сигнала несущей частоты объединенного стерео используются первый и второй каналы сведения. Предпочтительно, также сумма первого и второго каналов сведения может быть использована. Естественно, сумма первого и второго каналов сведения может быть использована для вычисления дополнительной канальной информации по каждому из исходных каналов. Тем не менее, предпочтительно, сумма каналов сведения используется для вычисления дополнительной канальной информации исходного центрального канала в окружении объемного звучания, таком как пятиканальное объемное звучание, семиканальное объемное звучание, объемное звучание 5.1 или объемное звучание 7.1. Использование суммы первого и второго каналов сведения особенно выгодно, поскольку не требуется дополнительной передачи служебных данных. Это обусловлено тем фактом, что оба канала сведения присутствуют в декодере, так что суммирование этих каналов сведения может быть легко выполнено в декодере без необходимости каких-либо дополнительных бит передачи.

Предпочтительно, дополнительная канальная информация, формирующая многоканальное окружение, входит в поток битов выходных данных совместимым способом, с тем чтобы декодер меньшего масштаба просто игнорировал данные многоканального расширения и предоставлял только стереопредставление многоканального звукового сигнала. Тем не менее, кодер большего масштаба использует два канала сведения, но, кроме того, использует дополнительную канальную информацию для восстановления полного многоканального представления исходного звукового сигнала.

Декодер согласно изобретению предназначен во-первых, для декодирования обоих каналов сведения и считывания дополнительной канальной информации для выбранных исходных каналов. Затем дополнительная канальная информация и каналы сведения используются для восстановления аппроксимаций исходных каналов. С этой целью операция обратного матрицирования предпочтительно вообще не выполняется. Это означает, что в этом варианте осуществления каждый из, к примеру, пяти исходных каналов восстанавливается с помощью, к примеру, пяти наборов различной дополнительной канальной информации. В декодере выполняется такая же группировка, что и в кодере, для вычисления восстановленной аппроксимации канала. В пятиканальном окружении объемного звучания это означает, что для восстановления исходного левого канала используется левый канал сведения и дополнительная канальная информация для левого канала. Чтобы восстановить исходный правый канал, используется правый канал сведения и дополнительная канальная информация о правом канале. Чтобы восстановить исходный левый канал объемного звучания, используется левый канал сведения и дополнительная канальная информация о левом канале объемного звучания. Чтобы восстановить исходный правый канал объемного звучания, используется дополнительная канальная информация о правом канале объемного звучания и правый канал сведения. Чтобы восстановить исходный центральный канал, используется объединенный канал, сформированный из первого канала сведения и второго канала сведения, и дополнительная информация о центральном канале.

Естественно, также можно воспроизводить первый и второй каналы сведения как левый и правый каналы, так что только три набора параметров (из, к примеру, пяти) дополнительной канальной информации предназначены для передачи. Тем не менее, это рекомендуется только в случае, когда предусмотрены менее строгие правила в отношении качества. Это обусловлено тем фактом, что обычно левый канал сведения и правый канал сведения отличаются от исходного левого канала или исходного правого канала. Только в случае, когда нельзя передавать дополнительную канальную информацию для каждого из исходных каналов, эта обработка выгодна.

Краткое описание чертежей

Предпочтительные варианты осуществления настоящего изобретения описаны далее со ссылками на прилагаемые чертежи, из которых:

Фиг.1 - блок-схема предпочтительного варианта осуществления изобретаемого кодера.

Фиг.2 - блок-схема предпочтительного варианта осуществления изобретаемого декодера.

Фиг.3A - блок-схема предпочтительной реализации средства вычисления, чтобы получить частотно-селективную дополнительную канальную информацию.

Фиг.3B - предпочтительный вариант осуществления средства вычисления, реализующего обработку объединенного стерео, такую как стереокодирование по интенсивности или стереокодирование по меткам.

Фиг.4 иллюстрирует еще один предпочтительный вариант осуществления средства вычисления дополнительной канальной информации, в котором дополнительной канальной информацией являются коэффициенты усиления.

Фиг.5 иллюстрирует предпочтительный вариант осуществления реализации декодера, когда декодер реализован как на фиг.4.

Фиг.6 иллюстрирует предпочтительную реализацию средства предоставления каналов сведения.

Фиг.7 иллюстрирует группировки исходных каналов и каналов сведения для вычисления дополнительной канальной информации для соответствующих исходных каналов.

Фиг.8 иллюстрирует еще один предпочтительный вариант осуществления изобретаемого кодера.

Фиг.9 иллюстрирует еще одну реализацию изобретаемого декодера.

Фиг.10 иллюстрирует стереодекодер предшествующего уровня техники.

Подробное описание предпочтительных вариантов осуществления

Фиг.1 иллюстрирует устройство обработки многоканального звукового сигнала 10, имеющего, по меньшей мере, три исходных канала, таких как R, L и C. Предпочтительно, исходный звуковой сигнал имеет более трех каналов, например пять каналов, в окружении объемного звучания, которое проиллюстрировано на фиг. 1. Пять каналов - это левый канал L, правый канал R, центральный канал C, левый канал объемного звучания Ls и правый канал объемного звучания Rs. Устройство согласно изобретению включает в себя средство 12 предоставления первого канала сведения Lc и второго канала сведения Rc, причем первый и второй каналы сведения извлекаются из исходных каналов. Для извлечения каналов сведения из исходных каналов существует несколько вариантов. Один вариант - извлечение каналов сведения Lc и Rc посредством матрицирования исходных каналов с помощью операции матрицирования, проиллюстрированной на фиг.6. Эта операция матрицирования выполняется во временной области.

Параметры матрицирования a, b и t выбираются таким образом, чтобы они были меньше или равны 1. Предпочтительно, значения a и b составляют 0,7 или 0,5. Общий параметр взвешивания t предпочтительно выбирается таким образом, чтобы не допустить ограничения канала.

Альтернативно, как указано на фиг.1, каналы сведения Lc и Rc также могут быть внешними. Это может быть выполнено, когда каналы сведения Lc и Rc являются результатом операции "микширования вручную". В этом случае звукооператор микширует каналы сведения самостоятельно вместо использования операции автоматического матрицирования. Звукооператор выполняет творческое микширование для получения оптимизированных каналов сведения Lc и Rc, которые обеспечивают наилучшее стереопредставление исходного многоканального звукового сигнала.

В случае внешних каналов сведения средство предоставления не выполняет операцию матрицирования, а просто переадресует внешние каналы сведения последующему средству 14 вычисления.

Средство 14 вычисления предназначено для вычисления дополнительной канальной информации, например li, lsi, ri или rsi для выбранных исходных каналов, например L, Ls, R или Rs, соответственно. В частности, средство 14 вычисления предназначено для вычисления дополнительной канальной информации, так чтобы канал сведения, при взвешивании с помощью дополнительной канальной информации приводил к аппроксимации выбранного исходного канала.

Альтернативно, или кроме того, средство вычисления дополнительной канальной информации дополнительно предназначено для вычисления дополнительной канальной информации для выбранного исходного канала, так чтобы объединенный канал сведения, включающий в себя комбинацию первого и второго канала сведения, при взвешивании с помощью вычисленной дополнительной канальной информации приводил к аппроксимации выбранного исходного канала. Чтобы показать этот признак, на чертеже проиллюстрирован сумматор 14a и средство 14b вычисления информации об объединенном канале.

Специалистам в данной области техники должно быть очевидно, что эти элементы необязательно реализованы как отдельные элементы. Наоборот, все функциональные возможности блоков 14, 14a и 14b могут быть реализованы посредством определенного процессора, которым может быть процессор общего назначения или любое другое средство выполнения требуемых функциональных возможностей.

Дополнительно, здесь следует отметить, что сигналы каналов, являющиеся выборками поддиапазонов или значениями частотной области, указываются заглавными буквами. Информация о каналах, в отличие от самих каналов, указывается строчными буквами. Дополнительная канальная информация ci - это, следовательно, дополнительная канальная информация для исходного центрального канала C.

Дополнительная канальная информация, а также каналы сведения Lc и Rc или кодированная версия Lc' и Rc', генерируемые аудиокодером 16, входят в устройство 18 форматирования выходных данных. Как правило, устройство 18 форматирования выходных данных выступает в качестве средства генерирования выходных данных, при этом выходные данные включают в себя дополнительную канальную информацию для, по меньшей мере, одного исходного канала, первого канала сведения или сигнала, извлеченного из первого канала сведения (к примеру, его кодированная версия), и второго канала сведения или сигнала, извлеченного из второго канала сведения (к примеру, его кодированная версия).

Выходные данные или выходной поток битов 20 затем может быть передан декодеру выходного потока битов или может быть сохранен или распространен. Предпочтительно, выходной поток битов 20 - это совместимый поток битов, который также может быть считан декодером меньшего масштаба, не имеющим функции многоканального расширения. Такие кодеры меньшего масштаба, к примеру, самые распространенные в современном уровне техники MP3-декодеры, просто игнорируют данные многоканального расширения, т.е. дополнительную канальную информацию. Они декодируют только первый и второй каналы сведения для выходного генерирования стереосигнала. Декодеры большего масштаба, такие как декодеры с поддержкой многоканального режима, считывают дополнительную канальную информацию и затем генерируют аппроксимацию исходных звуковых каналов для получения впечатления многоканального звука.

Фиг.8 иллюстрирует предпочтительный вариант осуществления настоящего изобретения в пятиканальном окружении объемного звучания/MP3. При этом предпочтительно записывать данные расширения объемного звучания в поле служебных данных в стандартном синтаксисе потока битов MP3, так чтобы получать поток битов "объемное звучание MP3".

Фиг.2 иллюстрирует изобретаемый декодер, выступающий в качестве средства обратной обработки входных данных, принимаемых в порту 22 входных данных. Данные, принимаемые в порту 22 входных данных - это те же данные, что выводятся в порту 20 выходных данных на фиг.1. Альтернативно, когда данные передаются не посредством проводного канала, а посредством беспроводного канала, данные, принимаемые в порту 22 входных данных, - это данные, извлекаемые из исходных данных, генерируемых кодером.

Входные данные декодера входят в устройство 24 считывания потоков данных для считывания входных данных, чтобы в итоге получить дополнительную канальную информацию 26 и левый канал 28 сведения и правый канал 30 сведения. Если входные данные включают в себя кодированные версии каналов сведения, что соответствует случаю, в котором аудиокодер 16 на фиг.1 присутствует, устройство считывания 24 потоков данных также включает в себя аудиодекодер, который адаптирован к аудиокодеру, используемому для кодирования каналов сведения. В этом случае аудиодекодер, который является частью устройства 24 считывания потоков данных, предназначен для генерирования первого канала сведения Lc и второго канала сведения Rc или, если говорить более точно, декодированной версии этих каналов. Для простоты описания различие между сигналами и их декодированными версиями делается, только если это явно указано.

Дополнительная канальная информация 26 и левый и правый каналы 28 и 30 сведения, выводимые устройством 24 считывания потоков данных, подаются в многоканальное устройство 32 восстановления для предоставления восстановленной версии 34 исходных звуковых сигналов, которые могут быть воспроизведены посредством многоканального проигрывателя 36. Если многоканальное устройство восстановления работает в частотной области, многоканальный проигрыватель 36 принимает входные данные частотной области, которые должны быть определенным образом декодированы, например, преобразованы во временную область, перед воспроизведением. С этой целью многоканальный проигрыватель 36 также может включать в себя средства декодирования.

Здесь следует отметить, что декодер меньшего масштаба имеет только устройство 24 считывания потоков данных, которое выводит только левый и правый каналы 28 и 30 сведения на стереовыход 38. Улучшенный изобретаемый декодер, тем не менее, извлекает дополнительную канальную информацию 26 и использует эту дополнительную информацию и каналы 28 и 30 сведения для восстановления восстановленных версий 34 исходных каналов с помощью многоканального устройства 32 восстановления.

Фиг.3A показывает вариант осуществления изобретаемого средства 14 вычисления для вычисления дополнительной канальной информации, с которой аудиокодер, с одной стороны, и средство вычисления дополнительной канальной информации, с другой стороны, оперируют в одном спектральном представлении многоканального сигнала. Фиг.1, тем не менее, показывает другую альтернативу, в которой аудиокодер, с одной стороны, и средство вычисления дополнительной канальной информации, с другой стороны, оперируют в различных спектральных представлениях многоканального сигнала. Когда вычислительные ресурсы не так важны, как качество звука, предпочтительна альтернатива фиг.1, поскольку могут быть использованы группы блоков фильтров, специально оптимизированные для кодирования звука и вычисления дополнительной информации. Тем не менее, когда вычислительные ресурсы представляют важность, предпочтительна альтернатива фиг. 3A, поскольку эта альтернатива требует меньшей вычислительной мощности вследствие совместного использования элементов.

Устройство, показанное на фиг.3A, предназначено для приема двух каналов A, B. Устройство, показанное на фиг.3A, работает, чтобы вычислять дополнительную информацию для канала B, с тем чтобы с помощью этой дополнительной канальной информации для выбранного исходного канала B могла быть вычислена восстановленная версия канала B из сигнала канала A. Дополнительно, устройство, показанное на фиг.3A, предназначено для формирования дополнительной канальной информации частотной области, такой как параметры для взвешивания (посредством умножения или временной обработки, как, к примеру, при кодировании BCC) спектральных значений или выборок поддиапазонов. С этой целью изобретаемое средство вычисления включает в себя средство 140a обработки методом окна и частотно-временного преобразования для получения частотного представления канала A на выходе 140b или представления частотной области канала B на выходе 140c.

В предпочтительном варианте осуществления определение дополнительной канальной информации (посредством средства 140f определения дополнительной информации) выполняется с помощью квантованных спектральных значений. В таком случае также предусмотрен квантователь 140d, который предпочтительно управляется с помощью психоакустической модели, имеющей вход 140e управления акустической моделью. Тем не менее, квантователь не требуется, когда средство 140c определения дополнительной информации использует неквантованное представление канала A для определения дополнительной канальной информации для канала B.

Если дополнительная канальная информация для канала B вычисляется посредством представления частотной области канала A и представления частотной области канала B, средство 140a обработки методом окна и частотно-временного преобразования может быть таким же, что и используемое в аудиокодере на основе группы блоков фильтров. В этом случае, когда рассматривается AAC (ISO/IEC 13818-3), средство 140a реализовано как группа блоков фильтров MDCT (MDCT = модифицированное дискретное косинусное преобразование) с функциональными возможностями 50%-ного перекрытия с суммированием.

В этом случае квантователем 140d является итеративный квантователь, например, такой, который используется при генерировании кодированных звуковых сигналов MP3 или AAC. Представление частотной области канала A, которое предпочтительно уже квантовано, в таком случае может быть непосредственно использовано для энтропийного кодирования с помощью энтропийного кодера 140g, которым может быть кодер по методу Хаффмана или энтропийный кодер, реализующий арифметическое кодирование.

При сравнении с фиг.1, вывод устройства фиг.3A - это дополнительная информация, такая как li для одного исходного канала (соответствующая дополнительной информации для B в выводе устройства 140f). Кодированный по энтропии поток битов канала A соответствует, к примеру, кодированному левому каналу сведения Lc' в выводе блока 16 на фиг.1. Из фиг.3A очевидно, что элемент 14 (фиг.1), т.е. средство вычисления для вычисления дополнительной канальной информации, и аудиокодер 16 (фиг.1) могут быть реализованы как отдельные средства или могут быть реализованы как совместно используемая версия, так чтобы оба устройства совместно использовали некоторые элементы, такие как группа блоков 140a фильтров MDCT, квантователь 140e и кодер 140g по энтропии. Естественно, если требуется другое преобразование и т.д. для определения дополнительной канальной информации, то кодер 16 и средство 14 вычисления (фиг.1) реализованы в отдельных устройствах, с тем чтобы оба элемента не использовали совместно группу блоков фильтров и т.д.

Как правило, фактический определитель для вычисления дополнительной информации (или установленное в целом средство 14 вычисления) может быть реализован как объединенный стереомодуль, показанный на фиг.3B, который работает в соответствии с какой-либо из методик объединенного стерео, таких как стереокодирование по интенсивности или стереокодирование по меткам.

В отличие от стереокодеров по интенсивности предшествующего уровня техники средство 140f определения согласно изобретению не должно вычислять объединенный канал. "Объединенный канал", или канал несущей частоты, как считается, уже существует, и это левый совместимый канал сведения Lc или правый совместимый канал сведения Rc, или объединенная версия этих каналов сведения, например, Lc + Rc. Поэтому устройство 140f согласно изобретению должно только вычислять информацию о масштабировании для масштабирования соответствующего канала сведения, с тем чтобы получать энергетические временные огибающие соответствующего выбранного исходного канала, когда канал сведения взвешивается с помощью информации масштабирования или, скажем, направляющей информации об интенсивности.

Поэтому объединенный стереомодуль 140f на фиг.3B проиллюстрирован так, что он принимает в качестве входного "объединенный" канал A, который является первым или вторым каналом сведения или комбинацией каналов сведения, и исходный выбранный канал. Этот модуль, естественно, выводит "объединенный" канал A и параметры объединенного стерео в качестве дополнительной канальной информации, с тем чтобы, используя объединенный канал A и параметры объединенного стерео, можно было вычислить аппроксимацию исходного выбранного канала B.

Альтернативно, объединенный стереомодуль 140f может быть реализован для выполнения стереокодирования по меткам.

В случае BCC объединенный стереомодуль 140f предназначен для вывода дополнительной канальной информации, так чтобы дополнительной канальной информацией были квантованные и кодированные параметры ICLD или ICTD, при этом выбранный исходный канал выступает в качестве фактического канала, который должен быть обработан, тогда как соответствующий канал сведения, используемый для вычисления дополнительной информации, такой как первый, второй или комбинация первого и второго каналов сведения, использовался в качестве опорного канала в отношении методики кодирования/декодирования BCC.

Ссылаясь на фиг.4, предоставлена простая ориентированная на энергию реализация элемента 140f. Это устройство включает в себя селектор 44 полос частот, выбирающий полосу частот из канала A и соответствующую полосу частот канала B. Затем в обеих полосах частот вычисляется энергия посредством средства 42 вычисления энергии для каждой ветви. Подробная реализация средства 42 вычисления энергии зависит от того, является ли выходной сигнал из блока 40 сигналом поддиапазона или частотными коэффициентами. В других реализациях, где вычисляются масштабные коэффициенты для полос масштабных коэффициентов, уже можно использовать масштабные коэффициенты первого и второго канала A, B в качестве значений энергии EA и EB или, по меньшей мере, в качестве оценок энергии. В устройстве 44 вычисления коэффициента усиления коэффициент усиления gB для выбранной полосы частот определяется на основе определенного правила, такого как правило определения усиления, проиллюстрированное в блоке 44 на фиг.4. При этом коэффициент усиления gB может непосредственно быть использован для взвешивания выборок частотной области или частотных коэффициентов, как, например, будет описано далее на фиг.5. С этой целью коэффициент усиления gB, который является допустимым для выбранной полосы частот, используется в качестве дополнительной канальной информации для канала B как выбранного исходного канала. Выбранный исходный канал B не передается декодеру, но представляется параметрической дополнительной канальной информацией, вычисленной средством 14 вычисления на фиг.1.

Здесь следует отметить, что не обязательно передавать значения усиления как дополнительную канальную информацию. Также достаточно передавать частотно-зависимые значения, связанные с абсолютной энергией выбранного исходного канала. В таком случае декодер должен вычислить фактическую энергию канала сведения и коэффициент усиления на основе энергии канала сведения и передаваемой энергии для канала B.

Фиг.5 показывает возможную реализацию декодера, настроенного в связи с основанным на преобразовании перцептуальным аудиокодером. В сравнении с фиг.2 функциональные возможности энтропийного кодера и обратного квантователя 50 (фиг.5) включены в блок 24 фиг.2. Функциональные возможности элементов 52a, 52b (фиг.5) частотно-временного преобразования, тем не менее, реализуются в элементе 36 фиг.2. Элемент 50 на фиг.5 принимает кодированную версию первого и второго сигнала сведения Lc' или Rc'. На выходе элемента 50 представлена, по меньшей мере, частично декодированная версия первого и второго канала сведения, которая далее называется каналом A. Канал A - это вход в селектор 54 полос частот для выбора конкретной полосы частот из канала A. Эта выбранная полоса частот взвешивается с помощью умножителя 56. Умножитель 56 принимает для умножения определенный коэффициент усиления gB, который назначен полосе частот, выбранной селектором 54 полос частот, который соответствует селектору 40 полос частот на фиг.4 на стороне кодера. На входе частотно-временного преобразователя 52a существует, наряду с другими полосами, представление доменной области канала A. На выходе умножителя 56 и, в частности, на выходе средства частотно-временного преобразования 52b имеется восстановленное представление частотной области канала B. Поэтому на выходе элемента 52a имеется представление временной области канала A, тогда как на выходе элемента 52b имеется представление временной области восстановленного канала B.

Здесь следует отметить, что в зависимости от конкретной реализации декодированный канал сведения Lc или Rc не воспроизводится в многоканальном улучшенном декодере. В таком многоканальном улучшенном декодере декодированные каналы сведения используются только для восстановления исходных каналов. Декодированные каналы сведения воспроизводятся только в стереодекодерах меньшего масштаба.

С этой целью сделана ссылка на фиг.9, которая показывает предпочтительную реализацию настоящего изобретения в окружении объемного звучания/MP3. Улучшенный поток битов объемного звучания MP3 входит в стандартный MP3-декодер 24, который выводит декодированные версии исходных каналов сведения. Эти каналы сведения затем могут быть непосредственно воспроизведены посредством низкоуровневого декодера. Альтернативно, эти два канала входят в усовершенствованное устройство 32 объединенного стереодекодирования, которое также принимает данные многоканального расширения, которые предпочтительно вводятся в поле служебных данных совместимого с MP3 потока битов.

Далее сделана ссылка на фиг.7, показывающую группировку выбранного исходного канала и соответствующего канала сведения или объединенного канала сведения. В этом отношении правый столбец табл. на фиг.7 соответствует каналу A на фиг.3A, 3B, 4 и 5, тогда как столбец в середине соответствует каналу B на этих чертежах. В левом столбце фиг.7 явно указана соответствующая дополнительная канальная информация. В соответствии с таблицей на фиг.7 дополнительная канальная информация li для исходного левого канала L вычисляется с помощью левого канала сведения Lc. Дополнительная информация о левом канале объемного звучания lsi определяется посредством исходного выбранного левого канала объемного звучания Ls, а левый канал сведения Lc - это несущая. Дополнительная информация о правом канале ri для исходного правого канала R определяется с помощью правого канала сведения Rc. Дополнительно, дополнительная канальная информация для правого канала объемного звучания Rs определяется с помощью правого канала сведения Rc в качестве несущей. Наконец, дополнительная канальная информация ci для центрального канала C определяется с помощью объединенного канала сведения, который получается посредством комбинации первого и второго канала сведения, что может быть легко вычислено в кодере и декодере и что не требует дополнительных бит для передачи.

Естественно, также можно вычислить дополнительную канальную информацию для левого канала, к примеру, на основе объединенного канала сведения или даже канала сведения, который получен посредством взвешенного сложения первого и второго каналов сведения, таких как 0,7 Lc и 0,3 Rc, пока параметры взвешивания известны декодеру или передаются надлежащим образом. Тем не менее, для большинства приложений предпочтительно извлекать только дополнительную канальную информацию для центрального канала из объединенного канала сведения, т.е. из комбинации первого и второго каналов сведения.

Чтобы показать потенциал экономии битов настоящего изобретения, представлен следующий типичный пример. В случае пятиканального звукового сигнала обычному кодеру требуется скорость передачи в 64 Кбит/с для каждого канала, составляющего общую скорость передачи 320 Кбит/с для пятиканального сигнала. Левый и правый стереосигналы требуют скорости передачи в 128 Кбит/с. Дополнительная канальная информация для одного канала составляет от 1,5 до 2 Кбит/с. Таким образом, даже в случае, когда передается дополнительная канальная информация для каждого из пяти каналов, эти дополнительные данные приводят в сумме только к 7,5-10 Кбит/с. Таким образом, изобретательская концепция позволяет передачу пятиканального звукового сигнала с помощью скорости передачи в 138 Кбит/с (в сравнении с 320 (!) Кбит/с) с хорошим качеством, поскольку декодер не использует проблематичную операцию обратного матрицирования. Возможно, даже более важным является тот факт, что изобретательская концепция является полностью обратно совместимой, поскольку каждый из существующих MP3-проигрывателей может воспроизводить первый канал сведения и второй канал сведения, для генерирования традиционного выходного сигнала.

В зависимости от применения способ обработки или обратной обработки согласно изобретению может быть реализован в аппаратных средствах или в программном обеспечении. Реализацией может быть цифровой носитель хранения данных, такой как диск или компакт-диск, имеющий электронно-читаемые управляющие сигналы, которые могут взаимодействовать с программируемой компьютерной системой, с тем чтобы выполнялся способ обработки или обратной обработки согласно изобретению. В общем, изобретение, таким образом, относится к компьютерному программному продукту, имеющему программный код, сохраненный на машиночитаемом носителе, при этом программный код адаптирован для выполнения способа согласно изобретению, когда компьютерный программный продукт выполняется на компьютере. Другими словами, изобретение, таким образом, также относится к компьютерной программе, имеющей программный код для выполнения способа, когда компьютерная программа выполняется на компьютере.

Похожие патенты RU2327304C2

название год авторы номер документа
УСТРОЙСТВО И СПОСОБ ДЛЯ ФОРМИРОВАНИЯ МНОГОКАНАЛЬНОГО ВЫХОДНОГО СИГНАЛА 2005
  • Херре Юрген
  • Фаллер Кристоф
  • Диш Саша
  • Хильперт Йоханнес
RU2361185C2
УСТРОЙСТВО И СПОСОБ СОЗДАНИЯ МНОГОКАНАЛЬНОГО ВЫХОДНОГО СИГНАЛА ИЛИ ФОРМИРОВАНИЯ НИЗВЕДЕННОГО СИГНАЛА 2005
  • Херре Юрген
  • Фаллер Кристоф
RU2329548C2
КОДЕР, МНОГОСИГНАЛЬНЫЙ ДЕКОДЕР И СООТВЕТСТВУЮЩИЕ СПОСОБЫ С ИСПОЛЬЗОВАНИЕМ ОТБЕЛИВАНИЯ СИГНАЛОВ ИЛИ ПОСТОБРАБОТКИ СИГНАЛОВ 2019
  • Фотопоулоу, Элени
  • Мультрус, Маркус
  • Дик, Саша
  • Маркович, Горан
  • Мабен, Паллави
  • Корсе, Срикантх
  • Байер, Штефан
  • Диш, Саша
  • Херре, Юрген
RU2769788C1
КОДИРОВАНИЕ И ДЕКОДИРОВАНИЕ АУДИО 2007
  • Бребарт Дирк Й.
  • Суйерс Эрик Г. П.
  • Омен Арнольдус В. Й.
RU2427978C2
УСТРОЙСТВО И СПОСОБ ДЛЯ СИНТЕЗИРОВАНИЯ ВЫХОДНОГО СИГНАЛА 2008
  • Энгдегард Йонас
  • Пурнхаген Хейко
  • Реш Барбара
  • Виллемоес Ларс
  • Фалч Корнелия
  • Херре Юрген
  • Хилперт Йоханнес
  • Хёльцер Андреас
  • Терентьев Леонид
RU2439719C2
ПОЧТИ ПРОЗРАЧНАЯ ИЛИ ПРОЗРАЧНАЯ СХЕМА МНОГОКАНАЛЬНОГО КОДЕРА/ДЕКОДЕРА 2005
  • Линдблом Йонас
RU2388176C2
ОПТИМИЗИРОВАННОЕ ПО ТОЧНОСТИ КОДИРОВАНИЕ С ПОДАВЛЕНИЕМ УПРЕЖДАЮЩЕГО ЭХО 2007
  • Брун Стефан
  • Йоханссон Ингемар
  • Талеб Аниссе
  • Энстрем Даниель
RU2425340C2
ОПТИМИЗИРОВАННОЕ ПО ТОЧНОСТИ КОДИРОВАНИЕ С ПЕРЕМЕННОЙ ДЛИНОЙ КАДРА 2004
  • Брун Стефан
  • Йоханссон Ингемар
  • Талеб Аниссе
  • Энстрем Даниель
RU2305870C2
КОДИРОВАНИЕ ЗВУКА С ИСПОЛЬЗОВАНИЕМ ДЕКОРРЕЛИРОВАННЫХ СИГНАЛОВ 2005
  • Пурнхаген Хейко
  • Энгдегард Йонас
  • Бребарт Ерун
  • Схейерс Эрик
RU2369982C2
АУДИОКОДЕР ДЛЯ КОДИРОВАНИЯ МНОГОКАНАЛЬНОГО СИГНАЛА И АУДИОДЕКОДЕР ДЛЯ ДЕКОДИРОВАНИЯ КОДИРОВАННОГО АУДИОСИГНАЛА 2016
  • Диш Саша
  • Фукс Гийом
  • Равелли Эммануэль
  • Нойкам Кристиан
  • Шмидт Константин
  • Бенндорф Конрад
  • Нидермайер Андреас
  • Шуберт Беньямин
  • Гайгер Ральф
RU2680195C1

Иллюстрации к изобретению RU 2 327 304 C2

Реферат патента 2008 года СОВМЕСТИМОЕ МНОГОКАНАЛЬНОЕ КОДИРОВАНИЕ/ДЕКОДИРОВАНИЕ

Изобретение относится к устройству и способу обработки многоканального звукового сигнала в совместимом стереоформате. При обработке многоканального звукового сигнала, имеющего, по меньшей мере, три исходных канала, предоставляют (12) первый канал сведения и второй канал сведения, которые извлекают из исходных каналов. Для выбранного исходного канала из исходных каналов вычисляют (14) дополнительную канальную информацию, так чтобы канал сведения или объединенный канал сведения, включающий в себя первый и второй канал сведения, при взвешивании с помощью дополнительной канальной информации, приводили к аппроксимации выбранного исходного канала. Дополнительная канальная информация и первый и второй канал сведения формируют выходные данные (20), которые должны быть переданы декодеру, который, в случае низкоуровневого декодера, декодирует только первый и второй каналы сведения или, в случае высокоуровневого декодера, предоставляет полный многоканальный звуковой сигнал на основе каналов сведения и дополнительной канальной информации. Технический результат - поскольку дополнительная канальная информация занимает совсем небольшое число бит и поскольку декодер не использует обратное матрицирование, получают эффективное и высококачественное многоканальное расширение для стереопроигрывателей и многоканальных проигрывателей. 5 н. и 24 з.п. ф-лы, 10 ил.

Формула изобретения RU 2 327 304 C2

1. Устройство для обработки многоканального звукового сигнала, причем многоканальный звуковой сигнал имеет, по меньшей мере, три исходных канала, содержащее

средство (12) предоставления первого канала сведения в качестве левого канала сведения и второго канала сведения в качестве правого канала сведения, причем первый и второй каналы сведения извлекаются из исходных каналов так, что левый и правый каналы сведения предоставляют стереопредставление многоканального звукового сигнала;

средство (14) вычисления дополнительной канальной информации для выбранных исходных каналов, причем средство для вычисления предназначено для вычисления дополнительной канальной информации, так чтобы канал сведения или объединенный канал сведения, включающий в себя первый и второй канал сведения, при взвешивании с помощью дополнительной канальной информации, приводил к аппроксимации выбранных исходных каналов; и

средство (18) генерирования выходных данных, причем выходные данные включают в себя дополнительную канальную информацию.

2. Устройство по п.1, в котором средство (18) генерирования предназначено для генерирования выходных данных так, чтобы выходные данные дополнительно включали в себя первый канал сведения или сигнал, извлеченный из первого канала сведения, и второй канал сведений или сигнал, извлеченный из второго канала сведения.3. Устройство по п.1 или 2, в котором средство (14) вычисления предназначено для определения дополнительной канальной информации как параметрических данных, не включающих в себя выборки временной области или спектральные значения.4. Устройство по любому из пп.1-3, в котором средство (14) вычисления предназначено для выполнения объединенного стереокодирования, с использованием канала сведения в качестве канала несущей частоты и с использованием в качестве входного канала выбранного исходного канала для генерирования параметров объединенного стерео в качестве дополнительной канальной информации для выбранного исходного канала.5. Устройство по п.3, в котором средство (14) вычисления предназначено для выполнения стереокодирования по интенсивности или стереокодирования по меткам с тем, чтобы дополнительная канальная информация представляла распределение энергии или параметры стереокодирования по меткам для выбранного исходного канала, причем канал сведения или объединенный канал сведения используются в качестве канала несущей частоты.6. Устройство по любому из пп.1-5,

в котором многоканальный звуковой сигнал включает в себя левый канал, левый канал объемного звучания, правый канал и правый канал объемного звучания,

в котором средство (12) предоставления предназначено для предоставления первого канала сведения в качестве левого канала сведения и предоставления второго канала сведения в качестве правого канала сведения, причем левый и правый каналы сведения предоставляют стереопредставление многоканального звукового сигнала, и

в котором средство (14) вычисления предназначено для

вычисления дополнительной канальной информации для левого канала как выбранного исходного канала с помощью левого канала сведения,

вычисления дополнительной канальной информации для правого канала как выбранного исходного канала с помощью правого канала сведения,

вычисления дополнительной канальной информации для левого канала объемного звучания как выбранного исходного канала с помощью левого канала сведения, и

вычисления дополнительной канальной информации для правого канала объемного звучания как выбранного исходного канала с помощью правого канала сведения.

7. Устройство по любому из пп.1-6,

в котором исходные каналы включают в себя центральный канал,

которое дополнительно включает в себя сумматор (14а) для объединения первого канала сведения и второго канала сведения для получения объединенного канала сведения; и

в котором средство вычисления дополнительной канальной информации для центрального канала как выбранного исходного канала предназначено для вычисления (14b) дополнительной канальной информации с тем, чтобы объединенный канал сведения, при взвешивании с помощью дополнительной канальной информации, приводил к аппроксимации исходного центрального канала.

8. Устройство по любому из пп.1-6, в котором средство (12) предоставления предназначено для извлечения первого канала сведения и второго канала сведения из исходных каналов с помощью первой заданной линейной взвешенной комбинации для первого канала сведения и с помощью второй заданной линейной взвешенной комбинации для второго канала сведения.9. Устройство по п.7,

в котором первая заданная линейная взвешенная комбинация задается следующим образом:

Lc=t(L+aLs+bC); или

в котором вторая заданная линейная взвешенная комбинация задается следующим образом:

Rc=t(R+aRs+bC),

где Lc - первый канал сведения, Rc - второй канал сведения, t, а и b - весовые коэффициенты меньше 1, L - исходный левый канал, С - исходный центральный канал, R - исходный правый канал, Ls - исходный левый канал объемного звучания и Rs - исходный правый канал объемного звучания.

10. Устройство по любому из пп.1-8, в котором средство (12) предоставления предназначено для приема внешних первого и второго каналов сведения.11. Устройство по любому из пп.1-10, в котором первый канал сведения и второй канал сведения являются составными каналами, состоящими из исходных каналов в различных степенях, причем средство вычисления предназначено для использования того канала сведения из обоих каналов сведения, на который большее влияние оказывает выбранный исходный канал по сравнению с другим каналом сведения, для вычисления дополнительной канальной информации.12. Устройство по любому из пп.1-11, в котором средство (18) генерирования предназначено для формирования выходных данных так, чтобы выходные данные соответствовали синтаксису выходных данных, который должен быть использован низкоуровневым декодером для обработки первого канала сведения или сигнала, извлеченного из первого канала сведения, или второго канала сведения или сигнала, извлеченного из второго канала сведения, для получения декодированного стереопредставления многоканального звукового сигнала.13. Устройство по п.12, в котором синтаксис выходных данных структурирован таким образом, чтобы он включал в себя специальное поле данных, которое должно игнорироваться низкоуровневым декодером, и при этом средство генерирования предназначено для вставки дополнительной канальной информации в специальное поле данных.14. Устройство по п.13, в котором синтаксисом является МР3-синтаксис, а специальным полем данных является поле служебных данных.15. Устройство по любому из пп.12-14, в котором средство (18) генерирования предназначено для вставки дополнительной канальной информации в выходные данные так, чтобы дополнительная канальная информация использовалась только высокоуровневым декодером, но игнорировалась низкоуровневым декодером.16. Устройство по любому из пп.2-15, которое дополнительно содержит кодер (16) для кодирования первого канала сведения для получения сигнала, извлеченного из первого канала сведения или для кодирования второго канала сведения для получения сигнала, извлеченного из второго канала сведения.17. Устройство по п.16, в котором кодер (16) является перцепционным кодером, который включает в себя средство преобразования сигнала, который должен быть кодирован в спектральном представлении, средство квантования спектрального представления с помощью психоакустической модели и средство энтропийного кодирования квантованного спектрального представления, для получения энтропийно кодированного квантованного спектрального представления как сигнала, извлеченного из первого канала сведения, или сигнала, извлеченного из второго канала сведения.18. Устройство по п.17, в котором перцепционный кодер (16) является кодером в соответствии со стандартом улучшенного аудиокодирования (ААС) MPEG-1/2 уровень III (MP3) или MPEG-2/4.19. Устройство по любому из пп.1-18, в котором средство (14) вычисления предназначено для

вычисления значения энергии сведения для канала сведения или объединенного канала сведения,

вычисления исходного значения энергии для выбранного исходного канала, и

вычисления коэффициента усиления как дополнительной канальной информации, при этом коэффициент усиления извлекается из значения энергии сведения и исходного значения энергии.

20. Устройство по любому из пп.1-19, в котором средство (14) вычисления предназначено для вычисления частотно-зависимых параметров дополнительной канальной информации с тем, чтобы для множества полос частот получать множество различных параметров дополнительной канальной информации.21. Способ обработки многоканального звукового сигнала, причем многоканальный звуковой сигнал имеет, по меньшей мере, три исходных канала, заключающийся в том, что

предоставляют (12) первый канал сведения в качестве левого канала сведения и второй канал сведения в качестве правого канала сведения, причем первый и второй каналы сведения извлекают из исходных каналов так, что левый и правый каналы сведения предоставляют стереопредставление многоканального звукового сигнала;

вычисляют (14) дополнительную канальную информацию для выбранных исходных каналов так, чтобы канал сведения или объединенный канал сведения, включающий в себя первый и второй канал сведения, при взвешивании с помощью дополнительной канальной информации, приводил к аппроксимации выбранного исходного канала; и

генерируют (18) выходные данные, причем выходные данные включают в себя дополнительную канальную информацию.

22. Устройство для обратной обработки входных данных, причем входные данные включают в себя дополнительную канальную информацию, левый канал сведения или сигнал, извлеченный из левого канала сведения, и правый канал сведения или сигнал, извлеченный из правого канала сведения, причем левый канал сведения и правый канал сведения извлекаются из, по меньшей мере, трех исходных каналов многоканального звукового сигнала и результатом при воспроизведении является стереопредставление многоканального звукового сигнала, и дополнительная канальная информация вычисляется так, чтобы канал сведения или объединенный канал сведения, включающий в себя левый канал сведения и правый канал сведения, при взвешивании с помощью дополнительной канальной информации, приводил к аппроксимации выбранного исходного канала, при этом устройство содержит

устройство (24) считывания входных данных для считывания входных данных, предназначенное для получения левого канала сведения или сигнала, извлеченного из левого канала сведения, и правого канала сведения или сигнала, извлеченного из правого канала сведения, и дополнительной канальной информации; и

многоканальное устройство (32) восстановления, предназначенное для предоставления восстановленной версии (34) исходного звукового сигнала с помощью дополнительной канальной информации и левого и правого сведения, подаваемых из устройства (24) считывания входных данных, или объединенного канала сведения, при получении аппроксимации выбранного исходного канала.

23. Устройство по п.22, дополнительно содержащее перцепциальный декодер (24) для декодирования сигнала, извлеченного из левого канала сведения, для получения декодированной версии левого канала сведения, и для декодирования сигнала, извлеченного из правого канала сведения, для получения декодированной версии правого канала сведения.24. Устройство по п.22 или 23, дополнительно содержащее сумматор для объединения левого канала сведения и правого канала сведения для получения объединенного канала сведения.25. Устройство по любому из пп.22-24,

в котором исходный звуковой сигнал включает в себя левый канал, левый канал объемного звучания, правый канал, правый канал объемного звучания и центральный канал, и

входные данные включают в себя дополнительную канальную информацию для, по меньшей мере, трех каналов из левого канала, левого канала объемного звучания, правого канала, правого канала объемного звучания и центрального канала,

при этом устройство (32) восстановления предназначено для

восстановления аппроксимации левого канала с помощью дополнительной канальной информации для левого канала и левого канала сведения,

восстановления аппроксимации левого канала объемного звучания с помощью дополнительной канальной информации для левого канала объемного звучания и левого канала сведения,

восстановления аппроксимации правого канала с помощью дополнительной канальной информации для правого канала и правого канала сведения, и

восстановления аппроксимации правого канала объемного звучания с помощью дополнительной канальной информации для правого канала объемного звучания и правого канала сведения.

26. Устройство по любому из пп.22-25, в котором устройство восстановления предназначено для восстановления аппроксимации центрального канала с помощью дополнительной канальной информации для центрального канала и объединенного канала сведения.27. Способ обратной обработки входных данных, причем входные данные включают в себя дополнительную канальную информацию, левый канал сведения или сигнал, извлеченный из левого канала сведения, и правый канал сведения или сигнал, извлеченный из правого канала сведения, причем левый канал сведения и правый канал сведения извлекают из, по меньшей мере, трех исходных каналов многоканального звукового сигнала, и при этом дополнительную канальную информацию вычисляют так, чтобы канал сведения или объединенный канал сведения, включающий в себя левый канал сведения и правый канал сведения, при взвешивании с помощью дополнительной канальной информации, приводил к аппроксимации выбранного исходного канала, заключающийся в том, что

считывают (24) входные данные для получения левого канала сведения или сигнала, извлеченного из левого канала сведения, и правого канала сведения или сигнала, извлеченного из правого канала сведения, и дополнительной канальной информации; и

восстанавливают (32) исходный звуковой сигнал с помощью дополнительной канальной информации и канала сведения, полученных на этапе считывания, или объединенного канала сведения при получении аппроксимации выбранного исходного канала.

28. Машиночитаемый носитель для обработки многоканального звукового сигнала, имеющий электронно-читаемые управляющие сигналы, взаимодействующие с программируемой компьютерной системой для выполнения способа по п.21.29. Машиночитаемый носитель для обработки многоканального звукового сигнала, имеющий электронно-читаемые управляющие сигналы, взаимодействующие с программируемой компьютерной системой для выполнения способа по п.27.

Документы, цитированные в отчете о поиске Патент 2008 года RU2327304C2

СПОСОБ ПЕРЕДАЧИ И/ИЛИ ЗАПОМИНАНИЯ ЦИФРОВЫХ СИГНАЛОВ НЕСКОЛЬКИХ КАНАЛОВ 1993
  • Эрнст Эберляйн
  • Юрген Херре
  • Бернхард Грилл
  • Карл-Хайнц Бранденбург
  • Дитер Зайтцер
RU2129336C1
US 5859826 A, 12.01.1999
RU 98121130 А, 20.09.2000
Прибор для очистки паром от сажи дымогарных трубок в паровозных котлах 1913
  • Евстафьев Ф.Ф.
SU95A1
Способ получения производных тетрациклина 1973
  • Луиджи Бернарди
  • Винченцо Коллонна
  • Роберто Ди Кастиглионе
  • Паоло Маси
SU574145A3

RU 2 327 304 C2

Авторы

Херре Юрген

Хильперт Йоханнес

Геиэрсбергер Штефан

Хельцер Андреас

Шпенгер Клаус

Даты

2008-06-20Публикация

2004-09-30Подача