ПЕРЕКРЕСТНАЯ ССЫЛКА НА РОДСТВЕННЫЕ ЗАЯВКИ
По данной заявке испрашивается приоритет Предварительной Патентной Заявки США № 61/877,189, поданной 12 сентября 2013г., которая во всей своей полноте включена в настоящее описание посредством ссылки.
ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ
Раскрываемое в данном документе изобретение в целом относится к аудио кодированию и декодированию. В частности, оно относится к аудио кодеру и аудио декодеру, выполненным с возможностью кодирования и декодирования каналов многоканальной аудиосистемы посредством выполнения множества стерео преобразований.
ПРЕДПОСЫЛКИ СОЗДАНИЯ ИЗОБРЕТЕНИЯ
Существуют методики известного уровня техники для кодирования каналов многоканальной аудиосистемы. Примером многоканальной аудиосистемы является 5.1 канальная система, содержащая центральный канал (C), левый передний канал (Lf), правый передний канал (Rf), левый пространственный канал (Ls), правый пространственный канал (Rs), и канал низкочастотных эффектов (Lfe). Существующий подход кодирования такой системы состоит в том, чтобы кодировать канал C отдельно, и выполнять объединенное стереокодирование передних каналов Lf и Rf, и объединенное стереокодирование пространственных каналов Ls и Rs. Lfe канал также кодируется отдельно и в нижеследующем всегда будет предполагаться в качестве кодируемого отдельно.
Существующий подход обладает некоторыми недостатками. Например, рассмотрим ситуацию, когда Lf канал и Ls канал содержат сходный аудио сигнал сходной громкости. Такой аудио сигнал будет звучать, как если исходит из виртуального источника звука, располагающегося между Lf и Ls громкоговорителем. Тем не менее, описанный выше подход неспособен эффективно кодировать такой аудио сигнал, поскольку он предписывает, что Lf канал должен кодироваться с Rf каналом, вместо выполнения объединенного кодирования Lf и Ls канала. Таким образом, сходства между аудио сигналами Lf и Ls громкоговорителей не могут быть использованы для того, чтобы добиться эффективного кодирования.
Таким образом, существует потребность в инфраструктуре кодирования/декодирования, которая обладает повышенной гибкостью, когда речь заходит о кодировании многоканальных систем.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
В дальнейшем, примерные варианты осуществления будут описаны более подробно и со ссылкой на сопроводительные чертежи, на которых:
Фиг. 1a иллюстрирует примерную двухканальную структуру.
Фиг. 1b и 1c иллюстрируют компоненты стереокодирования и декодирования в соответствии с примером.
Фиг. 2a иллюстрирует примерную трехканальную структуру.
Фиг. 2b и 2c иллюстрируют устройство кодирования и устройство декодирования, соответственно, для трехканальной структуры в соответствии с примером.
Фиг. 3a иллюстрирует примерную четырехканальную структуру.
Фиг. 3b и 3c иллюстрируют устройство кодирования и устройство декодирования, соответственно, для четырехканальной структуры в соответствии с примерным вариантом осуществления.
Фиг. 4a иллюстрирует примерную пятиканальную структуру.
Фиг. 4b и 4c иллюстрируют устройство кодирования и устройство декодирования, соответственно, для пятиканальной структуры в соответствии с примерным вариантом осуществления.
Фиг. 5a иллюстрирует примерную многоканальную структуру.
Фиг. 5b и 5c иллюстрируют устройство кодирования и устройство декодирования, соответственно, для многоканальной структуры в соответствии с примерным вариантом осуществления.
Фиг. 6a, 6b, 6c, 6d и 6e иллюстрируют конфигурации кодирования пятиканальной аудиосистемы в соответствии с примером.
Фиг. 7 иллюстрирует устройство декодирования в соответствии с вариантами осуществления.
ПОДРОБНОЕ ОПИСАНИЕ
В свете вышеупомянутого, цель состоит в том, чтобы предоставить устройство кодирования и устройство декодирования и ассоциированные способы, которые обеспечивают гибкое и эффективное кодирование каналов в многоканальной аудиосистеме.
I. Обзор – Кодер
В соответствии с первым аспектом, предоставляется способ кодирования, устройство кодирования и компьютерный программный продукт в многоканальной аудиосистеме.
В соответствии с примерными вариантами осуществления, предоставляется способ кодирования в многоканальной аудиосистеме, содержащей, по меньшей мере, четыре канала, содержащий этапы, на которых: принимают первую пару входных каналов и вторую пару входных каналов; подвергают первую пару входных каналов первому стереокодированию; подвергают вторую пару входных каналов второму стереокодированию; подвергают первый канал, полученный в результате первого стереокодирования, и аудиоканал, ассоциированный с первым каналом, полученным в результате второго стереокодирования, третьему стереокодированию с тем, чтобы получить первую пару выходных каналов; подвергают второй канал, полученный в результате первого стереокодирования, и второй канал, полученный в результате второго стереокодирования, четвертому стереокодированию с тем, чтобы получить вторую пару выходных каналов; и выводят первую и вторую пару выходных каналов.
Первая пара и вторая пара входных каналов соответствуют каналам, которые должны быть закодированы. Первая пара и вторая пара выходных каналов соответствуют закодированным каналам.
Рассмотрим примерную аудиосистему, содержащую Lf канал, Rf канал, Ls канал, и Rs канал. Если Lf канал и Ls канал ассоциированы с первой парой входных каналов, а Rf канал и Rs канал ассоциированы со второй парой входных каналов, вышеупомянутый примерный вариант осуществления будет подразумевать, что сначала кодируются объединенным образом Lf и Ls каналы, и кодируются объединенным образом Rf и Rs каналы. Другими словами, каналы сначала кодируются в направлении вперед-назад. Результат первого (вперед-назад) кодирования затем вновь кодируется, означая, что кодирование применяется в направлении влево-вправо.
Другая опция состоит в том, чтобы ассоциировать Lf канал и Rf канал с первой парой входных каналов, и Ls канал и Rs канал со второй парой входных каналов. Такое отображение каналов будет подразумевать, что сначала выполняется кодирование в направлении влево-вправо, за которым следует кодирование в направлении вперед-назад.
Другими словами, вышеупомянутый способ кодирования обеспечивает повышенную гибкость в отношении того, как объединенным образом кодировать каналы многоканальной системы.
В соответствии с примерными вариантами осуществления, аудиоканал, ассоциированный с первым каналом, полученным в результате второго стереокодирования, является первым каналом, полученным в результате второго стереокодирования. Такой вариант осуществления эффективен, при выполнении кодирования для четырехканальной структуры.
В соответствии с другими примерными вариантами осуществления второй канал, полученный в результате первого стереокодирования, является дополнительно кодированным перед тем, как подвергаться четвертому стереокодированию. Например, способ кодирования может дополнительно содержать этапы, на которых: принимают пятый входной канал; подвергают пятый входной канал и первый канал, полученный в результате второго стереокодирования, пятому стереокодированию; при этом аудиоканал, ассоциированный с первым каналом, полученным в результате второго стереокодирования, является первым каналом, полученным в результате пятого стереокодирования; и при этом второй канал, полученный в результате пятого стереокодирования, выводится в качестве пятого выходного канала.
Таким образом, пятый входной канал, следовательно, объединенным образом кодируется со вторым каналом, полученным в результате первого стереокодирования. Например, пятый входной канал может соответствовать центральному каналу, а второй канал, полученный в результате первого стереокодирования, может соответствовать объединенному кодированию Rf и Rs каналов или объединенному кодированию Lf и Ls каналов. Другими словами, в соответствии с примерами, центральный канал C может быть объединенным образом кодированным что касается левой стороны или правой стороны структуры каналов.
Примерные варианты осуществления, описываемые выше, относятся к аудиосистемам, содержащим четыре или пять каналов. Тем не менее, раскрываемые в данном документе принципы могут быть расширены на шесть каналов, семь каналов и т.д. В частности, дополнительная пара входных каналов может быть добавлена к четырехканальной структуре, чтобы прийти к шестиканальной структуре. Подобным образом, дополнительная пара входных каналов может быть добавлена к пятиканальной структуре, чтобы прийти к семиканальной структуре, и т.д.
В частности, в соответствии с примерными вариантами осуществления способ кодирования может дополнительно содержать этапы, на которых: принимают третью пару входных каналов; подвергают второй канал из первой пары входных каналов и первый канал из третьей пары входных каналов шестому стереокодированию; подвергают второй канал из второй пары входных каналов и второй канал из третьей пары входных каналов седьмому стереокодированию; при этом первый канал, полученный в результате шестого стереокодирования, и первый канал из первой пары входных каналов подвергаются первому стереокодированию;
при этом первый канал, полученный в результате седьмого стереокодирования, и первый канал из второй пары входных каналов подвергаются второму стереокодированию; и подвергают второй канал, полученный в результате шестого стереокодирования, и второй канал, полученный в результате седьмого стереокодирования, восьмому стереокодированию с тем, чтобы получить третью пару выходных каналов.
Вышеупомянутое обеспечивает гибкий подход добавления дополнительных пар каналов к структуре каналов.
В соответствии с примерными вариантами осуществления, первое, второе, третье и четвертое стереокодирование и пятое, шестое, седьмое и восьмое стереокодирование, если применимо, содержат выполнение стереокодирования в соответствии со схемой кодирования, включающей в себя левое-правое кодирование (LR-кодирование), суммарно-разностное кодирование (или среднее-остаточное кодирование, MS-кодирование), и улучшенное суммарно-разностное кодирование (или улучшенное среднее-остаточное кодирование, улучшенное MS-кодирование).
Это обладает преимуществом в том, что это дополнительно добавляет гибкости системе. В частности, посредством выбора разных типов схем кодирования кодирование может быть адаптировано, чтобы оптимизировать кодирование для наличных аудио сигналов.
Разные схемы кодирования будут описаны более подробно ниже. Тем не менее, вкратце, левое-правое кодирование означает, что осуществляется сквозной пропуск входных сигналов (выходные сигналы равны входным сигналам). Суммарно-разностное кодирование означает, что один из выходных сигналов является суммой входных сигналов, а другой выходной сигнал является разностью входных сигналов. Улучшенное MS-кодирование означает, что один из выходных сигналов является взвешенной суммой входных сигналов, а другой выходной сигнал является взвешенной разностью входных сигналов.
Первое, второе, третье, и четвертое стереокодирование и пятое, шестое, седьмое, и восьмое стереокодирование, если применимо, все могут применять одну и туже схему стереокодирования. Тем не менее, первое, второе, третье, и четвертое стереокодирование и пятое, шестое, седьмое, и восьмое стереокодирование, если применимо, также могут применять разные схемы стереокодирования.
В соответствии с примерными вариантами осуществления, разные схемы кодирования могут быть использованы для разных полос частот. Таким образом, кодирование может быть оптимизировано касательно аудио содержимого в разных полосах частот. Например, более усовершенствованное кодирование (в единицах количества бит, затрачиваемых при кодировании) может быть применено к полосам низких частот, к которым ухо наиболее чувствительно.
В соответствии с примерными вариантами осуществления, разные схемы кодирования могут быть использованы для разных временных кадров. Таким образом, кодирование может быть адаптировано и оптимизировано касательно аудио содержимого в разных временных кадрах.
Первое, второе, третье, четвертое и пятое, шестое, седьмое и восьмое стереокодирование, если применимо, выполняются в области модифицированного дискретного косинусного преобразования, MDCT, с критической дискретизацией. Под критической дискретизацией подразумевается то, что количество элементов дискретизации кодированных сигналов равно количеству элементов дискретизации исходных сигналов.
MDCT преобразует сигнал из временной области в область MDCT на основании последовательности окон. Помимо некоторых исключительных случаев, входные каналы преобразуются в область MDCT, используя одинаковое окно, как касательно размера окна, так и длины преобразования. Это позволяет стереокодированию применять среднее-остаточное и улучшенное MS-кодирование сигналов.
Примерные варианты осуществления также относятся к компьютерному программному продукту, содержащему компьютерно-читаемый носитель с инструкциями для выполнения любого из способов кодирования, раскрытых выше. Компьютерно-читаемый носитель может быть не временным компьютерно-читаемым носителем.
В соответствии с примерными вариантами осуществления, предоставляется устройство кодирования в многоканальной аудиосистеме, содержащей, по меньшей мере, четыре канала, содержащее: компонент приема, выполненный с возможностью приема первой пары входных каналов и второй пары входных каналов; первый компонент стереокодирования, выполненный с возможностью подвергать первую пару входных каналов первому стереокодированию;
второй компонент стереокодирования, выполненный с возможностью подвергать вторую пару входных каналов второму стереокодированию; третий компонент стереокодирования, выполненный с возможностью подвергать первый канал, полученный в результате первого стереокодирования, и аудиоканал, ассоциированный с первым каналом, полученным в результате второго стереокодирования, третьему стереокодированию с тем, чтобы получить первую пару выходных каналов; четвертый компонент стереокодирования, выполненный с возможностью подвергать второй канал, полученный в результате первого стереокодирования, и второй канал, полученный в результате второго стереокодирования, четвертому стереокодированию с тем, чтобы получить вторую пару выходных каналов; и компонент вывода, выполненный с возможностью вывода первой и второй пары выходных каналов.
Примерные варианты осуществления также предоставляют аудиосистему, содержащую устройство кодирования в соответствии с вышеупомянутым.
II. Обзор – Декодер
В соответствии со вторым аспектом, предоставляется способ декодирования, устройство декодирования, и компьютерный программный продукт в многоканальной аудиосистеме.
Второй аспект может в целом обладать точно такими же признаками и преимуществами, что и первый аспект.
В соответствии с примерными вариантами осуществления, предоставляется способ декодирования в многоканальной аудиосистеме, содержащей, по меньшей мере, четыре канала, содержащий этапы, на которых: принимают первую пару входных каналов и вторую пару входных каналов; подвергают первую пару входных каналов первому стереодекодированию; подвергают вторую пару входных каналов второму стереодекодированию; подвергают первый канал, полученный в результате первого стереодекодирования, и первый канал, полученный в результате второго стереодекодирования, третьему стереодекодированию с тем, чтобы получить первую пару выходных каналов; подвергают аудиоканал, ассоциированный со вторым каналом, полученным в результате первого стереодекодирования, и второй канал, полученный в результате второго стереодекодирования, четвертому стереодекодированию с тем, чтобы получить вторую пару выходных каналов; и выводят первую и вторую пару выходных каналов.
Первая и вторая пара входных каналов соответствуют закодированным каналам, которые должны быть декодированы. Первая и втора пара выходных каналов соответствуют декодированным каналам.
В соответствии с примерными вариантами осуществления, аудиоканал, ассоциированный со вторым каналом, полученным в результате первого стереодекодирования, может быть равен второму каналу, полученному в результате первого стереодекодирования.
Например, способ может дополнительно содержать этапы, на которых: принимают пятый входной канал; подвергают пятый входной канал и второй канал, полученный в результате первого стереодекодирования, пятому стереодекодированию; при этом аудиоканал, ассоциированный со вторым каналом, полученным в результате первого стереодекодирования, равен первому каналу, полученному в результате пятого стереодекодирования; и при этом второй канал, полученный в результате пятого стереодекодирования, выводится в качестве пятого выходного канала.
Способ декодирования может дополнительно содержать этапы, на которых: принимают третью пару входных каналов; подвергают третью пару входных каналов шестому стереодекодированию; подвергают второй канал из первой пары выходных каналов и первый канал, полученный в результате шестого стереодекодирования, седьмому стереодекодированию; подвергают второй канал из второй пары выходных каналов и второй канал, полученный в результате шестого стереодекодирования, восьмому стереодекодированию; и выводят первый канал из первой пары выходных каналов, пару каналов, полученных в результате седьмого стереодекодирования, первый канал из второй пары выходных каналов и пару каналов, полученных в результате восьмого стереодекодирования.
В соответствии с примерными вариантами осуществления, первое, второе, третье, и четвертое стереодекодирование и пятое, шестое, седьмое, и восьмое стереодекодирование, если применимо, содержит выполнение стереодекодирования в соответствии со схемой кодирования, включающей в себя левое-правое кодирование, суммарно-разностное кодирование, и улучшенное суммарно-разностное кодирование.
Разные схемы кодирования используются для разных полос частот. Разные схемы кодирования могут быть использованы для разных временных кадров.
Первое, второе, третье, четвертое и пятое, шестое, седьмое, и восьмое стереодекодирование, если применимо, предпочтительно выполняются в области модифицированного дискретного косинусного преобразования, MDCT, с критической дискретизацией. Предпочтительно, все входные каналы преобразуются в область MDCT, используя одинаковое окно, как касательно формы окна, так и длины преобразования.
Вторая пара входных каналов может иметь спектральное содержимое, соответствующее полосам частот вплоть до первого порогового значения частоты, в соответствии с чем пара каналов, полученная в результате второго стереодекодирования, равна нулю для полос частот выше первого порогового значения частоты. Например, спектральное содержимое второй пары входных каналов может быть установлено равным нулю на стороне кодера для того, чтобы уменьшить объем данных, которые должны быть переданы декодеру.
В случае, когда вторая пара входных каналов имеет только спектральное содержимое соответствующее полосам частот вплоть до первого порогового значения частоты, а первая пара входных каналов имеет спектральное содержимое, соответствующее полосам частот вплоть до второго порогового значения частоты, которое больше первого порогового значения частоты, способ может дополнительно применять методики параметрического повышающего микширования для частот выше первой частоты, чтобы компенсировать ограничение частоты второй пары входных каналов. В частности, способ может содержать этапы, на которых: представляют первую пару выходных каналов как первый сигнал суммы и первый сигнал разности, и представляют вторую пару выходных каналов как второй сигнал суммы и второй сигнал разности; расширяют первый сигнал суммы и второй сигнал суммы до диапазона частот выше второго порогового значения частоты посредством выполнения реконструкции высокой частоты; микшируют первый сигнал суммы и первый сигнал разности, при этом для частот ниже первого порогового значения частоты микширование содержит выполнение обратного суммарно-разностного преобразования первого сигнала суммы и первого сигнала разности, а для частот выше первого порогового значения частоты, микширование содержит выполнение параметрического повышающего микширования части первого сигнала суммы, соответствующей полосам частот выше первого порогового значения частоты; и микшируют второй сигнал суммы и второй сигнал разности, при этом для частот ниже первого порогового значения частоты микширование содержит выполнение обратного суммарно-разностного преобразования второго сигнала суммы и второго сигнала разности, а для частот выше первого порогового значения частоты микширование содержит выполнение параметрического повышающего микширования части второго сигнала суммы, соответствующей полосам частот выше первого порогового значения частоты.
Этапы расширения первого сигнала суммы и второго сигнала суммы до диапазона частот выше второго порогового значения частоты, микширования первого сигнала суммы и первого сигнала разности, и микширования второго сигнала суммы и второго сигнала разности предпочтительно выполняются в области квадратурного зеркального фильтра, QMF. В этом заключается отличие от первого, второго, третьего и четвертого стереодекодирования, которое, как правило, проводится в области MDCT. В соответствии с примерными вариантами осуществления, предоставляется компьютерный программный продукт, содержащий компьютерно-читаемый носитель с инструкциями для выполнения способа в виде любого из предшествующих пунктов формулы изобретения. Компьютерно-читаемый носитель может быть не временным компьютерно-читаемым носителем.
В соответствии с примерными вариантами осуществления, предоставляется устройство декодирования в многоканальной аудиосистеме, содержащей, по меньшей мере, четыре канала, содержащее: компонент приема, выполненный с возможностью приема первой пары входных каналов и второй пары входных каналов; первый компонент стереодекодирования, выполненный с возможностью подвергать первую пару входных каналов первому стереодекодированию; второй компонент стереодекодирования, выполненный с возможностью подвергать вторую пару входных каналов второму стереодекодированию; третий компонент стереодекодирования, выполненный с возможностью подвергать первый канал, полученный в результате первого стереодекодирования, и первый канал, полученный в результате второго стереодекодирования, третьему стереодекодированию с тем, чтобы получить первую пару выходных каналов; четвертый компонент стереодекодирования, выполненный с возможностью подвергать аудиоканал, ассоциированный со вторым каналом, полученным в результате первого стереодекодирования, и второй канал, полученный в результате второго стереодекодирования, четвертому стереодекодированию с тем, чтобы получить вторую пару выходных каналов; и компонент вывода, выполненный с возможностью вывода первой и второй пары выходных каналов.
В соответствии с примерными вариантами осуществления, предоставляется аудиосистема, содержащая устройство декодирования в соответствии с вышеупомянутым.
III. Обзор – Формат сигнализации
В соответствии с третьим аспектом, предоставляется формат сигнализации для указания декодеру посредством кодера конфигурации кодирования, чтобы использовать при декодировании сигнала, представляющего собой аудио содержимое многоканальной аудиосистемы, причем многоканальная аудиосистема содержащая, по меньшей мере, четыре канала, при этом упомянутые, по меньшей мере, четыре канала являются разделяемыми на разные группы в соответствии со множеством конфигураций, причем каждая группа соответствует каналам, которые кодируются объединенным образом, причем формат сигнализации содержит, по меньшей мере, два бита, указывающие одну из множества конфигураций, которая должна быть применена декодером.
В этом есть преимущество, которое состоит в том, что это обеспечивает эффективный способ сигнализации декодеру того, какую конфигурацию кодирования, среди множества возможных конфигураций кодирования, использовать при декодировании.
Конфигурации кодирования могут быть ассоциированы с идентификационным номером. По этой причине, по меньшей мере, два бита указывают одну из множества конфигураций, посредством указания идентификационного номера упомянутой одной из множества конфигураций.
В соответствии с примерными вариантами осуществления, многоканальная аудиосистема содержит пять каналов и конфигурации кодирования соответствуют: объединенному кодированию пяти каналов; объединенному кодированию четырех каналов и отдельному кодированию последнего канала; объединенному кодированию трех каналов и отдельному объединенному кодированию двух других каналов; и объединенному кодированию двух каналов, отдельному объединенному кодированию двух других каналов, и отдельному кодированию последнего канала.
В случае, когда, по меньшей мере, два бита указывают объединенное кодирование двух каналов, отдельное объединенное кодирование двух других каналов, и отдельное кодирование последнего канала, по меньшей мере, два бита могут дополнительно включать бит, указывающий на то, какие два канала должны быть кодированы объединенным образом и какие другие два канала должны быть кодированы объединенным образом.
IV. Примерные варианты осуществления
Фиг. 1a иллюстрирует структуру 100 каналов аудиосистемы, содержащую первый канал 102, который в данном случае соответствует левому громкоговорителю L, и второй канал 104, который в данном случае соответствует правому громкоговорителю R. Первый 102 и второй 104 канал могут быть подвергнуты объединенному стереокодированию и декодированию.
Фиг. 1b иллюстрирует компонент 110 стереокодирования, который может быть использован, чтобы выполнять объединенное стереокодирование первого канала 102 и второго канала 104 с Фиг. 1a. В целом, компонент 110 стереокодирования преобразует первый канал 112 (такой как первый канал 102 на Фиг. 1a), здесь обозначенный как Ln, и второй канал 114 (такой как второй канал 104 на Фиг. 1a), здесь обозначенный как Rn, в первый выходной канал 116, здесь обозначенный как An, и второй выходной канал 118, здесь обозначенный как Bn. Во время процесса кодирования, компонент 110 стереокодирования может извлекать дополнительную информацию 115, включающую в себя параметр, которая будет рассмотрен более подробно ниже. Параметр может быть разным для разных полос частот.
Компонент 110 кодирования квантует первый выходной канал 116, второй выходной канал 118, и дополнительную информацию 115 и кодирует это в форме битового потока, который отправляется соответствующему декодеру.
Фиг. 1c иллюстрирует соответствующий компонент 120 стереодекодирования. Компонент 120 стереодекодирования принимает битовый поток от устройства 110 кодирования и декодирует и деквантует первый канал 116’ An (соответствующий первому выходному каналу 116 на стороне кодера), второй канал 118’ Bn (соответствующий второму выходному каналу 118 на стороне кодера), и дополнительную информацию 115’. Компонент 120 стереодекодирования выводит первый выходной канал 112’ Ln и второй выходной канал 114’ Rn. Компонент 120 стереодекодирования может дополнительно брать дополнительную информацию 115’ в качестве ввода, которая соответствует дополнительной информации 115, которая была извлечена на стороне кодера.
Компоненты 110, 120 кодирования/декодирования могут применять разные схемы кодирования. То, какую схему кодирования применять, может быть просигнализировано компоненту 120 декодирования посредством компонента 110 кодирования в дополнительной информации 115. Компонент 110 кодирования решает, какую из трех разных схем кодирования, описываемых ниже, использовать. Данное решение является адаптивным к сигналу и, следовательно, может варьироваться по времени от кадра к кадру. Кроме того, оно даже может варьироваться между разными полосами частот. Фактический процесс принятия решения в кодере довольно сложен, и, как правило, учитывает эффекты квантования/кодирования в области MDCT, как впрочем и аспекты относящиеся к восприятию и затраты на дополнительную информацию.
В соответствии с первой схемой кодирования, именуемой в данном документе как левое-правое кодирование «LR-кодирование» входные и выходные каналы компонентов 110 и 120 стерео преобразования связаны в соответствии со следующими выражениями:
Ln = An; Rn = Bn.
Другими словами, LR-кодирование подразумевает лишь сквозной пропуск входных каналов. Такое кодирование может быть полезно, если входные каналы очень разные.
В соответствии со второй схемой кодирования, именуемой в данном документе как среднее-остаточное кодирование (или суммарно-разностное кодирование) «MS-кодирование» входные и выходные каналы компонентов 110 и 120 стереокодирования/декодирования связаны в соответствии со следующими выражениями:
Ln = (An + Bn); Rn = (An – Bn).
С точки зрения кодера, соответствующими выражениями являются:
An = 0.5(Ln + Rn); Bn = 0.5(Ln – Rn).
Другими словами, MS-кодирование задействует вычисление суммы и разности входных каналов. По этой причине канал An (первый выходной канал 116 на стороне кодера, и первый входной канал 116’ на стороне декодера) можно рассматривать как средний-сигнал (суммарный-сигнал) первого и второго каналов Ln и Rn, а канал Bn можно рассматривать как остаточный-сигнал (разностный-сигнал) первого и второго каналов Ln и Rn. MS-кодирование может быть полезно, если входные каналы Ln и Rn сходны касательно формы сигнала, как, впрочем, и громкости, поскольку тогда остаточный-сигнал Bn будет близок к нулю. В такой ситуации источник звука звучит, как если бы он располагался в середине между первым каналом 102 и вторым каналом 104 на Фиг. 1a.
Схема среднего-остаточного кодирования может быть обобщена третьей схемой кодирования, именуемой в данном документе как «улучшенное MS-кодирование» (или улучшенное суммарно-разностное кодирование). В улучшенном MS-кодировании, входные и выходные каналы компонентов 110 и 120 стереокодирования/декодирования связаны в соответствии со следующими выражениями:
Ln = (1 + α)An + Bn; Rn = (1 - α)An – Bn,
где α является параметром, который может формировать часть дополнительной информации 115, 115’. Уравнения выше описывают процесс с точки зрения декодера, т.е., переходя от An, Bn к Ln, Rn. Также в данном случае сигнал An может представляться в качестве среднего-сигнала, а сигнал Bn в качестве модифицированного остаточного-сигнала. В особенности, для α = 0, схема улучшенного MS-кодирования вырождается в среднее-остаточное кодирование. Улучшенное MS-кодирование может быть полезно, чтобы кодировать сигналы, которые сходны, но с разной громкостью. Например, если левый канал 102 и правый канал 104 на Фиг. 1a содержат один и тот же сигнал, но громкость выше в левом канале 102, источник звука будет звучать, как если бы он располагался ближе к левой стороне, как иллюстрируется элементом 105 на Фиг. 1a. В такой ситуации, среднее-остаточное кодирование будет генерировать ненулевой остаточный-сигнал. Тем не менее, посредством выбора надлежащего значения α между нулем и единицей, модифицированный остаточный-сигнал Bn может быть равен или близок к нулю. Подобным образом, значения α между нулем и минус единицей соответствуют случаям, где громкость выше в правом канале.
В соответствии с вышеупомянутым, компоненты 110 и 120 стереокодирования/декодирования могут таким образом быть сконфигурированы, чтобы применять разные схемы стереокодирования. Компоненты 110 и 120 стереокодирования/декодирования также могут применять разные схемы стереокодирования для разных полос частот. Например, первая схема стереокодирования может быть применена для частот вплоть до первой частоты, а вторая схема стереокодирования может быть применена для полос частот выше первой частоты. Более того, параметр α может быть частотно-зависимым.
Компоненты 110 и 120 стереокодирования/декодирования выполнены с возможностью оперирования сигналами в области модифицированного дискретного косинусного преобразования (MDCT) с критической дискретизацией, которая является областью перекрывающейся последовательности окон. Под критической дискретизацией подразумевается то, что количество элементов дискретизации в сигнале частотной области равно количеству элементов дискретизации в сигнале временной области. В случае, когда компоненты 110 и 120 стереокодирования/декодирования выполнены с возможностью применения схемы LR-кодирования, входные каналы 112 и 114 могут быть кодированными, используя разные окна. Тем не менее, если компоненты 110 и 120 стереокодирования/декодирования выполнены с возможностью применения любого из MS-кодирования или улучшенного MS-кодирования, входные каналы должны быть кодированными, используя одинаковое окно касательно формы окна, как, впрочем, и длины преобразования.
Компоненты 110 и 120 стереокодирования/декодирования могут быть использованы в качестве строительных блоков для того, чтобы реализовать гибкие схемы кодирования/декодирования для аудиосистем, содержащих более двух каналов. Чтобы проиллюстрировать принципы, трехканальная структура 200 многоканальной аудиосистемы иллюстрируется на Фиг. 2a. Аудиосистема содержит первый аудиоканал 202 (здесь левый канал L), второй аудиоканал 204 (здесь правый канал R), и третий канал 206 (здесь центральный канал C).
Фиг. 2b иллюстрирует устройство 210 кодирования для кодирования трех каналов 202, 204, и 206 с Фиг. 2a. Устройство 210 кодирования содержит первый компонент 210a стереокодирования и второй компонент 210b стереокодирования, которые сгруппированы в каскад.
Устройство 210 кодирования принимает первый входной канал 212 (например, соответствующий первому каналу 202 с Фиг. 2a), второй входной канал 214 (например, соответствующий второму каналу 204 с Фиг. 2a), и третий входной канал 216 (например, соответствующий третьему каналу 206 с Фиг. 2a). Первый канал 212 и третий входной канал 216 вводятся в первый компонент 210a стереокодирования, который выполняет стереокодирование в соответствии с любой из схем стереокодирования, описанных выше. В результате, первый компонент 210a стереокодирования выводит первый промежуточный выходной канал 213 и второй промежуточный выходной канал 215. Используемый в данном документе промежуточный выходной канал относится к результату стереокодирования или стереодекодирования. Промежуточный выходной канал, как правило, не является физическим сигналом в том смысле, что он обязательно генерируется или может быть измерен в конкретной реализации. Наоборот, промежуточные выходные каналы используются в данном документе, чтобы проиллюстрировать то, каким образом разные компоненты стереокодирования или декодирования могут быть сгруппированы и/или организованы относительно друг друга. Промежуточный означает, что выходные каналы 213 и 215 представляют собой промежуточные стадии устройства 210 кодирования, как противоположность выходным каналам, которые представляют собой закодированные каналы. Например, первый промежуточный выходной канал 213 может быть средним-сигналом, а второй промежуточный выходной канал 215 может быть модифицированным остаточным-сигналом.
Со ссылкой на примерную структуру 200 каналов на Фиг. 1a, обработка, выполняемая посредством первого компонента 210a стереокодирования, может, например, соответствовать объединенному стереокодированию 207 левого канала 202 и центрального канала 206. В случае сходных сигналов в левом канале 202 и центральном канале 206 с разными громкостями, такое объединенное стереокодирование может быть эффективным, чтобы захватить виртуальный источник 205 звука, расположенный между левым каналом 202 и центральным каналом 206.
Первый промежуточный выходной канал 213, и второй входной канал 214 затем вводятся во второй компонент 210b стереокодирования, который выполняет стереокодирование в соответствии с любой из схем стереокодирования, описанных выше. Второй компонент 210b стереокодирования выводит первый выходной канал 217 и второй выходной канал 218. Со ссылкой на примерную структуру каналов на Фиг. 1a, обработка, выполняемая посредством второго компонента 210b стереокодирования, может, например, соответствовать объединенному стереокодированию 208 правого канала 204 и среднего-сигнала левого канала 292 и центрального канала 206, сгенерированного посредством первого компонента 210a стереокодирования.
Устройство 210 кодирования выводит первый выходной канал 217, второй выходной канал 218 и второй промежуточный канал 215 в качестве третьего выходного канала. Например, первый выходной канал 217 может соответствовать среднему-сигналу, а второй и третий выходные каналы 218 и 215, соответственно, могут соответствовать модифицированным остаточным-сигналам.
Устройство 210 кодирования квантует и кодирует выходные сигналы вместе с дополнительной информацией в битовый поток, который должен быть передан декодеру.
Соответствующее устройство 220 декодирования иллюстрируется на Фиг. 2c. Устройство 220 декодирования содержит первый компонент 220b стереодекодирования и второй компонент 220a стереодекодирования. Первый компонент 220b стереодекодирования в устройстве 220 декодирования выполнен с возможностью применения схемы кодирования, которая является обратной схеме кодирования второго компонента 210b стереокодирования на стороне кодера. Подобно, второй компонент 220a стереодекодирования в устройстве 220 декодирования выполнен с возможностью применения схемы кодирования, которая является обратной схеме кодирования первого компонента 210a стереокодирования на стороне кодера. Схемы кодирования для применения на стороне декодера могут быть указаны посредством сигнализации в битовом потоке, который отправляется от устройства 210 кодирования к устройству 220 декодирования. Это может, например, включать в себя то, какое из LR-кодирования, MS-кодирования или улучшенного MS-кодирования должны применять компоненты 220b и 220a стереодекодирования. Может дополнительно присутствовать один или более биты, которые указывают на то, должен ли центральный канал быть кодированным совместно с левым каналом или правым каналом.
Устройство 220 декодирования принимает, декодирует и деквантует битовый поток, который передается от устройства 210 кодирования. Таким образом, устройство 220 декодирования принимает первый входной канал 217’ (соответствующий первому выходному каналу устройства 210 кодирования), второй входной канал 218’ (соответствующий второму выходному каналу устройства 210 кодирования), и третий входной канал 215’ (соответствующий третьему выходному каналу устройства 210 кодирования). Первый и второй входные каналы 217’ и 218’ вводятся в первый компонент 220b стереодекодирования. Первый компонент 220b стереодекодирования выполняет стереодекодирование в соответствии со схемой кодирования обратной той, что была применена в компоненте 210b стереокодирования на стороне кодера. В качестве ее результата, первый промежуточный выходной канал 213’ и второй промежуточный выходной канал 214’ выводятся из первого компонента 220b стереодекодирования. Далее первый промежуточный выходной канал 213’ и третий входной канал 215’ вводятся во второй компонент 220a стереодекодирования. Второй компонент 220a стереодекодирования выполняет стереодекодирование его входных сигналов в соответствии со схемой кодирования, которая является обратной схеме кодирования, примененной в первом компоненте 210a стереокодирования на стороне кодера. Второй компонент 220a стереодекодирования выводит первый выходной канал 212’ (соответствующий первому входному сигналу 212 на стороне кодера), второй выходной канал 214’ (соответствующий второму входному сигналу 214 на стороне кодера), и второй промежуточный выходной канал 214’ в качестве третьего выходного канала 216’ (соответствующего третьему входному сигналу 216 на стороне кодера).
В приведенных выше примерах, первый входной канал 212 может соответствовать левому каналу 202, второй входной канал 214 может соответствовать правому каналу 204, и третий входной канал 216 может соответствовать центральному каналу 206. Тем не менее, следует отметить, что первый, второй и третий входные каналы 212, 214, 216, могут соответствовать каналам 202, 204, и 206 с Фиг. 2a в соответствии с любой перестановкой. Таким образом, устройства 210, 220 кодирования и декодирования предоставляют очень гибкую схему для того, каким образом кодировать/декодировать три канала 202, 204, и 206 с Фиг. 2a. Более того, гибкость еще более увеличивается тем, что схемы кодирования компонентов 210a и 210b стереокодирования могут быть выбраны любым образом. Например, оба компонента 210a и 210b стереокодирования могут применять одну и туже схему кодирования, такую как улучшенное MS-кодирование, или разные схемы кодирования. Кроме того, схемы кодирования могут варьироваться в зависимости от полосы частот, которая должна быть кодирована, и/или в зависимости от временного кадра, который должен быть кодирован. Схема кодирования для применения может быть просигнализирована в битовом потоке от устройства 210 кодирования к устройству 220 декодирования в качестве дополнительной информации.
Примерный вариант осуществления теперь будет описан со ссылкой на Фиг. 3a-c. Фиг. 3a иллюстрирует четырехканальную структуру 300 многоканальной аудиосистемы. Аудиосистема содержит первый канал 302, здесь соответствующий левому переднему громкоговорителю Lf, второй канал 304, здесь соответствующий правому переднему громкоговорителю Rf, третий канал 306, здесь соответствующий левому пространственному громкоговорителю Ls, и четвертый канал 308, здесь соответствующий правому пространственному громкоговорителю Rs.
Фиг. 3b и 3c иллюстрируют устройство 310 кодирования и устройство 320 декодирования, соответственно, которые могут быть использованы, чтобы кодировать/декодировать четыре канала 302, 304, 306, и 308 с Фиг. 3a.
Устройство 310 кодирования содержит первый компонент 310a стереокодирования, второй компонент 310b стереокодирования, третий компонент 310c стереокодирования, и четвертый компонент 310d стереокодирования. Теперь будет объяснена работа устройства 310 кодирования.
Устройство 310 кодирования принимает первую пару входных каналов. Первая пара входных каналов содержит первый входной канал 312 (который, например, может соответствовать Lf каналу 302 с Фиг. 3a) и второй входной канал 316 (который, например, может соответствовать Ls каналу 306 с Фиг. 3a). Устройство 310 кодирования дополнительно принимает вторую пару входных каналов. Вторая пара входных каналов содержит первый входной канал 314 (который, например, может соответствовать Rf каналу 304 с Фиг. 3a) и второй входной канал 318 (который, например, может соответствовать RS каналу 308 с Фиг. 3a). Первая и вторая пара входных каналов 312, 316, 314, и 318, как правило, представлены в форме спектра MDCT.
Первая пара входных каналов 312, 316 вводится в первый компонент 310a стереокодирования, который подвергает первую пару входных каналов 312, 316 стереокодированию в соответствии с любой из ранее описанных схем стереокодирования. Первый компонент 310a стереокодирования выводит первую пару промежуточных выходных каналов, соответствующих первому каналу 313 и второму каналу 317. В качестве примера, если применяется MS-кодирование или улучшенное MS-кодирование, первый канал 313 может соответствовать среднему-сигналу, а второй канал 317 может соответствовать модифицированному остаточному-сигналу.
Подобным образом, вторая пара входных каналов 314, 318 вводится во второй компонент 310b стереокодирования, который подвергает вторую пару входных каналов 314, 318 стереокодированию в соответствии с любой из ранее описанных схем стереокодирования. Второй компонент 310b стереокодирования выводит вторую пару промежуточных выходных каналов, содержащих первый канал 315 и второй канал 319. В качестве примера, если применяется MS-кодирование или улучшенное MS-кодирование, первый канал 315 может соответствовать среднему-сигналу, а второй канал 319 может соответствовать модифицированному остаточному-сигналу.
Рассматривая структуру каналов с Фиг. 3a, обработка, применяемая посредством первого компонента 310a стереокодирования, может соответствовать выполнению объединенного стереокодирования 303 Lf канала 302 и Ls канала 306. Подобным образом, обработка, выполняемая посредством второго компонента 310b стереокодирования, может соответствовать выполнению объединенного стереокодирования 305 Rf канала 304 и Rs канала 308.
Первый канал 313 из первой пары промежуточных выходных каналов и первый канал 315 из второй пары промежуточных выходных каналов затем вводятся в третий компонент 310c стереокодирования. Третий компонент 310c стереокодирования подвергает каналы 313 и 315 стереокодированию в соответствии с любой из вышеупомянутых схем стереокодирования. Третий компонент 310c стереокодирования выводит первую пару выходных каналов, состоящую из первого выходного канала 322 и второго выходного канала 324.
Подобным образом, второй канал 317 из первой пары промежуточных выходных каналов и второй канал 319 из второй пары промежуточных выходных каналов вводятся в четвертый компонент 310d стереокодирования. Четвертый компонент 310d стереокодирования подвергает каналы 317 и 319 стереокодированию в соответствии с любой из вышеупомянутых схем стереокодирования. Четвертый компонент 310d стереокодирования выводит вторую пару выходных каналов, состоящую из первого выходного канала 326 и второго выходного канала 328.
Вновь рассматривая структуру каналов на Фиг. 3a, обработка, выполняемая посредством третьего и четвертого компонентов 310c и 310d стереокодирования, может походить на объединенное стереокодирование 307 левой и правой стороны структуры каналов. В качестве примера, если первые каналы 313 и 315 из первой и второй пары промежуточных выходных каналов, соответственно, являются средними-сигналами, третий компонент 310c стереокодирования выполняет объединенное стереокодирование средних-сигналов. Подобным образом, если вторые каналы 317 и 319 из первой и второй пары промежуточных выходных каналов, соответственно, являются (модифицированными) остаточными-сигналами, третий компонент 310c стереокодирования выполняет объединенное стереокодирование (модифицированных) остаточных-сигналов. В соответствии с примерными вариантами осуществления, (модифицированные) остаточные-сигналы 317 и 319 могут быть установлены равными нулю для более высоких диапазонов частот (с требуемой компенсацией энергии для средних-сигналов 313 и 315), как например для частот выше определенного порогового значения частоты. В качестве примера, пороговое значение частоты может быть 10кГц.
Устройство 310 кодирования квантует и кодирует выходные сигналы 322, 324, 326, 328, чтобы сгенерировать битовый поток, который отправляется устройству декодирования.
Теперь обращаясь к Фиг. 3c, иллюстрируется соответствующее устройство 320 декодирования. Устройство 320 декодирования содержит первый компонент 320c стереодекодирования, второй компонент 320d стереодекодирования, третий компонент 320а стереодекодирования и четвертый компонент 320b стереодекодирования. Теперь будет объяснена работа устройства 320 декодирования.
Устройство 320 декодирования принимает, декодирует и деквантует битовый поток, который принимается от устройства 310 кодирования. Таким образом, устройство 320 декодирования принимает первую пару входных каналов, состоящую из первого канала 322’ (соответствующего выходному каналу 322 с Фиг. 3b) и второго канала 324’ (соответствующего выходному каналу 324 с Фиг. 3b). Устройство 320 декодирования дополнительно принимает вторую пару входных каналов, состоящую из первого канала 326’ (соответствующего выходному каналу 326 с Фиг. 3b) и второй канал 328’ (соответствующий выходному каналу 328 с Фиг. 3b). Первая и вторая пары входных каналов, как правило, в форме спектра MDCT.
Первая пара входных каналов 322’, 324’ вводится в первый компонент 320c стереодекодирования, где она подвергается стереодекодированию в соответствии со схемой стереокодирования, которая является обратной схеме стереокодирования, применяемой посредством третьего компонента 310c стереокодирования на стороне кодера. Первый компонент 320c стереодекодирования выводит первую пару промежуточных каналов, состоящую из первого канала 313’ и второго канала 315’.
Аналогичным образом вторая пара входных каналов 326’, 328’ вводится во второй компонент 320d стереодекодирования, который применяет схему стереокодирования, которая является обратной схеме стереокодирования, применяемой посредством четвертого компонента 310d стереокодирования на стороне кодера. Второй компонент 320d стереодекодирования выводит вторую пару промежуточных каналов, состоящую из первого канала 317’ и второго канала 319’.
Первые каналы 313’ и 317’ из первой и второй пар промежуточных выходных каналов затем вводятся в третий компонент 320a стереодекодирования, который применяет схему стереокодирования, которая является обратной схеме стереокодирования, применяемой в первом компоненте 310a стереокодирования на стороне кодера. Третий компонент 320a стереодекодирования тем самым генерирует первую пару выходных каналов, содержащую выходной канал 312’ (соответствующий входному каналу 312 на стороне кодера) и выходной канал 316’ (соответствующий входному каналу 316 на стороне кодера).
Подобным образом вторые каналы 315’ и 319’ из первой и второй пар промежуточных выходных каналов вводятся в четвертый компонент 320b стереодекодирования, который применяет схему стереокодирования, которая является обратной схеме стереокодирования, применяемой во втором компоненте 310b стереокодирования на стороне кодера. Таким образом, третий компонент 320a стереодекодирования генерирует вторую пару выходных каналов, содержащую выходной канал 312’ (соответствующий входному каналу 312 на стороне кодера) и выходной канал 316’ (соответствующий входному каналу 316 на стороне кодера).
В приведенных выше примерах, первый входной канал 312 соответствует Lf каналу 302, второй входной канал 316 соответствует Ls каналу 306, третий входной канал 314 соответствует Rf каналу 304, и четвертый канал соответствует Rs каналу 308. Тем не менее, в равной степени возможна любая перестановка каналов 302, 304, 306, и 308 с Фиг. 3a касательно входных каналов 312, 314, 316, и 318 с Фиг. 3b. Таким образом, устройства 310 и 320 кодирования/декодирования составляют гибкую инфраструктуру для выбора того, какие каналы кодировать парно и в каком порядке. Выбор может, например, быть основан на рассмотрениях, которые относятся к схожестям между каналами.
Дополнительная гибкость добавляется, так как могут быть выбраны схемы кодирования, применяемые компонентами 310a, 310b, 310c, 310d стереокодирования. Схемы кодирования предпочтительно выбираются таким образом, что общий объем данных, который должен быть передан от кодера к декодеру, минимизируется. Выбор схем кодирования, которые должны использоваться разными компонентами 320a-d стереодекодирования на стороне декодера, может быть просигнализирован устройству 320 декодирования посредством устройства 310 кодирования в качестве дополнительной информации (смотри элементы 115, 115’ Фиг. 1b-c). Компоненты 301a, 310b, 310c, 310d стерео преобразования могут таким образом применять разные схемы кодирования. Тем не менее, в некоторых вариантах осуществления все компоненты 310a, 310b, 310c, 310d стерео преобразования применяют одну и ту же схему стерео преобразования, например, схему улучшенного MS-кодирования.
Компоненты 310a, 310b, 310c, 310d стереокодирования могут дополнительно применять разные схемы стереокодирования для разных полос частот. Более того, разные схемы стереокодирования могут быть применены для разных временных кадров.
Как рассмотрено выше, компоненты 310a-d и 320a-d стереокодирования и декодирования работают в области MDCT с критической дискретизацией. Выбор окна будет ограничен схемами стереокодирования, которые применяются. Более подробно, если компонент 310a-d стереокодирования применяет MS-кодирование или улучшенное MS-кодирование, требуется, чтобы его входные сигналы были кодированы, используя одно и то же окно, как касательно формы окна, так и длины преобразования. Таким образом, в некоторых вариантах осуществления все из входных сигналов 312, 314, 316, и 318 кодируются, используя одно и то же окно.
Со ссылкой на Фиг. 4a-c теперь будет описан примерный вариант осуществления. Фиг. 4a иллюстрирует пятиканальную структуру 400 аудиосистемы. Подобно четырехканальной структуре 300, рассмотренной со ссылкой на Фиг. 3a, пятиканальная структура содержит первый канал 402, второй канал 404, третий канал 406, и четвертый канал 408, здесь соответствующие Lf громкоговорителю, Rf громкоговорителю, Ls громкоговорителю и Rs громкоговорителю, соответственно. В дополнение, пятиканальная структура 400 содержит пятый канал 409, соответствующий центральному громкоговорителю C.
Фиг. 4b иллюстрирует устройство 410 кодирования, которое, например, может быть использовано, чтобы кодировать пять каналов пятиканальной структуры с Фиг. 4a. Устройство 410 кодирования на Фиг. 4b отличается от устройства 310 кодирования на Фиг. 3a тем, что оно дополнительно содержит пятый компонент 410e стереокодирования. Дополнительно, во время работы, устройство 410 кодирования принимает пятый входной канал 419 (который, например, может соответствовать центральному каналу 409 на Фиг. 4a). Пятый входной канал 419 и первый канал 317 из второй пары промежуточных выходных каналов вводятся в пятый компонент 410e стереокодирования, который выполняет стереокодирование в соответствии с любой из описанных выше схем стереокодирования. Пятый компонент 410e стереокодирования выводит третью пару промежуточных выходных каналов, состоящую из первого канала 417 и второго канала 421. Первый канал 417 из третьей пары промежуточных выходных каналов и первый канал 313 из первой пары промежуточных каналов затем вводятся в третий компонент 310c стереокодирования для того, чтобы сгенерировать первую пару выходных каналов 422, 424. Устройство 410 кодирования выводит пять выходных каналов, а именно первую пару выходных каналов 422, 424, второй канал 421 из третьей промежуточной пары выходных каналов, выведенной из пятого компонента 410e стереокодирования, и вторую пару выходных каналов 326, 328, являющуюся выводом четвертого компонента 310d стереокодирования.
Выходные каналы 422, 424, 421, 326, 328 квантуются и кодируются для того, чтобы сгенерировать битовый поток, который должен быть передан соответствующему устройству декодирования.
Рассматривая пятиканальную структуру на Фиг. 4a и отображая Lf канал 402 во входном канале 312, Ls канал 406 во входном канале 316, C канал на входном канале 419, Rf канал во входном канале 314, и Rs канал во входном канале 318, получается следующая реализация: Во-первых, первый и второй компоненты 310a и 310b стереокодирования выполняют объединенное стереокодирование Lf и Ls канала, и Rf и Rs канала, соответственно. Во-вторых, пятый компонент 410e стереокодирования выполняет объединенное стереокодирование центрального канала C с результатом объединенного кодирования Rf и Rs каналов. В-третьих, третий и четвертый компоненты 310c и 310d стереокодирования выполняют объединенное стереокодирование между левой и правой стороной структуры 400 каналов. В соответствии с одним примером, если компоненты 310a и 310b установлены, чтобы осуществлять сквозной пропуск, т.е., чтобы применять LR-кодирование, устройство 410 кодирования кодирует три передних канала C, Lf, Rf объединенным образом, и два пространственных канала Ls и Rs будут кодированы объединенным образом. Тем не менее, как рассмотрено в связи с предыдущими вариантами осуществления, отображение пяти каналов в структуре 400 каналов во входных каналах 312, 314, 316, 318, 419 может быть выполнено в соответствии с любой перестановкой. Например, центральный канал 409 может быть объединенным образом кодирован с левой стороной структуры каналов вместо правой стороны структуры каналов. Кроме того, следует отметить, что если пятый компонент 410e стереокодирования выполняет LR-кодирование, т.е. осуществляет сквозной пропуск своих входных сигналов, устройство 410 кодирования выполняет объединенное кодирование входных каналов 312, 314, 316, 318 подобно устройству 310 кодирования, и отдельное кодирование входного канала 419.
Фиг. 4c иллюстрирует устройство 420 декодирования, которое соответствует устройству 410 кодирования. В сравнении с устройством 320 декодирования на Фиг. 3c, устройство 420 декодирования содержит пятый компонент 420e стереодекодирования. В дополнение к первой паре входных каналов 422’, 424’ и второй паре входных каналов 326’, 328’, устройство 420 декодирования принимает пятый входной канал 421’, который соответствует выходному каналу 421 стороны кодера. После того, как подвергают первую пару входных каналов 422’, 424’ стереодекодированию в первом компоненте 320a стереодекодирования, второй выходной канал 417’ первого компонента 320a стереодекодирования и пятый входной канал 421 вводятся в пятый компонент 420e стереодекодирования. Пятый компонент 420e стереодекодирования применяет схему стереокодирования, которая является обратной схеме стереокодирования, применяемой посредством пятого компонента 410e стереокодирования на стороне кодера. Пятый компонент 420e стереодекодирования выводит третью пару промежуточных выходных каналов, состоящую из первого канала 315’ и второго канала 419’. Первый канал 315’ затем, совместно со вторым каналом 319’ из второй пары промежуточных выходных каналов, вводится в четвертый компонент 320d стереодекодирования. Устройство 420 декодирования выводит выходные каналы 312’, 316’ третьего компонента 320c стереодекодирования, второй канал 419’ из третьей пары промежуточных выходных каналов, и выходные каналы 314’, 318’ четвертого компонента 320d стереодекодирования.
В вышеупомянутом, концепция промежуточных выходных каналов была использована, чтобы объяснить, каким образом компоненты стереокодирования/декодирования могут быть сгруппированы или организованы относительно друг друга. Тем не менее, как дополнительно рассмотрено выше, промежуточный выходной канал относится лишь к результату стереокодирования или стереодекодирования. В частности, промежуточный выходной канал, как правило, не является физическим сигналом в том смысле, что он обязательно генерируется или может быть измерен в практической реализации. Теперь будут объяснены примеры реализаций, которые основаны на матричных операциях.
Схемы кодирования/декодирования, описанные касательно Фиг. 3a-c (четырехканальный случай) и Фиг. 4a-c (пятиканальный случай) могут быть реализованы посредством выполнения матричных операций. Например, первый компонент 320c декодирования может быть ассоциирован с первой 2×2 матрицей A1, второй компонент 320d декодирования может быть ассоциирован со второй 2×2 матрицей B1, третий компонент 320a декодирования может быть ассоциирован с третьей 2×2 матрицей A2, четвертый компонент 320b декодирования может быть ассоциирован с четвертой 2×2 матрицей B2, и пятый компонент 420e декодирования может быть ассоциирован с пятой 2×2 матрицей A. Соответствующие компоненты 310a, 310b, 410e, 310c, 310d кодирования могут подобным образом быть ассоциированы с 2×2 матрицами, которые являются обратными соответствующим матрицам на стороне декодера.
В общем случае матрицы определяются следующим образом:
Элементы вышеупомянутых матриц зависят от применяемой схемы кодирования (LR-кодирование, MS-кодирование, улучшенное MS-кодирование). Например, для LR-кодирования, соответствующая 2×2 матрица равна единичной матрице, т.е.
Для MS-кодирования соответствующая 2×2 матрица следует из:
Для улучшенного MS-кодирования соответствующая 2×2 следует из:
Схема кодирования, которая должна быть применена, сигнализируется от кодера декодеру в качестве дополнительной информации.
Теперь будет раскрыто некоторое количество разных примеров. В целях этих примеров, каналы 312, 312’ отождествляются с Lf каналом 402, каналы 316, 316’ отождествляются с Ls каналом 406, канал 419 отождествляется с C каналом 409, каналы 314, 314’ отождествляются с Rf каналом 404, и каналы 318, 318’ отождествляются с Rs каналом 408. Более того, каналы 422’, 424’, 421’, 326’ и 328’ будут обозначены посредством и , соответственно.
Пример 1. Объединенное кодирование четырех каналов и отдельное кодирование центрального канала
В соответствии с данным примером, Lf, Ls, Rf, и Rs каналы кодируются объединенным образом, а C канал является отдельно кодированным. Для иллюстрации такой конфигурации кодирования смотри, например, Фиг. 6d. Для того, чтобы кодировать Lf, Ls, Rf, и Rs каналы объединенным образом, спектры MDCT, представляющие собой эти каналы, должны быть кодированными с общим окном касательно формы окна и длины преобразования.
Для того чтобы добиться отдельного кодирования центрального канала, компонент 420e декодирования устанавливается, чтобы осуществлять сквозной пропуск (LR-кодирование), что подразумевает, что матрица A равна единичной матрице.
Lf, Ls, Rf, и Rs каналы могут быть декодированы объединенным образом в соответствии со следующей матричной операцией:
, с
Пример 2: Попарное кодирование четырех каналов и отдельное кодирование центрального канала
В соответствии с данным примером, Lf и Ls каналы кодируются объединенным образом. Более того, Rf, и Rs каналы кодируются объединенным образом (отдельно от Rf и Rs каналов) и C канал кодируется отдельно. Для иллюстрации такой конфигурации кодирования смотри, например, Фиг. 6b. (Случай Фиг. 6a может быть получен посредством перестановки каналов).
Для того чтобы добиться отдельного кодирования центрального канала компонент 420e декодирования устанавливается, чтобы осуществлять сквозной пропуск (LR-кодирование), что подразумевает, что матрица A равна единичной матрице.
Кроме того, для того, чтобы добиться отдельного кодирования Lf/Ls и Rf/Rs, компоненты 320c, 320d декодирования устанавливаются, чтобы осуществлять сквозной пропуск (LR-кодирование), что подразумевает, что матрицы A1 и B1 равны единичной матрице. Более того, спектры MDCT, представляющие собой Lf и Ls каналы, должны быть кодированными с общим окном касательно формы окна и длины преобразования. Также, спектры MDCT, представляющие собой Rf и Rs каналы, должны быть кодированными с общим окном касательно формы окна и длины преобразования. Тем не менее, окно для Lf/Ls может отличаться от окна для Rf/Rs. Lf, Ls, Rf, и Rs каналы могут быть декодированы в соответствии со следующими матричными операциями:
Пример 3: Объединенное кодирование пяти каналов
В соответствии с данным примером, Lf, Ls, Rf, Rs, и C каналы кодируются объединенным образом. Для иллюстрации такой конфигурации кодирования смотри, например, Фиг. 6e. Для того чтобы кодировать Lf, Ls, Rf, Rs и C объединенным образом, спектры MDCT, представляющие собой эти каналы, должны быть кодированными с общим окном касательно формы окна и длины преобразования. Lf, Ls, Rf, и Rs каналы могут быть декодированы в соответствии со следующей матричной операцией:
где M определяется посредством матриц A1, B1, A, A2, B2 по аналогичным строкам как матрица M Примера 1 выше.
Пример 4: Объединенное кодирование передних каналов и объединенное кодирование пространственных каналов
В соответствии с данным примером, C, Lf, и Rf каналы кодируются объединенным образом и Rs, Ls каналы кодируются объединенным образом. Для иллюстрации такой конфигурации кодирования смотри, например, Фиг. 6c. Для того чтобы кодировать C, Lf, и Rf объединенным образом, спектры MDCT, представляющие собой эти каналы, должны быть кодированными с общим окном касательно формы окна и длины преобразования. Также, спектры MDCT, представляющие собой Rs и Ls каналы, должны быть кодированными с общим окном касательно формы окна и длины преобразования. Тем не менее, окно для C/Lf/Rf может отличаться от окна для Rs/Ls.
Для того чтобы добиться отдельного кодирования передних каналов и пространственных каналов, матрицы A2 и B2 должны быть установлены в единичную матрицу.
Передние каналы могут быть декодированы в соответствии с
где M определяется посредством A1 и A. Пространственные каналы могут быть декодированы в соответствии с
В некоторых случаях устройства 310 и 410 кодирования могут устанавливать вторую пару выходных каналов 326, 328 в ноль выше определенной частоты, здесь именуемой первой частотой (с требуемой компенсацией энергии для первой пары выходных каналов 322, 324 или 422, 424). Причина этого состоит в том, чтобы сократить объем данных, отправляемых устройством 310, 410 кодирования соответствующему устройству 320, 420 декодирования. В таких случаях, вторая пара входных каналов 326’, 328’ на стороне декодера будет равна нулю для полос частот выше первой частоты. Это подразумевает, что вторая пара промежуточных каналов 317’, 319’ также не имеет спектрального содержимого выше первой частоты. В соответствии с примерными вариантами осуществления, вторая пара входных каналов 326’, 328’ интерпретируется в качестве (модифицированных) остаточных-сигналов. Описанная выше ситуация, таким образом, подразумевает, что частоты выше первой частоты, где отсутствуют (модифицированные) остаточные-сигналы, вводятся в третий и четвертый компоненты 320a, 320b декодирования.
Фиг. 7 иллюстрирует устройство 720 декодирования, которое является разновидностью устройств 320 и 420 декодирования. Устройство 720 декодирования компенсирует ограниченное спектральное содержимое второй пары входных каналов 326’, 328’ с Фиг. 3c и 4c. В частности предполагается, что вторая пара входных каналов 326’, 328’ имеет спектральное содержимое, соответствующее полосам частот вплоть до первой частоты, а первая пара входных каналов 322’, 324’ (или 422’, 424’) имеет спектральное содержимое, соответствующее полосам частот вплоть до второй частоты, которая больше первой частоты.
Устройство 720 декодирования содержит первый компонент декодирования, соответствующий любому из устройств 320 или 420 декодирования. Устройство 720 декодирования дополнительно содержит компонент 722 представления, который выполнен с возможностью представления первой пары выходных каналов 312’, 316’ в качестве первого сигнала 712 суммы и первого сигнала 716 разности. В частности, для полос частот ниже первой частоты компонент 722 представления преобразует первую пару выходных каналов 312’, 316’ с Фиг. 3c или Фиг. 4c из левого-правого формата в средний-остаточный формат в соответствии с выражениями, которые были описаны выше. Для полос частот выше первой частоты, компонент 722 представления отображает спектральное содержимое канала 313’ с Фиг. 3c или Фиг. 4c в первом сигнале суммы (а первый сигнал разности равен нулю для полос частот выше первой частоты).
Подобным образом, компонент 722 представления представляет вторую пару выходных каналов 314’, 318’ в качестве второго сигнала 714 суммы и второго сигнала 718 разности. В частности, для полос частот ниже первой частоты компонент 722 представления преобразует вторую пару выходных каналов 314, 318 с Фиг. 3c или Фиг. 4c из левого-правого формата в средний-остаточный формат в соответствии с выражениями, которые были описаны выше. Для полос частот выше первой частоты, компонент 722 представления отображает спектральное содержимое канала 315’ с Фиг. 3c или Фиг. 4c во втором сигнале суммы (а второй сигнал разности равен нулю для полос частот выше первой частоты).
Устройство 720 декодирования дополнительно содержит компонент 724 расширения частоты. Компонент 724 расширения частоты выполнен с возможностью расширения первого сигнала суммы и второго сигнала суммы до диапазона частот выше второго порогового значения частоты посредством выполнения реконструкции высокой частоты. Первый и второй суммарные-сигналы с расширенной частотой обозначены посредством 728 и 730. Например, компонент 724 расширения частоты может применять методики репликации спектральной полосы, чтобы расширять первый и второй суммарные-сигналы до более высоких частот (смотри, например, EP1285436B1).
Устройство 720 декодирования дополнительно содержит компонент 726 микширования. Компонент 726 микширования выполняет микширование сигнала 728 суммы с расширенной частотой и первого сигнала 716 разности. Для частот ниже первой частоты микширование содержит выполнение обратного суммарно-разностного преобразования первого сигнала суммы с расширенной частотой и первого сигнала разности. Как результат, выходные каналы 732, 734 компонента 726 микширования равны первой паре выходных каналов 312’, 316’ с Фиг. 3c и 4c для полос частот ниже первой частоты.
Для частот выше первого порогового значения частоты микширование содержит выполнение параметрического повышающего микширования (из одного сигнала для двух сигналов 732, 734) части первого сигнала суммы с расширенной частотой, соответствующего полосам частот выше первого порогового значения частоты. Применимые процедуры параметрического повышающего микширования описываются, например, в EP1410687B1). Параметрическое повышающее микширование может включать в себя генерирование декоррелированной версии первого сигнала 728 суммы с расширенной частотой, которая затем микшируется с первым сигналом 728 суммы с расширенной частотой в соответствии с параметрами (извлеченными на стороне кодера), которые вводятся в компонент 726 микширования. Таким образом, для частот выше первой частоты, выходные каналы 732, 734 компонента 726 микширования соответствуют результату повышающего микширования первого сигнала 728 суммы с расширенной частотой.
Подобным образом, компонент микширования обрабатывает второй сигнал 730 суммы с расширенной частотой и второй сигнал 718 разности.
В случае пятиканальной системы (когда устройство 720 декодирования содержит устройство 420 декодирования), компонент 724 расширения частоты может подвергать пятый выходной канал 419 расширению частоты, чтобы сгенерировать пятый выходной канал 740 с расширенной частотой.
Действия расширения первого сигнала 712 суммы и второго сигнала 714 суммы до диапазона частот выше второй частоты, микширования первого сигнала 728 суммы и первого сигнала 716 разности, и микширования второго сигнала 730 суммы и второго сигнала 718 разности, как правило, выполняются в области квадратурного зеркального фильтра, QMF. Вследствие этого устройство 720 декодирования может содержать компонент преобразования QMF, который преобразует сигналы 712, 716, 714, 718 суммы и разности (и пятый выходной канал 419) в область QMF перед выполнением расширения частоты и микширования. Более того, устройство 720 декодирования может содержать компонент обратного преобразования QMF, который преобразует выходные сигналы 732, 734, 736, 738 (и 740) во временную область.
Фиг. 5a, 5b и 5c иллюстрируют то, каким образом дополнительные пары каналов могут быть включены в инфраструктуру кодирования/декодирования, описанную касательно Фиг. 1a-c, Фиг. 2a-c, Фиг. 3a-c и Фиг. 4a-c. Фиг. 5a иллюстрирует многоканальную структуру 500, которая содержит первую структуру 502 каналов и два дополнительных канала 506 и 508. Первая структура 502 каналов содержит, по меньшей мере, два канала 502a и 502b и может, например, соответствовать любой из структур каналов, иллюстрируемых на Фиг. 1a, 2a, 3a, и 4a. В иллюстрируемом примере первая структура 502 каналов содержит пять каналов и, следовательно, соответствует структуре каналов с Фиг. 4a. В иллюстрируемом примере, два дополнительных канала 506, 508 могут, например, соответствовать левому заднему пространственному громкоговорителю Lbs и правому заднему пространственному громкоговорителю Rbs.
Фиг. 5b иллюстрирует устройство 510 кодирования, которое может быть использовано, чтобы кодировать структуру 500 каналов.
Устройство 510 кодирования содержит первый компонент 510a кодирования, второй компонент 510b кодирования, третий компонент 510c кодирования, и четвертый компонент 510d кодирования. Первый 510a, второй 510b, и четвертый 510d компоненты кодирования являются компонентами стереокодирования, такими как тот, что иллюстрируется на Фиг. 1b.
Третий компонент 510c кодирования выполнен с возможностью приема, по меньшей мере, двух входных каналов и преобразования их в точно такое же количество выходных каналов. Например, третий компонент 510c кодирования может соответствовать любому из устройств 110, 210, 310, 410 кодирования с Фиг. 1b, 2b, 3b, и 4b. Тем не менее, в более общем смысле, третий компонент 510c кодирования может быть любым компонентом кодирования, который выполнен с возможностью приема, по меньшей мере, двух входных каналов и преобразования их в точно такое же количество выходных каналов.
Устройство 510 кодирования принимает первое количество входных каналов, соответствующих количеству каналов первой структуры 502 каналов. В соответствии с вышеупомянутым, первое количество, таким образом, по меньшей мере, равно двум и первое количество входных каналов включает в себя первый входной канал 512a, и второй входной канал 512b (и, возможно, также некоторые оставшиеся каналы 512c). В иллюстрируемом примере, первый и второй входные каналы 512a, 512b могут соответствовать каналам 502a, и 502b с Фиг. 5a.
Устройство 510 кодирования дополнительно принимает два дополнительных входных канала, первый дополнительный входной канал 516 и второй дополнительный входной канал 518. Входные каналы 512a-c, 516, 518, как правило, представлены в качестве спектра MDCT.
Первый входной канал 512a и первый дополнительный канал 516 вводятся в первый компонент 510a стереокодирования. Первый компонент 510a стереокодирования выполняет стереокодирование в соответствии с любой из схем стереокодирования, описанных выше. Первый компонент 510a стереокодирования выводит первую пару промежуточных выходных каналов, включающую в себя первый канал 513 и второй канал 517.
Подобным образом, второй входной канал 512b и второй дополнительный канал 518 вводятся во второй компонент 510b стереокодирования. Второй компонент 510b стереокодирования выполняет стереокодирование в соответствии с любой из схем стереокодирования, раскрытых выше. Второй компонент 510a стереокодирования выводит вторую пару промежуточных выходных каналов, включающую в себя первый канал 515 и второй канал 519.
Рассматривая примерную структуру 500 каналов с Фиг. 5a, обработка, выполняемая посредством первого и второго компонентов 510a, 510b стереокодирования, соответствует стереокодированию Lbs канала 506 с Ls каналом 502a, и стереокодированию Rbs канала 508 и Rs канала 502b, соответственно. Тем не менее, должно быть понятно, что при других примерных структурах каналов получаются другие интерпретации.
Первый канал 513 из первой пары промежуточных выходных каналов и первый канал 515 из второй пары промежуточных выходных каналов затем вводятся в третий компонент 510c кодирования совместно с первым количеством входных каналов 512c кроме первого входного канала 512a и второго входного канала 512b. Третий компонент 510c кодирования преобразует его входные каналы 513, 515, 512c, чтобы сгенерировать точно такое же количество выходных каналов, включая первую пару выходных каналов 522, 524, и, если применимо дополнительно выходные каналы 521. Третий компонент кодирования может, например, преобразовывать его входные каналы 513, 515, 512c аналогично тому, что было раскрыто касательно Фиг. 1b, Фиг. 2b, Фиг. 3b, и Фиг. 4b.
Подобным образом, второй канал 517 из первой пары промежуточных выходных каналов и второй канал 519 из второй пары промежуточных выходных каналов вводятся в четвертый компонент 510d стереокодирования, который выполняет стереокодирование в соответствии с любой из схем стереокодирования, рассмотренных выше. Четвертый компонент стереокодирования выводит вторую пару выходных каналов 526, 528.
Выходные каналы 521, 522, 524, 526, 528 квантуются и кодируются, чтобы сформировать битовый поток, который должен быть передан соответствующему устройству декодирования.
Фиг. 5c иллюстрирует соответствующее устройство 520 декодирования. Устройство 520 декодирования содержит первый компонент 520c декодирования, второй компонент 520d декодирования, третий компонент 520a декодирования, и четвертый компонент 520b декодирования. Второй 520d, третий 520a, и четвертый 520b компоненты декодирования являются компонентами стереодекодирования, такими как тот, что иллюстрируется на Фиг. 1c.
Первый компонент 520c декодирования выполнен с возможностью приема, по меньшей мере, двух входных каналов и преобразования их в точно такое же количество выходных каналов. Например, первый компонент 520c декодирования может соответствовать любому из устройств 120, 220, 320, 420 декодирования с Фиг. 1b, 2b, 3b, и 4b. Тем не менее, в более общем смысле, первый компонент 520c декодирования может быть любым компонентом декодирования, который выполнен с возможностью приема, по меньшей мере, двух входных каналов и преобразования их в точно такое же количество выходных каналов.
Устройство 520 декодирования принимает, декодирует и деквантует битовый поток, переданный посредством устройства 510 кодирования. Таким образом, устройство 520 декодирования принимает первое количество входных каналов 521’, 522’, 524’, соответствующих выходным каналам 521, 522, 524 устройства 510 кодирования. В соответствии с вышеупомянутым, первое количество входных каналов включает в себя первый входной канал 522’, и второй входной канал 524’ (и возможно также некоторое количество оставшихся каналов 521’).
Устройство 520 декодирования дополнительно принимает два дополнительных входных канала, первый дополнительный входной канал 526’ и второй дополнительный входной канал 528’ (соответствующие выходным каналам 526, 528 на стороне кодера).
Первое количество входных каналов 521’, 522’, 524’ вводится в первый компонент 520c декодирования. Первый компонент 520c декодирования преобразует его входные каналы 521’, 522’, 524’, чтобы сгенерировать точно такое же количество выходных каналов, включающих в себя первую пару промежуточных выходных каналов 513’, 515’, и, если применимо, дополнительные выходные каналы 512c’. Первый компонент 520c декодирования может, например, преобразовывать его входные каналы 521’, 522’, 524’ аналогично том, что было раскрыто касательно Фиг. 1c, Фиг. 2c, Фиг. 3c, и Фиг. 4c. В частности, первый компонент 520c декодирования выполнен с возможностью выполнения декодирования, которое является обратным кодированию, которое выполняется посредством третьего компонента 510c кодирования на стороне кодера.
Первый дополнительный входной канал 526, и второй дополнительный входной канал 528 вводятся во второй компонент 520d стереодекодирования, который выполняет стереодекодирование, соответствующее обратному для кодирования, которое выполняется посредством четвертого компонента 510d стереокодирования на стороне кодера. Второй компонент 520d стереодекодирования выводит вторую пару промежуточных выходных каналов 517’, 519’.
Первый канал 513’ из первой пары промежуточных выходных каналов и первый канал 517’ из второй пары промежуточных выходных каналов вводятся в третий компонент 520a стереодекодирования. Третий компонент 520a стереодекодирования выполняет стереодекодирование соответствующее обратному для кодирования, которое выполняется посредством первого компонента 510a стереокодирования на стороне кодера. Третий компонент 520a стереодекодирования выводит первую пару выходных каналов, включающую в себя первый канал 512a’ и второй канал 516’.
Подобным образом, второй канал 515’ из первой пары промежуточных выходных каналов и второй канал 519’ из второй пары промежуточных выходных каналов вводятся в четвертый компонент 520b стереодекодирования. Четвертый компонент 520b стереодекодирования выполняет стереодекодирование, соответствующее обратному для кодирования, которое выполняется посредством второго компонента 510b стереокодирования на стороне кодера. Четвертый компонент 520b декодирования выводит вторую пару выходных каналов, включающую в себя первый канал 512b’ и второй канал 518’.
Фиг. 6a, 6b, 6c, 6d и 6e иллюстрируют пять каналов пятиканальной системы. Пять каналов могут быть разделены на разные группы, чтобы формировать разные конфигурации кодирования. Каждая группа соответствует каналам, которые кодируются объединенным образом посредством использования устройств кодирования в соответствии с вышеприведенным.
Первая конфигурация 610 кодирования показана на Фиг. 6a. Первая конфигурация 610 кодирования содержит первую группу 612, которая состоит из одного канала (здесь центрального канала C), вторую группу 614, состоящую из двух каналов (здесь Lf и Rf каналов), и третью группу 616, состоящую из двух каналов (здесь Ls и Rs каналов). Канал первой группы 612 будет кодироваться отдельно, каналы второй группы 614 будут кодироваться объединенным образом, и каналы третьей группы 616 будут кодироваться объединенным образом. Такое кодирование может, например, быть достигнуто посредством устройства 410 кодирования с Фиг. 4b посредством отображения Lf канала во входном канале 312, Ls канала во входном канале 316, C канала во входном канале 419, Rf канала во входном канале 314, и Rs канала во входном канале 318. Кроме того, схемы кодирования первого 310a, второго 310b, и пятого 410e компонентов стереокодирования должны быть установлены в LR-кодирование (сквозной пропуск входных сигналов). Фиг. 6b иллюстрирует вариант 610’ первой конфигурации 610 кодирования. В варианте 610’ первой конфигурации кодирования вторая группа 614’ соответствует Lf и Ls каналам, а третья группа 616’ Rf и Rs каналам. Конфигурации кодирования с Фиг. 6a и 6b в нижеследующем именуются 1-2-2 конфигурациями кодирования.
Вторая конфигурация 620 кодирования показана на Фиг. 6c. Вторая конфигурация 620 кодирования содержит первую группу 622, которая состоит из трех каналов (здесь центрального канала C, Lf канала, и Rf канала), и вторую группу 624, состоящую из двух каналов (здесь Ls и Rs каналов). Конфигурация кодирования на Фиг. 6c в нижеследующем именуется как 2-3 конфигурация кодирования. Каналы первой группы 622 будут кодироваться объединенным образом и каналы второй группы 624 будут кодироваться объединенным образом отдельно от первой группы 622. Такое кодирование может, например, быть достигнуто посредством устройства 410 кодирования с Фиг. 4b посредством отображения Lf канала во входном канале 312, Ls канала во входном канале 316, C канала во входном канале 419, Rf канала во входном канале 314, и Rs канала во входном канале 318. Кроме того, схемы кодирования первого 310a, второго 310b компонентов стереокодирования должны быть установлены в LR-кодирование (сквозной пропуск входных сигналов).
Третья конфигурация 630 кодирования показана на Фиг. 6d. Третья конфигурация 630 кодирования содержит первую группу 632, которая состоит из одного канала (здесь центрального канала C), и вторую группу 634, состоящую из четырех каналов (здесь Ls и Rs каналов). Конфигурация кодирования на Фиг. 6d в нижеследующем именуется 1-4 конфигурацией кодирования. Канал первой группы 632 будет кодироваться отдельно, а каналы второй группы 634 будут кодироваться объединенным образом. Такое кодирование может, например, быть достигнуто посредством устройства 410 кодирования с Фиг. 4b посредством отображения Lf канала во входном канале 312, Ls канала во входном канале 316, C канала во входном канале 419, Rf канала во входном канале 314, и Rs канала во входном канале 318. Кроме того, схемы кодирования пятого компонента 410e стереокодирования должны быть установлены в LR-кодирование (сквозной пропуск входных сигналов).
Четвертая конфигурация 640 кодирования показана на Фиг. 6e. Четвертая конфигурация 640 кодирования содержит единственную группу 642, которая состоит из всех пяти каналов, означая, что все каналы кодируются объединенным образом. Конфигурация кодирования с Фиг. 6e в нижеследующем именуется 0-5 конфигурацией кодирования. Например, каналы могут быть закодированы объединенным образом посредством устройства 410 кодирования с Фиг. 4b посредством отображения Lf канала во входном канале 312, Ls канала во входном канале 316, C канала в входном канале 419, Rf канала во входном канале 314, и Rs канала во входном канале 318.
Несмотря на то, что вышеупомянутые конфигурации кодирования были объяснены касательно пятиканальной системы, они эквивалентно применимы к системам с четырьмя и более каналами.
Устройство кодирования может, таким образом, кодировать аудио содержимое многоканальной системы в соответствии с разными конфигурациями 610, 610’, 620, 630, 640 кодирования. Конфигурация кодирования, использованная на стороне кодера, должна быть сообщена декодеру. Для этой цели может быть использован конкретный формат сигнализации. Для аудиосистемы, содержащей, по меньшей мере, четыре канала, формат сигнализации содержит, по меньшей мере, два бита, которые указывают одну из множества конфигураций 610, 610’, 620, 630, 640, которая должна быть применена на стороне декодера. Например, каждая конфигурация кодирования может быть ассоциирована с идентификационным номером и, по меньшей мере, два бита могут указывать идентификационный номер конфигурации кодирования, для применения в декодере.
Для пятиканальной системы, иллюстрируемой на Фиг. 6a-6e, два бита могут быть использованы для выбора между 1-2-2 конфигурацией, 2-3 конфигурацией, 1-4 или 0-5 конфигурацией. В случае, когда два бита указывают 1-2-2 конфигурацию, формат сигнализации может содержать третий бит, указывающий на то, какой вариант 1-2-2 конфигурации выбрать, т.е. должна ли быть применена правая-левая конфигурация кодирования с Фиг. 6a или передняя-задняя конфигурация с Фиг. 6b. Следующий псевдо-код приводит пример того, каким образом это может быть реализовано:
Касательно вышеупомянутого псевдо-кода, формат сигнализации использует два бита, чтобы кодировать параметр high_mid_coding_config, и один бит используется, чтобы кодировать параметр l_2_2_channel_mapping.
Эквиваленты, расширения, альтернативы и прочее
Дополнительные варианты осуществления настоящего раскрытия станут очевидны специалисту в соответствующей области техники после изучения вышеупомянутого описания. Даже если настоящее описание и чертежи раскрывают варианты осуществления и примеры, раскрытие не ограничивается этими конкретными примерами. Многочисленные модификации и вариации могут быть выполнены, не отступая от объема настоящего раскрытия, который определяется посредством сопроводительной формулы изобретения. Любые ссылочные знаки, встречающиеся в формуле изобретения, не должны пониматься, как ограничивающие ее объем.
Дополнительно, вариации в отношении раскрытых вариантов осуществления могут быть поняты и осуществлены специалистом в соответствующей области техники при воплощении на практике раскрытия, из изучения чертежей, раскрытия и прилагаемой формулы изобретения. В формуле изобретения слово «содержащий» не исключает других элементов или этапов, а формы единственного числа не исключают множественное. Тот лишь факт, что некоторые меры сформулированы во взаимно разных зависимых пунктах формулы изобретения, не указывает на то, что сочетание этих мер не может быть использовано для получения преимущества.
Системы и способы, раскрытые выше, могут быть реализованы в качестве программного обеспечения, встроенного программного обеспечения, аппаратного обеспечения или их сочетания. При реализации в аппаратном обеспечении, деление задач между функциональными модулями, упомянутыми в вышеприведенном описании, не обязательно соответствует делению на физические модули; наоборот, один физический компонент может иметь несколько функциональных возможностей, и одна задача может быть выполнена несколькими физическими компонентами сообща. Некоторые компоненты или все компоненты могут быть реализованы в качестве программного обеспечения, исполняемого посредством цифрового сигнального процессора или микропроцессора, или реализованы в качестве аппаратного обеспечения или в качестве проблемно-ориентированной интегральной микросхемы. Такое программное обеспечение может быть распространено на компьютерно-читаемых носителях, которые могут содержать компьютерные запоминающие носители (или не временные носители) и средства связи (или временные носители). Как хорошо известно специалисту в соответствующей области техники, понятие компьютерные запоминающие носители включает в себя как энергозависимые, так и энергонезависимые, как съемные, так и несъемные носители, реализованные любым способом или по любой технологии для хранения информации, такой как компьютерно-читаемые инструкции, структуры данных, программные модули или прочие данные. Компьютерные запоминающие носители включают в себя, но не ограничиваются, RAM, ROM, EEPROM, флэш-память или другую технологию памяти, CD-ROM, цифровые универсальные диски (DVD) или запоминающее устройство на оптическом диске, магнитные кассеты, магнитную ленту, запоминающее устройство на магнитном диске или другие магнитные запоминающие устройства, или любой другой носитель, который может быть использован, чтобы хранить требуемую информацию и доступ к которому может быть осуществлен посредством компьютера. Кроме того, специалисту в соответствующей области техники хорошо известно, что средства связи, как правило, воплощают компьютерно-читаемые инструкции, структуры данных, программные модули или прочие данные в модулированном сигнале данных, таком как несущая волна или другой механизм транспортировки, и включают в себя любые средства доставки информации.
название | год | авторы | номер документа |
---|---|---|---|
МНОГОКАНАЛЬНОЕ КОДИРОВАНИЕ И ДЕКОДИРОВАНИЕ | 2005 |
|
RU2407068C2 |
АУДИОКОДИРОВАНИЕ | 2003 |
|
RU2363116C2 |
АУДИОКОДИРОВАНИЕ | 2006 |
|
RU2419249C2 |
УСТРОЙСТВО И СПОСОБ ДЛЯ УЛУЧШЕННОГО ПРОСТРАНСТВЕННОГО КОДИРОВАНИЯ АУДИООБЪЕКТОВ | 2014 |
|
RU2660638C2 |
КОДИРОВАНИЕ И ДЕКОДИРОВАНИЕ АУДИО | 2007 |
|
RU2427978C2 |
ДЕКОДИРОВАНИЕ БИНАУРАЛЬНЫХ АУДИОСИГНАЛОВ | 2007 |
|
RU2409911C2 |
ПРИНЦИП ДЛЯ КОДИРОВАНИЯ И ДЕКОДИРОВАНИЯ АУДИО ДЛЯ АУДИОКАНАЛОВ И АУДИООБЪЕКТОВ | 2014 |
|
RU2641481C2 |
УСТРОЙСТВО ДЕКОДИРОВАНИЯ ЗВУКОВОГО СИГНАЛА И СПОСОБ РЕГУЛИРОВАНИЯ БАЛАНСА УСТРОЙСТВА ДЕКОДИРОВАНИЯ ЗВУКОВОГО СИГНАЛА | 2009 |
|
RU2491656C2 |
СОВМЕСТИМОЕ МНОГОКАНАЛЬНОЕ КОДИРОВАНИЕ/ДЕКОДИРОВАНИЕ | 2004 |
|
RU2327304C2 |
АУДИОКОДЕР ДЛЯ КОДИРОВАНИЯ МНОГОКАНАЛЬНОГО СИГНАЛА И АУДИОДЕКОДЕР ДЛЯ ДЕКОДИРОВАНИЯ КОДИРОВАННОГО АУДИОСИГНАЛА | 2016 |
|
RU2679571C1 |
Изобретение относится к средствам кодирования и декодирования для кодирования каналов аудиосистемы с по меньшей мере четырьмя каналами. Технический результат заключается в повышении эффективности кодирования многоканального аудио. Устройство декодирования имеет первый компонент стереодекодирования, который подвергает первую пару входных каналов первому стереодекодированию, и второй компонент стереодекодирования, который подвергает вторую пару входных каналов второму стереодекодированию. Результаты первого и второго компонентов стереодекодирования крест-накрест связываются с третьим и четвертым компонентом стереодекодирования, при этом каждый выполняет стереодекодирование в отношении одного канала, полученного из первого компонента стереодекодирования, и одного канала, полученного из второго компонента стереодекодирования. 8 н. и 31 з.п. ф-лы, 21 ил.
1. Способ декодирования в многоканальной аудиосистеме, содержащей по меньшей мере четыре аудиоканала, содержащий этапы, на которых:
принимают первую пару входных аудиоканалов и вторую пару входных аудиоканалов, отличную от первой пары входных аудиоканалов;
принимают пятый входной аудиоканал;
подвергают первую пару входных аудиоканалов первому стереодекодированию;
подвергают вторую пару входных аудиоканалов второму стереодекодированию;
подвергают первый аудиоканал, полученный в результате первого стереодекодирования, и первый аудиоканал, полученный в результате второго стереодекодирования, третьему стереодекодированию с тем, чтобы получить первую пару выходных аудиоканалов;
подвергают пятый входной аудиоканал и второй аудиоканал, полученный в результате первого стереодекодирования, пятому стереодекодированию;
подвергают аудиоканал, ассоциированный со вторым аудиоканалом, полученным в результате первого стереодекодирования, и второй аудиоканал, полученный в результате второго стереодекодирования, четвертому стереодекодированию с тем, чтобы получить вторую пару выходных аудиоканалов, отличную от первой пары выходных аудиоканалов, при этом аудиоканал, ассоциированный со вторым каналом, полученным в результате первого стереодекодирования, является вторым аудиоканалом, полученным в результате первого стереодекодирования, или аудиоканалом, полученным в результате пятого стереодекодирования; и
выводят первую и вторую пару выходных аудиоканалов,
при этом по меньшей мере два из первого, второго, третьего и четвертого стереодекодирования включают в себя формирование для по меньшей мере одной полосы частот и по меньшей мере одного временного кадра взвешенной или невзвешенной суммы двух аудиоканалов, подвергаемых соответствующему стереодекодированию, и взвешенной или невзвешенной разности между двумя аудиоканалами, подвергаемыми соответствующему стереодекодированию.
2. Способ декодирования по п. 1, содержащий этапы, на которых принимают дополнительную информацию, и для первого, второго, третьего и четвертого стереодекодирования:
выбирают, на основании дополнительной информации, схему кодирования из группы, содержащей левое-правое кодирование, суммарно-разностное кодирование, и улучшенное суммарно-разностное кодирование; и
выполняют стереодекодирование в соответствии с выбранной схемой кодирования,
при этом улучшенным суммарно-разностным кодированием является суммарно-разностное кодирование с применением дополнительного параметра, указывающего громкость каналов, к сигналам, используемым для формирования кодируемой суммы и разности.
3. Способ декодирования по п. 1, в котором аудиоканал, ассоциированный со вторым каналом, полученным в результате первого стереодекодирования, является вторым каналом, полученным в результате первого стереодекодирования.
4. Способ декодирования по п. 1,
при этом аудиоканал, ассоциированный со вторым аудиоканалом, полученным в результате первого стереодекодирования, равен первому аудиоканалу, полученному в результате пятого стереодекодирования; и
при этом второй аудиоканал, полученный в результате пятого стереодекодирования, выводят в качестве пятого выходного аудиоканала.
5. Способ декодирования по п. 1, дополнительно содержащий этапы, на которых:
принимают третью пару входных аудиоканалов;
подвергают третью пару входных аудиоканалов шестому стереодекодированию;
подвергают второй аудиоканал из первой пары выходных аудиоканалов и первый аудиоканал, полученный в результате шестого стереодекодирования, седьмому стереодекодированию;
подвергают второй аудиоканал из второй пары выходных аудиоканалов и второй аудиоканал, полученный в результате шестого стереодекодирования, восьмому стереодекодированию; и
выводят первый аудиоканал из первой пары выходных аудиоканалов, пару аудиоканалов, полученных в результате седьмого стереодекодирования, первый аудиоканал из второй пары выходных аудиоканалов и пару аудиоканалов, полученных в результате восьмого стереодекодирования.
6. Способ декодирования по п. 1, в котором первое, второе, третье и четвертое стереодекодирование и пятое, шестое, седьмое и восьмое стереодекодирование, если применимо, содержит выполнение стереодекодирования в соответствии со схемой кодирования из группы, содержащей: левое-правое кодирование, суммарно-разностное кодирование, и улучшенное суммарно-разностное кодирование,
при этом улучшенным суммарно-разностным кодированием является суммарно-разностное кодирование с применением дополнительного параметра, указывающего громкость каналов, к сигналам, используемым для формирования кодируемой суммы и разности.
7. Способ декодирования по п. 6, в котором разные схемы кодирования используют для разных полос частот.
8. Способ декодирования по п. 6, в котором разные схемы кодирования используют для разных временных кадров.
9. Способ декодирования по п. 1, в котором первое, второе, третье, четвертое и пятое, шестое, седьмое и восьмое стереодекодирование, если применимо, выполняют в области модифицированного дискретного косинусного преобразования, MDCT, с критической дискретизацией.
10. Способ декодирования по п. 9, в котором все входные аудиоканалы преобразуют в область MDCT, используя одинаковое окно.
11. Способ декодирования по п. 9, в котором вторая пара входных аудиоканалов имеет спектральное содержимое, соответствующее полосам частот вплоть до первого порогового значения частоты, в соответствии с чем пара аудиоканалов, полученная в результате второго стереодекодирования, равна нулю для полос частот выше первого порогового значения частоты.
12. Способ декодирования по п. 9, в котором вторая пара входных аудиоканалов имеет спектральное содержимое, соответствующее полосам частот вплоть до первого порогового значения частоты, и первая пара входных аудиоканалов имеет спектральное содержимое, соответствующее полосам частот вплоть до второго порогового значения частоты, которое больше первого порогового значения частоты; причем способ дополнительно содержит этапы, на которых:
представляют первую пару выходных аудиоканалов как первый сигнал суммы и первый сигнал разности и представляют вторую пару выходных аудиоканалов как второй сигнал суммы и второй сигнал разности;
расширяют первый сигнал суммы и второй сигнал суммы до диапазона частот выше второго порогового значения частоты посредством выполнения реконструкции высокой частоты;
микшируют первый сигнал суммы и первый сигнал разности, при этом для частот ниже первого порогового значения частоты микширование содержит выполнение обратного суммарно-разностного преобразования первого сигнала суммы и первого сигнала разности, а для частот выше первого порогового значения частоты микширование содержит выполнение параметрического повышающего микширования части первого сигнала суммы, соответствующей полосам частот выше первого порогового значения частоты; и
микшируют второй сигнал суммы и второй сигнал разности, при этом для частот ниже первого порогового значения частоты микширование содержит выполнение обратного суммарно-разностного преобразования второго сигнала суммы и второго сигнала разности, а для частот выше первого порогового значения частоты микширование содержит выполнение параметрического повышающего микширования части второго сигнала суммы, соответствующей полосам частот выше первого порогового значения частоты.
13. Способ по п. 12, в котором этапы расширения первого сигнала суммы и второго сигнала суммы до диапазона частот выше второго порогового значения частоты, микширования первого сигнала суммы и первого сигнала разности и микширования второго сигнала суммы и второго сигнала разности выполняются в области квадратурного зеркального фильтра, QMF.
14. Компьютерно-читаемый носитель, содержащий сохраненные на нем инструкции, которые при исполнении компьютером предписывают компьютеру выполнять способ по любому из предшествующих пунктов.
15. Устройство декодирования в многоканальной аудиосистеме, содержащей по меньшей мере четыре аудиоканала, содержащее:
компонент приема, выполненный с возможностью приема первой пары входных аудиоканалов и второй пары входных аудиоканалов, отличной от первой пары входных аудиоканалов, и приема пятого входного аудиоканала;
первый компонент стереодекодирования, выполненный с возможностью подвергать первую пару входных аудиоканалов первому стереодекодированию;
второй компонент стереодекодирования, выполненный с возможностью подвергать вторую пару входных аудиоканалов второму стереодекодированию;
третий компонент стереодекодирования, выполненный с возможностью подвергать первый аудиоканал, полученный в результате первого стереодекодирования, и первый аудиоканал, полученный в результате второго стереодекодирования, третьему стереодекодированию с тем, чтобы получить первую пару выходных аудиоканалов;
пятый компонент стереодекодирования, выполненный с возможностью подвергать пятый входной аудиоканал и второй аудиоканал, полученный в результате первого стереодекодирования, пятому стереодекодированию;
четвертый компонент стереодекодирования, выполненный с возможностью подвергать аудиоканал, ассоциированный со вторым аудиоканалом, полученным в результате первого стереодекодирования, и второй аудиоканал, полученный в результате второго стереодекодирования, четвертому стереодекодированию с тем, чтобы получить вторую пару выходных аудиоканалов, отличную от первой пары выходных аудиоканалов, при этом аудиоканал, ассоциированный со вторым каналом, полученным в результате первого стереодекодирования, является вторым аудиоканалом, полученным в результате первого стереодекодирования, или аудиоканалом, полученным в результате пятого стереодекодирования; и
компонент вывода, выполненный с возможностью вывода первой и второй пары выходных аудиоканалов,
при этом по меньшей мере два из первого, второго, третьего и четвертого стереодекодирования включают в себя формирование для по меньшей мере одной полосы частот и по меньшей мере одного временного кадра взвешенной или невзвешенной суммы двух аудиоканалов, подвергаемых соответствующему стереодекодированию, и взвешенной или невзвешенной разности между двумя аудиоканалами, подвергаемыми соответствующему стереодекодированию.
16. Устройство декодирования по п. 15, выполненное с возможностью приема дополнительной информации и для первого, второго, третьего и четвертого компонента стереодекодирования:
выбора, на основании дополнительной информации, схемы кодирования из группы, содержащей левое-правое кодирование, суммарно-разностное кодирование и улучшенное суммарно-разностное кодирование; и
выполнения стереодекодирования в соответствии с выбранной схемой кодирования,
при этом улучшенным суммарно-разностным кодированием является суммарно-разностное кодирование с применением дополнительного параметра, указывающего громкость каналов, к сигналам, используемым для формирования кодируемой суммы и разности.
17. Аудиосистема, содержащая устройство декодирования по п. 15.
18. Способ кодирования в многоканальной аудиосистеме, содержащей по меньшей мере четыре аудиоканала, содержащий этапы, на которых:
принимают первую пару входных аудиоканалов и вторую пару входных аудиоканалов, отличную от первой пары входных аудиоканалов;
принимают пятый входной аудиоканал;
подвергают первую пару входных аудиоканалов первому стереокодированию;
подвергают вторую пару входных аудиоканалов второму стереокодированию;
подвергают пятый входной аудиоканал и первый аудиоканал, полученный в результате второго стереокодирования, пятому стереокодированию;
подвергают первый аудиоканал, полученный в результате первого стереокодирования, и аудиоканал, ассоциированный с первым аудиоканалом, полученным в результате второго стереокодирования, третьему стереокодированию с тем, чтобы получить первую пару выходных аудиоканалов;
подвергают второй аудиоканал, полученный в результате первого стереокодирования, и второй аудиоканал, полученный в результате второго стереокодирования, четвертому стереокодированию с тем, чтобы получить вторую пару выходных аудиоканалов, отличную от первой пары выходных аудиоканалов; и
выводят первую и вторую пару выходных аудиоканалов,
при этом аудиоканал, ассоциированный с первым аудиоканалом, полученным в результате второго стереокодирования, является первым аудиоканалом, полученным в результате второго стереокодирования, или аудиоканалом, полученным в результате пятого стереокодирования, и
при этом по меньшей мере два из первого, второго, третьего и четвертого стереокодирования включают в себя формирование для по меньшей мере одной полосы частот и по меньшей мере одного временного кадра взвешенной или невзвешенной суммы двух аудиоканалов, подвергаемых соответствующему стереокодированию, и взвешенной или невзвешенной разности между двумя аудиоканалами, подвергаемыми соответствующему стереокодированию.
19. Способ кодирования по п. 18, содержащий для первого, второго, третьего и четвертого стереокодирования этапы, на которых:
выбирают схему кодирования из группы, содержащей левое-правое кодирование, суммарно-разностное кодирование и улучшенное суммарно-разностное кодирование; и
выполняют стереокодирование в соответствии с выбранной схемой кодирования,
при этом способ кодирования дополнительно содержит этап, на котором:
выводят дополнительную информацию, указывающую выбранные схемы кодирования,
при этом улучшенным суммарно-разностным кодированием является суммарно-разностное кодирование с применением дополнительного параметра, указывающего громкость каналов, к сигналам, используемым для формирования кодируемой суммы и разности.
20. Способ кодирования по п. 18, в котором аудиоканал, ассоциированный с первым аудиоканалом, полученным в результате второго стереокодирования, является первым аудиоканалом, полученным в результате второго стереокодирования.
21. Способ кодирования по п. 18,
при этом аудиоканал, ассоциированный с первым аудиоканалом, полученным в результате второго стереокодирования, является первым аудиоканалом, полученным в результате пятого стереокодирования; и
при этом второй аудиоканал, полученный в результате пятого стереокодирования, выводят в качестве пятого выходного аудиоканала.
22. Способ кодирования по п. 18, дополнительно содержащий этапы, на которых:
принимают третью пару входных аудиоканалов;
подвергают второй аудиоканал из первой пары входных аудиоканалов и первый аудиоканал из третьей пары входных аудиоканалов шестому стереокодированию;
подвергают второй аудиоканал из второй пары входных аудиоканалов и второй аудиоканал из третьей пары входных аудиоканалов седьмому стереокодированию;
при этом первый аудиоканал, полученный в результате шестого стереокодирования, и первый аудиоканал из первой пары входных аудиоканалов подвергаются первому стереокодированию;
при этом первый аудиоканал, полученный в результате седьмого стереокодирования, и первый аудиоканал из второй пары входных каналов подвергаются второму стереокодированию; и
подвергают второй аудиоканал, полученный в результате шестого стереокодирования, и второй аудиоканал, полученный в результате седьмого стереокодирования, восьмому стереокодированию с тем, чтобы получить третью пару выходных аудиоканалов.
23. Способ кодирования по п. 18, в котором первое, второе, третье и четвертое стереокодирование и пятое, шестое, седьмое и восьмое стереокодирование, если применимо, включают в себя выполнение стереокодирования в соответствии со схемой кодирования из группы, содержащей: левое-правое кодирование, суммарно-разностное кодирование и улучшенное суммарно-разностное кодирование,
при этом улучшенным суммарно-разностным кодированием является суммарно-разностное кодирование с применением дополнительного параметра, указывающего громкость каналов, к сигналам, используемым для формирования кодируемой суммы и разности.
24. Способ кодирования по п. 23, в котором разные схемы кодирования используют для разных полос частот.
25. Способ кодирования по п. 23, в котором разные схемы кодирования используют для разных временных кадров.
26. Способ кодирования по п. 18, в котором первое, второе, третье, четвертое и пятое, шестое, седьмое и восьмое стереокодирование, если применимо, выполняют в области модифицированного дискретного косинусного преобразования, MDCT, с критической дискретизацией.
27. Способ кодирования по п. 26, в котором все входные аудиоканалы преобразуют в область MDCT, используя одинаковое окно.
28. Компьютерно-читаемый носитель, содержащий сохраненные на нем инструкции, которые при исполнении компьютером предписывают компьютеру выполнять способ по п. 18.
29. Устройство кодирования в многоканальной аудиосистеме, содержащей по меньшей мере четыре канала, содержащее:
компонент приема, выполненный с возможностью приема первой пары входных аудиоканалов и второй пары входных аудиоканалов, отличной от первой пары входных аудиоканалов, и приема пятого входного аудиоканала;
первый компонент стереокодирования, выполненный с возможностью подвергать первую пару входных аудиоканалов первому стереокодированию;
второй компонент стереокодирования, выполненный с возможностью подвергать вторую пару входных аудиоканалов второму стереокодированию;
пятый компонент стереокодирования, выполненный с возможностью подвергать пятый входной аудиоканал и первый аудиоканал, полученный в результате второго стереокодирования, пятому стереокодированию;
третий компонент стереокодирования, выполненный с возможностью подвергать первый аудиоканал, полученный в результате первого стереокодирования, и аудиоканал, ассоциированный с первым аудиоканалом, полученным в результате второго стереокодирования, третьему стереокодированию с тем, чтобы предоставить первую пару выходных аудиоканалов;
четвертый компонент стереокодирования, выполненный с возможностью подвергать второй аудиоканал, полученный в результате первого стереокодирования, и второй аудиоканал, полученный в результате второго стереокодирования, четвертому стереокодированию с тем, чтобы получить вторую пару выходных аудиоканалов, отличную от первой пары выходных аудиоканалов; и
компонент вывода, выполненный с возможностью вывода первой и второй пары выходных аудиоканалов,
при этом аудиоканал, ассоциированный с первым аудиоканалом, полученным в результате второго стереокодирования, является первым аудиоканалом, полученным в результате второго стереокодирования, или аудиоканалом, полученным в результате пятого стереокодирования, и
при этом по меньшей мере два из первого, второго, третьего и четвертого стереокодирования включают в себя формирование для по меньшей мере одной полосы частот и по меньшей мере одного временного кадра взвешенной или невзвешенной суммы двух аудиоканалов, подвергаемых соответствующему стереокодированию, и взвешенной или невзвешенной разности между двумя аудиоканалами, подвергаемыми соответствующему стереокодированию.
30. Устройство кодирования по п. 29, выполненное с возможностью для первого, второго, третьего и четвертого компонента стереокодирования:
выбора схемы кодирования из группы, содержащей левое-правое кодирование, суммарно-разностное кодирование и улучшенное суммарно-разностное кодирование; и
выполнения стереокодирования в соответствии с выбранной схемой кодирования,
при этом устройство кодирования дополнительно выполнено с возможностью:
вывода дополнительной информации, указывающей выбранные схемы кодирования,
при этом улучшенным суммарно-разностным кодированием является суммарно-разностное кодирование с применением дополнительного параметра, указывающего громкость каналов, к сигналам, используемым для формирования кодируемой суммы и разности.
31. Аудиосистема, содержащая устройство кодирования по п.30.
32. Способ по п. 2, в котором по меньшей мере четыре аудиоканала упомянутой многоканальной аудиосистемы являются разделяемыми на разные группы в соответствии с множеством конфигураций, причем каждая группа соответствует аудиоканалам, которые кодируются объединенным образом, причем дополнительная информация содержит по меньшей мере два бита, указывающие одну из множества конфигураций, которая должна быть применена при декодировании, и при этом схемы кодирования соответствующего стереодекодирования выбираются в соответствии с указанной конфигурацией.
33. Способ по п. 19, в котором по меньшей мере четыре аудиоканала упомянутой многоканальной аудиосистемы являются разделяемыми на разные группы в соответствии со множеством конфигураций, причем каждая группа соответствует аудиоканалам, которые кодируются объединенным образом, при этом способ содержит этап, на котором выбирают одну из множества конфигураций, при этом схемы кодирования соответствующего стереокодирования выбираются в соответствии с выбранной конфигурацией, и при этом дополнительная информация содержит по меньшей мере два бита, указывающие выбранную конфигурацию.
34. Способ по п. 32, в котором по меньшей мере два бита указывают одну из множества конфигураций посредством указания идентификационного номера упомянутой одной из множества конфигураций.
35. Способ по п. 32, в котором многоканальная аудиосистема содержит пять аудиоканалов и при этом конфигурации кодирования соответствуют:
объединенному кодированию пяти аудиоканалов;
объединенному кодированию четырех аудиоканалов и отдельному кодированию последнего аудиоканала;
объединенному кодированию трех аудиоканалов и отдельному объединенному кодированию двух других аудиоканалов; и
объединенному кодированию двух аудиоканалов, отдельному объединенному кодированию двух других аудиоканалов и отдельному кодированию последнего аудиоканала.
36. Способ по п. 35, в котором, в случае когда по меньшей мере два бита указывают объединенное кодирование двух аудиоканалов, отдельное объединенное кодирование двух других аудиоканалов и отдельное кодирование последнего аудиоканала, упомянутые по меньшей мере два бита включают в себя бит, указывающий, какие два аудиоканала должны быть кодированы объединенным образом и какие другие два аудиоканала должны быть кодированы объединенным образом.
37. Способ по п. 33, в котором по меньшей мере два бита указывают одну из множества конфигураций посредством указания идентификационного номера упомянутой одной из множества конфигураций.
38. Способ по п. 33, в котором многоканальная аудиосистема содержит пять аудиоканалов и при этом конфигурации кодирования соответствуют:
объединенному кодированию пяти аудиоканалов;
объединенному кодированию четырех аудиоканалов и отдельному кодированию последнего аудиоканала;
объединенному кодированию трех аудиоканалов и отдельному объединенному кодированию двух других аудиоканалов; и
объединенному кодированию двух аудиоканалов, отдельному объединенному кодированию двух других аудиоканалов и отдельному кодированию последнего аудиоканала.
39. Способ по п. 38, в котором, в случае когда по меньшей мере два бита указывают объединенное кодирование двух аудиоканалов, отдельное объединенное кодирование двух других аудиоканалов и отдельное кодирование последнего аудиоканала, упомянутые по меньшей мере два бита включают в себя бит, указывающий, какие два аудиоканала должны быть кодированы объединенным образом и какие другие два аудиоканала должны быть кодированы объединенным образом.
Пресс для выдавливания из деревянных дисков заготовок для ниточных катушек | 1923 |
|
SU2007A1 |
Способ обработки целлюлозных материалов, с целью тонкого измельчения или переведения в коллоидальный раствор | 1923 |
|
SU2005A1 |
Пресс для выдавливания из деревянных дисков заготовок для ниточных катушек | 1923 |
|
SU2007A1 |
Изложница с суживающимся книзу сечением и с вертикально перемещающимся днищем | 1924 |
|
SU2012A1 |
Изложница с суживающимся книзу сечением и с вертикально перемещающимся днищем | 1924 |
|
SU2012A1 |
СОВМЕСТИМОЕ МНОГОКАНАЛЬНОЕ КОДИРОВАНИЕ/ДЕКОДИРОВАНИЕ | 2004 |
|
RU2327304C2 |
Авторы
Даты
2018-05-07—Публикация
2014-09-08—Подача