Показать метаданные Скрыть метаданные

(19)

(11)

2 383 942

(13)

(51)

МПК

G10L19/00(2006-01-01)

(21) (22)

Заявка

2008112174/09, 2006-08-30

(24)

Дата начала отсчета патента

2006-08-30

(22)

дата подачи заявки

2006-08-30

(45)

опубликовано

2010-03-10

(72)

авторы

Панг Хее СукОх Хиеон О.Ким Донг СооЛим Дзае ХиунДзунг Йанг Вон

(73)

патентообладатели

Элджи Электроникс Инк.

(56)

Документы, цитированные в отчете о поиске

US 6631352 B1, 2003.10.07US 6339760 B1, 2002.01.15DE 69712383 T2, 2003.01.23.

СПОСОБ И УСТРОЙСТВО ДЛЯ ДЕКОДИРОВАНИЯ АУДИОСИГНАЛА Российский патент 2010 года по МПК G10L19/00

Описание патента на изобретение RU2383942C2

Область техники, к которой относится изобретение

Настоящее изобретение относится к обработке аудиосигналов, а более конкретно к устройству декодирования аудиосигнала и способу для этого.

Уровень техники

В общем, в случае аудиосигнала устройство кодирования аудиосигнала сжимает аудиосигнал в сигнал понижающего микширования моно- или стереофонического типа вместо сжатия каждого многоканального аудиосигнала. Устройство кодирования аудиосигнала передает сжатый сигнал понижающего микширования в устройство декодирования вместе с пространственным информационным сигналом или сохраняет сжатый сигнал понижающего микширования и пространственный информационный сигнал в носителе хранения. В этом случае пространственный информационный сигнал, который извлекается при понижающем микшировании многоканального аудиосигнала, используется при восстановлении исходного многоканального аудиосигнала из сигнала понижающего микширования.

Конфигурационная информация, в общем, является неизменяемой, и заголовок, включающий в себя эту информацию, вставляется в аудиосигнал один раз. Поскольку конфигурационная информация передается посредством вставки в аудиосигнал один раз, устройство декодирования аудиосигнала имеет проблему при декодировании пространственной информации вследствие отсутствия конфигурационной информации в случае воспроизведения аудиосигнала из случайной точки времени.

Устройство кодирования аудиосигнала формирует сигнал понижающего микширования и пространственный информационный сигнал в потоки битов совместно или в указанном порядке, а затем передает их в устройство декодирования аудиосигнала. Так что, если ненужная информация и т.п. включается в пространственный информационный сигнал, эффективность сжатия и передачи сигналов снижается.

Сущность изобретения

Техническая задача

Цель настоящего изобретения заключается в том, чтобы предоставить устройство декодирования аудиосигнала и способ для этого, посредством которых аудиосигнал может быть воспроизведен из произвольной точки времени посредством выборочного включения пространственного информационного сигнала в заголовок.

Другая цель настоящего изобретения заключается в том, чтобы предоставить устройство декодирования аудиосигнала и способ для этого, посредством которых позиция временного интервала, к которой применяется набор параметров, может быть эффективно представлена с помощью произвольного числа битов.

Другая цель настоящего изобретения заключается в том, чтобы предоставить устройство декодирования аудиосигнала и способ для этого, посредством которых эффективность сжатия и передачи аудиосигналов может быть повышена посредством представления количества информации, требуемого для осуществления компоновки сигнала понижающего микширования или привязки многоканального сигнала к громкоговорителю, как минимального переменного числа битов.

Дополнительная цель настоящего изобретения заключается в том, чтобы предоставить устройство декодирования аудиосигнала и способ для этого, посредством которых количество информации, требуемое для компоновки сигнала, может быть уменьшено посредством привязки многоканального сигнала к громкоговорителю без выполнения компоновки сигнала понижающего микширования.

Техническое решение

Вышеупомянутые цели, признаки и преимущества изобретения излагаются в нижеприведенном описании и частично должны стать очевидными из описания. Варианты осуществления настоящего изобретения, которые допускают вышеупомянутые цели, излагаются со ссылкой на прилагаемые чертежи.

Далее приводится подробное описание одного предпочтительного варианта осуществления настоящего изобретения, примеры которого проиллюстрированы на прилагаемых чертежах.

Фиг.1 - это конфигурационная схема аудиосигнала, передаваемого в устройство декодирования аудиосигналов из устройства кодирования аудиосигналов, согласно одному варианту осуществления настоящего изобретения.

Ссылаясь на фиг.1, аудиосигнал включает в себя дескриптор 101 аудио, сигнал 103 понижающего микширования и пространственный информационный сигнал 105.

В случае использования схемы кодирования для воспроизведения аудиосигнала в широковещательной передаче и т.п. аудиосигнал может включать в себя вспомогательные данные, а также дескриптор 101 аудио и сигнал 103 понижающего микширования. Также настоящее изобретение включает пространственный информационный сигнал 105 в качестве вспомогательных данных. Чтобы устройство декодирования аудиосигнала знало базовую информацию по аудиокодеку без анализа аудиосигнала, аудиосигнал может выборочно включать в себя дескриптор 101 аудио. Дескриптор 101 аудио сконфигурирован с небольшим количеством элементов базовой информации, требуемых для декодирования аудио, таких как скорость передачи для передаваемого аудиосигнала, число каналов, частота дискретизации сжатых данных, идентификатор, указывающий текущий использованный кодек, и т.п.

Устройство декодирования аудиосигнала может узнать тип кодека, применяемого к аудиосигналу, с помощью дескриптора 101 аудио. В частности, с помощью дескриптора 101 аудио устройство декодирования аудиосигнала может знать то, конфигурирует ли аудиосигнал многоканальный сигнал с помощью пространственного информационного сигнала 105 и сигнала 103 понижающего микширования. Дескриптор 101 аудио размещается независимо от сигнала 103 понижающего микширования или пространственного информационного сигнала 105, включенного в аудиосигнал. Например, дескриптор 101 аудио размещается в отдельном поле, указывающем аудиосигнал. В случае если заголовок не включен в сигнал 103 понижающего микширования, устройство декодирования аудиосигнала может декодировать сигнал 103 понижающего микширования с помощью дескриптора 101 аудио.

Сигнал 103 понижающего микширования - это сигнал, формируемый из многоканального сигнала понижающего микширования. Кроме того, сигнал 103 понижающего микширования может быть сформирован из блока понижающего микширования, включенного в устройство кодирования аудиосигнала, или сформирован искусственно. Сигнал 103 понижающего микширования может быть классифицирован на случай включения заголовка и случай невключения заголовка. В случае если сигнал 103 понижающего микширования включает в себя заголовок, заголовок включается в каждый кадр посредством блока кадров. В случае если сигнал 103 понижающего микширования не включает в себя заголовок, как упоминалось в предшествующем описании, сигнал 103 понижающего микширования может быть декодирован с помощью дескриптора 101 аудио. Сигнал 103 понижающего микширования принимает либо форму включения заголовка для каждого кадра, либо форму невключения заголовка в кадр. Также сигнал 103 понижающего микширования включается в аудиосигнал таким же образом, пока содержимое не завершается.

Пространственный информационный сигнал 105 также классифицируется на случай включения заголовка 107 и пространственной информации 111 и случай включения только пространственной информации 111 без включения заголовка. Заголовок 107 пространственного информационного сигнала 105 отличается от заголовка сигнала 103 понижающего микширования тем, что он необязательно должен вставляться в каждый кадр идентично. В частности, пространственный информационный сигнал 105 может совместно использовать и кадр, включающий в себя заголовок, и кадр, не включающий в себя заголовок. Большая часть информации, включенная в заголовок 107 пространственного информационного сигнала 105, - это конфигурационная информация 109, которая декодирует пространственную информацию 111 посредством интерпретации пространственной информации 111. Пространственная информация 111 сконфигурирована с помощью кадров, каждый из которых включает в себя временные интервалы. Временной интервал означает каждый временной интервал в случае деления кадра по временным интервалам. Число временных интервалов, включенных в один кадр, включается в конфигурационную информацию 109.

Конфигурационная информация 109 включает в себя информацию компоновки сигнала, число блоков преобразования сигнала, информацию конфигурации канала, информацию привязки к громкоговорителю и т.п., а также число временных интервалов.

Информация компоновки сигнала - это идентификатор, который указывает то, будет ли аудиосигнал скомпонован для повышающего сведения до восстановления декодированного сигнала 103 понижающего микширования в многоканальный сигнал.

Блок преобразования сигналов означает модуль OTT (один-в-два), преобразующий один сигнал 103 понижающего микширования в два сигнала, или модуль TTT (два-в-три), преобразующий два сигнала 103 понижающего микширования в три сигнала, при формировании многоканального сигнала посредством повышающего сведения сигнала 103 понижающего микширования. В частности, OTT- или TTT-модуль - это концептуальный модуль, используемый при восстановлении многоканального сигнала посредством включения в блок повышающего сведения (не показан на чертеже) устройства декодирования аудиосигнала. Помимо этого, информация для типов и числа блоков преобразования сигнала включена в пространственный информационный сигнал 105.

Информация конфигурации канала - это информация, указывающая конфигурацию блока повышающего сведения, включенного в устройство декодирования аудиосигнала. Информация конфигурации канала включает в себя идентификатор, указывающий то, проходит или нет аудиосигнал через блок преобразования сигнала. Устройство декодирования аудиосигнала может знать, проходит ли аудиосигнал, вводимый в блок повышающего сведения, через блок преобразования сигнала, или не использует информацию конфигурации канала. Устройство декодирования аудиосигнала выполняет повышающее сведение сигнала 103 понижающего микширования в многоканальный аудиосигнал с помощью информации для блока преобразования сигналов, информации конфигурации канала и т.п. Устройство декодирования аудиосигналов формирует многоканальный сигнал посредством повышающего сведения сигнала 103 понижающего микширования с помощью информации блока преобразования сигнала, информации конфигурации канала и т.п., включенной в пространственную информацию 111.

Информация привязки к громкоговорителям - это информация, указывающая то, к какому громкоговорителю должен быть привязан многоканальный аудиосигнал, при выводе многоканальных аудиосигналов, формируемых посредством повышающего сведения для громкоговорителей, соответственно. Устройство декодирования аудиосигналов выводит многоканальный аудиосигнал в соответствующий громкоговоритель с помощью информации привязки к громкоговорителю, включенной в конфигурационную информацию 109.

Пространственная информация 111 - это информация, используемая для того, чтобы предоставлять пространственную чувствительность при формировании многоканальных аудиосигналов посредством комбинирования с сигналом понижающего микширования. Пространственная информация включает в себя CLD (разности уровней каналов), указывающие разность энергии между аудиосигналами, ICC (межканальные корреляции), указывающие тесную корреляцию или похожесть между аудиосигналами, CPC (коэффициенты прогнозирования каналов), указывающие коэффициент для того, чтобы прогнозировать значение аудиосигнала с помощью других сигналов и т.п. Помимо этого, набор параметров указывает пакет этих параметров.

Кроме того, идентификатор кадра, указывающий то, является позиция временного интервала, к которому применяется набор параметров, фиксированной или нет, число наборов параметров, применяемых к одному кадру, информация позиции временного интервала, к которому применяется набор параметров, и т.п. включены в пространственную информацию 111.

Фиг.2 - это блок-схема последовательности операций способа декодирования аудиосигнала согласно другому варианту осуществления настоящего изобретения.

Ссылаясь на фиг.2, устройство декодирования аудиосигналов принимает пространственный информационный сигнал 105, передаваемый в форме потока битов, посредством устройства кодирования аудиосигналов (S201). Пространственный информационный сигнал 105 может передаваться в форме потока отдельно от потока сигнала 103 понижающего микширования или передаваться посредством включения во вспомогательные данные или данные расширения сигнала 103 понижающего микширования.

В случае если пространственный информационный сигнал 105 передается посредством комбинирования с сигналом 103 понижающего микширования, блок демультиплексирования (не показан) устройства декодирования аудиосигналов разделяет аудиосигнал на кодированный сигнал 103 понижающего микширования и кодированный пространственный информационный сигнал 105. Кодированный пространственный информационный сигнал 105 включает в себя заголовок 107 и пространственную информацию 111. Устройство декодирования аудиосигнала определяет то, включен ли заголовок 107 в пространственный информационный сигнал 105 (S203).

Если заголовок 107 включен в пространственный информационный сигнал 105, устройство декодирования аудиосигналов извлекает конфигурационную информацию 109 из заголовка 107 (S205).

Устройство декодирования аудиосигналов определяет то, извлечена ли конфигурационная информация из первого заголовка 107, включенного в пространственный информационный сигнал 105 (S207).

Если конфигурационная информация 109 извлечена из заголовка 107, извлеченного из пространственного информационного сигнала 105, устройство декодирования аудиосигналов декодирует конфигурационную информацию 109 (S215) и декодирует пространственную информацию 111, передаваемую после конфигурационной информации 109, согласно декодированной конфигурационной информации 109.

Если заголовок 107, извлеченный из аудиосигнала, не является заголовком 107, извлеченным первым из пространственного информационного сигнала 105, устройство декодирования аудиосигналов определяет то, является ли конфигурационная информация 109, извлеченная из заголовка 107, идентичной конфигурационной информации 109, извлеченной из первого заголовка 107 (S209).

Если конфигурационная информация 109 идентична конфигурационной информации 109, извлеченной из первого заголовка 107, устройство декодирования аудиосигналов декодирует пространственную информацию 111 с помощью декодированной конфигурационной информации 109, извлеченной из первого заголовка 107. Если извлеченная конфигурационная информация 109 не идентична конфигурационной информации 109, извлеченной из первого заголовка 107, устройство декодирования аудиосигнала определяет то, возникает ли ошибка в аудиосигнале или пути передачи от устройства кодирования аудиосигналов к устройству декодирования аудиосигналов (S211).

Если конфигурационная информация 109 является переменной, ошибки не возникает даже в том случае, если конфигурационная информация 109 не идентична конфигурационной информации 109, извлеченной из первого заголовка 107. Следовательно, устройство декодирования аудиосигнала обновляет заголовок 107 в переменный заголовок 107 (S213). Устройство декодирования аудиосигналов затем декодирует конфигурационную информацию 109, извлеченную из обновленного заголовка 107 (S215).

Устройство декодирования аудиосигналов декодирует пространственную информацию 111, передаваемую после конфигурационной информации 109, согласно декодированной конфигурационной информации 109.

Если конфигурационная информация 109, которая не является переменной, не идентична конфигурационной информации 109, извлеченной из первого заголовка 107, это означает то, что возникает ошибка в пути передачи аудиосигнала. Соответственно, устройство декодирования аудиосигналов удаляет пространственную информацию 111, включенную в пространственный информационный сигнал 105, в том числе ошибочную конфигурационную информацию 109, или исправляет ошибку пространственной информации 111 (S217).

Фиг.3 - это блок-схема последовательности операций способа декодирования аудиосигнала согласно другому варианту осуществления настоящего изобретения.

Ссылаясь на фиг.3, устройство декодирования аудиосигналов принимает аудиосигнал, включающий в себя сигнал 103 понижающего микширования и пространственный информационный сигнал 105, из устройства кодирования аудиосигнала (S301).

Устройство декодирования аудиосигналов разделяет принимаемый аудиосигнал на пространственный информационный сигнал 105 и сигнал 103 понижающего микширования (S303), а затем отправляет отделенную пространственную информацию 105 и отделенный сигнал 103 понижающего микширования в базовый блок декодирования (не показан) и блок декодирования пространственной информации (не показан), соответственно.

Устройство декодирования аудиосигналов извлекает число временных интервалов и число наборов параметров из пространственного информационного сигнала 105. Устройство декодирования аудиосигналов находит позицию временного интервала, к которому должен быть применен набор параметров, с помощью извлеченного числа временных интервалов и наборов параметров. Согласно порядку соответствующего набора параметров позиция временного интервала, к которой должен быть применен соответствующий набор параметров, представляется как переменное число битов. Помимо этого, посредством уменьшения числа битов, представляющих позицию временного интервала, к которой должен быть применен соответствующий набор параметров, можно эффективно представить пространственный информационный сигнал 105. Помимо этого, позиция временного интервала, к которой должен быть применен соответствующий набор параметров, подробнее поясняется со ссылкой на фиг.4 и фиг.5.

После того как получена позиция временного интервала, устройство декодирования аудиосигналов декодирует пространственный информационный сигнал 105 посредством применения соответствующего набора параметров к соответствующей позиции (S305). Также устройство декодирования аудиосигналов декодирует сигнал 103 понижающего микширования в базовом блоке декодирования (S305).

Устройство декодирования аудиосигналов может формировать многоканальный сигнал посредством повышающего сведения декодированного сигнала 103 понижающего микширования как есть. Но устройство декодирования аудиосигналов может скомпоновать последовательность декодированных сигналов 103 понижающего микширования до того, как устройство декодирования аудиосигналов выполняет повышающее сведение соответствующих сигналов (S307).

Устройство декодирования аудиосигналов формирует многоканальный сигнал с помощью декодированного сигнала 103 понижающего микширования и декодированного пространственного информационного сигнала 105 (S309). Устройство декодирования аудиосигналов использует пространственный информационный сигнал 105 для того, чтобы сформировать сигнал 103 понижающего микширования в многоканальный сигнал. Как упоминалось в вышеприведенном описании, пространственный информационный сигнал 105 включает в себя ряд блоков преобразования сигнала и информацию конфигурации канала для представления того, проходит ли сигнал 103 понижающего микширования через блок преобразования сигналов при повышающем сведении или выводе без прохождения через блок преобразования сигналов. Устройство декодирования аудиосигналов выполняет повышающее сведение сигнала 103 понижающего микширования с помощью ряда блоков преобразования сигналов, информации конфигурации канала и т.п. (S309). Способ представления информации конфигурации канала и способ конфигурирования информации конфигурации канала с помощью меньшего числа битов поясняется со ссылками на фиг.6 и фиг.7 ниже.

Устройство декодирования аудиосигналов привязывает многоканальный аудиосигнал к громкоговорителю в заранее заданной последовательности, чтобы вывести сформированные многоканальные аудиосигналы (S311). В этом случае, поскольку последовательность привязанных аудиосигналов возрастает, число битов для привязки многоканального аудиосигнала к громкоговорителю становится меньше. В частности, в случае если номера предоставляются многоканальным аудиосигналам по порядку, поскольку первый аудиосигнал может быть привязан к одному или более громкоговорителей, количество информации, необходимое для привязки аудиосигнала к громкоговорителю, больше, чем требуется для привязки второго или последующего аудиосигнала. Поскольку второй или последующий аудиосигнал привязывается к одному из остальных громкоговорителей за исключением первого громкоговорителя, привязанного к первому аудиосигналу, количество информации, требуемое для привязки, уменьшается. В частности, за счет снижения количества информации, требуемой для привязки аудиосигнала по мере того, как последовательность привязанных аудиосигналов возрастает, можно эффективно представлять пространственный информационный сигнал 105. Этот способ также применим к способу компоновки сигналов 103 понижающего микширования на этапе S307.

Фиг.4 - это синтаксис информации позиции временного интервала, к которой применяется набор параметров, согласно одному варианту осуществления настоящего изобретения.

Ссылаясь на фиг.4, синтаксис относится к FramingInfo 401, чтобы представлять информацию для числа наборов параметров и информацию для временного интервала, к которому применяется набор параметров.

Поле 403 bsFramingType указывает то, является ли кадр, включенный в пространственный информационный сигнал 105, фиксированным кадром или переменным кадром. Фиксированный кадр означает кадр, в котором позиция временного интервала, к которой набор параметров должен быть применен, заранее задана. В частности, позиция временного интервала, к которой должен быть применен набор параметров, определяется согласно заранее заданному правилу. Переменный кадр означает кадр, в котором позиция временного интервала, к которой набор параметров должен быть применен, еще не задана. Так что переменный кадр дополнительно требует информации позиции временного интервала для представления позиции временного интервала, к которой должен быть применен набор параметров. В нижеследующем описании bsFramingType 403 должен быть назван "идентификатором кадра", указывая то, является кадр фиксированным кадром или переменным кадром.

В случае переменного кадра поле 407 или 411 для bsParamSlot указывает информацию позиции временного интервала, к которой должен быть применен набор параметров. Поле 407 bsParamSlot[0] указывает позицию временного интервала, к которой должен быть применен первый набор параметров, а поле 411 bsParamSlot[ps] указывает позицию временного интервала, к которой второй или последующий набор параметров должен быть применен. Позиция временного интервала, к которой первый набор параметров должен быть применен, представляется как начальное значение, а позиция временного интервала, к которой второй или последующий набор параметров должен быть применен, представляется как значение разности bsDiffParamSlot[ps] 409, т.е. разность между bsParamSlot[ps] и bsParamSlot[ps-1].

В этом случае "ps" означает набор параметров. Первый набор параметров представляется как ps=0. Также ps может представлять значение в диапазоне от 0 до значения, меньшего общего числа набора параметров.

(i) Позиция 407 или 409 временного интервала, к которой должен быть применен набор параметров, увеличивается по мере того, как возрастает значение ps (bsParamSlot[ps]>bsParamSlot[ps-1]).

(ii) Для первого набора параметров максимальное значение позиции временного интервала, к которой должен быть применен первый набор параметров, соответствует значению, получающемуся в результате прибавления 1 к разности между номером временного интервала и номером набора параметров, и позиция временного интервала представляется как количество информации nBitsParamSlot(0) 413.

(iii) Для второго или последующего набора параметров позиция временного интервала, к которой N-ный набор параметров должен быть применен, больше, по меньшей мере, на 1, чем позиция временного интервала, к которой должен быть применен (N-1)-ый набор параметров, и даже может иметь значение, получающееся в результате прибавления значения N к значению, получающемуся в результате вычитания номера набора параметров из номера временного интервала. Позиция временного интервала bsParamSlot[ps], к которой должен быть применен второй или последующий набор параметров, представляется как значение разности bsDiffParamSlot[ps] 409. Кроме того, это значение представляется как количество информации по nBitsParamSlot[ps]. Таким образом, можно найти позицию временного интервала, к которой должен быть применен набор параметров, с помощью (i)-(iii).

Например, если имеется десять временных интервалов, включенных в один пространственный кадр, и если имеется три набора параметров, позиция временного интервала, к которой должен быть применен первый набор параметров (ps=0), применима к позиции временного интервала, получающейся в результате прибавления 1 к значению, получающемуся в результате вычитания общего числа параметров из общего числа временных интервалов. В частности, соответствующая позиция применима к одному из временных интервалов, принадлежащих к диапазону между 1 до максимум 8. Посредством рассмотрения того, что позиция временного интервала, к которой должен быть применен набор параметров, увеличивается согласно числу наборов параметров, можно понять, что позиции временного интервала, к которым применимы два оставшихся набора параметров, составляют максимум 9 и 10, соответственно. Таким образом, позиция 407 временного интервала, к которой должен быть применен первый набор параметров, требует трех битов для того, чтобы указать 1-8, что может быть представлено как ceil{log₂(k-i+1)}. В этом случае "k" - это число временных интервалов, а "i" - это число параметров.

Если позиция 407 временного интервала, к которой должен быть применен первый набор параметров, равна 5, позиция временного интервала bsParamSlot[1], к которой должен быть применен второй набор параметров, должна быть выбрана из значений между "5+1=6" и "10-3+2=9". В частности, позиция временного интервала, к которой должен быть применен второй набор параметров, может быть представлена как значение, получающееся в результате прибавления значения разности bsDiffParamSlot[ps] 409 к значению, получающемуся в результате прибавления 1 к позиции временного интервала, к которой должен быть применен первый набор параметров. Таким образом, значение 409 разности может соответствовать от 0 до 3, что может быть представлено, как два бита. Для второго или последующего набора параметров посредством представления позиции временного интервала, к которой должен быть применен набор параметров, как значения 409 разности вместо представления позиции временного интервала непосредственно, можно уменьшить число битов. В первом примере четыре бита требуется для того, чтобы представить одно из 6-9 в случае представления позиции временного интервала непосредственно. Тем не менее, только два бита требуются для того, чтобы представить позицию временного интервала в качестве значения разности.

Следовательно, информация позиции, указывающая количество nBitsParamSlot(0) или nBitsParamSlot(ps) 413 или 415 временного интервала, к которому должен быть применен набор параметров, может быть представлена не как фиксированное число битов, а как переменное число битов.

Фиг.5 - это блок-схема последовательности операций способа декодирования пространственного информационного сигнала посредством применения набора параметров к временному интервалу согласно другому варианту осуществления настоящего изобретения.

Ссылаясь на фиг.5, устройство декодирования аудиосигналов принимает аудиосигнал, включающий в себя сигнал 103 понижающего микширования и пространственный информационный сигнал 105 (S501).

Если заголовок 107 существует в пространственном информационном сигнале, устройство декодирования аудиосигналов извлекает число временных интервалов, включенных в кадр, из конфигурационной информации 109, включенной в заголовок 107 (S503). Если заголовок 107 не включен в пространственный информационный сигнал, устройство декодирования аудиосигналов извлекает число временных интервалов из конфигурационной информации 109, включенной в ранее извлеченный заголовок 107.

Устройство декодирования аудиосигналов извлекает число наборов параметров, которые должны быть применены к кадру, из пространственного информационного сигнала 105 (S505).

Устройство декодирования аудиосигналов определяет то, являются позиции временных интервалов, к которым наборы параметров должны быть применены, фиксированными или переменными, с помощью идентификатора кадров, включенного в пространственный информационный сигнал 105 (S507).

Если кадр является фиксированным кадром, устройство декодирования аудиосигналов декодирует пространственный информационный сигнал 105 посредством применения набора параметров к соответствующему интервалу согласно заранее заданному правилу (S513).

Если кадр является переменным кадром, устройство декодирования аудиосигналов извлекает информацию для позиции временного интервала, к которой первый набор параметров должен быть применен (S509). Как упоминалось в вышеприведенном описании, позиция временного интервала, к которой должен быть применен первый набор параметров, максимально может быть значением, получающимся в результате прибавления 1 к разности между числом временных интервалов и числом наборов параметров.

Устройство декодирования аудиосигналов получает информацию для позиции временного интервала, к которой должен быть применен второй или последующий набор параметров, с помощью информации для позиции временного интервала, к которой должен быть применен первый набор параметров (S511). Если N - это натуральное число, равное или больше 2, позиция временного интервала, к которой должен быть применен набор параметров, может быть представлена как минимальное число битов, с помощью того факта, что позиция временного интервала, к которой должен быть применен N-ный набор параметров, больше, по меньшей мере, на 1, чем позиция временного интервала, к которой должен быть применен (N-1)-ый набор параметров, и может даже иметь значение, получающееся в результате прибавления N к значению, получающемуся в результате вычитания числа наборов параметров из числа временных интервалов.

Кроме того, устройство декодирования аудиосигналов декодирует пространственный информационный сигнал 105 посредством применения набора параметров к полученной позиции временного интервала (S513).

Фиг.6 и фиг.7 - это схемы блока повышающего сведения устройства декодирования аудиосигналов согласно одному варианту осуществления настоящего изобретения.

Устройство декодирования аудиосигналов разделяет аудиосигнал, принимаемый от устройства кодирования аудиосигналов, на сигнал 103 понижающего микширования и пространственный информационный сигнал 105, а затем декодирует сигнал 103 понижающего микширования и пространственный информационный сигнал 105, соответственно. Как упоминалось в вышеприведенном описании, устройство декодирования аудиосигналов декодирует пространственный информационный сигнал 105 посредством применения параметра к временному интервалу. Также устройство декодирования аудиосигналов формирует многоканальные аудиосигналы с помощью декодированного сигнала 103 понижающего микширования и декодированного пространственного информационного сигнала 105.

Если устройство кодирования аудиосигналов сжимает N входных каналов в M аудиосигналов и передает M аудиосигналов в форме потока битов в устройство декодирования аудиосигналов, устройство декодирования аудиосигналов восстанавливает и выводит исходные N каналов. Эта конфигурация называется структурой N-M-N. В некоторых случаях, если устройство декодирования аудиосигналов не может восстановить N каналов, сигнал 103 понижающего микширования выводится в два стереосигнала без учета пространственного информационного сигнала 105. Тем не менее, это не поясняется дополнительно. Структура, при которой значения N и M являются фиксированными, должна быть названа фиксированной структурой каналов. Структура, при которой значения N и M представляются как произвольные значения, должна быть названа произвольной структурой каналов. В случае такой фиксированной структуры каналов, как 5-1-5, 5-2-5, 7-2-7 и т.п., устройство декодирования аудиосигналов передает аудиосигнал посредством включения структуры каналов в аудиосигнал. Устройство декодирования аудиосигналов затем декодирует аудиосигнал посредством прочтения структуры каналов.

Устройство декодирования аудиосигналов использует блок повышающего сведения, включающий в себя блок преобразования сигналов, для того, чтобы восстановить M аудиосигналов в N многоканальных сигналов. Блок преобразования сигналов - это концептуальный модуль, используемый для того, чтобы преобразовать один сигнал 103 понижающего микширования в два сигнала, или преобразовать два сигнала 103 понижающего микширования в три сигнала, при формировании многоканального сигнала посредством повышающего сведения сигналов 103 понижающего микширования.

Устройство декодирования аудиосигналов может получать информацию для структуры блока повышающего сведения посредством извлечения информации конфигурации канала из информации 109 конфигурации, включенной в пространственный информационный сигнал 105. Как упоминалось в вышеприведенном описании, информация конфигурации канала - это информация, указывающая конфигурацию блока повышающего сведения, включенного в устройство декодирования аудиосигналов. Информация конфигурации канала включает в себя идентификатор, который указывает то, проходит ли аудиосигнал через блок преобразования сигнала. В частности, информация конфигурации каналов может быть представлена как сегментирующий идентификатор, поскольку число входных и выходных сигналов блока преобразования сигналов изменяется в случае, если декодированный сигнал понижающего микширования проходит через блок преобразования сигналов в блок повышающего сведения. Также информация конфигурации канала может быть представлена как несегментирующий идентификатор, поскольку входной сигнал блока преобразования сигналов выводится нетронутым в случае, если декодированный сигнал понижающего микширования не проходит через блок преобразования сигналов, включенный в блок повышающего сведения. В настоящем изобретении сегментирующий идентификатор должен быть представлен как 1, а несегментирующий идентификатор должен быть представлен как 0.

Информация конфигурации канала может быть представлена двумя способами, горизонтальным способом и вертикальным способом.

В горизонтальном способе, если аудиосигнал проходит через блок преобразования сигналов, т.е. если информация конфигурации канала равна 1, то, проходит ли сигнал нижнего уровня, выводимый посредством блока преобразования сигналов, еще через один блок преобразования сигналов, последовательно указывается посредством сегментирующего или несегментирующего идентификатора. Если информация конфигурации канала равна 0, то, проходит ли следующий аудиосигнал того же или верхнего уровня через блок преобразования сигналов, указывается посредством сегментирующего или несегментирующего идентификатора.

В вертикальном способе то, проходит ли каждый из всех аудиосигналов верхнего уровня через блок преобразования сигналов, последовательно указывается посредством сегментирующего или несегментирующего идентификатора независимо от того, проходит ли аудиосигнал верхнего уровня через блок преобразования сигналов, а затем указывается, проходит ли аудиосигнал нижнего уровня через блок преобразования сигналов.

Для структуры того же блока повышающего сведения фиг.6 примерно показывает то, что информация конфигурации канала представляется посредством горизонтального способа, а фиг.7 примерно показывает, что информация конфигурации канала представляется посредством вертикального способа. На фиг.6 и фиг.7 блок преобразования сигналов использует OTT-модуль, например.

Ссылаясь на фиг.6, четыре аудиосигнала X₁-X₄ входят в блок повышающего сведения. X₁ входит в первый блок преобразования сигналов и затем преобразуется в два сигнала 601 и 603. Блок преобразования сигналов, включенный в блок повышающего сведения, преобразует аудиосигнал с помощью пространственных параметров, таких как CLD, ICC и т.п. Сигналы 601 и 603, преобразованные посредством первого блока преобразования сигналов, входят во второй блок преобразования и третий блок преобразования, чтобы быть выведенными как многоканальные аудиосигналы Y₁-Y₄. X₂ входит в четвертый блок преобразования сигналов и затем выводится как Y₅ и Y₆. Также X₃ и X₄ непосредственно выводятся без прохождения через блоки преобразования сигналов.

Поскольку X₁ проходит через первый блок преобразования сигналов, информация конфигурации канала представляется как сегментирующий идентификатор 1. Поскольку информация конфигурации канала представляется посредством горизонтального способа на фиг.6, если информация конфигурации канала представляется как сегментирующий идентификатор, то, проходят ли два сигнала 601 и 603, выводимые посредством блока преобразования первого блока преобразования сигналов, через другие блоки преобразования сигналов, последовательно представляется как сегментирующий или несегментирующий идентификатор.

Сигнал 601 из двух выводимых сигналов первого блока преобразования сигналов проходит через второй блок преобразования сигналов, тем самым представляясь как сегментирующий идентификатор 1. Сигнал посредством второго блока преобразования сигналов выводится нетронутым без прохождения через другой блок преобразования сигналов, тем самым представляясь как несегментирующий идентификатор 0.

Если информация конфигурации канала равна 0, то, проходит ли следующий аудиосигнал того же или верхнего уровня через блок преобразования сигналов, представляется как сегментирующий или несегментирующий идентификатор. Таким образом, информация конфигурации канала представляется для X₂ верхнего уровня.

X₂, который проходит через четвертый блок преобразования сигналов, представляется как сегментирующий идентификатор 1. Сигналы через четвертый блок преобразования сигналов непосредственно выводятся как Y₅ и Y₆, тем самым представляясь как несегментирующие идентификаторы 0, соответственно.

X₃ и X₄, которые непосредственно выводятся без прохождения через блоки преобразования сигналов, представляются как несегментирующие идентификаторы 0, соответственно.

Следовательно, информация конфигурации канала представляется как 110010010000 посредством горизонтального способа. В этом случае информация конфигурации канала извлекается посредством конфигурирования блока повышающего сведения для удобства понимания. Тем не менее, устройство декодирования аудиосигналов считывает информацию конфигурации канала, чтобы получить информацию по структуре блока повышающего сведения в обратном порядке.

Ссылаясь на фиг.7, как и на фиг.6, четыре аудиосигнала X₁-X₄ входят в блок повышающего сведения. Поскольку информация конфигурации канала представляется как сегментирующий или несегментирующий идентификатор с верхнего уровня или нижнего уровня посредством вертикального способа, идентификаторы аудиосигналов первого уровня 701 как самого верхнего уровня представляются последовательно. В частности, поскольку X₁ и X₂ проходят через первый и четвертый блок преобразования сигналов, соответственно, каждая информация конфигурации канала становится равной 1. Поскольку X₃и X₄ не проходят через блоки преобразования сигналов, каждая информация конфигурации канала становится равной 0. Таким образом, информация конфигурации канала первого уровня 701 становится равной 1100. Аналогичным образом, если представляются последовательно, информация конфигурации канала второго уровня 703 и третьего уровня 705 становится равной 1100 и 0000 соответственно. Следовательно, вся информация конфигурации канала, представляемая посредством вертикального способа, становится равной 110011000000.

Устройство декодирования аудиосигналов считывает информацию конфигурации канала и затем конфигурирует блок повышающего сведения. Чтобы устройство декодирования аудиосигнала сконфигурировало блок повышающего сведения, идентификатор, указывающий то, представляется конфигурация канала посредством горизонтального способа или вертикального способа, должен быть включен в аудиосигнал. Альтернативно, информация конфигурации канала, как правило, представляется посредством горизонтального способа. Тем не менее, если эффективно представлять информацию конфигурации канала посредством вертикального способа, устройство кодирования аудиосигналов может предоставлять идентификатор, указывающий то, что конфигурация канала представляется посредством вертикального способа, который должен быть включен в аудиосигнал.

Устройство декодирования аудиосигналов считывает информацию конфигурации канала, представляемую посредством горизонтального способа, а затем может конфигурировать блок повышающего сведения. Тем не менее, в том случае, если информация конфигурации канала представляется посредством вертикального способа, устройство декодирования аудиосигналов может конфигурировать блок повышающего сведения только в том случае, если знает число блоков преобразования сигнала, включенных в блок повышающего сведения, или число входных и выходных каналов. Таким образом, устройство декодирования аудиосигналов может конфигурировать блок повышающего сведения способом извлечения числа блоков преобразования сигналов или числа входных и выходных каналов из конфигурационной информации 109, включенной в пространственный информационный сигнал 105.

Устройство декодирования аудиосигналов интерпретирует информацию конфигурации канала последовательно с начала. В случае обнаружения числа сегментирующих идентификаторов 1, включенных в информацию конфигурации канала, равным тому, какое число блоков преобразования сигналов, извлеченных из информации конфигурации, устройство декодирования аудиосигналов не должно дополнительно считывать информацию конфигурации канала. Это обусловлено тем, что число сегментирующих идентификаторов 1, включенных в информацию конфигурации канала, равно числу блоков преобразования сигнала, включенных в блок повышающего сведения, поскольку сегментирующий идентификатор 1 указывает то, что аудиосигнал введен в блок преобразования сигналов.

В частности, как упоминалось в вышеприведенном примере, если информация конфигурации канала, представляемая посредством вертикального способа, равна 110011000000, устройство декодирования аудиосигналов должно считать всего 12 битов, чтобы декодировать информацию конфигурации канала. Тем не менее, если устройство декодирования аудиосигналов обнаруживает то, что число блоков преобразования сигнала равно 4, устройство декодирования аудиосигналов декодирует информацию конфигурации канала до тех пор, пока число единиц, включенных в информацию конфигурации канала, не появляется четыре раза. А именно, устройство декодирования аудиосигналов декодирует информацию конфигурации канала только вплоть до 110011. Это обусловлено тем, что остальные значения представляются как несегментирующие идентификаторы 0, несмотря на неиспользование информации конфигурации канала дополнительно. Следовательно, поскольку устройству декодирования аудиосигналов не обязательно декодировать шесть битов, эффективность декодирования может быть повышена.

В случае если структура канала является заранее заданной фиксированной структурой канала, дополнительная информация не требуется, поскольку число блоков преобразования сигналов или число входных и выходных каналов включено в конфигурационную информацию, которая включена в пространственный информационный сигнал 105. Тем не менее, в случае если структура канала является произвольной структурой канала, из которой структура канала еще не определена, дополнительная информация необходима для того, чтобы указать число блоков преобразования сигналов или число входных и выходных каналов, поскольку число блоков преобразования сигналов или число входных и выходных каналов не включено в пространственный информационный сигнал 105.

Для примера информации для блока преобразования сигналов, в случае использования только OTT-модуля в качестве блока преобразования сигналов информация для указания блока преобразования сигналов может быть представлена максимум как 5 битов. В случае если входной сигнал, поступающий в блок повышающего сведения, проходит через OTT- или TTT-модуль, один входной сигнал преобразуется в два сигнала или два входных сигнала преобразуются в три сигнала. Таким образом, число выходных каналов становится значением, получающимся в результате добавления числа OTT- или TTT-модулей к входному сигналу. Соответственно, число блоков преобразования сигналов становится значением, получающимся в результате вычитания числа входных сигналов и числа TTT-модулей из числа выходных каналов. Поскольку можно использовать максимум 32 выходных канала, в общем, информация для указания блоков преобразования сигналов может быть представлена как значение в рамках пяти битов.

Следовательно, если информация конфигурации канала представляется посредством вертикального способа, и если структура канала является произвольной структурой канала, устройство кодирования аудиосигналов должно представить число блоков преобразования сигналов максимум как пять битов в пространственном информационном сигнале 105. В вышеприведенном примере 6-битовая информация конфигурации канала и 5-битовая информация для указания блоков преобразования сигналов требуется. А именно, всего одиннадцать битов требуется. Это указывает то, что количество битов, требуемое для конфигурирования блока повышающего сведения, снижается в отличие от информации конфигурации канала, представляемой посредством горизонтального способа. Следовательно, если информация конфигурации канала представляется посредством вертикального способа, число битов может быть уменьшено.

Фиг.8 - это блок-схема устройства декодирования аудиосигналов согласно одному варианту осуществления настоящего изобретения.

Ссылаясь на фиг.8, устройство декодирования аудиосигналов согласно одному варианту осуществления настоящего изобретения включает в себя блок приема, блок демультиплексирования, блок декодирования пространственной информации, блок компоновки сигналов, блок формирования многоканальных сигналов и блок привязки к громкоговорителю.

Блок 801 приема принимает аудиосигнал, включающий в себя сигнал 103 понижающего микширования и пространственный информационный сигнал 105.

Блок 803 демультиплексирования разделяет аудиосигнал, принимаемый посредством блока 801 приема, в кодированный сигнал 103 понижающего микширования и кодированный пространственный информационный сигнал 105, а затем отправляет кодированный сигнал 103 понижающего микширования и кодированный пространственный информационный сигнал в базовый блок 805 декодирования и блок 807 декодирования пространственной информации соответственно.

Блок 805 декодирования кодера и блок 807 декодирования пространственной информации декодируют кодированный сигнал понижающего микширования и кодированный пространственный информационный сигнал соответственно.

Как упоминалось в вышеприведенном описании, блок 807 декодирования пространственной информации декодирует пространственный информационный сигнал 105 посредством извлечения идентификатора кадров, числа временных интервалов, числа наборов параметров, информации позиции временных интервалов и т.п. из пространственного информационного сигнала 105 и посредством применения набора параметров к соответствующему временному интервалу.

Устройство декодирования аудиосигналов может включать в себя блок 809 компоновки сигналов. Блок 809 компоновки сигналов компонует множество сигналов понижающего микширования согласно заранее заданной компоновке, чтобы выполнить повышающее сведение декодированного сигнала 103 понижающего микширования. В частности, блок 809 компоновки сигналов компонует M сигналов понижающего микширования на M' аудиосигналов в конфигурации каналов N-M-N.

Устройство декодирования аудиосигналов может непосредственно выполнять повышающее сведение сигналов понижающего микширования согласно последовательности, в которой сигналы понижающего микширования прошли через базовый блок 805 декодирования. Тем не менее, в некоторых случаях устройство декодирования аудиосигналов может выполнять повышающее сведение после того, как устройство декодирования аудиосигналов скомпонует последовательность сигналов понижающего микширования.

При определенных обстоятельствах компоновка сигналов может быть осуществлена для сигналов, входящих в модуль преобразования сигналов, который выполняет повышающее сведение двух низведенных сигналов в три сигнала.

В случае выполнения компоновки сигналов для аудиосигналов или в случае выполнения компоновки сигналов только для входного сигнала TTT-модуля, информация компоновки сигналов, указывающая соответствующий случай, должна быть включена в аудиосигнал посредством устройства кодирования аудиосигналов. В этом случае информация компоновки сигналов - это идентификатор, указывающий то, должны ли последовательности сигналов быть скомпонованы для повышающего сведения перед восстановлением аудиосигнала в многоканальный сигнал, должна ли компоновка выполняться только для конкретного сигнала, и т.п.

Если заголовок 107 включен в пространственный информационный сигнал 105, устройство декодирования аудиосигналов компонует сигналы понижающего микширования с помощью информации компоновки аудиосигналов, включенной в конфигурационную информацию 109, извлеченную из заголовка 107.

Если заголовок 107 не включен в пространственный информационный сигнал 105, устройство декодирования аудиосигналов может компоновать аудиосигналы с помощью информации компоновки аудиосигналов, извлеченной из конфигурационной информации 109, включенной в предыдущий заголовок 107.

Устройство декодирования аудиосигналов может не выполнять компоновку сигналов понижающего микширования. В частности, устройство декодирования аудиосигналов может формировать многоканальный сигнал посредством непосредственного повышающего сведения сигнала, декодированного и переданного в блок 811 формирования многоканального сигнала посредством базового блока 805 декодирования, вместо выполнения компоновки сигнала понижающего микширования. Это обусловлено тем, что требуемая цель компоновки сигналов может быть достигнута посредством привязки сформированного многоканального сигнала к громкоговорителям. В этом случае можно сжимать и передавать аудиосигнал более эффективно посредством невыполнения вставки информации по компоновке сигнала понижающего микширования в аудиосигнал. Также сложность устройства декодирования может быть снижена за счет невыполнения дополнительной компоновки сигналов.

Блок 809 компоновки сигналов отправляет скомпонованный сигнал понижающего микширования в блок 811 формирования многоканальных сигналов. Кроме того, блок 809 декодирования пространственной информации также отправляет декодированный пространственный информационный сигнал 105 в блок 811 формирования многоканальных сигналов. Помимо этого, блок 811 формирования многоканальных сигналов формирует многоканальный сигнал с помощью сигнала понижающего микширования 103 и пространственного информационного сигнала 105.

Устройство декодирования аудиосигналов включает в себя блок 813 привязки к громкоговорителям, чтобы выводить аудиосигнал посредством блока 811 формирования многоканальных сигналов в громкоговоритель.

Блок 813 привязки к громкоговорителям определяет то, какой многоканальный аудиосигнал должен быть выведен посредством привязки к какому громкоговорителю. Помимо этого, типы громкоговорителей, используемых для того, чтобы выводить аудиосигналы, в общем, показаны в нижеприведенной таблице.

BsOutputChannelPos Громкоговоритель 0 FL - передний левый 1 FR - передний правый 2 FC - передний центральный 3 LFE - низкочастотная оптимизация 4 BL - задний левый 5 BR - задний правый 6 FLC - передний левый центральный 7 FRC - передний правый центральный 8 BC - задний центральный 9 SL - боковой левый 10 SR - боковой правый 11 TC - верхний центральный 12 TFL - верхний передний левый 13 TFC - верхний передний центральный 14 TFR - верхний передний правый 15 TBL - верхний задний левый 16 TBC - верхний задний центральный 17 TBR - верхний задний правый 18...31 Зарезервировано

В общем, максимум 32 громкоговорителя доступно для привязки к выводимому аудиосигналу. Таким образом, как показано в таблице, блок 813 привязки к громкоговорителю дает возможность аудиосигналу быть привязанным к громкоговорителю ("Громкоговоритель"), соответствующему каждому номеру, способом задания конкретного номера (bsOutputCahnnelPos) от 0 до 31 многоканальному аудиосигналу. В этом случае, поскольку один из всего 32 громкоговорителей должен быть выбран, чтобы привязывать первый аудиосигнал из многоканальных аудиосигналов, выводимых из блока 811 формирования многоканального сигнала, к громкоговорителю, требуется 5 битов. Поскольку один из оставшихся 31 громкоговорителя должен быть выбран так, чтобы привязывать второй аудиосигнал к громкоговорителю, также требуется 5 битов. Согласно этому способу, поскольку один из оставшихся 16 громкоговорителей должен быть выбран так, чтобы привязывать семнадцатый аудиосигнал к громкоговорителю, требуется 4 бита. В частности, по мере того как номер привязки аудиосигналов возрастает, количество информации, требуемое для указания громкоговорителей, привязанных к аудиосигналам, снижается. Это может быть выражено посредством ceil[log₂(32-bsOutputChannelPos)], представляющего число битов, требуемых для преобразования аудиосигнала к громкоговорителю. Требуемое число битов снижается вследствие увеличения числа аудиосигналов, которые должны быть скомпонованы, что может быть применимо к случаю, когда число сигналов понижающего микширования, скомпонованных посредством блока 809 компоновки сигналов, возрастает. Таким образом, устройство декодирования аудио привязывает многоканальный аудиосигнал к громкоговорителю и затем выводит соответствующий сигнал.

Несмотря на то что настоящее изобретение показано и описано в данном варианте осуществления со ссылкой на его предпочтительные варианты осуществления, специалистам в данной области техники должно быть очевидным, что различные модификации и изменения по форме и содержанию могут быть сделаны без отступления от сущности и области применения изобретения. Таким образом, настоящее изобретение предназначено, чтобы охватывать модификации и изменения этого изобретения при условии, что они находятся в области применения формулы изобретения и ее эквивалентов.

Выгоды

Следовательно, посредством устройства декодирования аудиосигнала и способа для этого согласно настоящему изобретению заголовок может быть выборочно включен в пространственный информационный сигнал.

Посредством устройства декодирования аудиосигнала и способа для этого согласно настоящему изобретению передаваемое количество данных может быть снижено за счет представления позиции временного интервала, к которой должен быть применен набор параметров, как переменного числа битов.

Посредством устройства декодирования аудиосигнала и способа для этого согласно настоящему изобретению эффективность сжатия и передачи аудиосигналов может быть повышена за счет представления количества информации, требуемого для осуществления компоновки сигнала понижающего микширования или привязки многоканального сигнала к громкоговорителю, как минимального произвольного числа битов.

Посредством устройства декодирования аудиосигнала и способа для этого согласно настоящему изобретению аудиосигнал может быть более эффективно сжат и передан и сложность устройства декодирования аудиосигналов может быть снижена за счет повышающего сведения сигналов, декодированных и переданных в блок формирования многоканальных сигналов посредством базового блока декодирования, последовательно без выполнения компоновки сигнала понижающего микширования.

Краткое описание чертежей

Фиг.1 - это конфигурационная схема аудиосигнала согласно одному варианту осуществления настоящего изобретения.

Оптимальный режим осуществления изобретения

Чтобы достичь этих и других преимуществ, согласно одному аспекту настоящего изобретения, предусмотрен способ декодирования аудиосигнала, включающий в себя прием аудиосигнала, включающего в себя пространственный информационный сигнал и сигнал понижающего микширования, получение информации позиции временного интервала с помощью числа временных интервалов и числа параметров, включенных в аудиосигнал, формирование многоканального аудиосигнала посредством применения пространственного информационного сигнала к сигналу понижающего микширования согласно информации позиции временного интервала и компоновку многоканального аудиосигнала соответствующим образом на выходном канале.

Информация позиции временного интервала может быть представлена как переменное число битов. Также информация позиции может включать в себя начальное значение и значение разности, при этом начальное значение указывает информацию позиции временного интервала, к которой применяется первый параметр, и при этом значение разности указывает информацию позиции временного интервала, к которой применяется второй или последующий параметр. Также начальное значение может быть представлено как переменное число битов, определенное с помощью, по меньшей мере, одного из числа временных интервалов и числа параметров. Кроме того, значение разности может быть представлено как переменное число битов, определенное с помощью, по меньшей мере, одного из числа временных интервалов, числа параметров и информации позиции временного интервала, к которой применяется предыдущий параметр. Также способ дополнительно может включать в себя компоновку сигнала понижающего микширования для сигнала понижающего микширования согласно заранее заданному способу. Помимо этого, компоновка сигнала понижающего микширования может осуществляться посредством поступления сигнала понижающего микширования в блок преобразования сигналов, выполняющий повышающее сведение двух сигналов понижающего микширования в три сигнала. Также если заголовок включен в пространственный информационный сигнал, компоновка сигнала понижающего микширования может состоять в том, чтобы скомпоновать сигнал понижающего микширования с помощью информации компоновки аудиосигналов, включенной в конфигурационную информацию, извлеченную из заголовка. Помимо этого, количество информации, требуемое для привязки i-того аудиосигнала или для компоновки i-того сигнала понижающего микширования, может быть минимальным целым числом, равным или большим log₂[(общее число аудиосигналов или общее число сигналов понижающего микширования)-(значение i)+1]. Помимо этого, компоновка многоканального аудиосигнала дополнительно может включать в себя компоновку аудиосигнала соответствующим образом для громкоговорителя.

Согласно другому аспекту настоящего изобретения предусмотрено устройство декодирования аудиосигнала, включающее в себя блок повышающего сведения, выполняющий повышающее сведение аудиосигнала в многоканальный аудиосигнал, и блок компоновки многоканального сигнала, привязывающий многоканальный аудиосигнал к выходным каналам согласно заранее заданной компоновке.

Согласно другому аспекту настоящего изобретения предусмотрено устройство декодирования аудиосигнала, включающее в себя базовый блок декодирования, декодирующий кодированный сигнал понижающего микширования, блок компоновки, компонующий декодированный аудиосигнал согласно заранее заданной компоновке, и блок повышающего сведения, выполняющий повышающее сведение скомпонованного аудиосигнала в многоканальный аудиосигнал.

Иллюстрации к изобретению RU 2 383 942 C2

Реферат патента 2010 года СПОСОБ И УСТРОЙСТВО ДЛЯ ДЕКОДИРОВАНИЯ АУДИОСИГНАЛА

Изобретение относится к обработке аудиосигналов, а более конкретно к устройству и способу декодирования аудиосигнала. Способ декодирования содержит этапы приема аудиосигнала с помощью пространственного информационного сигнала, получения информации позиции с помощью числа временных интервалов и параметров аудиосигнала, установления многоканального аудиосигнала посредством применения пространственного информационного сигнала к сигналу понижающего микширования и выполнения многоканальной матрицы для многоканального аудиосигнала в ответ на выходной канал. Технический результат - обеспечить возможность более эффективного сжатия и передачи аудиосигнала. 2 н. и 14 з.п. ф-лы, 8 ил., 1 табл.

Формула изобретения RU 2 383 942 C2

1. Способ декодирования аудиосигнала, содержащий этапы, на которых:
принимают пространственный информационный сигнал и сигнал понижающего микширования;
извлекают число временных интервалов и числа наборов параметров из принятого пространственного информационного сигнала;
определяют информацию о позиции временного интервала, к которому применен набор параметров, с помощью числа временных интервалов и числа параметров;
формируют многоканальный аудиосигнал посредством повышающего микширования сигнала понижающего микширования, используя пространственный информационный сигнал и информацию о позиции временного интервала; и
компонуют многоканальный аудиосигнал соответствующим образом на выходном канале.

2. Способ по п.1, в котором информация позиции временного интервала представляется как переменное число битов.

3. Способ по п.2, в котором информация позиции включает в себя начальное значение и значение разности, при этом начальное значение указывает информацию о позиции временного интервала, к которому применяется первый набор параметров, и при этом значение разности указывает информацию о позиции временного интервала, к которому применяется второй или последующий набор параметров.

4. Способ по п.3, в котором начальное значение представляется как переменное число битов, определенное с помощью, по меньшей мере, одного из числа временных интервалов и числа наборов параметров.

5. Способ по п.3, в котором значение разности представляется как переменное число битов, определенное с помощью, по меньшей мере, одного из числа временных интервалов, числа набора параметров и информации о позиции временного интервала, к которой применяется предыдущий параметр.

6. Способ по п.1, дополнительно содержащий этап, на котором компонуют сигнал понижающего микширования согласно заранее заданному способу.

7. Способ по п.6, в котором, если заголовок включен в пространственный информационный сигнал, при этом сигнал понижающего микширования скомпонован с помощью информации компоновки аудиосигналов, включенной в конфигурационную информацию, извлеченную из заголовка.

8. Способ по п.1, дополнительно содержащий этап, на котором осуществляют привязку многоканального аудиосигнала на позицию громкоговорителя.

9. Устройство декодирования аудиосигнала, содержащее:
приемный блок, принимающий пространственный информационный сигнал и сигнал понижающего микширования;
блок декодирования пространственной информации, извлекающий число временных интервалов и число наборов параметров из принятого пространственного информационного сигнала;
блок формирования многоканального аудиосигнала, определяющий информацию о позиции временного интервала, к которому применен набор параметров, с помощью числа временных интервалов и числа наборов параметров, формирующий многоканальный аудиосигнал посредством повьшающего микширования сигнала понижающего микширования, используя пространственный информационный сигнал и информацию о позиции временного интервала; и
блок многоканальной компоновки, компонующий многоканальный аудиосигнал соответствующим образом на выходном канале.

10. Устройство по п.9, в котором информация о позиции временного интервала представляется как переменное число битов.

11. Устройство по п.10, в котором информация о позиции включает в себя начальное значение и значение разности, при этом начальное значение указывает информацию о позиции временного интервала, к которому применяется первый набор параметров, и при этом значение разности указывает информацию о позиции временного интервала, к которому применяется второй или последующий набор параметров.

12. Устройство по п.11, в котором начальное значение представляется как переменное число битов, определенное с помощью, по меньшей мере, одного из числа временных интервалов и числа наборов параметров.

13. Устройство по п.11, в котором значение разности представляется как переменное число битов, определенное с помощью, по меньшей мере, одного из числа временных интервалов, числа наборов параметров и информации о позиции временного интервала, к которой применяется предыдущий набор параметров.

14. Устройство по п.9, в котором блок многоканальной компоновки компонует сигнал понижающего микширования согласно заранее заданному способу.

15. Устройство по п.14, в котором блок многоканальной компоновки компонует сигнал понижающего микширования с помощью информации компоновки аудиосигналов, включенной в конфигурационную информацию, извлеченную из заголовка, если заголовок включен в пространственный информационный сигнал.

16. Устройство по п.9, в дополнительно содержащий блок привязки к громкоговорителю, осуществляющий привязку многоканального аудиосигнала на позицию громкоговорителя.

Документы, цитированные в отчете о поиске Патент 2010 года RU2383942C2

Межкамерная перегородка трубной мельницы	1981	Вердиян М.А. Цернес Р.Я. Уманский Ю.В. Бочевер Б.М. Кравченко В.М. Севостьянов Б.И.	SU1001549A1
US 6631352 B1, 2003.10.07
СПОСОБ КОДИРОВАНИЯ РЕЧИ (ВАРИАНТЫ), КОДИРУЮЩЕЕ И ДЕКОДИРУЮЩЕЕ УСТРОЙСТВО	1998	Хардвик Джон Кларк	RU2214048C2
US 6339760 B1, 2002.01.15
DE 69712383 T2, 2003.01.23.

RU 2 383 942 C2

Авторы

Панг Хее Сук

Ох Хиеон О.

Ким Донг Соо

Лим Дзае Хиун

Дзунг Йанг Вон

Даты

2010-03-10—Публикация

2006-08-30—Подача

название	год	авторы	номер документа
СПОСОБ И УСТРОЙСТВО ДЛЯ ДЕКОДИРОВАНИЯ АУДИОСИГНАЛА	2006	Панг Хее Сук Ох Хиен О Лим Дзае Хиун Ким Донг Соо Дзунг Йанг Вон	RU2380767C2
КОДИРОВАНИЕ И ДЕКОДИРОВАНИЕ АУДИОСИГНАЛОВ	2013	Омен Арнольдус Вернер Йоханнес Коппенс Ерун Герардус Хенрикус Схейерс Эрик Госейнус Петрус	RU2643644C2
СПОСОБ КОДИРОВАНИЯ И ДЕКОДИРОВАНИЯ АУДИОСИГНАЛА И УСТРОЙСТВО ДЛЯ ЕГО ОСУЩЕСТВЛЕНИЯ	2006	Панг Хее Сук Ох Хиеон О Ким Донг Соо Лим Дзае Хиун Дзунг Йанг Вон	RU2376656C1
СПОСОБ КОДИРОВАНИЯ И ДЕКОДИРОВАНИЯ АУДИОСИГНАЛА И УСТРОЙСТВО ДЛЯ ЕГО ОСУЩЕСТВЛЕНИЯ	2006	Панг Хее Сук Ох Хиеон О Ким Донг Соо Лим Дзае Хиун Дзунг Йанг Вон	RU2473062C2
МНОГОКАНАЛЬНЫЙ АУДИОДЕКОДЕР, МНОГОКАНАЛЬНЫЙ АУДИОКОДЕР, СПОСОБЫ, КОМПЬЮТЕРНАЯ ПРОГРАММА И КОДИРОВАННОЕ АУДИОПРЕДСТАВЛЕНИЕ С ИСПОЛЬЗОВАНИЕМ ДЕКОРРЕЛЯЦИИ ПРЕДСТАВЛЕННЫХ ПОСРЕДСТВОМ РЕНДЕРИНГА АУДИОСИГНАЛОВ	2014	Диш Саша Фукс Харальд Хелльмут Оливер Херре Юрген Муртаза Адриан Паулус Йоуни Риддербуш Фалько Терентив Леон	RU2665917C2
СПОСОБ И УСТРОЙСТВО ДЛЯ КОДИРОВАНИЯ И ДЕКОДИРОВАНИЯ АУДИОСИГНАЛОВ	2006	Панг Хее Сук Ох Хиен О Ким Донг Соо Лим Дзае Хиун Дзунг Йанг Вон	RU2383941C2
МНОГОКАНАЛЬНЫЙ ДЕКОРРЕЛЯТОР, МНОГОКАНАЛЬНЫЙ АУДИОДЕКОДЕР, МНОГОКАНАЛЬНЫЙ АУДИОКОДЕР, СПОСОБЫ И КОМПЬЮТЕРНАЯ ПРОГРАММА С ИСПОЛЬЗОВАНИЕМ ПРЕДВАРИТЕЛЬНОГО МИКШИРОВАНИЯ ВХОДНЫХ СИГНАЛОВ ДЕКОРРЕЛЯТОРА	2014	Диш Саша Фукс Харальд Хелльмут Оливер Херре Юрген Муртаза Адриан Паулус Йоуни Риддербуш Фалько Терентив Леон	RU2666640C2
МАНИПУЛИРОВАНИЕ ЗОНОЙ НАИЛУЧШЕГО ВОСПРИЯТИЯ ДЛЯ МНОГОКАНАЛЬНОГО СИГНАЛА	2007	Коппенс Ероен Г. Х. Схейерс Эрик Г. П.	RU2454825C2
УСТРОЙСТВО И СПОСОБ ДЛЯ КОДИРОВАНИЯ ПРОСТРАНСТВЕННОГО ЗВУКОВОГО ПРЕДСТАВЛЕНИЯ ИЛИ УСТРОЙСТВО И СПОСОБ ДЛЯ ДЕКОДИРОВАНИЯ ЗАКОДИРОВАННОГО АУДИОСИГНАЛА С ИСПОЛЬЗОВАНИЕМ ТРАНСПОРТНЫХ МЕТАДАННЫХ И СООТВЕТСТВУЮЩИЕ КОМПЬЮТЕРНЫЕ ПРОГРАММЫ	2020	Кюх, Фабиан Тиргарт, Оливер Фукс, Гийом Дёла, Штефан Бутеон, Александр Херре, Юрген Байер, Штефан	RU2792050C2
КОДИРОВАНИЕ И ДЕКОДИРОВАНИЕ АУДИО	2006	Хото Герард Х. Мибург Франсуа П. Омен Арнольдус В. Й.	RU2411594C2