Область техники, к которой относится изобретение
Настоящее изобретение относится к способу и устройству для обработки аудиосигнала, в частности относится к устройству для обработки аудиосигнала и к соответствующему способу. Хотя настоящее изобретение подходит для широкого круга применений, оно особенно подходит для обработки аудиосигнала, принятого в виде цифрового носителя, широковещательного сигнала или т.п.
Уровень техники
В общем случае в ходе создания сигнала понижающего микширования путем понижающего микширования аудиосигнала, включающего в себя множество объектов, с получением моно- или стереосигнала, из упомянутых объектов извлекают параметры (информацию). Эти параметры (информацию) используют в процессе декодирования сигнала понижающего микширования. Также можно управлять панорамированием и коэффициентами усиления объектов на основе выбора, выполняемого пользователем.
Сущность изобретения
Техническая задача
Тем не менее, объектами, содержащимися в сигнале понижающего микширования, следует должным образом управлять на основе выбора, осуществляемого пользователем. Когда пользователь управляет объектом, ему неудобно управлять данным объектом напрямую и возможно ему труднее, чем это мог бы сделать эксперт, восстановить оптимальное состояние аудиосигнала, включающего в себя множество объектов, соответствующих окружающей среде.
Техническое решение
Соответственно, настоящее изобретение направлено на создание устройства и способа обработки аудиосигнала, которые фактически решают одну или несколько проблем, возникающих из-за ограничений и недостатков существующего уровня техники.
Задачей настоящего изобретения является создание устройства и способа для обработки аудиосигнала, с помощью которых можно управлять объектом, содержащимся в аудиосигнале, с использованием предварительно установленной информации, включающей в себя предварительно установленные метаданные и предварительно установленные данные рендеринга.
Другой задачей настоящего изобретения является создание устройства и способа для обработки аудиосигнала, с помощью которых можно настраивать уровень объекта в выходном канале путем определения предварительно установленных данных рендеринга на основе информации об аудиосигнале в выходном канале и последующего применения предварительно установленных данных рендеринга к аудиосигналу в том случае, когда предварительно установленные данные рендеринга относятся к матричному типу.
Еще одной задачей настоящего изобретения является создание устройства и способа для обработки аудиосигнала, с помощью которых шаг за шагом из предварительно установленной матрицы рендеринга типа «моно», переданной от кодера, или из информации об усилении шаг за шагом создают предварительно установленную матрицу рендеринга для настройки объекта.
Положительные эффекты
Соответственно, настоящее изобретение обеспечивает следующие положительные эффекты или преимущества.
Прежде всего, согласно настоящему изобретению выбирается некоторая из предварительно установленной информации без установки для объектов, выполняемой пользователем, в результате чего облегчается настройка уровня выходного канала.
Во-вторых, настоящее изобретение представляет предварительно установленные метаданные для представления предварительно установленной информации в виде текста на основе предварительно установленной информации о длине, указывающей длину метаданных, в результате чего сокращается объем излишнего кодирования.
В-третьих, в том случае, когда предварительно установленные данные рендеринга относятся к матричному типу, настоящее изобретение определяет предварительно установленную матрицу, указывающую предварительно установленные данные рендеринга на основе информации об аудиосигнале в выходном канале, в результате чего обеспечивается более точная и эффективная настройка уровня выходного канала объекта.
В-четвертых, согласно настоящему изобретению предварительно установленная матрица создается шаг за шагом, в результате чего уменьшается скорость передачи данных от кодера.
В-пятых, в настоящем изобретении предварительно установленная матрица используется для настройки объектов только частично, в результате чего сокращается объем излишнего кодирования.
Краткое описание чертежей
Сопроводительные чертежи, которые предусмотрены для обеспечения более детального представления об изобретении и образуют часть этого описания, иллюстрируют варианты осуществления изобретения и вместе с описанием служат для объяснения принципов изобретения.
На чертежах:
фиг.1 - концептуальная схема предварительно установленной информации, применяемой к объекту, содержащемуся в аудиосигнале, согласно варианту настоящего изобретения;
фиг.2 - блок-схема устройства обработки аудиосигнала согласно варианту настоящего изобретения;
фиг.3 - блок-схема блока приема предварительно установленной информации в устройстве обработки аудиосигнала согласно варианту настоящего изобретения;
фиг.4 - блок-схема способа обработки аудиосигнала согласно варианту настоящего изобретения;
фиг.5 - схема синтаксиса согласно варианту настоящего изобретения;
фиг.6 - схема синтаксиса согласно еще одному варианту настоящего изобретения;
фиг.7 - схема синтаксиса согласно дополнительному варианту настоящего изобретения;
фиг.8 - блок-схема блока приема предварительно установленных данных рендеринга согласно дополнительному варианту настоящего изобретения;
фиг.9 - схема синтаксиса согласно другому дополнительному варианту настоящего изобретения;
фиг.10 - блок-схема устройства обработки аудиосигнала согласно другому варианту настоящего изобретения;
фиг.11 - блок-схема оборудования, реализующего блок приема предварительно установленной информации согласно варианту настоящего изобретения;
фиг.12 - схема взаимосвязи между терминалом и сервером согласно оборудованию, показанному на фиг.11;
фиг.13 - блок-схема блока приема предварительно установленной информации для реализации применительно к цифровому телевидению согласно варианту настоящего изобретения; и
фиг.14 - схема блока отображения для оборудования, включающего в себя блок приема предварительно установленной информации согласно одному варианту настоящего изобретения.
Наилучший вариант осуществления изобретения
Дополнительные признаки и преимущества изобретения изложены в последующем описании и частично могут быть выяснены из этого описания, либо представление о них можно получить в результате практической реализации изобретения. Задачи и другие преимущества изобретения реализуются и поддерживаются структурой, детально указанной в описании изобретения и формуле изобретения, а также на прилагаемых чертежах.
Для достижения указанных и других преимуществ и в соответствии с задачей настоящего изобретения способ обработки аудиосигнала согласно настоящему изобретению включает в себя: прием аудиосигнала и предварительно установленной информации, причем аудиосигнал включает в себя по меньшей мере один объект; получение предварительно установленной матрицы из предварительно установленной информации, причем предварительно установленная матрица указывает степень вклада объекта в выходной канал; настройку выходного уровня объекта согласно выходному каналу путем использования предварительно установленной матрицы; и вывод аудиосигнала, включающего в себя объект с настроенным выходным уровнем, причем предварительно установленную информацию получают на основе предварительно установленной информации о наличии, указывающей, что предварительно установленная информация существует, и предварительно установленной информации о номерах, указывающей номер предварительно установленной информации, причем предварительно установленную матрицу получают на основе предварительно установленной информации о типе, указывающей, что предварительно установленная информация представлена в матрице.
Предварительно установленную матрицу предпочтительно получают на основе информации о выходном канале, указывающей о том, что выходной канал является моноканалом, стереоканалом или многоканальным.
Предварительно установленную информацию о типе предпочтительно представляют 1 битом.
Более предпочтительно определять размерность предварительно установленной матрицы на основе номера объекта и номера выходного канала.
Кроме того, для достижения этих и других преимуществ и в соответствии с задачей настоящего изобретения устройство для обработки аудиосигнала согласно настоящему изобретению включает в себя: блок приема аудиосигнала, принимающий аудиосигнал, включающий в себя по меньшей мере один объект; блок приема предварительно установленных метаданных, принимающий предварительно установленные метаданные из предварительно установленной информации, причем блок приема предварительно установленных метаданных получает по меньшей мере некоторые из предварительно установленных метаданных по меньшей мере из некоторой предварительно установленной информации; блок приема предварительно установленных данных рендеринга, получающий предварительно установленную матрицу из предварительно установленной информации, причем предварительно установленная матрица указывает степень вклада объекта в выходной канал, и причем предварительно установленная матрица соответствует предварительно установленным метаданным; блок отображения, отображающий предварительно установленные метаданные; блок ввода, принимающий команду для выбора некоторых из предварительно установленных метаданных; блок настройки объекта, настраивающий выходной уровень объекта согласно выходному каналу путем использования предварительно установленной матрицы, соответствующей выбранным предварительно установленным метаданным; и блок вывода, выводящий аудиосигнал, включающий в себя объект с настроенным выходным уровнем. Предпочтительно, чтобы блок отображения отображал выбранные предварительно установленные метаданные, когда блок вывода выводит аудиосигнал.
Предпочтительно, чтобы блок отображения, кроме того, отображал выходной уровень объекта.
Предварительно установленную матрицу предпочтительно получают на основе информации о выходном канале, указывающей, что выходной канал является моноканалом, стереоканалом или многоканальным.
Предварительно установленную информацию получают на основе предварительно установленной информации о номерах, указывающей номер предварительно установленной информации, причем предварительно установленную матрицу получают на основе предварительно установленной информации о типе, указывающей, что предварительно установленная информация представлена в матрице.
Предпочтительно, чтобы предварительно установленная информация, кроме того, содержала предварительно установленную информацию о применении к объекту, указывающую, существует ли предварительно установленная матрица, применяемая к объектам.
Предпочтительно, чтобы блок отображения дополнительно отображал, существует ли предварительно установленная матрица, подлежащая применению к объекту, на основе предварительно установленной информации о применении к объекту.
Более предпочтительно, чтобы блок отображения отображал предварительно установленные метаданные в виде текста.
Должно быть понятно, что как предшествующее общее описание, так и последующее подробное описание носят иллюстративный и разъяснительный характер и предназначены обеспечить дополнительное понимание заявленного изобретения.
Вариант осуществления изобретения
Далее следуют подробные ссылки на предпочтительные варианты настоящего изобретения, примеры которых показаны на сопроводительных чертежах.
Прежде всего, термин «информация» в данном описании трактуется в общем случае как: значения, параметры, коэффициенты, элементы и т.п., а термин «объект» может трактоваться как сигнал источника, образующий аудиосигнал гитары, вокала, фортепиано или т.п. Их смысл может трактоваться подчас по-разному, но настоящее изобретение этим не ограничивается.
При декодировании аудиосигнала, включающего в себя множество объектов, настоящее изобретение обеспечивает способ эффективного декодирования аудиосигнала с использованием некоторой из предварительно установленной информации для настройки объектов.
На фиг.1 представлена концептуальная схема настоящего изобретения, применимая к объекту, содержащемуся в аудиосигнале, согласно варианту настоящего изобретения. В данном описании заранее установленная информация для настройки объекта называется предварительно установленной информацией. Предварительно установленная информация может указывать один из различных режимов, выбираемых в соответствии с характеристикой аудиосигнала или окружающей среды при прослушивании. Также может существовать множество видов предварительно установленной информации. Кроме того, предварительно установленная информация включает в себя метаданные для представления атрибута предварительно установленной информации или т.п., а также данные рендеринга, применяемые для настройки объекта. Метаданные могут быть представлены в текстовом виде. Метаданные не только указывают атрибут (например, режим концертного зала, режим караоке, режим новостей и т.д.) предварительно установленной информации, но также включают в себя соответствующую информацию для представления предварительно установленной информации, такой как автор предварительно установленной информации, дата записи, название объекта, имеющего применяемую к нему предварительно установленную информацию, и т.п. Между тем, данные рендеринга представляют собой данные, фактически применяемые к объекту. Данные рендеринга могут иметь одну из различных форм. В частности, данные рендеринга могут существовать в матричном виде.
Обратимся к фиг.1, где предварительно установленной информацией 1 может быть режим концертного зала для обеспечения звукового сценического эффекта, позволяющего слышать музыкальный сигнал, как в концертном зале. Предварительно установленной информацией 1 может быть режим караоке, снижающий уровень вокального объекта в аудиосигнале. Наконец, предварительно установленной информацией n может быть режим новостей, поднимающий уровень речевого объекта. Кроме того, предварительно установленная информация 2 включает в себя метаданные 2 и данные 2 рендеринга. Если пользователь выбирает предварительно установленную информацию 2, то в блоке отображения будет реализован режим караоке метаданных 2 и можно будет настроить уровень, применив к объекту данные 2 рендеринга, соответствующие метаданным 2.
В этом случае, если данные рендеринга относятся к матричному типу, они могут включать в себя матрицу моно, матрицу стерео или многоканальную матрицу. Матрица моно представляет собой данные рендеринга, применяемые в том случае, когда выходным каналом объекта является моноканал. Матрица стерео представляет собой данные рендеринга, применяемые в том случае, когда выходным каналом объекта является стереоканал. И многоканальная матрица представляет собой данные рендеринга, применяемые в том случае, когда выходной канал объекта является многоканальным. Как только определен выходной канал объекта, определяют матрицу, используя определенный выходной канал. Затем, применяя упомянутую матрицу к объекту, можно настроить уровень.
Таким образом, используя метаданные и данные рендеринга, содержащиеся в предварительно установленной информации, выполняют настройку объекта и представляют атрибут или признак применяемой предварительно установленной информации. Таким образом, можно эффективно обеспечить аудиосигнал с эффектом, необходимым конкретному пользователю.
На фиг.2 представлена блок-схема устройства 200 обработки аудиосигнала согласно варианту настоящего изобретения.
Обратимся к фиг.2, где устройство 200 обработки аудиосигнала согласно варианту настоящего изобретения может включать в себя блок 210 создания предварительно установленной информации и блок 2210 приема предварительно установленной информации, а также блок 230 настройки объекта.
Блок 210 создания предварительно установленной информации создает предварительно установленную информацию для настройки объекта, включенного в аудиосигнал. Блок 210 создания предварительно установленной информации может включать в себя блок 212 создания метаданных и блок 214 создания предварительно установленных данных рендеринга. Блок 212 создания метаданных принимает на входе текстовую информацию для представления предварительно установленной информации, после чего он способен создавать предварительно установленные метаданные. Как упоминалось в предшествующем описании, предварительно установленные метаданные могут представлять собой информацию для представления характеристики или атрибута предварительно установленной информации. В этом случае блок 212 создания метаданных может дополнительно создавать информацию о предварительно установленной длине, указывающую число для длины предварительно установленных метаданных. В этом случае информация о предварительно установленной длине может быть представлена в байтах, но примеры информации о предварительно установленной длине этим не ограничиваются.
Между тем, если в блок 214 создания предварительно установленных данных рендеринга введена информация об усилении для настройки уровня объекта и панорамировании объекта, то имеется возможность создания предварительно установленных данных рендеринга для их применения к объектам. В этом случае предварительно установленные данные рендеринга можно создавать для каждого объекта и реализовать по одному из возможных различных типов. Например, предварительно установленными данными рендеринга может быть предварительно установленная матрица, реализованная по матричному типу. Кроме того, блок 214 создания предварительно установленных данных рендеринга может дополнительно создавать предварительно установленную информацию о типе (preset_type_flag), указывающую, представлены ли предварительно установленные данные рендеринга в виде матрицы. Кроме того, блок 214 создания предварительно установленных данных рендеринга может создавать информацию о выходном канале, указывающую, сколько выходных каналов имеет объект.
Предварительно установленная информация о длине и предварительно установленные метаданные, созданные блоком 212 создания метаданных, а также предварительно установленная информация о типе, информация о выходном канале и предварительно установленные данные рендеринга, созданные блоком 214 создания предварительно установленных данных рендеринга, могут транспортироваться, будучи включенными в один битовый поток, и, в частности, будучи включенными в служебную область битового потока, включающего в себя аудиосигнал.
Между тем, блок 210 создания предварительно установленной информации может дополнительно создавать предварительно установленную информацию о наличии, указывающую, включены ли в битовый поток предварительно установленная информация о длине, предварительно установленные метаданные, предварительно установленная информация о типе, информация о выходном канале и предварительно установленные данные рендеринга. Предварительно установленная информация о наличии может относиться к контейнерному типу, дающему информацию о том, в какой области существует предварительно установленная информация, или относится к типу «флаг», но примеры предварительно установленной информации о наличии этим не ограничиваются.
Кроме того, блок 210 создания предварительно установленной информации способен создавать предварительно установленную информацию. Предварительно установленная информация включает в себя предварительно установленную информацию о длине, предварительно установленные метаданные, предварительно установленную информацию о типе, информацию о выходном канале и предварительно установленную информацию о рендеринге. В этом случае блок 210 создания предварительно установленной информации может дополнительно создавать предварительно установленную информацию о номерах, указывающую номер предварительно установленной информации.
Блок 220 приема предварительно установленной информации принимает предварительно установленную информацию, созданную и переданную блоком 210 создания предварительно установленной информации. Блок 220 приема предварительно установленной информации может включать в себя блок 222 приема метаданных и блок 224 приема предварительно установленных данных рендеринга.
Блок 222 приема метаданных принимает, а затем выдает предварительно установленные метаданные, а блок 224 приема предварительно установленных данных рендеринга принимает предварительно установленные данные рендеринга (например, предварительно установленную матрицу), подробности которых объясняются со ссылками на фиг.3 и фиг.4.
Блок 230 настройки объекта принимает аудиосигнал, включающий в себя множество объектов, и предварительно установленные данные рендеринга, созданные блоком 224 приема данных рендеринга. В этом случае предварительно установленные данные рендеринга применяют к объекту, в результате чего может быть настроен уровень или положение объекта.
На фиг.3 представлена блок-схема блока 310 приема метаданных и блока 320 приема предварительно установленных данных рендеринга, входящих в блок 200 приема предварительно установленной информации в устройстве 200 обработки аудиосигнала согласно варианту настоящего изобретения.
Обратимся к фиг.3, где блок 310 приема метаданных включает в себя блок 312 приема предварительно установленной информации о длине и блок 314 приема предварительно установленных метаданных. Блок 312 приема предварительно установленной информации о длине принимает предварительно установленную информацию о длине, указывающую длину предварительно установленных метаданных, для представления предварительно установленной информации, а затем получает длину предварительно установленных метаданных. После этого блок 314 приема предварительно установленных метаданных считывает из битового потока длину, указанную в предварительно установленной информации о длине, а затем принимает предварительно установленные метаданные. Кроме того, блок 314 приема предварительно установленных метаданных преобразует предварительно установленные метаданные, которые указывают тип или атрибут предварительно установленной информации, в метаданные текстового типа, а затем выводит преобразованные предварительно установленные метаданные текстового типа.
Блок 320 приема предварительно установленных данных рендеринга включает в себя блок 322 приема предварительно установленного флага типа, блок 324 приема информации о выходном канале и блок 326 приема предварительно установленной матрицы. Блок 322 приема предварительно установленного флага типа данных принимает предварительно установленный флаг типа (preset_type_flag), указывающий, относятся ли предварительно установленные данные рендеринга к матричному типу. В этом случае значение предварительно установленного флага типа показано в Таблице.
Если предварительно установленный флаг типа указывает на случай, когда предварительно установленные данные рендеринга относятся к матричному типу, блок 324 приема информации о выходном канале принимает информацию о выходных каналах, указывающую число выходных каналов, по которым будет воспроизводиться объект, включенный в аудиосигнал. Информация о выходных каналах может включать в себя моноканал, стереоканал или указывать на многоканальность (канал 5.1), но пример информации о выходных каналах этим не ограничивается.
Блок 326 приема предварительно установленной матрицы принимает и выводит предварительно установленную матрицу, указывающую степень вклада объекта в выходной канал в соответствии с предварительно установленными метаданными на основе информации о выходном канале. В этом случае предварительно установленная матрица может включать в себя одно из следующего: предварительно установленную матрицу моно, предварительно установленную матрицу стерео и предварительно установленную многоканальную матрицу. Размерность предварительно установленной матрицы определяется на основе номера объекта и номера выходного канала. Следовательно, предварительно установленная матрица может быть матрицей вида (номер объекта)*(номер выходного канала). Например, если имеется n объектов, содержащихся в аудиосигнале, и выходной канал из блока 324 приема информации о выходных каналах соответствует каналу 5.1 (то есть шесть каналов), то блок 326 приема предварительно установленной матрицы может определить предварительно установленную многоканальную матрицу (смотри формулу 1), реализованную в виде n*6.
[Формула 1]
В формуле 1 матричная компонента ma,b представляет собой значение усиления, указывающее меру, которая характеризует вклад a-го объекта в b-й канал. Затем, применив предварительно установленную многоканальную матрицу к аудиосигналу, можно настроить уровень соответствующего объекта.
Таким образом, блок 220 приема предварительно установленной информации согласно настоящему изобретению эффективно представляет предварительно установленные метаданные путем считывания битового потока в необходимом объеме с использованием предварительно установленной информации о длине и способен эффективно настраивать усиление объекта, содержащегося в аудиосигнале, и т.п., получив предварительно установленную матрицу на основе информации о выходном канале.
На фиг.4 показана блок-схема способа обработки аудиосигнала согласно варианту настоящего изобретения.
Обратимся к фиг.4, где на шаге S410 принимается аудиосигнал, включающий в себя по меньшей мере один объект. На шаге S415 принимают предварительно установленную информацию о наличии, указывающую, существует ли предварительно установленная информация для настройки усиления или указано панорамирование объекта. Если предварительно установленная информация существует, то принимают (шаг S420) предварительно установленную численную информацию, указывающую, сколько (n) видов предварительно установленной информации существует. Предварительно установленная численная информация предполагает, что предварительно установленная информация существует и может быть представлена в виде «(номер действительно существующей предварительно установленной информации) - 1». Затем принимают (шаг S430) предварительно установленную информацию о длине, указывающую, сколько имеется бит (или байт) метаданных для представления предварительно установленной информации. На основе предварительно установленной информации о длине принимают (шаг S435) предварительно установленные метаданные. Например, выводят (шаг S437) режим караоке, режим концертного зала, режим новостей или т.п. В этом случае предварительно установленные метаданные могут относиться к текстовому типу. Как упоминалось в вышеприведенном описании, предварительно установленные метаданные могут включать в себя данные, раскрывающие автора предварительно установленной информации, дату написания, название объекта, настраиваемого с помощью предварительно установленной информации, и т.п., а также метаданные, представляющие звуковой сценический эффект предварительно установленной информации, причем примеры предварительно установленных метаданных этим не ограничиваются.
Затем принимают (шаг S440) предварительно установленную информацию о типе, указывающую тип предварительно установленных данных рендеринга, включенных в предварительно установленную информацию. На основе предварительно установленной информации о типе на шаге S445 определяют, относится ли тип предварительно установленных данных к матричному типу. Если типом предварительно установленных данных является матричный тип («да» на шаге S445), то на шаге S450 принимают информацию о выходном канале, указывающую, сколько объектных каналов существует. На основе информации о выходном канале на шаге S455 принимают соответствующую предварительно установленную матрицу из закодированной предварительно установленной матрицы. Размерность предварительно установленной матрицы определяют на основе номера объекта и номера выходного канала. Например, если выходным каналом объекта является стереоканал, то принятой предварительно установленной матрицей окажется предварительно установленная матрица стерео типа «(номер объекта)*2».
На шаге S460 определяют, меньше ли индекс i предварительно установленной информации (i-й), включающей в себя принятую ранее предварительно установленную информацию о длине, предварительно установленные метаданные, предварительно установленную информацию о типе, информацию о выходных каналах и предварительно установленную матрицу, чем число (n) предустановок, указанных в предварительно заданной численной информации. Если i меньше числа, указанного в предварительно установленной информации («да» на шаге S460), то процедура возвращается к шагу S430, а затем повторяется шаг приема предварительно установленной информации о длине для следующей предустановки [(i+1)-й]. Если i-я предустановка равна числу в предварительно установленной информации («нет» на шаге S460), то на шаге S465 настраивают уровень объекта с применением к аудиосигналу предварительно установленной матрицы. Между тем, если в матрице не присутствует упомянутая предварительно установленная матрица («нет» на шаге S445), то на шаге S457 принимают предварительно установленные данные, реализованные в типе, за исключением матрицы, установленной кодером. Затем на шаге S468 настраивают уровень объекта, применяя к аудиосигналу принятые предварительно установленные данные. Далее можно вывести аудиосигнал, включающий в себя настроенный объект (S470).
На шаге S465 настройки объекта с применением предварительно установленной матрицы можно использовать предварительно установленную матрицу, выбранную пользователем (не показано). Пользователь способен выбрать предварительно установленные метаданные, соответствующие предварительно установленной матрице, причем предварительно установленные метаданные выводят на шаге S437 вывода метаданных. Например, если пользователь выбирает из предварительно установленных метаданных метаданные, представленные как режим караоке, то из принятой на шаге S455 предварительно установленной матрицы на основе информации о выходном канале выбирается предварительно установленная матрица, соответствующая предварительно установленным метаданным для режима караоке. Затем с применением к аудиосигналу выбранной предварительно установленной матрицы, соответствующей режиму караоке, выполняют настройку уровня объекта. После этого выполняется вывод аудиосигнала, включающего в себя настроенный объект.
На фиг.5 представлена схема синтаксиса согласно варианту настоящего изобретения.
Обратимся к фиг.5, где информация, соответствующая предварительно установленной информации, может существовать в области заголовка битового потока. Таким образом, предварительно установленную численную информацию (bsNumPresets) можно получить из области заголовка битового потока.
Если предварительно установленная численная информация существует (если (bsNumPresets)), то получают номер предварительно установленной информации, который указан в предварительно установленной информации о номерах [numPresets = bsNumPresets+1]. Например, если существует одна предварительно установленная информация, то предварительно установленная информация о номерах может установить «bsNumPresets» в 0. В этом случае действительный номер предварительно установленной информации определяется и используется как «(предварительно установленная информация о номерах)+1». Сначала предварительно установленная информация о номерах может быть получена из битового потока.
На основе предварительно установленной информации о номерах можно получить информацию, указывающую тип предварительно установленных данных рендеринга для каждой предварительно установленной информации (i-я предустановка) (bsPresetType[i]). Если случай пересылки предварительно установленных данных рендеринга по матричному типу определить как специальный предварительно установленный тип (случай пересылки bsPresetType[i] при матричном типе), то информацией, указывающей тип предварительно установленных данных рендеринга, может быть вышеупомянутая предварительно установленная информация о типе (preset_type_flag), указывающая, были ли созданы и переданы предварительно установленные данные рендеринга по матричному типу. В этом случае предварительно установленная информация о типе может быть представлена в виде одного бита.
Если предварительно установленные данные рендеринга, включенные в i-ю предварительно установленную информацию, относятся к матричному типу (bsPresetType[i]), то получают информацию о выходных каналах (bsPresetCh[i]), указывающую, сколько каналов имеется в выходном канале. Наконец, получают предварительно установленную матрицу для настройки уровня объекта, содержащегося в аудиосигнале, на основе информации о выходном канале (getRenderingMatrix()).
На фиг.6 показана схема синтаксиса, представляющего способ обработки аудиосигнала согласно другому варианту настоящего изобретения. Предварительно установленная информация существует в области заголовка и впоследствии может быть применена ко всем кадрам одинаковым образом. В альтернативном варианте предварительно установленную информацию применяют по-разному в зависимости от времени (далее это называется «переменная во времени») для эффективной настройки уровня объекта. Если предварительно установленная информация является переменной во времени, то информация, соответствующая предварительно установленной информации, должна быть предусмотрена для каждого кадра. Таким образом, информацию, указывающую, предусмотрена ли предварительно установленная информация для каждого кадра, включают в заголовок, в результате чего можно обеспечить эффективную конфигурацию битового потока.
Обратимся к фиг.6, где показан синтаксис, указывающий, включена ли предварительно установленная информация для каждого кадра. Этот синтаксис аналогичен прежнему синтаксису, показанному на фиг.5, который указывает способ обработки аудиосигнала, показанный на фиг.5. Синтаксис, показанный на фиг.6, может еще включать в себя предварительно установленную информацию об изменяющемся во времени флаге (bsPresetTimeVarying[i]), указывающую, является ли предварительно установленная информация переменной во времени, то есть для каждого кадра после получения информации о выходном канале (bsPresetCh[i]). Если в область заголовка битового потока включена предварительно установленная информация об изменяющемся во времени флаге, настраивается уровень объекта с использованием предварительно установленной матрицы и предварительно установленных метаданных, включенных в область кадра битового потока. Если предварительно установленная информация об изменяющемся во времени флаге в заголовке присутствует, то определяется, имеется ли обновление предварительно установленной информации для каждого кадра. Если обновления нет, то отдельный флаг устанавливают в состояние «удержание». Если обновление есть, то отдельный флаг устанавливают в состояние «считывание». Таким образом, предоставляется возможность эффективной настройки битового потока путем настройки отдельного флага.
Кроме того, в битовом потоке имеется предварительно установленная информация о наличии (bsPresetExists), указывающая, существует ли предварительно установленная информация в битовом потоке. Если предварительно установленная информация о наличии указывает, что предварительно установленная информация не существует в битовом потоке, то может не выполняться цикл для получения предварительно установленной информации о номерах (bsNumPresets), предварительно установленной информации о типе (bsPresetType[i]), информации о выходном канале (bsPresetCh[i]) и предварительно установленной информации об изменяющемся во времени флаге (bsPresetTimeVarying[i]). Предварительно установленная информация может быть опущена в данном синтаксисе, если это необходимо.
На фиг.7 показана схема синтаксиса, представляющего способ обработки аудиосигнала согласно дополнительному варианту настоящего изобретения. Вышеописанная предварительно установленная матрица представляет собой матрицу типа «(число объектов)*(число выходных каналов)» и указывает степень вклада объекта в выходной канал. В этом случае благодаря приему и использованию информации только о некоторых объектах можно уменьшить количество передаваемых битов, что повышает эффективность обработки. Таким образом, в дополнительном варианте настоящего изобретения предлагается синтаксис для способа обработки аудиосигнала, обеспечивающий настройку конкретного объекта с использованием только предварительно установленной информации.
Обратимся к фиг.7, где синтаксис может дополнительно включать в себя предварительно установленную информацию о применении к объекту (bsPresetObject[i][j]), указывающую применимость предварительно установленной информации для настройки уровня объекта к каждому объекту. Используя предварительно установленную информацию о применимости к объекту, можно дать знать, включает ли предварительно установленная информация информацию о соответствующем объекте. Предварительно установленная информация о применимости к объекту может существовать в области заголовка битового потока. Если предварительно установленная информация изменяется во времени, как показано на фиг.6, предварительно установленная информация о применимости к объекту может находиться в кадре. Можно дать знать, что предварительно установленная информация для каждого объекта включает в себя информацию о соответствующем объекте, как показано на фиг.7. Наконец, в битовый поток может быть включен индекс объекта, указывающий наличие или отсутствие включения. При использовании индекса объекта можно сконфигурировать битовый поток в более удобном виде, используя символ выхода.
В случае выполнения кодирования без потерь с использованием таблицы Хаффмана или т.п. символ выхода создает таблицу, имеющую параметры, превосходящие действующие параметры на 1. В этом случае в качестве параметра выхода может быть задан дополнительно распределенный параметр. В частности, если параметр выхода получают из битового потока, его можно использовать как определяющий то, что получена вся соответствующая информация. Например, если предварительно установленная информация включает в себя информацию только о двух объектах, а всего их 10 (информацию о 3-м объекте и информацию о 8-м объекте), то можно эффективно сконфигурировать битовый поток путем пересылки индекса Хаффмана, соответствующего 3-му и 8-му объектам, а затем индекса Хаффмана, соответствующего параметру выхода.
На фиг.8 представлена блок-схема блока приема предварительно установленных данных рендеринга для пошагового создания предварительно установленной матрицы согласно дополнительному варианту настоящего изобретения.
Обратимся к фиг.8, где блок 320 приема предварительно установленных данных рендеринга включает в себя блок 322 приема предварительно установленного флага типа данных, блок 324 приема информации о выходном канале и блок 326 определения предварительно установленной матрицы. Остальные элементы имеют конфигурации и функции, подобные блокам 224-320 приема предварительно установленных данных рендеринга, показанным на фиг.2/3, в связи с чем их подробное описание далее опущено.
Между тем, блок 326 определения предварительно установленной матрицы, показанный на фиг.8, включает в себя блок 810 приема предварительно установленной матрицы типа «моно», блок 820 создания предварительно установленной матрицы типа «стерео» и блок 830 создания предварительно установленной матрицы многоканального типа.
Блок 810 приема предварительно установленной матрицы типа «моно» принимает предварительно установленную матрицу «моно», представленную в виде матрицы типа «число объектов» из блока создания предварительно установленной информации (не показан). Если информация о выходном канале, полученная из блока 324 приема информации о выходном канале, относится к типу «моно», то предварительно установленная матрица «моно» выводится, как она есть. Выведенная предварительно установленная матрица «моно» применяется к аудиосигналу для настройки уровня объекта.
Между тем, если информация о выходном канале относится к типу «стерео», то предварительно установленная матрица «моно» вводится в блок 820 создания предварительно установленной матрицы типа «стерео». Дополнительно вводится информация о расширении канала для создания предварительно установленной матрицы «стерео» типа «(число объектов)*2». Если информация о выходном канале указывает на многоканальный тип, то в блок 830 создания предварительно установленной матрицы многоканального типа вводится предварительно установленная матрица «стерео» и информация о многоканальном расширении для создания предварительно установленной многоканальной матрицы типа «(число объектов)*6».
Таким образом, кодер создает только предварительно установленную матрицу «моно», а блок 326 определения предварительно установленной матрицы пошагово создает предварительно установленную матрицу с использованием информации о расширении каналов. Следовательно, если конфигурация воспроизведения сводится лишь к «стерео», то имеется возможность сэкономить некоторое количество передаваемых бит. И тогда предварительно установленную матрицу для стереоканала или многоканальную матрицу можно передавать без избыточности.
В способе обработки аудиосигнала согласно дополнительному варианту настоящего изобретения предлагается способ пересылки значения усиления при передаче предварительно установленной или передаче нормализованной предварительно установленной матрицы, если это необходимо. Это можно распространить на способ передачи значения усиления только в том случае, если усиление необходимо для настройки объекта, содержащегося в аудиосигнале, или сравнительно легкой передачи всей предварительно установленной матрицы. Например, чтобы переслать предварительно установленную матрицу, показанную в формуле 1, первым делом следует переслать информацию о n*6 значениях усиления. В этом случае информацию об усилении можно вычислить по формуле 2.
[Формула 2]
В формуле 2 'i' указывает объект, 'j' указывает выходной канал, а 'nCH' указывает количество выходных каналов. Поскольку количество Gi соответствует количеству объектов, для предварительно установленной информации потребуется число n.
Если необходима информация о панорамировании и информация об усилении, то дополнительно используют нормализованную предварительно установленную матрицу. В этом случае нормализованная предварительно установленная матрица может быть определена согласно формуле 3.
[Формула 3]
В случае использования в раскрытом выше способе информации об усилении и нормализованной предварительно установленной матрицы потребуется пересылка информации о n*6 значениях усиления. Кроме того, в характеристиках нормализации имеется такая характеристика, как , причем значение десятичного логарифма для всегда меньше или равно 0. Следовательно, в случае использования таблицы приращений канального уровня для квантования информации об усилении, будет использована только половина известной таблицы. Это поможет сэкономить объем необходимых данных, а также сохранить скорость передачи в битах по сравнению с приемом с использованием ненормализованной предварительно установленной матрицы без отдельной пересылки информации об усилении. Кроме того, поскольку информация об усилении может быть включена только в предварительно установленную информацию, появляется возможность использования предварительно установленной информации в масштабируемом виде.
На фиг.9 представлена схема синтаксиса согласно еще одному дополнительному варианту настоящего изобретения, в котором информация об усилении и соответствующая информация о панорамировании пересылается по отдельности включенной в предварительно установленную информацию. Информация об усилении и информация о панорамировании могут быть включены в область заголовка или кадра.
Обратимся к фиг.9, где часть, набранная курсивным шрифтом, указывает, что из битового потока принимается действующее предварительно установленное значение. В наличии имеются различные схемы помехоустойчивого кодирования, которые представлены на фиг.9 в виде функций. Например, если вышеупомянутая информация находится в области кадра, то проверяют, имеется ли предварительно установленная информация. Если предварительно установленная информация существует, то принимают предварительно установленную информацию о номерах. Затем в первую очередь принимают информацию об усилении. Информацией об усилении является информация, указывающая, что соответствующий объект будет воспроизведен с предписанным значением усиления. В этом случае информацией об усилении может быть вышеупомянутый параметр G_i или произвольное усиление понижающего микширования (далее сокращенно обозначено как ADG), которое создается, если уровень аудиосигнала настраивают на значение, введенное извне.
Дополнительно получаемая информация о панорамировании может относиться к одному из нескольких различных типов. Информация о панорамировании может включать в себя вышеупомянутую нормализованную предварительно установленную матрицу. Информацию о панорамировании можно разделить на информацию о панорамировании стерео и информацию о многоканальном панорамировании.
На фиг.10 представлена блок-схема устройства обработки аудиосигнала согласно другому варианту настоящего изобретения.
Обратимся к фиг.10, где устройство обработки аудиосигнала согласно другому варианту настоящего изобретения в основном включает в себя блок 1010 понижающего микширования, блок 1020 создания информации об объекте, блок 1030 создания предварительно установленной информации, блок 1040 обработки сигнала понижающего микширования, блок 1050 обработки информации и блок 1060 многоканального декодирования.
Прежде всего, в блок 1010 понижающего микширования вводится множество объектов, после чего создается моно- или стереосигнал понижающего микширования. Также в блок 1020 создания информации об объектах вводится множество объектов, после чего создается информация об уровне объекта, указывающая уровень объекта, информация об усилении объекта, указывающая меру вклада объекта, включенного в сигнал понижающего микширования в случае, когда значение усиления объекта включено в сигнал понижающего микширования, и/или стереосигнал понижающего микширования, а также информацию об объекте, включающую в себя информацию о корреляции объектов, указывающую о наличии или отсутствии корреляции между объектами.
Затем сигнал понижающего микширования и объектная информация вводятся в блок 1030 создания предварительно установленной информации, чтобы создать предварительно установленную информацию, включающую в себя предварительно установленные данные рендеринга для настройки уровня объекта и предварительно установленные метаданные для представления предварительно установленной информации. Процесс создания предварительно установленных данных рендеринга и предварительно установленных метаданных достаточно хорошо объяснен в предшествующем описании устройства и способа обработки аудиосигнала, показанных на фиг.1-9, в связи с чем в последующем описании соответствующие подробности опущены. Между тем, объектная информация, созданная блоком 1020 создания объектной информации, и предварительно установленная информация, созданная блоком 1030 создания предварительно установленной информации, могут пересылаться, будучи включенными в битовый поток SAOC.
Блок 1050 обработки информации включает в себя блок 1051 обработки объектной информации и блок 1052 приема предварительно установленной информации. Наконец, блок 1050 обработки информации принимает битовый поток SAOC.
Блок 1052 приема предварительно установленной информации принимает из битового потока SAOC вышеупомянутую предварительно установленную информацию о наличии, предварительно установленную информацию о номерах, предварительно установленную информацию о длине, предварительно установленные метаданные, предварительно установленную информацию о типе, информацию о выходном канале и предварительно установленную матрицу и использует упомянутые способы согласно различным объясненным вариантам изобретения для способа и устройства обработки аудиосигнала, показанным на фиг.1-9. Наконец, блок 1052 приема предварительно установленной информации выводит предварительно установленные метаданные и предварительно установленную матрицу. Блок 1051 обработки объектной информации принимает предварительно установленные метаданные и предварительно установленную матрицу, а затем создает информацию, необходимую для обработки понижающего микширования, для предобработки сигнала понижающего микширования и многоканальную информацию для повышающего микширования сигнала понижающего микширования с использованием объектной информации, включенной в битовый поток SAOC вместе с предварительно установленными метаданными и предварительно установленной матрицей.
Затем, когда информация об обработке понижающего микширования введена в блок 1040 обработки сигнала понижающего микширования, появляется возможность выполнения панорамирования объекта, включенного в сигнал понижающего микширования. Предварительно обработанный вышеописанным образом сигнал понижающего микширования вводится в блок 1060 многоканального декодирования вместе с многоканальной информацией, выведенной из блока 1050 обработки информации, после чего выполняется повышающее микширование для создания многоканального аудиосигнала.
Таким образом, при декодировании аудиосигнала, содержащего множество объектов, в многоканальный сигнал с использованием объектной информации устройство обработки аудиосигнала согласно настоящему изобретению приспособлено для настройки уровня объекта с использованием предварительно установленной информации. Действуя таким образом, устройство обработки аудиосигнала согласно настоящему изобретению эффективно выполняет настройку уровня объекта, используя данные о типе матрицы, полученные на основе информации о выходном канале, в виде предварительно установленной матрицы, применяемой к объекту. Наконец, устройство обработки аудиосигнала согласно настоящему изобретению способно повысить эффективность кодирования путем вывода предварительно установленных метаданных на основе предварительно установленной информации о длине, переданной со стороны кодера.
На фиг.11 представлена блок-схема оборудования, реализующего блок приема предварительно установленной информации, который включает в себя блок приема метаданных и блок приема предварительно установленных данных рендеринга согласно варианту настоящего изобретения, а на фиг.12 показана схема взаимосвязей между терминалом и сервером согласно оборудованию, показанному на фиг.11.
Обратимся к фиг.11, где блок 1110 проводной/беспроводной связи принимает битовый поток с помощью системы проводной/беспроводной связи. В частности, блок 1110 проводной/беспроводной связи может включать в себя по меньшей мере один блок из группы, состоящей из блока 1111 проводной связи, блока 1112 инфракрасной связи, блока 1113 Bluetooth и блока 1114 беспроводной связи по сети LAN.
Блок 1120 аутентификации пользователя принимает введенную информацию о пользователе, а затем выполняет аутентификацию пользователя. Блок 1120 аутентификации пользователя может включать в себя по меньшей мере один блок из группы, состоящей их блока 1121 распознавания по отпечаткам пальцев, блок 1122 распознавания по радужной оболочке, блок 1123 распознавания по лицу и блок 1124 распознавания по голосу. В данном случае аутентификация пользователя может выполняться путем приема введенной информации об отпечатках пальцев, информации о радужной оболочке, информации о контуре лица или информации о голосе, преобразования введенной информации в информацию о пользователе с последующим определением того, соответствует ли информация о пользователе зарегистрированным данным об этом пользователе.
Блок 1130 ввода представляет собой устройство ввода, позволяющее пользователю вводить команды различных видов. Блок 1130 ввода может включать в себя по меньшей мере один блок из группы, состоящей из блока 1131 клавиатуры, блока 1132 сенсорной панели и блока 1133 удаленного контроллера, причем указанные примеры блока 1130 ввода этим не ограничиваются. Между тем, если предварительно установленные метаданные для предварительно установленной информации, выводимой из блока 1141 приема данных, описываемого ниже, визуализируются на экране через блок 1162 отображения, пользователь имеет возможность выбрать предварительно установленные метаданные через блок 1130 ввода, а информация о выбранных предварительно установленных метаданных вводится в блок 1150 управления.
Блок 1140 декодирования сигнала включает в себя блок 1141 приема метаданных и блок 1142 приема предварительно установленных данных рендеринга. Блок 1141 приема метаданных принимает предварительно установленную информацию о длине, а затем принимает предварительно установленные метаданные на основе принятой предварительно установленной информации о длине. Если предустановка представлена в виде матрицы с помощью предварительно установленной информации о типе, то блок 1142 приема предварительно установленных данных рендеринга принимает информацию о выходном канале, а затем принимает предварительно установленную матрицу, представляющую собой предварительно установленные данные рендеринга, на основе принятой информации о выходном канале. Блок 1140 декодирования сигнала создает выходной сигнал путем декодирования аудиосигнала с использованием принятого битового потока, предварительно установленных метаданных и предварительно установленной матрицы и выводит предварительно установленные метаданные текстового типа.
Блок 1150 управления принимает сигналы, поступившие из устройств ввода, и управляет всеми процессами в блоке 1140 декодирования сигнала и блоке 1160 вывода. Как упоминалось в вышеприведенном описании, если информация о выбранных предварительно установленных метаданных введена в блок 1150 управления из блока 1130 ввода, блок 1142 приема предварительно установленных данных рендеринга принимает предварительно установленную матрицу, соответствующую выбранным предварительно установленным метаданным, а затем декодирует аудиосигнал, используя принятую предварительно установленную матрицу.
Наконец, блок 1160 вывода является элементом, предназначенным для вывода выходного сигнала и т.п., созданного блоком 1140 декодирования сигнала. Блок 1160 вывода может включать в себя блок 1161 динамиков и блок 1162 отображения. Если выходным сигналом является аудиосигнал, то он выводится через блок 1161 динамиков. Если выходным сигналом является видеосигнал, то он выводится через блок 1162 отображения. Кроме того, блок 1160 вывода визуализирует предварительно установленные метаданные, введенные из блока 1150 управления, на экране через блок 1162 отображения.
На фиг.12 показаны взаимосвязи между терминалами или между терминалом и сервером, каждый из которых соответствует оборудованию, показанному на фиг.11.
Обратимся к части (А) на фиг.12, из которой можно видеть, что между первым терминалом 1210 и вторым терминалом 1220 может осуществляться двусторонняя передача данных или битовых потоков через блоки проводной/беспроводной связи.
Обратимся к части (В) на фиг.12, где можно видеть, что проводная/беспроводная передача может осуществляться между сервером 1230 и первым терминалом 1240.
На фиг.13 представлена блок-схема устройства 1300 декодирования широковещательного сигнала, который реализует функцию блока приема предварительно установленной информации, содержащего блок приема метаданных и блок приема предварительно установленных данных рендеринга согласно одному варианту настоящего изобретения.
Обратимся к фиг.13, где демультиплексор 1320 принимает множество данных, относящихся к телевизионному вещанию, от селектора 1310 каналов. Принятые данные разделяются демультиплексором 1320, а затем декодируются декодером 1330 данных. Между тем, данные, разделенные демультиплексором 1320, могут быть запомнены на носителе 1350 данных, таком как HDD. Данные, разделенные демультиплексором 1320, вводятся в декодер, включающий в себя аудиодекодер 1341 и видеодекодер 1342, для их декодирования в аудиосигнал и видеосигнал. Аудиодекодер 1341 включает в себя блок 1341А приема метаданных и блок 1341В приема предварительно установленных данных рендеринга согласно одному варианту настоящего изобретения. Блок 1341А приема метаданных принимает предварительно установленную информацию о длине, а затем принимает предварительно установленные метаданные на основе принятой предварительно установленной информации о длине.
Если предварительно установленная информация представлена в матрице, то блок 1341В приема предварительно установленных данных рендеринга принимает информацию о выходном канале, а затем принимает предварительно установленную матрицу, представляющую предварительно установленные данные рендеринга, на основе принятой информации о выходном канале. Аудиодекодер 1341 создает выходной сигнал путем декодирования аудиосигнала с использованием принятого битового потока, предварительно установленных метаданных и предварительно установленной матрицы и выводит предварительно установленные метаданные текстового типа.
Блок 1370 отображения визуализирует видеосигнал, выведенный из видеодекодера 1342, и предварительно установленные метаданные, выведенные из аудиодекодера 1341. Блок 1370 отображения включает в себя блок динамиков (не показан). Аудиосигнал, в котором с использованием предварительно установленной матрицы настроен уровень объекта, выведенного из аудиодекодера 1341, выводится через блок динамиков, входящий в блок 1370 отображения. Кроме того, данные, декодированные декодером 1340, могут запоминаться на носителе 1350 данных, таком как HDD,
Между тем, устройство 1300 декодирования сигнала может дополнительно включать в себя администратор 1360 приложений, способный управлять множеством данных, имея информацию, введенную пользователем.
Администратор 1360 приложений включает в себя администратор 1361 пользовательского интерфейса и сервисный администратор 1362. Администратор 1361 пользовательского интерфейса управляет интерфейсом для приема информации, вводимой пользователем. Например, администратор 1361 пользовательского интерфейса может управлять типом шрифта текста, визуализируемого в блоке 1370 отображения, яркостью экрана, конфигурацией меню и т.п. Между тем, если широковещательный сигнал декодируется и выводится декодером 1340 и блоком 1370 отображения, то сервисный менеджер 1362 может управлять принятым широковещательным сигналом, используя информацию, введенную пользователем. Например, сервисный менеджер 1362 способен обеспечить настройку широковещательного канала, настройку функции аварийной сигнализации, функцию аутентификации контента только для взрослых и т.д. Данные, выдаваемые администратором 1360 приложений, можно использовать путем их пересылки в блок 1370 отображения, а также декодер 1340.
На фиг.14 представлена схема блока отображения, состоящего из оборудования, которое включает в себя блок приема предварительно установленной информации согласно одному варианту настоящего изобретения. Блок отображения способен визуализировать все предварительно установленные метаданные, содержащиеся в битовом потоке. Например, на экране визуализируются режим караоке, режим концертного зала и режим новостей, как показано на фиг.14.
Если пользователь выбирает что-то одно из предварительно установленных метаданных, блок отображения визуализирует объекты, уровни которых настраиваются таким образом, что к множеству объектов применяется предварительно установленная матрица, соответствующая режиму караоке. Например, если пользователь выбирает режим караоке, то может быть визуализирована конфигурация настройки уровня вокального объекта на минимум. Кроме того, если пользователь выбирает режим новостей, то предварительно установленная матрица, применяемая к аудиосигналу, снизит уровни всех объектов за исключением вокального объекта.
Обратимся к фиг.14, где при выборе режима новостей блок отображения способен визуализировать конфигурацию, в которой уровень вокального объекта поднят выше, чем в режиме караоке, в то время как уровни остальных объектов сведены к минимуму.
Таким образом, при визуализации уровней объектов, настроенных с помощью предварительно установленной матрицы, а также предварительно установленных метаданных, указывающих предустановку в блоке отображения, пользователь способен прослушивать аудиосигнал, имеющий особый звуковой сценический эффект путем правильного выбора конкретного предварительно установленного режима.
Промышленная применимость
Соответственно, настоящее изобретение применимо к кодированию и декодированию аудиосигналов.
Хотя настоящее изобретение было здесь описано и проиллюстрировано со ссылками на предпочтительные варианты его осуществления, специалистам в данной области техники будет очевидно, что в него могут быть внесены различные модификации и видоизменения, не выходящие за рамки существа и объема изобретения. Таким образом, предполагается, что настоящее изобретение покрывает упомянутые модификации и видоизменения этого изобретения, которые входят в объем прилагаемой формулы изобретения и ее эквивалентов.
Изобретение относится к способу и устройству для обработки аудиосигнала, в частности аудиосигнала, принятого в виде цифрового носителя, широковещательного сигнала или т.п. Техническим результатом является повышение точности и эффективности настройки уровня выходного канала, сокращение объема излишнего кодирования. Указанный результат достигается тем, что способ для обработки аудиосигнала включает прием аудиосигнала и предварительно установленной информации; получение предварительно установленной матрицы из предварительно установленной информации, причем предварительно установленная матрица указывает степень вклада объекта в выходной канал; и настройку выходного уровня объекта путем использования предварительно установленной матрицы. Соответственно, при отсутствии пользовательских настроек для каждого объекта, если предварительно установленные метаданные, применяемые к аудиосигналу, выбирают со ссылками на предварительно установленные метаданные, можно легко настроить уровни объектов, содержащихся в аудиосигнале, путем использования предварительно установленных данных рендеринга, соответствующих выбранным предварительно установленным метаданным. 5 н. и 10 з.п. ф-лы, 14 ил., 1 табл.
1. Способ обработки аудиосигнала, содержащий:
прием аудиосигнала и предварительно установленной информации, причем аудиосигнал включает в себя по меньшей мере один объект;
получение предварительно установленной матрицы из предварительно установленной информации, причем предварительно установленная матрица указывает степень вклада объекта в выходной канал;
настройку выходного уровня объекта согласно выходному каналу путем использования предварительно установленной матрицы; и
вывод аудиосигнала, включающего в себя объект с настроенным выходным уровнем,
причем предварительно установленную информацию получают на основе предварительно установленной информации о наличии, указывающей, что предварительно установленная информация существует, и предварительно установленной информации о номерах, указывающей номер предварительно установленной информации,
причем предварительно установленную матрицу получают на основе предварительно установленной информации о типе, указывающей, что предварительно установленная информация представлена в матрице.
2. Способ по п.1, в котором предварительно установленную матрицу получают на основе информации о выходном канале, указывающей о том, что выходной канал является одним из моноканала, стереоканала или многоканальным.
3. Способ по п.2, в котором предварительно установленную информацию о типе представляют 1 битом.
4. Способ по п.1, в котором размерность предварительно установленной матрицы определяют на основе номера объекта и номера выходного канала.
5. Устройство для обработки аудиосигнала, содержащее:
блок приема аудиосигнала, принимающий аудиосигнал, включающий в себя по меньшей мере один объект;
блок приема предварительно установленных метаданных, принимающий предварительно установленные метаданные из предварительно установленной информации;
блок приема предварительно установленных данных рендеринга, получающий предварительно установленную матрицу из предварительно установленной информации, причем предварительно установленная матрица указывает степень вклада объекта в выходной канал;
блок настройки объекта, настраивающий выходной уровень объекта согласно выходному каналу путем использования предварительно установленной матрицы; и
блок вывода, выводящий аудиосигнал, включающий в себя объект с настроенным выходным уровнем,
причем предварительно установленную матрицу получают на основе предварительно установленной информации о типе, указывающей, что предварительно установленная информация представлена в матрице.
6. Устройство по п.5, в котором блок приема предварительно установленных данных рендеринга получает предварительно установленную матрицу на основе информации о выходном канале, указывающей, что выходной канал является либо моноканалом, либо стереоканалом, либо многоканальным.
7. Устройство по п.6, в котором предварительно установленная информация о типе представлена 1 битом.
8. Устройство по п.5, в котором размерность предварительно установленной матрицы определяют на основе номера объекта и номера выходного канала.
9. Считываемый компьютером носитель записи, хранящий цифровые аудиоданные,
причем цифровые аудиоданные содержат предварительно установленную информацию и аудиосигнал, включающий в себя по меньшей мере один объект,
причем предварительно установленная информация содержит предварительно установленные метаданные, представляющие предварительно установленную информацию, предварительно установленную информацию о наличии, указывающую, что предварительно установленная информация существует, предварительно установленную информацию о номерах, указывающую номер предварительно установленной информации, предварительно установленную матрицу, указывающую степень вклада объекта в выходной канал, и предварительно установленную информацию о типе, указывающую, что предварительно установленная информация представлена в матрице,
причем предварительно установленную информацию получают на основе предварительно установленной информации о наличии и предварительно установленной информации о номерах,
причем предварительно установленную матрицу получают на основе предварительно установленной информации о типе.
10. Носитель записи по п.9, в котором предварительно установленную матрицу получают на основе информации о выходном канале, указывающей, что выходной канал является либо моноканалом, либо стереоканалом, либо многоканальным.
11. Носитель записи по п.10, в котором предварительно установленная информация о типе представлена 1 битом.
12. Носитель записи по п.9, в котором размерность предварительно установленной матрицы определяют на основе номера объекта и номера выходного канала.
13. Устройство для обработки аудиосигнала, содержащее:
блок создания аудиосигнала, создающий аудиосигнал, выполняющий понижающее микширование по меньшей мере одного объекта;
блок создания метаданных, создающий предварительно установленные метаданные для предварительно установленной информации; и
блок создания предварительно установленных данных рендеринга, создающий предварительно установленную матрицу, указывающую степень вклада объекта в выходной канал, и предварительно установленную информацию о типе, указывающую, что предварительно установленная информация представлена в матрице.
14. Устройство по п.13, в котором блок создания предварительно установленных данных рендеринга дополнительно создает информацию о выходном канале, указывающую, что выходной канал является либо моноканалом, либо стереоканалом, либо многоканальным.
15. Способ обработки аудиосигнала, содержащий:
создание аудиосигнала, осуществляющего понижающее микширование по меньшей мере одного объекта;
создание предварительно установленной информации о наличии, указывающей, существует или нет предварительно установленная информация;
создание предварительно установленной информации о номерах, указывающей номер предварительно установленной информации;
создание предварительно установленных метаданных, представляющих предварительно установленную информацию;
создание предварительно установленной матрицы, указывающей степень вклада объекта в выходной сигнал; и
создание предварительно установленной информации о типе, указывающей, что предварительно установленная информация представлена в матрице.
ЕР 1853093 A1, 07.11.2007 | |||
Пломбировальные щипцы | 1923 |
|
SU2006A1 |
KR 20070044352 A, 27.04.2007 | |||
JP 2007178590 A, 12.07.2007 | |||
KR 20070031212 A, 19.03.2007 | |||
Способ обработки целлюлозных материалов, с целью тонкого измельчения или переведения в коллоидальный раствор | 1923 |
|
SU2005A1 |
Способ обработки целлюлозных материалов, с целью тонкого измельчения или переведения в коллоидальный раствор | 1923 |
|
SU2005A1 |
RU 2006114742 A, 20.11.2007. |
Авторы
Даты
2012-05-10—Публикация
2009-01-23—Подача