ЗАЩИТА ОТ ОГРАНИЧЕНИЯ СИГНАЛА С ИСПОЛЬЗОВАНИЕМ ЗАРАНЕЕ СУЩЕСТВУЮЩИХ МЕТАДАННЫХ КОЭФФИЦИЕНТА УСИЛЕНИЯ АУДИОСИГНАЛА Российский патент 2012 года по МПК G10L19/14 

Описание патента на изобретение RU2468451C1

Перекрестная ссылка на родственные заявки

В данной заявке заявлен приоритет в соответствии с Предварительной заявкой № 61/109,433 на патент США, поданный 29 октября 2008 г., приведенный здесь полностью по ссылке.

Область техники, к которой относится изобретение

Заявка на патент относится к защите от ограничения сигнала аудиосигнала с использованием заранее существующих аудиометаданных, внедренных в поток цифровых аудиоданных. В частности, заявка относится к защите от ограничения сигнала в случае смешения с уменьшением количества каналов многоканального аудиосигнала.

Уровень техники

Обычно используется концепция, состоящая во внедрении аудиометаданных в цифровой поток аудиоданных, например, в цифровой среде широковещательной передачи. Такие метаданные представляют собой "данные о данных", то есть данные о цифровых аудиоданных в потоке. Метаданные могут предоставлять информацию для аудиодекодера о том, как воспроизводить звук. Один тип метаданных представляет собой информацию управления динамическим диапазоном, которая представляет изменяющуюся по времени огибающую коэффициента усиления. Такие метаданные управления динамическим диапазоном могут использоваться для ряда назначений.

(1) Управление динамическим диапазоном воспроизводимого звука: цифровая передача позволяет получить расширенный динамический диапазон, но условия прослушивания не всегда позволяют использовать преимущества этого. Хотя расширенный динамический диапазон является желательным в условиях тихой гостиной комнаты, он может не соответствовать другим условиям, например в автомобильном радиоприемнике, из-за высокого уровня фонового шума. Для того чтобы соответствовать широкому разнообразию условий прослушивания, метаданные, с которыми передают инструкции в приемник о том, как следует уменьшить динамический диапазон воспроизводимых аудиоданных, могут быть вставлены в цифровой поток аудиоданных, вместо уменьшения динамического диапазона аудиоданных перед передачей. Последний подход не является предпочтительным, поскольку он лишает возможности приемник воспроизводить аудиоданные с полным динамическим диапазоном. Вместо этого первый подход является предпочтительным, поскольку он позволяет для слушателя принять решение в отношении управления динамическим диапазоном, которое должно быть применено или нет, в зависимости от окружающей среды при прослушивании. Такие метаданные управления динамическим диапазоном делают доступным для слушателей высококачественное художественное сжатие динамического диапазона декодированного сигнала по их усмотрению.

(2) Предотвращение ограничения сигнала в случае операции смешения с понижением частоты: когда многоканальный сигнал (например, аудиосигнал 5.1 каналов) смешивают с уменьшением каналов, количество каналов уменьшается, типично до двух каналов. В случае воспроизведения многоканального аудиосигнала, содержащего больше чем два канала (например, аудиосигнала 5.1 каналов, сигнала, имеющего 5 основных каналов и 1 канал эффекта низкой частоты), через стереогромкоговорители обычно на стороне приемника выполняют операцию смешения с уменьшением количества каналов, где многоканальный сигнал смешивают в два канала. Операция смешения может быть описана по матрице смешения с уменьшением количества каналов, например матрице 2-5, имеющей два ряда по 5 столбцов в случае смешения с уменьшением количества каналов 5-канального сигнала в 2 канальный (стереофонический) сигнал (канал с эффектом низкой частоты типично не учитывают во время смешения с уменьшением количества каналов).

Различные схемы смешения с уменьшением количества каналов для схемы смешивания 5 основных каналов сигнала 5.1 каналов в два канала известны, например Lo/Ro (только левый, только правый) или Lt/Rt (весь левый, весь правый).

Этап смешения с уменьшением количества каналов связан с риском случайной перегрузки цифрового стереосигнала, в результате чего генерируются нежелательные искажения, связанные с ограничениями сигнала. Такое ограничение сигнала может возникать, когда амплитуда цифрового сигнала, подвергаемого смешению с уменьшением количества каналов, которая может превысить максимальное (или минимальное) представительное значение, ограничена максимальным (или минимальным) представительным значением. Например, в случае простого двоичного представления без знака с фиксированной запятой возникает ограничение сигнала, когда рассчитанная амплитуда при смешении с уменьшением количества каналов ограничена словом максимального значения, в котором все биты соответствуют 1. В случае представления со знаком в 16-битном формате, максимальное значение может, например, соответствовать слову "0111111111111111".

Поскольку известно использование матриц для различных схем смешения с уменьшением количества каналов в блоке предварительной обработки, отправитель или сторона генерирования содержания может добавлять к аудиопотоку для сигналов, которые могут привести к ограничению сигнала при смешении с уменьшением количества каналов, метаданные управления динамическим диапазоном, которые передают инструкции в приемник о том, что требуется ослабить сигналы, предназначенные для смешения с уменьшением количества каналов перед смешением, для динамического предотвращения ограничения сигнала.

(3) Предотвращение ограничения сигнала в случае усиленного выхода: для повторной передачи по динамически очень ограниченным каналам (например, из телевизионной приставки через аналоговое RF соединение на RF вход телевизора) сигнал усиливают, обычно на 11 дБ, для достижения лучшего соотношения сигнал-шум на этом пути. При таком применении для сигналов, которые могут привести к ограничению сигнала при усилении на 11 дБ, метаданные управления динамическим диапазоном, которые передают инструкции в приемник о необходимости ослабить сигналы перед усилением на 11 дБ, могут быть добавлены к аудиопотоку, для динамического предотвращения ограничения сигнала.

С точки зрения устройства, принимающего аудиопоток, непонятно, используются ли входящие метаданные управления динамическим диапазоном с целью, соответствующей пункту (1), то есть управление динамическим диапазоном, с целью в соответствии с пунктом (2), то есть защита от ограничения сигнала при смешении с уменьшением количества каналов, или с целью, соответствующей обоим пунктам (1) и (2). Часто метаданные выполняют обе задачи, но это происходит не всегда, поэтому в некоторых случаях метаданные могут не включать в себя защиту от ограничения сигнала при смешении с уменьшением количества каналов. Кроме того, в случае когда метаданные (типично, другой параметр усиления используют для режима RF) ассоциированы с режимом RF по пункту (3), метаданные могут использоваться для предотвращения ограничения сигнала в случае дополнительного усиления (как в случае смешения с уменьшением количества каналов, так и в случае, когда смешение с уменьшением количества каналов не используется).

Кроме того, входящий аудиопоток может вообще не включать в себя метаданные управления динамическим диапазоном, вследствие того что для некоторых форматов кодирования аудиоданных метаданные не обязательны.

Если метаданные управления динамическим диапазоном не включены в сжатый аудиопоток или включены, но не включают в себя защиту от ограничения сигнала при смешении с уменьшением количества каналов, нежелательные искажения в результате ограничения сигнала могут присутствовать в декодированном сигнале, если многоканальный сигнал будет смешан с уменьшением количества каналов.

В WO 2008/1000098 описан способ кодирования/декодирования аудиоданных и устройство для обработки аудиосигналов на основе объектов.

Сущность изобретения

В настоящем изобретении описаны способ и устройство для предотвращения ограничения аудиосигнала в случае, когда защита от ограничения сигнала с помощью аудиометаданных не гарантируется.

Первый аспект изобретения относится к способу предоставления защиты от ограничения сигнала для аудиосигнала, например цифрового аудиосигнала, смешанного с уменьшением количества каналов, который был получен из цифровых аудиоданных. В соответствии с этим способом определяют, являются ли значения первого усиления на основе принятых аудиометаданных достаточными для защиты от ограничения аудиосигнала. Аудиометаданные внедряют в первый аудиопоток. Например, определяют, достаточны или нет метаданные огибающей изменяющегося по времени усиления, включенные в поток сжатых аудиоданных, для предотвращения ограничения сигнала при смешении с уменьшением количества каналов. В случае когда первое значение усиления не достаточно для защиты, соответствующее первое значение усиления заменяют значением усиления, достаточным для защиты от ограничения аудиосигнала. Предпочтительно, в случае когда метаданные, относящиеся к управлению динамическим диапазоном, отсутствуют в первом аудиопотоке, способ может добавлять значения усиления, достаточные для защиты от ограничения сигнала. Например, в случае когда метаданные огибающей изменяющегося по времени усиления не обеспечивают достаточную защиту от ограничения сигнала при смешении с уменьшением количества каналов или отсутствуют вообще, метаданные огибающей изменяющегося по времени усиления модифицируют или добавляют таким образом, чтобы они обеспечивали достаточную защиту от ограничения сигнала при смешении с уменьшением количества каналов.

Способ обеспечивает защиту от ограничения сигнала, в частности защиту от ограничения сигнала в случае смешения с уменьшением количества каналов, независимо от того, были ли приняты значения усиления, достаточные для защиты от ограничения сигнала, или нет.

В соответствии со способом принятые слова, содержащие значения усиления аудиоданных (если они предусмотрены), могут использоваться настолько правильно, насколько это возможно, но они могут быть отменены, когда входящие слова, содержащие значения усиления, не обеспечивают достаточного уменьшения уровня для предотвращения ограничения сигнала, например, при смешении с уменьшением количества каналов.

Поскольку данные управления динамическим диапазоном, используемые для назначения в соответствии с пунктом (1), содержат артистические аспекты, типично приемное устройство (например, телевизионная приставка) не имеет задачи ввода их в случае, когда входящие метаданные не обеспечивают динамический диапазон. Свойства по пункту (2), однако, могут и поэтому должны быть предусмотрены принимающей стороной. Это означает, что приемное устройство должно пытаться сохранить данные управления динамическим диапазоном, предназначенные для управления динамическим диапазоном в соответствии с пунктом (1), в максимально возможной степени, в то время как одновременно с этим добавляется защита от ограничения сигнала.

Существуют различные способы определения, достаточно ли первых значений усиления на основе принимаемых аудиометаданных для защиты от ограничения сигнала.

В соответствии с предпочтительным подходом вторые значения усиления рассчитывают на основе цифровых аудиоданных, в случае когда вторые значения усиления достаточны для защиты от ограничения аудиосигнала. Вторые значения усиления могут представлять собой максимально допустимые значения усиления, которые не приводят к ограничению сигнала.

Предпочтительно, способ определяет, являются ли достаточными первые значения усиления таким образом, что выполняют сравнение первых значений усиления на основе принятых аудиометаданных и рассчитанных вторых значений усиления. Способ может сравнивать одно из первого значения, ассоциированного с сегментом аудиоданных, с соответствующим вторым значением усиления, ассоциированным с тем же сегментом аудиоданных.

В зависимости от этого поток значений усиления, соответствующих защите от ограничений сигнала, может быть сгенерирован из первого и второго значений усиления. Предпочтительно, такие значения усиления выбирают из первых значений усиления и рассчитанных вторых значений усиления, в зависимости от операций сравнения. В результате выбора второго рассчитанного значения усиления вместо первого значения усиления первое значение усиления заменяют выбранным вторым значением усиления.

Предпочтительно, выбирают минимальное из пары из первого и второго значений усиления. Если первое значение усиления больше, чем рассчитанное второе значение усиления, достаточное для защиты, это обозначает, что существует риск того, что первое значение усиления будет недостаточным для защиты от ограничения сигнала и, таким образом, должно быть заменено соответствующим вторым значением усиления. В противном случае, если первое значение усиления будет меньше, чем рассчитанное второе значение усиления, достаточное для защиты, это обозначает, что отсутствует какой-либо риск ограничения сигнала, и первое значение усиления должно быть сохранено.

Выбор значений усиления из первого и второго значений усиления может осуществляться, как поясняется ниже.

В случае когда как первое значение усиления, так и второе значение усиления обеспечивают усиление, меньшее или равное 1, выбирают минимальное из них. Это означает, что либо первое значение усиления уже гарантирует защиту от ограничения сигнала, или, в противном случае, оно будет заменено вторым значением усиления.

В случае когда усиление для второго значения усиления больше 1 и первое значение усиления предусматривает усиление, меньшее или равное 1, сигнал может быть усилен и все еще не будет ограничен. Однако входящий аудиопоток запрашивает ослабление, например, с целью выполнения ограничения динамического диапазона, и, таким образом, его сохраняют.

В случае когда первое значение усиления обеспечивает усиление, большее 1, и второе значение усиления обеспечивает усиление, меньшее или равное 1, входящее первое значение усиления может нарушить защиту от ограничения сигнала, и, таким образом, выбирают второе значение усиления.

В случае когда как первое значение усиления, так и второе значение усиления обеспечивают усиление, большее 1, входной сигнал должен быть усилен. Такое усиление разрешено, если только все еще не возникает ограничение сигнала, и, таким образом, используется меньшее из первого значения усиления и второго значения усиления.

Альтернативный подход для определения, является ли первое значения усиления достаточным для защиты, состоит в применении первого значения усиления к аудиоданным, для определения, получится ли в результате цифровой аудиосигнал (например, сигнал, полученный в результате смешения с уменьшением количества каналов) ограничения.

В случае когда первые значения усиления не достаточны для защиты, возможно итерационно определить значения усиления, которые достаточны для защиты от ограничения сигнала, начиная с первых значений усиления, в качестве исходных значений усиления. Например, можно определить, происходит ли ограничение аудиосигнала со значением усиления, которое представляет собой ближайшее значение усиления, меньшим, чем первое усиление, в соответствии с разрешающей способностью значений усиления (например, в случае когда первое значение усиления равно 0,8 и разрешение значения усиления составляет 0,1, наименьшее ближайшее значение усиления будет 0,7). Если все еще происходит ограничение сигнала, можно определить, произойдет ли ограничение аудиосигнала со следующим меньшим значением усиления (например, со значением усиления 0,6). Это повторяют до тех пор, пока не найдут значение усиления, которое не приводит к ограничению сигнала.

Предпочтительно, способ выполняют как часть процесса транскодирования, в случае когда первый аудиопоток, который находится в первом формате аудиокодирования (например, формате AAC ПЗК (перспективное звуковое кодирование) или в формате высокоэффективного AAC (HE-AAC, ВЭ-ПЗК), также известном, как aacPlus), транскодируют во второй аудиопоток, кодированный во втором формате кодирования аудиоданных (например, в формате Dolby Digital или в формате Dolby Digital Plus). Второй поток аудиоданных содержит замененные значения усиления, достаточные для ограничения, или имеет значения усиления, полученные из них.

Часто требуется выполнять транскодирование аудиоданных, поскольку цифровой формат сжатия для передачи аудиоданных не может поддерживаться по всей цепи передачи до конечного аудиодекодера в цепи передачи (например, до декодера AVR - приемника аудио/видеоданных). В случае широковещательной передачи это связано с тем, что, например, разные схемы кодирования можно использовать для широковещательной передачи через радиоканал (или широковещательной передачи потребителю по кабелю) и передачи аудиоданных между приемным устройством (например, телевизионной приставкой - STB (ТВП)) и конечным декодером в цепи передачи (например, декодером в AVR или аудиодекодером в телевизионном приемнике). Например, аудиоданные могут быть переданы в режиме широковещательной передачи по радиоканалу через формат AAC или формат HE-AAC, и затем аудиоданные могут быть транскодированы в формат Dolby Digital или в формат Dolby Digital Plus для передачи из STB в AVR. Вследствие этого этап транскодирования может быть выполнен, например, в STB, для преобразования из одного формата в другой. Такой этап транскодирования содержит транскодирование самих аудиоданных, но в идеале также транскодирование сопровождающих метаданных, в частности данных управления динамическим диапазоном. В соответствии с предпочтительным вариантом осуществления способ обеспечивает транскодированные метаданные усиления аудиосигналов во втором потоке аудиоданных с метаданными усиления, достаточными для защиты от ограничения сигнала.

Способ может быть очень полезным в любом устройстве, которое транскодирует сигнал из одного сжатого формата аудиопотока в другой, когда заранее не известно, включают ли в себя метаданные управления изменяющимся по времени усилением, если таковые вообще имеются, переносимые с использованием первого формата, защиту от ограничения при смешении с уменьшением количества каналов (например, в транскодере из AAC/HE-AAC в Dolby Digital, в транскодере из Dolby E в AC/HE-AAC или в транскодере из Dolby Digital в AAC/HE-AAC).

Предпочтительно, для определения, достаточны ли первые значения усиления для защиты, цифровые аудиоданные смешивают с уменьшением количества каналов в соответствии с, по меньшей мере, одной схемой смешения с уменьшением количества каналов, например в соответствии со схемой смешения с уменьшением количества каналов Lt/Rt. В результате смешения с уменьшением количества каналов получают один или больше сигналов, например один сигнал, ассоциированный с правым каналом, и один сигнал, ассоциированный с левым каналом. Кроме того, множество схем смешения с уменьшением количества каналов можно рассматривать, и цифровые аудиоданные смешивают с уменьшением количества каналов в соответствии с более чем одной схемой смешения с уменьшением количества каналов.

Предпочтительно, фактическое пиковое значение различных сигналов, полученных из аудиосигнала, постоянно определяют, то есть в заданный момент времени определяют, какой из различных сигналов имеет наибольшее значение сигнала. Для расчета пикового значения способ может определять максимум абсолютных значений двух или больше сигналов в заданный момент времени. Эти два или больше сигнала могут включать в себя один или больше сигналов после смешения с уменьшением количества каналов в соответствии с первой схемой смешения с уменьшением количества каналов, например абсолютное значение выборки сигнала правого канала после смешения с уменьшением количества каналов и абсолютное значение одновременной полученной выборки, смешанного с уменьшением количества каналов сигнала для левого канала. Кроме того, для расчета пикового значения способ также может рассматривать абсолютное значение одного или больше сигналов после смешения с уменьшением количества каналов в соответствии со второй (и даже третьей) схемой смешения с уменьшением количества каналов. Кроме того, определение пикового значения может учитывать абсолютное значение одного или больше аудиосигналов перед смешением с уменьшением количества каналов, например абсолютное значение каждого из 5 основных каналов для сигнала с 5.1 каналами одновременно. Следует отметить, что в случае транскодирования обычно неизвестно, воспроизводится ли впоследствии многоканальный сигнал через дискретные каналы, или выполняют смешение с уменьшением количества каналов в соответствии со схемой смешивания с уменьшением количества каналов.

Пиковое значение соответствует максимуму из этих одновременных значений выборки сигнала, обозначая, таким образом, максимальную амплитуду, которую сигнал может иметь во всех возможных случаях в определенный момент времени, и это представляет наихудший случай, который должен учитывать алгоритм защиты от ограничения сигнала.

Данные управления динамическим диапазоном обычно изменяются по времени с определенной степенью детализации, которая обычно относится к длине сегмента данных (например, блоку) соответствующего формата кодирования аудиоданных или представляет интегральную его часть. Таким образом, также предпочтительно рассчитывают второе значение усиления для сегмента данных.

Поэтому частота выборки пиковых значений или последовательных пиковых значений предпочтительно уменьшается (снижение частоты выборки). Это может быть выполнено путем определения максимального из множества последовательных значений пиков или последовательных отфильтрованных значений пиков. В частности, способ может определять максимальное значение из множества последовательных (отфильтрованных) значений пика, ассоциированных с сегментом данных, например блоком или фреймом. В случае транскодирования способ может определять наивысшие значения пика среди множества последовательных (отфильтрованных) значений пика, ассоциированных с сегментом данных второго (выходящего) потока данных. Следует отметить, что предпочтительно учитывают не только последовательные значения пика, на основе выборок сигналов в нисходящем сегменте для определения максимума, но также и дополнительные (предшествующие и последующие) значения пика, которые могли бы повлиять на декодирование сегмента данных, то есть значения пика, которые относятся к выборкам сигнала в начале и в конце окна декодирования. Эти значения пика также ассоциированы с сегментом данных.

Вместо выбора наибольшего значения пика можно рассчитывать другое значение на сегмент данных, для уменьшения частоты выборки.

Следует отметить, что смешение с уменьшением количества каналов может быть выполнено для выборок, полученных из других аудиоданных, кроме значений пика. Например, аудиоданные могут быть смешаны с уменьшением количества каналов до одного канала (монофонический), и определяют только максимальные среди смешиваемых с уменьшением количества каналов последовательных выборок на сегмент исходящих данных. В соответствии с другим примером первый каждый максимум для каждого сигнала, смешанного с уменьшением количества каналов, рассчитывают на исходящий сегмент данных (снижение частоты выборки) и затем определяют пиковое значение этих максимумов.

На основе определенного максимума величину усиления можно рассчитать путем инвертирования определенного максимума. Если 1 представляет собой максимальное значение сигнала, которое может быть представлено, инвертирование определенного максимума позволяет непосредственно получить коэффициент усиления. Когда коэффициент усиления прикладывают к максимуму (отфильтрованных) значений пика, получаемое значение равно 1, то есть максимальное значение сигнала. Это означает, что каждая аудиовыборка, к которой прикладывают усиление, поддерживается ниже 1 или равна 1, исключая, таким образом, ограничение сигнала для данного сегмента данных. В случае когда 1 представляет собой максимальный уровень сигнала, 1 соответствует 0 dBFS - децибел, относящихся к полной шкале; обычно 0 dBFS назначают для максимального возможного уровня.

Вместо простого инвертирования определенного максимума значение усиления может быть рассчитано путем деления максимального значения сигнала (которое соответствует 0 dBFS) путем определения максимума, ассоциированного с сегментом данных. Однако стоимость расчетов в этом случае будет более высокой по сравнению с простой инверсией.

В случае транскодирования длины сегментов данных (например, блока или фрейма) часто отличаются для первого формата кодирования аудиоданных (формат входного потока) и второго формата кодирования аудиоданных (формат выходного потока). Например, в AAC блок типично содержит 128 выборок (в HE-AAC: 256 выборок на блок), в то время как в случае Dolby Digital блок типично содержит 256 выборок. Таким образом, количество выборок на блок увеличивается при транскодировании с AAC в Dolby Digital. В AAC фрейм типично содержит 1024 выборки (в HE-AAC: 2048 выборок на фрейм), в то время как в Dolby Digital фрейм типично содержит 1536 выборок (6 блоков). Таким образом, количество выборок на фрейм также увеличивается при транскодировании с AAC на Dolby Digital. Степень детализации данных управления динамического диапазона, в основном, составляет либо размер блока, или размер фрейма. Например, степень детализации метаданных "DRC" управления динамическим диапазоном в MPEG для потока HE-AAC и метаданные усиления "dynrng" в Dolby Digital представляют размер блока. В отличие от этого степень детализации метаданных усиления "compr" в Dolby Digital и метаданных усиления "сильная степень сжатия" в DVB (цифровое видео и телевещание) для потока HE-AAC составляет размер фрейма.

Кроме того, частоты выборки могут отличаться для входного потока (например, 32 кГц или 44,1 кГц) и выходного потока (например, 48 кГц), то есть выполняют повторную выборку аудиоданных. Это также изменяет взаимосвязи длины между сегментами входящих данных и сегментами исходящих данных. Кроме того, входящие и исходящие сегменты данных могут не быть выровнены. Кроме того, следует отметить, что метаданные, передаваемые во входном сегменте данных (например, блоке или фрейме), имеют область влияния управления на динамический диапазон (то есть область в потоке, где применение значения усиления имеет эффект), то есть часто имеют не точно такой же размер, как и сегмент данных, но больше. Это связано с наложением характеристик суммирования используемого преобразования и с тем фактом, что управление динамическим диапазоном часто применяют в спектральной области. То же самое часто справедливо для данных управления динамическим диапазоном исходящего аудиопотока. Поэтому для определения, какие входные значения усиления влияют на заданный выходной сегмент данных, следует посмотреть на наложение входной и выходной длин влияния (вместо учета степени наложения входных и выходных сегментов данных), как поясняется подробно ниже.

В соответствии с причинами, описанными выше, транскодирование данных управления динамического диапазона должно учитывать, что на исходящее значение управления динамическим диапазоном может влиять более чем одно входящее значение управления динамическим диапазоном. В этом случае повторная выборка (повторное разделение на фреймы) данных управления динамическим диапазоном может быть выполнена в случае транскодирования потока данных.

Поэтому способ может содержать этап повторной выборки значений усиления, выведенных из принятых аудиометаданных первого аудиопотока. Когда сегмент данных первого аудиопотока охватывает более короткую длительность времени, чем сегмент данных второго аудиопотока, для значений усиления выполняют уменьшение частоты выборки.

Значение усиления после повторной выборки может быть определено путем расчета минимума из множества последовательных значений усиления. Другими словами: из множества входных значений управления динамическим диапазоном (которые относятся для исходящего сегмента данных) выбирают наименьшее. Мотивация этого состоит в том, чтобы сохранить входящие значения в максимально возможной степени (в случае, когда эти значения не приводят к ограничению сигнала). Однако это часто невозможно, поскольку значения усиления должны быть подвергнуты повторной выборке. Поэтому выбирают наименьшее значение усиления, что приводит к уменьшению амплитуды сигнала. Однако такое уменьшение амплитуды сигнала рассматривают как менее значимое или менее раздражающее. Предпочтительно, такой минимум определяют для выходного сегмента данных.

В случае отсутствия метаданных усиления, относящихся к управлению динамическим диапазоном, в первом аудиопотоке способ предпочтительно добавляет значения усиления, достаточные для защиты от ограничения сигнала во втором аудиопотоке (исходящий поток). Такие значения усиления должны быть предпочтительно ограничены так, чтобы они не превышали усиление, равное 1. Причина предотвращения превышения 1 значениями усилениями состоит в том, что сигнал не должен быть излишне усилен и чтобы он не приближался к пределу ограничения сигнала.

Таким образом, в случае когда соответствующим образом рассчитанное второе значение усиления имеет усиление ниже 1, соответствующее добавленное значение усиления соответствует рассчитанному второму значению усиления. В случае когда соответствующее рассчитанное второе значение усиления превышает 1, соответствующее добавленное значение усиления устанавливают как усиление, равное 1.

Во втором аспекте настоящая заявка относится к устройству для предоставления защиты от ограничения сигнала для аудиосигнала, получаемого из цифровых аудиоданных. Устройство выполнено с возможностью осуществления способа, описанного выше. Свойства устройства соответствуют свойствам способа, описанного выше. В соответствии с этим устройство содержит средство для определения, достаточно ли первых значений усиления, основанных на принятых аудиометаданных, для защиты от ограничения аудиосигнала. Кроме того, устройство содержит средство для замены первого значении усиления значением усиления, достаточным для защиты от ограничения аудиосигнала в случае, когда первое значение усиления не достаточно.

Предпочтительно, средство определения содержит средство для расчета вторых значений усиления на основе цифровых аудиоданных, где вторые значения усиления достаточны для защиты от ограничения аудиосигнала. Более предпочтительно, средство определения также содержит средство сравнения, предназначенное для сравнения первого значения усиления на основе принятых аудиометаданных и рассчитанных вторых значений усиления. В зависимости от этого значения усиления выбирают из первых значений усиления и рассчитанных вторых значений усиления.

Представленные выше замечания, относящиеся к первому аспекту заявки, также применимы ко второму аспекту заявки.

Третий аспект заявки относится к транскодеру, в случае когда транскодер выполнен с возможностью транскодировать поток аудиоданных из первого формата кодирования аудиоданных во второй формат кодирования аудиоданных. Транскодер содержит устройство в соответствии со вторым аспектом заявки. Предпочтительно, транскодер представляет собой часть приемного устройства, принимающего первый аудиопоток, где первый аудиопоток представляет собой цифровой сигнал широковещательной передачи, например аудиопоток цифрового телевизионного сигнала (например, DVB-T (цифровое телевидение - наземное, ЦТВ-Н), DVB-S (цифровое телевидение - спутниковое, ЦТВ-С), DVB-C (цифровое телевидение - кабельное, ЦТВ-К)) или цифровой радиосигнал (например, сигнал DAP (протокол доступа к данным, ПДД)). Например, приемное устройство представляет собой телевизионную приставку. Поток аудиоданных также может представлять собой поток широковещательной передачи через Интернет (например, Интернет-TV или интернет-радио). В качестве альтернативы, первый поток аудиоданных может быть считан с носителя для сохранения цифровых данных, например DVD (цифровой универсальный диск, ЦУД) или диск Blu-ray.

Представленные выше комментарии, относящиеся к первому и второму аспектам заявки, также применимы к третьему аспекту заявки.

Краткое описание чертежей

Изобретение поясняется ниже на примере со ссылкой на приложенные чертежи, на которых:

на фиг. 1 иллюстрируется вариант осуществления транскодера, обеспечивающего защиту от ограничения сигнала;

на фиг. 2 иллюстрируется предпочтительный подход для повторного формирования фреймов метаданных;

на фиг. 3 иллюстрируется вариант осуществления, предназначенный для определения пиковых значений на основе принятых аудиоданных;

на фиг. 4 иллюстрируется вариант осуществления для слияния входящих данных управления динамическим диапазоном с рассчитанными значениями усиления, достаточными для защиты от ограничения сигнала;

на фиг. 5 иллюстрируется выбор выходящих значений усиления;

на фиг. 6 иллюстрируется альтернативный вариант осуществления для слияния входящих данных управления динамическим диапазоном с рассчитанными значениями усиления, достаточными для защиты от ограничения сигнала;

на фиг. 7 иллюстрируется вариант осуществления каскада сглаживающего фильтра;

на фиг. 8 иллюстрируются другие варианты осуществления для предоставления защиты от ограничения сигнала;

на фиг. 9 иллюстрируются еще один, другой вариант осуществления, который обеспечивает защиту от ограничения сигнала; и

на фиг. 10 иллюстрируется приемное устройство, принимающее транскодированный поток аудиоданных.

Подробное описание изобретения

AAC/HE-AAC и Dolby Digital/Dolby Digital Plus поддерживают концепцию метаданных, более конкретно слова, содержащие значения усиления, в которых передают изменяющееся по времени значение усиления, с тем чтобы в случае необходимости использовать его для аудиоданных после декодирования. С целью уменьшения объема передаваемых данных такие слова, содержащие усиление, типично передают только один раз на сегмент данных, например на блок или фрейм. В упомянутых аудиоформатах такие слова, содержащие значения усиления, являются необязательными, то есть технически возможно не посылать эти данные. Кодеры Dolby Digital/Dolby и Digital Plus типично передают слова со значением усиления, в то время как кодеры AAC и HE-AAC часто не передают такие слова со значением усиления. Однако количества кодеров AAC и HE-AAC, которые передают слова с усилением, увеличиваются. Приложение позволяет декодерам или транскодерам, принимающим аудиопоток, работать в "правильном режиме" в обеих ситуациях. Если слова со значением усиления будут предоставлены, "правильный режим работы" будет состоять в обработке принимаемых слов со значением усиления аудиоданных настолько достоверно, насколько это возможно, но с отменой этого значения, когда входящие слова со значением усиления не обеспечивают достаточной аттенюации для предотвращения ограничения сигнала, например, в случае смешения с уменьшением количества каналов. Если значения усиления не предоставлены, "правильный режим работы" будет состоять в расчете и предоставлении значений усиления, которые предотвращают ограничение сигнала.

На фиг. 1 показан вариант осуществления транскодера, причем этот транскодер обеспечивает защиту от ограничения сигнала, в частности защиту от ограничения сигнала в случае смешения с уменьшением количества каналов (например, в случае смешения с уменьшением количества каналов от сигнала с 5.1 каналами в сигнал с 2 каналами). Транскодер принимает поток 1 цифровых аудиоданных, содержащий аудиометаданные. Например, поток цифровых аудиоданных представляет собой поток цифровых аудиоданных AAC или HE-AAC (HE-AAC версия 1 или HE-AAC версия 2). Поток цифровых аудиоданных может представлять собой часть видео/аудиопотока DVB, например поток DVB-T, DVB-S или DVB-C. Транскодер транскодирует принимаемый поток 1 аудиоданных и выводит выходной поток 14 аудиоданных, который кодирован в другом формате, например Dolby Digital или Dolby Digital Plus. Как правило, декодеры Dolby Digital поддерживают смешение с уменьшением количества каналов для многоканальных сигналов и в них принимают, что огибающие изменяющегося по времени усиления, включенные в принимаемые метаданные Dolby Digital, включают защиту от ограничения сигнала при смешении с уменьшением количества каналов. К сожалению, поток 1 битов (например, поток битов AAC/HE-AAC) необязательно содержит метаданные огибающей изменяющегося по времени усиления, и даже в случае когда они содержат такие данные, не ясно, включают ли в себя эти данные защиту от ограничения сигнала. Транскодер предотвращает декодер (например, декодер Dolby Digital) в приемном устройстве (расположен после транскодера), не позволяя ему производить выходные сигналы, которые содержат искажения, связанные с ограничением сигнала, при смешении сигнала с уменьшением количества каналов. Транскодер обеспечивает то, что выходной аудиопоток 14 содержит метаданные огибающей изменяющего по времени усиления, включающие в себя защиту от ограничения сигнала при смещении с уменьшением количества каналов.

На фиг. 1 модуль 2 считывает значения 3 усиления для управления динамическим диапазоном, содержащиеся в аудиометаданных аудиопотока 1. В случае необходимости значение 3 усиления, кроме того, обрабатывают в модуле 5, например значение 3 усиления подвергают повторной выборке и транскодируют в соответствии с временными характеристиками сегмента транскодированного вывода аудиопотока 14. Повторная выборка и транскодирование значений усиления метаданных описаны в документе "Transcoding of dynamic range control coefficients and other metadata into MPEG-4 HE AAC", Wolfgang Schildbach et al., Audio Engineering Society Convention Paper, presented at the 123rd Convention October 5-8, 2007, New York. Раскрытия в данной публикации, в частности, концепции повторной выборки и транскодирования значений усиления метаданных, таким образом, приведены здесь по ссылке. Кроме того, 30 сентября 2008 г. автор данной заявки подал предварительную заявку США 61/101497 под названием "Транскодирование аудиометаданных", и эта предварительная заявка США относится к повторной выборке и транскодированному значению усиления метаданных. Раскрытие данной заявки, в частности концепции для повторной выборки и транскодирования значений усиления метаданных, таким образом, приведено здесь по ссылке.

Параллельно повторной выборке, аудиоданные в аудиопотоке 1 декодируют с помощью декодера 6, типично с получением аудиоданных PCM (импульсно-кодовая модуляция, ИКМ). Декодированные аудиоданные 7 содержат множество параллельных каналов сигнала, например 6 каналов сигнала, в случае сигнала с 5.1 каналами, или 8 каналов сигнала, в случае сигнала с 7.1 каналами.

Вычислительный модуль 8 определяет рассчитанное значение 9 усиления на основе аудиоданных 7. Рассчитанные значения 9 усиления достаточны для защиты от ограничения сигнала в приемном устройстве, которое расположено после транскодера, которое принимает транскодированный аудиопоток, в частности выполняют смешение с уменьшением количества каналов сигнала в приемном устройстве. Такое устройство может представлять собой AVR или телевизионный приемник. Рассчитанные значения усиления должны гарантировать, что сигнал после смешения с уменьшением количества каналов максимально достигает 0 dBFS или меньше. Значение усиления 4, полученное по метаданным в аудиопотоке 1, и рассчитанное значение 9 усиления сравнивают друг с другом в модуле 10. Модуль 10 выводит значение 11 усиления, где значение усиления из потока 4 заменяют значением усиления, полученным из потока 9 значений усиления, в случае когда соответствующее значение усиления для значения усиления из потока 4 не достаточно для предотвращения ограничения сигнала в приемном устройстве. Параллельно, аудиоданные 7 кодируют с помощью кодера 12 для вывода формата кодирования аудиоданных, например, в Dolby Digital или Dolby Digital Plus. Кодированные аудиоданные и значение 11 усиления комбинируют в модуле 13. Полученный в результате аудиопоток обеспечивает метаданные усиления аудиоданных, которые предотвращают ограничение сигнала, в частности, для случая смешения сигнала с уменьшением количества каналов.

Обычно входящие метаданные усиления аудиоданных должны быть сохранены в максимально возможной степени, пока эти метаданные усиления обеспечивают защиту от ограничения сигнала. В большинстве случаев длина сегмента данных (например, блока или фрейма) входного потока аудиоданных (см. позицию 1 на фиг. 1) и длина сегмента данных (например, блока или фрейма) выходного потока аудиоданных (см. позицию 14 на фиг. 1) отличаются друг от друга. Кроме того, типично начало сегмента данных входного потока аудиоданных и начало сегмента данных выходного потока аудиоданных не совмещены (даже если длины сегментов данных идентичны). Таким образом, типично требуется отображение входящих метаданных на исходящие метаданные.

На фиг. 2 иллюстрируется предпочтительный подход для отображения входящих метаданных на исходящие метаданные. Как описано выше, типично каждый сегмент данных (например, блок или фрейм) имеет одно значение усиления из данных управления динамическим диапазоном (или множество значений усиления, например 8 значений усиления). Однако метаданные, переданные вместе с входным сегментом данных (например, блоком или фреймом), имеют область влияния на управление динамическим диапазоном (то есть диапазон в потоке, где применение значения усиления имеет эффект), которая часто не имеет точно такой же размер, как и сегмент данных, но больше него. Это связано с характеристиками наложения - суммирования используемого преобразования (то есть используют окна, которые больше, чем сегмент данных, и эти окна накладываются друг на друга) и в связи с тем фактом, что управление динамическим диапазоном часто применяют в области спектра. То же самое часто относится к данным управления динамическим диапазоном исходящего битового потока аудиоданных. На фиг. 2 сплошными линиями отмечены начало и конец сегмента данных 20-23 во входном потоке и начало и конец сегмента 24-26 данных в выходном потоке. На фиг. 2 каждая область влияния 30-33 и 34-36 управления динамическим диапазоном из величин усиления продолжается за пределы конца и начала соответствующего сегмента данных. Каждая область влияния 30-33 и 34-36 обозначена штрихпунктирными линиями.

Например, в HE-AAC размер блока равен 256 выборок, в то время как окно для декодирования имеет 512 выборок. Все окно 512 выборок может рассматриваться как область влияния; однако влияние значения усиления на внешних кромках окна меньше по сравнению с влиянием в середине окна. Таким образом, область влияния также можно рассматривать как участок окна. Область влияния может быть представлена как количество выборок, выбранных из размера блока/фрейма (здесь: 256 выборок) вплоть до размера окна (здесь: 512 выборок). Предпочтительно, используемая область влияния больше, чем размер сегмента данных (блок или фрейм).

Для определения, какие входные значения управления динамическим диапазоном влияют на заданный выходной сегмент данных, предпочтительно, посмотреть на степень перекрытия входных и выходных областей влияния (вместо учета перекрытия входных и выходных сегментов данных). На фиг. 2 определено, на какие области влияния 30-33 во входном потоке наложены области влияния 34-36 заданного выходного сегмента 24-26 данных. Например, на область влияния 34 сегмента 24 данных в выходном потоке наложены области 30, 31, 32 и 33. Поэтому, предпочтительно, значения усиления, ассоциированные с четырьмя сегментами 20, 21, 22 и 23 данных, рассматривают при определении значения усиления первого сегмента 24 данных в иллюстрируемом выходном потоке. На первый сегмент 24 данных влияют 4 входных сегмента 20-23 данных. В качестве альтернативы, способ может рассматривать наложение входных областей влияния и выходного сегмента сигнала или наложение входных сегментов данных и выходного сегмента данных.

Такой процесс наложения или повторной выборки может осуществляться в модуле 5 на фиг. 1, который принимает значение 3 усиления входного потока 1 и отображает одно или больше из значений 3 усиления на значение 4 усиления.

На фиг. 3 представлен вариант осуществления блока 50 для определенных пиковых значений на основе принятых аудиоданных. Такой блок 50 определения пика может представлять собой часть блока 8 на фиг. 1. Основываясь на декодированных многоканальных аудиоданных 7, содержащих множество каналов (здесь 5 каналов для сигнала с 5.1 каналами, канал с эффектом низкой частоты не рассматривается), смешение с уменьшением количества каналов выполняют в соответствии с одной или больше схемами смешения с уменьшением количества каналов (то есть в соответствии с одной или больше матрицами смешения с уменьшением количества каналов). Следует отметить, что в транскодере не имеется информации о том, выполняется ли смешение с уменьшением количества каналов в приемном устройстве вообще и какую схему смешения с уменьшением количества каналов затем используют в приемном устройстве. Таким образом, неизвестно, воспроизводят ли многоканальный сигнал через дискретные каналы или выполняют смешение с уменьшением количества каналов в соответствии с одной из нескольких схем. Транскодер моделирует все случаи и определяет наихудший случай.

В примере на фиг. 3 смешение с уменьшением количества каналов в соответствии со схемой смешения с уменьшением количества каналов Lo/Ro выполняют в блоке 41, смешение с уменьшением количества каналов в соответствии со схемой смешения с уменьшением количества каналов Pro Logic (PL) выполняют в блоке 42, и смешение с уменьшением количества каналов в соответствии со схемой смешения с уменьшением количества каналов Pro Logic II (PL II) выполняют в блоке 43. Схема PL смешения с уменьшением количества каналов и схема PL II смешения с уменьшением количества каналов представляют собой два варианта схемы смешения с уменьшением количества каналов Lt/Rt, описанной выше. Каждая схема смешения с уменьшением количества каналов выводит сигнал правого канала и сигнал левого канала. Затем рассчитывают абсолютные значения сигналов после смешения с уменьшением количества каналов (см. блоки 44 на фиг. 3). Предпочтительно, также рассчитывают абсолютные значения выборок для различных каналов многоканального аудиосигнала 7 (см. блоки 40 для определения абсолютных значений). Также учет абсолютных значения каналов (без смешения с уменьшением количества каналов) является полезным для предотвращения ограничения сигнала в других случаях, кроме смешения с уменьшением количества каналов, например, в случае когда сигнал в последующем усиливают с использованием дополнительного усиления (например, усиление 11 дБ в случае RF режима, как будет описано ниже).

Максимум (пиковое значение) абсолютных значений в этот момент времени рассчитывают в блоке 45. Расчет максимума выполняют постоянно, генерируя, таким образом, поток пиковых значений 46. Возможно, что различные выборки будут иметь разную задержку сигнала из-за разной обработки сигналов. Такие другие задержки сигнала могут быть выровнены (не показано). Максимум значений выборки обозначает максимальную амплитуду, которую может иметь сигнал во всех случаях, и, таким образом, это представляет собой наихудший случай, который учитывает алгоритм защиты от ограничения сигнала. Транскодер, таким образом, одновременно моделирует амплитуду наихудшего случая сигнала в приемном устройстве. Значение управления динамическим диапазоном, которое обеспечивает защиту от ограничения сигнала, должно уменьшать амплитуду (или усиливать) сигнала таким образом, чтобы он достигал максимума 0 dBFS.

Следует отметить, что блок 50 может определять пиковое значение на основе меньших абсолютных значений, чем показано на фиг. 3 (то есть без учета абсолютных значений для каналов, которые не подвергают смешению с уменьшением количества каналов), или на основе дополнительных абсолютных значений, которые не показаны на фиг. 3 (то есть абсолютных значений других схем смешения с уменьшением количества каналов). В качестве альтернативы, становится возможным выполнять смешение с уменьшением количества каналов для каналов 7, без определения пикового значения: например два получаемых в результате канала могут быть скомбинированы, и комбинированный сигнал дополнительно обрабатывают (вместо использования пиковых значений 46, выводимых блоком 45).

Дополнительная обработка пиковых значений 46 обозначена на фиг. 4. Элементы, показанные на фиг. 1 и 4, обозначенные теми же номерами ссылочных позиций, в принципе, являются одинаковыми. Пиковые значения 46 обрабатывают на этапе блокирования и накопления максимума в модуле 60. Здесь наибольшее пиковое значение определяют для заданного выходного сегмента данных (например, блока). Другими словами: для пиковых значений выполняют смешение с уменьшением количества каналов путем выбора наибольшего значения пика (которое является наиболее критичным) для выходного сегмента данных из множества пиковых значений. Следует отметить, что предпочтительно не только последовательные пиковые значения, соответствующие выборкам сигнала в выходном сегменте, учитывают для определения максимума. Скорее также учитывают дополнительные (предыдущие и последующие) пиковые значения, которые могли бы повлиять на данный сегмент данных, то есть пиковые значения, которые относятся к выборкам сигнала вначале и в конце окна декодирования. Предпочтительно, учитывают все выборки окна.

Результат такого осуществления выборки инвертирован в блоке 61 в соответствии с формулой C=1/X, где C относится к рассчитанному значению 9 усиления и X относится к соответствующему наибольшему пику для блока выходного потока 14. Результат C представляет собой коэффициент (усиление), которое гарантирует, что каждая аудиовыборка сегмента данных (например, блока) находится ниже или равна максимальному уровню 1 сигнала (соответствует 0 dBFS), когда усиление применяют к соответствующей аудиовыборке. Это исключает ограничение сигнала для данного сегмента данных. Следует отметить, что максимальный уровень сигнала означает максимальный уровень сигнала в приемнике транскодированного аудиопотока; таким образом, на выходе блока 60 амплитуда может быть выше чем 1 (когда C<1).

Рассчитанное значение C усиления представляет собой максимально допустимое усиление, которое предотвращает ограничение сигнала; меньшее значение усиления, чем рассчитанное усиление C, также можно использовать (в этом случае получаемый сигнал будет еще меньше). Следует отметить, что в случае когда усиление C ниже 1, усиление C (или меньшее значение усиления) должно быть применено, в противном случае сигнал будет ограничен, по меньшей мере, в сценарии наихудшего случая.

В блоке 5 входящие значения 3 усиления из метаданных также подвергают повторной выборке. Среди множества входящих значений усиления, относящихся к выходному сегменту данных, наименьшее значение усиления выбирают и используют для дальнейшей обработки. Предпочтительно, повторную выборку выполняют, как описано со ссылкой на фиг. 2. Для определения, какие входящие значения усиления соответствуют выходному сегменту данных, рассматривают наложение входных и выходных областей влияния. Если область влияния входного сегмента данных накладывается на область влияния заданного сегмента выходных данных, входной сегмент данных учитывают (и, таким образом, его значение усиления) при определении наименьшего значения усиления. Вместо этого, также, два альтернативных подхода могут использоваться, как описано со ссылкой на фиг. 2.

Мотивация этого состоит в сохранении входящих значений. Однако это невозможно, поскольку значения усиления должны быть подвергнуты повторной выборке в соответствии с временными характеристиками входного потока. При использовании наименьшего значения усиления из множества последовательных значений усиления проявляется тенденция уменьшения амплитуды сигнала, которую рассматривают по тенденции как менее заметную или менее раздражающую.

В случае когда соответствующие данные управления динамического диапазона присутствуют во входящем потоке 1 данных, сравнение между этим усилением (предпочтительно после повторной выборки в блоке 5) и рассчитанными значениями 9 усиления, достаточными для защиты от ограничения сигнала, выполняют в блоке 10. Блок 62 определяет минимум между подвергнутым повторной выборке значением 4 усиления и рассчитанным значением 9 усиления, при этом меньшее значение усиления используют как выходное значение усиления (блок 62 формирует селектор минимума).

В случае когда входящие значения усиления не присутствуют, переключатель 63 на фиг. 4 переключают в верхнее положение, при этом блок 62 определяет затем минимум между усилением, равным 1, и рассчитанным значением усиления, при этом меньшее значение усиления используют в качестве выходного значения усиления. Таким образом, в случае когда входящее значение усиления не присутствует, выходное значение усиления ограничивают до максимального усиления, равного 1.

В следующей таблице иллюстрируется операция блока 10 сравнения. Здесь знак "I" обозначает входящее усиление 4 для управления динамическим диапазоном (после повторной выборки), и знаком "C" обозначено рассчитанное усиление 9.

I≤1 I>1 I отсутствует C≤1 min(I, C) min(I, C)=C C C>1 min(I, C)=I min(I, C) 1

В случае когда оба значения I и C меньше или равны 1, выбирают минимальное значение. Это означает, что либо I уже гарантирует защиту от ограничения, или, если это не так, его заменяют значением C.

В случае если C>1 и I<1, сигнал может быть усилен и при этом все еще не происходит ограничение. Входящий поток при этом требует аттенюации, например, для выполнения назначения ограничения динамического диапазона, и, таким образом, I сохраняют (I представляет собой минимум из I и C в данном случае).

В случае если I>1 и C≤1, входящее значение будет нарушать условия защиты ограничения сигнала, и, таким образом, принимают C (C представляет собой минимальное из I и C в данном случае).

В случае когда оба I и C больше 1, входной сигнал должен быть усилен. Такое усиление разрешено, если только при этом не происходит ограничение сигнала, и, таким образом, используют меньшее значение из I и C.

В случае когда входящее значение динамического диапазона не присутствует, защиту от ограничения сигнала обеспечивают, используя C, если только C≤1. В случае если C>1, сигнал не должен быть модифицирован (то есть сигнал не должен быть излишне усилен, приближаясь при этом близко к границе ограничения сигнала). Таким образом, единицу принимают, как выходное усиление. В обоих случаях, когда входящие значения усиления отсутствуют, используют минимум из 1 и C (вместо минимума между I и C).

На фиг. 5 иллюстрируется выбор исходящих значений 11 усиления в форме блок-схемы последовательности операций. Определяют, присутствует ли значение I усиления (см. ссылочную позицию 130 на фиг. 5). Если значение I усиления в данный момент присутствует, выходное значение усиления зависит от значений входящего значения I усиления и рассчитанного значения C усиления. Если I≤1 и C≤1, выбранное значение усиления соответствует минимуму из I и C (см. ссылочную позицию 131). Если I≤1 и C>1, выбранное значение усиления соответствует I (см. ссылочную позицию 132). Если I>1 и C≤1, выбранное значение усиления соответствует C (см. ссылочную позицию 133). Если I>1 и C>1, выбранное значение усиления соответствует минимуму из I и C (см. ссылочную позицию 134). Следует отметить, что во всех этих четырех случаях исходящее значение все еще соответствует минимальному из I и C. Таким образом, нет необходимости определять, являются ли I и C≤1 или нет.

Если значение I усиления в данный момент отсутствует, исходящее значение усиления зависит от значения рассчитанного значения C усиления. Если C≤1, исходящее значение усиления соответствует C (см. ссылочную позицию 135). Если C>1, исходящее значение усиления соответствует 1 (см. ссылочную позицию 136). Следует отметить, что в обоих случаях исходящее значение все еще соответствует минимуму из 1 и C. Таким образом, нет необходимости определять, является ли C≤1 или нет.

В варианте осуществления, описанном выше, достигается то, что входящий динамический диапазон сохраняется, и только в случае возникновения ограничения сигнала динамический диапазон модифицируют для предотвращения ограничения сигнала. В случае когда значения управления динамическим диапазоном отсутствуют, значения, достаточные для управления динамическим диапазоном, добавляют к потоку для предотвращения ограничения сигнала. Переключение между режимами работает мгновенно и плавно, уменьшая, таким образом, любые искажения.

На фиг. 6 иллюстрируется альтернатива для варианта осуществления, показанного на фиг. 4. Элементы, показанные на чертежах на фиг. 4 и 6, обозначенные теми же номерами ссылочных позиций, в принципе, являются теми же самыми. На фиг. 6 отдельные метаданные усиления для двух разных режимов, линейного режима и режима RF, принимают и транскодируют. В варианте осуществления, показанном на фиг. 6, рассчитывают разные слова, содержащие значения усиления для режима RF и линейного режима, поскольку в них используются два разных типа метаданных. Метаданные для линейного режима охватывают меньший диапазон значений, и их передают чаще (типично одно на блок), в то время как метаданные для режима RF охватывают больший диапазон значений, и их передают менее часто (типично один раз на фрейм). В режиме RF сигнал усиливают на дополнительное усиление 11 дБ, что позволяет обеспечить более высокое отношение сигнал-шум при передаче сигнала через динамически весьма ограниченный канал (например, из телевизионной приставки на RF вход телевизора через канал аналоговой антенны RF). Кроме того, поскольку метаданные усиления в режиме RF охватывают более широкий диапазон значений, чем метаданные усиления в линейном режиме, режим RF обеспечивает более высокую степень сжатия динамического диапазона. Метаданные усиления для линейного режима обозначены как "DRC" (см. номер 3 ссылочной позиции), в то время как метаданные усиления для режима RF обозначены как "compr" (см. номер 3' ссылочной позиции). Следует отметить, что в DVB метаданные усиления для режима RF обозначены как "сжатие" или "высокая степень сжатия". Кроме того, в варианте осуществления, показанном на фиг. 6, также учитывается опорный уровень программы (PRL), который может быть передан как часть метаданных. PRL обозначает опорный уровень громкости аудиосодержания (например, в HE-AAC PRL может изменяться от 0 дБ до -31,75 дБ). Приложение для PRL понижает громкость звука до определенного целевого опорного уровня. В зависимости от формата кодирования звука другие обозначения для опорных уровней являются общими, например уровень диалога, нормализация диалога или dialnorm.

На фиг. 6 значение наивысшего пика для блока данных (генерируемого модулем 60) представляет собой уровень, регулируемый в модуле 70 в зависимости от принятого PRL (обычно этот уровень уменьшают с использованием PRL). Для расчета значений усиления, ассоциированных с линейным режимом, выборки с отрегулированным уровнем инвертируют в блоке 61, генерируя, таким образом, рассчитанные значения усиления, которые гарантируют, что каждая аудиовыборка блока находится ниже или равна максимальному уровню 1 сигнала в случае, когда аудиосигнал регулируют в приемнике с использованием PRL. Повторная выборка входящих данных 3 DRC в блоке 5 и сравнение значений 4 усиления после повторной выборки и рассчитанных значений усиления идентичны показанным на фиг. 4.

Для рассчитанных значений усиления, ассоциированных с режимом RF, выборки с отрегулированным уровнем усиливают на 11 дБ в блоке 71, поскольку в приемнике сигнал также усиливается на 11 дБ, в случае использования режима RF. Транскодер, таким образом, моделирует амплитуду наихудшего случая сигнала в приемном устройстве. Усиленные выборки инвертируют в блоке 61', генерируя, таким образом, рассчитанное значение усиления для RF режима, которое гарантирует, что каждая аудиовыборка блока будет ниже или равна 1 (= максимальной амплитуде сигнала) в случае, когда аудиосигнал регулируют в приемнике с использованием PRL и усиливают на 11 дБ.

Вариант осуществления, показанный на фиг. 6, предпочтительно, используется для транскодера, выводящего аудиопоток Dolby Digital (например, HE-AAC в транскодер Dolby Digital или AAC в транскодер Dolby Digital). В соответствии с Dolby Digital, в линейном режиме, каждый блок кодирования имеет значение усиления "DRC" (управление динамическим диапазоном), в то время как в режиме RF каждый фрейм (который содержит 6 блоков) имеет значение усиления "compr". Однако оба этих типа значений усиления относятся к управлению динамическим диапазоном. Для рассчитанного значения усиления для режима RF выполняют уменьшение частоты выборки от частоты блока до частоты фреймов в блоке 73. Блок 73 определяет минимум из рассчитанных значений усиления для общего количества из 6 последовательных блоков, и каждый минимум назначают для вычисленного значения 72 усиления для всего фрейма. Повторная выборка входящих значений 3' усиления compr в блоке 5' отличается от повторной выборки в блоке 5 таким образом, что определяют минимум для выходного фрейма. Сравнение значений 4' усиления после повторной выборки и рассчитанных значений 72 усиления на основе фрейма выполняют так же, как описано выше.

Вариант осуществления на фиг. 6 обеспечивает защиту не только от ограничения сигнала в случае смешения с уменьшением количества каналов, но также и от ограничения сигнала при применении дополнительного усиления 11 дБ в режиме RF (в противном случае, сигнал, усиленный на 11дБ, может быть ограничен, когда не используют смешение с уменьшением количества каналов для сигнала). Поэтому предпочтительно в блоке 50 учитывать также абсолютные значения каналов без смешения с уменьшением количества каналов.

Следует отметить, что в случае, когда PRL не принимают, предпочтительно PRL устанавливают как принятое по умолчанию значение.

Для расчета значений усиления можно использовать каскад сглаживания. На фиг. 7 показан вариант осуществления каскада 80 сглаживания, который может быть помещен в любом месте на пути между выходным блоком 50 и входными блоками 61 и 61'. Предпочтительно, каскад 80 сглаживания размещен в выходном блоке 50, генерируя, таким образом, сглаженные значения 46' пика на основе значений 46 пика. Каскад 80 сглаживания воплощает фильтр низкой частоты для входного сигнала каскада сглаживания, то есть для сигнала пикового значения. Его назначение состоит в улучшении впечатления от звучания после того, как защита от ограничения сигнала будет активирована: мгновенное высвобождение скрытого усиления через период защиты от ограничений сигнала приведет к появлению раздражающего звука. Таким образом, как это широко выполняют в вариантах осуществления ограничителей, сигнал пикового значения (и полученный из него сигнал усиления; см. ниже) фильтруют, используя фильтр низкой частоты первого порядка, который предпочтительно работает с постоянной времени τ 200 мс. В случае когда новое входное значение требует защиты от ограничения сигнала в большей степени, чем позволяет достичь сглаженный сигнал (поскольку новое входное значение выше, чем сглаженный сигнал), его пропускают в обход сглаживающего каскада и непосредственно подают для достижения эффекта. В этом случае верхний входной сигнал будет больше, чем нижний входной сигнал в блоке 81 расчета максимума на фиг. 7.

Предпочтительно, вариант осуществления, показанный на фиг. 3-7, представляет собой часть транскодера аудиоданных, например, разработанного для AAC и/или HE-AAC, в Dolby Digital, или из Dolby E или Dolby Digital в AAC и/или HE-AAC. Однако следует отметить, что варианты осуществления, показанные на фиг. 3-7, необязательно представляют собой часть транскодера аудиоданных. Эти варианты осуществления могут представлять часть устройства, принимающего входящий аудиопоток 1 и применяющего модифицированные значения усиления (без транскодирования). Модифицированные значения усиления могут использоваться непосредственно для регулирования усиления принимаемого аудиопотока. Например, варианты осуществления, показанные на фиг. 3-7, могут составлять часть AVR или телевизионного приемника.

На фиг. 8 иллюстрируется альтернативный вариант осуществления, предназначенный для предоставления защиты при смешении с уменьшением количества каналов. Устройство принимает входящие слова 90, содержащие значения усиления, содержащиеся в метаданных, полученных из аудиоданных. Слова 90, содержащие значения усиления, могут соответствовать значениям 3 или 4 усиления на фиг. 1 и 4. Кроме того, устройство принимает аудиовыборки 91 (например, аудиовыборки PCM). Например, аудиовыборки 91 могут представлять собой пиковые значения, генерируемые блоком 50 на фиг. 3. Если аудиовыборки 91 не являются абсолютными значениями, абсолютное значение аудиовыборок 91 может быть определено заранее. В блоке 92 максимальные значения разрешенного усиления gainmax (t) рассчитывают путем деления в соответствии со следующим уравнением:

Здесь член signalmax,allowed обозначает максимальную разрешенную амплитуду сигнала, например signalmax,allowed=1. Член уравнения signal(t) обозначает текущую аудиовыборку 91. В блоке 93 максимально допустимые значения усиления gainmmax(t) ограничены максимальным усилением, равным 1. Если значение gainmmax(t) выше 1, тогда gainmmax(t) будет установлено равным 1. Однако если значение gainmmax(t) ниже 1 или равно 1, то значение не будет модифицировано.

Выход блока 93 подают в каскад 94 сглаживающего фильтра. Каскад 94 сглаживающего фильтра содержит фильтр низкой частоты и селектор 95 минимума, который выбирает минимум из его двух входных сигналов. Эта операция аналогична каскаду 80 сглаживающего фильтра на фиг. 7. Однако здесь используется селектор 95 минимума вместо селектора 81 максимума, поскольку каскад 94 сглаживающего фильтра сглаживает значения усиления вместо аудиовыборок (значения усиления выводят путем инвертирования аудиовыборок). Каскад 80 сглаживающего фильтра может использоваться вместо него, когда он размещен перед блоком 92 (который определяет значения усиления путем инверсии). Аналогично, каскад 94 сглаживающего фильтра может использоваться на фиг. 4 и 5, когда он помещен после блоков 61 и/или 61' (поскольку после блоков 61 и/или 61' обрабатывают сигнал усиления). Каскад 94 сглаживающего фильтра сглаживает наклон сигнала в случае резкого увеличения значения усиления в блоке 93 (в противном случае, звук может казаться раздражающим). В отличие от этого каскад 94 сглаживающего фильтра позволяет пропускать сигнал усиления без сглаживания в случае резкого уменьшения значения усиления (в противном случае произойдет ограничение сигнала). Рассчитанный сигнал 96 усиления и выход каскада 95 сглаживающего фильтра сравнивают с входящими словами 90, содержащими значения усиления, в селекторе 97 минимума. Минимум из фактически рассчитанного значения 96 усиления и фактического входящего слова 90, содержащего значение усиления, передают на выход селектора 97 минимума. Значения 98 усиления на выходе селектора 97 минимума обеспечивают защиту при смешении с уменьшением количества каналов, и они могут быть внедрены в транскодируемый поток аудиоданных, как описано выше.

Следует отметить, что вариант осуществления, показанный на фиг. 8, необязательно составляет часть аудиотранскодера. Выходные значения усиления могут непосредственно использоваться для регулирования уровня принимаемого аудиопотока. В этом случае устройство по фиг. 8 может представлять собой часть AVR или телевизионного приемника.

Кроме того, вариант осуществления на фиг. 8 может использоваться для предотвращения ограничения сигнала, без учета смешения с уменьшением количества этих каналов. Например, вариант осуществления, показанный на фиг. 8, может принимать обычные аудиовыборки 91 PCM без дальнейшей предварительной обработки в блоке 50. В этом случае вариант осуществления на фиг. 8 предотвращает ограничение сигнала, когда выборки 91 PCM усиливают с использованием выходных значений усиления.

На фиг. 9 иллюстрируются другие альтернативные варианты осуществления. Элементы, показанные на фиг. 8 и 9, обозначенные одинаковыми номерами ссылочных позиций, в принципе, являются одними и теми же. В отличие от варианта осуществления, показанного на фиг. 8, вариант осуществления, показанный на фиг. 9, представляет собой блочную рабочую версию, как в вариантах осуществления, показанных на фиг. 4 и 6, где выполняют только одно разделение на блок сигнала (или любой другой сегмент данных, такой как фрейм). Это уменьшает количество разделений на единицу времени. Как уже описано со ссылкой на фиг. 8, аудиовыборки 91 могут быть сгенерированы блоком 50 по фиг. 3. Если аудиовыборки 91 не являются абсолютными значениями, абсолютные значения аудиовыборок 91 могут быть определены заранее (не показаны на фиг. 9). Аудиовыборки 91 затем подают в каскад 80 сглаживающего фильтра, который соответствует каскаду 80 сглаживающего фильтра на фиг. 7. В отличие от фиг. 8, каскад 80 сглаживающего фильтра обрабатывает аудиовыборки вместо выборок усиления. Таким образом, каскад 80 сглаживающего фильтра использует селектор 81 максимума вместо селектора 95 минимума. После сглаживания максимум выборок в блоке аудиоданных определяют в модуле 100. Затем максимальное значение инвертируют в блоке 101, рассчитывая, таким образом, максимально допустимое усиление в блоке. Такое значение усиления сравнивают с текущим значением 90 усиления в селекторе 97 минимума, при этом минимум обеих величин передают на выход селектора 97 минимума. Значение 98 усиления на выходе селектора 97 минимума обеспечивает защиту от ограничения сигнала при смешении с уменьшением количества каналов и может быть внедрено в транскодированный аудиопоток, как описано выше. Вариант осуществления на фиг. 9 может быть модифицирован для генерирования значения 98 усиления аналогично случаю, когда входящее значение 90 усиления отсутствует. Если входящее значение 90 усиления отсутствует и рассчитанное значение усиления меньше или равно 1, выводят рассчитанное значение усиления. В случае когда рассчитанное значение усиления больше чем 1 (и входящее значение 90 усиления отсутствует), выводят значение усиления, имеющее усиление 1. Это может быть реализовано с помощью дополнительного переключателя 63 на фиг. 6, при этом переключатель осуществляет переключение между входящим значением 90 усиления и усилением, равным 1, в зависимости присутствия входящего значения 90 усиления.

Следует отметить, что варианты осуществления, описанные выше, соответствуют ограничителю, который учитывает значения усиления, поступающие из другого варианта уплотнителя.

На фиг. 10 иллюстрируется приемное устройство, принимающее транскодированный аудиопоток 14, генерируемый транскодером по фиг. 1. Блок 121 отделяет значение 11 усиления от аудиопотока 14. Приемное устройство дополнительно содержит декодер 110, который генерирует декодированный аудиосигнал 120. Амплитуду декодированного аудиосигнала 120 регулируют в блоке 112 с помощью значений 11 усиления, которые были выведены на фиг. 1. В случае когда необязательное смешение с уменьшением количества каналов выполняют в блоке 113, выходной сигнал 114 не будет ограничен, поскольку значения 11 усиления будет достаточно для предотвращения ограничения сигнала в случае смешения с уменьшением количества каналов. Амплитуда декодированного аудиосигнала 120 может быть дополнительно отрегулирована PRL (не показан). В случае когда значение 11 усиления также учитывает усиление 11 дБ в режиме RF, как описано со ссылкой на фиг. 6, аудиосигнал 120 может быть также усилен на 11 дБ, без ограничения (как в случае смешения сигнала с уменьшением количества каналов, так и в случае отсутствия смешения сигналов с уменьшением количества каналов).

Похожие патенты RU2468451C1

название год авторы номер документа
АУДИОКОДЕР И АУДИОДЕКОДЕР С МЕТАДАННЫМИ ГРОМКОСТИ И ГРАНИЦЫ ПРОГРАММЫ 2014
  • Грант Майкл
  • Норкросс Скотт Грегори
  • Ридмиллер Джеффри
  • Вард Майкл
RU2589362C1
АУДИОКОДЕР И АУДИОДЕКОДЕР С МЕТАДАННЫМИ ГРОМКОСТИ И ГРАНИЦЫ ПРОГРАММЫ 2020
  • Грант, Майкл
  • Норкросс, Скотт Грегори
  • Ридмиллер, Джеффри
  • Вард, Майкл
RU2800629C2
АУДИОКОДЕР И АУДИОДЕКОДЕР С МЕТАДАННЫМИ ГРОМКОСТИ И ГРАНИЦЫ ПРОГРАММЫ 2014
  • Грант Майкл
  • Норкросс Скотт Грегори
  • Ридмиллер Джеффри
  • Вард Майкл
RU2713609C2
АУДИОКОДЕР И АУДИОДЕКОДЕР С МЕТАДАННЫМИ ГРОМКОСТИ И ГРАНИЦЫ ПРОГРАММЫ 2014
  • Грант Майкл
  • Норкросс Скотт Грегори
  • Ридмиллер Джеффри
  • Вард Майкл
RU2719690C2
ОПТИМИЗАЦИЯ ГРОМКОСТИ И ДИНАМИЧЕСКОГО ДИАПАЗОНА ЧЕРЕЗ РАЗЛИЧНЫЕ УСТРОЙСТВА ВОСПРОИЗВЕДЕНИЯ 2018
  • Райдмиллер, Джеффри
  • Норкросс, Скотт Грегори
  • Рёден, Карл Йонас
RU2777880C2
ОПТИМИЗАЦИЯ ГРОМКОСТИ И ДИНАМИЧЕСКОГО ДИАПАЗОНА ЧЕРЕЗ РАЗЛИЧНЫЕ УСТРОЙСТВА ВОСПРОИЗВЕДЕНИЯ 2014
  • Райдмиллер Джеффри
  • Норкросс Скотт Грегори
  • Рёден Карл Йонас
RU2665873C1
ОПТИМИЗАЦИЯ ГРОМКОСТИ И ДИНАМИЧЕСКОГО ДИАПАЗОНА ЧЕРЕЗ РАЗЛИЧНЫЕ УСТРОЙСТВА ВОСПРОИЗВЕДЕНИЯ 2014
  • Райдмиллер Джеффри
  • Норкросс Скотт Грегори
  • Реден Карл Йонас
RU2631139C2
АУДИОКОДЕР И АУДИОДЕКОДЕР С МЕТАДАННЫМИ СВЕДЕНИЙ О ПРОГРАММЕ ИЛИ СТРУКТУРЫ ВЛОЖЕННЫХ ПОТОКОВ 2014
  • Ридмиллер Джеффри
  • Вард Майкл
RU2624099C1
АУДИОКОДЕР И АУДИОДЕКОДЕР С МЕТАДАННЫМИ СВЕДЕНИЙ О ПРОГРАММЕ ИЛИ СТРУКТУРЫ ВЛОЖЕННЫХ ПОТОКОВ 2019
  • Ридмиллер, Джеффри
  • Вард, Майкл
RU2790571C2
АУДИОКОДЕР И АУДИОДЕКОДЕР С МЕТАДАННЫМИ СВЕДЕНИЙ О ПРОГРАММЕ ИЛИ СТРУКТУРЫ ВЛОЖЕННЫХ ПОТОКОВ 2014
  • Ридмиллер, Джеффри
  • Вард, Майкл
RU2589370C1

Иллюстрации к изобретению RU 2 468 451 C1

Реферат патента 2012 года ЗАЩИТА ОТ ОГРАНИЧЕНИЯ СИГНАЛА С ИСПОЛЬЗОВАНИЕМ ЗАРАНЕЕ СУЩЕСТВУЮЩИХ МЕТАДАННЫХ КОЭФФИЦИЕНТА УСИЛЕНИЯ АУДИОСИГНАЛА

Изобретение относится к способу и устройству для предотвращения ограничения аудиосигнала, когда защита от ограничения сигнала на основе принятых аудиометаданных не гарантируется. Способ используется для предотвращения ограничения сигнала в случае смешения с уменьшением количества каналов многоканального сигнала до стереофонического аудиосигнала. В соответствии со способом определяют, достаточно ли первое значение (4) усиления на основе принятых аудиометаданных для защиты от ограничения аудиосигнала. Аудиометаданные внедряют в первый поток (1) аудиоданных. В случае когда первое значение (4) усиления не достаточно для защиты, соответствующее первое значение (4) усиления заменяют значением усиления, достаточным для защиты от ограничения аудиосигнала. Предпочтительно, в случае когда метаданные, относящиеся к управлению динамическим диапазоном, отсутствуют в первом потоке (1) аудиоданных, способ может добавлять значения усиления, достаточные для защиты от ограничения сигнала. Технический результат - обеспечение предотвращения ограничения сигнала на основе принятых аудиометаданных в случае смешения с уменьшением количества каналов многоканального аудиосигнала. 4 н. и 16 з.п. ф-лы, 10 ил., 1 табл.

Формула изобретения RU 2 468 451 C1

1. Способ обеспечения защиты от ограничения сигнала для аудиосигнала, выведенного из цифровых аудиоданных, содержащий:
- определяют, достаточно ли первое значение (4) усиления для принятых аудиометаданных для защиты от ограничения аудиосигнала, принятые аудиометаданные внедрены в первый цифровой поток (1) аудиоданных; и
- в случае, когда первое значение (4) усиления не достаточно, заменяют соответствующее первое значение (4) усиления на значение (11) усиления, достаточное для защиты от ограничения аудиосигнала,
в котором этап определения содержит следующие этапы:
рассчитывают вторые значения (9) усиления на основе цифровых аудиоданных, причем вторые значения (9) усиления достаточны для защиты от ограничения аудиосигнала; и сравнивают
первые значения (4) усиления на основе принятых аудиометаданных и
рассчитанные вторые значения (9) усиления.

2. Способ по п.1, в котором этап расчета вторых значений (9) усиления содержит:
- определяют максимально разрешенные значения усиления.

3. Способ по п.1, в котором в зависимости от этапа сравнения значения (11) усиления выбирают из первых значений (4) усиления и рассчитанных вторых значений (9) усиления, когда замену значений (11) усиления выполняют путем выбора второго рассчитанного значения (9) усиления.

4. Способ по п.3, в котором выбирают минимум из пары первых (4) и вторых (9) значений усиления.

5. Способ по п.1, в котором способ выполняют в ходе транскодирования
первого потока (1) аудиоданных, кодированного в первом формате кодирования аудиоданных, во
второй поток (14) аудиоданных, кодированный во втором формате кодирования аудиоданных, отличающемся от первого формата кодирования аудиоданных, второй поток (14) аудиоданных, содержащий аудиометаданные, в которых были заменены значения (11) усиления, достаточные для защиты от ограничения аудиосигнала или в которых значения (11) усиления были выведены из них.

6. Способ по п.1, в котором аудиосигнал представляет собой смешанный с уменьшением количества каналов аудиосигнал, и способ обеспечивает защиту от ограничения сигнала, смешанного с уменьшением количества каналов сигнала.

7. Способ по п.1, в котором этап определения, достаточно ли первое значение (4) усиления для защиты, содержит следующий этап:
- выполняют смешение с уменьшением количества каналов цифровых аудиоданных в соответствии с, по меньшей мере, первой схемой смешения с уменьшением количества каналов.

8. Способ по п.7, в котором этап определения, достаточно ли первое значение (4) усиления для защиты, содержит следующий этап:
- вычисляют пиковые значения, в котором пиковое значение вычисляют путем определении максимального из абсолютных значений, по меньшей мере, двух аудиосигналов одновременно, по меньшей мере, два аудиосигнала выбирают из следующей группы:
- один или больше аудиосигналов после смешения с уменьшением количества каналов в соответствии с первой схемой смешения с уменьшением количества каналов,
- один или больше аудиосигналов перед смешением с уменьшением количества каналов, и
- один или больше аудиосигналов после смешения с уменьшением количества каналов в соответствии со второй схемой смешения с уменьшением количества каналов.

9. Способ по п.1, в котором этап определения, достаточно ли первое значение (4) усиления для защиты, содержит следующий этап:
- определяют максимум из множества последовательных значений сигнала, выведенных из цифровых аудиоданных.

10. Способ по п.9, в котором этап определения, достаточно ли первое значение (4) усиления для защиты, содержит следующий этап:
рассчитывают пиковые значения, в котором пиковое значение рассчитывают путем определения максимума абсолютных значений, по меньшей мере, двух аудиосигналов одновременно, по меньшей мере, два аудиосигнала выбирают из следующей группы из:
- одного или больше аудиосигналов после смешения с уменьшением количества каналов в соответствии с первой схемой смешения с уменьшением количества каналов,
- одного или больше аудиосигналов перед смешением с уменьшением количества каналов, и
- одного или больше аудиосигналов после смешения с уменьшением количества каналов в соответствии со второй схемой аудиосмешения с уменьшением количества каналов, и
в котором множество последовательных значений сигнала соответствует последовательным значениям пика или последовательным фильтрованным значениям пика.

11. Способ по п.9,
в котором способ выполняют в ходе транскодирования первого аудиопотока (1), кодированного в первом формате кодирования аудиоданных, во
второй поток (14) аудиоданных, кодированный во втором формате кодирования аудиоданных, отличающемся от первого формата кодирования аудиоданных,
второй поток (14) аудиоданных содержит аудиометаданные, в которых были заменены значения (11) усиления, достаточные для защиты от ограничения аудиосигнала или имеющие значения (11) усиления, выведенные из них, и
в котором
второй поток (14) аудиоданных организован в сегментах данных, и
определяют максимум из множества значений сигнала, ассоциированных с сегментом второго потока (14) аудиоданных.

12. Способ по п.9, в котором
максимальное значение сигнала делят на определенный максимум.

13. Способ по п.9, в котором:
определенный максимум инвертируют.

14. Способ по п.1,
в котором способ выполняют в ходе транскодирования
первого потока (1) аудиоданных, кодированного в первом формате кодирования аудиоданных, во
второй поток (14) аудиоданных, кодированный во втором формате кодирования аудиоданных, отличающемся от первого формата кодирования аудиоданных, второй поток (14) аудиоданных, содержащий аудиометаданные, в которых были заменены значения (11) усиления, достаточные для защиты от ограничения аудиосигнала или которые имеют значения (11) усиления, выведенные из него, и
в котором
- первый поток (1) аудиоданных организован в сегменты данных, по меньшей мере, одно значение усиления принимают для каждого сегмента данных первого потока аудиоданных,
- второй поток (14) аудиоданных организован в сегментах данных, и
- способ дополнительно содержит следующий этап:
- повторно выполняют выборку значений усиления первого потока (1) аудиоданных.

15. Способ по п.1, содержащий следующий этап:
в котором способ выполняют в ходе транскодирования
первого потока (1) аудиоданных, кодированного в первом формате кодирования аудиоданных, во
второй поток (14) аудиоданных, кодированный во втором формате кодирования аудиоданных, отличающемся от первого формата кодирования аудиоданных, второй поток (14) аудиоданных, содержащий аудиометаданные, в которых заменены значения (11) усиления, достаточные для защиты от ограничения аудиосигнала или имеющие значения (11) усиления, выведенные из них, и
в котором
- первый поток (1) аудиоданных организован в сегментах данных, по меньшей мере, одно значение усиления принимают для каждого сегмента данных первого потока аудиоданных,
- второй аудиопоток (14) организован в сегментах данных,
- способ дополнительно содержит следующий этап:
- определяют минимум из множества последовательных значений усиления первого потока (1) аудиоданных.

16. Устройство для предоставления защиты от ограничения сигнала для аудиосигнала, выведенного из цифровых аудиоданных, содержащее:
- средство (8, 10) определения, предназначенное для определения, достаточно ли первое значение (4) усиления, основанное на принятых аудиометаданных, для защиты от ограничения аудиосигнала, принятые аудиометаданные внедрены в первый цифровой поток (1) аудиоданных; и
- средство (10) замены, предназначенное для замены первого значения (4) усиления значением (11) усиления, достаточным для защиты от ограничения аудиосигнала в случае, когда первое значение (4) усиления не достаточно для защиты,
в котором средство определения содержит:
- средство (8) расчета, предназначенное для расчета вторых значений (9) усиления на основе цифровых аудиоданных, причем вторые значения (9) усиления достаточны для защиты от ограничения аудиосигнала; и
- средство (10) сравнения, предназначенное для сравнения
первых значений (4) усиления на основе принятых аудиометаданных и
рассчитанных вторых значений (9) усиления.

17. Устройство по п.16, в котором устройство представляет собой часть транскодера, транскодер выполнен с возможностью транскодирования
первого аудиопотока (1), кодированного в первом формате кодирования аудиоданных, во второй поток (14) аудиоданных, кодированный во втором формате кодирования аудиоданных, отличающемся от первого формата аудиокодирования, второй поток (14) аудиоданных, содержащий аудиометаданные, в которых значения усиления (11), достаточные для защиты от ограничения аудиосигнала, были заменены или имеют значения (11) усиления, выведенные из них.

18. Устройство по п.16, в котором аудиосигнал представляет собой аудиосигнал, смешанный с уменьшением количества каналов аудиосигнала, и устройство обеспечивает защиту от ограничения сигнала для сигнала, смешанного с уменьшением количества каналов.

19. Транскодер, выполненный с возможностью транскодировать первый поток (1) аудиоданных, кодированный в первом формате кодирования аудиоданных, во второй поток (14) аудиоданных, кодированный во втором формате кодирования аудиоданных, транскодер, содержащий устройство по п.16.

20. Способ предоставления защиты от ограничения сигнала для аудиосигнала, выведенного из цифровых аудиоданных, в котором способ выполняют в ходе транскодирования
первого потока (1) аудиоданных, кодированного в первом формате кодирования аудиоданных, во
второй поток (14) аудиоданных, кодированный во втором формате кодирования аудиоданных, отличающемся от первого формата кодирования аудиоданных, и
в котором, в случае, когда метаданные, относящиеся к управлению динамическим диапазоном, отсутствует в первом потоке аудиоданных, значения (11) усиления, достаточные для защиты от ограничения аудиосигнала, добавляют во второй поток аудиоданных путем расчета значений (11) усиления на основе цифровых аудиоданных, содержащихся в первом потоке (1) аудиоданных.

Документы, цитированные в отчете о поиске Патент 2012 года RU2468451C1

WO 2008100098 A1, 21.08.2008
АУДИОКОДИРОВАНИЕ 2003
  • Схейерс Эрик Г. П.
  • Омен Арнолдус В. Й.
RU2325046C2
ЧАСТОТНО-ОРИЕНТИРОВАННОЕ КОДИРОВАНИЕ КАНАЛОВ В ПАРАМЕТРИЧЕСКИХ СИСТЕМАХ МНОГОКАНАЛЬНОГО КОДИРОВАНИЯ 2005
  • Фаллер Кристоф
  • Херре Юрген
RU2323551C1
WO 2006084916 A2, 17.08.2006
US 2005105442 A1, 19.05.2005
СПОСОБ КОДИРОВАНИЯ РЕЧИ (ВАРИАНТЫ), КОДИРУЮЩЕЕ И ДЕКОДИРУЮЩЕЕ УСТРОЙСТВО 1998
  • Хардвик Джон Кларк
RU2214048C2

RU 2 468 451 C1

Авторы

Шильдбах Вольфганг А.

Грешель Александер

Даты

2012-11-27Публикация

2009-10-26Подача