Показать метаданные Скрыть метаданные

(19)

(11)

2 553 084

(13)

(51)

МПК

G10L19/08(2013-01-01)

(21) (22)

Заявка

2013120547/08, 2011-10-06

(24)

Дата начала отсчета патента

2011-10-06

(22)

дата подачи заявки

2011-10-06

(45)

опубликовано

2015-06-10

(72)

авторы

Гайгер РальфШнелль МаркусЛутцки МанфредДиачук Марко

(73)

патентообладатели

Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.

(56)

Документы, цитированные в отчете о поиске

CN 101816038 A, 25.08.2010CN 101609674 A, 23.12.2009EP 1521241 A1, 06.04.2005JP 2001092500 A, 06.04.2001JP 2002534702 A, 15.10.2002

УСТРОЙСТВО И СПОСОБ ДЛЯ ОЦЕНКИ УРОВНЯ КОДИРОВАННЫХ АУДИО КАДРОВ В ОБЛАСТИ БИТОВОГО ПОТОКА Российский патент 2015 года по МПК G10L19/08

Описание патента на изобретение RU2553084C2

Настоящее изобретение относится к обработке аудио и, в частности, к устройству и способу для оценки уровня кодируемых аудио сигналов в области битового потока.

Обработка аудио развивается многими способами и она была подвергнута многим исследованиям, как эффективно кодировать и декодировать сигналы данных аудио. Эффективное кодирование, например, обеспечено посредством MPEG AAC (MPEG = группа экспертов по движущимся изображениям; AAC = усовершенствованное кодирование аудио).

Согласно MPEG AAC, спектральные значения аудио сигнала кодируют, используя коэффициенты масштабирования, квантование и кодовые книги, в частности кодовые книги Хаффмана.

Прежде, чем будет выполнено кодирование по Хаффману, кодер группирует множество спектральных коэффициентов, которые должны быть закодированы в различные секции. Для каждой секции спектральных коэффициентов кодер выбирает кодовую книгу Хаффмана для кодирования по Хаффману. MPEG AAC обеспечивает одиннадцать различных Спектральных кодовых книг Хаффмана для кодирования спектральных данных, из которых кодер выбирает кодовую книгу, лучше всего подходящую для кодирования спектральных коэффициентов секции. Кодер выдает идентификатор кодовой книги, идентифицирующий кодовую книгу, используемую для кодирования по Хаффману спектральных коэффициентов секции к декодеру, в качестве побочной информации.

На стороне декодера декодер анализирует принятую побочную информацию, чтобы определить, какой множества Кодовых книг Хаффмана Спектра использовался для кодирования спектральных значений секции. Декодер проводит Хаффмана, Декодирующего на основании информации стороны о Кодовой книге Хаффмана, используемой для кодирования спектральных коэффициентов секции, которая должна быть декодирована декодером.

После декодирования по Хаффману множество квантованных спектральных значений получают в декодере. Декодер может затем выполнить обратное квантование, чтобы инвертировать неоднородное квантование, которое могло быть проведено кодером. Посредством этого обратно квантованные спектральные значения получают в декодере.

Однако, эти обратно квантованные спектральные значения могут все еще быть немасштабированы. Выведенные немасштабированные спектральные значения группируют в диапазоны коэффициентов масштабирования, каждый диапазон коэффициентов масштабирования имеет общий коэффициент масштабирования. Коэффициент масштабирования для каждого диапазона коэффициентов масштабирования доступен для декодера в качестве побочной информации, которая предоставлена кодером. Используя эту информацию, декодер умножает немасштабированные спектральные значения диапазона коэффициентов масштабирования на их коэффициент масштабирования. Этим масштабированные спектральные значения получают.

Кодирование и декодирование спектральных значений согласно состоянию уровня техники описаны со ссылками на фиг. 7-10.

Фиг. 7 иллюстрирует кодер согласно состоянию уровня техники. Кодер содержит банк фильтров T/F 710 для преобразования аудио сигналов AS, которые должны быть кодированы, из временной области в частотную область, чтобы получить сигнал аудио частотной области. Сигнал аудио частотной области подается в модуль 720 коэффициентов масштабирования для определения коэффициентов масштабирования. Модуль 720 коэффициентов масштабирования приспособлен, чтобы разделить спектральные коэффициенты аудио сигнала частотной области в несколько групп спектральных коэффициентов, называемых диапазонами коэффициентов масштабирования, которые совместно используют один коэффициент масштабирования. Коэффициент масштабирования представляет значение усиления, используемое для изменения амплитуды всех спектральных коэффициентов в соответствующем диапазоне коэффициентов масштабирования. Модуль 720 коэффициентов масштабирования, кроме того, приспособлен, чтобы генерировать и вывести немасштабированные спектральные коэффициенты аудио сигнала частотной области.

Кроме того, кодер на Фиг. 7 содержит квантователь для квантования немасштабированных спектральных коэффициентов аудио сигнала частотной области. Квантователь 730 может быть неоднородным квантователем.

После квантования квантованные немасштабированные спектры аудио сигнала подаются в кодер 740 Хаффмана для того, чтобы быть закодированными по Хаффману. Кодирование по Хаффману используется для уменьшенной избыточности квантованного спектра аудио сигнала. Множество немасштабированных квантованных спектральных коэффициентов группируется в секции. В то время как в MPEG-AAC обеспечены одиннадцать возможных кодовых книг, все спектральные коэффициенты секции закодированы посредством одной и той же кодовой книги Хаффмана.

Кодер выберет одну из одиннадцати возможных кодовых книг Хаффмана, которая особенно подходит для кодирования спектральных коэффициентов секции. Посредством этого выбор кодовой книги Хаффмана кодера для конкретной секции зависит от спектральных значений конкретной секции. Закодированные по Хаффману спектральные коэффициенты могут затем быть переданы к декодеру вместе с побочной информацией, содержащей например, информацию о кодовой книге Хаффмана, которая использовалась для кодирования секции спектральных коэффициентов, коэффициент масштабирования, который использовался для конкретного диапазона коэффициентов масштабирования, и т.д.

Два или четыре спектральных коэффициента закодированы кодовым словом кодовой книги Хаффмана, используемой для кодирования по Хаффману спектральных коэффициентов секции. Кодер передает кодовые слова, представляющие закодированные спектральные коэффициенты, к декодеру вместе с побочной информацией, содержащей длину секции, а также информацию о кодовой книге Хаффмана, используемой для кодирования спектральных коэффициентов секции.

В MPEG AAC, одиннадцать Спектральных кодовых книг Хаффмана предоставлены для кодирования спектральных данных аудио сигнала. Различная спектральная кодовая книга Хаффмана может быть идентифицирована посредством ее индекса кодовой книги (значение между 1 и 11). Размерность кодовой книги Хаффмана указывает, сколько спектральных коэффициентов закодировано кодовым словом рассматриваемой кодовой книги Хаффмана. В MPEG AAC, размерность кодовой книги Хаффмана равна или 2 или 4, указывающие, что кодовое слово кодирует или два или четыре спектральных значения аудио сигнала.

Однако различные кодовые книги Хаффмана также отличаются относительно других свойств. Например, максимальное абсолютное значение спектрального коэффициента, которое может быть закодировано кодовой книгой Хаффмана, изменяется от кодовой книги к кодовой книги и может, например, быть равно 1, 2, 4, 7, 12 или больше. Кроме того, рассмотренная кодовая книга Хаффмана может быть приспособлена, чтобы кодировать значения со знаком или без.

Используя кодирование по Хаффману, спектральные коэффициенты кодируются кодовыми словами различных длин. MPEG AAC обеспечивает две различных кодовых книги Хаффмана, имеющие максимальное абсолютное значение 1, две различные кодовые книги Хаффмана, имеющие максимальное абсолютное значение 2, две различные кодовые книги Хаффмана, имеющие максимальное абсолютное значение 4, две различные кодовые книги Хаффмана, имеющие максимальное абсолютное значение 7 и две различные кодовые книги Хаффмана, имеющие максимальное абсолютное значение 12, в котором каждая кодовая книга Хаффмана представляет отличную функцию распределения вероятности. Кодер Хаффмана будет всегда выбирать кодовую книгу Хаффмана, которая подходит лучше всего для кодирования спектральных коэффициентов.

Фиг. 8 иллюстрирует декодер согласно состоянию уровня техники. Закодированные по Хаффману спектральные значения принимаются декодером 750 Хаффмана. Декодер 750 Хаффмана также принимает, в качестве побочной информации, информацию о кодовой книге Хаффмана, используемой для кодирования спектральных значений для каждой секции спектральных значений. Декодер 750 Хаффмана затем выполняет декодирование по Хаффману для получения немасштабированных квантованных спектральных значений. Немасштабированные квантованные спектральные значения подаются в обратный квантователь 760. Обратный квантователь выполняет обратное квантование, чтобы получить обратно квантованные немасштабированные спектральные значения, которые подаются в блок 770 масштабирования. Блок 770 масштабирования также принимает коэффициенты масштабирования в качестве побочной информации для каждого диапазона коэффициентов масштабирования. На основании принятых коэффициентов масштабирования, блок 770 масштабирования взвешивает немасштабированные обратно квантованные спектральные значения, чтобы получить масштабированные обратно квантованные спектральные значения. Банк фильтров F/T 780 затем преобразовывает масштабированные обратно квантованные спектральные значения аудио сигнала частотной области из частотной области во временную область, чтобы получить значения выборок аудио сигнала временной области.

Фиг. 9 иллюстрирует кодер согласно состоянию уровня техники, отличающийся от кодера согласно Фиг. 7 тем, что кодер согласно Фиг. 9 также содержит блок TNS (TNS = временное формирование шума) стороны кодера. Временное формирование шума может использоваться, чтобы управлять временной формой шума квантования посредством проведения процесса фильтрования относительно частей спектральных данных аудио сигнала. Блок TNS 715 стороны кодера определяет, выполняет вычисление с линейным прогнозирующим кодированием (LPC) относительно спектральных коэффициентов аудио сигнала частотной области, который должен быть закодирован. Среди прочего, получают из вычисления LPC коэффициентов отражения, также называемые коэффициентами PARCOR. Временное формирование шума не используется, если коэффициент предсказания, который также получают посредством вычисления LPC, не превышает некоторое пороговое значение. Однако, если коэффициент предсказания больше чем пороговое значение, временное формирование шума используется. Блок TNS стороны кодера удаляет все коэффициенты отражения, которые меньше чем некоторое пороговое значение. Оставшиеся коэффициенты отражения преобразуются в коэффициенты линейного предсказания и используются как коэффициенты фильтра формирования шума в кодере. Блок TNS стороны кодера затем выполняет операцию фильтрования в отношении тех спектральных коэффициентов, для которых используется TNS, чтобы получить обработанные спектральные коэффициенты аудио сигнала. Побочная информация, указывающая информацию TNS, например, коэффициенты отражения (коэффициенты PARCOR), передается к декодеру.

Фиг. 10 иллюстрирует декодер согласно состоянию уровня техники, который отличается от декодера, иллюстрированного на Фиг. 8, поскольку декодер согласно Фиг. 10, кроме того, содержит блок TNS 775 стороны декодера. Блок TNS стороны декодера принимает обратно квантованные масштабированные спектры аудио сигнала и также принятую информацию TNS, например, информацию, указывающую коэффициенты отражения (коэффициенты PARCOR). Блок TNS 775 стороны декодера обрабатывает обратно квантованные спектры аудио сигнала, чтобы получить обработанный обратно квантованный спектр аудио сигнала.

Для множества приложений важно определить или оценить уровень, например, энергию, амплитуду или громкость, кодируемого аудио сигнала. Это особенно верно для систем телеконференции. Телеконференции с несколькими участниками в различных местоположениях обрабатываются блоками управления многими точками (MCU). Их цель состоит в том, чтобы смешать различные входные и выходные потоки, где аудио данные представлены в кодированном формате.

Согласно состоянию уровня техники, все входные потоки декодируются в MCU, и аудио данные затем далее анализируют, чтобы идентифицировать наиболее доминирующие потоки, которые примешаны к выходному потоку. Это означает, что, согласно состоянию уровня техники, все входные потоки являются декодированными по Хаффману обратно квантованными и масштабированными для дальнейшего анализа входных потоков после этого, чтобы идентифицировать наиболее доминирующие потоки, например, потоки, показывающие самый высокий уровень, например, показывающие наибольшую энергию. Современный подход для оценки уровня, например, энергии, одного диапазона коэффициентов масштабирования должен был бы выполнить декодирование по Хаффману и обратное квантование для всех спектральных значений и вычислить энергию, суммируя квадраты всех обратно квантованных спектральных значений.

Задача настоящего изобретения состоит в том, чтобы обеспечить улучшенные концепции для оценки уровня кодируемого аудио сигнала. Задача настоящего изобретения решается устройством по п. 1, способом по п. 12, способом по п. 14 и компьютерной программой по п. 15.

Устройство для оценки уровня кодируемого аудио сигнала обеспечено. Устройство содержит модуль определения кодовой книги для определения кодовой книги для множества кодовых книг в качестве идентифицированной кодовой книги, в котором аудио сигнал кодирован, используя идентифицированную кодовую книгу. Устройство, кроме того, содержит модуль оценки, сконфигурированный для получения значения уровня, ассоциированного с идентифицированной кодовой книгой в качестве полученного значения уровня. Кроме того, модуль оценки приспособлен для оценивания оценки уровня аудио сигнала, используя полученное значение уровня.

В варианте осуществления полученное значение уровня может быть полученным значением энергии, и устройство для оценки уровня может быть приспособлено для выполнения оценки энергии в качестве оценки уровня. В другом варианте осуществления полученное значение уровня может быть полученным значением амплитуды, и устройство для оценки уровня может быть приспособлено для выполнения оценки амплитуды в качестве оценки уровня. В следующем варианте осуществления полученное значение уровня может быть полученным значением громкости, и устройство для оценки уровня может быть приспособлено для выполнения оценки громкости в качестве оценки уровня.

Настоящее изобретение основано на обнаружении, что, для того, чтобы уменьшить сложность для всех этапов декодирования, уровень, например, энергия, амплитуда или громкость, может быть оценен непосредственно из параметров битового потока для идентификационной информации наиболее доминирующих потоков. Оценка уровня, например, оценка энергии, оценка амплитуды или оценка громкости, может быть основана на информации битового потока, например, элементах битового потока, например, кодовой книге Хаффмана, коэффициенте масштабирования и, например, коэффициентах фильтра TNS. Эти элементы битового потока могут использоваться, чтобы оценить уровень согласно потоку AAC-ELD (AAC-ELD; Усовершенствованное кодирование аудио с расширенной малой задержкой). Таким образом, согласно настоящему изобретению, не является необходимым полностью декодировать битовый поток аудио, но вместо этого обеспечить оценку уровня, на основании определении кодовой книги, которая использовалась для кодирования аудио сигналов, посредством получения значения уровня, ассоциированного с идентифицированной кодовой книгой, и посредством оценки уровня аудио сигнала, используя это значение уровня.

В варианте осуществления модуль оценки содержит модуль масштабирования. Модуль масштабирования может быть приспособлен, чтобы получить коэффициент масштабирования, относящийся к кодируемому аудио сигналу или части кодируемого аудио сигнала в качестве полученного коэффициента масштабирования. Модуль масштабирования может быть приспособлен для получения масштабированного значения уровня, например, масштабированное значение энергии, амплитуды или громкости, на основании коэффициента масштабирования и полученного значения уровня. Кроме того, модуль оценки может быть приспособлен для оценивания оценки уровня аудио сигнала, используя масштабированное значение уровня. Согласно этому варианту осуществления, оценка уровня обеспечивается на основании информации о кодовой книге, которая использовалась для кодирования аудио сигналов, значении уровня, которое ассоциировано с идентифицированной кодовой книгой и коэффициента масштабирования.

В варианте осуществления полученное значение уровня является значением энергии, и модуль масштабирования приспособлен, чтобы применить полученный коэффициент масштабирования к полученному значению энергии, чтобы получить масштабированное значение энергии, посредством умножения полученного значения энергии на квадрат полученного коэффициента масштабирования. Посредством этого полученный коэффициент масштабирования применяется к полученной энергии аналогичным образом тому, как коэффициент масштабирования применяется к немасштабированным обратно квантованным спектральным коэффициентам в декодере согласно MPEG-2 AAC, но без необходимости декодировать спектральные коэффициенты.

В другом варианте осуществления полученное значение уровня является значением амплитуды, и модуль масштабирования приспособлен, чтобы применить полученный коэффициент масштабирования к полученному значению амплитуды, чтобы получить масштабированное значение амплитуды, посредством умножения полученного значения амплитуды на полученный коэффициент масштабирования.

В другом варианте осуществления полученное значение уровня является значением громкости, и модуль масштабирования приспособлен, чтобы применить полученный коэффициент масштабирования к полученному значению громкости, чтобы получить масштабированное значение громкости, посредством умножения полученного значения громкости на куб полученного коэффициента масштабирования. Существуют альтернативные способы вычислить громкость, такие как, на степень 3/2. Обычно коэффициенты масштабирования должны быть преобразованы в область громкости, когда полученное значение уровня является значением громкости.

В другом варианте осуществления модуль оценки конфигурируется для оценивания оценки уровня аудио сигнала, используя конкретное значение уровня в качестве полученного значения уровня. Таким образом, модуль оценки специально конфигурируется для того, чтобы выполнить оценку уровня, на основании конкретного вида значения уровня.

В варианте осуществления полученное значение уровня является полученным значением энергии, и модуль оценки конфигурируется для оценивания оценки энергии в качестве оценки уровня аудио сигнала, используя в качестве полученного значения энергии значение энергии кодовой книги, которое указывает сумму усредненных взвешенных по вероятности значений суммы энергии всех кодовых слов идентифицированной кодовой книги. Каждое среднее взвешенное по вероятности суммарное значение указывает отношение взвешенного по вероятности суммарного значения энергии кодового слова идентифицированной кодовой книги к значению размерности, ассоциированному с кодовой книгой. Каждое взвешенное по вероятности суммарное значение энергии указывает произведение суммарного значения энергии рассматриваемого кодового слова идентифицированной кодовой книги на значение вероятности, ассоциированное с рассматриваемым кодовым словом идентифицированной кодовой книги. Каждое суммарное значение энергии указывает числовые значения последовательности значений энергии кодового слова идентифицированной кодовой книги. Каждая последовательность значений энергии указывает значение квадрата для каждого значения последовательности обратно квантованных числовых значений последовательности числовых значений кодового слова для каждого кодового слова кодовой книги. Каждая последовательность числовых значений является последовательностью числовых значений, закодированных кодовым словом кодовой книги.

В другом варианте осуществления модуль оценки также содержит модуль получения значения уровня. Модуль получения значения уровня приспособлен для получения полученного значения уровня посредством поиска значения уровня, ассоциированного с идентифицированной кодовой книгой, в памяти. В альтернативном варианте осуществления модуль получения значения уровня приспособлен запрашивать значение уровня, ассоциированного с идентифицированной кодовой книгой, из локальной базы данных. В другом дополнительном варианте осуществления модуль получения значения уровня приспособлен запрашивать значение уровня, ассоциированного с идентифицированной кодовой книгой, от удаленного компьютера.

В другом варианте осуществления устройство дополнительно содержит память или базу данных, имеющую сохраненные множество значений хранения уровня кодовой книги, указывающих значение уровня, ассоциированного с кодовой книгой, при этом каждая из множества кодовых книг имеет значение хранения уровня кодовой книги, ассоциированной с ней и сохраненное в памяти или базе данных. Модуль получения значения уровня конфигурируется для получения значения уровня, ассоциированного с идентифицированной кодовой книгой, посредством получения значения хранения уровня кодовой книги, ассоциированного с идентифицированной кодовой книгой, из памяти или из базы данных.

В варианте осуществления память или база данных имеют сохраненные множество значений хранения энергии кодовой книги в качестве значений уровня памяти кодовой книги, при этом каждое значение хранения энергии кодовой книги указывает сумму усредненной взвешенных по вероятности значений суммы энергии всех кодовых слов идентифицированной кодовой книги. Каждое суммарное значение энергии указывает числовые значения последовательности значений энергии кодового слова идентифицированной кодовой книги. Кроме того, каждая последовательность значений энергии указывает значение квадрата для каждого значения последовательности обратно квантованных числовых значений последовательности числовых значений кодового слова для каждого кодового слова кодовой книги. Каждая последовательность числовых значений является последовательностью числовых значений, сохраненных посредством кодового слова кодовой книги. Этот вариант осуществления обеспечивает память или базу данных, имеющие сохраненные множество значений хранения энергии кодовой книги, ассоциированных с конкретной кодовой книгой, причем сохраненные значения хранения энергии кодовой книги имеют специальные свойства, которые являются особенно подходящими для использования для оценки энергии.

В другом варианте осуществления память или база данных имеют сохраненные множество значений амплитуды в качестве значений уровня памяти кодовой книги. В другом варианте осуществления память или база данных имеют сохраненные множество значений громкости в качестве значений уровня памяти кодовой книги.

В другом варианте осуществления модуль оценки дополнительно содержит модуль настройки фильтра предсказания. Модуль настройки фильтра предсказания приспособлен для получения одного или более коэффициентов фильтра предсказания, относящихся к кодируемому аудио сигналу или к части кодируемого аудио сигнала в качестве полученных коэффициентов фильтра предсказания. Модуль настройки фильтра предсказания, кроме того, приспособлен, чтобы получить настроенное фильтром предсказания значение уровня на основании коэффициентов фильтра предсказания и полученного значения уровня. Кроме того, модуль оценки приспособлен для оценивания оценки уровня аудио сигнала, используя настроенное фильтром предсказания значение уровня.

Согласно другому варианту осуществления, предоставлено устройство для генерирования обратного потока данных для множества участников системы организации телеконференций. Устройство содержит интерфейс приемника для приема множества потоков данных участников, содержащих аудио сигналы от множества участников. Кроме того, устройство для генерирования обратного потока данных содержит устройство для оценки уровня кодируемого аудио сигнала согласно одному из вышеописанных вариантов осуществления. Устройство для оценки уровня скомпоновано для выполнения оценки уровня для каждого потока данных участников, без полного декодирования потока данных. Кроме того, устройство для генерирования обратного потока данных содержит модуль принятия решения для принятия решения, должен ли поток данных участников быть включен в обратный поток данных, на основании оценки уровня. Кроме того, устройство для генерирования обратного потока данных содержит смеситель для смешивания только потоков данных участников, которые должны быть включены в обратный поток данных, и для не включения потоков данных участников, для которых принято решение не включать. Устройство для генерирования обратного потока данных сконфигурировано для не полностью декодирования потоков данных участников, для которых принято решение не включать в обратный поток данных. В варианте осуществления модуль принятия решения приспособлен, для принятия решения, что рассматриваемый поток данных участников не включен в обратный поток данных, когда оценка уровня рассматриваемого потока данных участников ниже порогового значения. В другом варианте осуществления модуль принятия решения приспособлен для принятия решения, что только поток данных, который включен в обратный поток данных, является потоком данных, имеющим самую высокую оценку уровня из оценок уровня всех потоков данных участников относительно конкретного диапазона коэффициентов масштабирования.

Согласно варианту осуществления предоставлен способ для генерирования значения уровня, ассоциированного с кодовой книгой. Способ содержит: определение последовательности числовых значений, ассоциированных с кодовым словом кодовой книги для каждого кодового слова кодовой книги. Определение обратно квантованной последовательности числовых значений для каждого кодового слова кодовой книги посредством применения обратного квантователя к числовым значениям последовательности числовых значений кодового слова для каждого кодового слова этой кодовой книги. Вычисление последовательности значений уровня для каждого кодового слова кодовой книги посредством возведения в квадрат каждого значения обратно квантованной последовательности числовых значений кодового слова для каждого кодового слова кодовой книги. Вычисление суммарного значения уровня для каждого кодового слова кодовой книги посредством суммирования значений последовательности значений уровня для каждого кодового слова кодовой книги. Определение взвешенного по вероятности суммарного значения уровня для каждого кодового слова кодовой книги посредством умножения суммарного значения уровня кодового слова на значение вероятности, ассоциированное с кодовым словом для каждого кодового слова кодовой книги. Определение среднего взвешенного по вероятности суммарного значения уровня для каждого кодового слова кодовой книги посредством деления взвешенного по вероятности суммарного значения уровня кодового слова на значение размерности, ассоциированное с этой кодовой книгой, для каждого кодового слова кодовой книги, и вычисления значения уровня кодовой книги посредством суммирования среднего взвешенного по вероятности суммарного значения уровня всех кодовых слов.

Предпочтительные варианты осуществления описаны со ссылками на чертежи, на которых:

Фиг. 1 изображает устройство для оценки уровня согласно варианту осуществления,

Фиг. 2 иллюстрирует модуль оценки согласно варианту осуществления,

Фиг. 3 показывает модуль оценки согласно другому варианту осуществления,

Фиг. 4a и 4b иллюстрируют способ для генерирования значения уровня,

Фиг. 5 изображает модуль оценки согласно дополнительному варианту осуществления, содержащему модуль настройки фильтра предсказания,

Фиг. 6 иллюстрирует устройство для генерирования обратного потока данных,

Фиг. 7 иллюстрирует кодер согласно состоянию уровня техники,

Фиг. 8 изображает декодер согласно состоянию уровня техники,

Фиг. 9 иллюстрирует другой кодер согласно состоянию уровня техники, и

Фиг. 10 изображает дополнительный кодер согласно состоянию уровня техники.

Фиг. 1 иллюстрирует устройство согласно варианту осуществления. Устройство содержит модуль 110 определения кодовой книги и модуль 120 оценки. Модуль 110 определения кодовой книги приспособлен для определения кодовой книги из множества кодовых книг в качестве идентифицированной кодовой книги, при этом аудио сигналы кодированы, используя идентифицированную кодовую книгу. Модуль 120 оценки приспособлен для получения значения уровня, например, значения энергии, значения амплитуды или значения громкости, ассоциированного с идентифицированной кодовой книгой, в качестве полученного значения уровня. Кроме того, модуль 120 оценки приспособлен для оценивания оценки уровня, например, оценки энергии, оценки амплитуды или оценки громкости, аудио сигнала, используя полученное значение уровня. Например, модуль 110 определения кодовой книги может определить кодовую книгу, которая использовалась кодером для кодирования аудио сигнала, посредством приема побочной информации, переданной вместе с кодированным аудио сигналом. В частности, побочная информация может содержать информацию, идентифицирующую кодовую книгу, используемую для кодирования рассматриваемой секции аудио сигнала. Такая информация может, например, быть передана от кодера к декодеру в качестве числа, идентифицирующего кодовую книгу Хаффмана, используемую для кодирования рассматриваемой секции аудио сигнала.

Фиг. 2 иллюстрирует модуль оценки согласно варианту осуществления. Модуль оценки содержит модуль 210 получения значения уровня и модуль 220 масштабирования. Модуль получения значения уровня приспособлен для получения значения уровня, ассоциированного с идентифицированной кодовой книгой, то есть, кодовой книгой, которая использовалась для кодирования спектральных данных кодером, посредством поиска значения уровня в памяти, запрашивая значение уровня из локальной базы данных, или запрашивая значение уровня, ассоциированное с идентифицированной кодовой книгой, из удаленного компьютера. В варианте осуществления значение уровня, которое найдено или запрошено блоком получения значения уровня, может быть средним значением уровня, которое указывает средний уровень закодированного немасштабированного спектрального значения, закодированного посредством использования идентифицированной кодовой книги.

Посредством этого полученное значение уровня не вычисляется из фактических спектральных значений, но вместо этого используется среднее значение уровня, который зависит только от используемой кодовой книги. Как был описано выше, кодер обычно приспособлен, чтобы выбрать кодовую книгу из множества кодовых книг, которые подходят лучше всего для кодирования соответствующих спектральных данных секции аудио сигнала. Поскольку кодовые книги отличаются, например, относительно их максимального абсолютного значения, которое может быть закодировано, среднее значение, которое закодировано с помощью кодовой книги Хаффмана, отличается от кодовой книги к кодовой книге и, поэтому среднее значение уровня закодированного спектрального коэффициента, закодированного конкретной кодовой книгой, также отличается от кодовой книги к кодовой книге.

Таким образом, согласно варианту осуществления, среднее значение уровня для кодирования спектрального коэффициента аудио сигнала, используя конкретную кодовую книгу Хаффмана, может быть определено для каждой кодовой книги Хаффмана, и может, например, может быть сохранено в памяти, базе данных или на удаленном компьютере. Модуль получения значения уровня затем просто должен искать или запросить значение уровня, ассоциированное с идентифицированной кодовой книгой, которая использовалась для кодирования спектральных данных, чтобы получить полученное (выведенное) значение уровня, ассоциированное с идентифицированной кодовой книгой.

Однако, нужно учесть, что кодовые книги Хаффмана часто используются, чтобы закодировать немасштабированные спектральные значения, как это имеет место для MPEG AAC. Затем, однако, масштабирование должно быть принято во внимание, когда проводится оценка уровня. Поэтому, модуль оценки согласно Фиг. 2 также содержит модуль 220 масштабирования. Модуль масштабирования приспособлен, чтобы получить коэффициент масштабирования, относящийся к кодируемому аудио сигналу или к части кодируемого аудио сигнала, в качестве полученного коэффициента масштабирования. Например, относительно декодера, модуль 220 масштабирования будет определять коэффициент масштабирования для каждого диапазона коэффициентов масштабирования. Например, модуль 220 масштабирования может принять информацию о коэффициенте масштабирования диапазона коэффициентов масштабирования посредством приема побочной информации, переданной от кодера к декодеру. Модуль 220 масштабирования, кроме того, приспособлен, чтобы определить масштабированное значение уровня на основании коэффициента масштабирования и полученного значения уровня.

В варианте осуществления, в котором полученное значение уровня является полученным значением энергии, модуль масштабирования приспособлен, чтобы применить полученный коэффициент масштабирования к полученному значению энергии, чтобы получить масштабированное значение уровня, посредством умножения полученного значения энергии на квадрат полученного коэффициента масштабирования.

В другом варианте осуществления, в котором полученное (выведенное) значение уровня является полученным (выведенным) значением амплитуды, и модуль масштабирования приспособлен для применения полученного коэффициента масштабирования к полученному значению амплитуды, чтобы получить масштабированное значение уровня, умножая полученное значение амплитуды на полученный коэффициент масштабирования.

В другом варианте осуществления, в котором полученное значение уровня является полученным значением громкости, и модуль (220) масштабирования приспособлен для применения полученного коэффициента масштабирования к полученному значению громкости, чтобы получить масштабированное значение уровня, посредством умножения полученного значения громкости на куб полученного коэффициента масштабирования. Существуют альтернативные способы, чтобы вычислить громкость, например, посредством степени 3/2. В общем случае коэффициенты масштабирования должны быть преобразованы к области громкости, когда полученное значение уровня является значением громкости.

Эти варианты осуществления принимают во внимание, что значение энергии определено на основании квадрата спектральных коэффициентов аудио сигнала, что значение амплитуды определено на основании абсолютных значений спектральных коэффициентов аудио сигнала, и что значение громкости определено на основании спектральных коэффициентов аудио сигнала, которые были преобразованы к области громкости.

Модуль оценки приспособлен для оценивания оценки уровня аудио сигнала, используя масштабированное значение уровня. В варианте осуществления согласно Фиг. 2 модуль оценки приспособлен, чтобы вывести масштабированное значение уровня в качестве оценки уровня. В этом случае постобработка масштабированного значения уровня не проводится. Однако, как иллюстрировано в варианте осуществления согласно Фиг. 3, модуль оценки может также быть приспособлен, чтобы выполнить постобработку. Поэтому, модуль оценки согласно Фиг. 3 содержит постпроцессор 230 для постобработки одного или более масштабированных значений уровня для оценивания оценки уровня. Например, оценка уровня блока оценки может быть определена постпроцессором 230 посредством определения среднего значения множества масштабированных значений уровня. Это усредненное значение может быть выведено блоком оценки в качестве оценки уровня.

В отличие от представленных вариантов осуществления современный подход для оценки, например, энергии одного диапазона коэффициентов масштабирования может состоять в том, чтобы выполнить декодирование по Хаффману и обратное квантование для всех спектральных значений и вычислить энергию, посредством суммирования квадрата всех обратно квантованных спектральных значений.

В предложенных вариантах осуществления, однако, этот в вычислительном отношении сложный процесс состояния из уровня техники заменен оценкой среднего уровня, который только зависит от коэффициента масштабирования и использования кодовой книги, а не от фактических квантованных значений.

Варианты осуществления настоящего изобретения используют факт, что кодовая книга Хаффмана разработана, чтобы обеспечить оптимальное кодирование, следуя назначенной статистике. Это означает, что кодовая книга разработана согласно вероятности данных, например, AAC-ELD (AAC-ELD; Усовершенствованное кодирование аудио с расширенной малой задержкой): спектральные линии. Этот процесс может быть обращен, чтобы получить вероятность данных согласно кодовой книге. Вероятность каждой записи данных в кодовой книге (индекс) задана длиной кодового слова. Например,

p (индекс)=2^-длина (кодовое слово)

то есть

p (индекс)=2^{-длина (кодовое слово)}

где p (индекс) является вероятностью записи данных (индекс) в кодовой книге.

На основании этого, ожидаемый уровень может быть предварительно вычислен и сохранен следующим образом: каждый индекс представляет последовательность целочисленных значений (x), например, спектральных линий, где длина последовательности зависит от размерности кодовой книги, например, 2 или 4 для AAC-ELD.

Фиг. 4a и 4b иллюстрируют способ для генерирования значения уровня, например, значения энергии, значения амплитуды или значения громкости, ассоциированного с кодовой книгой, согласно варианту осуществления. Способ содержит:

Определение последовательности числовых значений, ассоциированных с кодовым словом кодовой книги для каждого кодового слова кодовой книги (этап 410). Как было описано выше, кодовая книга кодирует последовательность числовых значений, например, 2 или 4 числовых значений, кодовым словом кодовой книги. Кодовая книга содержит множество кодовых книг, чтобы кодировать множество последовательностей числовых значений. Последовательность числовых значений, которая определена, является последовательностью числовых значений, которая закодирована рассматриваемым кодовым словом кодовой книги. Этап 410 проводится для каждого кодового слова кодовой книги. Например, если кодовая книга содержит 81 кодовое слово, 81 последовательность числовых значений определяется на этапе 410.

На этапе 420 обратно квантованная последовательность числовых значений определяется для каждого кодового слова кодовой книги посредством применения обратного квантователя к числовым значениям последовательности числовых значений кодового слова для каждого кодового слова кодовой книги. Как было описано выше, кодер может обычно использовать квантование при кодировании спектральных значений аудио сигнала, например, нелинейное квантование. Как следствие, это квантование должно быть обращено на стороне декодера.

Затем на этапе 430 последовательность значений уровня определяется для каждого кодового слова кодовой книги.

Если значение энергии должно генерироваться в качестве значения уровня кодовой книги, то последовательность значений энергии определяется для каждого кодового слова, и квадрат каждого значения обратно квантованной последовательности числовых значений вычисляется для каждого кодового слова кодовой книги.

Если, однако, значение амплитуды должно генерироваться в качестве значения уровня кодовой книги, то последовательность значений амплитуды определяется для каждого кодового слова, и абсолютное значение каждого значения обратно квантованной последовательности числовых значений вычисляется для каждого кодового слова кодовой книги.

Если, тем не менее, значение громкости должно генерироваться в качестве значения уровня кодовой книги, то последовательность значений громкости определяется для каждого кодового слова, и куб каждого значения обратно квантованной последовательности числовых значений вычисляется для каждого кодового слова кодовой книги. Существуют альтернативные способы вычислить громкость, например, посредством степени 3/2. В общем случае значения обратно квантованной последовательности числовых значений должны быть преобразованы к области громкости, когда значение громкости должно генерироваться в качестве значения уровня кодовой книги.

Затем на этапе 440 суммарное значение уровня для каждого кодового слова кодовой книги вычисляется посредством суммирования значений последовательности значений уровня для каждого кодового слова кодовой книги.

Затем на этапе 450 взвешенное по вероятности суммарное значение уровня определяется для каждого кодового слова кодовой книги посредством умножения суммарного значения уровня кодового слова на значение вероятности, ассоциированное с кодовым словом для каждого кодового слова кодовой книги. Посредством этого принимается во внимание, что некоторые из последовательности числовых значений, например, последовательностей спектральных коэффициентов, не будут появляться так часто, как другие последовательности спектральных коэффициентов. Значение вероятности, ассоциированное с кодовым словом, принимает во внимание это. Такое значение вероятности может быть получено (выведено) из длины кодового слова, когда кодовые слова, которые более вероятно появятся, кодируются посредством использования кодовых слов, имеющих более короткую длину, в то время как другие кодовые слова, которые менее вероятно появятся, будут закодированы посредством использования кодовых слов, имеющих более длинную длину, при использовании кодирования по Хаффману.

На этапе 460 усредненное взвешенное по вероятности суммарное значение уровня для каждого кодового слова кодовой книги будет определяется посредством деления взвешенного по вероятности суммарного значения уровня кодового слова на значение размерности, ассоциированное с кодовой книгой, для каждого кодового слова кодовой книги. Значение размерности указывает количество спектральных значений, которые закодированы кодовым словом кодовой книги. Посредством этого усредненное взвешенное по вероятности суммарное значение уровня определяется, которое представляет значение уровня (взвешенное по вероятности) для спектрального коэффициента, который закодирован кодовым словом.

Затем на этапе 470 значение уровня кодовой книги вычисляется, суммируя усредненные взвешенные по вероятности суммарные значения уровня всех кодовых слов.

Должно быть отмечено, что такое генерирование значения уровня должно быть сделано только однажды для кодовой книги. Если значение уровня кодовой книги определено, это значение может быть просто найдено и использоваться, например, устройством для оценки уровня согласно вариантам осуществления, описанным выше.

Ниже представлен способ генерирования значения энергии, ассоциированного с кодовой книгой, согласно варианту осуществления. Чтобы оценить ожидаемое значение энергии данных, кодированных заданной кодовой книгой, следующие этапы должны быть выполнены только однажды для каждого индекса кодовой книги:

A) применение обратного квантователя к целочисленным значениям последовательности (например, AAC-ELD: x^(4/3)),

B) вычислить энергию посредством возведения в квадрат каждого значения последовательности A),

C) найти сумму последовательности B),

D) перемножить C) с заданной вероятностью индекса,

E) разделить на размерность кодовой книги, чтобы получить ожидаемую энергию для каждой спектральной линии.

Наконец, все значения, вычисленные посредством E), должны быть суммированы, чтобы получить ожидаемую энергию полной кодовой книги.

После того, как выходное значение этих этапов сохранено в таблице, оцененные значения энергии могут быть просто найдены на основании индекса кодовой книги, то есть, в зависимости от того, какая используется кодовая книга. Фактические спектральные значения не должны быть декодированы по Хаффману для этой оценки.

Чтобы оценить полную энергию спектральных данных полного аудио кадра, коэффициент масштабирования должен быть принят во внимание. Коэффициент масштабирования может быть извлечен из битового потока без значительного объема сложности. Коэффициент масштабирования может быть модифицирован, прежде чем будет применен к ожидаемой энергии, например, квадрат используемого коэффициента масштабирования может быть вычислен. Ожидаемая энергия затем умножается на квадрат используемого коэффициента масштабирования.

Согласно вышеописанным вариантам осуществления спектральный уровень для каждого диапазона коэффициентов масштабирования может быть оценен без декодирования кодированных спектральных значений Хаффмана. Оценки уровня могут использоваться, чтобы идентифицировать потоки с низким уровнем, например, с низкой мощностью, которые не являются релевантными для последующего процесса смешивания. Поэтому, полного декодирования таких потоков можно избежать.

Согласно варианту осуществления, устройство для оценки уровня дополнительно содержит память или базу данных, хранящую множество значений хранения уровня кодовой книги, указывающих значение уровня, ассоциированное с кодовой книгой, в котором каждая из множества кодовых книг имеет значение хранения уровня кодовой книги, ассоциированное с сохраненным в памяти или базе данных. Кроме того, модуль получения значения уровня сконфигурирован для получения значения уровня, ассоциированного с идентифицированной кодовой книгой, посредством получения значения хранения уровня кодовой книги, ассоциированного с идентифицированной кодовой книгой из памяти или из базы данных.

Уровень, оцененный согласно вышеописанным вариантам осуществления, может измениться, если дополнительный этап обработки в качестве предсказания, такой как фильтрование с предсказанием, применяется в кодеке, например, для фильтрования AAC-ELD TNS (временного формирования шума). Здесь, коэффициенты предсказания передают в битовом потоке, например, для TNS в качестве коэффициентов PARCOR.

Фиг. 5 иллюстрирует вариант осуществления, в котором модуль оценки дополнительно содержит модуль 240 настройки фильтра предсказания. Модуль настройки фильтра предсказания приспособлен для получения одного или более коэффициентов фильтра предсказания, относящихся к кодируемому аудио сигналу или к части кодируемого аудио сигнала, в качестве полученных коэффициентов фильтра предсказания. Кроме того, модуль настройки фильтра предсказания приспособлен, чтобы получить настроенное фильтром предсказания значение уровня на основании коэффициентов фильтра предсказания и полученного значения уровня. Кроме того, модуль оценки приспособлен для оценивания оценки уровня аудио сигнала, используя настроенное фильтром предсказания значение уровня.

В варианте осуществления коэффициенты PARCOR для TNS используются в качестве коэффициентов фильтра предсказания. Коэффициент усиления предсказания процесса фильтрования может быть определен из этих коэффициентов очень эффективным способом. Относительно TNS коэффициент усиления предсказания может быть вычислен согласно формуле: коэффициент усиления=1/prod(1-parcor^2).

Например, если 3 коэффициента PARCOR, например, parcor₁, parcor₂ и parcor₃ должны быть учтены, коэффициент усиления вычисляют согласно формуле: 1

коэффициент усиления = $\frac{1}{(1 - p a r c o r_{1}^{2}) (1 - p a r c o r_{2}^{2}) (1 - p a r c o r_{3}^{2})}$

для коэффициентов PARCOR parcor₁, parcor₂, … parcor_n, применяется следующая формула

коэффициент усиления = $\frac{1}{(1 - p a r c o r_{1}^{2}) (1 - p a r c o r_{2}^{2}) ... (1 - p a r c o r_{n}^{2})}$

Это означает, что усиление аудио сигнала посредством фильтрования может быть оценено без применения операции фильтрования непосредственно.

Устройство для оценки уровня согласно одному из вышеописанных вариантов осуществления может использоваться для систем телеконференции, например, для блока управления многими точками (MCU).

Фиг. 6 иллюстрирует устройство для генерирования обратного потока данных для множества участников системы телеконференции согласно варианту осуществления. Устройство содержит интерфейс 610 приемника для приема множества потоков p1, p2,... pn данных участников. Потоки p1, p2,... pn данных участников содержит аудио сигналы от множества участников. Кроме того, устройство для генерирования обратного потока данных содержит устройство 620 для оценки уровня кодируемого аудио сигнала согласно одному из вышеописанных вариантов осуществления, в котором устройство 620 для оценки уровня скомпоновано для выполнения оценки уровня для каждого потока данных участников без полного декодирования потока данных. Как иллюстрировано на Фиг. 6, устройство для оценки уровня принимает потоки p1, p2,... pn данных участников и проводит оценку уровня для каждого из принятых потоков p1, p2,... pn данных участников, содержащих аудио сигналы. Устройство 620 выдает оценку уровня ee₁, ee₂,... ee_n, относящуюся к потокам p1, p2,... pn аудио данных к модулю 630 принятия решения. Модуль 630 принятия решения приспособлен для принятия решения, должен ли поток данных участников быть включен в обратный поток данных или нет, на основании оценки уровня для каждого потока данных участников. Модуль 630 принятия решения затем выдает решение dec₁, dec₂, … dec_n, относительно того, включен ли конкретный поток данных p1, p2,... pn в обратный поток данных или нет, к смесителю 640 для каждого потока данных участников. Смеситель 640 также приспособлен, чтобы принять потоки p1, p2,... pn данных участников. На основании этих решений dec₁, dec₂, … dec_n смеситель 640 смешивает потоки данных только участников, которые должны быть включены в обратный поток данных, и не включает потоки данных участников, для которых принято решение не включать.

Устройство для генерирования обратного потока данных сконфигурировано для того, чтобы полностью не декодировать потоки данных участников, для которых принято решение не включать в обратный поток данных.

В варианте осуществления модуль 630 принятия решения приспособлен для принятия решения, что рассматриваемый поток данных участников не включен в обратный поток данных, когда оценка уровня рассматриваемого потока данных участников ниже порогового значения.

В варианте осуществления устройство для генерирования обратного потока данных приспособлено для принятия решения на основе кадр-за-кадром, должен ли поток данных участников быть включен в обратный поток данных или нет, например, решается для каждого аудио кадра, должен ли целый аудио кадр потока данных участников быть включен в обратный поток данных или нет.

В альтернативном варианте осуществления устройство для генерирования обратного потока данных приспособлено для принятия решения на основании диапазона коэффициентов масштабирования, должен ли поток данных участников быть включен в обратный поток данных или нет, например, для различных диапазонов коэффициента масштабирования аудио кадра, решение, включен ли диапазон коэффициентов масштабирования в обратный поток данных, может быть различным.

В другом варианте осуществления модуль 630 принятия решения приспособлен для принятия решения, что единственный поток данных, который включен в обратный поток данных, является потоком данных, имеющим самую высокую оценку уровня оценок уровня из всех потоков данных участников относительно конкретного диапазона коэффициентов масштабирования.

В другом варианте осуществления модуль 630 принятия решения приспособлен для принятия решения, что только два потока данных, которые включены в обратный поток данных, являются потоками данных, имеющими две самых высоких оценки уровня оценок уровня из всех потоков данных участников относительно конкретного диапазона коэффициентов масштабирования.

В альтернативном варианте осуществления устройство 620 для оценки уровня на Фиг. 6 не является единственным устройством для оценки уровня, которое оценивает оценку уровня для каждого из аудио сигналов, но вместо этого устройство 620 содержит множество из n устройств для оценки уровня, каждое устройство для оценки уровня обеспечивает оценку уровня для одного из n потоков аудио сигнала.

Устройство для оценки уровня также применимо для множества других приложений. В варианте осуществления предоставлено устройство для управления буфером. Устройство для управления буфером содержит блок доступа к буферу для получения доступа к аудио данным буфера из буфера в качестве данных аудио буфера, к которым получают доступ, в котором аудио данные буфера содержат кодируемый аудио сигнал. Кроме того, устройство для управления буфера содержит устройство для оценки уровня кодируемого аудио сигнала согласно одному из вышеупомянутых вариантов осуществления. Кроме того, устройство для управления буфером содержит модуль принятия решения для принятия решения, должны ли данные аудио буфера, к которым получают доступ, быть удалены из буфера или нет, на основании оценки уровня кодируемого аудио сигнала.

Такое устройство для управления буфером особенно полезно для управления буфером дрожания (смещения), например, используемым для VoIP (Голос по Интернет-протоколу). Устройство для управления буфером согласно варианту осуществления приспособлено, чтобы хранить важные аудио кадры в буфере, и приспособлено, чтобы удалять менее важные кадры из буфера, когда буфер находится в состоянии, что существует опасность переполнения буфера. Например, целое содержимое аудио данных буфера может быть проверено, и устройство для управления буфером решает, должно ли содержимое аудио данных (данные аудио буфера) быть удалено из буфера или нет, на основании оценки уровня.

В варианте осуществления устройство для сохранения данных ввода приспособлено для принятия решения, будут ли аудио данные сохранены или отклонены, на основе кадр-за-кадром, например, принятия решения для каждого аудио кадра, сохранен ли целый аудио кадр или отклонен.

Хотя некоторые аспекты были описаны в контексте устройства, ясно, что эти аспекты также представляют описание соответствующего способа, где блок или устройство соответствуют этапу способа или признаку этапа способа. Аналогично, аспекты, описанные в контексте этапа способа, также представляют описание соответствующего блока или элемента или признака соответствующего устройства.

В зависимости от некоторых требований реализации варианты осуществления изобретения могут быть реализованы в аппаратном обеспечении или в программном обеспечении. Реализация может быть выполнена, используя цифровой носитель данных, например, дискету, DVD, компакт-диск, ROM, PROM, EPROM, EEPROM или флэш-память, имеющие электронно хранимые считываемые управляющие сигналы на нем, которые взаимодействуют (или способны к взаимодействию) с программируемой компьютерной системой таким образом, что соответствующий способ выполнен.

Некоторые варианты осуществления согласно изобретению содержат невременный носитель информации, имеющий электронно считываемые управляющие сигналы, которые способны к взаимодействию с программируемой компьютерной системой, таким образом, что один из способов, описанных здесь, выполняется.

В общем случае варианты осуществления настоящего изобретения могут быть реализованы как компьютерный программный продукт с программным кодом, причем программный код функционирует для выполнения одного из способов, когда компьютерный программный продукт выполняется на компьютере. Программный код может, например, быть сохранен на машиночитаемой несущей.

Другие варианты осуществления содержат компьютерную программу для выполнения одного из способов, описанных здесь, сохраненных на машиночитаемой несущей.

Другими словами, вариант осуществления изобретательного способа является поэтому компьютерной программой, имеющей программный код для выполнения одного из способов, описанных здесь, когда компьютерная программа работает на компьютере.

Другим вариантом осуществления изобретательных способов является поэтому носитель информации (или цифровой носитель данных, или считываемый компьютером носитель), содержащий записанную на нем компьютерную программу для выполнения одного из способов, описанных здесь.

Другим вариантом осуществления изобретательного способа является поэтому поток данных или последовательность сигналов, представляющих компьютерную программу, для выполнения одного из способов, описанных здесь. Поток данных или последовательность сигналов могут например, быть сконфигурированы для передачи через соединение передачи данных, например, через Интернет.

Другой вариант осуществления содержит средство обработки, например, компьютер, или программируемое логическое устройство, конфигурируемое или приспособленное, чтобы выполнить один из способов, описанных здесь.

Другой вариант осуществления содержит компьютер, имеющий установленную на нем компьютерную программу для выполнения одного из способов, описанных здесь.

В некоторых вариантах осуществления программируемое логическое устройство (например, программируемая пользователем вентильная матрица) может использоваться, чтобы выполнить некоторые или все функциональные возможности способов, описанных здесь. В некоторых вариантах осуществления программируемая пользователем вентильная матрица может взаимодействовать с микропроцессором, чтобы выполнить один из способов, описанных здесь. В общем случае способы предпочтительно выполняются любым устройством аппаратного обеспечения.

Вышеупомянутые описанные варианты осуществления являются просто иллюстративными для принципов настоящего изобретения. Подразумевается, что модификации и вариации компоновок и деталей, описанных здесь, будут очевидны для специалистов в данной области техники. Оно предназначено, поэтому, быть ограниченным только объемом охраны согласно формуле изобретения, а не конкретными деталями, представленными в качестве описания и объяснения вариантов осуществления здесь.

Иллюстрации к изобретению RU 2 553 084 C2

Реферат патента 2015 года УСТРОЙСТВО И СПОСОБ ДЛЯ ОЦЕНКИ УРОВНЯ КОДИРОВАННЫХ АУДИО КАДРОВ В ОБЛАСТИ БИТОВОГО ПОТОКА

Изобретение относится к средствам оценки аудио сигнала. Техническим результатом является повышение эффективности кодирования аудио сигнала. Устройство содержит модуль определения кодовой книги из множества кодовых книг в качестве идентифицированной кодовой книги. В устройстве аудио сигнал кодируется, используя идентифицированную кодовую книгу, и модуль оценки, сконфигурированный для получения значения уровня, ассоциированного с идентифицированной кодовой книгой, в качестве полученного значения уровня и для оценивания оценки уровня аудио сигнала, используя полученное значение уровня. 8 н. и 11 з.п. ф-лы, 11 ил.

Формула изобретения RU 2 553 084 C2

1. Устройство для оценки уровня кодируемого аудио сигнала, содержащее:
модуль (110) определения кодовой книги для определения кодовой книги из множества кодовых книг в качестве идентифицированной кодовой книги, при этом аудио сигнал кодируется, используя идентифицированную кодовую книгу, и
модуль (120) оценки, сконфигурированный для получения значения уровня, ассоциированного с идентифицированной кодовой книгой, в качестве полученного значения уровня и для оценивания оценки уровня аудио сигнала, используя полученное значение уровня.

2. Устройство согласно п. 1, в котором модуль (120) оценки содержит модуль (220) масштабирования, при этом модуль (220) масштабирования приспособлен, чтобы получить коэффициент масштабирования, относящийся к кодируемому аудио сигналу или к части кодируемого аудио сигнала, в качестве полученного коэффициента масштабирования, при этом модуль (220) масштабирования приспособлен для получения масштабированного значения уровня на основании коэффициента масштабирования и полученного значения уровня, и при этом модуль (120) оценки приспособлен для оценивания оценки уровня аудио сигнала, используя масштабированное значение уровня.

3. Устройство по п. 2, в котором полученное значение уровня является полученным значением энергии и модуль (220) масштабирования приспособлен для применения полученного коэффициента масштабирования к полученному значению энергии, чтобы получить масштабированное значение уровня посредством умножения полученного значения энергии на квадрат полученного коэффициента масштабирования, или
в котором полученное значение уровня является полученным значением амплитуды и модуль (220) масштабирования приспособлен для применения полученного коэффициента масштабирования к полученному значению амплитуды, чтобы получить масштабированное значение уровня посредством умножения полученного значения амплитуды на полученный коэффициент масштабирования, или
в котором полученное значение уровня является полученным значением громкости и модуль (220) масштабирования приспособлен, чтобы преобразовать полученный коэффициент масштабирования в область громкости и применить преобразованный полученный коэффициент масштабирования к полученному значению громкости, чтобы получить масштабированное значение уровня.

4. Устройство по п. 1, в котором модуль (120) оценки конфигурируется для оценивания оценки уровня аудио сигнала, используя значение уровня кодовой книги, указывающее сумму усредненных взвешенных по вероятности суммарных значений уровня всех кодовых слов идентифицированной кодовой книги,
в котором каждое усредненное взвешенное по вероятности суммарное значение уровня указывает отношение взвешенного по вероятности суммарного значения уровня кодового слова идентифицированной кодовой книги к значению размерности, ассоциированному с кодовой книгой,
в котором каждое взвешенное по вероятности суммарное значение уровня указывает произведение суммарного значения уровня рассматриваемого кодового слова идентифицированной кодовой книги на значение вероятности, ассоциированное с рассматриваемым кодовым словом идентифицированной кодовой книги,
в котором каждое суммарное значение уровня указывает числовые значения последовательности значений уровня кодового слова идентифицированной кодовой книги,
в котором каждая последовательность значений уровня указывает значение квадрата для каждого значения последовательности обратно квантованных числовых значений последовательности числовых значений кодового слова для каждого кодового слова кодовой книги, когда значение уровня кодовой книги является значением энергии, или каждая последовательность значений уровня указывает абсолютное значение для каждого значения последовательности обратно квантованных числовых значений последовательности числовых значений кодового слова для каждого кодового слова кодовой книги, когда значение уровня кодовой книги является значением амплитуды, или каждая последовательность значений уровня указывает значение, преобразовываемое в область громкости для каждого значения последовательности обратно квантованных числовых значений последовательности числовых значений кодового слова для каждого кодового слова кодовой книги, когда значение уровня кодовой книги является значением громкости, и
в котором каждая последовательность числовых значений является последовательностью числовых значений, закодированных кодовым словом кодовой книги.

5. Устройство по п. 1, в котором модуль (120) оценки дополнительно содержит модуль (210) получения значения уровня,
в котором модуль (210) получения значения уровня приспособлен для получения полученного значения уровня посредством поиска значения уровня, ассоциированного с идентифицированной кодовой книгой, в памяти,
в котором модуль (210) получения значения уровня приспособлен для запрашивания значения уровня, ассоциированного с идентифицированной кодовой книгой, из локальной базы данных, или
в котором модуль (210) получения значения уровня приспособлен для запрашивания значения уровня, ассоциированного с идентифицированной кодовой книгой, из удаленного компьютера.

6. Устройство по п. 5, дополнительно содержащее память или базу данных, имеющую сохраненное множество значений хранения уровня кодовой книги, указывающих значение уровня, ассоциированное с кодовой книгой, в котором каждая из множества кодовых книг имеет значение хранения уровня кодовой книги, ассоциированное с ней, сохраненное в памяти или базе данных,
и в котором модуль (210) получения значения уровня конфигурируется для получения значения уровня, ассоциированного с идентифицированной кодовой книгой, в качестве значения уровня посредством получения значения хранения уровня кодовой книги, ассоциированного с идентифицированной кодовой книгой, из памяти или из базы данных.

7. Устройство по п. 6, в котором память или база данных имеют сохраненные множество значений хранения уровня кодовой книги,
в котором каждое значение хранения уровня кодовой книги указывает сумму усредненных взвешенных по вероятности суммарных значений уровня всех кодовых слов ассоциированной кодовой книги, при этом ассоциированная кодовая книга ассоциирована со значением хранения уровня кодовой книги,
в котором каждое усредненное взвешенное по вероятности суммарное значение уровня указывает отношение взвешенного по вероятности суммарного значения уровня кодового слова ассоциированной кодовой книги к значению размерности, ассоциированному с ассоциированной кодовой книгой,
в котором каждое взвешенное по вероятности суммарное значение уровня указывает произведение суммарного значения уровня рассматриваемого кодового слова ассоциированной кодовой книги на значение вероятности, ассоциированное с рассматриваемым кодовым словом ассоциированной кодовой книги,
в котором каждое суммарное значение уровня указывает числовые значения последовательности значений уровня кодового слова ассоциированной кодовой книги,
в котором каждая последовательность значений уровня указывает значение квадрата для каждого значения последовательности обратно квантованных числовых значений последовательности числовых значений кодового слова для каждого кодового слова ассоциированной кодовой книги, когда значение хранения уровня кодовой книги является значением энергии, или каждая последовательность значений уровня указывает абсолютное значение для каждого значения последовательности обратно квантованных числовых значений последовательности числовых значений кодового слова для каждого кодового слова ассоциированной кодовой книги, когда значение хранения уровня кодовой книги является значением амплитуды, или каждая последовательность значений уровня указывает значение, преобразовываемое в область громкости для каждого значения последовательности обратно квантованных числовых значений последовательности числовых значений кодового слова для каждого кодового слова ассоциированной кодовой книги, когда значение хранения уровня кодовой книги является значением громкости, и
в котором каждая последовательность числовых значений является последовательностью числовых значений, закодированных кодовым словом ассоциированной кодовой книги.

8. Устройство по п. 1, в котором модуль (120) оценки дополнительно содержит модуль настройки фильтра предсказания,
в котором модуль (240) настройки фильтра предсказания приспособлен для получения одного или более коэффициентов фильтра предсказания, относящихся к кодируемому аудио сигналу или к части кодируемого аудио сигнала, в качестве полученных коэффициентов фильтра предсказания,
в котором модуль (240) настройки фильтра предсказания приспособлен, чтобы получить настроенное фильтром предсказания значение уровня на основании коэффициентов фильтра предсказания и полученного значения уровня, и
в котором модуль (120) оценки приспособлен для оценивания оценки уровня аудио сигнала, используя настроенное фильтром предсказания значение уровня.

9. Устройство для генерирования потока данных вывода из данных ввода, содержащее:
интерфейс (610) приемника для приема данных ввода, содержащих кодируемый аудио сигнал,
устройство (620) для оценки уровня кодируемого аудио сигнала по любому из предыдущих пунктов,
модуль (630) принятия решения для принятия решения, должна ли часть кодируемого аудио сигнала быть включена в поток данных вывода или нет, на основании оценки уровня для части потока данных вывода.

10. Устройство по п. 9, в котором устройство дополнительно содержит смеситель, причем устройство приспособлено, чтобы генерировать обратный поток данных в качестве потока данных вывода для множества участников системы организации телеконференций,
в котором приемник приспособлен, чтобы принять множество потоков данных участников, содержащих аудио сигналы от множества участников,
в котором модуль принятия решения приспособлен для принятия решения, должен ли поток данных участников быть включен в обратный поток данных или нет, на основании оценки уровня для каждого потока данных участников, и
смеситель для того, чтобы смешивать потоки данных только участников, которые должны быть включены в обратный поток данных, и для невключения потоков данных участников, для которых принято решение не включать.

11. Устройство по п. 10, в котором модуль (630) принятия решения приспособлен для принятия решения, что рассматриваемый поток данных участников не включен в обратный поток данных, когда оценка уровня рассматриваемого потока данных участников ниже порогового значения.

12. Устройство по п. 10, в котором модуль (630) принятия решения приспособлен для принятия решения, что только поток данных, который включен в обратный поток данных, является потоком данных, имеющим самую высокую оценку уровня из оценок уровня из всех потоков данных участников относительно конкретного диапазона коэффициентов масштабирования.

13. Устройство для управления буфером:
блок доступа к буферу для получения доступа к аудио данным буфера для буфера в качестве данных аудио буфера, к которым получают доступ, в котором аудио данные буфера содержат кодируемый аудио сигнал,
устройство для оценки уровня кодируемого аудио сигнала по любому из предыдущих пунктов,
модуль принятия решения для принятия решения, должны ли данные аудио буфера, к которым получают доступ, быть удалены из буфера или нет, на основании оценки уровня кодируемого аудио сигнала.

14. Способ для генерирования значения уровня кодовой книги, ассоциированного с кодовой книгой, содержащий:
определение последовательности числовых значений, ассоциированных с кодовым словом кодовой книги для каждого кодового слова кодовой книги,
определение обратно квантованной последовательности числовых значений для каждого кодового слова кодовой книги посредством применения обратного квантователя к числовым значениям последовательности числовых значений кодового слова для каждого кодового слова кодовой книги,
определение последовательности значений уровня для каждого кодового слова кодовой книги посредством определения квадрата каждого значения обратно квантованной последовательности числовых значений кодового слова для каждого кодового слова кодовой книги, когда значение энергии должно генерироваться в качестве значения уровня кодовой книги, или посредством определения последовательности значений уровня для каждого кодового слова кодовой книги посредством определения абсолютного значения каждого значения обратно квантованной последовательности числовых значений кодового слова для каждого кодового слова кодовой книги, когда значение амплитуды должно генерироваться в качестве значения уровня кодовой книги, или посредством преобразования каждого значения обратно квантованной последовательности числовых значений кодового слова в область громкости для каждого кодового слова кодовой книги, когда значение громкости должно быть определено в качестве значения уровня кодовой книги,
вычисление суммарного значения уровня для каждого кодового слова кодовой книги посредством суммирования значений последовательности значений уровня для каждого кодового слова кодовой книги,
определение взвешенного по вероятности суммарного значения уровня для каждого кодового слова кодовой книги посредством умножения суммарного значения уровня кодового слова на значение вероятности, ассоциированное с кодовым словом для каждого кодового слова кодовой книги,
определение усредненного взвешенного по вероятности суммарного значения уровня для каждого кодового слова кодовой книги посредством деления взвешенного по вероятности суммарного значения уровня кодового слова на значение размерности, ассоциированное с кодовой книгой для каждого кодового слова кодовой книги, и
вычисление значения уровня кодовой книги посредством суммирования усредненных взвешенных по вероятности суммарных значений уровня всех кодовых слов.

15. Способ по п. 14, в котором значение вероятности, ассоциированное с кодовым словом, вычисляют согласно формуле:
2^{-(длина (кодовое слово))}
в котором «длина (кодовое слово)» указывает длину кодового слова.

16. Способ для оценки уровня кодируемого аудио сигнала, содержащий:
определение кодовой книги из множества кодовых книг в качестве идентифицированной кодовой книги, причем аудио сигнал кодирован посредством использования идентифицированной кодовой книги,
получение значения уровня, ассоциированного с идентифицированной кодовой книгой, и
оценивание оценки уровня аудио сигнала, используя значение уровня.

17. Способ для генерирования потока данных вывода из данных ввода, содержащий:
прием данных ввода, содержащих кодированный аудио сигнал,
определение кодовой книги из множества кодовых книг в качестве идентифицированной кодовой книги, в котором аудио сигнал кодирован, используя идентифицированную кодовую книгу,
получение значения уровня, ассоциированного с идентифицированной кодовой книгой, и
оценивание оценки уровня аудио сигнала, используя значение уровня,
принятие решения, должна ли часть кодированного аудио сигнала быть включена в поток данных вывода или нет, на основании оценки уровня для части потока данных вывода.

18. Способ для сохранения данных ввода, содержащих кодированный аудио сигнал, в буфере, содержащий:
прием данных ввода, содержащих кодированный аудио сигнал,
определение кодовой книги из множества кодовых книг в качестве идентифицированной кодовой книги, причем аудио сигнал кодируют, используя идентифицированную кодовую книгу,
получение значения уровня, ассоциированного с идентифицированной кодовой книгой, и
оценивание оценки уровня аудио сигнала, используя значение уровня,
принятие решения, должна ли часть кодированного аудио сигнала быть сохранена в буфере или нет, на основании оценки уровня для части потока данных вывода.

19. Цифровой носитель данных, хранящий компьютерную программу, реализующую способ согласно одному из пп. 14-18, будучи выполняемой компьютером или сигнальным процессором.

Документы, цитированные в отчете о поиске Патент 2015 года RU2553084C2

CN 101816038 A, 25.08.2010
CN 101609674 A, 23.12.2009
EP 1521241 A1, 06.04.2005
JP 2001092500 A, 06.04.2001
JP 2002534702 A, 15.10.2002
УСТРОЙСТВО И СПОСОБ ДЛЯ ФОРМИРОВАНИЯ СИГНАЛА УПРАВЛЕНИЯ МНОГОКАНАЛЬНЫМ СИНТЕЗАТОРОМ И УСТРОЙСТВО И СПОСОБ МНОГОКАНАЛЬНОГО СИНТЕЗА	2006	Нойзингер Маттиас Херре Юрген Диш Саша Пурнхаген Хейко Керлинг Кристофер Энгдегард Йонас Бребарт Ерун Схейерс Эрик Омен Вернер	RU2361288C2
КОДИРОВАНИЕ КОЭФФИЦИЕНТОВ ПРЕОБРАЗОВАНИЯ В КОДЕРАХ И/ИЛИ ДЕКОДЕРАХ ИЗОБРАЖЕНИЯ/ВИДЕОСИГНАЛА	2003	Курсерен Рагип Карчевич Марта	RU2335845C2

RU 2 553 084 C2

Авторы

Гайгер Ральф

Шнелль Маркус

Лутцки Манфред

Диачук Марко

Даты

2015-06-10—Публикация

2011-10-06—Подача

название	год	авторы	номер документа
РЕГУЛИРОВКА УРОВНЯ ВО ВРЕМЕННОЙ ОБЛАСТИ ДЛЯ ДЕКОДИРОВАНИЯ ИЛИ КОДИРОВАНИЯ АУДИОСИГНАЛОВ	2014	Шрайнер Штефан Борзум Арне Нойзингер Маттиас Яндер Мануэль Ловассер Маркус Нойгебауэр Бернхард	RU2608878C1
СИСТЕМА ОБРАБОТКИ АУДИО	2014	Черлинг, Кристофер Пурнхаген, Хейко Виллемоес, Ларс	RU2625444C2
МНОГОРЕЖИМНЫЙ АУДИО КОДИРОВЩИК И CELP КОДИРОВАНИЕ, АДАПТИРОВАННОЕ К НЕМУ	2010	Гайгер Ральф Фуш Гильом Мултрус Маркус Грилл Бернхард	RU2586841C2
УСОВЕРШЕНСТВОВАННЫЙ КВАНТОВАТЕЛЬ	2021	Клейса, Януш Виллемоес, Ларс Хеделин, Пер	RU2823174C2
УСОВЕРШЕНСТВОВАННЫЙ КВАНТОВАТЕЛЬ	2017	Клейса, Януш Виллемоес, Ларс Хеделин, Пер	RU2752127C2
АУДИО ИЛИ ВИДЕО КОДЕР, АУДИО ИЛИ ВИДЕО И ОТНОСЯЩИЕСЯ К НИМ СПОСОБЫ ДЛЯ ОБРАБОТКИ МНОГОКАНАЛЬНЫХ АУДИО ИЛИ ВИДЕОСИГНАЛОВ С ИСПОЛЬЗОВАНИЕМ ПЕРЕМЕННОГО НАПРАВЛЕНИЯ ПРЕДСКАЗАНИЯ	2011	Робийяр Жюльен Нойзингер Маттиас Хельмрих Кристиан Хильперт Йоханнес Реттельбах Николаус Диш Саша Эдлер Бернд	RU2541864C2
КОНЦЕПЦИЯ ЗАПОЛНЕНИЯ ШУМОМ	2014	Диш Саша Гайер Марк Хельмрих Кристиан Маркович Горан Луис Валеро Мария	RU2660605C2
ВЫБОР КОДОВЫХ КНИГ ДЛЯ КОДИРОВАНИЯ ВЕКТОРОВ, РАЗЛОЖЕННЫХ ИЗ АУДИОСИГНАЛОВ НА ОСНОВЕ АМФИБИОФОНИИ ВЫСШЕГО ПОРЯДКА	2015	Ким Моо Янг Петерс Нильс Гюнтер Сен Дипанджан	RU2688275C2
ОПРЕДЕЛЕНИЕ МЕЖДУ СКАЛЯРНЫМ И ВЕКТОРНЫМ КВАНТОВАНИЕМ В КОЭФФИЦИЕНТАХ АМБИОФОНИИ ВЫСШЕГО ПОРЯДКА	2015	Ким Моо Янг Петерс Нильс Гюнтер Сен Дипанджан	RU2656833C1
КОДИРОВАНИЕ ВЕКТОРОВ, РАЗЛОЖЕННЫХ ИЗ АУДИОСИГНАЛОВ НА ОСНОВЕ АМБИОФОНИИ ВЫСШЕГО ПОРЯДКА	2015	Ким Моо Янг Питерс Нилс Гюнтер Сен Дипанджан	RU2685997C2