УСТРОЙСТВО И СПОСОБ КОДИРОВАНИЯ АУДИОСИГНАЛА С ИСПОЛЬЗОВАНИЕМ ЗНАЧЕНИЯ КОМПЕНСАЦИИ Российский патент 2020 года по МПК G10L21/38 G10L19/02 G10L21/232 

Описание патента на изобретение RU2727728C1

Настоящее изобретение направлено на кодирование и декодирование аудио, и конкретно на кодирование/декодирование аудио с использованием технологий спектрального улучшения, таких как расширение полосы пропускания или репликация спектральной полосы (SBR) или интеллектуальное заполнение промежутков (IGF).

Хранение или передача аудиосигналов часто подвергается строгим ограничениям скорости передачи битов. В прошлом, кодеры были вынуждены значительно уменьшать полосу пропускания передаваемого аудиосигнала, когда была доступна только очень низкая скорость передачи битов. Современные аудиокодеки в настоящее время способны кодировать широкополосные сигналы посредством использования способов [1-2] расширения полосы пропускания (BWE). Эти алгоритмы полагаются на параметрическое представление высокочастотного контента (HF), который генерируется из имеющей кодированную форму сигнала низкочастотной части (LF) декодированного сигнала посредством транспозиции в HF спектральную область ("патчирования", "patching") и применения постобработки, управляемой параметрами. Однако, если, например, тонкая структура спектра в патче, скопированном в некоторую целевую область, сильно отличается от тонкой структуры спектра первоначального контента, раздражающие артефакты могут образоваться в результате и ухудшить воспринимаемое качество кодированного аудиосигнала.

В BWE схемах, реконструкция HF спектральной области выше заданной так называемой частоты разделения часто основывается на спектральном патчировании. Обычно, HF область состоит из многочисленных смежных патчей, и каждый из этих патчей происходит из полосовых областей (BP) LF спектра ниже заданной частоты разделения. Современные системы эффективно выполняют патчирование внутри представления блока фильтров посредством копирования набора коэффициентов смежных подполос из исходной в целевую область. На следующем этапе, спектральная огибающая регулируется так, что она становится сильно похожа на огибающую первоначального HF сигнала, который был измерен в кодере и передан в битовом потоке как вспомогательная информация.

Однако часто существует несовпадение в тонкой структуре спектра, которое может привести к восприятию артефактов. Известное в общем смысле несовпадение относится к тональности. Если первоначальная HF включает в себя тон с достаточно доминантной энергоемкостью, и патч, который должен быть копирован в спектральное местоположение тона, имеет характеристику шума, этот полосовой шум может быть отмасштабирован так, что он станет слышим как раздражающий всплеск шумов.

Репликация спектральной полосы (SBR) является хорошо известным BWE, используемым в современных аудиокодеках [1]. В SBR, проблема несовпадения тональности решается посредством вставки искусственных замещающих синусоид. Однако, это требует передачи декодеру дополнительной вспомогательной информации, увеличивая потребность битов для BWE-данных. Более того, вставленные тоны могут привести к нестабильности во времени, если вставка тона включается/выключается для последующих блоков.

Интеллектуальное заполнение промежутков (IGF) обозначает способ полупараметрического кодирования среди современных кодеков, таких как MPEG-H 3D Audio или кодек 3gpp EVS. IGF может быть применено для заполнения спектральных дыр, возникших в результате процесса квантования в кодере из-за ограничений низкой скорости передачи битов. Обычно, если ограниченных запас битов не обеспечивает возможность прозрачного кодирования, спектральные дыры возникают в высокочастотной (HF) области сигнала в первую очередь и все больше и больше воздействуют на весь верхний спектральный диапазон для самых низких скоростей передачи битов. На стороне декодера, такие спектральные дыры заменяются посредством IGF с использованием синтетического HF контента, сгенерированного полупараметрическим образом из низкочастотного (LF) контента, и постобработки, управляемой с помощью дополнительной параметрической вспомогательной информации.

Так как IGF фундаментально основывается на заполнении высокочастотного спектра посредством копирования спектральных частей (так называемых мозаичных элементов) из более низких частот и регулирования энергий посредством применения коэффициента усиления, это может доказывать проблематику, если в первоначальном сигнале частотный диапазон, используемый как источник процесса копирования, отличается от своего конечного пункта в том, что касается тонкой структуры спектра.

Одним таким случаем, который может иметь сильное воспринимаемое воздействие, является разница в тональности. Это несовпадение тональности может происходить в двух разных случаях: либо частотный диапазон с сильной тональностью копируется в спектральную область, которая должна быть шумоподобной по структуре, либо другой случай с шумом, заменяющим тональный компонент в первоначальном сигнале. При IGF, ранее рассмотренный случай, который является более распространенным, так как большинство аудиосигналов обычно становятся более шумоподобными ближе к более высоким частотам, обрабатывается посредством применения спектрального отбеливания, где параметры передаются декодеру, которые сигнализируют, сколько отбеливания необходимо, если требуется. Для последнего случая, тональность может быть скорректирована с использованием возможности полнополосного кодирования базового кодера для сохранения тональных линий в HF полосе посредством кодирования формы сигнала. Эти так называемые "линии выживания" могут быть выбраны на основе сильной тональности. Кодирование формы сигнала является достаточно требовательным в том, что касается скорости передачи битов, и в сценариях с низкой скоростью передачи битов наиболее вероятно, что некоторым это будет не под силу. Более того, следует избегать переключения от кадра к кадру между кодированием и некодированием тонального компонента, которое вызовет раздражающие артефакты.

Технология интеллектуального заполнения промежутков дополнительно раскрыта и описана в европейской патентной заявке EP 2830054 A1. Технология IGF решает проблемы, относящиеся к разделению расширения полосы пропускания с одной стороны и базового декодирования с другой стороны посредством выполнения расширения полосы пропускания в той же спектральной области, в которой функционирует базовый декодер. Вследствие этого, предоставляется полноскоростной базовый кодер/декодер, который кодирует и декодирует целый диапазон аудиосигнала. Это не требует потребности в блоке понижения частоты дискретизации на стороне кодера и блоке повышения частоты дискретизации на стороне декодера. Вместо этого, вся обработка выполняется с полной частотой дискретизации или в области полной полосы пропускания. Для того, чтобы получить сильное усиление кодирования, аудиосигнал анализируется, для того, чтобы найти первый набор первых спектральных участков, которые должны быть кодированы с высоким разрешением, где этот первый набор первых спектральных участков может включать в себя, в варианте осуществления, тональные участки аудиосигнала. С другой стороны, нетональные или компоненты шума в аудиосигнале, составляющие второй набор вторых спектральных участков, кодируются параметрически с низким спектральным разрешением. Кодированный аудиосигнал затем только требует первый набор первых спектральных участков, кодированный с сохранением формы сигнала образом с высоким спектральным разрешением, и дополнительно второй набор вторых спектральных участков, кодированных параметрически с низким разрешением с использованием частотных "мозаичных элементов", происходящих из первого набора. На стороне декодера, базовый декодер, который является полнополосным декодером, реконструирует первый набор первых спектральных участков сохраняющим форму сигнала образом, т.е. без какого-либо знания, что есть какая-либо дополнительная частотная регенерация. Однако, такой сгенерированный спектр имеет массу спектральных промежутков. Эти промежутки последовательно заполняются с помощью патентоспособной технологии интеллектуального заполнения промежутков (IGF) посредством использования частотный регенерации, применяющей параметрические данные с одной стороны, и с использованием исходного спектрального диапазона, т.е. первых спектральных участков, реконструированных полноскоростным аудиодекодером, с другой стороны.

Технология IGF также включена и раскрыта в 3GPP TS 26.445 V13.2.0 (2016-06), Third Generation Partnership Project; Technical Specification Group Services and System Aspect; Codec for Enhanced Voice Services (EVS); Detailed Algorithmic Description (release 13). В частности, сделана ссылка на раздел 5.3.3.2.11 "интеллектуальное заполнение промежутков" этого материала касательно стороны кодера, и делается дополнительная ссылка на раздел 6 и в частности раздел 6.2.2.3.8 "IGF Apply" и другие связанные с IGF выдержках, такие как раздел 6.2.2.2.9 "IGF Bitstream Reader" или раздел 6.2.2.3.11 "IGF Temporal Flattening" по отношению к реализации на стороне декодера.

EP 2301027 B1 раскрывает устройство и способ для генерирования выходных данных расширения полосы пропускания. В речевых сигналах с голосом, занижение вычисленного уровня шума дает ощутимо большее качество по сравнению с первоначальным вычисленным уровнем шума. В результате в этом случае речь звучит менее реверберирующей. В случае, когда аудиосигналы содержат шипящие звуки, искусственное увеличение уровня шума может покрыть недостатки в способе патчирования, относящиеся к шипящим звукам. Поэтому, данный материал раскрывает обеспечение уменьшения уровня шума для сигналов, таких как голосовая речь, и увеличение уровня шума для сигналов, содержащих, например, шипящие звуки. Чтобы различать разные сигналы, варианты осуществления используют данные распределения энергии (например, параметр шипящего звука), которые измеряют, расположена ли энергия большей частью на более высоких частотах или более высокой частоте, или другими словами, показывает ли представление аудиосигнала увеличение или уменьшение наклона ближе к более высоким частотам. Дополнительные реализации также используют первый LPC-коэффициент (LPC это линейное кодирование с предсказанием), чтобы сгенерировать параметр шипящего звука.

Целью настоящего изобретения является предоставить улучшенную концепцию для кодирования аудио или обработки аудио.

Эта цель достигается посредством устройства для кодирования аудиосигнала по п. 1, способа кодирования аудиосигнала по п. 23, системы для обработки аудиосигнала по п. 24, способа обработки аудиосигнала по п. 25 или компьютерной программы по п. 26.

Устройство для кодирования аудиосигнала содержит базовый кодер для базового кодирования первых аудиоданных в первой спектральной полосе и параметрический кодер для параметрического кодирования вторых аудиоданных во второй спектральной полосе, отличающейся от первой спектральной полосы. В частности, параметрический кодер содержит анализатор для анализа первых аудиоданных в первой спектральной полосе для получения первого результата анализа и для анализа вторых аудиоданных во второй спектральной полосе для получения второго результата анализа. Компенсатор вычисляет значение компенсации с использованием первого результата анализа и второго результата анализа. Кроме того, калькулятор параметров затем вычисляет параметр из вторых аудиоданных во второй спектральной полосе с использованием значения компенсации, которое определено компенсатором.

Таким образом, настоящее изобретение основано на выяснении того, что для того, чтобы выяснить, обращается ли реконструкция с использованием определенного параметра на стороне декодера к определенной характеристике, которую требует аудиосигнал, первая спектральная полоса, которая обычно является исходной полосой, анализируется для получения первого результата анализа. Аналогично, вторая спектральная полоса, которая обычно является целевой полосой, и которая реконструируется на стороне декодера с использованием первой спектральной полосы, т.е. исходной полосы, дополнительно анализируется анализатором для получения второго результата анализа. Таким образом, для исходной полосы, также как и целевой полосы, вычисляется отдельный результат анализа.

Затем, на основе этих двух результатов анализов, компенсатор вычисляет значение компенсации для изменения определенного параметра, который будет получен без какой-либо компенсации для модифицированного значения. Другими словами, настоящее изобретение отступает от обычной процедуры, в которой параметр для второй спектральной полосы вычисляется из первоначального аудиосигнала и передается декодеру, так что вторая спектральная полоса реконструируется с использованием вычисленного параметра, и вместо этого дает в результате скомпенсированный параметр, вычисленный из целевой полосы, с одной стороны, и значение компенсации, которое зависит как от первого, так и второго результатов анализа, с другой стороны.

Скомпенсированный параметр, может быть сначала вычислен посредством вычисления нескомпенсированного параметра, и затем этот нескомпенсированный параметр может быть объединен со значением компенсации для получения скомпенсированного параметра, или скомпенсированный параметр может быть вычислен за раз, без нескомпенсированного параметра в качестве промежуточного результата. Скомпенсированный параметр может быть затем передан из кодера декодеру, и затем декодер применяет определенную технологию улучшения полосы пропускания, такую как репликация спектральной полосы или интеллектуальное заполнение промежутков или любую другую процедуру с использованием значения скомпенсированного параметра. Таким образом, строгое следование определенному алгоритму вычисления параметра, независимо от того, дает ли параметр в результате желаемый результат улучшения спектральной полосы, гибко обходится посредством выполнения, в дополнение к вычислению параметра, анализа сигнала в исходной полосе и целевой полосе, и последующего вычисления значения компенсации на основе результата из исходной полосы и результата из целевой полосы, т.е. из первой спектральной полосы и второй спектральной полосы, соответственно.

Предпочтительно, анализатор и/или компенсатор применяет подобие психоакустической модели, определяя психоакустическое несовпадение. Отсюда, в варианте осуществления, вычисление значения компенсации основано на обнаружении психоакустического несовпадения определенных параметров сигнала, таких как тональность, и стратегия компенсация применяется для минимизации общего воспринимаемого раздражающего воздействия других параметров сигнала, таких как коэффициенты усиления спектральной полосы. Таким образом, посредством поиска компромисса между разными типами артефактов, получают воспринимаемый хорошо сбалансированный результат.

В противоположность подходам предшествующего уровня техники, "которые пытаются исправить тональность любой ценой", варианты осуществления учат вместо этого исправлять артефакты посредством применения демпфирования проблематичных частей спектра, где обнаружено несовпадение тональности, тем самым находя компромисс между несовпадением огибающей спектральной энергии с несовпадением тональности.

При вводе нескольких параметров сигнала, стратегия компенсации, содержащая модель воспринимаемого раздражающего воздействия, может выбрать стратегию для получения наилучшего воспринимаемого соответствия, а не соответствия лишь параметров сигнала.

Стратегия состоит из взвешивания воспринимаемой значимости потенциальных артефактов и выбора комбинации параметров для минимизирования общего ухудшения качества.

Этот подход в основном предназначен для применения в BWE на основе преобразования наподобие MDCT. Так или иначе, сведения данного изобретения в основном применимы, например, аналогично в рамках системы на основе банка квадратурных зеркальных фильтров (QMF).

Одним возможным сценарием, в котором может быть применен этот способ, является обнаружение и последующее демпфирование шумовых полос в контексте интеллектуального заполнения промежутков (IGF).

Варианты осуществления справляются с возможным несовпадением тональности посредством обнаружения его возникновения и уменьшения его воздействия посредством ослабления соответствующего масштабного коэффициента. Это может с одной стороны привести к отклонению от первоначальной огибающей спектральной энергии, но с другой стороны, к снижению HF шумности, которая способствует общему увеличению воспринимаемого качества.

Таким образом, варианты осуществления повышают воспринимаемое качество посредством новаторского способа параметрической компенсации, обычно управляемого посредством модели воспринимаемого раздражающего воздействия, особенно в случаях где, например, существует несовпадение в тонкой структуре спектра между источником или первой спектральной полосой и целью или второй спектральной полосой.

Предпочтительные варианты осуществления последовательно описаны в контексте прилагающихся Фигур, на которых:

Фиг. 1 иллюстрирует блок-схему устройства для кодирования аудиосигнала в соответствии с вариантом осуществления;

Фиг. 2 иллюстрирует блок-схему устройства для кодирования с фокусом на детекторе компенсации;

Фиг. 3a иллюстрирует схематичное представление аудиоспектра, имеющего исходный диапазон и диапазон IGF или расширения полосы пропускания и ассоциированное отображение между исходной и конечной полосами;

Фиг. 3b иллюстрирует спектр аудиосигнала, где базовый кодер применяет технологию IGF, и где во второй спектральной полосе есть "линии выживания";

Фиг. 3c иллюстрирует представление симулированных первых аудиоданных в первой спектральной полосе, которые должны быть использованы для вычисления первого результата анализа;

Фиг. 4 иллюстрирует более подробное представление компенсатора;

Фиг. 5 иллюстрирует более подробное представление калькулятора параметров;

Фиг. 6 иллюстрирует схему последовательности операций для иллюстрирования функциональности детектора компенсации в варианте осуществления;

Фиг. 7 иллюстрирует функциональность калькулятора параметров для вычисления нескомпенсированного коэффициента усиления;

Фиг. 8a иллюстрирует кодер реализация, имеющий базовый декодер для вычисления первого результата анализа из кодированной и декодированной первой спектральной полосы;

Фиг. 8b иллюстрирует блок-схему кодера в варианте осуществления, в котором симулятор патча применяется для генерирования первой линии спектральной полосы пропускания, сдвинутой из второй спектральной полосы, для получения первого результата анализа;

Фиг. 9 иллюстрирует эффект несовпадения тональности в реализации интеллектуального заполнения промежутков;

Фиг. 10 иллюстрирует, в варианте осуществления, реализацию параметрического кодера; и

Фиг. 11a-11c иллюстрируют результаты теста прослушивания, полученные из кодирования аудиоданных с использованием значений скомпенсированных параметров.

Фиг. 1 иллюстрирует устройство для кодирования аудиосигнала 100 в варианте осуществления настоящего изобретения. Устройство содержит базовый кодер 110 и параметрический кодер 120. Кроме того, базовый кодер 110 и параметрический кодер 120 соединены, на своей входной стороне, с спектральным анализатором 130, и соединены, на своей выходной стороне, с выходным интерфейсом 140. Выходной интерфейс 140 генерирует кодированный аудиосигнал 150. Выходной интерфейс 140 принимает, с одной стороны, кодированный базовым кодером сигнал 160 и по меньшей мере параметр для второй спектральной полосы и обычно полное представление параметра, содержащее параметр для второй спектральной полосы на входной линии 170. Кроме того, спектральный анализатор 130 разделяет аудиосигнал 100 на первую спектральную полосу 180 и вторую спектральную полосу 190. В частности, калькулятор параметров содержит анализатор 121, который проиллюстрирован как анализатор сигнала на Фиг. 1, для анализа первых аудиоданных в первой спектральной полосе 180 для получения первого результата 122 анализа и для анализа вторых аудиоданных во второй спектральной полосе 190 для получения второго результата 123 анализа. И первый результат 122 анализа, и второй результат 123 анализа подаются в компенсатор 124 для вычисления значения 125 компенсации. Таким образом, компенсатор 124 сконфигурирован для использования первого результата 122 анализа и второго результата 123 анализа для вычисления значения компенсации. Затем, как значение 125 компенсации с одной стороны, так и по меньшей мере вторые аудиоданные из второй спектральной полосы 190 (также могут быть использованы первые спектральные данные из первой спектральной полосы) предоставляются в калькулятор 126 параметров для вычисления параметра 170 из вторых аудиоданных во второй спектральной полосе с использованием значения 125 компенсации.

Спектральный анализатор 130 на Фиг. 1 может быть, например, прямым частотно-временным преобразователем для получения индивидуальных спектральных полос или MDCT-линий. Вследствие этого, в этой реализации спектральный анализатор 130 реализует модифицированное дискретное косинусное преобразование (MDCT) для получения спектральных данных. Затем, эти спектральные данные дополнительно анализируются, для того, чтобы разделить данные для базового кодера 110 с одной стороны и данные для параметрического кодера 120 с другой стороны. Данные для базового кодера 110 по меньшей мере содержат первую спектральную полосу. Кроме того, базовые данные могут дополнительно содержать дополнительно исходные данные, когда базовый кодер должен кодировать более, чем одну исходную полосу.

Таким образом, базовый кодер может принимать, в качестве входных данных, которые должны быть кодированы базовым кодером, всю полосу пропускания ниже частоты разделения в случае технологий репликации спектральной полосы, тогда как параметрический кодер затем принимает все аудиоданные выше этой частоты разделения.

Однако в случае механизма интеллектуального заполнения промежутков базовый кодер 110 может дополнительно принимать спектральные линии выше начальной частоты IGF, которые также анализируются спектральным анализатором 130, так что спектральный анализатор 130 дополнительно определяет данные даже выше начальной частоты IGF, где эти данные выше начальной частоты IGF дополнительно кодируются базовым кодером. В связи с этим, спектральный анализатор 130 может также быть реализован как "тональная маска", которая, например, также рассматривается в разделе 5.3.3.2.11.5 документа "IGF Tonal Mask", который раскрыт в 3GPP TS 26.445 V13.0.0(12). Таким образом, для того, чтобы определить, какой спектральный компонент должен быть передан с помощью базового кодера, спектральным анализатором 130 вычисляется тональная маска. Вследствие этого идентифицируется весь значимый спектральный контент, тогда как контент, который хорошо подходит для параметрического кодирования посредством IGF, квантуется до нуля посредством тональной маски. Спектральный анализатор 130 тем не менее пересылает спектральный контент, который хорошо подходит для параметрического кодирования, параметрическому кодеру 120, и эти данные могут, например, быть данными, которые были заданы в ноль посредством обработки с тональной маской.

В варианте осуществления, проиллюстрированном на Фиг. 2, параметрический кодер 120 дополнительно сконфигурирован для параметрического кодирования третьих аудиоданных в третьей спектральной полосе для получения дополнительного параметра 200 для этой третьей спектральной полосы. В этом случае, анализатор 121 сконфигурирован для анализа третьих аудиоданных в третьей спектральной полосе 202 для получения третьего результата анализа 204 в дополнение к первому результату 122 анализа и второму результату 123 анализа.

Кроме того, параметрический кодер 120 с Фиг. 1 дополнительно содержит детектор 210 компенсации для обнаружения, с использованием по меньшей мере третьего результата анализа 204, должна ли третья спектральная полоса быть скомпенсирована или нет. Результатом этого обнаружения является вывод управляющей линией 212, который либо указывает ситуацию компенсации для третьей спектральной полосы, либо нет. Калькулятор 126 параметров выполнен с возможностью вычисления дополнительного параметра 200 для третьей спектральной полосы без какого-либо значения компенсации, когда детектор компенсации обнаруживает, что третья спектральная полоса не должна быть скомпенсирована, как предоставляется управляющей линией 212. Однако, если детектор компенсации обнаруживает, что третья спектральная полоса должна быть скомпенсирована, то калькулятор параметров выполнен с возможностью вычисления дополнительного параметра 200 для третьей спектральной полосы с помощью дополнительного значения компенсации, вычисленного компенсатором 124 из третьего результата 200 анализа.

В предпочтительном варианте осуществления, где применяется количественная компенсация, анализатор 121 выполнен с возможностью вычисления, в качестве первого результата анализа, первого количественного значения 122 и, в качестве второго результата анализа, второго количественного значения 123. Затем, компенсатор 124 выполнен с возможностью вычисления количественного значения 125 компенсации из первого количественного значения и из второго количественного значения. Наконец, калькулятор параметров сконфигурирован для вычисления количественного параметра с использованием количественного значения компенсации.

Однако, настоящее изобретение также применимо, когда только получают только количественные результаты анализа. В этой ситуации вычисляется количественное значение компенсации, которое управляет калькулятором параметров для понижения или увеличения определенного нескомпенсированного параметра до определенной степени. Таким образом, оба результата анализа вместе могут дать в результате определенное увеличение или уменьшение параметра, определенное увеличение или уменьшение является фиксированным и вследствие этого не зависит от количественного результата. Однако, количественные результаты являются более предпочтительными, чем фиксированные увеличивающие/уменьшающие приращения, хотя последние вычисления являются менее интенсивными в вычислительном отношении.

Предпочтительно, анализатор 121 сигнала анализирует первую характеристику аудиоданных для получения первого результата анализа и дополнительно анализирует ту же первую характеристику вторых аудиоданных во второй спектральной полосе для получения второго результата анализа. В противоположность этому, калькулятор параметров сконфигурирован для вычисления параметра из вторых аудиоданных во второй спектральной полосе посредством оценки второй характеристики, где эта вторая характеристика отличается от этой первой характеристики.

В качестве примера, Фиг. 2 иллюстрирует ситуацию, где первая характеристика является тонкой структурой спектра или распределением энергии внутри определенной полосы, такой как первая, вторая или любая другая полоса. В противоположность этому, второй характеристикой, примененной калькулятором параметров или определенной калькулятором параметров, является показатель спектральной огибающей, показатель энергии или показатель мощности или обычно показатель, связанный с амплитудой, дающий абсолютный или относительный показатель мощности/энергии в полосе, такой как, например, коэффициент усиления. Однако калькулятором параметров также могут быть вычислены другие параметры, которые измеряют разные характеристики исходя из характеристики коэффициента усиления. Кроме того, анализатором 121 могут быть применены и проанализированы другие характеристики для отдельной исходной полосы с одной стороны и конечной полосы с другой стороны, т.е. первой спектральной полосы и второй спектральной полосы соответственно.

Кроме того, анализатор 121 выполнен с возможностью вычисления первого результата 122 анализа без использования вторых аудиоданных во второй спектральной полосе 190 и дополнительного вычисления второго результата 123 анализа без использования первых аудиоданных в первой спектральной полосе 180, где, в этом варианте осуществления, первая спектральная полоса и вторая спектральная полоса взаимно исключают друг друга, т.е. не перекрывают друг друга.

Кроме того, спектральный анализатор 130 дополнительно выполнен с возможностью построения кадров аудиосигнала или обработки методом окна входящего потока аудиовыборок для получения кадров аудиовыборок, где аудиовыборки в соседних кадрах перекрывают друг друга. В случае 50%-го перекрывания, например, второй участок более раннего кадра имеет аудиовыборки, которые доставлены из тех же первоначальных аудиовыборок, включенных в первую половину последующего кадра, где аудиовыборки внутри кадра доставлены из первоначальной аудиовыборки посредством обработки методом окна.

В этом случае, когда аудиосигнал содержит временную последовательность кадров, которая, например, дополнительно предоставляется блоком 130 по Фиг. 1, дополнительно имеющим функциональность построителя кадров, компенсатор 124 выполнен с возможностью вычисления текущего значения компенсации для текущего кадра с использованием предыдущего значения кадра компенсации для предыдущего кадра. Это обычно дает в результате подобие операции сглаживания.

Как обозначено позднее, детектор 210 компенсации проиллюстрированный на Фиг. 2, может дополнительно или альтернативно от других признаков на Фиг. 2 содержать ввод спектра мощности и ввод транзиентов, проиллюстрированные в положениях 221, 223, соответственно.

В частности, детектор 210 компенсации выполнен с возможностью только подачи команд для использования компенсации калькулятором 126 параметров, когда доступен спектр мощности первоначального аудиосигнала 100 по Фиг. 1. Этот факт, т.е. доступен ли спектр мощности или нет, сигнализируется посредством определенного элемента данных или флага.

Кроме того, детектор 210 компенсации выполнен с возможностью только обеспечения возможности операции компенсации посредством управляющей линии 212, когда линия 223 информации транзиентов сигнализирует, что для текущего кадра транзиент не присутствует. Таким образом, когда линия 223 сигнализирует, что транзиент присутствует, вся операция компенсации отключается независимо от каких-либо результатов анализа. Это конечно применяется для третьей спектральной полосы, когда компенсация была сигнализирована для второй спектральной полосы. Однако это также применяется для второй спектральной полосы в определенном кадре, когда для этого кадра обнаруживается ситуация, такая как ситуация с транзиентом. Затем, может произойти ситуация, и произойдет, что для определенного временного кадра не будет какого-либо параметра компенсации.

Фиг. 3a иллюстрирует представление спектра амплитуд A(f) или амплитуд в квадрате A2(f). В частности, проиллюстрирована начальная частота IGF или XOVER.

Кроме того, проиллюстрирован набор перекрывающихся исходных полос, где исходные полосы содержат первую спектральную полосу 180, дополнительную исходную полосу 302 и еще дополнительную исходную полосу 303. Дополнительно, конечными полосами выше частоты IGF или XOVER являются вторая спектральная полоса 190, дополнительная конечная полоса 305, еще дополнительная конечная полоса 307 и третья спектральная полоса 202, например.

Обычно функции отображения внутри механизма IGF или расширения полосы пропускания задают отображение между отдельными исходными полосами 180, 302, 303 и отдельными конечными полосами 305, 190, 307, 202. Это отображение может быть фиксированным, как это есть в случае 3GPP TS 26.445, или может быть адаптивно определено посредством определенного алгоритма IGF-кодера. В любом случае, Фиг. 3a иллюстрирует, в нижней таблице, отображение между конечной полосой и исходной полосой для случая неперекрывающихся конечных полос и перекрывающихся исходных полос независимо от того, является ли это отображение фиксированным или адаптивно определяемым и фактически было адаптивно определено для определенного кадра, причем спектр проиллюстрирован на верхнем участке по Фиг. 3a.

Фиг. 4 иллюстрирует более подробную реализацию компенсатора 124. Компенсатор 124 принимает, в этой реализации, в дополнение к первому результату 122 анализа, которым может быть показатель спектральной неравномерности, коэффициент амплитуды, значение наклона спектра или любой другой вид параметрических данных для первой спектральной полосы, результат анализа 123 для второй спектральной полосы. Этим результатом анализа может, снова, быть показатель спектральной неравномерности для второй спектральной полосы, коэффициент амплитуды для второй спектральной полосы или значение наклона, т.е. значение наклона спектра, ограниченное второй спектральной полосой, тогда как значение наклона или значение наклона спектра для первой спектральной полосы также ограничено для первой спектральной полосы. Дополнительно, компенсатор 124 принимает спектральную информацию по второй спектральной полосе, такую как стоп-линия второй спектральной полосы. Таким образом, в ситуации, где параметрический калькулятор 126 по Фиг. 2 сконфигурирован для параметрического кодирования третьих аудиоданных в третьей спектральной полосе 202, третья спектральная полоса содержит более высокие частоты чем вторая спектральная полоса. Это также проиллюстрировано в примере по Фиг. 3a, где третья спектральная полоса находится на более высоких частотах, чем вторая спектральная полоса, т.е. где полоса 202 имеет более высокие частоты, чем полоса 190. В этой ситуации, компенсатор 124 выполнен с возможностью использования весового значения при вычислении значения компенсации для третьей спектральной полосы, где это третье весовое значение отличается для весового значения, используемого для вычисления значения компенсации для второй спектральной полосы. Таким образом, в общем, компенсатор 124 влияет на вычисление значения 125 компенсации, так что, для одинаковых других входных значений, значение компенсации меньше для более высоких частот.

Весовое значение может, например, быть экспонентой, применяемой при вычислении значения компенсации на основе первого и второго результатов анализа, такой как экспонента α, как описано позднее, или может, например, быть мультипликативным значением или даже значением, которое должно быть добавлено или вычтено, так что для более высоких частот получают разное влияние по сравнению с влиянием, когда параметр должен быть вычислен для более низких частот.

Дополнительно, как проиллюстрировано на Фиг. 4, компенсатор принимает отношение тон-шум для второй спектральной полосы для того, чтобы вычислять значение компенсации в зависимости от отношения тон-шум вторых аудиоданных во второй спектральной полосе. Таким образом, первое значение компенсации получают для первого отношения тон-шум, или второе значение компенсации получают для второго отношения тон-шум, где первое значение компенсации больше, чем второе значение компенсации, когда первое отношение тон-шум больше, чем второе отношение тон-шум.

Как указано, компенсатор 124 в общем выполнен с возможностью определения значения компенсации посредством применения психоакустической модели, при этом психоакустическая модель выполнена с возможностью оценки психоакустического несовпадения между первыми аудиоданными и вторыми аудиоданными с использованием первого результата анализа и второго результата анализа для получения значения компенсации. Эта психоакустическая модель, оценивающая психоакустическое несовпадение, может быть реализована как вычисление с прямой связью, как рассмотрено позднее в контексте следующих SFM-вычислений, или может, в качестве альтернативы, быть модулем вычисления с обратной связью, применяющей подобие анализа посредством процедуры синтеза. Кроме того, психоакустическая модель может также быть реализована как нейронная сеть или аналогичная структура, которая автоматически обучается посредством определенных обучающих данных, чтобы решить, в каком случае необходима компенсация, а в каком случае нет.

Впоследствии, проиллюстрирована функциональность детектора 210 компенсации, проиллюстрированного на Фиг. 2, или обычно детектора, включенного в калькулятор 120 параметров.

Функциональность детектора компенсации выполнена с возможностью обнаружения ситуации компенсации, когда разница между первым результатом анализа и вторым результатом анализа имеет предварительно определенную характеристику, как проиллюстрировано, например, на этапах 600 и 602 на Фиг. 6. Блок 600 выполнен с возможностью вычисления разницы между первым и вторым результатом анализа, и блок 602 затем определяет, имеет ли разница предварительно определенную характеристику или предварительно определенное значение. Если определено, что предварительно определенной характеристики нет, то блоком 602 определяется, что компенсация не должна выполняться, как проиллюстрировано на этапе 603. Если, однако, определено, что предварительно определенная характеристика существует, то управление продолжается по линии 604. Кроме того, детектор выполнен с возможностью, в качестве альтернативы или дополнительно, определения, имеет ли второй результат анализа определенное предварительно определенное значение или определенную предварительно определенную характеристику. Если определено, что характеристика не существует, то линия 605 сигнализирует, что компенсация не должна выполняться. Если, однако, определено, что предварительно определенное значение есть, управление продолжается по линии 606. В вариантах осуществления, линии 604 и 606 могут быть достаточны для определения, есть ли компенсация ли или нет. Однако в варианте осуществления, проиллюстрированном на Фиг. 6, дополнительные определения на основе наклона спектра вторых аудиоданных для второй спектральной полосы 190 по Фиг. 1 выполняются как описано позднее.

В варианте осуществления, анализатор выполнен с возможностью вычисления показателя спектральной неравномерности, коэффициента амплитуды или соотношения показателя спектральной неравномерности и коэффициента амплитуды для первой спектральной полосы как первого результата анализа, и вычисления показателя спектральной неравномерности или коэффициента амплитуды или соотношения показателя спектральной неравномерности и коэффициента амплитуды вторых аудиоданных как второго результата анализа.

В таком варианте осуществления, калькулятор 126 параметров дополнительно выполнен с возможностью вычисления, из вторых аудиоданных, информации спектральной огибающей или коэффициента усиления.

Кроме того, в таком варианте осуществления, компенсатор 124 выполнен с возможностью вычисления значения 125 компенсации, так что, для первой разницы между первым результатом анализа и вторым результатом анализа, получают первое значение компенсации, и для разницы между первым результатом анализа и вторым результатом анализа, вычисляется второе значение компенсации, где первая разница больше, чем вторая разница, когда первое значение компенсации больше, чем второе значение компенсации.

В нижеследующем, описание по Фиг. 6 будет продолжено посредством иллюстрации опционального дополнительного определения, должна ли ситуация компенсации быть обнаружена или нет.

В блоке 608, наклон спектра вычисляется из вторых аудиоданных. Когда определено, что этот наклон спектра ниже порога, как проиллюстрировано на этапе 610, то ситуация компенсации положительно подтверждается, как проиллюстрировано на 612. Когда, однако, определено, что наклон спектра ниже предварительно определенного порога, но выше порога, то эта ситуация сигнализируется посредством линии 614. В этапе 616, определяется, находится ли тональный компонент близко к границе второй спектральной полосы 190. Когда определено, что тональный компонент находится близко к границе, как проиллюстрировано элементом 618, то ситуация компенсации снова положительно подтверждается. Однако, когда определено, что тональный компонент не существует вблизи границы, то любая компенсация отменяется, т.е. отключается, как проиллюстрировано посредством линии 620. Определение в блоке 616, т.е. определение, находится ли тональный компонент близко к границе или нет, совершается посредством выполнения, в любом варианте осуществления, вычисления сдвинутого SFM. Когда есть сильный нисходящий наклон в уклоне, который определен блоком 608, то частотная область, для которой вычисляется SFM, будет сдвинута вниз на половину ширины соответствующей полосы с масштабным коэффициентом (SFB) или второй спектральной полосы. Для сильного восходящего наклона, частотная область, для которой вычисляется SFM, сдвигается вверх на половину ширины второй спектральной полосы. Таким образом, тональные компоненты, которые должны быть демпфированы, все еще могут быть корректно обнаружены благодаря низкому SFM, тогда как для более высоких значений SFM, демпфирование применяться не будет.

Впоследствии Фиг. 5 рассматривается более подробно. В частности, калькулятор 126 параметров может содержать калькулятор 501 для вычисления нескомпенсированного параметра из аудиоданных для второй спектральной полосы, т.е. конечной полосы, и калькулятор 126 параметров дополнительно содержит блок 503 объединения для объединения нескомпенсированного параметра 502 и значения 125 компенсации. Этим объединением может быть, например, мультипликация, когда нескомпенсированный параметр 502 является значением усиления, и значение компенсации 105 является количественным значением компенсации. Однако объединение, выполняемое блоком 503 объединения, может, в качестве альтернативы, также быть операцией взвешивания с использованием значения компенсации как экспоненты или добавочной модификации, где значение компенсации используется как добавочное или вычитаемое значение.

Кроме того, следует отметить, что вариант осуществления, проиллюстрированный на Фиг. 5, где вычисляется нескомпенсированный параметр, и затем выполняется последующее объединение со значением объединения, является только вариантом осуществления. В альтернативных вариантах осуществления, значение компенсации может быть уже введено в вычисление для скомпенсированного параметра, так что любой промежуточный вариант с явным нескомпенсированным параметром не возникает. Вместо этого, выполняется только одиночная операция, где в качестве результата этой "одиночной операции", скомпенсированный параметр вычисляется с использованием значения компенсации и с использованием алгоритма вычисления, который может дать в результате нескомпенсированный параметр, когда значение 125 компенсации не будет введено в такое вычисление.

Фиг. 7 иллюстрирует процедуру, которая должна быть применена калькулятором 501 для вычисления нескомпенсированного параметра. Представление на Фиг. 7 "вычисления масштабного коэффициента IGF" грубо соответствует разделу 5.3.3.2.11.4 документа 3gpp TS 26.445 V13.3.3 (2015/12). Когда доступен "комплексный" TCX спектр мощности P (спектр, где оцениваются действительные части и мнимые части спектральных линий), то калькулятор 501 для вычисления нескомпенсированного параметра по Фиг. 5 выполняет вычисление показателя, относящегося к амплитуде, для второй спектральной полосы из спектра мощности P, как проиллюстрировано на этапе 700. Кроме того, калькулятор 501 выполняет вычисление показателя, относящегося к амплитуде, для первой спектральной полосы из комплексного спектра P, как проиллюстрировано на этапе 702. Дополнительно, калькулятор 501 выполняет вычисление показателя, относящегося к амплитуде, из действительной части первой спектральной полосы, т.е., исходной полосы, как проиллюстрировано на этапе 704, так что получают три показателя, относящихся к амплитуде, Ecplx, target, Ecplx, source, Ereal, source и вводят в дополнительную функциональность 706 вычисления коэффициента усиления, чтобы в итоге получить коэффициент усиления, являющийся функцией соотношения между Ereal, source и Ecplx, source, умноженной на Ecplx, target.

Когда, в качестве альтернативы, комплексный TCX спектр мощности недоступен, то показатель, относящийся к амплитуде, вычисляется только из действительной второй спектральной полосы, как проиллюстрировано в нижней части по Фиг. 7.

Кроме того, следует отметить, что вычисляется TCX спектр мощности P, например, как проиллюстрировано в подпункте 5.3.3.2.11.1.2 на основе нижеследующего уравнения:

P(sb)=R2(sb) +I2(sb), sb=0,1,2,…, n-1.

Здесь, n является фактической длиной TCX окна, R является вектором, содержащим часть с действительными значениями (с косинусным преобразованием) текущего TCX спектра, и I является вектором, содержащим мнимую (с синусным преобразованием) часть текучего TCX спектра. В частности, термин "TCX" относится к 3gpp терминологии, но в общем упоминает спектральные значения в первой спектральной полосе или второй спектральной полосе, которые предоставляются спектральным анализатором 130 базовому кодеру 110 или параметрическому кодеру 120 по Фиг. 1.

Фиг. 8a иллюстрирует предпочтительный вариант осуществления, где анализатор 121 сигнала дополнительно содержит базовый декодер 800 для вычисления кодированной и снова декодированной первой спектральной полосы и для вычисления, естественно, аудиоданных в кодированной/декодированной первой спектральной полосе.

Затем, базовый декодер 800 подает кодированную/декодированную первую спектральную полосу в калькулятор 801 результата анализа, включенный в анализатор сигнала 821 для вычисления первого результата 122 анализа. Кроме того, анализатор сигнала содержит второй калькулятор 802 результата анализа, включенный в анализатор 121 сигнала по Фиг. 1 для вычисления вычисляемого второго результата 123 анализа. Таким образом, анализатор 121 сигнала сконфигурирован таким образом, что фактический первый результат 122 анализа вычисляется с использованием кодированной и снова декодированной первой спектральной полосы, тогда как второй результат анализа вычисляется из первоначальной второй спектральной полосы. Таким образом, ситуация на стороне декодера лучше симулируется на стороне кодера, так как ввод в калькулятор 801 результата анализа уже имеет все ошибки квантования, включенные в декодированные первые аудиоданные для первой спектральной полосы, доступной на декодере.

Фиг. 8b иллюстрирует предпочтительную дополнительную реализацию анализатора сигнала, которая имеет, либо в качестве альтернативы для процедуры по Фиг. 8a, либо дополнительно к процедуре по Фиг. 8a, симулятор 804 патча. Симулятор 804 патча конкретно подтверждает функциональность IGF-кодера, т.е., что могут быть линии или по меньшей мере одна линии в пределах второй конечной полосы, которая фактически кодируется базовым кодером.

В частности, эта ситуация проиллюстрирована на Фиг. 3b.

Фиг. 3b иллюстрирует, аналогично Фиг. 3a, верхний участок, первую спектральную полосу 180 и вторую спектральную полосу 190. Однако, в дополнение к тому, что было рассмотрено на Фиг. 3a, вторая спектральная полоса содержит конкретные линии 351, 352, включенные в пределах второй спектральной полосы, которые были определены спектральным анализатором 130 как линии, которые дополнительно кодируются базовым кодером 110 в дополнение к первой спектральной полосе 180.

Это конкретное кодирование определенных линий выше начальной частоты 130 IGF отражает ситуацию, что базовый кодер 110 является кодером полной полосы, имеющим частоту Найквиста вплоть до fmax 354, которая выше, чем начальная частота IGF. Это отличается от реализаций, относящихся к технологии SBR, там частота разделения также является максимальной частотой и, вследствие этого, частотой Найквиста базового кодера 110.

Тестовый симулятор 804 принимает либо первую спектральную полосу 180, либо декодированную первую спектральную полосу из базового декодера 800 и, дополнительно, информацию из спектрального анализатора 130 или базового кодера 110, во второй спектральной полосе фактически есть линии, которые включены в выходной сигнал базового кодера. Это сигнализируется спектральным анализатором 130, посредством линии 806 или сигнализируется базовым кодером посредством линии 808. Симулятор 804 патча теперь симулирует первые аудиоданные для первой спектральной полосы посредством использования простых первых аудиоданных для четырех спектральных полос и посредством вставки линий 351, 352 из второй спектральной полосы в первую спектральную полосу посредством сдвига этих линий в первую спектральную полосу. Таким образом, линии 351' и 352' представляют спектральные линии, полученные посредством сдвига линий 351, 352 по Фиг. 3b из второй спектральной полосы в первую спектральную полосу. Предпочтительно, спектральные линии 351, 352 генерируются для первой спектральной полосы таким образом, что размещение этих линий в пределах границ полосы является идентичным в обеих полосах, т.е., разностная частота между линией и границей полосы идентична второй спектральной полосе 190 и первой спектральной полосе 180.

Таким образом, симулятор патча выводит симулированные данные 808, проиллюстрированные на Фиг. 3c, имеющие простые данные первой спектральной полосы и, дополнительно, имеющие линии сдвинутые из второй спектральной полосы в первую спектральную полосу. Теперь, калькулятор 801 результата анализа вычисляет первый результат 102 анализа с использованием конкретных данных 808, тогда как калькулятор 802 результата анализа вычисляет второй результат 123 анализа из первоначальных вторых аудиоданных во второй спектральной полосе, т.е., первоначальных аудиоданных, включающих в себя линии 351, 352, проиллюстрированные на Фиг. 3b.

Эта процедура с симулятором 804 патча имеет преимущество, что необязательно накладывать определенные условия на дополнительные линии 351, 352, такие как высокая тональность или что-то еще. Вместо этого, решение полностью зависит от спектрального анализатора 130 или базового кодера 110, должны ли определенные линии во второй спектральной полосе быть кодированы базовым кодером. Однако результат этой операции автоматически учитывается посредством использования этих линий как дополнительного ввода для вычисления первого результата 122 анализа, как проиллюстрировано на Фиг. 8b.

Далее проиллюстрирован эффект несовпадения тональности внутри механизма интеллектуального заполнения промежутков.

Для того, чтобы обнаружить артефакты шума полосы, должна быть определена разница в тональности между исходной и целевой полосами с масштабным коэффициентом (SFB). Для вычисления тональности может быть использован показатель спектральной неравномерности (SFM). Если обнаружено несовпадение тональности, где исходная полоса гораздо более зашумленная, чем целевая полоса, должна быть применена определенная величина демпфирования. Эта ситуация изображена на Фиг. 9 без применения патентоспособной обработки.

Также имеет смысл применить некоторое сглаживание к коэффициентам демпфирования, для того, чтобы избежать поведения с внезапным включение/отключением инструмента. Подробное описание необходимых этапов для применения демпфирования в нужных местах приводится ниже. (Следует отметить, что демпфирование будет применяться не только, если и TCX спектр мощности P доступен, и кадр является нетранзиентным (флаг isTransient неактивен).)

Обнаружение несовпадения тональности: Параметры

На первом этапе должны быть идентифицированы, те SFB, где несовпадение тональности может вызвать артефакты зашумленной полосы. Для того, чтобы так сделать, должна быть определена тональность в каждой SFB IGF-диапазона и соответствующих полосах, которые используются для копирования. Одним подходящим показателем для вычисления тональности является показатель спектральной неравномерности (SFM), который основан на делении среднего геометрического спектра на его среднее арифметическое и диапазоны между 0 и 1. Значения, близкие к 0, указывают сильную тональность, тогда как значение, приближающееся к 1, является знаком очень зашумленного спектра. Формула задана как

где P - TCX спектр мощности, b - начальная линия, и e - конечная линии текущей SFB, тогда как p задано как

Дополнительно к SFM, вычисляется коэффициент амплитуды, который также дает указание того, как энергия распределяется внутри спектра, посредством деления максимальной энергии на среднюю энергию всех элементов разрешения по частоте в спектре. Деление SFM на коэффициент амплитуды дает в результате показатель тональности SFB для текущего кадра. Коэффициент амплитуды вычисляется посредством

где P - TCX спектр мощности, b - начальная линия, и e - конечная линии текущей SFB, тогда как задано как

Однако имеет смысл также использовать результаты из предыдущих кадров для достижения сглаженной оценки тональности. Таким образом, оценка тональности осуществляется с помощью нижеследующей формулы:

где sfm обозначает результат вычисления фактического показателя спектральной неравномерности, тогда как переменная включает в себя деление на коэффициент амплитуды также как сглаживание.

Теперь вычисляется разница в тональности между источником и конечным пунктом:

Для положительных значений для этой разницы, удовлетворяется условие, что что-то, что более шумное, чем целевой спектр, используется для копирования. Такая SFB становится вероятным кандидатом для демпфирования.

Однако низкое значение SFM необязательно указывает сильную тональность, но также может из-за внезапного нисходящего наклона или восходящего наклона энергии в SFB. Это в частности применяется к элементам, где есть ограничение полосы где-то в середине SFB. Это может привести к нежелательному демпфированию, создающему впечатление сигнала слегка обработанного фильтр низких частот.

Для того, чтобы предотвратить демпфирование в таких случаях, возможно подверженные воздействию SFB определяются посредством вычисления наклона спектра энергии во всех полосах с положительным , где сильный наклон в одном направлении может указывать внезапное отбрасывание, которое вызывает низкое значение SFM. Наклон спектра вычисляется как линейная регрессия по всем спектральным элементам разрешения в SFB, при этом уклон линии регрессии задан нижеследующей формулой:

при этом x - номер элемента разрешения, P - TCX спектр мощности, b - начальная линия, и e - конечная линия текущей SFB.

Однако тональный компонент, близкий к границе SFB, может также вызвать крутой наклон, но все равно должен подвергаться демпфированию. Чтобы отделить эти два случая, для полос с крутым наклоном должно быть выполнено еще одно вычисление сдвинутого SFM.

Порог для значения уклона задан как

с делением на ширину SFB в качестве нормализации.

Если есть сильный нисходящий наклон , частотная область, для которой вычисляется SFM, будет сдвинута вниз на половину ширины SFB; для сильного восходящего наклона она сдвигается вверх. Таким образом, тональные компоненты, которые должны быть демпфированы, все еще могут быть корректно обнаружены благодаря низкому SFM, тогда как для более высоких значений SFM, демпфирование применяться не будет. Порог здесь задается как значение 0,04, где демпфирование применяется только, если сдвинутый SFM попадает ниже порога.

Модель воспринимаемого раздражающего воздействия

Демпфирование не должно применяться для любого положительного , но только имеет смысл, если целевая SFB в действительности очень тональна. Если в конкретной SFB на первоначальный сигнал наложен зашумленный фоновый сигнал, то воспринимаемая разница для даже более зашумленной полосы будет небольшой, и глухость из-за потери энергии в результате демпфирования может перевесить преимущества.

Чтобы гарантировать применение в пределах разумных границ, демпфирование должно использоваться только, если целевая SFB в действительности очень тональна. Так, демпфирование должно применяться, только когда выполняется и

и

.

Другим моментом, который должен быть рассмотрен, является фон тональных компонентов в IGF-спектре. Воспринимаемое ухудшение, вызванное артефактами зашумленной полосы, вероятно должно быть наиболее очевидно всегда, когда практически нет шумоподобного фона, окружающего первоначальный тональный компонент. В этом случае, при сравнении первоначального HF спектра с HF спектром, созданным посредством IGF, представленная зашумленная полоса будет восприниматься как что-то полностью новое и таким образом очень заметно выделяться. С другой стороны, если уже присутствует значительная величина фонового шума, то дополнительный шум смешивается с фоном, приводя к менее неприятную воспринимаемую разницу. Таким образом, величина применяемого демпфирования должна также зависеть от отношения тон-шум в подверженной воздействию SFB.

Для вычисления этого отношения тон-шум квадраты спектральных значений TCX мощности для всех элементов разрешения i в SFB суммируются и делятся на ширину SFB (заданную начальной линией b и конечной линией ), чтобы получить среднюю энергию полосы. Это среднее значение впоследствии используется для нормализации всех энергий в полосе.

Все элементы разрешения с нормализованной энергией ниже 1 затем суммируются и подсчитываются как шумовая часть , тогда как все выше порога с

подсчитывается как тональная часть Ptonal. Этот порог зависит от ширины SFB, так что меньшие полосы получают более низкий порог соответствовать более высокому среднему значению из-за большего воздействия элементов разрешения с высокой энергией из тонального компонента. Из тональной и шумовой части наконец вычисляется логарифмическое соотношение.

Демпфирование зависит как от разницы в SFM между источником и конечным пунктом, так и SFM целевой SFB, где более высокие разницы и меньший целевой SFM, оба должны привести к более сильному демпфированию. Естественно, что для большей разницы в тональности должно применяться более сильное демпфирование. Кроме того, величина демпфирования должна также увеличиваться более быстро, если целевой SFM ниже, т.е. целевая SFB более тональна. Это значит, что для чрезвычайно тональных SFB будет применяться более сильное демпфирование, чем для SFB, где SFM попадает лишь в диапазон демпфирования.

Дополнительно, демпфирование должно также применяться более умеренно для более высоких частот, так как изъятие энергии в более высоких полосах может легко привести к воспринимаемому ощущению ограничения полосы, тогда как микроструктура SFB становится менее важной из-за уменьшения чувствительности слуховой системы человека в отношении более высоких частот.

Компенсация несовпадения тональности: Вычисление коэффициента демпфирования

Чтобы включить все эти соображения в одну формулу демпфирования, соотношение между целевым и исходным SFM принимается за основу формулы. Таким образом, как большая абсолютная разница в SFM, так и меньшее значение целевого SFM приведут к более сильному демпфированию, что является более подходящим, чем просто взять разницу. Также, чтобы добавить зависимости от частоты и отношения тон-шум, к этому отношению применяются параметры регулирования. Таким образом, формула демпфирования может быть записана как

где d - коэффициент демпфирования, который будет перемножен с масштабным коэффициентом, и α и β - параметры регулирования демпфирования, которые вычисляются как

где e - конечная линия текущей SFB и

где adap зависит от ширины SFB, вычисляемой посредством

Параметр α уменьшается с частотой, для того, чтобы применить меньшее демпфирование для более высоких частот, тогда как β используется, чтобы дополнительно уменьшить силу демпфирования, если отношение тон-шум для SFB, которая должна быть демпфирована, падает ниже порога. Чем больше оно падает ниже этого порога, тем больше уменьшается демпфирование.

Так как демпфирование активируется только при определенных ограничениях, необходимо применить сглаживание, для того, чтобы предотвратить внезапные переходы включения/выключения. Чтобы это реализовать, активны несколько механизмов сглаживания.

Сразу после транзиента, базовый переключатель на TCX или демпфирование недемпфированного предыдущего кадра применяется только постепенно с полной силой, чтобы избежать чрезмерных просадок энергии после транзиентов с высокой энергией. Кроме того, чтобы также учитывать результаты предыдущих кадров используется коэффициент забывания в виде IIR-фильтра.

Все способы сглаживания содержатся в нижеследующей формуле:

где - коэффициент демпфирования предыдущего кадра. Если демпфирование было неактивно в предыдущем кадре, перезаписывается с помощью , но ограничивается до минимума в 0,1. Сглаживание переменной является дополнительным коэффициентом сглаживания, который будет задан в значение 2 во время транзиентных кадров (флаг isTransient активен) или после базовых переключателей (флаг isCelpToTCX активен), на 1, если в предыдущем кадре демпфирование было неактивно. В каждом кадре с демпфированием переменная будет уменьшена на 1, но может не падать ниже 0.

На последнем этапе, коэффициент демпфирования d умножается на усиление масштабирования g:

Фиг. 10 иллюстрирует предпочтительную реализацию настоящего изобретения.

Аудиосигнал, например, который выводится спектральным анализатором 130, доступен как MDCT-спектр или даже комплексный спектр, как указано с помощью (c) слева по Фиг. 10.

Анализатор 121 сигнала реализован посредством детекторов 801 и 802 тональности на Фиг. 10 для обнаружения тональности целевого контента блоком 802 и для обнаружения тональности (симулированного) исходного контента у элемента 801.

Затем выполняется вычисление 124 коэффициента демпфирования для получения значения компенсации, и затем, компенсатор 503 оперирует данными, полученными от элемента 501, 700-706. Элемент 501 и элемент 700-706 отражают оценку огибающей из целевого контента и оценку огибающей из симулированного исходного контента, и последующее вычисление масштабного коэффициента который, например, проиллюстрирован на Фиг. 7 у элемента 700-706.

Таким образом, нескомпенсированный масштабный вектор вводится в блок 503 как значение 502 по аналогии с тем, как было рассмотрено в контексте Фиг. 5. Кроме того, модель 1000 шума проиллюстрирована на Фиг. 10 как отдельный строительный блок, хотя тоже самое также может быть непосредственно включено в калькулятор 124 коэффициента демпфирования, как было рассмотрено в контексте Фиг. 4.

Кроме того, параметрический IGF-кодер на Фиг. 10, дополнительно содержащий оценщик отбеливания, сконфигурирован для вычисления уровней отбеливания, как рассмотрено, например, в пункте 5.3.3.2.11.6.4 документа "Coding of IGF whitening levels". В частности, уровни IGF-отбеливания вычисляются и передаются с использованием одного или двух битов на мозаичный элемент. Эти данные также вносятся в мультиплексор 140 битового потока, для того, чтобы в итоге получить полные параметрические IGF-данные.

Кроме того, дополнительно предоставляется блок "проредить спектр", который может соответствовать блоку 130 в отношении определения спектральных линий, которые должны быть кодированы базовым кодером 110, и иллюстрируется как отдельный блок 1020 на Фиг. 10. Эта информация предпочтительно используется компенсатором 503, для того, чтобы отразить конкретную ситуацию IGF.

Кроме того, термин "симулированный" слева от блока 801 и блок "оценки огибающей" на Фиг. 10 отражают ситуацию, проиллюстрированную на Фиг. 8a, где "симулированным исходным контентом" являются кодированные и снова декодированные аудиоданные в первой спектральной полосе.

В качестве альтернативы, "симулированный" исходный контент является данными, полученными симулятором 804 патча из первоначальных первых аудиоданных в первой спектральной полосе, как указано линией 180, или является декодированной первой спектральной полосой, которая получена базовым декодером 800 с добавлением линий, сдвинутых из второй спектральной полосы в первую спектральную полосу.

В дальнейшем, проиллюстрирован дополнительный вариант осуществления данного изобретения, составляющий измененную версию кодека 3gpp TS 26.445. В нижеследующем предоставлен заново добавленный текст, указывающую патентоспособную обработку. Здесь, сделано явное указание на определенные подпункты, уже содержащиеся в спецификации 3gpp TS 26.445.

5.3.3.2.11.1.9 Функция наклона спектра SLOPE

Пусть будет TCX спектром мощности, который вычисляется согласно подпункту 5.3.3.2.11.1.2, и b - начальная линия, и e - конечная линия диапазона измерения наклона спектра.

Функция SLOPE, применяемая с IGF, задается с помощью:

SLOPE:

где n является фактической длиной TCX окна, и x - номер элемента разрешения.

5.3.3.2.11.1.10. Функция отношения тон-шум TNR

Пусть будет TCX спектром мощности, который вычисляется согласно подпункту 5.3.3.2.11.1.2, и b - начальная линия, и e - конечная линия диапазона измерения отношения тон-шум.

Функция TNR, применяемая с IGF, задается с помощью:

TNR:

где n является фактической длиной TCX окна, задано с помощью

и adap задано с помощью

Демпфирование:

Для вычисления 6 IGF коэффициента демпфирования, статические массивы (prevTargetFIR, prevSrcFIR, prevTargetIIR и prevSrcIIR для вычисления SFM в целевом и исходном диапазоне, также как prevDamp и dampSmooth), все с размером nB, должны удерживать состояния фильтра на протяжении кадров. Дополнительно статический флаг wasTransient нужен, чтобы сохранить информацию входного флага isTransient из предыдущего кадра.

Сброс состояний фильтра

Все векторы prevTargetFIR, prevSrcFIR, prevTargetIIR, prevSrcIIR, и prevDamp и dampSmooth являются статическими массивами с размером nB в IGF-модуле и инициализируются, как следует ниже:

для

Эта инициализация должна быть совершена

- При запуске кодека

- При любом переключении скорости передачи битов

- При любом переключении типа кодека

- При переходе с CELP на TCX, например, isCelpToTCX=true

- Если текущий кадр имеет транзиентные свойства, например isTransient=true

- если TCX спектр мощности P недоступен

Вычисление коэффициента демпфирования

Если TCX спектр мощности P доступен и isTransient имеет значение false, вычисляют

и

где уже должно быть отображено с помощью функции tF, см. подпункт 5.3.3.2.11.1.1, является функцией отображения, которая отображает целевой диапазон IGF в исходный диапазон IGF, описанный в подпункте 5.3.3.2.11.1.8, и nB является числом полос с масштабными коэффициентами, см. таблицу 94. SFM является функцией измерения спектральной неравномерности, описанной в подпункте 5.3.3.2.11.1.3, и CREST является функцией коэффициента амплитуды, описанной в подпункте 5.3.3.2.11.1.4.

Если isCelpToTCX - true, или wasTransient - true, задают

для

Вычисляют:

и

С помощью этих векторов вычисляют:

Если для

или

задают

иначе, вычисляют наклон спектра с помощью функции SLOPE, описанной в подпункте 5.3.3.2.11.1.9:

Если для

или иначе, если

где threshTilt задается как

вычисляют SFM на спектре со сдвигом:

при этом сдвиг задан как

если

задают

Если для

задают коэффициент демпфирования текущего кадра dampCurr в значение ноль в полосе k:

Иначе, вычисляют как следует ниже:

где alpha задано как

и beta задано как

где TNR - функция отношения тон-шум, как описано в подпункте 5.3.3.2.11.1.10, и adap задано как

Если для

задают

Вычисляют вектор коэффициентов демпфирования d с размером nB:

Наконец, если isTransient имеет значение false, и спектр мощности P доступен, обновляют фильтры

для

Названия значений/индексов/параметров в предыдущем абзаце аналогичны соответствующим параметрам/индексам/значениям, которые были рассмотрены во всем этом описании. В дальнейшем, несколько результатов из тестов прослушивания рассматриваются в контексте Фиг. 11a - 11c.

Были проведены тесты прослушивания, показывающие пользу демпфирования, если сравнивать элементы, которые были кодированы с активированным демпфированием, с элементами, которые были кодированы без этого.

Первым результатом, проиллюстрированным на Фиг. 11a, является A-B тест сравнения со скоростью передачи битов 13,2 кбит/с и частотой дискретизации 32 кГц с использованием моноэлементов. На Фиг. 11a показаны результаты, показывающие демпфирование c A-B тестом против без демпфирования со скоростью передачи битов 13,2 кбит/с.

Вторым результатом, проиллюстрированным на Фиг. 11b, был MUSHRA-тест со скоростью передачи битов 24,4 кбит/с и частотой дискретизации 32 кГц с использованием моноэлементов. Здесь, две версии без демпфирования сравнивались с новой версией с демпфированием. Результаты показаны на Фиг. 11b (абсолютные баллы) и Фиг. 11c (разностные баллы).

Патентоспособный кодированный аудиосигнал может быть сохранен в цифровой среде хранения или постоянной среде хранения или может быть передан в среде передачи, такой как среда беспроводной передачи или среда проводной передачи, такой как Интернет.

Хотя некоторые аспекты были описаны в контексте устройства, ясно, что эти аспекты также представляют описание соответствующего способа, где блок или устройство соответствует этапу способа или признаку этапа способа. Аналогично, аспекты, описанные в контексте этапа способа, также представляют описание соответствующего блока или элемента или признака соответствующего устройства.

В зависимости от определенных требований реализации, варианты осуществления данного изобретения могут быть реализованы в аппаратных средствах или программном обеспечении. Данная реализация может быть выполнена с цифрового носителя информации, например, floppy-диска, DVD, CD, ROM, PROM, EPROM, EEPROM или flash-памяти, имеющего электронно считываемые сигналы управления, хранящиеся на нем, которые взаимодействуют (или способны взаимодействовать) с программируемой компьютерной системой, так чтобы выполнялся соответствующий способ.

Некоторые варианты осуществления согласно данному изобретению содержат носитель данных, имеющий электронно считываемые сигналы управления, которые способны взаимодействовать с программируемой компьютерной системой, так чтобы выполнялся один из способов, описанных в настоящем документе.

В общем, варианты осуществления настоящего изобретения могут быть реализованы как компьютерный программный продукт с программным кодом, причем программным кодом, действующим для выполнения одного из способов, когда компьютерный программный продукт выполняется на компьютере. Программный код может, например, храниться на машиночитаемом носителе.

Другие варианты осуществления содержат компьютерную программу для выполнения одного из способов, описанных в настоящем документе, хранящихся на машиночитаемом носителе или в некратковременном носителе информации.

Другими словами, вариант осуществления патентоспособного способа, вследствие этого, является компьютерной программой, имеющей программный код для выполнения одного из способов, описанных в настоящем документе, когда компьютерная программа выполняется на компьютере.

Дополнительный вариант осуществления патентоспособных способов, вследствие этого, является носителем данных (или цифровым носителем информации или компьютерно-читаемым носителем), содержащим, записанную на нем, компьютерную программу для выполнения одного из способов, описанных в настоящем документе.

Дополнительный вариант осуществления патентоспособного способа, вследствие этого, является потоком данных или последовательностью сигналов, представляющих собой компьютерную программу для выполнения одного из способов, описанных в настоящем документе. Поток данных или последовательность сигналов могут, например, быть выполнены с возможностью пересылки посредством соединения связи, например, через Интернет.

Дополнительный вариант осуществления содержит средство обработки, например, компьютер, или программируемое логическое устройство, выполненное с возможностью или адаптированное для выполнения одного из способов, описанных в настоящем документе.

Дополнительный вариант осуществления содержит компьютер, имеющий установленную на нем компьютерную программу для выполнения одного из способов, описанных в настоящем документе.

В некоторых вариантах осуществления, программируемое логическое устройство (например, программируемая пользователем вентильная матрица) может быть использовано для выполнения некоторых или всех функциональных возможностей способов, описанных в настоящем документе. В некоторых вариантах осуществления, программируемая пользователем вентильная матрица может взаимодействовать с микропроцессором для выполнения одного из способов, описанных в настоящем документе. В общем, способы предпочтительно выполняются любым аппаратным устройством.

Вышеописанные варианты осуществления являются лишь иллюстративными для принципов настоящего изобретения. Следует понимать, что модификации и вариации данных компоновок и сведений, описанных в настоящем документе, будут понятны специалистам в данной области техники. Вследствие этого, они должны быть ограничены только объемом предстоящей формулы изобретения, а не конкретными сведениями, представленными с целью описания и разъяснения вариантов осуществления в настоящем документе.

Похожие патенты RU2727728C1

название год авторы номер документа
КОДЕР И ДЕКОДЕР АУДИОСИГНАЛА, ИСПОЛЬЗУЮЩИЕ ПРОЦЕССОР ЧАСТОТНОЙ ОБЛАСТИ С ЗАПОЛНЕНИЕМ ПРОМЕЖУТКА В ПОЛНОЙ ПОЛОСЕ И ПРОЦЕССОР ВРЕМЕННОЙ ОБЛАСТИ 2015
  • Диш Саша
  • Дитц Мартин
  • Мультрус Маркус
  • Фукс Гийом
  • Равелли Эммануэль
  • Нойзингер Маттиас
  • Шнелль Маркус
  • Шуберт Беньямин
  • Грилл Бернхард
RU2671997C2
КОДЕР И ДЕКОДЕР АУДИОСИГНАЛА, ИСПОЛЬЗУЮЩИЕ ПРОЦЕССОР ЧАСТОТНОЙ ОБЛАСТИ, ПРОЦЕССОР ВРЕМЕННОЙ ОБЛАСТИ И КРОССПРОЦЕССОР ДЛЯ НЕПРЕРЫВНОЙ ИНИЦИАЛИЗАЦИИ 2015
  • Диш Саша
  • Дитц Мартин
  • Мультрус Маркус
  • Фукс Гийом
  • Равелли Эммануэль
  • Нойзингер Маттиас
  • Шнелль Маркус
  • Шуберт Беньямин
  • Грилл Бернхард
RU2668397C2
УСТРОЙСТВО, СПОСОБ И КОМПЬЮТЕРНАЯ ПРОГРАММА ДЛЯ ДЕКОДИРОВАНИЯ КОДИРОВАННОГО АУДИОСИГНАЛА 2014
  • Диш Саша
  • Гайгер Ральф
  • Хельмрих Кристиан
  • Нагель Фредерик
  • Нойкам Кристиан
  • Шмидт Константин
  • Фишер Михаэль
RU2651229C2
АУДИОКОДЕР, АУДИОДЕКОДЕР И СВЯЗАННЫЕ СПОСОБЫ С ИСПОЛЬЗОВАНИЕМ ДВУХКАНАЛЬНОЙ ОБРАБОТКИ В ИНФРАСТРУКТУРЕ ИНТЕЛЛЕКТУАЛЬНОГО ЗАПОЛНЕНИЯ ИНТЕРВАЛОВ ОТСУТСТВИЯ СИГНАЛА 2014
  • Диш Саша
  • Нагель Фредерик
  • Гайгер Ральф
  • Тхошкахна Баладжи Нагендран
  • Шмидт Константин
  • Байер Штефан
  • Нойкам Кристиан
  • Эдлер Бернд
  • Хельмрих Кристиан
RU2646316C2
УСТРОЙСТВО И СПОСОБ ДЛЯ КОДИРОВАНИЯ ИЛИ ДЕКОДИРОВАНИЯ ЗВУКОВОГО СИГНАЛА С ИНТЕЛЛЕКТУАЛЬНЫМ ЗАПОЛНЕНИЕМ ИНТЕРВАЛОВ В СПЕКТРАЛЬНОЙ ОБЛАСТИ 2014
  • Диш Саша
  • Нагель Фредерик
  • Гайгер Ральф
  • Тхошкахна Баладжи Нагендран
  • Шмидт Константин
  • Байер Штефан
  • Нойкам Кристиан
  • Эдлер Бернд
  • Хельмрих Кристиан
RU2635890C2
УСТРОЙСТВО И СПОСОБ ДЛЯ ДЕКОДИРОВАНИЯ И КОДИРОВАНИЯ АУДИОСИГНАЛА С ИСПОЛЬЗОВАНИЕМ АДАПТИВНОГО ВЫБОРА СПЕКТРАЛЬНЫХ ФРАГМЕНТОВ 2014
  • Нойкам Кристиан
  • Диш Саша
  • Нагель Фредерик
  • Нидермайер Андреас
  • Шмидт Константин
  • Тхошкахна Баладжи Нагендран
RU2643641C2
УСТРОЙСТВО И СПОСОБ ДЛЯ ДЕКОДИРОВАНИЯ ИЛИ КОДИРОВАНИЯ ЗВУКОВОГО СИГНАЛА С ИСПОЛЬЗОВАНИЕМ ЗНАЧЕНИЙ ИНФОРМАЦИИ ЭНЕРГИИ ДЛЯ ПОЛОСЫ ЧАСТОТ ВОССТАНОВЛЕНИЯ 2014
  • Нидермайер, Андреас
  • Эртель, Христиан
  • Гайгер, Ральф
  • Гидо, Флорин
  • Хельмрих, Кристиан
RU2649940C2
УСТРОЙСТВО И СПОСОБ ДЛЯ ДЕКОДИРОВАНИЯ КОДИРОВАННОГО АУДИОСИГНАЛА С ИСПОЛЬЗОВАНИЕМ ФИЛЬТРА РАЗДЕЛЕНИЯ ВОКРУГ ЧАСТОТЫ ПЕРЕХОДА 2014
  • Диш Саша
  • Гайгер Ральф
  • Хельмрих Кристиан
  • Нагель Фредерик
  • Нойкам Кристиан
  • Шмидт Константин
  • Фишер Михаэль
RU2640634C2
УСТРОЙСТВО И СПОСОБ ДЛЯ КОДИРОВАНИЯ И ДЕКОДИРОВАНИЯ КОДИРОВАННОГО АУДИОСИГНАЛА С ИСПОЛЬЗОВАНИЕМ ВРЕМЕННОГО ФОРМИРОВАНИЯ ШУМА/НАЛОЖЕНИЙ 2014
  • Диш Саша
  • Нагель Фредерик
  • Гайгер Ральф
  • Тхошкахна Баладжи Нагендран
  • Шмидт Константин
  • Байер Штефан
  • Нойкам Кристиан
  • Эдлер Бернд
  • Хельмрих Кристиан
RU2607263C2
УСТРОЙСТВО И СПОСОБ ФОРМИРОВАНИЯ РАСШИРЕННОГО СИГНАЛА С ИСПОЛЬЗОВАНИЕМ ЗАПОЛНЕНИЯ НЕЗАВИСИМЫМ ШУМОМ 2015
  • Диш Саша
  • Гайгер Ральф
  • Нидермайер Андреас
  • Нойзингер Маттиас
  • Шмидт Константин
  • Вильде Штефан
  • Шуберт Беньямин
  • Нойкам Кристиан
RU2665913C2

Иллюстрации к изобретению RU 2 727 728 C1

Реферат патента 2020 года УСТРОЙСТВО И СПОСОБ КОДИРОВАНИЯ АУДИОСИГНАЛА С ИСПОЛЬЗОВАНИЕМ ЗНАЧЕНИЯ КОМПЕНСАЦИИ

Изобретение для кодирования аудиосигналов. Технический результат заключается в повышении эффективности кодирования. Осуществляют базовое кодирование первых аудиоданных в первой спектральной полосе. Осуществляют параметрическое кодирование вторых аудиоданных во второй спектральной полосе, отличающейся от первой спектральной полосы. Анализируют первые аудиоданные в первой спектральной полосе для получения первого результата анализа и анализируют вторые аудиоданные во второй спектральной полосе для получения второго результата анализа. Вычисляют значение компенсации с использованием первого результата анализа и второго результата анализа. Вычисляют параметр из вторых аудиоданных во второй спектральной полосе с использованием значения компенсации. Параметрически кодируют третьи аудиоданные в третьей спектральной полосе. Анализируют третьи аудиоданные в третьей спектральной полосе для получения третьего результата анализа. Обнаруживают, с использованием по меньшей мере третьего результата анализа, должна ли третья спектральная полоса быть скомпенсирована или нет. Вычисляют дополнительный параметр из третьих аудиоданных в третьей спектральной полосе без какого-либо значения компенсации, когда на этапе обнаружения обнаруживают, что третья спектральная полоса не должна быть скомпенсирована. 6 н. и 20 з.п. ф-лы, 16 ил.

Формула изобретения RU 2 727 728 C1

1. Устройство для кодирования аудиосигнала, содержащее:

базовый кодер для базового кодирования первых аудиоданных в первой спектральной полосе;

параметрический кодер для параметрического кодирования вторых аудиоданных во второй спектральной полосе, отличающейся от первой спектральной полосы, при этом параметрический кодер содержит:

анализатор для анализа первых аудиоданных в первой спектральной полосе для получения первого результата анализа и для анализа вторых аудиоданных во второй спектральной полосе для получения второго результата анализа;

компенсатор для вычисления значения компенсации с использованием первого результата анализа и второго результата анализа; и

калькулятор параметров для вычисления параметра из вторых аудиоданных во второй спектральной полосе с использованием значения компенсации,

при этом параметрический кодер сконфигурирован для параметрического кодирования третьих аудиоданных в третьей спектральной полосе;

при этом анализатор сконфигурирован для анализа третьих аудиоданных в третьей спектральной полосе для получения третьего результата анализа;

при этом параметрический кодер дополнительно содержит детектор компенсации для обнаружения, с использованием по меньшей мере третьего результата анализа, должна ли третья спектральная полоса быть скомпенсирована или нет, и

при этом калькулятор параметров выполнен с возможностью вычисления дополнительного параметра из третьих аудиоданных в третьей спектральной полосе без какого-либо значения компенсации, когда детектор компенсации обнаруживает, что третья спектральная полоса не должна быть скомпенсирована.

2. Устройство по п. 1,

при этом первым результатом анализа является первое количественное значение, и вторым результатом анализа является второе количественное значение,

при этом значением компенсации является количественное значение компенсации, получаемое из упомянутого первого количественного значения и из упомянутого второго количественного значения, и

при этом параметром является количественный параметр, вычисляемый калькулятором параметров с использованием количественного значения компенсации.

3. Устройство по п. 1,

при этом анализатор выполнен с возможностью анализа первой характеристики первых аудиоданных для получения первого результата анализа, и анализа той же первой характеристики вторых аудиоданных во второй спектральной полосе для получения второго результата анализа, и

при этом калькулятор параметров сконфигурирован для вычисления параметра из вторых аудиоданных во второй спектральной полосе посредством оценки второй характеристики, причем вторая характеристика отличается от первой характеристики.

4. Устройство по п. 3,

при этом первой характеристикой является характеристика тонкой структуры спектра или характеристика распределения энергии в пределах первой спектральной полосы, или

при этом второй характеристикой является показатель огибающей или показатель, относящийся к энергии, или показатель, относящийся к мощности, спектральных значений в пределах второй спектральной полосы.

5. Устройство по п. 1,

при этом первая спектральная полоса и вторая спектральная полоса взаимно исключают друг друга,

при этом анализатор выполнен с возможностью вычисления первого результата анализа без использования вторых аудиоданных во второй спектральной полосе, и вычисления второго результата анализа без использования первых аудиоданных в первой спектральной полосе.

6. Устройство по п. 1,

при этом аудиосигнал содержит временную последовательность кадров,

при этом компенсатор выполнен с возможностью вычисления текущего значения компенсации для текущего кадра с использованием предыдущего значения компенсации для предыдущего кадра.

7. Устройство по п. 1,

при этом параметрический кодер сконфигурирован для параметрического кодирования третьих аудиоданных в третьей спектральной полосе,

при этом третья спектральная полоса содержит более высокие частоты, чем вторая спектральная полоса, и

при этом компенсатор выполнен с возможностью использования третьего весового значения при вычислении значения компенсации для третьей спектральной полосы,

при этом третье весовое значение отличается от второго весового значения, используемого для вычисления значения компенсации для второй спектральной полосы.

8. Устройство по п. 1,

при этом анализатор выполнен с возможностью дополнительного вычисления отношения тон-шум вторых аудиоданных во второй спектральной полосе, и

при этом компенсатор выполнен с возможностью вычисления значения компенсации в зависимости от отношения тон-шум вторых аудиоданных, так что первое значение компенсации получается для первого отношения тон-шум, или второе значение компенсации получается для второго отношения тон-шум, причем первое значение компенсации больше, чем второе значение компенсации, и первое отношение тон-шум больше, чем второе отношение тон-шум.

9. Устройство по п. 1, при этом калькулятор параметров сконфигурирован для вычисления нескомпенсированного параметра из вторых аудиоданных и для объединения нескомпенсированного параметра и значения компенсации для получения параметра.

10. Устройство по п. 1,

дополнительно содержащее выходной интерфейс для вывода кодируемых базовым кодером аудиоданных в первой спектральной полосе и параметра.

11. Устройство по п. 1,

при этом компенсатор выполнен с возможностью определения значения компенсации посредством применения психоакустической модели, при этом психоакустическая модель выполнена с возможностью оценки психоакустического несовпадения между первыми аудиоданными и вторыми аудиоданными с использованием первого результата анализа и второго результата анализа для получения значения компенсации.

12. Устройство по п. 1,

при этом аудиосигнал содержит временную последовательность кадров, и

при этом анализатор сконфигурирован для анализа первых аудиоданных в первой спектральной полосе кадра для получения первого результата анализа и для анализа вторых аудиоданных кадра во второй спектральной полосе для получения второго результата анализа для кадра, при этом компенсатор сконфигурирован для вычисления значения компенсации для кадра с использованием первого результата анализа для кадра и второго результата анализа для кадра; и при этом калькулятор параметров сконфигурирован для вычисления параметра из вторых аудиоданных во второй спектральной полосе кадра с использованием значения компенсации для кадра, или

при этом параметрический кодер дополнительно содержит: детектор компенсации для обнаружения, на основе первого результата анализа и второго результата анализа, должен ли параметр для второй спектральной полосы кадра быть вычислен с использованием значения компенсации либо в ситуации компенсации, либо в ситуации без компенсации.

13. Устройство по п. 1,

при этом детектор компенсации выполнен с возможностью обнаружения ситуации компенсации, когда разница между первым результатом анализа и вторым результатом анализа имеет предварительно определенную характеристику, или когда второй результат анализа имеет предварительно определенную характеристику,

при этом детектор компенсации выполнен с возможностью обнаружения, что спектральная полоса не должна быть скомпенсирована, когда спектр мощности недоступен для аудиокодера, или когда обнаружено, что текущий кадр является транзиентным кадром, или

при этом компенсатор выполнен с возможностью вычисления значения компенсации на основе соотношения первого результата анализа и второго результата анализа.

14. Устройство по п. 1,

при этом анализатор выполнен с возможностью вычисления показателя спектральной неравномерности, коэффициента амплитуды или соотношения показателя спектральной неравномерности и коэффициента амплитуды для первой спектральной полосы в качестве первого результата анализа, и вычисления показателя спектральной неравномерности или коэффициента амплитуды или соотношения показателя спектральной неравномерности и коэффициента амплитуды для второй спектральной полосы в качестве второго результата анализа, или

при этом калькулятор параметров выполнен с возможностью вычисления, из вторых аудиоданных, информации спектральной огибающей или коэффициента усиления, или

при этом компенсатор выполнен с возможностью вычисления значения компенсации, так что для первой разницы между первым результатом анализа и вторым результатом анализа получается первое значение компенсации, и для второй разницы между первым результатом анализа и вторым результатом анализа вычисляется второе значение компенсации, при этом первая разница больше, чем вторая разница, и при этом первое значение компенсации больше, чем второе значение компенсации.

15. Устройство по п. 14,

при этом анализатор выполнен с возможностью вычисления наклона спектра из вторых аудиоданных,

при этом анализатор выполнен с возможностью проверки, находится ли тональный компонент близко к границе второй спектральной полосы, и

при этом детектор компенсации параметрического кодера выполнен с возможностью определения, что параметр должен быть вычислен с использованием значения компенсации, только когда наклон спектра ниже предварительно определенного порога, или, когда наклон спектра выше предварительно определенного порога, и проверка определила, что существует тональный компонент, близкий к границе.

16. Устройство по п. 1, дополнительно содержащее:

декодер для декодирования кодированных первых аудиоданных в первой спектральной полосе для получения кодированных и декодированных первых аудиоданных,

при этом анализатор выполнен с возможностью вычисления первого результата анализа с использованием кодированных и декодированных первых аудиоданных, и

вычисления второго результата анализа из вторых аудиоданных из аудиосигнала, введенного в данное устройство для кодирования.

17. Устройство по п. 1, дополнительно содержащее:

симулятор патча для симуляции результата патчирования для второй спектральной полосы, причем результат патчирования содержит по меньшей мере одну спектральную линию из второй спектральной полосы, включенной в аудиосигнал, кодированный базовым кодером;

при этом анализатор выполнен с возможностью вычисления первого результата анализа с использованием первых аудиоданных и по меньшей мере одной спектральной линии из второй спектральной полосы; и

вычисления второго результата анализа из вторых аудиоданных из аудиосигнала, введенного в устройство для кодирования.

18. Устройство по п. 1,

при этом базовый кодер выполнен с возможностью кодирования первых аудиоданных в последовательности спектров с действительными значениями,

при этом анализатор выполнен с возможностью вычисления первого и второго результата анализа из последовательности спектров мощности,

при этом спектр мощности вычисляется из аудиосигнала, введенного в устройство для кодирования, или получается из спектра с действительными значениями, используемого базовым кодером.

19. Устройство по п. 1,

при этом базовый кодер выполнен с возможностью базового кодирования аудиосигнала по меньшей мере в базовой полосе, продолжающейся до начальной частоты улучшения,

при этом базовая полоса содержит первую спектральную полосу и по меньшей мере одну дополнительную исходную полосу, перекрывающуюся с первой спектральной полосой,

при этом аудиосигнал содержит диапазон улучшения, продолжающийся от начальной частоты улучшения до максимальной частоты, при этом вторая спектральная полоса и по меньшей мере одна дополнительная целевая полоса включены в диапазон улучшения, при этом вторая спектральная полоса и дополнительная целевая полоса не перекрывают друг друга.

20. Устройство по п. 19,

при этом начальная частота улучшения является частотой разделения, и сигнал, кодированный базовым кодером, ограничен по полосе до частоты разделения, или

при этом начальная частота улучшения является начальной частотой интеллектуального заполнения промежутков, и сигнал, кодированный базовым кодером, ограничен по полосе до максимальной частоты, которая больше, чем начальная частота улучшения.

21. Устройство по п. 1,

при этом калькулятор параметров выполнен с возможностью

вычисления коэффициента усиления для второй спектральной полосы на основе вторых аудиоданных во второй спектральной полосе,

вычисления коэффициента демпфирования как значения компенсации, и

умножения коэффициента усиления для полосы на коэффициент демпфирования для получения скомпенсированного коэффициента усиления как параметра, и

при этом устройство дополнительно содержит выходной интерфейс для вывода аудиоданных, кодированных базовым кодером, в первой спектральной полосе и скомпенсированного коэффициента усиления как параметра.

22. Способ кодирования аудиосигнала, содержащий этапы, на которых:

осуществляют базовое кодирование первых аудиоданных в первой спектральной полосе;

осуществляют параметрическое кодирование вторых аудиоданных во второй спектральной полосе, отличающейся от первой спектральной полосы, при этом параметрическое кодирование содержит этапы, на которых:

анализируют первые аудиоданные в первой спектральной полосе для получения первого результата анализа и анализируют вторые аудиоданные во второй спектральной полосе для получения второго результата анализа;

вычисляют значение компенсации с использованием первого результата анализа и второго результата анализа; и

вычисляют параметр из вторых аудиоданных во второй спектральной полосе с использованием значения компенсации,

параметрически кодируют третьи аудиоданные в третьей спектральной полосе;

анализируют третьи аудиоданные в третьей спектральной полосе для получения третьего результата анализа;

обнаруживают, с использованием по меньшей мере третьего результата анализа, должна ли третья спектральная полоса быть скомпенсирована или нет; и

вычисляют дополнительный параметр из третьих аудиоданных в третьей спектральной полосе без какого-либо значения компенсации, когда на этапе обнаружения обнаруживают, что третья спектральная полоса не должна быть скомпенсирована.

23. Система для обработки аудиосигнала, содержащая:

устройство для кодирования аудиосигнала по любому из пп. 1-21; и

декодер для приема кодированного аудиосигнала, содержащего кодированные первые аудиоданные в первой спектральной полосе, и параметра, представляющего вторые аудиоданные во второй спектральной полосе,

при этом декодер сконфигурирован для выполнения операции спектрального улучшения для того, чтобы регенерировать синтезированные аудиоданные для второй спектральной полосы с использованием параметра и декодированных первых аудиоданных в первой спектральной полосе.

24. Способ обработки аудиосигнала, содержащий этапы на которых:

кодируют аудиосигнал в соответствии с п. 22; и

принимают кодированный аудиосигнал, содержащий кодированные первые аудиоданные в первой спектральной полосе, и параметр, представляющий вторые аудиоданные во второй спектральной полосе; и

выполняют операцию спектрального улучшения для того, чтобы регенерировать синтезированные аудиоданные для второй спектральной полосы с использованием параметра и декодированных первых аудиоданных в первой спектральной полосе.

25. Компьютерно-читаемый носитель, содержащий сохраненный на нем компьютерно-читаемый код для выполнения способа по п. 22, когда компьютерно-читаемый код исполняется компьютером.

26. Компьютерно-читаемый носитель, содержащий сохраненный на нем компьютерно-читаемый код для выполнения способа по п. 24, когда компьютерно-читаемый код исполняется компьютером.

Документы, цитированные в отчете о поиске Патент 2020 года RU2727728C1

Токарный резец 1924
  • Г. Клопшток
SU2016A1
Приспособление для суммирования отрезков прямых линий 1923
  • Иванцов Г.П.
SU2010A1
Способ защиты переносных электрических установок от опасностей, связанных с заземлением одной из фаз 1924
  • Подольский Л.П.
SU2014A1
Способ защиты переносных электрических установок от опасностей, связанных с заземлением одной из фаз 1924
  • Подольский Л.П.
SU2014A1
US 8751225 B2, 10.06.2014
Многоступенчатая активно-реактивная турбина 1924
  • Ф. Лезель
SU2013A1
US 8073050 B2, 06.12.2011
УСТРОЙСТВО И СПОСОБ ОБРАБОТКИ ПЕРЕХОДНЫХ ПРОЦЕССОВ ДЛЯ АУДИО СИГНАЛОВ С ИЗМЕНЕНИЕМ СКОРОСТИ ВОСПРОИЗВЕДЕНИЯ ИЛИ ВЫСОТЫ ТОНА 2011
  • Диш Саша
  • Нагел Фредерик
  • Вилде Стефан
RU2591012C2

RU 2 727 728 C1

Авторы

Диш, Саша

Ройтельхубер, Франц

Бютэ, Ян

Мультрус, Маркус

Эдлер, Бернд

Даты

2020-07-23Публикация

2017-08-21Подача