КОДЕР РАСШИРЕНИЯ ПОЛОСЫ ПРОПУСКАНИЯ, ДЕКОДЕР РАСШИРЕНИЯ ПОЛОСЫ ПРОПУСКАНИЯ И ФАЗОВЫЙ ВОКОДЕР Российский патент 2015 года по МПК G10L19/02 

Описание патента на изобретение RU2563164C2

Заявляемое изобретение относится к цифровой обработке аудиосигнала, в частности, к кодеру расширения полосы пропускания, способу кодирования звукового сигнала, декодеру расширения полосы пропускания, способу декодирования кодированного аудиосигнала, фазовому вокодеру и аудиосигналу.

Вместе с тем, конструктивные решения по настоящему изобретению имеют целью применение фазового вокодера для автономного растягивания временной шкалы независимо от расширения полосы пропускания.

Процесс накопления или передачи звуковых сигналов часто строго ограничен скоростью передачи данных. Причиной таких ограничений чаще всего служит применение кодеров/декодеров („кодеков"), которые эффективно сжимают аудиосигнал для обеспечения скорости обмена информацией при хранении или передаче сигнала. Раньше, когда была доступна только низкая скорость передачи данных (низкий битрейт), кодеры вынужденно резко сужали ширину полосы пропускания звуковых частот. Современные аудиокодеки могут кодировать широкополосные сигналы, используя методы расширения полосы пропускания (BWE), что описано в литературе: М. Dietz, L. Liljeryd, К. Kjörling and О. Kunz, "Spectral Band Replication, a novel approach in audio coding," [„Репликация спектральных полос (SBR), новый подход в кодировании звука"], in 112th AES Convention, Munich, May 2002; S. Meltzer, R. Böhm and F. Henn, "SBR enhanced audio codecs for digital broadcasting such as "Digital Radio Mondiale" (DRM)," [„ Усовершенствованные аудиокодеки с репликацией спектральных полос (SBR) для цифрового радиовещания, такого как „Всемирное цифровое радио (DRM)"] in 112th AES Convention, Munich, May 2002; T. Ziegler, A. Ehret, P. Ekstrand and M. Lutzky, "Enhancing mp3 with SBR: Features and Capabilities of the new mp3PRO Algorithm," [„Расширение mp3 с SBR: особенности и возможности нового алгоритма mpSPRO "] in 112th AES Convention, Munich, May 2002; Международный стандарт ISO/IEC 14496-3:2001/FPDAM 1, "Bandwidth Extension," [„Расширение полосы пропускания"] ISO/IEC, 2002; "Speech bandwidth extension method and apparatus" [„Способ и устройство расширения полосы пропускания речи"], Vasu Iyengar et al. US Patent 5,455,888; E. Larsen, R. M. Aarts, and M. Danessis. Efficient high-frequency bandwidth extension of music and speech [Эффективное расширение высокочастотного диапазона в музыке и речи]. In AES 112th Convention, Munich, Germany, May 2002; R. M. Aarts, E. Larsen, and O. Ouweltjes. A unified approach to low- and high-frequency bandwidth extension [Унифицированный подход к расширению низко- и высокочастотной полосы пропускания]. In AES 115th Convention, New York, USA, October 2003; K. Käyhkö. A Robust Wideband Enhancement for Narrowband Speech Signal [Мощное широкополосное расширение узкополосного голосового сигнала.]. Research Report, Helsinki University of Technology, Laboratory of Acoustics and Audio Signal Processing, 2001; E. Larsen and R. M. Aarts. Audio Bandwidth Extension - Application to psychoacoustics, Signal Processing and Loudspeaker Design [Расширение полосы пропускания звуковых частот - применение в психоакустике, обработке сигналов и конструировании громкоговорителей]. John Wiley & Sons, Ltd, 2004; E. Larsen, R. M. Aarts, and M. Danessis. Efficient high-frequency bandwidth extension of music and speech [Эффективное расширение высокочастотного диапазона в музыке и речи]. In AES 112th Convention, Munich, Germany, May 2002; J. Makhoul. Spectral Analysis of Speech by Linear Prediction [Спектральный анализ речи с помощью линейного предсказания]. IEEE Transactions on Audio and Electroacoustics, AU-21(3), June 1973; United States Patent Application 08/951,029, Ohmori, et al. Audio band width extending system and method [Система и способ расширения диапазона звуковых частот]; United States Patent 6895375, Malah, D & Cox, R. V.: System for bandwidth extension of Narrow-band speech [Система для расширения диапазона частот узкополосной речи]; и Frederik Nagel, Sascha Disch, "A harmonic bandwidth extension method for audio codecs," [„Метод расширения гармонического диапазона частот для аудиокодеков"], ICASSP International Conference on Acoustics, Speech and Signal Processing, IEEE CNF, Taipei, Taiwan, April 2009.

Такие алгоритмы основаны на параметрическом представлении высокочастотного контента (ВЧ). Это представление генерируется из низкочастотной составляющей (НЧ) декодированного сигнала посредством транспонирования в ВЧ спектральную область („патчированием") и применением полученного параметра для последующей обработки сигнала.

На существующем уровне техники известны такие методы расширения полосы пропускания, как репликация спектральных полос (SBR) или гармоническое расширение полосы пропускания (НВЕ). Далее будут кратко рассмотрены эти два метода BWE.

С одной стороны, репликация спектральных полос (SBR), как описано в М. Dietz, L. Liljeryd, К. Kjörling and О. Kunz, "Spectral Band Replication, a novel approach in audio coding," [„Репликация спектральных полос (SBR), новый подход в кодировании звука"], in 112th AES Convention, Munich, May 2002, для генерации ВЧ характеристик использован банк квадратурных зеркальных фильтров (КЗФ). С помощью алгоритма так называемого „патчирования" („заполнения пробела") сигналы нижней полосы КЗФ копируют в верхние полосы КЗФ, дублируя информацию НЧ части в ВЧ часть. Позже выверяют согласование сгенерированной ВЧ составляющей с оригинальной ВЧ составляющей, используя параметры корректировки огибающей спектра и тона.

С другой стороны, альтернативной является схема гармонического расширения полосы пропускания (НВЕ), базирующаяся на фазовых вокодерах. По схеме НВЕ задействовано гармоническое продление спектра в противоположность SBR, которое основано на негармоническом спектральном сдвиге. Такая схема может заменить или усовершенствовать алгоритм SBR.

Предварительная заявка на патент США за номером US 61/079,841 раскрывает способ BWE, который дает выбор между альтернативными алгоритмами патчирования, которые работают или в частотной области, или во временной области. При время-частотном преобразовании с помощью банка фильтров задают определенное окно анализа. Кроме того, классические версии исполнения фазового вокодера по современному состоянию используют одну предварительно заданную форму окна, такую, как окно в виде приподнятого косинуса или окно Бартлетта.

Однако, выбирая одно заранее заданное окно анализа для приложений вокодера, разработчик всегда вынужден идти на компромисс в отношении общего воспринимаемого качества звучания, получаемого для различных классов аудиосигналов. В силу этого, несмотря на то, что усредненное качество звука может быть оптимизировано предварительным выбором определенной оконной функции, качество звучания каждого конкретного класса сигналов остается неоптимальным.

Вместе с тем, было установлено, что некоторые сигналы выигрывают от применения специализированных анализирующих окон для фазового вокодера, который может быть направленно использован для временного распространения аудиосигнала без модификации его основного тона.

Отсюда вытекает необходимость в концепции выбора оптимальных окон анализа, таких как существуют в рамках схемы BWE. В то же время, меры, принимаемые в отношении упомянутой выше деградации качества воспринимаемого звука, предпочтительно, не должны вести к значительному возрастанию вычислительной сложности используемых кодеков.

Целью данного изобретения является выработка концепции кодирования и/или декодирования или концепции фазового вокодера, обеспечивающих улучшенное акустическое качество.

Поставленная цель достигается за счет кодера расширения полосы пропускания по пункту 1 формулы изобретения, декодера расширения полосы пропускания по п.2, фазового вокодера по п.12, способа кодирования по п.13, способа декодирования по п.14, кодированного аудиосигнала по п.15 или компьютерной программы по п.16.

Идея, лежащая в основе настоящего изобретения, состоит в том, что улучшение перцептуальных свойств может быть достигнуто, если аудиосигнал, содержащий блок аудиоотсчетов заданной длины во времени, анализируют, чтобы определить из множества окон анализа анализирующее окно, которое будет использовано для расширения полосы пропускания в декодере расширения полосы пропускания. Благодаря применению такого подхода можно предотвратить ухудшение качества звука, происходящего вследствие применения предварительно заданного окна анализа, и, следовательно, повысить перцепционное качество звучания при относительно малой трудоемкости по сравнению с методиками В WE известного уровня техники.

Один из вариантов реализации настоящего изобретения включает в себя кодер расширения полосы пропускания для кодирования аудиосигнала, состоящий из анализатора сигналов, корневого кодера и вычислителя параметров. Аудиосигнал содержит низкочастотный сигнал, включающий в себя полосу центральной частоты, и высокочастотный сигнал, включающий в себя полосу верхних частот. Анализатор сигналов предназначен для анализа аудиосигнала, содержащего блок аудиоотсчетов, который имеет некоторую длительность во времени. Анализатор сигналов, кроме того, предназначен для выбора из множества окон анализа окна анализа, которое будет применено для расширения полосы пропускания в декодере расширения полосы пропускания. Корневой кодер предназначен для кодирования низкочастотного сигнала с образованием кодированного низкочастотного сигнала. Вычислитель параметров предназначен для расчета параметров расширения полосы пропускания на основе высокочастотного сигнала.

Другой вариант реализации изобретения включает в себя декодер расширения полосы пропускания для декодирования закодированного аудиосигнала, состоящий из корневого декодера, модуля патчирования и комбинатора (блока сведения). Кодированный аудиосигнал содержит закодированный низкочастотный сигнал и параметры верхней полосы частот. Корневой декодер предназначен для декодирования закодированного низкочастотного сигнала, при этом декодированный низкочастотный сигнал содержит полосу центральной частоты. Модуль патчирования предназначен для генерирования патчированного сигнала на основе декодированного низкочастотного сигнала и параметров верхней полосы частот, при этом патчированный сигнал содержит полосу верхних частот, сгенерированную на базе полосы центральной частоты. Комбинатор предназначен для сведения патчированного сигнала и декодированного низкочастотного сигнала для формирования общего выходного сигнал.

Еще один вариант реализации представленного изобретения включает в себя процессор фазового вокодера для обработки аудиосигнала, состоящий из оконного анализатора, время-спектрального преобразователя, процессора частотной области, частотно-временного преобразователя, синтезирующего оконного преобразователя, компаратора и сумматора с наложением. Оконный анализатор (анализирующий оконный преобразователь) предназначен для приложения множества оконных (весовых) функций анализа к аудиосигналу или сигналу, образованному из аудиосигнала, при этом аудиосигнал содержит блок аудиоотсчетов, имеющий определенную длительность во времени, с формированием множества взвешенных аудиосигналов. Время-спектральный преобразователь предназначен для преобразования взвешенных аудиосигналов в спектры. Процессор частотной области предназначен для преобразования спектров в частотную область с формированием модифицированных спектров. Частотно-временной преобразователь предназначен для преобразования модифицированных спектров в модифицированные сигналы временной области. Оконный синтезатор (синтезирующий оконный преобразователь) предназначен для приложения множества оконных (весовых) функций синтеза к модифицированным сигналам временной области, причем оконные функции синтеза соотнесены с оконными функциями анализа, с формированием взвешенных модифицированных сигналов временной области. Компаратор предназначен для расчета множества сравнительных параметров на основании сопоставления множества взвешенных модифицированных сигналов во временной области и аудиосигнала или сигнала, образованного из аудиосигнала, при этом множество сравнительных параметров соответствует множеству оконных функций анализа. Кроме того, компаратор выполнен с возможностью выбора оконной функции анализа и оконной функции синтеза, для которых сравнительный параметр удовлетворяет предварительно заданному условию. Сумматор с наложением предназначен для сложения наложением блоков взвешенного модифицированного сигнала во временной области с образованием развернутого во времени сигнала. Кроме того, сумматор с наложением предназначен для обработки блоков взвешенного модифицированного сигнала во временной области, модифицированного с использованием весовой функции анализа и весовой функции синтеза, подобранной компаратором.

Конструктивные решения по заявляемому изобретению основаны на концепции, согласно которой множество патчированных сигналов может быть генерировано с использованием множества оконных функций анализа, приложенных к аудиосигналу, содержащему полосу центральной частоты. Множество патчированных сигналов может быть сопоставлено с опорным сигналом, которым может служить оригинальный аудиосигнал или дериват аудиосигнала. В результате получают множество сравнительных параметров, которые могут быть интерпретированы как мера оценки качества звука. В дополнение к этому, из множества оконных функций анализа может быть выбрана оконная функция анализа, для которой сравнительный параметр удовлетворяет предварительно заданному условию. Таким образом, использование выбранной оконной функции анализа позволяет добиваться минимального снижения качества звучания, обеспечивая оптимальное перцептуальное акустическое качество в контексте сценария BWE.

Ряд технических решений по предлагаемому изобретению относится к анализатору сигналов, который включает в свой состав классификатор сигнала, предназначенный для выполнения анализа/классификации аудиосигнала или деривата аудиосигнала. В этом случае оконную функцию анализа, которая будет использована для расширения полосы пропускания на стороне декодера расширения полосы пропускания, выбирают на основе характеристики сигнала, прошедшего анализ/классификацию.

В силу этого, в вариантах компоновки реализован способ выбора оптимального окна анализа для расширения полосы пропускания в декодере. Для подбора наиболее подходящего окна анализа могут быть вычислены параметры управления. Это делается с использованием процедуры анализа через синтез; то есть - путем приложения ряда окон и выбора из них наиболее соответствующего поставленной задаче. В предпочтительной форме реализации изобретения такой задачей является обеспечение оптимального качества акустического восприятия восстановленного сигнала. В альтернативных реализациях может быть оптимизирована целевая функция. Например, цель может состоять в максимально точном сохранении равномерности исходных спектральных характеристик ВЧ.

С одной стороны, подбор оконной функции может выполняться только на стороне кодера, исходя из первоначального сигнала, синтезированного сигнала или обоих. Принятое решение (указание на окно) затем пересылается на декодер. С другой стороны, выбор может выполняться синхронно на стороне кодера и на стороне декодера, исходя только из полосы пропускания центральной частоты декодированного сигнала. При использовании последнего метода нет необходимости в формировании сопутствующей служебной информации, что дает преимущество в эффективности битрейта кодека.

Преимущество изобретения заключается в оптимизации перцептуальных свойств выходного сигнала вокодера. Конструктивные решения обеспечивают выбор адаптивных к сигналу окон анализа и синтеза в процессе преобразования речевых сигналов, при котором возможно варьирование временных или частотных характеристик окон анализа и/или синтеза.

Другим преимуществом изобретения является возможность достижения лучшего баланса между снижением вышеназванной деградации и вычислительной трудоемкостью, как, например, в рамках схемы BWE.

Далее будут представлены пояснения к вариантам технических решений по заявляемому изобретению со ссылкой на сопроводительные фигуры, где:

на фиг.1 показана принципиальная модульная схема варианта компоновки кодера расширения полосы пропускания;

на фиг.2 показана принципиальная модульная схема варианта компоновки декодера расширения полосы пропускания;

на фиг.3 показана принципиальная модульная схема развернутого варианта компоновки кодера расширения полосы пропускания;

на фиг.4 показана принципиальная модульная схема развернутого варианта компоновки декодера расширения полосы пропускания;

на фиг.5 показана принципиальная модульная схема развернутого варианта компоновки кодера расширения полосы пропускания;

на фиг.6 показана принципиальная модульная схема развернутого варианта компоновки декодера расширения полосы пропускания;

на фиг.7 показана принципиальная модульная схема конструктивного решения компаратора;

на фиг.8 показана принципиальная модульная схема развернутого варианта компоновки кодера расширения полосы пропускания;

на фиг.9 показана принципиальная модульная схема конструктивного решения классификатора сигналов;

на фиг.10 показана принципиальная модульная схема развернутого варианта компоновки кодера расширения полосы пропускания;

на фиг.11 показана принципиальная модульная схема развернутого варианта компоновки декодера расширения полосы пропускания;

на фиг.12 показана принципиальная модульная схема конструктивного решения процессора фазового вокодера;

на фиг.13 показана принципиальная модульная схема коммутатора вариантов окон анализа и синтеза в зависимости от управляющих параметров; и

на фиг.14 дана блок-схема реализации декодера расширения полосы пропускания на базе фазового вокодера.

На фиг.1 отображена принципиальная модульная схема реализации кодера расширения полосы пропускания 100, предназначенного для кодирования аудиосигнала 101-1 в соответствии с заявляемым изобретением. Аудиосигнал 101-1 включает в себя низкочастотный сигнал 101-2, содержащий полосу центральной частоты 101-3, и высокочастотный сигнал 101-4, содержащий полосу верхних частот 101-5. Кодер расширения полосы пропускания 100 имеет в своем составе анализатор сигналов 110, корневой кодер 120 и вычислитель параметров 130. Анализатор сигналов ПО выполняет функцию анализа аудиосигнала 101-1, который содержит блок 101-6 аудиоотсчетов, имеющий заданную продолжительность во времени. Анализатор сигналов ПО, кроме того, выполнен с возможностью подбора из множества 111-1 окон анализа окна анализа 111-2 для дальнейшего использования при расширении полосы пропускания в декодере расширения полосы пропускания 200. Корневой кодер 120 выполняет функцию кодирования низкочастотного сигнала 101-2 с получением кодированного низкочастотного сигнала 121. Наконец, вычислитель параметров 130 выполняет функцию расчета параметров расширения полосы пропускания 131 на базе высокочастотного сигнала 101-4. Параметры расширения полосы пропускания 131, окно анализа 111-2, которое будет использовано в декодере расширения полосы пропускания 200, и закодированный низкочастотный сигнал 121 составляют кодированный аудиосигнал 103-1 на выходе кодера расширения полосы пропускания 100.

На фиг.2 отображена принципиальная модульная схема декодера расширения полосы пропускания 200, предназначенного для декодирования закодированного аудиосигнала 201-1, в соответствии с другим техническим решением данного изобретения. Кодированный аудиосигнал 201-1 состоит из закодированного низкочастотного сигнала 201-2 и параметров верхней полосы частот 201-3. Здесь кодированный аудиосигнал 201-1 может соответствовать кодированному аудиосигналу 103-1, сгенерированному кодером расширения полосы пропускания 100 на фиг.1. Декодер расширения полосы пропускания 200 имеет в своем составе корневой декодер 210, модуль патчирования 220 и комбинатор 230. Корневой декодер 210 выполняет функцию декодирования закодированного низкочастотного сигнала 201-2 в образованием декодированного низкочастотного сигнала 211-1. Декодированный низкочастотный сигнал 211-1 содержит полосу центральной частоты 211-2. Модуль патчирования 220 генерирует патчированный сигнал 221-1 на базе декодированного низкочастотного сигнала 211-1 и параметров полосы верхних частот 201-3, при этом патчированный сигнал 221-1 включает в себя полосу верхних частот 221-2, генерированную из полосы центральной частоты 211-2. Наконец, комбинатор (блок сведения) 230 выполняет функцию сведения патчированного сигнала 221-1 и декодированного низкочастотного сигнала 211-1 с получением совокупного выходного сигнала. В частности, патчированный сигнал 221-1 может быть сигналом в пределах целевой полосы частот алгоритма расширения полосы пропускания, в то время как сведенный выходной сигнал на выходе декодера расширения полосы пропускания 200 может быть преобразованным сигналом с расширенным диапазоном рабочих частот (231-2).

На фиг.3 отображена принципиальная модульная схема реализации развернутого варианта компоновки кодера расширения полосы пропускания 300. Кодер расширения полосы пропускания 300 может включать в себя фильтр нижних частот (ФНЧ) и фильтр верхних частот (ФВЧ). Фильтры могут генерировать отфильтрованную по нижним частотам версию аудиосигнала 101-1, представляющую собой низкочастотный сигнал 101-2, и отфильтрованную по верхним частотам версию аудиосигнала 101-1, являющуюся высокочастотным сигналом 101-4. Как показано на фиг.3, кодер расширения полосы пропускания 300 может также включать в свой состав оконный контроллер 310 для формирования информации по управлению окнами 311, которая используется вычислителем параметров 320 и модулем патчирования 330. Информация по управлению окнами 311 на выходе оконного контроллера 310 может отображать множество 111-1 оконных функций анализа, которые будут применены к блоку 101-6 аудиоотсчетов, полученных из аудиосигнала 101-1. Вычислитель параметров 320, в частности, может включать в свою компоновку оконный преобразователь, управляемый оконным контроллером 310, причем оконный преобразователь вычислителя параметров 320 применяет множество 111-1 оконных функций анализа и оконную функцию анализа 111 - 2, выбранную компаратором 340, к высокочастотному сигналу 101-4. При этом получают соответственно параметры расширения полосы пропускания 321-1, 321-2, соответствующие множеству 111-1 оконных функций анализа, на что указывает информация по управлению окнами 311, и соответствующие выбранной оконной функции анализа 111-2 согласно индикации окна 341-1 на выходе компаратора 340.

В аппаратной версии на фиг.3 анализатор сигнала 110 имеет в своем составе модуль патчирования 330, генерирующий множество 331-1 патчированных сигналов на базе низкочастотного сигнала 101-2, информации по управлению окнами 311 и параметров расширения полосы пропускания 321-1. При этом патчированные сигналы 331-1 содержат полосы верхних частот 331-2, сгенерированные на основе полосы центральной частоты 101-3. Модуль патчирования 330, в частности, включает в себя оконный преобразователь, управляемый оконным контроллером 310, причем оконный преобразователь модуля патчирования 330 предназначен для приложения множества 111-1 оконных функций анализа к низкочастотному сигналу 101-2.

Далее, анализатор сигнала 110 в составе кодера расширения полосы пропускания 300 включает в себя компаратор 340, предназначенный для определения множества 341-2 сравнительных параметров на основе сопоставления патчированных сигналов 331-1 с опорным сигналом, представляющим собой аудиосигнал 101-1 или сигнал, производный от этого аудиосигнала, такой, как высокочастотный сигнал 101-4, обозначенный пунктирной линией, при этом множество 341-2 сравнительных параметров соответствует множеству 111-1 оконных функций анализа. Компаратор 340, кроме того, генерирует указатель окна 341-1, соответствующий оконной функции анализа 111-2, для которого сравнительный параметр удовлетворяет предварительно заданному условию. И, наконец, кодер расширения полосы пропускания 300 оснащен выходным интерфейсом 350 для вывода кодированного аудиосигнала 351, содержащего указатель окна 341-1.

Упомянув выше процедуру сопоставления, обратимся к фиг.7, отображающей принципиальную блочную схему варианта компоновки компаратора 700, куда может быть включен вычислитель 710 показателя степени спектральной (неравномерности (параметра SFM), компаратор параметра SFM 720 и экстрактор указателя окна 730. Вычислитель параметров SFM 710 реализован с возможностью расчета, например, множества 703-1 параметров SFM на основе множества 701-1 входных сигналов и опорного параметра SFM 703-2 на основе опорного входного сигнала 701-2. Так, каждый показатель SFM может быть рассчитан путем деления среднего геометрического спектральной плотности мощности на среднее арифметическое спектральной плотности мощности, выведенной из соответствующего входного сигнала, при этом относительно высокое значение параметра SFM указывает на однородность распределения плотности мощности по всем полосам спектра, в то время как относительно низкий показатель SFM свидетельствует о том, что спектральная мощность сконцентрирована в относительно небольшом числе полос. Вместе с тем, параметр SFM может быть измерен в пределах какой-либо части полосы (подполосы), а не по всему диапазону входного сигнала. Компаратор параметров SFM 720 реализован с возможностью сравнения параметров SFM 703-1 с опорным параметром SFM 703-2 с получением множества 705 сравнительных параметров, которые могут базироваться, допустим, на отклонениях в сравненных параметрах SFM. Экстрактор указателя окна 730 реализован с возможностью выбора из множества сравнительных параметров 705 сравнительного параметра, которому будет удовлетворять предварительно заданное условие. Предварительно задаваемое условие может быть выбрано так, например, что взятый сравнительный параметр будет минимальным из множества сравнительных параметров 705. В этом случае выбранный сравнительный параметр будет соответствовать одному входному сигналу из множества входных сигналов 701-1, который характеризуется минимальным отклонением от опорного входного сигнала 701-2 по спектральной неравномерности.

На практике входные сигналы 701-1 могут соответствовать патчированным сигналам 331-1, патчированным сигналам 331-1, полученным взвешиванием аудиосигнала 101-1 с помощью множества 111-1 оконных функций анализа, или деривату аудиосигнала 101-1, такому, как низкочастотный сигнал 101-2, в то время как опорный входной сигнал 701-2 может соответствовать оригинальному аудиосигналу 101-1. Кроме того, множество 705 сравнительных параметров компаратора 700 может соответствовать множеству 341-2 сравнительных параметров кодера расширения полосы пропускания 300. Таким образом, оконная функция анализа 111-2 может быть выбрана в соответствии с выделенным сравнительным параметром, в котором девиация параметра SFM патчированных сигналов 331-1 относительно оригинального аудиосигнала 101-1, например, будет минимальной. С выбранной оконной функцией анализа 111-2 также может быть соотнесен указатель окна 707, который может соответствовать указателю окна 341-1 на выходе компаратора 700 или компаратора 340 соответственно. Следовательно, перцептуальное акустическое качество, оцениваемое, например, через спектральную неравномерность, будет изменено или возможно минимально снижено при задействовании отобранной оконной функции анализа 111-2 для выполнения расширения полосы пропускания, например, на стороне декодера расширения полосы пропускания.

Более того, множество 111-1 оконных функций анализа, указанных в информации по управлению окнами 311 на выходе оконного контроллера 310, может включать в себя разные оконные функции анализа, содержащие отличающиеся друг от друга характеристики окон при длине окна, по времени совпадающей с блоком 101-6. В частности, разные оконные функции анализа могут характеризоваться различными амплитудно-частотными характеристиками („передаточными функциями"), полученными в результате спектрального анализа. Передаточные функции, в свою очередь, могут различаться характерными особенностями, такими как ширина основного лепестка, уровень боковых лепестков или спад боковых лепестков. Разные оконные функции анализа также могут быть разделены на несколько групп, исходя из таких их характеристик, как спектральное разрешение или динамический диапазон. Так, окна с высокой и средней разрешающей способностью могут быть представлены оконными функциями - прямоугольными, треугольными, косинусными, приподнято-косинусными, Хемминга, Ханна, Бартлетта, Блэкмана (Блекмена), Гауссовыми, Кайзера или Бартлетта-Ханна, в то время как окна с низким разрешением или с широким динамическим диапазоном могут быть представлены оконными функциями с плоской вершиной, Блэкмана-Харриса или Тукея (Tukey). В альтернативных конструктивных решениях могут быть использованы оконные функции, содержащие иное количество отсчетов (т.е. окна другой длины).

В частности, применяя различные оконные функции анализа 111-1, которые могут принадлежать к разным группам оконных функций анализа, к блоку 101-6 отсчетов аудиосигнала, с использованием модуля патчирования 330, например, даст в результате патчированные сигналы 331-1 с различными отличительными характеристиками, такими как разные показатели степени неравномерности спектра SFM.

На фиг.4 отображена принципиальная блочная схема развернутого конструктивного решения декодера расширения полосы пропускания 400, который однозначно может использовать указатель окна 341-1, принятый, например, от кодера расширения полосы пропускания 300 на фиг.3. Декодер расширения полосы пропускания 400 выполнен, в частности, с возможностью обрабатывать кодированный аудиосигнал 401-1, содержащий, кроме кодированного низкочастотного сигнала 401-2 и параметров полосы верхних частот 401-3, указатель окна 401-4. Здесь закодированный сигнал низких частот 401-2, параметры полосы верхних частот 401-3 и указатель окна 401-4 могут соответствовать кодированному низкочастотному сигналу 121, параметрам расширения полосы пропускания 321-2 и указателю окна 341-1 на выходе выходного интерфейса 350 кодера расширения полосы пропускания 300 соответственно. В аппаратной версии на фиг.4 декодер расширения полосы пропускания 400 имеет в своем составе корневой декодер 410 как возможный аналог корневого декодера 210 в составе декодера расширения полосы пропускания 200, при этом корневой декодер 410 предназначен для декодирования кодированного сигнала нижних частот 401-2, а декодированный низкочастотный сигнал 411-1 содержит полосу центральной частоты 411-2. Кроме того, декодер расширения полосы пропускания 400 включает в свой состав модуль патчирования 420 как возможный аналог модуля патчирования 220 декодера расширения полосы пропускания 200, при этом модуль патчирования 420 содержит в себе управляемый оконный преобразователь, предназначенный для подбора оконной функции анализа из множества оконных функций анализа, исходя из указателя окна 401-4, и для приложения выбранной оконной функции анализа к декодированному низкочастотному сигналу 411-1. В результате этого на выходе модуля патчирования 420 формируется патчированный сигнал 421. Патчированный сигнал 421 далее может быть совмещен комбинатором 430 с сигналом низких частот 411-1 с получением на выходе декодера расширения полосы пропускания 400 совокупного выходного сигнала 431. В данном случае патчированный сигнал 421, декодированный сигнал низких частот 411-1, комбинатор 430 и сведенный выходной сигнал 431 могут быть эквивалентны патчированному сигналу 221-1, декодированному сигналу низких частот 211-1, комбинатору 230 и сведенному выходному сигналу 231-1 соответственно. Как и в предыдущем случае, сведенный выходной сигнал 431 может быть прошедшим обработку сигналом с расширенной полосой пропускания.

Фиг.3 и 4 демонстрируют то преимущество, что указатель окна 341-1; 401-4, соответствующий оптимальной оконной функции анализа, полученной путем анализа сигнала на стороне кодера (фиг.3), может быть передан в составе кодированного аудиосигнала 351; 401-1 и затем использован модулем патчирования 420 в процессе расширения полосы пропускания без необходимости дополнительного анализа сигнала на стороне декодера (фиг.4).

На фиг.5 представлена принципиальная блочная схема развернутого варианта компоновки кодера расширения полосы пропускания 500. Кодер расширения полосы пропускания 500 в основном состоит из блоков, аналогичных кодеру расширения полосы пропускания 300 на фиг.3. Поэтому идентичные компоненты схемы, имеющие сходное конструктивное исполнение и/или функциональное назначение, имеют одинаковое цифровое обозначение. Тем не менее в отличие от аппаратной версии на фиг.3 в кодер расширения полосы пропускания 500 введен компаратор 510, выполняющий функцию сравнения множества патчированных сигналов 333-1 с опорным низкочастотным сигналом, производным от аудиосигнала 101-1. Кодер расширения полосы пропускания 500 может в качестве опции включать в свой состав корневой декодер 520, генерирующий декодированный низкочастотный сигнал 521, декодируя кодированный низкочастотный сигнал 121, принятый с выхода корневого кодера 120. В качестве опорного сигнала нижних частот может служить, например, низкочастотный сигнал 101-2, представляющий собой прошедшую НЧ фильтрацию версию аудиосигнала 101-1 или декодированный низкочастотный сигнал 521, принимаемый с выхода корневого декодера 520. Кроме того, компаратор 510 выводит указатель окна 511, соответствующий выбранной (оптимальной) оконной функции анализа, при этом в таком случае подбор окна основывается на сравнении патчированных сигналов 331-1 с опорным низкочастотным сигналом 101-2 или 521. Как и в случае указателя окна 341-1 на фиг.3 указатель окна 511 может быть передан на вычислитель параметров 320, причем, таким образом, что будет выполняться расчет только параметров В WE 321-2, соответствующих указателю окна 511. Параметры BWE 321-2 вместе с кодированным низкочастотным сигналом 121 могут быть выведены на выходной интерфейс 530. Однако при этом указатель окна 511 может не выводиться на выходной интерфейс 530. В итоге выходной интерфейс 530 предназначен для вывода кодированного аудиосигнала 531, который не содержит указатель окна 511.

На фиг.6 изображена принципиальная блочная схема развернутого варианта компоновки декодера расширения полосы пропускания 600. Декодер расширения полосы пропускания 600, в частности выполнен с возможностью обработки кодированного аудиосигнала 601-1, содержащего закодированный низкочастотный сигнал 601-2 и параметры верхней полосы частот 601-3. Здесь кодированный аудиосигнал 601-1, кодированный низкочастотный сигнал 601-2 и параметры верхней полосы частот 601-3 могут быть аналогами кодированному аудиосигналу 201-1, кодированному сигналу низких частот 201-2 и параметрам полосы верхних частот 201-3 соответственно. Следует обратить внимание на то, что в аппаратной версии на фиг.6 кодированный аудиосигнал 601-1, вводимый в декодер расширения полосы пропускания 600, не содержит указатель окна. Поэтому в данном случае на стороне декодера необходим анализ сигнала для подбора подходящей оконной функции, которая будет применена в рамках схемы расширения полосы пропускания (фиг.6).

Как показано на фиг.6, модуль патчирования 220 декодера расширения полосы пропускания 600 включает в себя оконный анализатор 610, время-спектральный преобразователь 620, процессор частотной области 630, частотно-временной преобразователь 640, оконный синтезатор 650, компаратор 660 и модуль расширения полосы пропускания 670. В дополнение к этому декодер расширения полосы пропускания 600 имеет в своем составе корневой декодер 680 для декодирования кодированного сигнала низких частот 601-2, при этом декодированный низкочастотный сигнал 681-1 содержит полосу центральной частоты 681-2. Здесь корневой декодер 680 и декодированный низкочастотный сигнал 681-1 могут быть идентичными корневому декодеру 210 и декодированному низкочастотному сигналу 211-1 соответственно.

Оконный анализатор 610 предназначен для приложения множества оконных функций анализа, таких как весовые функция анализа 111-1 в вариантах компоновки кодера расширения полосы пропускания 300; 500, к декодированному сигналу низких частот 681-1 с формированием множества 611 оконных (взвешенных) низкочастотных сигналов. Время-спектральный преобразователь 620 предназначен для трансформации взвешенных сигналов низких частот 611 в спектры 621. Процессор частотной области 630 предназначен для обработки спектров 621 в частотной области с получением модифицированных спектров 631. Частотно-временной преобразователь 640 предназначен для преобразования модифицированных спектров 631 в модифицированные сигналы временной области 641. Оконный синтезатор 650 предназначен для взвешивания модифицированных сигналов временной области 641 с помощью множества оконных функций синтеза, где оконные функции синтеза соотнесены с оконными функциями анализа, с получением модифицированных сигналов временной области 651. В частности, оконные функции синтеза могут быть так соотнесены с оконными функциями анализа, что приложенные оконные функции синтеза будут компенсировать эффект применения соответствующих оконных функций анализа. Компаратор 660 предназначен для расчета множества сравнительных параметров на основе сопоставления множества 651 взвешенных модифицированных сигналов во временной области с декодированным низкочастотным сигналом 681-1, причем множество сравнительных параметров соответствует множеству 111-1 оконных (весовых) функций анализа, примененных к декодированному низкочастотному сигналу 681-1 оконным анализатором 610. Компаратор 660, кроме того, выполнен с возможностью подбора оконной функции анализа и оконной функции синтеза, для которых сравнительный параметр удовлетворяет расчетному условию. В подобном случае компаратор 660 может быть специально сконфигурирован по аналогии с вариантом, рассмотренным в контексте фиг.7. Подобранные оконная функция анализа и оконная функция синтеза могут составлять указатель окна 661, сгенерированный на выходе компаратора 660. Тем не менее в противоположность конструктивному решению декодера расширения полосы пропускания 400 на фиг.4, где указатель окна 401-4, используемый в схеме расширения полосы пропускания на стороне декодера, содержится в кодированном аудиосигнале 401 -1, указатель окна 661 в декодере расширения полосы пропускания 600 на фиг.6 не входит в состав кодированного аудиосигнала 601-1, в силу чего указатель окна 661 сначала должен быть выведен путем анализа декодированного низкочастотного сигнала 681-1, выработанного из кодированного аудиосигнала 601-1. В дополнение к этому модуль патчирования 220 в составе декодера расширения полосы пропускания 600 может включать в себя модуль расширения полосы пропускания 670, выполненный с возможностью реализации алгоритма расширения полосы пропускания, в котором модуль патчирования 220 генерирует патчированный сигнал 671 на баже декодированного низкочастотного сигнала 681-1, оконной функции анализа и оконной функция синтеза, выбранных компаратором 660, и параметра 601-3 верхней полосы частот. В завершение, патчированные сигналы 671 и декодированный сигнал низких частот 681-1 могут быть сведены комбинатором 690 с формированием совокупного выходного сигнала 691 с расширенной частотной полосой. В подобном случае патчированный сигнал 671, декодированный низкочастотный сигнал 681-1, комбинатор 690 и сведенный выходной сигнал 691 могут соответствовать в той же последовательности патчированному сигналу 221-1, декодированному низкочастотному сигналу 211-1, комбинатору 230 и сведенному выходному сигналу 231-1 на стороне декодера расширения полосы пропускания 200, представленного на фиг.2.

Ранее рассмотренные технические решения кодеров/декодеров расширения полосы пропускания включают в свой состав компараторы, которые могут соответствовать компаратору 700, описанному в контексте фиг.7. А именно, компаратор 700 может быть реализован с возможностью приема в качестве множества входных сигналов 701-1 множества 331-1 патчированных сигналов от кодеров расширения полосы пропускания 300 и 500 на Фиг.3 и 5 или множества 651 взвешенных модифицированных сигналов временной области от декодера расширения полосы пропускания 600 на фиг.6 и в качестве опорного входного сигнала 701-2 аудиосигнала 101-1, обозначенного на фиг.3 как „опорный сигнал", или высокочастотного сигнала 101-4, обозначенного на фиг.3 пунктирной линией, низкочастотного сигнала 101-2, обозначенного на фиг.5 как „опорный низкочастотный сигнал", или декодированного низкочастотного сигнала 521, обозначенного на фиг.5 пунктирной линией, или декодированного низкочастотного сигнала 681-1 от декодера расширения полосы пропускания 600 на фиг.6. Кроме того, компаратор 700 выполнен с возможностью вычисления указателя окна 707, который может соответствовать указателю окна 341-1 кодера расширения полосы пропускания 300 на фиг.3, указателю окна 511 кодера расширения полосы пропускания 500 на фиг.5 или указателю окна 661 декодера расширения полосы пропускания 600 на фиг.6. Как пояснялось раньше, сравнение может базироваться, в частности, на вычислении параметров SFM входных сигналов. В ином случае входные сигналы 701-1 могут быть сопоставлены также с опорными входными сигналами 701-2 на основе вычисления разницы значений аудиосигнала по каждому отсчету.

В предыдущих реализациях выбор окон выполнялся посредством анализа сигнала, при котором множество разных оконных функций анализа применялось к аудиосигналу или сигналу, производному от аудиосигнала, с генерацией множества различных патчированных (синтезированных) сигналов. Из этого множества синтезированных сигналов выбирают оптимальную оконную функцию, исходя из критерия, предварительно заданного на основе сопоставления синтезированных сигналов с исходным аудиосигналом или сигналом, производным от этого аудиосигнала. Выбранную оконную функция затем применяют к аудиосигналу или к деривату такого аудиосигнала, скажем, в рамках схемы расширения полосы пропускания с формированием желаемого патчированного (синтезированного) сигнала. Описанная выше процедура в особенности соответствует замкнутому контуру и может быть названа схемой „анализа через синтез". И наоборот, окно может быть подобрано путем прямого анализа входного аудиосигнала или сигнала, производного от него, когда оригинальный входной сигнал разлагают/классифицируют, исходя из определенной характеристики сигнала, например тональной. Такой альтернативный подход к анализу, соответствующий открытому контуру, будет представлен в последующих конструктивных решениях.

На фиг.8 изображена принципиальная модульная схема развернутого варианта компоновки кодера расширения полосы пропускания 800. Здесь базовая компоновка кодера расширения полосы пропускания 800 соответствует компоновке кодера расширения полосы пропускания 300 на фиг.3. В силу этого идентичные блоки на фигурах 3 и 8 имеют одинаковое цифровое обозначение.

Анализатор сигнала 110 в составе кодера расширения полосы пропускания 800 включает в себя классификатор сигналов 810, предназначенный для сортировки аудиосигнала 101-1 или его деривата, например, сигнала высоких частот 101-4 (показанного пунктиром), с целью определения указателя окна 811, соответствующего оконной функции анализа, исходя из характеристики отсортированного сигнала. Так, классификатор сигналов 810 может предусматривать вычисление указателя окна 811 из тональных характеристик звукового сигнала 101-1 или высокочастотного сигнала 101-4, при этом тональные характеристики могут отражать распределение спектральной энергии в их полосах. В случае если спектральная энергия распределена по полосе относительно равномерно, то в этом диапазоне присутствует, скорее, нетональный сигнал („зашумленный сигнал"), и указатель окна 811 относится к первой оконной функции, имеющей первую характеристику, предназначенную для применения к нетональному сигналу, в то время как в случае, если спектральная энергия относительно сильно сконцентрирована на определенном участке данной полосы, то в этой полосе присутствует, скорее, тональный сигнал, и указатель окна 811 относится ко второй оконной функции, имеющей вторую характеристику, предназначенную для применения к тональному сигналу. Далее, кодер 800 имеет в своем составе оконный контроллер 820, предназначенный для формирования информации по управлению окнами 821 на основании указателя окна 811, определенного классификатором сигналов 810. Вычислитель параметров 830 в составе кодера 800 включает в себя управляемый оконным контроллером 820 оконный преобразователь, который применяет оконную функцию анализа, исходя из информации по управлению окнами 821, к высокочастотному сигналу 101-4 с извлечением параметров В WE 831. Оконный контроллер 820 может, допустим, предусматривать выработку информации по управлению окнами 821 для передачи на вычислитель параметров 830 таким образом, что первое окно, характеризуемое передаточной функцией с первой шириной основного лепестка, будет задействовано оконным преобразователем вычислителя параметров 830, когда значение рассчитанной тональной характеристики будет ниже расчетной пороговой величины, или второе окно, характеризуемое передаточной функцией со второй шириной основного лепестка, будет задействовано оконным преобразователем вычислителя параметров 830, когда значение рассчитанной тональной характеристики будет равно или выше расчетной пороговой величины, при этом первая ширина основного лепестка передаточной функции превышает вторую ширину основного лепестка передаточной функции. Особенно предпочтительным в контексте алгоритма расширения полосы пропускания, может быть использование оконной функции с большим основным лепестком передаточной функции в случае нетонального сигнала и использование оконной функции с меньшим основным лепестком передаточной функции в случае тонального сигнала.

Корневой кодер 120 в составе кодера расширения полосы пропускания 800 выполняет функцию кодирования низкочастотного сигнала 101-2 с формированием кодированного низкочастотного сигнала 121. Как и в версии исполнения на фиг.3, кодированный низкочастотный сигнал 121, указатель окна 811 и параметры В WE 831 могут быть переданы на устройство выходного интерфейса 840 с формированием на его выходе кодированного аудиосигнала 841, содержащего указатель окна 811.

На фиг.9 изображена принципиальная блочная схема классификатора сигналов 900, который может быть использован для прямого анализа аудиосигнала 101-1 в аппаратных реализациях на фиг.8, 10 и 11. Классификатор сигналов 900 может включать в свою схему измеритель тонального уровня 910, определитель типа сигнала 920 и оконный селектор (блок выбора окна) 930. Измеритель тонального уровня 910 может выполнять функцию анализа аудиосигнала 101-1 для определения тональной характеристики 911 аудиосигнала 101-1. Определитель типа сигнала 920 может выполнять функцию определения акустических свойств 921 аудиосигнала 101-1, исходя из тональной характеристики 911 полученной от измерителя тонального уровня 910. В частности, определитель типа сигнала 920 устанавливает принадлежность аудиосигнала 101-1 больше к зашумленному или к тональному сигналу. И, наконец, оконный селектор 930 выполнен с возможностью выработки указателя окна 811 в зависимости от свойств сигнала 921.

На фиг.10 изображена принципиальная модульная схема развернутого варианта компоновки кодера расширения полосы пропускания 1000, который может соответствовать кодеру расширения полосы пропускания 500 на фиг.5. Соответственно, идентичные блоки в версиях исполнения на фигурах 5 и 10 имеют одинаковые цифровые обозначения. Анализатор сигнала ПО в составе кодера расширения полосы пропускания 1000 включает в свой состав классификатор сигналов 1010, предназначенный для классификации низкочастотного сигнала 101-2, выработанного из аудиосигнала 101-1, для определения указателя окна 1011, соответствующего оконной функции анализа, на основании характеристики классифицированного сигнала, полученного от классификатора сигналов 1010. Кроме того, кодер 1000 включает в свой состав оконный контроллер 1020, предназначенный для выработки информации по управлению окнами 1021 на основании указателя окна 1011, определенного классификатором сигналов 1010. Вычислитель параметров 1030 в составе кодера расширения полосы пропускания 1000 включают в себя управляемый оконным контроллером 1020 оконный преобразователь, который выполняет функцию приложения на основании информации по управлению окнами 1021 оконной функции анализа к высокочастотному сигналу 101-4 с получением параметров расширения полосы пропускания В WE 1031. Кодер расширения полосы пропускания 1000 может включать в свою конфигурацию корневой кодер 120 для формирования из низкочастотного сигнала 101-2 кодированного низкочастотного сигнала 121. В дополнение к этому в кодер расширения полосы пропускания 1000 в качестве опции может быть введен корневой декодер 1050, обозначенный пунктирной рамкой, выполняющий декодирование закодированного сигнала низких частот 121 с извлечением декодированного низкочастотного сигнала 1051 (обозначенного пунктирной стрелкой). Соответственно, классификатор сигналов 1010 может факультативно выполнять анализ/классификацию декодированного сигнала нижних частот 1051 с целью определения указателя окна 1011. Закодированный низкочастотный сигнал 121 и параметры В WE 1031 далее могут быть переданы на устройство выходного интерфейса 1040, предназначенное для формирования кодированного аудиосигнала 1041, не содержащего указатель окна 1011. В данной ситуации кодированный аудиосигнал 1041 может соответствовать кодированному аудиосигналу 531 на фиг.5.

В подобном случае указатель окна не содержится в закодированном аудиосигнал на стороне кодера (фиг.10), что означает, что указатель окна должен быть задан на стороне декодера (фиг.11), что будет проиллюстрировано дальше.

На фиг.11 представлена принципиальная модульная схема развернутого варианта компоновки декодера расширения полосы пропускания 1100, который может соответствовать декодеру расширения полосы пропускания 600 на фиг.6. Соответственно, идентичные блоки в реализациях на фиг.6 и 11 имеют одинаковое цифровое обозначение. А именно, декодер расширения полосы пропускания 1100 имеет в своем составе корневой декодер 680 для извлечения из закодированного сигнала нижних частот 601-2 декодированного низкочастотного сигнала 681-1. Модуль патчирования 220 в составе декодера расширения полосы пропускания 1100 включает в себя классификатор сигналов 1110, который анализирует/классифицирует декодированный низкочастотный сигнал 681-1 для определения указателя окна 1111, соответствующего оконной функции анализа, исходя из характеристики проанализированного сигнала. Кроме того, в схему декодера 1100 входит оконный контроллер 1120, формирующий информацию по управлению окнами 1121 с опорой на указатель окна 1111, выведенный классификатором сигналов 1110. Дополнительно декодер 1100 может включать в себя модуль расширения полосы пропускания В WE ИЗО, в составе которого модуль патчирования 220 генерирует патчированный сигнал 671 на основе декодированного сигнала низких частот 681-1, оконную функцию анализа на основании информации по управлению окнами 1121 и параметры 601-3 полосы верхних частот. Патчированный сигнал 671 и декодированный низкочастотный сигнал 681-1 в последующем могут быть сведены с помощью комбинатора 690 с формированием совокупного выходного сигнала 691.

Схема анализа через синтез, задействованная в предыдущих реализациях, также может быть приложена в отношении технического исполнения фазового вокодера. В этой связи фиг.12 отображает принципиальную блочную схему аппаратной версии процессора фазового вокодера 1200. Процессор фазового вокодера 1200, предназначенный для обработки аудиосигнала 1201, может иметь в своем составе оконный анализатор 1210, время-спектральный преобразователь 1220, процессор частотной области 1230, частотно-временной преобразователь 1240, оконный синтезатор 1250, компаратор 1260 и сумматор с наложением 1270. В частности, оконный анализатор 1210 выполнен с возможностью приложения множества 111-1 оконных (весовых) функций анализа к аудиосигналу 1201 или к сигналу, производному от аудиосигнала, например декодированному сигналу нижних частот 1202, обозначенному пунктирной стрелкой, при этом аудиосигнал 1201 содержит блок аудиоотсчетов, имеющий определенную длину во времени, с целью формирования множества 1211 взвешенных аудиосигналов. Время-спектральный преобразователь 1220 выполнен с возможностью трансформации взвешенных аудиосигналов 1211 в спектры 1221. Процессор частотной области 1230 выполнен с возможностью обработки спектров 1221 трансформанты с получением модифицированных спектров 1231. Частотно-временной преобразователь 1240 выполнен с возможностью преобразования модифицированных спектров 1231 в модифицированные сигналы временной области 1241. Оконный синтезатор 1250 выполнен с возможностью приложения множества оконных (весовых) функций синтеза к модифицированным сигналам временной области 1241, причем оконные функции синтеза соотнесены с оконными функциями анализа, с формированием взвешенных модифицированных сигналов во временной области 1251. Компаратор 1260 выполнен с возможностью расчета множества сравнительных параметров на основе сопоставления множества взвешенных

модифицированных сигналов временной области 1251 с аудиосигналом 1201 или его дериватом, таким как декодированный низкочастотный сигнал 1202 (показанный пунктиром), причем множество сравнительных параметров соответствует множеству оконных функций анализа, и, кроме того, компаратор 1260 выполнен с возможностью подбора оконной функции анализа и оконной функции синтеза, для которых сравнительный параметр удовлетворяет предварительно заданному условию. Здесь следует заметить, что оконная функция анализа и оконная функция синтеза подбираются компаратором 1260 аналогично процедуре, рассмотренной ранее в контексте предшествующих конструктивных решений. Допустим, компаратор 1260 может быть осуществлен по аналогии с техническим исполнением, показанным на фиг.7. В последующем выбранные оконные функции анализа и синтеза могут быть задействованы по всей технологической цепочке на пути прохождения сигнала, начиная от оконного анализатора 1210 и заканчивая оконным синтезатором 1250 перед введением в компаратор 1260, как показано на фиг.12, в результате чего на выходе оконного синтезатора 1250 будет сгенерирован желаемый (оптимизированный) взвешенный модифицированный сигнал во временной области 1255. Наконец, устройство суммирования с наложением 1270 выполнено с возможностью сложения наложением последовательных блоков взвешенного модифицированного сигнала временной области 1255, преобразованного с помощью весовой функции анализа и весовой функции синтеза, отобранных компаратором 1260 с формированием развернутого во времени сигнала.

В частности, развернутый во времени сигнал 1271 может быть сформирован путем разнесения перекрывающихся последовательных блоков взвешенного модифицированного сигнала во временной области 1255 на большее расстояние относительно друг друга, чем расположены соответствующие блоки оригинального аудиосигнала 1201 или декодированного низкочастотного сигнала 1202. В дополнение к этому сумматор с наложением 1270' реализуют с возможностью временной развертки аудиосигнала 1201 или декодированного низкочастотного сигнала 1202, основной тон которого не меняется, с целью осуществления сценария „автономного растягивания временной шкалы".

В другой компоновке компаратор 1260 может быть помещен в тракте обработки сигнала после сумматора с наложением 1270 таким образом, что он тоже будет включен в схему анализа через синтез, что может обеспечить преимущество за счет того, что в этом случае эффекты от различных взвешенных модифицированных сигналов временной области 1251, обработанных блоком суммирования с наложением 1270, также могут быть приняты в расчет при последующем сопоставлении/выборе окна.

В других альтернативных реализациях процессор фазового вокодера 1200 может включать в себя также дециматор, выполненный, например, в форме простого преобразователя частоты дискретизации с возможностью децимации (сжатия) развернутого сигнала с получением децимированного сигнала в целевом частотном диапазоне алгоритма расширения полосы.

Дальнейшие конструктивные решения процессора фазового вокодера предусматривают выполнение прямого анализа входного аудиосигнала с целью выбора оптимальной оконной функции анализа, адаптированной к характеристикам проанализированного аудиосигнала. В частности, установлено, что определенные сигналы выигрывают от использования специфицированных окон анализа для фазового вокодера. Например, зашумленные сигналы лучше поддаются анализу с применением, например, окна Tukey, в то время как преимущественно тональные сигналы выигрывают от небольшого основного лепестка передаточной функции, который обеспечивает, например, окно Бартлетта.

Суммируя сказанное, можно отметить, что процедура подбора оптимальной оконной функции может быть осуществлена или только на стороне кодера, например кодеров расширения полосы пропускания 300 и 800 на фиг.3 и 8, где в последующем выведенный указатель окна передается на сторону декодера, например декодера расширения полосы пропускания 400 на фиг.4, или на обеих сторонах - кодера и декодера, как в случае кодеров/декодеров расширения полосы 500 и 600 на фиг.5 и 6 или кодеров/декодеров расширения полосы 1000 и 1100 на фиг.10 и 11.

В данном контексте преимуществом является то, что в последнем случае указатель окна не вводится как дополнительная служебная информация в состав кодированного аудиосигнала, благодаря чему битрейт для его хранения или передачи снижается.

На фиг.13 отображен вариант компоновки устройства 1300, выполненного с возможностью переключения между различными окнами анализа и синтеза в зависимости от управляющей информации в ходе время-частотных преобразований в рамках реализации фазового вокодера. Входящий битстрим 1301-1 обрабатывается интерпретатором потока данных, выполняющим функцию разделения управляющей информации 1301-2 и аудиоданных 1301-3. Кроме того, на основании управляющей информации 1301-2 к аудиоданным 1301-3 может быть применена оконная функция анализа 1311-1 из множества 1311-2 окон анализа. Здесь для наглядности показано множество 1311-2 из четырех разных окон анализа, отображенных рамками от „окно анализа 1" до „окно анализа 4", где блок „окно анализа 1" является активированным окном анализа 1311-1. Управляющая информация 1301-2 может являться результатом прямого расчета характеристик сигнала или следствием задействования схемы анализа через синтез, как описано ранее. В случае зашумленного сигнала может быть выбрано, допустим, окно Tukey, а в случае тонального сигнала может быть выбрано, скажем, окно Бартлетта. Окно Tukey, которое также можно назвать косинусоидально-клиновидным (серповидным), может быть отображено как косинусоидальный выступ шириной (α·2) N, свернутый совместно с прямоугольным окном шириной (1.0-α·2) N. Окно Tukey может быть построено с использованием

w ( n ) = { 1.0 ,0 | n | α N 2 0.5 [ 1.0 + cos [ π n α N 2 2 ( 1 α ) N 2 ] ] , α N 2 | n | N 2 , ( 1 )

где указанное окно превращается из прямоугольного окна в окно Ханнинга, так как параметр а изменяется от 0 до единицы. Окно Бартлетта, имеющее треугольную форму, может быть построено с помощью

w ( n ) = 1.0 | n | N / 2 . ( 2 )

В уравнениях (1) и (2) n - целочисленное значение, а N - ширина (в отсчетах) дискретизированных по времени оконных функций w(n).

После взвешивания окном анализа 1311-1 аудиосигнал может быть введен в блок „время-частотное преобразование" 1320 для дальнейшей трансформации из временной в частотную область. Сформированный спектр затем может быть передан для обработки в блок „преобразование в частотной области" 1330. В частности, блок 1330 может включать в себя фазокомпенсатор для фазовой корректировки спектральных характеристик. После этого модифицированный спектр может быть передан в блок „частотно-временное преобразование" 1340 для обратного преобразования во временную область с получением модифицированного сигнала временной области. В завершение, исходя из управляющей информации 1301-2, модифицированный сигнал временной области может быть взвешен с использованием окна синтеза 1351-1 из множества окон синтеза 1351-2, обозначенных от „окно синтеза 1" до „окно синтеза 4", из которых окно синтеза 1351-1 компенсирует эффекты от окна анализа 1311-1, с формированием на выходе устройства 1300 взвешенного модифицированного сигнала во временной области 1361 после сложения в блоке 1360, обозначенном знаком „+", всех возможных составляющих из всех каналов прохождения сигнала.

На фиг.14 представлена общая схема реализации декодера расширения полосы пропускания на базе фазового вокодера 1400. Практически, поток аудиоданных 1411-1 может быть разделен на кодированный сигнал нижних частот 1411-2 и данные гармонического расширения полосы пропускания/репликации спектральных полос HBE/SBR 1411-3. Закодированный сигнал низких частот 1411-2 декодируют с помощью корневого декодера 1420 с извлечением декодированного низкочастотного сигнала 1421, несущего в себе полосу центральной частоты 1425. Декодированный низкочастотный сигнал 1421 может содержать, предположим, данные ИКМ (импульсно-кодовой модуляции) с форматом фрейма 1024. Далее, декодированный низкочастотный сигнал 1421 проходит стадию задержки 1430 с образованием на выходе задержанного сигнала 1431. На следующем шаге сигнал с задержкой 1431 вводят в 32-полосный анализирующий банк КЗФ (квадратурно-зеркальных фильтров) 1440, генерирующий на основе задержанного сигнала 1431, например, 32 частотные подполосы 1441. Данные HBE/SBR 1411-3 могут включать в себя служебную информацию, управляющую коммутатором патчирования 1450, предназначенным для переключения между алгоритмом патчирования SBR и алгоритмом патчирования НВЕ. При задействовании алгоритма патчирования SBR частотные поддиапазоны 1441 поступают в устройство патчирования SBR 1460-1, формирующее патчированные данные КЗФ 1461. Патчированные данные КЗФ 1461 с выхода устройства патчирования SBR 1460-1 вводят в блок инструментальных средств HBE/SBR 1470-1, в схему которого могут быть включены, например, контур заполнения шумом 1470-2, контур восстановления недостающих гармоник 1470-3 или контур обратного фильтрования 1470-4. Так, с помощью блока инструментальных средств HBE/SBR 1470-1 к патчированным данным КЗФ 1461 могут быть применены известные механизмы репликации спектральных полос. В алгоритме патчирования, используемом устройством патчирования SBR 1460-1, может быть применено, например, зеркалирование или копирование спектральных данных в частотной области. Кроме того, управление блоком инструментальных средств HBE/SBR 1470-1 осуществляется с использованием данных HBE/SBR 1411-3. Патчированные данные КЗФ 1461 и выходные данные 1471 блока инструментальных средств HBE/SBR 1470-1 поступают в форматер огибающей 1470. Форматер огибающей 1470 введен с целью приведения огибающей в соответствие с генерируемым патчем таким образом, что на выходе формируется патчированный сигнал 1471 со скорректированной огибающей, включающий в себя полосу верхних частот. Сигнал со скорректированной огибающей 1471 вводят в синтезирующий банк КЗФ 1480, выполняющий функцию объединения компонент полосы верхних частот с аудиосигналом в частотной области 1441. В итоге на выходе синтезирован аудиосигнал 1481, обозначенный рамкой „форма волны".

В случае перехода к НВЕ-алгоритму патчирования (блок 1460-2) декодированный низкочастотный сигнал 1421 разбивают на отсчеты с пониженной частотой с помощью дискретизатора с увеличенным шагом 1490, скажем, на коэффициент 2, с получением версии декодированного низкочастотного сигнала 1491 с пониженной частотой дискретизации. Сигнал, дискретизированный с пониженной частотой 1491, далее может быть передан для обработки по усовершенствованной технологии с применением алгоритма гармонического расширения полосы пропускания на базе фазового вокодера.

С одной стороны, в случае необнаружения декодером нестационарности 1485 нестационарного события в блоке декодированного низкочастотного сигнала 1421 может быть использован адаптивный к сигналу метод обработки, где выполняется переключение между стандартным алгоритмом, показанным на схеме как путь прохождения сигнала 1500 с обозначением ,,no(/нет)", и усовершенствованным алгоритмом, показанным как путь сигнала 1510 с обозначением „yes(/da)", начиная с операции дополнения нулями (рамка 1515), в случае обнаружения события нестационарности в блоке.

С другой стороны, главным образом, выполняется адаптивная к сигналу коммутация характеристик окон анализа с помощью время-частотного преобразователя в структуре фазового вокодера, как подробно рассмотрено выше. Так, на фиг.14 рамки с пунктирным контуром 1520; 1530 обозначают окна, изменяемые через сигнал. В целом, фиг.14 демонстрирует приложение конструктивного решения фиг.13 к реализации процесса расширения полосы пропускания на базе фазового вокодера.

Здесь, рамки, обозначенные „FFT(/БПФ)" (быстрое преобразование Фурье), „фазовая адаптация" и „iFFT(/ОБПФ)" (обратное быстрое преобразование Фурье) могут соответствовать элементам 1320, 1330 и 1340 схемы на фиг.13 в порядке перечисления. В частности, преобразователи БПФ и ОБПФ могут быть реализованы с возможностью выполнения в отношении блока декодированного низкочастотного сигнала 1421 оконного преобразования Фурье (ОПФ) или дискретного преобразования Фурье (ДПФ) и обратного оконного преобразования (ООПФ) или обратного дискретного преобразования Фурье (ОДПФ) соответственно. В дополнение к этому декодер расширения полосы пропускания 1400 на фиг.14 может также включать в свой рабочий цикл этап повышения частоты дискретизации 1540, этап сложения наложением (OLA) 1550 и этап децимации 1560.

Обратим внимание на то, что представленный выше подход обеспечивает возможность коммутации разновидностей окон в любой позиции внутри аудиосигнала.

Несмотря на то, что данное изобретение представлено в контексте принципиальных блочных схем, где в виде блоков отображены реальные или логические инструментальные средства, изобретение также может быть реализовано как способ, осуществляемый в компьютерной среде. В этом случае блоки (рамки) схемы отображают соответствующие шаги осуществления способа, заменяющие аппаратные функции, выполняемые соответствующими логическими или физическими элементами технических средств.

Описанные выше примеры реализации приведены исключительно для наглядного представления основных принципов, лежащих в основе настоящего изобретения. Подразумевается, что для специалистов в данной области возможность внесения изменений и усовершенствований в компоновку и элементы описанной конструкции очевидна. В силу этого, представленные здесь описания и пояснения вариантов реализации изобретения ограничиваются только рамками патентных требований, а не конкретными деталями.

В зависимости от конкретных требований к практическому осуществления способов, относящихся к изобретению, эти способы могут быть реализованы в виде аппаратного или программного обеспечения. Для реализации может быть использована цифровая среда хранения информации, как, например, диск, DVD или CD, несущая электронно считываемые управляющие сигналы, совместимые с программируемыми вычислительными системами и обеспечивающие осуществление заявленных в изобретении способов. В целом, данное изобретение может быть реализовано как компьютерный программный продукт с хранящемся на машинно-считываемом накопителе кодом программы, обеспечивающим осуществление являющихся частью изобретения способов при условии, что компьютерный программный продукт выполняется на компьютерной техники. Иначе говоря, методы, относящиеся к изобретению, представляют собой, таким образом, компьютерную программу с присвоенным ей кодом программы, предназначенную для реализации, по меньшей мере, одного из относящихся к изобретению методов при выполнении компьютерной программы на компьютере. Относящийся к изобретению кодированный аудиосигнал может храниться на любом машиночитаемом носителе данных, относящемся к цифровой среде хранения информации.

Преимущества нового процесса обработки состоят в том, что представленные выше конструктивные решения, то есть - заявленные устройство, способы или компьютерные программы, направленные на расширение полосы пропускания частот, позволяют улучшить качество акустического восприятия. В частности, в этом процессе использована адаптивная к сигналу коммутация характеристик окон анализа, скажем, в рамках расширения полосы пропускания на базе фазового вокодера.

Новелла заявленного процесса применима в других приложениях фазового вокодера, таких как автономное растягивание временной шкалы в каждом случае, когда необходимо принимать в расчет характеристики сигнала для выбора оптимального окна анализа или синтеза.

Представленная концепция дает возможность расширению полосы пропускания с учетом характеристик сигнала при выполнении процедуры патчирования (заполнения пропуска). Решение о наиболее подходящем окне анализа может быть принято в пределах открытого или замкнутого контура. Благодаря этому через оптимизацию процесса восстановления достигается лучшее качество.

Наилучшее приложение предусматривается в аудиодекодерах, построенных на принципах расширения полосы пропускания. Тем не менее процесс, относящийся к изобретению, может также расширить сферу применения фазового вокодера, включая в нее музыкальную звукозапись или постпроцессинг фонограмм.

Похожие патенты RU2563164C2

название год авторы номер документа
УСТРОЙСТВО И СПОСОБ ДЛЯ ФОРМИРОВАНИЯ СИГНАЛА С РАСШИРЕННОЙ ПОЛОСОЙ ПРОПУСКАНИЯ ИЗ АУДИОСИГНАЛА С ОГРАНИЧЕННОЙ ПОЛОСОЙ ПРОПУСКАНИЯ 2013
  • Нагель Фредерик
  • Вильде Штефан
RU2611974C2
УСТРОЙСТВО, СПОСОБ И КОМПЬЮТЕРНАЯ ПРОГРАММА ДЛЯ ВЫРАБОТКИ ШИРОКОПОЛОСНОГО СИГНАЛА С ИСПОЛЬЗОВАНИЕМ УПРАВЛЯЕМОГО РАСШИРЕНИЯ ШИРИНЫ ПОЛОСЫ И СЛЕПОГО РАСШИРЕНИЯ ШИРИНЫ ПОЛОСЫ 2011
  • Нагель Фредерик
  • Нойендорф Макс
  • Шнелль Маркус
  • Мултрус Маркус
RU2527735C2
УСТРОЙСТВО, СПОСОБ И НОСИТЕЛЬ С ПРОГРАММНЫМ КОДОМ ДЛЯ ГЕНЕРИРОВАНИЯ ПРЕДСТАВЛЕНИЯ СИГНАЛА С РАСШИРЕННЫМ ДИАПАЗОНОМ ЧАСТОТ НА ОСНОВЕ ПРЕДСТАВЛЕНИЯ ВХОДНОГО СИГНАЛА С ИСПОЛЬЗОВАНИЕМ СОЧЕТАНИЯ ГАРМОНИЧЕСКОГО РАСШИРЕНИЯ ДИАПАЗОНА ЧАСТОТ И НЕГАРМОНИЧЕСКОГО РАСШИРЕНИЯ ДИАПАЗОНА ЧАСТОТ 2010
  • Нагел Фредерик
  • Нуендорф Макс
  • Реттелбач Николаус
  • Лекомте Джереми
  • Мултрус Маркус
  • Грилл Бернхард
  • Диш Саша
RU2452044C1
УСТРОЙСТВО И СПОСОБ ДЕКОДИРОВАНИЯ КОДИРОВАННОГО АУДИОСИГНАЛА С НИЗКИМИ ВЫЧИСЛИТЕЛЬНЫМИ РЕСУРСАМИ 2014
  • Нидермайер Андреас
  • Вильде Штефан
  • Фишер Даниэль
  • Хильденбранд Маттиас
  • Гайер Марк
  • Нойендорф Макс
RU2644135C2
УСТРОЙСТВО И СПОСОБ РАСШИРЕНИЯ ПОЛОСЫ ПРОПУСКАНИЯ АУДИО СИГНАЛА 2009
  • Нагель Фредерик
  • Диш Саша
  • Нуендорф Макс
RU2455710C2
АДАПТИВНОЕ РАСШИРЕНИЕ ПОЛОСЫ ПРОПУСКАНИЯ И УСТРОЙСТВО ДЛЯ ЭТОГО 2014
  • Гао Ян
RU2641224C2
СПОСОБ РАСШИРЕНИЯ ШИРИНЫ ПОЛОСЫ, УСТРОЙСТВО РАСШИРЕНИЯ ШИРИНЫ ПОЛОСЫ, ПРОГРАММА, ИНТЕГРАЛЬНАЯ СХЕМА И УСТРОЙСТВО ДЕКОДИРОВАНИЯ АУДИО 2011
  • Исикава Томоказу
  • Норимацу Такеси
  • Чжоу Хуань
  • Чун Кок Сэн
  • Чжун Хайшань
RU2582061C2
УСТРОЙСТВО И СПОСОБ ПОЛУЧЕНИЯ УЛУЧШЕННОЙ ЧАСТОТНОЙ ХАРАКТЕРИСТИКИ И ВРЕМЕННОГО ФАЗИРОВАНИЯ СПОСОБОМ РАСШИРЕНИЯ ПОЛОСЫ АУДИО СИГНАЛОВ В ФАЗОВОМ ВОКОДЕРЕ 2011
  • Диш Саша
  • Нагел Фредерик
  • Вилде Стефан
  • Виллемоес Ларс
  • Экстранд Пер
RU2596033C2
УСТРОЙСТВО И СПОСОБ ДЛЯ ГЕНЕРИРОВАНИЯ ВЫСОКОЧАСТОТНОГО АУДИОСИГНАЛА С ПРИМЕНЕНИЕМ АДАПТИВНОЙ ИЗБЫТОЧНОЙ ДИСКРЕТИЗАЦИИ 2010
  • Виллемоес Ларс
  • Экстранд Пер
  • Диш Саша
  • Нагел Фредерик
  • Вилд Штефан
RU2547220C2
УСТРОЙСТВО И СПОСОБ ГЕНЕРИРОВАНИЯ СИГНАЛА С РАСШИРЕННОЙ ПОЛОСОЙ ПРОПУСКАНИЯ 2009
  • Нагель Фредерик
  • Диш Саша
  • Нуендорф Макс
  • Баер Стефан
  • Гайер Марк
  • Лохвассер Маркус
  • Реттелбах Николаус
  • Краемер Ульрих
RU2512090C2

Иллюстрации к изобретению RU 2 563 164 C2

Реферат патента 2015 года КОДЕР РАСШИРЕНИЯ ПОЛОСЫ ПРОПУСКАНИЯ, ДЕКОДЕР РАСШИРЕНИЯ ПОЛОСЫ ПРОПУСКАНИЯ И ФАЗОВЫЙ ВОКОДЕР

Изобретение относится к средствам расширения полосы пропускания. Технический результат заключается в улучшении акустических качеств выходного аудиосигнала. Кодер для кодирования аудиосигнала включает в себя анализатора сигнала, корневой кодер и вычислитель параметров. Аудиосигнал содержит низкочастотный сигнал, включающий в себя полосу центральной частоты, и высокочастотный сигнал, включающий в себя полосу верхних частот. Анализатор сигналов предназначен для анализа аудиосигнала, содержащего блок аудиоотсчетов, который имеет некоторую протяженность во времени. Анализатор сигналов также предназначен для выбора из множества окон анализа окна анализа для использования при расширении полосы пропускания на стороне декодера расширения полосы пропускания. Корневой кодер для кодирования низкочастотного сигнала с получением кодированного сигнала или сигнала с частотным кодированием. Вычислитель параметров предназначен для расчета параметров расширения полосы пропускания на основе высокочастотного сигнала. 16 н. и 7 з.п. ф-лы, 15 ил.

Формула изобретения RU 2 563 164 C2

1. Кодер расширения полосы пропускания (100; 300; 500; 800; 1000), предназначенный для кодирования аудиосигнала (101-1), содержащего низкочастотный сигнал (101-2), включающий полосу центральных частот (101-3), и содержащего высокочастотный сигнал (101-4), включающий полосу верхних частот (101-5), при этом в состав кодера (100; 300; 500; 800; 1000) входят:
анализатор сигнала (110), предназначенный для анализа аудиосигнала (101-1), содержащего блок аудиоотсчетов (101-6) определенной длительности во времени, выполненный с возможностью определения из множества (111-1) окон анализа окна анализа (111-2) для приложения при расширении полосы пропускания на стороне декодера расширения полосы пропускания (200; 400; 1400);
корневой кодер (120), предназначенный для кодирования низкочастотного сигнала (101-2) с получением кодированного низкочастотного сигнала (121); и
вычислитель параметров (130; 320; 830; 1030), предназначенный для расчета на основе высокочастотного сигнала (101-4) параметров расширения полосы пропускания (131; 321-2; 831; 1031);
кодер расширения полосы пропускания (300; 500), далее включающий оконный контроллер (310), предназначенный для вывода информации по управлению окнами (311), содержащей указания на множество (111-1) оконных функций анализа;
вычислитель параметров (320), включающий оконный преобразователь, управляемый оконным контроллером (310), где оконный преобразователь выполняет приложение множества (111-1) оконных функций анализа и оконной функции анализа (111-2), выбранной компаратором (340; 510), к высокочастотному сигналу (101-4),
анализатор сигнала (110) с модулем патчирования (330), генерирующий множество (331-1) патчированных сигналов на основе низкочастотного сигнала (101-2), информации по управлению окнами (311) и параметров BWE (расширения полосы пропускания) (321-1), где патчированные сигналы (331-1) содержат полосы верхних частот (331-2), генерируемые из полосы центральных частот (101-3);
компаратор (340; 510), предназначенный для определения множества (341-2) сравнительных параметров путем сравнения патчированных сигналов (331-1) и контрольного сигнала, являющегося аудиосигналом (101-1) или сигналом (101-4; 101-2) производным от аудиосигнала, где множество (341-2) сравнительных параметров соответствует множеству (111-1) оконных функций анализа, при этом компаратор (340; 510) предназначен также для указания окна (341-1; 511), соответствующего оконной функции анализа (111-2), для которой сравнительный параметр удовлетворяет заданному условию; и
выходной интерфейс (350; 530), предназначенный для вывода кодированного аудиосигнала (351; 531).

2. Декодер расширения полосы пропускания (200; 400; 600; 1100; 1400), выполняющий декодирование закодированного аудиосигнала (201-1; 401-1; 601-1; 1411-1), содержащего в себе кодированный низкочастотный сигнал (201-2; 401-2; 601-2; 1411-2) и параметры верхней полосы частот (201-3; 401-3; 601-3; 1411-3), при этом в состав декодера (200; 400; 600; 1100; 1400) включены:
корневой декодер (210; 410; 680; 1420), предназначенный для декодирования закодированного низкочастотного сигнала (201-2; 401-2; 601-2; 1411-2), содержащего полосу центральных частот (211-2; 411-2; 681-2; 1425);
модуль патчирования (220; 420; 1460-2), генерирующий патчированный сигнал (221-1; 421; 671; 1461) на основе декодированного низкочастотного сигнала (211-1; 411-1; 681-1; 1421) и параметров верхней полосы частот (201-3; 401-3; 601-3; 1411-3), при этом патчированный сигнал (221-1; 421; 671; 1461) содержит полосу верхних частот (221-2), генерированную на основе полосы центральных частот (211-2; 411-2; 681-2; 1425); и
комбинатор (230; 430; 690; 1480), предназначенный для сведения патчированного сигнала (221-1; 421; 671; 1461) и декодированного низкочастотного сигнала (211-1; 411-1; 681-1; 1421) с выводом совокупного выходного сигнала (231-1; 431; 691; 1481),
где модуль патчирования (220) включает:
оконный анализатор (610), предназначенный для приложения множества (111-1) оконных функций анализа к декодированному низкочастотному сигналу (681-1) с получением множества (611) взвешенных сигналов низких частот;
время-спектральный преобразователь (620), трансформирующий взвешенные низкочастотные сигналы (611) в спектры (621);
процессор частотной области (630), обрабатывающий спектры (621) в частотной области с получением модифицированных спектров (631);
частотно-временной преобразователь (640), преобразующий модифицированные спектры (631) в модифицированные сигналы временной области (641);
оконный синтезатор (650), применяющий множество оконных функций синтеза к модифицированным сигналам временной области (641), при этом оконные функции синтеза соотнесены с оконными функциями анализа, что обеспечивает формирование взвешенных модифицированных сигналов во временной области (651); и
компаратор (660), предназначенный для нахождения множества сравнительных параметров на основе сопоставления множества (651) взвешенных модифицированных сигналов временной области с низкочастотным сигналом (681-1), при этом множество сравнительных параметров соответствует множеству (111-1) оконных функций анализа, кроме того, компаратор (660) выполнен с возможностью подбора оконной функции анализа и оконной функция синтеза, для которых сравнительный параметр удовлетворяет требуемому условию;
с учетом сказанного модуль патчирования (220) предназначен для генерации патчированного сигнала (671) на основании декодированного низкочастотного сигнала (681-1), оконной функции анализа и оконной функции синтеза, подобранных компаратором (660), и параметров полосы верхних частот (601-3).

3. Кодер расширения полосы пропускания (500) по п.1, в котором модуль патчирования (330) включает оконный преобразователь, управляемый оконным контроллером (310), предназначенный для применения множества (111-1) оконных функций анализа к низкочастотному сигналу (101-2);
где компаратор (510) выполнен с возможностью нахождения множества сравнительных параметров на основании сравнения патчированных сигналов (331-1) с опорным низкочастотным сигналом (101-2), производным от аудиосигнала; и
в котором устройство выходного интерфейса (530) выводит кодированный аудиосигнал (531), не содержащий указатель окна (511).

4. Кодер (300; 500) расширения полосы пропускания по п.1 или 3, в котором компаратор (340; 510; 660; 700) предназначен для расчета множества (703-1) параметров спектральной неравномерности SFM для патчированных сигналов (331-1) или взвешенных модифицированных сигналов временной области (651) и опорного параметра SFM (703-2), выведенного из аудиосигнала (101-1) или декодированного низкочастотного сигнала (681-1), и для нахождения множества (705) сравнительных параметров путем сопоставления параметров SFM (703-1) и опорного параметра SFM (703-2).

5. Декодер (600) расширения полосы пропускания по п.2, в котором компаратор (340; 510; 660; 700) предназначен для расчета множества (703-1) параметров спектральной неравномерности SFM для патчированных сигналов (331-1) или взвешенных модифицированных сигналов временной области (651) и опорного параметра SFM (703-2), выведенного из аудиосигнала (101-1) или декодированного низкочастотного сигнала (681-1), и для нахождения множества (705) сравнительных параметров путем сопоставления параметров SFM (703-1) и опорного параметра SFM (703-2).

6. Кодер расширения полосы пропускания (800) по п.1, в составе которого анализатор сигнала (110) включает в себя классификатор сигналов (810; 900), предназначенный для классификации аудиосигнала (101-1) или его деривата (101-4) с целью определения указателя окна (811), соответствующего оконной функции анализа, исходя из характеристики классифицированного сигнала; кодер (800), в составе которого оконный контроллер (820) формирует информацию по управлению окнами (821) на основании указателя окна (811), определенного классификатором сигналов (810); вычислитель параметров (830) включает в себя оконный преобразователь, управляемый оконным контроллером (820), выполненный с возможностью применения оконной функции анализа к высокочастотному сигналу (101-4) на основании информации по управлению окнами (821); и устройство выходного интерфейса (840) обеспечивает вывод кодированного аудиосигнала (841).

7. Кодер расширения полосы пропускания (1000) по п.1, в составе которого анализатор сигнала (110) включает в себя классификатор сигналов (900; 1010), классифицирующий низкочастотный сигнал (101-2), производный от аудиосигнала (101-1), с целью определения указателя окна (1011), соответствующего оконной функции анализа, исходя из характеристики классифицированного сигнала; оконный контроллер (1020) выводит информацию по управлению окнами (1021) на основании указателя окна (1011), определенного классификатором сигналов (900; 1010); вычислитель параметров (1030) включает в себя оконный преобразователь, управляемый оконным контроллером (1020), применяющий оконную функцию анализа к высокочастотному сигналу (101-4) на основании информации по управлению окнами (1021); и устройство выходного интерфейса (1040), обеспечивающее вывод кодированного аудиосигнала (1041), не содержащего указатель окна (1011).

8. Кодер расширения полосы пропускания (500; 1000) в соответствии с пп. 3 или 7, в который также входит корневой декодер (520; 1050), выполняющий декодирование закодированного низкочастотного сигнала (121) с выводом декодированного низкочастотного сигнала (521; 1051).

9. Процессор фазового вокодера (1200), выполняющий обработку аудиосигнала (1201), включающий:
оконный анализатор (1210), предназначенный для применения множества (111-1) оконных (весовых) функций анализа к аудиосигналу (1201) или сигналу (1202), производному от аудиосигнала, причем аудиосигнал (1201) содержит блок (101-6) аудиоотсчетов, имеющий определенную длину во времени, с целью получения множества (1211) взвешенных аудиосигналов;
время-спектральный преобразователь (1220), предназначенный для трансформирования взвешенных аудиосигналов (1211) в спектры (1221);
процессор частотной области (1230), предназначенный для обработки спектров (1221) в области трансформанты с формированием модифицированных спектров (1231);
частотно-временной преобразователь (1240), предназначенный для преобразования модифицированных спектров (1231) в модифицированные сигналы временной области (1241);
оконный синтезатор (1250), предназначенный для применения множества весовых функций синтеза к модифицированным сигналам во временной области (1241), при этом оконные весовые функции синтеза соотнесены с весовыми функциями анализа, с образованием взвешенных модифицированных сигналов временной области (1251);
компаратор (1260), предназначенный для определения множества сравнительных параметров на основе сопоставления множества (1251) взвешенных модифицированных сигналов во временной области с аудиосигналом (1201) или деривата (1202) аудиосигнала, при этом множество сравнительных параметров соответствует множеству оконных функций анализа, и при этом компаратор (1260), кроме того, выполнен с возможностью подбора оконной функции анализа и оконной функции синтеза, для которых сравнительный параметр удовлетворяет заданному условию; и
устройство суммирования с наложением (1270), выполняющее сложение наложением блоков взвешенного модифицированного сигнала временной области (1255) с формированием сигнала с растянутой временной шкалой, предназначенное для обработки блоков взвешенного сигнала временной области (1255), модифицированного посредством весовой функции анализа и весовой функции синтеза, отобранных компаратором (1260).

10. Способ (100; 300; 500; 1000) кодирования аудиосигнала (101-1), состоящего из низкочастотного сигнала (101-2), содержащего полосу центральных частот (101-3), и высокочастотного сигнала (101-4), содержащего полосу верхних частот (101-5), включающий:
анализ (110) аудиосигнала (101-1), содержащего блок (101-6) аудиоотсчетов, имеющий определенную протяженность во времени, с целью определения из множества (111-1) окон анализа окна анализа (111-2) для использования в процедуре расширения полосы пропускания на стороне декодера расширения полосы пропускания (200; 400; 1400);
кодирование (120) низкочастотного сигнала (102-2) с формированием кодированного низкочастотного сигнала (121); и
вычисление (130; 320; 830; 1030) параметров расширения полосы пропускания на основе высокочастотного сигнала (101-4);
способ дополнительно включает:
обеспечение информации по управлению окнами (311) с указанием множества (111-1) оконных функций анализа, приложение множества (111-1) оконных функций анализа и оконной функции анализа (111-2), выбранной компаратором (340; 510), к высокочастотному сигналу (101-4), генерация множества (331-1) патчированных сигналов на основе низкочастотного сигнала (101-2), информации по управлению окнами (311) и параметров BWE (321-1), где патчированные сигналы (331-1) включают полосы верхних частот (331-2) генерируемые из полосы центральных частот (101-3);
определение множества (341-2) сравнительных параметров на основе сравнения патчированных сигналов (331-1) и контрольного сигнала, являющегося аудиосигналом (101-1) или сигналом (101-4; 101-2), производным от аудиосигнала, где множество (341-2) сравнительных параметров соответствует множеству (111-1) оконных функций анализа, и указание окна (341-1; 511), соответствующего оконной функции анализа (111-2), для которой сравнительный параметр удовлетворяет заданному условию; и
обеспечение кодированного аудиосигнала (351; 531).

11. Способ (200; 400; 600; 1100; 1400) декодирования закодированного аудиосигнала (201-1; 401-1; 601-1; 1411-1), содержащего кодированный низкочастотный сигнал (201-2; 401-2; 601-2; 1411-2) и параметры верхней полосы частот (201-3; 401-3; 601-3; 1411-3), включающий:
декодирование (210; 410; 680; 1420) закодированного низкочастотного сигнала (201-2; 401-2; 601-2; 1411-2), содержащего полосу центральных частот (211-2; 411-2; 681-2; 1425);
генерирование (220; 420; 1460-2) патчированного сигнала (221-1; 421; 671; 1461), исходя из декодированного низкочастотного сигнала (211-1; 411-1; 681-1; 1421) и параметров полосы верхних частот (201-3; 401-3; 601-3; 1411-3), при этом патчированный сигнал (221-1; 421; 671; 1461), содержит полосу верхних частот (221-2), генерированную из полосы центральных частот (211-2; 411-2; 681-2; 1425); и
сведение (230; 430; 690; 1480) патчированного сигнала (221-1; 421; 671; 1461) и декодированного низкочастотного сигнала (211-1; 411-1; 681-1; 1421) с получением сведенного выходного сигнала (231-1; 431; 691; 1481), при этом генерация (220) патчированного сигнала включает:
приложение множества (111-1) оконных функций анализа к декодированному низкочастотному сигналу (681-1) с получением множества (611) оконно-взвешенных низкочастотных сигналов;
преобразование оконно-взвешенных низкочастотных сигналов (611) в спектры (621);
обработка спектров (621) в частотной области с получением модифицированных спектров (631);
преобразование модифицированных спектров (631) в модифицированные сигналы временной области (641);
приложение множества оконных функций синтеза к модифицированным сигналам временной области (641), при выполнении которого оконные функции синтеза согласуются с оконными функциями анализа с формированием оконно-взвешенных модифицированных сигналов временной области (651); и
определение множества сравнительных параметров на основе сравнения множества (651) взвешенных модифицированных сигналов временной области и декодированного низкочастотного сигнала (681-1), где множество сравнительных параметров соответствует множеству (111-1) весовых (оконных) функций анализа, и подбор оконной функции анализа и оконной функции синтеза, для которых сравнительный параметр удовлетворяет заданному условию, и генерирование патчированного сигнала (671) на основе декодированного низкочастотного сигнала (681-1), оконной функции анализа и оконной функции синтеза, подобранных путем определения множества сравнительных параметров и параметров верхней полосы частот (601-3).

12. Способ обработки аудиосигнала (1201) с помощью процессора фазового вокодера (1200), включающий:
приложение множества (111-1) оконных функций анализа к аудиосигналу (1201) или к производному от него сигналу (1202), когда аудиосигнал (1201) содержит блок (101-6) аудиоотсчетов, имеющий определенную продолжительность во времени, с формированием множества (1211) взвешенных аудиосигналов с помощью оконного анализатора (1210);
преобразование взвешенных аудиосигналов (1211) в спектры (1221) с помощью время-спектрального преобразователя (1220);
обработка спектров (1221) в частотной области с формированием модифицированных спектров (1231) с помощью процессора частотной области (1230);
преобразование модифицированных спектров (1231) в модифицированные сигналы временной области (1241) с помощью частотно-временного преобразователя (1240);
приложение множества оконных функций синтеза к модифицированным сигналам временной области (1241), при котором оконные функции синтеза согласуются с оконными функциями анализа с формированием взвешенных модифицированных сигналов временной области (1251) с помощью оконного синтезатора (1250);
определение множества сравнительных параметров на основе сравнения множества (1251) взвешенных модифицированных сигналов временной области и аудиосигнала (1201) или производного от аудиосигнала сигнала (1202), где множество сравнительных параметров соответствует множеству оконных функций анализа, с помощью компаратора (1260) и подбор оконной функции анализа и оконной функции синтеза, для которых сравнительный параметр удовлетворяет заданному условию, с помощью компаратора (1260); и
сложение с наложением блоков взвешенного модифицированного сигнала временной области (1255) с формированием развернутого во времени сигнала (1271) с помощью сумматора с наложением (1270) и обработка блоков взвешенного модифицированного сигнала временной области (1255), модифицированных посредством оконной функции анализа и оконной функции синтеза, подобранных на шаге отбора компаратором (1260), с помощью сумматора с наложением (1270).

13. Машиночитаемая запоминающая среда, хранящая компьютерную программу, имеющую код программы, для осуществления способа по п.10 при условии выполнения компьютерной программы на компьютере.

14. Машиночитаемый носитель информации, с сохраненной на нем компьютерной программой, имеющей код программы, для осуществления способа по п.11 при условии выполнения компьютерной программы на компьютере.

15. Машиночитаемый носитель информации с сохраненной на нем компьютерной программой, имеющей код программы, для осуществления способа по п.12 при условии выполнения компьютерной программы на компьютере.

16. Кодер расширения полосы пропускания (800), кодирующий аудиосигнал (101-1) с формированием кодированного аудиосигнала (103-1), причем аудиосигнал (101-1) содержит низкочастотный сигнал (101-2), включающий полосу центральных частот (101-3), и высокочастотный сигнал (101-4), включающий полосу верхних частот (101-5), при этом в состав кодера (800) входят:
анализатор сигнала (110), предназначенный для анализа аудиосигнала (101-1), содержащего блок аудиоотсчетов (101-6) определенной длительности во времени, выполненный с возможностью определения из множества (111-1) оконных функций анализа оконную функцию анализа (111-2) для приложения при расширении полосы пропускания на стороне декодера расширения полосы пропускания (400), включающий классификатор сигналов (810), который классифицирует аудиосигнал (101-1) или сигнал, производный от аудиосигнала (101-4), определяя указатель окна (811), соответствующий оконной функции анализа, исходя из характеристики аудиосигнала;
оконный контроллер (820), обеспечивающий на выходе информацию по управлению окнами (821) на основе указателя окна (811), определяемого классификатором сигналов (810), содержащую множество (111-1) оконных функций анализа с различными оконными характеристиками, где оконные функции анализа имеют разнообразные передаточные функции, отличающиеся шириной главного лепестка, уровнями боковых лепестков или спадами боковых лепестков;
корневой кодер (120), предназначенный для кодирования низкочастотного сигнала (101-2) с получением кодированного низкочастотного сигнала (121);
вычислитель параметров (830), рассчитывающий параметры расширения полосы пропускания (831) на основе высокочастотного сигнала (101-4), включающий оконный преобразователь, управляемый оконным контроллером (820), где оконный преобразователь отвечает за приложение оконной функции анализа, исходя из информации по управлению окнами (821), к высокочастотному сигналу (101-4); и
выходной интерфейс (840) для вывода кодированного аудиосигнала (841), содержащего кодированный низкочастотный сигнал (121), параметры расширения полосы пропускания и указатели окон (811).

17. Кодер расширения полосы пропускания (800) по п.16, в составе которого классификатор сигналов (810) включает:
измеритель тонального уровня (910), анализирующий аудиосигнал на меру тональности;
определитель типа сигнала (920), распознающий характеристики аудиосигнала на основе меры тональности; и
оконный селектор (930), обеспечивающий указатель окна (811) исходя из характеристики сигнала.

18. Кодер расширения полосы пропускания (800) по п.16, схема которого предусматривает подачу информации по управлению окнами (821) на драйвер параметров таким образом, что первая оконная функция, характеризующаяся передаточной функцией, имеющей первую ширину главного лепестка, применяется оконным преобразователем вычислителя параметров (830), когда вычисленная мера тональности аудиосигнала ниже заданного порогового значения, и таким образом, что вторая оконная функция, характеризующаяся передаточной функцией, имеющей вторую ширину главного лепестка, применяется оконным преобразователем вычислителя параметров (830), когда вычисленная мера тональности аудиосигнала равна или выше предварительно заданного порогового значения, при этом первая ширина главного лепестка превосходит вторую ширину главного лепестка.

19. Декодер расширения полосы пропускания (400), предназначенный для декодирования кодированного аудиосигнала (401-1), содержащего закодированный низкочастотный сигнал (401-2), параметры верхней полосы частот (401-3) и указатель окна (401-4), при этом в состав декодера (400) входят:
корневой декодер (410), декодирующий кодированный низкочастотный сигнал (401-2), где декодированный низкочастотный сигнал (411-1) включает полосу центральных частот (411-2);
модуль патчирования (420), генерирующий патчированный сигнал (421) на основе декодированного низкочастотного сигнала (411-1) и параметров верхней полосы частот (401-3), где патчированный сигнал (421) содержит полосу верхних частот (221-2), генерируемых из полосы центральных частот (211-2; 411-2), при этом модуль патчирования (420) включает управляемый оконный преобразователь, селектирующий оконную функцию анализа из множества оконных функций анализа на основе указателя окна (401-4) и применяющий селектированную оконную функцию анализа к декодированному низкочастотному сигналу (411-1) с формированием патчированного сигнала (421), где множество (111-1) оконных функций анализа, обозначенных указателем окна, включает различные оконные функции анализа с разнообразными оконными характеристиками, где оконные функции анализа имеют разнообразные передаточные функции, отличающиеся шириной главного лепестка, уровнями боковых лепестков или спадами боковых лепестков; и
комбинатор (430), представляющий собой блок сведения патчированного сигнала (421) и декодированного низкочастотного сигнала (411-1) с формированием сведенного выходного сигнала (431).

20. Способ (100; 300; 500; 1000) кодирования аудиосигнала (101-1), содержащего низкочастотный сигнал (101-2) с полосой центральных частот (101-3) и высокочастотный сигнал (101-4) с полосой верхних частот (101-5), включающий:
анализ (110) аудиосигнала (101-1), содержащего блок аудиоотсчетов (101-6) определенной длительности во времени, для определения из множества (111-1) оконных функций анализа оконной функции анализа (111-2) для приложения при расширении полосы пропускания на стороне декодера расширения полосы пропускания (400), включающий классификацию аудиосигнала (101-1) или сигнала (101-4), производного от аудиосигнала, с использованием классификатора сигналов (810) для определения указателя окна (811), соответствующего оконной функции анализа, исходя из характеристики аудиосигнала;
обеспечение с помощью оконного контроллера (820) информации по управлению окнами (821) на основе указателя окна (811), определенного классификатором сигналов (810), где множество (111-1) оконных функций анализа, указанных в информации по управлению окнами на выходе оконного контроллера, включает различные оконные функции анализа с разнообразными оконными характеристиками, с передаточными функциями, различающимися шириной главного лепестка, уровнями боковых лепестков или спадами боковых лепестков;
кодирование (120) низкочастотного сигнала (102-2) с формированием кодированного низкочастотного сигнала (121);
расчет (130) параметров расширения полосы пропускания из высокочастотного сигнала с приложением оконной функции анализа на основе информации по управлению окнами (821) к высокочастотному сигналу (101-4) посредством оконного преобразователя, управляемого оконным контроллером (820);
вывод посредством выходного интерфейса (840) кодированного аудиосигнала (841), содержащего кодированный низкочастотный сигнал (121), параметры расширения полосы пропускания и указатель окна (811).

21. Способ декодирования кодированного аудиосигнала (401-1), содержащего кодированный низкочастотный сигнал (401-2), параметры верхней полосы частот (401-3) и указатель окна (401-4), включающий:
декодирование (410) кодированного низкочастотного сигнала (401-2), где декодированный низкочастотный сигнал (411-1) содержит полосу центральных частот (411-2);
генерирование (420) на основе декодированного низкочастотного сигнала (411-1) и параметров верхней полосы частот (401-3) патчированного сигнала (421), содержащего полосу верхних частот (221-2), формируемую из полосы центральных частот (411-2), включающее подбор управляемым оконным преобразователем оконной функции анализа из множества оконных функций анализа на основе указателя окна (401-4) и приложение выбранной оконной функции анализа к декодированному низкочастотному сигналу (411-1) с формированием патчированного сигнала (421), где множество (111-1) оконных функций анализа, обозначенных указателем окна, включает различные оконные функции анализа с разнообразными оконными характеристиками, где оконные функции анализа имеют разнообразные передаточные функции, отличающиеся шириной главного лепестка, уровнями боковых лепестков или спадами боковых лепестков; и
сведение (430) патчированного сигнала (421) и декодированного низкочастотного сигнала (411-1) с формированием сведенного выходного сигнала (431).

22. Машиночитаемый носитель информации, с сохраненной на нем компьютерной программой, имеющей код программы, предназначенной для осуществления способа по п.20 при условии выполнения компьютерной программы на компьютере.

23. Машиночитаемый носитель информации, с сохраненной на нем компьютерной программой, имеющей код программы, предназначенной для осуществления способа по п.21 при условии выполнения компьютерной программы на компьютере.

Документы, цитированные в отчете о поиске Патент 2015 года RU2563164C2

EP 1672618 A1, 21.06.2006

RU 2 563 164 C2

Авторы

Нагел Фредерик

Мултрус Маркус

Диш Саша

Лекомте Джереми

Ертел Кристиан

Вармболд Патрик

Даты

2015-09-20Публикация

2010-06-24Подача