Область техники, к которой относится изобретение
Настоящее изобретение относится к устройству масштабируемого декодирования и устройству масштабируемого кодирования, используемым для осуществления связи с использованием речевых сигналов и аудиосигналов в системе мобильной связи и в системе пакетной связи, использующей интернет-протокол.
Уровень техники
Для эффективного использования радиоресурсов в системе мобильной связи необходимо сжимать речевые сигналы на низкой битовой скорости. С другой стороны, пользователь ожидает повышение качества передаваемой речи и реализации услуг связи с высокой точностью ощущения. Чтобы реализовать это, предпочтительно не только повышать качество речевых сигналов, но также иметь возможность кодировать сигналы, отличные от речевых, например аудиосигналы, имеющие более широкий диапазон, с высоким качеством.
Кроме того, в условиях эксплуатации, где существуют различные типы сетей, необходима схема кодирования речи, которая может гибко поддерживать связь между разными сетями, связь между терминалами, использующими разные услуги, связь между терминалами, имеющими разную производительность обработки, и взаимную связь в режиме многоточечной связи, а также связь между двумя сторонами.
Кроме того, необходима схема кодирования речи, устойчивая к ошибкам в канале связи (в частности, в сетях с коммутацией пакетов, например, IP-сетях).
Одной из схем кодирования речи, удовлетворяющей таким требованиям, является схема кодирования речи с масштабированием диапазона рабочих частот. Схема кодирования с масштабированием диапазона рабочих частот - это схема кодирования, которая кодирует речевые сигналы в многоуровневом режиме, и схема кодирования, где качество кодирования возрастает в соответствии с увеличением количества уровней кодирования. Битовую скорость можно задать переменной путем увеличения или уменьшения количества уровней кодирования, что позволяет эффективно использовать пропускную способность канала связи.
Кроме того, в схеме кодирования речи с масштабированием диапазона рабочих частот не только необходим прием, по меньшей мере, кодированных данных базового уровня на стороне декодера, но и допустима, до некоторой степени, потеря кодированной информации дополнительных уровней в канале связи, и поэтому схема кодирования речи с масштабированием диапазона рабочих частот обеспечивает высокую устойчивость к ошибкам в канале связи. Кроме того, диапазон рабочих частот речевых сигналов, подлежащих кодированию, также расширяется в соответствии с возрастанием количества уровней кодирования. Например, для базового уровня используется схема кодирования речи в телефонном диапазоне рабочих частот, соответствующем уровню техники. Кроме того, в дополнительных уровнях (уровнях расширения) уровни имеют конфигурацию, позволяющую кодировать широкополосный речевой сигнал, например, в диапазоне рабочих частот 7 кГц.
Таким образом, в схеме кодирования речи с масштабированием диапазона рабочих частот речевые сигналы телефонного диапазона рабочих частот кодируются в базовом уровне, и широкополосные сигналы высокого качества кодируются в уровнях расширения, что позволяет использовать схему кодирования речи с масштабированием рабочих частот как для терминалов с услугой передачи речи в телефонном диапазоне рабочих частот, так и для терминалов с услугой широкополосной передачи речи высокого качества и поддерживать многоточечную связь с участием двух терминалов. Кроме того, кодированная информация является многоуровневой, что позволяет увеличить устойчивость к ошибкам благодаря разработке метода связи и легко управлять битовой скоростью на стороне кодирования или в канале связи. Поэтому, схема кодирования речи с масштабированием диапазона рабочих частот привлекает внимание как схема кодирования речи для связи будущего.
Способ, раскрытый в непатентном документе 1, приведен в качестве примера вышеописанной схемы кодирования речи с масштабированием диапазона рабочих частот.
В схеме кодирования речи с масштабированием диапазона рабочих частот, раскрытой в непатентном документе 1, коэффициенты MDCT кодируются с использованием масштабного коэффициента и информации структуры высокого разрешения для каждого диапазона рабочих частот. Масштабный коэффициент кодируется по Хаффману, и структура высокого разрешения подвергается векторному квантованию. Слуховое взвешивание каждого диапазона рабочих частот вычисляется с использованием результата декодирования масштабного коэффициента и принимается решение по выделению битов для каждого диапазона рабочих частот. Ширина каждого диапазона рабочих частот является неравномерной и задается заранее, так, чтобы она расширялась для диапазона более высоких частот.
Кроме того, информация передачи подразделяется на четыре группы, что описано ниже.
A: Информация кодирования базового кодека
B: Информация кодирования масштабных коэффициентов диапазона верхних частот
C: Информация кодирования масштабных коэффициентов диапазона нижних частот
D: Информация кодирования структуры спектра высокого разрешения.
Кроме того, следующая обработка осуществляется на стороне декодирования.
<Случай 1> Когда информацию для A нельзя принять полностью, декодированная речь генерируется путем осуществления обработки кадра компенсации потерь.
<Случай 2> Когда принимается только информация для A, выводится декодированный сигнал для базового кодека.
<Случай 3> В случае приема информации для B помимо информации для A, диапазон верхних частот генерируется путем зеркального отражения декодированного сигнала для базового кодека и генерируется декодированный сигнал, имеющий более широкую полосу, чем декодированный сигнал кодека. Декодированная информация для B используется при генерации форм спектра диапазона верхних частот. Зеркальное отражение выполняется на вокализованном кадре и осуществляется так, чтобы гармоническая структура не коллапсировала (не разрушалась). Диапазон верхних частот генерируется на невокализованном кадре с использованием случайного шума.
<Случай 4> В случае приема информации C помимо информации для A и B осуществляется такая же обработка декодированием, что и в случае 3, с использованием только информации для A и B.
<Случай 5> В случае приема информации для D помимо информации для A, B и C полная обработка декодированием осуществляется в диапазонах рабочих частот, где принимается вся информация для A-D, и спектр высокого разрешения декодируется путем зеркального отражения декодированного спектра сигнала на стороне диапазона нижних частот в диапазонах, где информация для D не принимается. Даже, если информация для D не принимается, можно принимать информацию для B и C, и эта информация для B и C используется при декодировании информации огибающей спектра. Зеркальное отражение выполняется на вокализованном кадре и осуществляется так, чтобы гармоническая структура не коллапсировала. Диапазон верхних частот генерируется на невокализованном кадре с использованием случайного шума.
Непатентный документ 1: Ковеси (B. Kovesi) и др., “A scalable speech and audio coding scheme with continuous bit rate flexibility”, в материалах IEEE ICASSP 2004, стр.I-273-I-276.
Сущность изобретения
Проблемы, стоящие перед изобретением
Согласно уровню техники (непатентный документ 1) диапазон верхних частот генерируется путем зеркального отражения. При этом зеркальное отражение осуществляется так, чтобы гармоническая структура не коллапсировала, чтобы поддерживать гармоническую структуру. Однако гармоническая структура диапазона нижних частот появляется в диапазоне верхних частот как зеркальное изображение. Обычно, в вокализованном сигнале, гармоническая структура более склонна к коллапсу в диапазоне верхних частот, и поэтому гармоническая структура не появляется более заметно в диапазоне верхних частот, чем в диапазоне нижних частот. Иными словами, несмотря на то, что впадины в гармониках диапазона нижних частот глубокие, впадины в гармониках диапазона верхних частот неглубокие, или, в ряде случаев, сама гармоническая структура становится менее выраженной. Поэтому, согласно вышеописанному уровню техники гармоническая структура с большей легкостью отчетливо проявляется в компонентах диапазона верхних частот, из-за чего качество декодированного речевого сигнала ухудшается.
Таким образом, задачей настоящего изобретения является создание устройства масштабируемого декодирования и устройства масштабируемого кодирования, позволяющих получать высококачественный декодированный речевой (аудио) сигнал с незначительным ухудшением в спектре диапазона верхних частот, даже когда речевой (или аудио) сигнал декодируется путем генерации спектра диапазона верхних частот с использованием спектра диапазона нижних частот.
Средство решения проблемы
Устройство масштабируемого декодирования согласно настоящему изобретению, содержит первый блок декодирования, который декодирует кодированную информацию диапазона нижних частот и получает декодированный сигнал диапазона нижних частот, и второй блок декодирования, который получает декодированный сигнал диапазона верхних частот из декодированного сигнала диапазона нижних частот и кодированной информации диапазона верхних частот, причем второй блок декодирования содержит блок преобразования, который преобразует декодированный сигнал диапазона нижних частот и получает спектр диапазона нижних частот, блок регулировки, который осуществляет регулировку амплитуды в спектре диапазона нижних частот, и блок генерации, который генерирует спектр диапазона нижних частот в псевдорежиме с использованием спектра диапазона нижних частот, отрегулированного по амплитуде, и кодированной информации диапазона верхних частот.
Преимущества изобретения
Настоящее изобретение позволяет получать высококачественный декодированный речевой (или аудио) сигнал с незначительным ухудшением в диапазоне верхних частот, даже когда речевой (или аудио) сигнал декодируется путем генерации спектра диапазона верхних частот с использованием спектра диапазона нижних частот.
Краткое описание чертежей
Фиг.1 - блок-схема, демонстрирующая конфигурацию устройства масштабируемого декодирования согласно варианту осуществления 1 настоящего изобретения;
фиг.2 - блок-схема, демонстрирующая конфигурацию устройства масштабируемого кодирования согласно варианту осуществления 1 настоящего изобретения;
фиг.3 - блок-схема, демонстрирующая конфигурацию блока декодирования второго уровня согласно варианту осуществления 1 настоящего изобретения;
фиг.4 - блок-схема, демонстрирующая конфигурацию блока кодирования второго уровня согласно варианту осуществления 1 настоящего изобретения;
фиг.5 - блок-схема, демонстрирующая конфигурацию блока декодирования спектра согласно варианту осуществления 1 настоящего изобретения;
фиг.6 - другая блок-схема, демонстрирующая конфигурацию блока декодирования спектра согласно варианту осуществления 1 настоящего изобретения;
фиг.7 - еще одна блок-схема, демонстрирующая конфигурацию блока декодирования спектра согласно варианту осуществления 1 настоящего изобретения;
фиг.8 - еще одна блок-схема, демонстрирующая конфигурацию блока декодирования спектра согласно варианту осуществления 1 настоящего изобретения;
фиг.9 - еще одна блок-схема, демонстрирующая конфигурацию блока декодирования спектра согласно варианту осуществления 1 настоящего изобретения;
фиг.10 - еще одна блок-схема, демонстрирующая конфигурацию блока декодирования спектра согласно варианту осуществления 1 настоящего изобретения;
фиг.11 - схема, демонстрирующая обработку генерации компонента диапазона верхних частот в блоке декодирования спектра диапазона верхних частот согласно варианту осуществления 1 настоящего изобретения;
фиг.12 - еще одна блок-схема, демонстрирующая конфигурацию блока декодирования спектра согласно варианту осуществления 1 настоящего изобретения;
фиг.13 - еще одна блок-схема, демонстрирующая конфигурацию блока декодирования спектра согласно варианту осуществления 1 настоящего изобретения;
фиг.14 - блок-схема, демонстрирующая конфигурацию блока декодирования второго уровня согласно варианту осуществления 2 настоящего изобретения;
фиг.15 - блок-схема, демонстрирующая конфигурацию блока кодирования второго уровня согласно варианту осуществления 2 настоящего изобретения;
фиг.16 - еще одна блок-схема, демонстрирующая конфигурацию блока декодирования спектра согласно варианту осуществления 2 настоящего изобретения;
фиг.17 - еще одна блок-схема, демонстрирующая конфигурацию блока декодирования спектра согласно варианту осуществления 2 настоящего изобретения;
фиг.18 - блок-схема, демонстрирующая конфигурацию блока кодирования первого спектра согласно варианту осуществления 2 настоящего изобретения;
фиг.19 - блок-схема, демонстрирующая конфигурацию блока декодирования с расширенным диапазоном согласно варианту осуществления 2 настоящего изобретения;
фиг.20 - другая блок-схема, демонстрирующая конфигурацию блока декодирования с расширенным диапазоном согласно варианту осуществления 2 настоящего изобретения;
фиг.21 - еще одна блок-схема, демонстрирующая конфигурацию блока декодирования с расширенным диапазоном согласно варианту осуществления 2 настоящего изобретения;
фиг.22 - еще одна блок-схема, демонстрирующая конфигурацию блока декодирования с расширенным диапазоном согласно варианту осуществления 2 настоящего изобретения;
фиг.23 - схема, демонстрирующая обработку генерации компонента диапазона верхних частот во втором блоке декодирования с расширенным диапазоном согласно варианту осуществления 1 настоящего изобретения;
фиг.24 - блок-схема, демонстрирующая конфигурацию блока кодирования с расширенным диапазоном согласно варианту осуществления 2 настоящего изобретения;
фиг.25 - схема, демонстрирующая содержимое битового потока, принятого блоком разделения устройства масштабируемого декодирования согласно варианту осуществления 2 настоящего изобретения;
фиг.26 - блок-схема, демонстрирующая конфигурацию блока декодирования с расширенным диапазоном согласно варианту осуществления 3 настоящего изобретения.
Предпочтительные варианты осуществления изобретения
Варианты осуществления настоящего изобретения подробно описаны ниже со ссылкой на прилагаемые чертежи.
Вариант осуществления 1
На фиг.1 показана блок-схема, демонстрирующая конфигурацию устройства масштабируемого декодирования для формирования, например, устройства декодирования речевого (аудио) сигнала с масштабированием диапазона рабочих частот.
Устройство 100 масштабируемого декодирования включает в себя блок 101 разделения, блок 102 декодирования первого уровня и блок 103 декодирования второго уровня.
Блок 101 разделения принимает битовый поток, передаваемый с устройства масштабируемого кодирования, описанного ниже, разделяет битовый поток на параметр кодирования первого уровня и параметр кодирования второго уровня и выводит параметры, соответственно, в блок 102 декодирования первого уровня и блок 103 декодирования второго уровня.
Блок 102 декодирования первого уровня декодирует параметр кодирования первого уровня, введенный из блока 101 разделения, и выводит декодированный сигнал первого уровня. Этот декодированный сигнал первого уровня также выводится в блок 103 декодирования второго уровня.
Блок декодирования второго уровня декодирует параметр кодирования второго уровня, введенный из блока 101 разделения, с использованием декодированного сигнала первого уровня, введенного из блока 102 декодирования первого уровня, и выводит декодированный сигнал второго уровня.
На фиг.2 показан пример конфигурации устройства 200 масштабируемого кодирования, соответствующего устройству 100 масштабируемого декодирования, показанному на фиг.1.
Согласно фиг.2 блок 201 кодирования первого уровня кодирует введенный речевой сигнал (исходный сигнал) и выводит полученные параметры кодирования в блок 202 декодирования первого уровня и блок 203 мультиплексирования. Блок 201 декодирования первого уровня реализует масштабируемость диапазона для первого и второго уровней, выполняя обработку понижающей дискретизацией и обработку фильтрацией низких частот для кодирования.
Затем блок 202 декодирования первого уровня генерирует декодированный сигнал первого уровня из параметров кодирования, введенных из блока 201 кодирования первого уровня, и выводит декодированный сигнал первого уровня в блок 204 кодирования второго уровня.
Затем блок 204 кодирования второго уровня кодирует введенный речевой сигнал (исходный сигнал) с использованием декодированного сигнала первого уровня, введенного из блока 202 декодирования первого уровня, и выводит полученный параметр кодирования в блок 203 мультиплексирования. Блок 204 кодирования второго уровня осуществляет обработку повышающей дискретизацией декодированного сигнала первого уровня и обработку регулировкой фазы для согласования фаз первого декодированного сигнала и введенного речевого сигнала согласно обработке, осуществляемой в блоке 201 кодирования первого уровня (обработке понижающей дискретизацией или обработке фильтрацией низких частот) для кодирования.
Затем блок 203 мультиплексирования мультиплексирует параметр кодирования, введенный из блока 201 кодирования первого уровня, и параметр кодирования, введенный из блока 204 кодирования второго уровня, и выводит результат как битовый поток.
Перейдем к подробному описанию блока 103 декодирования второго уровня, показанного на фиг.1. На фиг.3 показана блок-схема, демонстрирующая конфигурацию блока 103 декодирования второго уровня. Блок 103 декодирования второго уровня включает в себя блок 301 разделения, блок 302 декодирования масштабных коэффициентов, блок 303 декодирования спектра высокого разрешения, блок 304 преобразования частотной области, блок 305 декодирования спектра и блок 306 преобразования временной области.
Блок 301 разделения разделяет введенный параметр кодирования второго уровня на параметр кодирования (параметры масштабного коэффициента), указывающий масштабные коэффициенты, и параметр кодирования (параметр спектра высокого разрешения), указывающий структуру спектра высокого разрешения, и выводит параметры кодирования в блок 302 декодирования масштабных коэффициентов и блок 303 декодирования спектра высокого разрешения, соответственно.
Блок 302 декодирования масштабных коэффициентов декодирует введенный параметр масштабного коэффициента для получения масштабных коэффициентов диапазона нижних частот и масштабных коэффициентов диапазона верхних частот и выводит масштабные коэффициенты декодирования в блок 305 декодирования спектра и блок 303 декодирования спектра высокого разрешения.
Блок 303 декодирования спектра высокого разрешения вычисляет слуховое взвешивание для каждого диапазона с использованием масштабных коэффициентов, введенных из блока 302 декодирования масштабных коэффициентов, и получает число битов, выделенных для информации спектра высокого разрешения каждого диапазона. Затем блок 303 декодирования спектра высокого разрешения декодирует параметры спектра высокого разрешения, введенные из блока 301 разделения, и получает информацию декодирования спектра высокого разрешения для каждого диапазона и выводит результат в блок 305 декодирования спектра. Информацию для декодированного сигнала также можно использовать первого уровня при вычислении слухового взвешивания, и в этом случае, выходной сигнал блока 304 преобразования частотной области также поступает в блок 303 декодирования спектра высокого разрешения.
Блок 304 преобразования частотной области преобразует введенный декодированный сигнал первого уровня в параметр спектра частотной области (например, коэффициенты MDCT) и выводит результат в блок 305 декодирования спектра.
Блок 305 декодирования спектра декодирует второй декодированный сигнал из декодированного сигнала первого уровня, который поступает из блока 304 преобразования частотной области и преобразуется в частотную область, масштабные коэффициенты декодирования (диапазон нижних частот и диапазон верхних частот), введенные из блока 302 декодирования масштабных коэффициентов, и информацию декодирования спектра высокого разрешения, введенную 303 из блока декодирования спектра высокого разрешения, и выводит результат в блок 306 преобразования временной области.
Блок преобразования временной области 306 преобразует спектр декодированного сигнала второго уровня, введенного из блока 305 декодирования спектра, в сигнал временной области и выводит результат как декодированный сигнал второго уровня.
На фиг.4 показан пример конфигурации блока 204 кодирования второго уровня, соответствующего блоку 103 декодирования второго уровня, показанному на фиг.3.
Согласно фиг.4 введенный речевой сигнал поступает в блок 401 вычисления слухового маскирования и блок 402A преобразования частотной области.
Блок 401 вычисления слухового маскирования вычисляет слуховое маскирование для каждого поддиапазона, имеющего заранее определенную ширину, и выводит это слуховое маскирование в блок 403 кодирования масштабного коэффициента и блок 404 кодирования спектра высокого разрешения.
Здесь восприятие человеческой аудитории имеет характеристики слухового маскирования, которые, при прослушивании данного сигнала, даже если звук, имеющий частоту, близкую к частоте этого сигнал достигает уха, звук трудно расслышать. Это дает возможность реализовать эффективное кодирование спектра, с использованием слухового маскирования на основании этой характеристики слухового маскирования, путем выделения малого количества битов квантования частотному спектру, в котором искажения квантования трудно расслышать, и выделяя большое битов квантования частотному спектру, в котором искажения квантования легко расслышать.
Блок 402A преобразования частотной области преобразует введенный речевой сигнал в параметр спектра частотной области (например, коэффициенты MDCT) и выводит результат в блок 403 кодирования масштабного коэффициента и блок 404 кодирования спектра. Блок 402B преобразования частотной области преобразует введенный декодированный сигнал первого уровня в параметр спектра частотной области (например, коэффициенты MDCT) и выводит результат в блок 403 кодирования масштабного коэффициента и блок 404 кодирования спектра.
Блок 403 кодирования масштабного коэффициента кодирует дифференциальный спектр между параметром спектра, введенным из блока 402A преобразования частотной области, и декодированным спектром первого уровня, введенным из блока 402 преобразования частотной области, с использованием информации слухового маскирования, введенный из блока 401 вычисления слухового маскирования, получает параметр масштабного коэффициента и выводит параметр масштабного коэффициента в блок 405 мультиплексирования параметров кодирования и блок 404 кодирования спектра высокого разрешения. Здесь показан пример, где параметр масштабного коэффициента спектра диапазона верхних частот и параметр масштабного коэффициента спектра диапазона нижних частот выводятся раздельно.
Блок 404 кодирования спектра высокого разрешения декодирует параметр масштабного коэффициента (диапазон нижних частот и диапазон верхних частот), введенный из блока 403 кодирования масштабного коэффициента, получает декодированные масштабные коэффициенты (диапазон нижних частот и диапазон верхних частот) и нормализует дифференциальный спектр между параметром спектра, введенным из блока 402A преобразования частотной области, и декодированным спектром первого уровня, введенным из блока 402B преобразования частотной области, с использованием масштабных коэффициентов декодирования (диапазон нижних частот и диапазон верхних частот). Блок 404 кодирования спектра высокого разрешения кодирует нормализованный дифференциальный спектр и выводит дифференциальный спектр после кодирования (параметры кодирования спектра высокого разрешения) в блок 405 мультиплексирования параметров кодирования. При этом блок 404 кодирования спектра высокого разрешения вычисляет слуховое взвешивание для диапазона спектра высокого разрешения с использованием декодированных масштабных коэффициентов (нижний диапазон и верхний диапазон) и осуществляет выделение битов в соответствии со слуховым взвешиванием. Это слуховое взвешивание также можно вычислять с использованием декодированного спектра первого уровня.
Блок 405 мультиплексирования параметров кодирования мультиплексирует параметр масштабного коэффициента спектра диапазона верхних частот и параметр масштабного коэффициента спектра диапазона нижних частот, введенные из блока 403 кодирования масштабного коэффициента, и параметр кодирования спектра высокого разрешения, введенный из блока 404 кодирования спектра высокого разрешения, и выводит результат как параметр кодирования первого спектра.
Перейдем к подробному описанию блока 305 декодирования спектра, показанного на фиг.3. На фиг.5-фиг.9 показаны блок-схемы, демонстрирующие конфигурацию блока 305 декодирования спектра.
На фиг.5 показана конфигурация для выполнения обработки при нормальном приеме декодированного сигнала первого уровня, всех масштабных коэффициентов декодирования (диапазон нижних частот и диапазон верхних частот) и всей информации декодирования спектра высокого разрешения.
На фиг.6 показана конфигурация для выполнения обработки, когда часть информации декодирования спектра высокого разрешения для диапазона верхних частот не принята. Фиг.6 отличается от фиг.5 тем, что выходной сигнал сумматора A поступает в блок 602 декодирования спектра диапазона верхних частот. Спектр для диапазонов, подлежащих декодированию с использованием информации декодирования спектра высокого разрешения диапазона верхних частот, которая не принята, генерируется в псевдорежиме следующим способом.
На фиг.7 показана конфигурация для выполнения обработки, когда никакая информация декодирования спектра высокого разрешения диапазона верхних частот не принята (включая случай, когда часть информации декодирования спектра высокого разрешения диапазона нижних частот не принята). Отличие от фиг.6 состоит в том, что информация декодирования спектра высокого разрешения не поступает в блок 702 декодирования спектра диапазона верхних частот. Спектр для диапазонов, подлежащих декодированию с использованием информации декодирования спектра высокого разрешения диапазона верхних частот, которая не принята, генерируется в псевдорежиме следующим способом.
На фиг.8 показана конфигурация для выполнения обработки, когда никакая информация декодирования спектра высокого разрешения не принята, и, кроме того, не принята часть масштабных коэффициентов декодирования диапазона нижних частот. Отличие от фиг.7 состоит в том, что информация декодирования спектра высокого разрешения не поступает, ничего не выводится из блока 801 декодирования спектра диапазона нижних частот, и сумматор A отсутствует. Спектр для диапазонов, подлежащих декодированию с использованием информации декодирования спектра высокого разрешения диапазона верхних частот, которая не принята, генерируется в псевдорежиме следующим способом.
На фиг.9 показана конфигурация для выполнения обработки, когда принимаются только масштабные коэффициенты декодирования диапазона верхних частот (включая случай, когда часть масштабных коэффициентов декодирования диапазона верхних частот не принята). Отличие от фиг.8 состоит в том, что не поступают масштабные коэффициенты декодирования диапазона нижних частот и отсутствует блок декодирования спектра диапазона нижних частот. Способ генерации спектра диапазона верхних частот в псевдорежиме только из принятых масштабных коэффициентов декодирования диапазона верхних частот будет описан позже.
Блок 305 декодирования спектра, показанный на фиг.5, снабжен блоком 501 декодирования спектра диапазона нижних частот, блоком 502 декодирования спектра диапазона верхних частот, сумматором A и сумматором B.
Блок 501 декодирования спектра диапазона нижних частот декодирует спектр диапазона нижних частот с использованием масштабных коэффициентов декодирования диапазона нижних частот, введенных из блока 302 декодирования масштабных коэффициентов, и информацию декодирования спектра высокого разрешения, введенную из блока 303 декодирования спектра высокого разрешения, и выводит результат на сумматор A. Обычно декодированный спектр вычисляется путем умножения информации декодирования спектра высокого разрешения на масштабные коэффициенты декодирования.
Сумматор A суммирует декодированный спектр диапазона нижних частот (остаток), введенный из блока декодирования спектра диапазона нижних частот 501, и декодированный сигнал первого уровня (спектр), введенный из блока 302 преобразования частотной области, для получения декодированного спектра диапазона нижних частот и выводит результат на сумматор B.
Блок 502 декодирования спектра диапазона верхних частот декодирует спектр диапазона верхних частот с использованием масштабных коэффициентов декодирования диапазона верхних частот, введенных из блока 302 декодирования масштабных коэффициентов, и информацию декодирования спектра высокого разрешения, введенную из блока 303 декодирования спектра высокого разрешения, и выводит результат на сумматор B.
Сумматор B суммирует декодированный спектр диапазона нижних частот, введенный из сумматора A, и декодированный спектр диапазона верхних частот, введенный из блока 502 декодирования спектра диапазона верхних частот для генерации спектра для всех диапазонов (всех частотных диапазонов, объединяющих диапазон нижних частот и диапазон верхних частот), и выводит результат как декодированный спектр.
Фиг.6 отличается от фиг.5 только работой блока 602 декодирования спектра диапазона верхних частот.
Блок 602 декодирования спектра диапазона верхних частот декодирует спектр диапазона верхних частот с использованием масштабных коэффициентов декодирования диапазона верхних частот, введенных из блока 302 декодирования масштабных коэффициентов, и информацию декодирования спектра высокого разрешения диапазона верхних частот, введенную из блока 303 декодирования спектра высокого разрешения. При этом информация декодирования спектра высокого разрешения диапазона верхних частот для части диапазона не принимается, и поэтому спектр диапазона верхних частот для соответствующего диапазона нельзя декодировать точно. Затем блок 602 декодирования спектра диапазона верхних частот генерирует спектр диапазона верхних частот в псевдорежиме с использованием декодированных масштабных коэффициентов, декодированного спектра диапазона нижних частот, введенного из сумматора A, и спектра диапазона верхних частот, который можно принимать и точно декодировать. Конкретный способ генерации описан ниже.
На фиг.7 показана операция фиг.5 и фиг.6 в случае, когда никакая информация декодирования спектра высокого разрешения диапазона верхних частот не принимается. В этом случае, блок 702 декодирования спектра диапазона верхних частот декодирует спектр диапазона верхних частот с использованием только масштабных коэффициентов декодирования диапазона верхних частот, введенных из блока 302 декодирования масштабных коэффициентов.
Кроме того, блок 701 декодирования спектра диапазона нижних частот декодирует спектр диапазона верхних частот с использованием масштабных коэффициентов декодирования диапазона нижних частот, введенных из блока 302 декодирования масштабных коэффициентов, и информации декодирования спектра высокого разрешения диапазона нижних частот, введенной из блока 303 декодирования спектра высокого разрешения. При этом информация декодирования спектра высокого разрешения диапазона нижних частот для части диапазона не принимается. Поэтому эта часть диапазона не подвергается обработке декодированием и считается нулевым спектром. В этом случае спектр соответствующего диапазона, выводимый через сумматоры A и B, является самим декодированным сигналом первого уровня (спектром).
На фиг.8 показана операция в случае, когда никакая информация декодирования спектра высокого разрешения диапазона нижних частот не принимается согласно фиг.7. Блок 801 декодирования спектра диапазона нижних частот принимает масштабные коэффициенты декодирования диапазона нижних частот, но вовсе не принимает информацию декодирования спектра высокого разрешения, и поэтому обработка декодированием не осуществляется.
На фиг.9 показана операция в случае, когда масштабные коэффициенты декодирования для диапазона нижних частот вовсе не поступают, согласно фиг.8. Однако в блоке 902 декодирования спектра диапазона верхних частот, когда часть масштабных коэффициентов декодирования (диапазон верхних частот) не вводится, спектр для этого диапазона выводится как нулевой.
Ниже, способ генерации спектра диапазона верхних частот в псевдорежиме описан со ссылкой на фиг.9 в порядке примера. Согласно фиг.9 блок 902 декодирования спектра в диапазоне верхних частот генерирует спектр диапазона верхних частот в псевдорежиме. На фиг.10 более подробно показана конфигурация блока 902 декодирования спектра диапазона верхних частот.
Блок 902 декодирования спектра диапазона верхних частот, показанный на фиг.10, включает в себя блок 1011 регулировки амплитуды, блок 1012 генерации псевдоспектра и блок 1013 масштабирования.
Блок регулировки амплитуды 1011 регулирует амплитуду декодированного спектра сигнала первого уровня, введенного из блока 302 преобразования частотной области, и выводит результат в блок 1012 генерации псевдоспектра.
Блок 1012 генерации псевдоспектра генерирует спектр диапазона верхних частот в псевдорежиме с использованием декодированного спектра сигнала первого уровня после регулировки амплитуды, введенной из блока 1011 регулировки амплитуды, и выводит результат в блок 1013 масштабирования.
Блок 1013 масштабирования масштабирует спектр, введенный из блока 1012 генерации псевдоспектра, и выводит результат на сумматор B.
На фиг.11 показана схема, демонстрирующая пример последовательности обработки генерации спектра диапазона верхних частот в псевдорежиме.
Сначала осуществляется регулировка амплитуды декодированного спектра сигнала первого уровня. Этот способ регулировки амплитуды представлять собой, например, постоянный множитель в логарифмической области (γ×S, где γ - коэффициент регулировки амплитуды (действительное число) в пределах 0≤γ≤1, и S - логарифмический спектр), или может представлять собой постоянный множитель (где Sγ, S - линейный спектр) в линейной области. Кроме того, можно также использовать коэффициенты, например коэффициенты, необходимые при добавлении глубины впадины гармоник, имеющей место в диапазоне нижних частот в вокализованной речи, и глубины впадины гармоник, имеющей место в диапазоне верхних частот, как регулировочные коэффициенты для регулировки амплитуды. Кроме того, регулировочные коэффициенты могут быть фиксированной постоянной, но также можно подготавливать совокупность подходящих регулировочных коэффициентов согласно индексу (например, непосредственно, значение дисперсии амплитуды спектра, имеющей место в диапазоне нижних частот, или опосредованно, значение коэффициента усиления основного тона, имеющего место в блоке 201 кодирования первого уровня), указывающую глубину ямы гармоник спектра диапазона нижних частот, и избирательно использовать соответствующие регулировочные коэффициенты согласно индексу. Кроме того, можно также избирательно использовать регулировочные коэффициенты согласно характеристикам для каждого гласного звука с использованием информации формы (огибающей) спектра диапазона нижних частот и информации периода основного тона. Кроме того, можно также кодировать оптимальные регулировочные коэффициенты на стороне кодера в качестве отдельной информации передачи и передавать кодированную информацию.
Затем спектр диапазона верхних частот генерируется в псевдорежиме с использованием спектра после регулировки амплитуды. В качестве способа генерации, пример зеркального отражения, которое генерирует спектр диапазона верхних частот как зеркальное изображение диапазона нижних частот, показан на фиг.11. Помимо зеркального отражения существует способ генерации спектра диапазона верхних частот путем сдвига спектра после регулировки амплитуды в направлении диапазона верхних частот частотной оси, и способ генерации спектра диапазона верхних частот путем выполнения обработки фильтрацией основного тона в направлении частотной оси в спектре после регулировки амплитуды с использованием отставания основного тона, полученного из спектра диапазона нижних частот. Каждый способ позволяет гарантировать, что сгенерированная гармоническая структура диапазона верхних частот не коллапсирует и что гармоническая структура спектра диапазона нижних частот и сгенерированная гармоническая структура спектра диапазона верхних частот непрерывно соединены.
Наконец, спектр диапазона верхних частот генерируется путем осуществления амплитудного масштабирования для каждого диапазона в блоках кодирования.
На фиг.12 показан случай, когда информация спектра первого уровня (например, параметры декодирования LSP) вводятся в блок 1211 регулировки амплитуды из блока 102 декодирования первого уровня. В этом случае, блок 1211 регулировки амплитуды определяет регулировочные коэффициенты с использованием амплитудных коэффициентов на основании введенной информации спектра первого уровня. Информацию основного тона первого уровня (период основного тона и коэффициент усиления основного тона), отличную от информации спектра первого уровня, также можно использовать для определения регулировочных коэффициентов.
На фиг.13 показан случай, когда коэффициенты регулировки амплитуды вводятся по отдельности. В этом случае, коэффициенты регулировки амплитуды квантуются, кодируются и передаются на стороне кодера.
Вариант осуществления 2
На фиг.14 показана блок-схема, демонстрирующая конфигурацию блока 103 декодирования второго уровня согласно варианту осуществления 2 настоящего изобретения.
Блок 103 декодирования второго уровня, показанный на фиг.14, включает в себя блок 1401 разделения, блок 1402 декодирования спектра, блок 1403 декодирования с расширенным диапазоном, блок 1402B декодирования спектра, блок 1404 преобразования частотной области и блок 1405 преобразования временной области.
Блок 1401 разделения разделяет кодированный параметр второго уровня на кодированный параметр первого спектра, кодированный параметр с расширенным диапазоном и кодированный параметр второго спектра и выводит эти параметры в блок 1402A декодирования спектра, блок 1403 декодирования с расширенным диапазоном и блок 1402B декодирования спектра, соответственно.
Блок 1404 преобразования частотной области преобразует декодированный сигнал первого уровня, введенный из блока 102 декодирования первого уровня, в параметр частотной области (например, коэффициенты MDCT) и выводит результат в первый блок 1402A декодирования спектра как декодированный спектр сигнала первого уровня.
Блок 1402A декодирования спектра суммирует квантованный спектр для ошибок кодирования первого уровня, полученный декодированием параметра декодирования первого спектра, введенного из блока 1401 разделения, с декодированным спектром сигнала первого уровня, введенным из блока 1404 преобразования частотной области, и выводит результат в блок 1403 декодирования с расширенным диапазоном как первый декодированный спектр. В блоке 1402A декодирования спектра ошибки кодирования первого уровня увеличиваются, в основном, для компонента диапазона нижних частот в блоке 1402A декодирования спектра.
Блок 1403 декодирования с расширенным диапазоном декодирует различные параметры из параметра кодирования с расширенным диапазоном, введенного из блока 1401 разделения, и декодирует/генерирует спектр диапазона верхних частот с использованием различных декодированных параметров на основании первого декодированного спектра, введенного из блока 1402A декодирования спектра. Затем блок 1403 декодирования с расширенным диапазоном выводит спектр для всего диапазона в блок 1402B декодирования спектра как второй декодированный спектр.
Блок 1402B декодирования спектра суммирует спектр, который представляет собой квантованные ошибки кодирования второго декодированного спектра, полученного декодированием параметра кодирования второго спектра, введенного из блока 1401 разделения, со вторым декодированным спектром, введенным из блока 1403 декодирования с расширенным диапазоном, и выводит результат в блок 1405 преобразования временной области как третий декодированный спектр.
Блок 1405 преобразования временной области преобразует третий декодированный спектр, введенный из блока 1402B декодирования спектра, в сигнал временной области и выводит результат как декодированный сигнал второго уровня.
Согласно фиг.14 возможна также конфигурация, где один или оба из блока 1402 декодирования спектра и блока 1402B декодирования спектра отсутствует. В случае конфигурации, где отсутствует блок 1402 декодирования спектра, декодированный спектр сигнала первого уровня, выведенный из блока 1404 преобразования частотной области, вводится в блок 1403 декодирования с расширенным диапазоном. Кроме того, в случае конфигурации, где отсутствует блок 1402 декодирования спектра, второй декодированный спектр, выведенный из блока 1403 декодирования с расширенным диапазоном, вводится в блок 1405 преобразования временной области.
На фиг.15 показан пример конфигурации блока 204 кодирования второго уровня, соответствующего блоку 103 декодирования второго уровня, показанному на фиг.14.
Согласно фиг.15, речевой сигнал (исходный сигнал) вводится в блок 1501 вычисления слухового маскирования и блок 1502A преобразования частотной области.
Блок 1501 вычисления слухового маскирования вычисляет слуховое маскирование с использованием введенного речевого сигнала и выводит слухового маскирование в блок 1503 кодирования первого спектра, блок 1504 кодирования с расширенным диапазоном и блок 1505 кодирования второго спектра.
Блок 1502A преобразования частотной области преобразует введенный речевой сигнал в параметр спектра частотной области (например, коэффициенты MDCT) и выводит результат в блок 1503 кодирования первого спектра, блок 1504 кодирования с расширенным диапазоном и блок 1505 кодирования второго спектра.
Блок 1502B преобразования частотной области преобразует введенный декодированный сигнал первого уровня в параметр спектра, например, MDCT и выводит результат в блок 1503 кодирования первого спектра.
Блок 1503 кодирования первого спектра кодирует дифференциальный спектр между спектром входного речевого сигнала, введенным из блока 1502 преобразования частотной области, и декодированным спектром первого уровня, введенным из блока 1502B преобразования частотной области, с использованием слухового маскирования, введенного из блока 1501 вычисления слухового маскирования, выводит результат как параметр кодирования первого спектра, и выводит первый декодированный спектр, полученный декодированием параметра кодирования первого спектра, в блок 1504 кодирования с расширенным диапазоном.
Блок 1504 кодирования с расширенным диапазоном кодирует спектр ошибки между спектром входного речевого сигнала, введенным из блока 1502A преобразования частотной области, и первым декодированным спектром, введенным 1503 из блока кодирования первого спектра с использованием слухового маскирования, введенного из блока 1501 вычисления слухового маскирования, выводит результат как параметр кодирования с расширенным диапазоном, и выводит второй декодированный спектр, полученный декодированием параметра кодирования с расширенным диапазоном, в блок 1505 кодирования второго спектра.
Блок 1505 кодирования второго спектра кодирует спектр ошибки между спектром входного речевого сигнала, введенным из блока 1502A преобразования частотной области, и вторым декодированным спектром, введенным из блока 1504 кодирования с расширенным диапазоном, с использованием слухового маскирования, введенного из блока 1501 вычисления слухового маскирования, и выводит результат как параметр кодирования второго спектра.
Далее, конкретные примеры блоков 1402A и 1402B декодирования спектра, показанных фиг.14, представлены на фиг.16 и фиг.17.
Согласно фиг.16 блок 1601 разделения разделяет введенный параметр кодирования на параметр кодирования (параметр масштабного коэффициента), указывающий масштабные коэффициенты, и параметр кодирования (параметр спектра высокого разрешения), указывающий структуру спектра высокого разрешения, и выводит параметры в блок 1602 декодирования масштабных коэффициентов и блок 1603 декодирования спектра высокого разрешения, соответственно.
Блок 1602 декодирования масштабных коэффициентов декодирует введенный параметр масштабного коэффициента для получения масштабных коэффициентов диапазона нижних частот и масштабных коэффициентов диапазона верхних частот, выводит масштабные коэффициенты декодирования в блок 1604 декодирования спектра и блок 1603 декодирования спектра высокого разрешения.
Блок 1603 декодирования спектра высокого разрешения вычисляет слуховое взвешивание для каждого диапазона с использованием масштабных коэффициентов, введенных из блока 1602 декодирования масштабных коэффициентов, и получает число битов, выделенных для информации спектра высокого разрешения каждого диапазона. Затем блок 1603 декодирования спектра высокого разрешения декодирует параметр спектра высокого разрешения, введенный из блока 1601 разделения, и получает декодированную информацию спектра высокого разрешения каждого диапазона, и выводит декодированную информацию спектра высокого разрешения в блок 1604 декодирования спектра. Информацию для декодированного спектра A можно также использовать при вычислении слухового взвешивания. В этом случае, рассмотрена конфигурация, позволяющая вводить декодированный спектр A в блок 1603 декодирования спектра высокого разрешения.
Затем блок 1604 декодирования спектра декодирует декодированный спектр B из введенного декодированного спектра A, декодированных масштабных коэффициентов (диапазон нижних частот и диапазон верхних частот), введенных из блока 1602 декодирования масштабных коэффициентов, и декодированной информации спектра высокого разрешения, введенной из блока 1603 декодирования спектра высокого разрешения.
Рассматривая соответствие между фиг.16 и фиг.14 обратим внимание на то, что, если конфигурация, показанная на фиг.16, является конфигурацией блока 1402 декодирования спектра, то параметр кодирования, показанный на фиг.16, соответствует параметру кодирования первого спектра, показанному на фиг.14, декодированный спектр A, показанный на фиг.16, соответствует декодированному спектру сигнала первого уровня, показанному на фиг.14, и декодированный спектр B, показанный на фиг.16, соответствует первому декодированному спектру, показанному на фиг.14. Кроме того, если конфигурация, показанная на фиг.16, является конфигурацией блока 1402B декодирования спектра, то параметр кодирования, показанный на фиг.16, соответствует параметру кодирования второго спектра, показанному на фиг.14, декодированный спектр A, показанный на фиг.16, соответствует второму декодированному спектру, показанному на фиг.14, и декодированный спектр B, показанный на фиг.16, соответствует третьему декодированному спектру, показанному на фиг.14.
На фиг.18 показан пример конфигурации блока 1503 кодирования первого спектра, соответствующего блокам декодирования спектра 1402A и 1402B, показанным на фиг.16. На фиг.18 показана конфигурация блока 1503 кодирования первого спектра, показанного на фиг.15. Блок 1503 кодирования первого спектра, показанный фиг.18, содержит блок 403 кодирования масштабного коэффициента, блок 404 кодирования спектра высокого разрешения, блок 405 мультиплексирования параметров кодирования, показанные на фиг.4, и блок 1604 декодирования спектра, показанный на фиг.16. Он работает так же, как описано на фиг.4 и фиг.16, и поэтому его описание здесь опущено. Кроме того, если декодированный спектр первого уровня, показанный на фиг.18, заменен вторым декодированным спектром, и параметр кодирования первого спектра заменен параметром кодирования второго спектра, конфигурация, показанная на фиг.18, является конфигурацией блока 1505 кодирования второго спектра, показанного на фиг.15. Блок 1604 декодирования спектра можно исключить в конфигурации блока 1505 кодирования второго спектра.
На фиг.17 показана конфигурация блоков 1402A и 1402B декодирования спектра в случае неиспользования масштабных коэффициентов. В этом случае, блоки 1402A и 1402B декодирования спектра включают в себя блок 1701 вычисления слухового взвешивания и распределения битов, блок 1702 декодирования спектра высокого разрешения и блок 1703 декодирования спектра.
Согласно фиг.17 блок 1701 вычисления слухового взвешивания и распределения битов получает слуховое взвешивание для каждого диапазона из введенного декодированного спектра A и получает распределение битов для каждого диапазона, определенное согласно слуховому взвешиванию. Затем информация полученного слухового взвешивания и распределения битов выводится в блок 1702 декодирования спектра высокого разрешения.
Затем блок 1702 декодирования спектра высокого разрешения декодирует введенные параметры кодирования на основании информации слухового взвешивания и распределения битов, введенной из блока 1701 вычисления слухового взвешивания и распределения битов, и получает декодированную информацию спектра высокого разрешения для каждого диапазона, и выводит декодированную информацию спектра высокого разрешения в блок 1703 декодирования спектра.
Затем блок 1703 декодирования спектра добавляет информацию декодирования спектра высокого разрешения, введенную из блока 1702 декодирования спектра высокого разрешения, к введенному декодированному спектру A и выводит результат как декодированный спектр B.
Рассматривая соответствие между фиг.17 и фиг.14 обратим внимание на то, что, если конфигурация, показанная на фиг.17, является конфигурацией блока 1402 декодирования спектра, параметр кодирования, показанный на фиг.17, соответствует параметру кодирования первого спектра, показанному на фиг.14, декодированный спектр A, показанный на фиг.17, соответствует декодированному спектру сигнала первого уровня, показанному на фиг.14, и декодированный спектр B, показанный на фиг.17, соответствует первому декодированному спектру, показанному на фиг.14. Кроме того, если конфигурация, показанная на фиг.17, является конфигурацией блока 1402B декодирования спектра, параметр кодирования, показанный на фиг.17, соответствует параметру кодирования второго спектра, показанному на фиг.14, декодированный спектр A, показанный на фиг.17, соответствует второму декодированному спектру, показанному на фиг.14, и декодированный спектр B, показанный на фиг.17, соответствует третьему декодированному спектру, показанному на фиг.14.
Что касается соответствия между фиг.16 и фиг.18, можно также конфигурировать блок кодирования первого спектра в соответствии с блоками 1402A и 1402B декодирования спектра, показанными на фиг.17.
Теперь, со ссылкой на фиг.19-фиг.23, подробно опишем блок 1403 декодирования с расширенным диапазоном, показанный на фиг.14.
На фиг.19 показана блок-схема, демонстрирующая конфигурацию блока 1403 декодирования с расширенным диапазоном. Согласно фиг.19 блок 1403 декодирования с расширенным диапазоном включает в себя блок 1901 разделения, блок 1902 регулировки амплитуды, блок 1903 задания состояния фильтра, блок 1904 фильтрации, кодовую книгу 1905 формы остаточного спектра, кодовую книгу 1906 коэффициента усиления остаточного спектра, умножитель 1907, блок 1908 декодирования масштабного коэффициента, блок 1909 масштабирования и блок 1910 синтеза спектра.
Блок 1901 разделения разделяет параметр кодирования, введенный из блока 1401 разделения, показанного на фиг.14, на параметр кодирования коэффициента регулировки амплитуды, параметр кодирования отставания, параметр кодирования формы остатка, параметр кодирования коэффициента усиления остатка и параметр кодирования масштабного коэффициента и выводит параметры в блок 1902 регулировки амплитуды, блок 1904 фильтрации, кодовую книгу 1905 формы остаточного спектра, кодовую книгу коэффициента усиления остаточного спектра 1906 и блок 1908 декодирования масштабного коэффициента, соответственно.
Блок 1902 регулировки амплитуды декодирует параметр кодирования коэффициента регулировки амплитуды, введенный из блока 1901 разделения, регулирует амплитуду декодированного спектра первого уровня, введенного из блока 1402 декодирования спектра, показанного на фиг.14, и выводит первый декодированный спектр после регулировки амплитуды в блок 1903 задания состояния фильтра. Регулировка амплитуды осуществляется с использованием метода, выраженного {S(n)}γ, где, например, первый декодированный спектр обозначен S(n), и коэффициенты регулировки амплитуды обозначены γ. Здесь, S(n) это амплитуда спектра в линейной области и n - частота.
Блок 1903 задания состояния фильтра присваивает первому декодированному спектру после регулировки амплитуды состояние фильтра для фильтра основного тона, выраженное передаточной функцией P(z)=(1-z-T)-1. В частности, блок 1903 задания состояния фильтра подставляет первый декодированный спектр S1[0 … Nn] после регулировки амплитуды в буфере сгенерированного спектра S[0 … Nn] и выводит буфер сгенерированного спектра после подстановки в блок 1904 фильтрации. Здесь, z - переменная, участвующая в z-преобразовании, z-1 - комплексная переменная, именуемая оператором задержки. Кроме того, T это отставание фильтра основного тона, Nn - количество пригодных точек спектра для первого декодированного спектра (соответствующее верхней предельной частоте спектра, используемой как состояние фильтра), и буфер сгенерированного спектра S[n] это матрица переменных, заданных в пределах от n=0 до Nw. Кроме того, Nw это количество точек спектра после расширения диапазона, и спектр с (Nw-Nn) точками генерируется посредством этой обработки фильтрацией.
Блок 1904 фильтрации осуществляет обработку фильтрацией в буфере сгенерированного спектра S[n], введенного из блока 1903 задания состояния фильтра, с использованием параметра кодирования отставания T, введенного из блока 1901 разделения. В частности, блок 1904 фильтрации генерирует S[n] с использованием S[n]=S[n-T]+gC[n], где n=Nn … Nw. Здесь, g обозначает коэффициент усиления остаточного спектра, C[n] обозначает вектор формы остаточного спектра и gC[n] вводится из умножителя 1907. Сгенерированный S[Nn … Nw] выводится в блок 1909 масштабирования.
Кодовая книга 1905 формы остаточного спектра декодирует параметр кодирования формы остатка, введенный из блока 1901 разделения, и выводит вектор формы остаточного спектра, соответствующий результату декодирования, в умножитель 1907.
Кодовая книга 1906 коэффициента усиления остаточного спектра декодирует параметр кодирования коэффициента усиления остатка, введенный из блока 1901 разделения, и выводит коэффициент усиления остатка, соответствующий результату декодирования, в умножитель 1907.
Умножитель 1907 выводит результат gC[n] умножения вектора формы остаточного спектра C[n], введенного из кодовой книги 1905 формы остаточного спектра, на коэффициент усиления остатка g, введенный из кодовой книги 1906 коэффициента усиления остаточного спектра, в блок 1904 фильтрации.
Блок 1908 декодирования масштабного коэффициента декодирует параметр кодирования масштабного коэффициента, введенный из блока 1901 разделения, и выводит декодированный масштабный коэффициент в блок 1909 масштабирования.
Блок 1909 масштабирования умножает масштабный коэффициент, введенный из блока 1908 декодирования масштабного коэффициента, на спектр S[Nn … Nw], введенный из блока 1904 фильтрации, и выводит результат в блок 1910 синтеза спектра.
Блок 1910 синтеза спектра подставляет первый декодированный спектр, введенный из блока 1402A декодирования спектра, показанного на фиг.14, в диапазон нижних частот (S[0 … Nn]) и подставляет спектр, введенный из блока 1909 масштабирования, в диапазон верхних частот (S[Nn … Nw]) и выводит полученный спектр в блок 1402B декодирования спектра, показанный на фиг.14, как второй декодированный спектр.
На фиг.20 показана конфигурация блока 403 декодирования с расширенным диапазоном в случае, когда параметр кодирования формы дифференциального спектра и параметр кодирования коэффициента усиления остаточного спектра нельзя принять полностью. В этом случае, информацию параметра кодирования для коэффициентов регулировки амплитуды, параметра кодирования отставания и параметра кодирования масштабного коэффициента нельзя принять полностью.
На фиг.20, конфигурация, не связанная с блоком 2001 разделения и блоком 2002 фильтрации, такая же, как для каждой части фиг.19, и поэтому не описана.
Согласно фиг.20 блок 2001 разделения разделяет параметр кодирования, введенный из блока разделения 1401, показанного на фиг.14, на параметр кодирования коэффициента регулировки амплитуды, параметр кодирования отставания и параметр кодирования масштабного коэффициента и выводит параметры в блок 1902 регулировки амплитуды, блок 2002 фильтрации и блок 1908 декодирования масштабного коэффициента, соответственно.
Блок 2002 фильтрации осуществляет обработку фильтрацией в буфере сгенерированного спектра S[n], введенного из блока 1903 задания состояния фильтра, с использованием параметра кодирования отставания, введенного из блока 2001 разделения. В частности, блок 2002 фильтрации генерирует S[n] с использованием S[n]=S[n-T], где n=Nn … Nw. Сгенерированный S[Nn … Nw] выводится в блок 1909 масштабирования.
На фиг.21 показана конфигурация блока 1403 декодирования с расширенным диапазоном в случае, когда параметр кодирования отставания нельзя принять полностью. В этом случае, информацию параметра кодирования для коэффициентов регулировки амплитуды и параметра кодирования масштабного коэффициента нельзя принять полностью.
На фиг.21 блок 1903 задания состояния фильтра, показанный на фиг.20, и блок 2002 фильтрации заменены блоком 2102 генерации псевдоспектра. На фиг.21 конфигурация, не связанная с блоком 2101 разделения и блоком 2102 генерации псевдоспектра, такая же, как для каждой части фиг.19, и поэтому не описана.
Согласно фиг.21 блок 2101 разделения разделяет параметр кодирования, введенный из блока 1401 разделения, показанного на фиг.14, на параметр кодирования коэффициента регулировки амплитуды и параметр кодирования масштабного коэффициента, и выводит параметры в блок 1902 регулировки амплитуды и блок 1908 декодирования масштабного коэффициента, соответственно.
Блок 2102 генерации псевдоспектра генерирует спектр диапазона верхних частот в псевдорежиме с использованием первого декодированного спектра сигнала после регулировки амплитуды, введенной из блока 1902 регулировки амплитуды, и выводит спектр в блок масштабирования 1909. В качестве конкретных способов генерации спектра диапазона верхних частот известны: способ на основе зеркального отражения, согласно которому генерируют спектр диапазона верхних частот как зеркальное изображение спектра диапазона нижних частот, способ сдвига спектра после регулировки амплитуды в направлении диапазона верхних частот частотной оси и способ осуществления обработки фильтрацией основного тона в направлении частотной оси на спектре после регулировки амплитуды с использованием отставания основного тона, полученного из спектра диапазона нижних частот. Можно также генерировать псевдоспектр с использованием спектра шума, генерируемого в случайном режиме, когда кадры в ходе декодирования определяются как невокализованные кадры.
На фиг.22 показана конфигурация блока 1403 декодирования с расширенным диапазоном в случае, когда информацию регулировки амплитуды также нельзя принять. В этом случае, информацию параметра кодирования масштабного коэффициента нельзя принять полностью. На фиг.22 конфигурация, не связанная с блоком 2201 разделения и блоком 2202 генерации псевдоспектра, такая же, как для каждой части фиг.19, и поэтому не описана.
Согласно фиг.22 блок 2201 разделения разделяет параметр кодирования масштабного коэффициента из параметра кодирования, введенного из блока 1401 разделения, показанного на фиг.14, и выводит параметр в блок 1908 декодирования масштабного коэффициента.
Блок 2202 генерации псевдоспектра генерирует спектр диапазона верхних частот в псевдорежиме с использованием первого декодированного спектра сигнала и выводит спектр в блок 1909 масштабирования. В качестве конкретных способов генерации спектра диапазона верхних частот известны: способ на основе зеркального отражения, согласно которому генерируют спектр диапазона верхних частот как зеркальное изображение спектра диапазона нижних частот, способ сдвига спектра после регулировки амплитуды в направлении диапазона верхних частот частотной оси и способ осуществления обработки фильтрацией основного тона в направлении частотной оси на спектре после регулировки амплитуды с использованием отставания основного тона, полученного из спектра диапазона нижних частот. Можно также генерировать псевдоспектр с использованием спектра шума, генерируемого в случайном режиме, когда кадры в ходе декодирования определяются как невокализованные кадры. Кроме того, способ регулировки амплитуды представлять собой, например, постоянный множитель в логарифмической области (γ×S, где S - логарифмический спектр) или может представлять собой постоянный множитель (где Sγ, S - линейный спектр) в линейной области. Кроме того, можно также использовать коэффициенты, например, коэффициенты, необходимые при добавлении глубины ямы гармоник, имеющей место в диапазоне нижних частот в вокализованной речи, и глубины ямы гармоник, имеющей место в диапазоне верхних частот, как регулировочные коэффициенты для регулировки амплитуды. Кроме того, регулировочные коэффициенты могут быть фиксированной постоянной, но также можно подготавливать совокупность подходящих регулировочных коэффициентов согласно индексу (например, непосредственно, значение дисперсии амплитуды спектра, имеющей место в диапазоне нижних частот, или опосредованно, значение коэффициента усиления основного тона, имеющего место в блоке 201 кодирования первого уровня), указывающую глубину впадины гармоник спектра диапазона нижних частот, и избирательно использовать соответствующие регулировочные коэффициенты согласно индексу. Кроме того, можно также избирательно использовать регулировочные коэффициенты согласно характеристикам для каждого гласного звука с использованием информации формы (огибающей) спектра диапазона нижних частот и информации периода основного тона. В частности, это то же самое, что генерация псевдоспектра, описанная согласно варианту осуществления 1, и поэтому не описано здесь.
На фиг.23 показана схема, демонстрирующая последовательность операций для генерации компонента диапазона верхних частот в конфигурации, показанной на фиг.20. Согласно фиг.23 сначала осуществляется регулировка амплитуды первого декодированного спектра. Затем осуществляется обработка фильтрацией (фильтрация основного тона) в направлении частотной оси, причем первый декодированный спектр после регулировки амплитуды рассматривается как информация фильтра для фильтра основного тона и генерируется компонент диапазона верхних частот. После этого осуществляется масштабирование на сгенерированном компоненте диапазона верхних частот для диапазона каждого масштабного коэффициента, чтобы, в конце концов, получился спектр диапазона верхних частот. Затем генерируется второй декодированный спектр путем объединения сгенерированного спектра диапазона верхних частот и первого декодированного спектра.
На фиг.24 показан пример конфигурации блока 1504 кодирования с расширенным диапазоном, соответствующего блоку 1403 декодирования с расширенным диапазоном, показанному на фиг.19.
Согласно фиг.24 блок 2401 регулировки амплитуды осуществляет регулировку амплитуды первого декодированного спектра, введенного из блока 1503 кодирования первого спектра, с использованием спектра входного речевого сигнала, введенного из блока 1502A преобразования частотной области, выводит параметр кодирования для коэффициентов регулировки амплитуды и выводит первый декодированный спектр после регулировки амплитуды в блок 2402 задания состояния фильтра. Блок 2401 регулировки амплитуды осуществляет обработку регулировкой амплитуды так, чтобы отношение (динамический диапазон) спектра максимальной амплитуды для первого декодированного спектра и спектра минимальной амплитуды приближалось к динамическому диапазону диапазона верхних частот спектра входного речевого сигнала. Например, в качестве способа регулировки амплитуды, можно применять вышеописанный способ. Кроме того, регулировку амплитуды можно осуществлять с использованием, например, уравнения преобразования, представленного уравнением 1. S1 это спектр до преобразования, и S1' это спектр после преобразования.
[1]
(уравнение 1)
Здесь, sign() это функция, возвращающая положительный знак/отрицательный знак, и γ - действительное число в пределах 0≤γ≤1. В случае использования уравнения 1, блок 2401 регулировки амплитуды выбирает коэффициенты регулировки амплитуды γ из совокупности кандидатов, подготовленных заранее, чтобы первый декодированный спектр после регулировки амплитуды приближался к динамическому диапазону диапазона верхних частот спектра входного речевого сигнала, и выводит параметр кодирования для выбранных коэффициентов регулировки амплитуды γ в блок 203 мультиплексирования.
Блок 2402 задания состояния фильтра присваивает первому декодированному спектру после регулировки амплитуды, введенной из блока 2401 регулировки амплитуды, внутреннее состояние фильтра основного тона аналогично блоку 1903 задания состояния фильтра, показанному на фиг.19.
Блок 2403 задания отставания выводит отставание T последовательно в блок 2404 фильтрации, в то же время мало-помалу изменяя отставание T в заранее определенном диапазоне поиска от TMIN до TMAX.
Кодовая книга 2405 формы остаточного спектра хранит совокупность кандидатов вектора формы остатка и последовательно выбирает и выводит векторы формы остаточного спектра из всех кандидатов или заранее отобранных кандидатов, согласно команде от блока 2406 поиска. Аналогично, кодовая книга коэффициента усиления остаточного спектра 2407 хранит совокупность кандидатов коэффициента усиления вектора остатка и последовательно выбирает и векторы формы остаточного спектра из всех кандидатов или заранее отобранных кандидатов, согласно команде от блока 2406 поиска.
Кандидаты на векторы формы остатка, выводимые из кодовой книги 2405 формы остаточного спектра, и кандидаты на коэффициенты усиления остаточного спектра, выводимые из кодовой книги 2407 коэффициента усиления остаточного спектра, перемножаются в блоке 2408 умножения, и результат умножения выводится в блок 2404 фильтрации.
Затем блок 2404 фильтрации осуществляет обработку фильтрацией с использованием внутреннего состояния фильтра основного тона, заданного в блоке 2402 задания состояния фильтра, отставания T, выведенного из блока 2403 задания отставания, и векторов формы остаточного спектра с отрегулированным коэффициентом усиления, и вычисляет оценочное значение для спектра входного речевого сигнала. Эта операция идентична операции блока 1904 фильтрации, показанного на фиг.19.
Блок 2406 поиска определяет комбинацию, где взаимная корреляция между диапазоном верхних частот спектра входного речевого сигнала (исходного спектра) и выходным сигналом блока 240 фильтрации оказывается максимальной для совокупности комбинаций отставаний, векторов формы остаточного спектра и коэффициента усиления остаточного спектра, с использованием анализа через синтез (AbS). При этом комбинация, наиболее схожая с точки зрения аудитории, определяется с использованием слухового маскирования. Кроме того, поиск также осуществляется с учетом масштабирования, осуществляемого посредством масштабного коэффициента на более поздней стадии. Параметр кодирования отставания, определенный в блоке 2406 поиска, параметр кодирования векторов формы остаточного спектра и параметр кодирования коэффициента усиления остаточного спектра выводятся в блок 203 мультиплексирования и блок 2409 декодирования с расширенным диапазоном.
Согласно вышеописанному способу определения параметров кодирования с использованием AbS, предпочтительно определять коэффициенты основного тона, векторы формы остаточного спектра и коэффициент усиления остаточного спектра одновременно. Кроме того, коэффициенты основного тона T, вектор формы остаточного спектра и коэффициент усиления остаточного спектра можно также определять по очереди для сокращения объема вычислений.
Затем блок 2409 декодирования с расширенным диапазоном осуществляет обработку декодированием на первом декодированном спектре с использованием параметра кодирования для коэффициентов регулировки амплитуды, выведенных из блока 2401 регулировки амплитуды, параметра кодирования отставания, выведенного из блока 2406 поиска, параметра кодирования для вектора формы остаточного спектра и параметра кодирования для коэффициента усиления остаточного спектра, генерирует оценочный спектр (т.е. спектр до масштабирования) для спектра входного речевого сигнала и выводит спектр в блок 2410 кодирования масштабного коэффициента. Процедура декодирования такая же, как в блоке 1403 декодирования с расширенным диапазоном, показанном на фиг.19 (однако, обработка для блока 1909 масштабирования и блока 1910 синтеза спектра исключается).
Блок 2410 кодирования масштабного коэффициента кодирует масштабный коэффициент (масштабные коэффициенты) оценочного спектра, наиболее подходящие с точки зрения аудитории, с использованием диапазона верхних частот спектра входного речевого сигнала (исходного спектра), выведенного из блока 1502A преобразования частотной области, оценочного спектра, выведенного из блока 2409 декодирования с расширенным диапазоном, и слухового маскирования, и выводит параметр кодирования в блок 203 мультиплексирования.
На фиг.25 показана схема, демонстрирующая содержимое битового потока, поступающего в блок 101 разделения, показанный на фиг.1. Из чертежей следует, что, в битовых потоках, совокупность параметров кодирования мультиплексируется по времени. Кроме того, согласно фиг.25, MSB (Most Significant Bit, старший бит в битовом потоке) находится слева, и LSB (Least Significant Bit, младший бит в битовом потоке) находится справа. В результате такой настройки параметров кодирования, когда битовый поток частично отбрасывается в канале связи, путем отбрасывания по порядку со стороны LSB, можно минимизировать ухудшение качества вследствие отбрасывания. Можно производить обработку декодированием с использованием способов, описанных, соответственно, со ссылкой на фиг.20 в случае отбрасывания от LSB к (1), фиг.21 в случае отбрасывания от LSB к (2) и фиг.22 в случае отбрасывания от LSB к (3). Кроме того, в случае отбрасывания от LSB к (4), декодированный сигнал первого уровня считается выходным сигналом.
Способ реализации сети, где параметры кодирования отбрасываются предпочтительно по порядку со стороны LSB, никоим образом не ограничен. Например, можно использовать сеть с коммутацией пакетов, где управление приоритетом осуществляется путем присвоения порядков приоритета параметрам кодирования, секционированным на фиг.25, и передачи параметров с использованием разных пакетов.
Согласно этому варианту осуществления на фиг.19 показана конфигурация, предусматривающая кодовую книгу 1905 формы остаточного спектра, кодовую книгу 1906 коэффициента усиления остаточного спектра и умножитель 1907, но возможна также конфигурация, в которой указанные элементы отсутствуют. В этом случае, сторона кодера может осуществлять связь на низкой битовой скорости без передачи параметра кодирования вектора формы остатка и параметра кодирования коэффициента усиления остатка. Кроме того, процедура обработки декодированием в этом случае отличается от описанной со ссылкой на фиг.19, тем, что не производится обработка декодированием информации остаточного спектра (формы, коэффициента усиления). Конкретно, процедура обработки описана со ссылкой на фиг.20, но битовый поток таков, что позиция (1) на фиг.25 является LSB.
Вариант осуществления 3
Согласно этому варианту осуществления показана еще одна конфигурация блока 1403 декодирования с расширенным диапазоном для блока 103 декодирования второго уровня, показанного на фиг.14 согласно варианту осуществления 2. Согласно этому варианту осуществления параметр декодирования для соответствующего кадра определяется с использованием параметра декодирования, декодированного из параметров кодирования с расширенным диапазоном для кадра и предыдущего кадра и информации о потере данных для принятого битового потока кадра, и декодируется второй декодированный спектр.
На фиг.26 показана блок-схема, демонстрирующая конфигурацию блока 1403 декодирования с расширенным диапазоном согласно варианту осуществления 3 настоящего изобретения. В блоке 1403 декодирования с расширенным диапазоном, показанном на фиг.26, блок 2601 декодирования коэффициентов регулировки амплитуды декодирует коэффициенты регулировки амплитуды из параметра кодирования коэффициентов регулировки амплитуды. Блок 2602 декодирования отставания декодирует отставание из параметра кодирования отставания. Блок 2603 управления параметрами декодирования определяет параметр декодирования, используемый при декодировании второго декодированного спектра кадра, с использованием каждого параметра декодирования, декодированного из параметра кодирования с расширенным диапазоном, принятой информации о потере данных и каждого параметра декодирования предыдущего кадра, выведенного из каждого буфера 2604a-2604e. Каждый из буферов 2604a-2604e декодирует параметр кадра и хранит коэффициенты регулировки амплитуды, отставание, векторы формы остатка, коэффициент усиления остаточного спектра и масштабный коэффициент. Другие аспекты конфигурации, показанной на фиг.26, такие же, как для конфигурации блока 1403 декодирования с расширенным диапазоном, показанного на фиг.19, и поэтому не описаны.
Теперь опишем работу блока 1403 декодирования с расширенным диапазоном вышеописанной конфигурации.
Сначала, параметры декодирования, включенные в параметры кодирования с расширенным диапазоном, которые составляют часть данных кодирования второго уровня для кадра, т.е. параметры кодирования масштабного коэффициента, отставания, коэффициентов регулировки амплитуды, вектора формы остатка и коэффициента усиления остаточного спектра, декодируются в блоках 1908, 2602, 2601, 1905 и 1906 декодирования. Затем блок 2603 управления параметрами декодирования определяет параметр декодирования, используемый при декодировании второго декодированного спектра кадра, на основании принятой информации о потере данных с использованием декодированных параметра декодирования и параметра декодирования для предыдущего кадра.
Здесь, под принятой информацией о потере данных подразумевается информация, указывающая, какие части параметра кодирования с расширенным диапазоном не могут использоваться блоком 1403 декодирования с расширенным диапазоном в результате потери (включая потерю пакетов и случай обнаружения ошибок, возникающих вследствие ошибок передачи).
Затем декодируется второй декодированный спектр с использованием параметра декодирования и первого декодированного спектра, полученных блоком 2603 управления параметрами декодирования, и первого декодированного спектра. Эта конкретная операция такая же, как в блоке 1403 декодирования с расширенным диапазоном, показанном на фиг.19 согласно варианту осуществления 2, и поэтому не описана.
Ниже приведено описание первого рабочего состояния блока 2603 управления параметрами декодирования.
В первом рабочем состоянии, блок 2603 управления параметрами декодирования подставляет параметр декодирования частотного диапазона, соответствующего предыдущему кадру, как параметр декодирования частотного диапазона, соответствующего параметру кодирования, который не может быть получен вследствие потерь.
В частности, когда предполагается, что:
SF (n, m): масштабный коэффициент для m-го частотного диапазона n-го кадра
T (n, m): отставание m-го частотного диапазона n-го кадра
γ (n, m): коэффициенты регулировки амплитуды m-го частотного диапазона n-го кадра
c (n, m): вектор формы остатка m-го частотного диапазона n-го кадра
g (n, m): коэффициент усиления остаточного спектра m-го частотного диапазона n-го кадра
m=ML~MH
ML: номер наинизшего частотного диапазона для частотного диапазона верхних частот на втором уровне
MH: номер наивысшего частотного диапазона для частотного диапазона верхних частот на втором уровне,
если в принятой информации о потере данных указано, что невозможно принять некоторые параметры кодирования m-го диапазона кадра вследствие потерь, параметр декодирования для m-го диапазона предыдущего кадра выводится как параметр декодирования, соответствующий потерянному параметру кодирования.
А именно,
если потерян масштабный коэффициент;
SF(n,m)←SF(n-1,m),
если потеряно отставание;
T(n,m)←T(n-1,m),
если потеряны коэффициенты регулировки амплитуды;
γ(n,m)←γ(n-1,m),
если потерян вектор формы остатка;
c(n,m)←c(n-1,m),
если потерян коэффициент усиления остаточного спектра;
g(n,m)←g(n-1,m).
Вместо вышеуказанного, можно применять (a) либо (b) из следующих.
(a) В частотном диапазоне, где потерян любой из пяти типов параметров, соответствующие параметры предыдущего кадра используются как совокупность типов параметров декодирования, коррелирующих с пятью типами параметров, связанных с произвольной комбинацией.
(b) В частотном диапазоне, где потерян любой из пяти типов параметров, вектор формы остатка и(или) коэффициент усиления остаточного спектра полагается равным 0.
С другой стороны, в частотном диапазоне, где потеря не происходит, параметры декодирования, декодированные с использованием параметра кодирования для принятого кадра, выводятся как есть.
Параметры декодирования SF(n, m), T(n, M), γ(n, m), c(n, M), g(n, m): m=ML … MH для всех диапазонов высокой частоты кадра затем выводятся как параметры декодирования кадра.
В случае потери всех параметров кодирования второго уровня, при компенсации кадра второго уровня, соответствующий параметр декодирования предыдущего кадра используется в качестве параметра декодирования с расширенным диапазоном для всего диапазона высоких частот кадра.
Кроме того, в вышеприведенном описании, описан случай, когда декодирование всегда выполняется с использованием параметра декодирования предыдущего кадра на кадрах с потерями, но возможен и другой случай, когда декодирование выполняется с использованием вышеописанного способа только, когда корреляция превышает пороговое значение, на основании корреляции сигнала между предыдущим кадром и кадром, и затем осуществляется декодирование с использованием способа, замкнутое в кадре в соответствии с вариантом осуществления 2, когда корреляция ниже порогового значения. В этом случае, в качестве индекса, указывающего корреляцию между сигналом предыдущего кадра и сигналом кадра, вычисляются коэффициенты корреляции и спектральное расстояние между предыдущим кадром и кадром с использованием, например, информации огибающей спектра, например, параметра LPC, полученным из параметра кодирования первого уровня, информации, связанной с вокализованной стационарностью сигналов, например, параметра периода основного тона и коэффициента усиления основного тона, декодированным сигналом диапазона нижних частот первого уровня и самим декодированным спектром диапазона нижних частот первого уровня.
Перейдем к описанию второго рабочего состояния блока 2603 управления параметрами декодирования.
Во втором рабочем состоянии, для частотного диапазона, где произошла потеря данных кадра, блок 2603 управления параметрами декодирования получает параметр декодирования для частотного диапазона с использованием параметра декодирования для частотного диапазона предыдущего кадра и параметр декодирования для частотного диапазона, соседствующего с частотным диапазоном предыдущего кадра и кадра.
В частности, когда в принятой информации о потере данных указано, что параметр кодирования для m-го диапазона кадра не может быть принят вследствие потерь, параметр декодирования получается следующим образом с использованием параметра декодирования для m-го диапазона предыдущего кадра (n-1-го кадра) как параметр декодирования, соответствующего потерянному параметру кодирования, и параметра декодирования для диапазона (одного и того же диапазона для предыдущего кадра и кадра), соседствующего с частотным диапазоном предыдущего кадра и кадра.
Конкретно,
когда потерян масштабный коэффициент;
SF(n,m)←SF(n-1,m)*SF(n,m-1)/SF(n-1,m-1),
когда потеряно отставание;
T(n,m)←T(n-1,m)*T(n,m-1)/T(n-1,m-1),
когда потеряны коэффициенты регулировки амплитуды;
γ(n,m)←γ(n-1,m)*γ(n,m-1)/γ(n-1,m-1),
когда потерян коэффициент усиления остаточного спектра;
g(n,m)←g(n-1,m)*g(n,m-1)/g(n-1,m-1),
когда потерян вектор формы остатка;
c(n,m)←c(n-1,m) или 0.
Вместо вышеописанного можно применять (a) либо (b) из следующего.
(a) В частотном диапазоне, где потерян любой из пяти типов параметров, параметры, полученные в соответствии с вышеописанным, используются как совокупность типов параметров декодирования, коррелирующих со всеми пятью типами параметров, или произвольная комбинация.
(b) В частотном диапазоне, где потерян любой из пяти типов параметров, вектор формы остатка и(или) коэффициент усиления остаточного спектра полагается равным 0.
С другой стороны, в частотном диапазоне, где потеря не происходит, параметры декодирования, декодированные с использованием параметра кодирования для принятого кадра, выводятся как есть.
Параметры декодирования SF(n, m), T(n, M), γ(n, m), c(n, M), g(n, m): m=ML … MH для всех диапазонов высокой частоты кадра затем выводятся как параметры декодирования кадра.
В вышеприведенном описании, частотный диапазон, соседний с частотным диапазоном m, рассматривался как m-1, но также можно использовать параметр частотного диапазона m+1. Однако, при потере параметра кодирования в соседнем частотном диапазоне, можно использовать параметр декодирования для другого частотного диапазона, например, ближайшего частотного диапазона, где не было потери.
Кроме того, как и в первом рабочем состоянии, описанном выше, также можно осуществлять декодирование с использованием только вышеописанного способа в случае, когда корреляция выше порогового значения, на основании корреляции между сигналом предыдущего кадра и сигналом кадра.
Кроме того, можно декодировать только часть параметров (масштабный коэффициент, или масштабный коэффициент и коэффициенты регулировки амплитуды) из вышеописанных пяти типов параметров декодирования с использованием параметров декодирования, вычисленных посредством вышеописанной обработки, и декодировать параметры декодирования, отличные от этих, с использованием параметра для частотного диапазона предыдущего кадра, или осуществлять декодирование с использованием способа, описанного согласно варианту осуществления 2.
Кроме того, в качестве другого рабочего состояния, в системе, где совокупность кодированных кадров совместно мультиплексируются в единый пакет и передаются, существует состояние, где управление осуществляется так, чтобы предпочтительно гарантировать (чтобы не потерять) будущие параметры кодирования. В этом случае, на приемной стороне, когда принятый битовый поток декодируются с совокупностью кадров, собранных воедино, параметры кодирования для потерянных кадров также можно декодировать одинаково как для первого рабочего состояния, так и для второго рабочего состояния с использованием параметров кодирования для кадров до и после кадра. При этом получается интерполированное значение, которое является промежуточным значением между параметром декодирования для предыдущего кадра и параметром декодирования для следующего кадра, которое используется как параметр декодирования.
Кроме того, возможно следующее состояние.
(1) Для частотного диапазона, где происходит потеря в параметре кодирования с расширенным диапазоном, декодированный спектр в блоке 1402B декодирования спектра в блоке 103 декодирования второго уровня, показанном на фиг.14, не добавляется.
(2) В блоке 1403 декодирования с расширенным диапазоном, также возможна конфигурация, где кодовая книга формы остаточного спектра, кодовая книга коэффициента усиления остаточного спектра и умножитель не обеспечены.
Кроме того, согласно вышеописанным вариантам осуществления 1-3, в любом из этих вариантов осуществления, показан пример двухуровневой конфигурации, но возможны также три уровня.
Выше приведено описание вариантов осуществления устройства масштабируемого декодирования и устройств масштабируемого кодирования, отвечающих настоящему изобретению.
Устройство масштабируемого декодирования и устройство масштабируемого кодирования согласно настоящему изобретению никоим образом не ограничены вышеописанными вариантами осуществления 1-3 и возможны различные их модификации.
Устройство масштабируемого декодирования и устройство масштабируемого кодирования согласно настоящему изобретению могут быть обеспечены в оконечных устройствах связи и в устройстве базовой станции в системе мобильной связи, чтобы было возможно обеспечить оконечное устройство связи и устройство базовой станции, имеющие одинаковые результаты работы, согласно описанному выше.
Кроме того, согласно вышеописанным вариантам осуществления, в порядке примера был описан случай, когда настоящее изобретение реализовано аппаратно, однако, настоящее изобретение можно реализовать программными средствами.
Кроме того, каждый функциональный блок, используемый для объяснения вышеописанных вариантов осуществления, обычно реализуется посредством БИС, образованной интегральной схемой. Это могут быть отдельные микросхемы или могут частично или полностью содержаться в единой микросхеме.
Здесь, каждый функциональный блок описан как БИС, но также может называться “ИС”, “системная БИС”, “супер-БИС”, “ультра-БИС” в зависимости от степени интеграции.
Кроме того, метод интеграции схем не ограничивается БИС и возможна реализация с использованием специализированной схемы или процессоров общего назначения. После изготовления БИС возможно применение программируемой FPGA (вентильной матрицы, программируемой пользователем) или перестраиваемого процессора, в котором соединения и настройки ячеек схемы в БИС можно перестраивать.
Во-первых, согласно настоящему изобретению, после генерации диапазона верхних частот с использованием зеркального отражения, зеркальное отражение осуществляется после регулировки ширины флуктуации исходного спектра диапазона нижних частот, который отражается, вследствие чего нет необходимости передавать информацию, связанную с регулировкой ширины флуктуации. Это дает возможность аппроксимировать гармоническую структуру, которая, скорее всего, является фактическим спектром диапазона верхних частот, и избегать генерации избыточной гармонической структуры.
Во-вторых, согласно настоящему изобретению, когда информация отставания не принимается вследствие ошибок в канале связи, после декодирования кодированного компонента диапазона верхних частот, зеркальное отражение осуществляется с использованием процедуры первой характеристики и обработка декодированием осуществляется для компонента диапазона верхних частот, что позволяет генерировать спектр, имеющий гармоническую структуру в диапазоне верхних частот без использования информации отставания. Кроме того, интенсивность гармонической структуры также можно регулировать до нужного уровня. Можно также генерировать псевдоспектр с использованием другого метода вместо зеркального отражения.
В-третьих, согласно настоящему изобретению, битовый поток используется в порядке масштабного коэффициента, коэффициентов регулировки амплитуды, отставания и остаточного спектра. Когда информация остаточного спектра не принимается, декодированный сигнал генерируется с использованием только масштабного коэффициента, коэффициентов регулировки амплитуды и информации отставания. Когда информация отставания и информация остаточного спектра не принимаются, обработка декодированием осуществляется с использованием процедуры декодирования второй характеристики. Поэтому, когда настоящее изобретение применяется к системе, построенной так, что частота появления ошибок передачи и потери/отбрасывания кодированной информации возрастает в порядке масштабного коэффициента, коэффициента регулировки амплитуды, отставания и остаточного спектра (т.е. масштабный коэффициент имеет наибольшую устойчивость к ошибкам, и предпочтительно передается по каналу связи), можно минимизировать ухудшение качества декодированной речи вследствие ошибок в канале связи. Кроме того, качество декодирования речи постепенно изменяется в единицах каждого параметра, что позволяет реализовать более детализированное масштабирование, чем в уровне технике.
В-четвертых, согласно настоящему изобретению, блок декодирования с расширенным диапазоном содержит: буфер для сохранения параметров декодирования, декодированных из параметров кодирования с расширенным диапазоном, используемых для декодирования предыдущего кадра; и блок управления параметрами декодирования, который определяет параметр декодирования для кадра с использованием параметров декодирования кадра и предыдущего кадра и информации о потере данных для принятого битового потока для кадра, и генерирует второй декодированный спектр с использованием первого декодированного спектра для кадра и параметра декодирования, выведенного из блока управления параметрами декодирования. Поэтому, когда кодированные данные с расширенным диапазоном, полученные кодированием диапазона верхних частот с использованием фильтра, имеющего спектр диапазона нижних частот в качестве внутреннего состояния, частично или полностью потеряны и поэтому не могут использоваться при декодировании, потери можно скомпенсировать с использованием параметров декодирования для предыдущего кадра с высокой степенью подобия в качестве замены и декодировать сигнал с высоким качеством, даже когда происходит потеря данных.
С четвертой характеристикой, для частотного диапазона, где произошла потеря данных кадра, блок управления параметрами декодирования может получать параметр декодирования для частотного диапазона с использованием параметров декодирования для частотного диапазона предыдущего кадра и параметров декодирования для частотного диапазона, соседствующего с частотным диапазоном предыдущего кадра и кадра. В результате, при использовании параметра кодирования предыдущего кадра с высокой степенью подобия, можно использовать соотношение изменений частотных диапазонов, соседствующих с частотным диапазоном цели компенсации, и выполнять точную компенсацию.
Данная заявка опирается на патентную заявку Японии №2004-322954, поданную 5 ноября 2004 г., все содержимое которой в явном виде включено сюда посредством ссылки.
Промышленная применимость
Устройство масштабируемого декодирования и устройство масштабируемого кодирования настоящего изобретения применимы к системе мобильной связи и к системе пакетной связи, использующей интернет-протокол.
название | год | авторы | номер документа |
---|---|---|---|
УСТРОЙСТВО МАСШТАБИРУЕМОГО ДЕКОДИРОВАНИЯ И УСТРОЙСТВО МАСШТАБИРУЕМОГО КОДИРОВАНИЯ | 2005 |
|
RU2404506C2 |
КОДЕР, ДЕКОДЕР, СПОСОБ КОДИРОВАНИЯ И СПОСОБ ДЕКОДИРОВАНИЯ | 2005 |
|
RU2387024C2 |
КОДЕР, ДЕКОДЕР, СПОСОБ КОДИРОВАНИЯ И СПОСОБ ДЕКОДИРОВАНИЯ | 2005 |
|
RU2500043C2 |
УСТРОЙСТВО И СПОСОБ КОДИРОВАНИЯ, УСТРОЙСТВО И СПОСОБ ДЕКОДИРОВАНИЯ | 2007 |
|
RU2464650C2 |
МАСШТАБИРУЕМЫЙ СЖАТЫЙ БИТОВЫЙ ПОТОК АУДИО И КОДЕК, ИСПОЛЬЗУЮЩИЙ ИЕРАРХИЧЕСКИЙ НАБОР ФИЛЬТРОВ И МНОГОКАНАЛЬНОЕ СОВМЕСТНОЕ КОДИРОВАНИЕ | 2006 |
|
RU2402160C2 |
КОДЕР И ДЕКОДЕР АУДИОСИГНАЛА, ИСПОЛЬЗУЮЩИЕ ПРОЦЕССОР ЧАСТОТНОЙ ОБЛАСТИ, ПРОЦЕССОР ВРЕМЕННОЙ ОБЛАСТИ И КРОССПРОЦЕССОР ДЛЯ НЕПРЕРЫВНОЙ ИНИЦИАЛИЗАЦИИ | 2015 |
|
RU2668397C2 |
КОДЕР И ДЕКОДЕР АУДИОСИГНАЛА, ИСПОЛЬЗУЮЩИЕ ПРОЦЕССОР ЧАСТОТНОЙ ОБЛАСТИ С ЗАПОЛНЕНИЕМ ПРОМЕЖУТКА В ПОЛНОЙ ПОЛОСЕ И ПРОЦЕССОР ВРЕМЕННОЙ ОБЛАСТИ | 2015 |
|
RU2671997C2 |
УСТРОЙСТВО И СПОСОБ ФОРМИРОВАНИЯ РАСШИРЕННОГО СИГНАЛА С ИСПОЛЬЗОВАНИЕМ ЗАПОЛНЕНИЯ НЕЗАВИСИМЫМ ШУМОМ | 2015 |
|
RU2665913C2 |
УСТРОЙСТВО И СПОСОБ ФОРМИРОВАНИЯ РАСШИРЕННОГО СИГНАЛА С ИСПОЛЬЗОВАНИЕМ ЗАПОЛНЕНИЯ НЕЗАВИСИМЫМ ШУМОМ | 2015 |
|
RU2667376C2 |
РЕГУЛИРОВКА УРОВНЯ ВО ВРЕМЕННОЙ ОБЛАСТИ ДЛЯ ДЕКОДИРОВАНИЯ ИЛИ КОДИРОВАНИЯ АУДИОСИГНАЛОВ | 2014 |
|
RU2608878C1 |
Изобретение относится к устройствам масштабируемого декодирования и масштабируемого кодирования. В устройстве масштабируемого декодирования блок (1211) регулировки амплитуды использует разные регулировочные коэффициенты в соответствии с характеристикой информации спектра первого уровня для регулировки амплитуды спектра декодированного сигнала первого уровня и затем выводит отрегулированный по амплитуде спектр декодированного сигнала первого уровня в блок (1012) генерации псевдоспектра. Используя отрегулированный по амплитуде спектр декодированного сигнала первого уровня, полученный из блока (1211) регулировки амплитуды, блок (1012) генерации псевдоспектра генерирует и выводит псевдоспектр высоких частот в блок (1013) масштабирования. Блок (1013) масштабирования масштабирует спектр, полученный от блока (1012) генерации псевдоспектра, и затем выводит его в сумматор (В). Технический результат - обеспечение получения декодированного сигнала высокого качества с незначительным ухудшением в спектре диапазона высоких частот. 2 н.п. ф-лы, 26 ил.
1. Устройство масштабируемого кодирования, содержащее
блок кодирования первого уровня, который кодирует компонент диапазона нижних частот спектра входного речевого сигнала для получения кодированной информации диапазона нижних частот;
блок декодирования первого уровня, который декодирует кодированную информацию для получения декодированного спектра диапазона нижних частот; и
блок кодирования второго уровня, который кодирует компонент диапазона верхних частот спектра входного речевого сигнала с использованием декодированного спектра диапазона нижних частот, для получения кодированной информации диапазона верхних частот,
причем блок кодирования второго уровня содержит
блок регулировки, который осуществляет регулировку амплитуды в декодированном спектре диапазона нижних частот;
блок генерации, который генерирует спектр диапазона верхних частот спектра входного речевого сигнала с использованием спектра диапазона нижних частот, отрегулированного по амплитуде; и
блок кодирования масштабного коэффициента, который находит и кодирует масштабный коэффициент сгенерированного спектра диапазона верхних частот в отношении спектра входного речевого сигнала.
2. Устройство масштабируемого декодирования, содержащее
блок декодирования первого уровня, который декодирует кодированную информацию диапазона нижних частот для получения декодированного спектра диапазона нижних частот; и
блок декодирования второго уровня, который получает декодированный спектр диапазона верхних частот из декодированного спектра диапазона нижних частот и кодированной информации диапазона верхних частот,
причем блок декодирования второго уровня содержит
блок регулировки, который осуществляет регулировку амплитуды в декодированном спектре диапазона нижних частот;
блок генерации, который генерирует спектр диапазона верхних частот с использованием декодированного спектра диапазона нижних частот, отрегулированного по амплитуде, и кодированной информации диапазона верхних частот; и
блок масштабирования, который масштабирует сгенерированный спектр диапазона верхних частот для получения декодированного спектра диапазона верхних частот.
СПОСОБ КОДИРОВАНИЯ РЕЧИ (ВАРИАНТЫ), КОДИРУЮЩЕЕ И ДЕКОДИРУЮЩЕЕ УСТРОЙСТВО | 1998 |
|
RU2214048C2 |
СПОСОБ И УСТРОЙСТВО МАСШТАБИРУЕМОГО КОДИРОВАНИЯ-ДЕКОДИРОВАНИЯ СТЕРЕОФОНИЧЕСКОГО ЗВУКОВОГО СИГНАЛА (ВАРИАНТЫ) | 1998 |
|
RU2197776C2 |
US 6639943 В1, 2003.10.28 | |||
Переносная печь для варки пищи и отопления в окопах, походных помещениях и т.п. | 1921 |
|
SU3A1 |
Авторы
Даты
2011-11-20—Публикация
2010-10-01—Подача