Область техники
Настоящее изобретение относится к кодирующему устройству, декодирующему устройству и их способам, используемым в системе связи с масштабируемой схемой кодирования.
Предшествующий уровень техники
В системе мобильной связи требуется, чтобы речевые сигналы сжимались до низких скоростей передачи битов для передачи, чтобы эффективно использовать радиоволновые ресурсы, и так далее. С другой стороны, также требуется, чтобы реализовывалось повышение качества в телефонном разговоре и обслуживании вызова высокого качества, и чтобы удовлетворить эти требования, предпочтительно не только обеспечивать качественные речевые сигналы, но также кодировать другие качественные сигналы, отличные от речевых сигналов, например качественные звуковые сигналы более широких диапазонов.
Методика интеграции множества методик кодирования на уровнях является перспективной для этих двух противоречивых требований. Эта методика объединяет в уровни первый уровень для кодирования входных сигналов в виде, достаточном для речевых сигналов на низких скоростях передачи битов, и второй уровень для кодирования разностных сигналов между входными сигналами и декодированными сигналами первого уровня в виде, достаточном для отличных от речи сигналов. Методика выполнения многоуровневого кодирования, таким образом, обладает характеристиками обеспечения масштабируемости в потоках битов, полученных от кодирующего устройства, то есть получением декодированных сигналов из части информации потоков битов, и поэтому обычно называется "масштабируемым кодированием (многоуровневым кодированием)".
Схема масштабируемого кодирования может гибко поддерживать взаимодействие между сетями меняющихся скоростей передачи битов благодаря ее характеристикам, и следовательно, является подходящей для будущего сетевого окружения, где различные сети будут интегрированы с помощью IP-протокола.
Например, непатентный документ 1 раскрывает методику реализации масштабируемого кодирования с использованием методики, которая стандартизована группой MPEG-4 (Экспертная группа по движущимся изображениям, фаза 4). Эта методика использует кодирование CELP (линейное предсказание с кодовым возбуждением) в первом уровне, подходящее для речевых сигналов, и использует кодирование с преобразованием, например AAC (Перспективный звуковой кодер) и TwinVQ (Векторное квантование с трансформными доменами и взвешенным чередованием) во втором уровне по отношению к разностным сигналам, вычитая декодированные сигналы первого уровня из исходных сигналов.
В отличие от этого непатентный документ 2 раскрывает способ кодирующих коэффициентов MDCT в нужных полосах частот на уровнях, используя TwinVQ, которое применяется к модулю, в качестве основного компонента. С помощью разделения этого модуля для использования множество раз, можно реализовать простое масштабируемое кодирование с высокой степенью гибкости. Хотя этот способ основывается на конфигурации, где заранее определяются поддиапазоны, которые являются объектами для кодирования по каждому уровню, также раскрывается конфигурация, где положение поддиапазона, который является объектом для кодирования по каждому уровню, изменяется в пределах заранее установленных полос в соответствии со свойством входных сигналов.
Непатентный документ 1: "All about MPEG-4", написанный и отредактированный Сукейчи Мики (Sukeichi MIKI), первое издание, Kogyo Chosakai Publishing, Inc., 30 сентября 1998 г., страница 126-127.
Непатентный документ 2: "Scalable Audio Coding Based on Hierarchical Transform Coding Modules", Акио Джин (Akio JIN) и др., Академический журнал Института инженеров по электронике, информации и связи (IEICE), том J83-A, №3, страница 241-252, март 2000 г.
Непатентный документ 3: "AMR Wideband Speech Codec; Transcoding functions", 3GPP TS 26.190, март 2001 г.
Непатентный документ 4: "Source-Controlled-Variable-Rate Multimode Wideband Speech Codec (VMR-WB), Service options 62 and 63 for Spread Spectrum Systems", 3GPP2 C.S0052-A, апрель 2005 г.
Непатентный документ 5: "7/10/15 kHz band scalable speech coding schemes using the band enhancement technique by means of pitch filtering", Журнал Акустического сообщества Японии, 3-11-4, страница 327-328, март 2004 г.
Раскрытие изобретения
Проблемы, которые должны быть решены изобретением
Однако для повышения качества речи у выходных сигналов важно, как устанавливаются поддиапазоны (то есть целевые полосы частот) участка кодирования второго уровня. Способ, раскрытый в непатентном документе 2, заранее определяет поддиапазоны, которые являются объектом для кодирования посредством второго уровня (фиг.1А). В этом случае качество заранее установленных поддиапазонов всегда повышается, и поэтому имеется проблема в том, что когда составляющие ошибки сосредотачиваются в других полосах, чем эти поддиапазоны, невозможно достичь очень большого эффекта улучшения качества речи.
Более того, хотя непатентный документ 2 раскрывает, что положение поддиапазона, который является объектом для кодирования по каждому уровню, изменяется в пределах заранее установленных полос (фиг.1В) в соответствии со свойством входных сигналов, применяемое поддиапазоном положение ограничивается рамками заранее установленных полос, и поэтому не может быть решена описанная выше проблема. Если полоса, применяемая в качестве поддиапазона, охватывает всю полосу входного сигнала (фиг.1С), то имеется проблема в том, что увеличивается вычислительная сложность для указания положения поддиапазона. Кроме того, когда увеличивается количество уровней, положение поддиапазона нужно указывать на основе уровня, и поэтому эта проблема становится существенной.
Поэтому цель настоящего изобретения - предоставить кодирующее устройство, декодирующее устройство и их способы, в схеме масштабируемого кодирования, для точного указания полосы со значительной ошибкой из всей полосы с небольшой вычислительной сложностью.
Средство для решения проблемы
Кодирующее устройство в соответствии с настоящим изобретением применяет конфигурацию, которая включает в себя: участок кодирования первого уровня, который выполняет обработку кодированием по отношению к входным коэффициентам преобразования, чтобы сформировать кодированные данные первого уровня; участок декодирования первого уровня, который выполняет обработку декодированием с использованием кодированных данных первого уровня, чтобы сформировать декодированные коэффициенты преобразования первого уровня; и участок кодирования второго уровня, который выполняет обработку кодированием по отношению к целевой полосе частот, где обнаруживается максимальная ошибка в ошибочных коэффициентах преобразования первого уровня, представляющих ошибку между входными коэффициентами преобразования и декодированными коэффициентами преобразования первого уровня, чтобы сформировать кодированные данные второго уровня, и где участок кодирования второго уровня содержит: участок указания первого положения, который ищет первую полосу, имеющую максимальную ошибку по всей полосе, на основе более широкой полосы пропускания, чем целевая полоса частот, и заранее установленного первого размера шага, чтобы сформировать информацию о первом положении, показывающую указанную первую полосу; участок указания второго положения, который ищет целевую полосу частот по всей первой полосе, на основе меньшего второго размера шага, чем первый размер шага, чтобы сформировать информацию о втором положении, показывающую указанную целевую полосу частот; и участок кодирования, который кодирует ошибочные коэффициенты преобразования первого уровня, включенные в целевую полосу частот, указанную на основе информации о первом положении и информации о втором положении, чтобы сформировать кодированную информацию.
Декодирующее устройство в соответствии с настоящим изобретением применяет конфигурацию, которая включает в себя: участок приема, который принимает: кодированные данные первого уровня, полученные путем выполнения обработки кодированием по отношению к входным коэффициентам преобразования; кодированные данные второго уровня, полученные путем выполнения обработки кодированием по отношению к целевой полосе частот, где обнаруживается максимальная ошибка в ошибочных коэффициентах преобразования первого уровня, представляющих ошибку между входными коэффициентами преобразования и декодированными коэффициентами преобразования первого уровня, которые получаются путем декодирования кодированных данных первого уровня; информацию о первом положении, показывающую первую полосу, которая максимизирует ошибку, в более широкой полосе пропускания, чем целевая полоса частот; и информацию о втором положении, показывающую целевую полосу частот в первой полосе; участок декодирования первого уровня, который декодирует кодированные данные первого уровня, чтобы сформировать декодированные коэффициенты преобразования первого уровня; участок декодирования второго уровня, который указывает целевую полосу частот на основе информации о первом положении и информации о втором положении и декодирует кодированные данные второго уровня, чтобы сформировать декодированные ошибочные коэффициенты преобразования первого уровня; и участок сложения, который складывает декодированные коэффициенты преобразования первого уровня и декодированные ошибочные коэффициенты преобразования первого уровня, чтобы сформировать декодированные коэффициенты преобразования второго уровня.
Способ кодирования в соответствии с настоящим изобретением включает в себя: этап кодирования первого уровня, состоящий из выполнения обработки кодированием по отношению к входным коэффициентам преобразования, чтобы сформировать кодированные данные первого уровня; этап декодирования первого уровня, состоящий из выполнения обработки декодированием с использованием кодированных данных первого уровня, чтобы сформировать декодированные коэффициенты преобразования первого уровня; и этап кодирования второго уровня, состоящий из выполнения кодирования по отношению к целевой полосе частот, где обнаруживается максимальная ошибка в ошибочных коэффициентах преобразования первого уровня, представляющих ошибку между входными коэффициентами преобразования и декодированными коэффициентами преобразования первого уровня, чтобы сформировать кодированные данные второго уровня, где этап кодирования второго уровня включает: этап указания первого положения, состоящий из поиска первой полосы, имеющей максимальную ошибку по всей полосе, на основе более широкой полосы пропускания, чем целевая полоса частот, и заранее установленного первого размера шага, чтобы сформировать информацию о первом положении, показывающую указанную первую полосу; этап указания второго положения, состоящий из поиска целевой полосы частот по всей первой полосе, на основе меньшего второго размера шага, чем первый размер шага, чтобы сформировать информацию о втором положении, показывающую указанную целевую полосу частот; и этап кодирования, состоящий из кодирования ошибочных коэффициентов преобразования первого уровня, включенных в целевую полосу частот, указанную на основе информации о первом положении и информации о втором положении, чтобы сформировать кодированную информацию.
Способ декодирования в соответствии с настоящим изобретением включает в себя: этап приема, состоящий из приема: кодированных данных первого уровня, полученных путем выполнения обработки кодированием по отношению к входным коэффициентам преобразования; кодированных данных второго уровня, полученных путем выполнения обработки кодированием по отношению к целевой полосе частот, где обнаруживается максимальная ошибка в ошибочных коэффициентах преобразования первого уровня, представляющих ошибку между входными коэффициентами преобразования и декодированными коэффициентами преобразования первого уровня, которые получаются путем декодирования кодированных данных первого уровня; информации о первом положении, показывающей первую полосу, которая максимизирует ошибку, в более широкой полосе пропускания, чем целевая полоса частот; и информации о втором положении, показывающей целевую полосу частот в первой полосе; этап декодирования первого уровня, состоящий из декодирования кодированных данных первого уровня, чтобы сформировать декодированные коэффициенты преобразования первого уровня; этап декодирования второго уровня, состоящий из указания целевой полосы частот на основе информации о первом положении и информации о втором положении и декодирования кодированных данных второго уровня, чтобы сформировать декодированные ошибочные коэффициенты преобразования первого уровня; и этап сложения, состоящий из сложения декодированных коэффициентов преобразования первого уровня и декодированных ошибочных коэффициентов преобразования первого уровня, чтобы сформировать декодированные коэффициенты преобразования второго уровня.
Полезные результаты изобретения
В соответствии с настоящим изобретением, участок указания первого положения ищет полосу со значительной ошибкой по всей полосе входного сигнала, на основе относительно широких полос пропускания и относительно крупных размеров шага, чтобы указать полосу со значительной ошибкой, и участок указания второго положения ищет целевую полосу частот (то есть полосу частот, имеющую наибольшую ошибку) в полосе, указанной в участке указания первого положения, на основе относительно узких полос пропускания и относительно мелких размеров шага, чтобы указать полосу, имеющую наибольшую ошибку, так что можно указать полосу со значительной ошибкой из всей полосы с небольшой вычислительной сложностью и повысить качество звука.
Краткое описание чертежей
Фиг.1 показывает кодированную полосу в участке кодирования второго уровня в традиционном устройстве кодирования речи;
фиг.2 - блок-схема, показывающая основную конфигурацию кодирующего устройства в соответствии с Вариантом 1 осуществления настоящего изобретения;
фиг.3 - блок-схема, показывающая конфигурацию участка кодирования второго уровня, показанного на фиг.2;
фиг.4 показывает положение полосы, указанной в участке указания первого положения, показанном на фиг.3;
фиг.5 показывает другое положение полосы, указанной в участке указания первого положения, показанном на фиг.3;
фиг.6 показывает положение целевой полосы частот, указанной в участке указания второго положения, показанном на фиг.3;
фиг.7 - блок-схема, показывающая конфигурацию участка кодирования, показанного на фиг.3;
фиг.8 - блок-схема, показывающая основную конфигурацию декодирующего устройства в соответствии с Вариантом 1 осуществления настоящего изобретения;
фиг.9 показывает конфигурацию участка декодирования второго уровня, показанного на фиг.8;
фиг.10 показывает состояние декодированных ошибочных коэффициентов преобразования первого уровня, выведенных из участка размещения, показанного на фиг.9;
фиг.11 показывает положение целевой частоты, указанной в участке указания второго положения, показанном на фиг.3;
фиг.12 - блок-схема, показывающая другую особенность конфигурации участка кодирования, показанного на фиг.7;
фиг.13 - блок-схема, показывающая другую особенность конфигурации участка декодирования второго уровня, показанного на фиг.9;
фиг.14 - блок-схема, показывающая конфигурацию участка кодирования второго уровня в кодирующем устройстве в соответствии с Вариантом 3 осуществления настоящего изобретения;
фиг.15 показывает положение целевой частоты, указанной в множестве участков указания субположения в кодирующем устройстве в соответствии с Вариантом 3 осуществления;
фиг.16 - блок-схема, показывающая конфигурацию участка кодирования второго уровня в кодирующем устройстве в соответствии с Вариантом 4 осуществления настоящего изобретения;
фиг.17 - блок-схема, показывающая конфигурацию участка кодирования, показанного на фиг.16;
фиг.18 показывает участок кодирования в случае, когда кандидаты в информацию о втором положении, сохраненные в кодовой книге информации о втором положении на фиг.17, имеют три целевые частоты;
фиг.19 - блок-схема, показывающая другую конфигурацию участка кодирования, показанного на фиг.16;
фиг.20 - блок-схема, показывающая конфигурацию участка кодирования второго уровня в соответствии с Вариантом 5 осуществления настоящего изобретения;
фиг.21 показывает положение полосы, указанной в участке указания первого положения, показанном на фиг.20;
фиг.22 - блок-схема, показывающая основную конфигурацию кодирующего устройства в соответствии с Вариантом 6 осуществления;
фиг.23 - блок-схема, показывающая конфигурацию участка кодирования первого уровня в кодирующем устройстве, показанном на фиг.22;
фиг.24 - блок-схема, показывающая конфигурацию участка декодирования первого уровня в кодирующем устройстве, показанном на фиг.22;
фиг.25 - блок-схема, показывающая основную конфигурацию декодирующего устройства, поддерживающего кодирующее устройство, показанное на фиг.22;
фиг.26 - блок-схема, показывающая основную конфигурацию кодирующего устройства в соответствии с Вариантом 7 осуществления;
фиг.27 - блок-схема, показывающая основную конфигурацию декодирующего устройства, поддерживающего кодирующее устройство, показанное на фиг.26;
фиг.28 - блок-схема, показывающая другую особенность основной конфигурации кодирующего устройства в соответствии с Вариантом 7 осуществления;
фиг.29А показывает положения полос в участке кодирования второго уровня, показанном на фиг.28;
фиг.29В показывает положения полос в участке кодирования третьего уровня, показанном на фиг.28;
фиг.29С показывает положения полос в участке кодирования четвертого уровня, показанном на фиг.28;
фиг.30 - блок-схема, показывающая основную конфигурацию декодирующего устройства, поддерживающего кодирующее устройство, показанное на фиг.28;
фиг.31А показывает другие положения полос в участке кодирования второго уровня, показанном на фиг.28;
фиг.31В показывает другие положения полос в участке кодирования третьего уровня, показанном на фиг.28;
фиг.31С показывает другие положения полос в участке кодирования четвертого уровня, показанном на фиг.28;
фиг.32 иллюстрирует работу участка указания первого положения в соответствии с Вариантом 8 осуществления;
фиг.33 - блок-схема, показывающая конфигурацию участка указания первого положения в соответствии с Вариантом 8 осуществления;
фиг.34 иллюстрирует, как информация о первом положении формируется в участке формирования информации о первом положении в соответствии с Вариантом 8 осуществления;
фиг.35 иллюстрирует декодирование в соответствии с Вариантом 8 осуществления;
фиг.36 иллюстрирует разновидность Варианта 8 осуществления; и
фиг.37 иллюстрирует разновидность Варианта 8 осуществления.
Лучший вариант осуществления изобретения
Варианты осуществления настоящего изобретения будут объясняться подробно ниже со ссылкой на прилагаемые чертежи.
(Вариант 1 осуществления)
Фиг.2 - блок-схема, показывающая основную конфигурацию кодирующего устройства в соответствии с Вариантом 1 осуществления настоящего изобретения. Кодирующее устройство 100, показанное на фиг.2, имеет участок 101 преобразования в частотную область, участок 102 кодирования первого уровня, участок 103 декодирования первого уровня, участок 104 вычитания, участок 105 кодирования второго уровня и участок 106 мультиплексирования.
Участок 101 преобразования в частотную область преобразует входной сигнал временной области в сигнал частотной области (то есть входные коэффициенты преобразования) и выводит входные коэффициенты преобразования в участок 102 кодирования первого уровня.
Участок 102 кодирования первого уровня выполняет кодирование по отношению к входным коэффициентам преобразования, чтобы сформировать кодированные данные первого уровня, и выводит эти кодированные данные первого уровня в участок 103 декодирования первого уровня и участок 106 мультиплексирования.
Участок 103 декодирования первого уровня выполняет обработку декодированием с использованием кодированных данных первого уровня, чтобы сформировать декодированные коэффициенты преобразования первого уровня, и выводит декодированные коэффициенты преобразования первого уровня в участок 104 вычитания.
Участок 104 вычитания вычитает декодированные коэффициенты преобразования первого уровня, сформированные в участке 103 декодирования первого уровня, из входных коэффициентов преобразования, чтобы сформировать ошибочные коэффициенты преобразования первого уровня, и выводит эти ошибочные коэффициенты преобразования первого уровня в участок 105 кодирования второго уровня.
Участок 105 кодирования второго уровня выполняет обработку кодированием ошибочных коэффициентов преобразования первого уровня, выведенных из участка 104 вычитания, чтобы сформировать кодированные данные второго уровня, и выводит эти кодированные данные второго уровня в участок 106 мультиплексирования.
Участок 106 мультиплексирования мультиплексирует кодированные данные первого уровня, полученные на участке 102 кодирования первого уровня, и кодированные данные второго уровня, полученные на участке 105 кодирования второго уровня, чтобы создать поток битов, и выводит этот поток битов в качестве итоговых кодированных данных в канал передачи.
Фиг.3 - блок-схема, показывающая конфигурацию участка 105 кодирования второго уровня, показанного на фиг.2. Участок 105 кодирования второго уровня, показанный на фиг.3, имеет участок 201 указания первого положения, участок 202 указания второго положения, участок 203 кодирования и участок 204 мультиплексирования.
Участок 201 указания первого положения использует ошибочные коэффициенты преобразования первого уровня, принятые от участка 104 вычитания, для поиска полосы, применяемой в качестве целевой полосы частот, которая является объектом для кодирования, на основе заранее установленных полос пропускания и заранее установленных размеров шага, и выводит информацию, показывающую указанную полосу, в качестве информации о первом положении в участок 202 указания второго положения, участок 203 кодирования и участок 204 мультиплексирования. Между тем, участок 201 указания первого положения будет подробно описываться позднее. Более того, эта указанная полоса может называться "диапазоном" или "областью".
Участок 202 указания второго положения ищет целевую полосу частот в полосе, указанной в участке 201 указания первого положения, на основе более узких полос пропускания, чем полосы пропускания, используемые в участке 201 указания первого положения, и меньших размеров шага, чем размеры шага, используемые в участке 201 указания первого положения, и выводит информацию, показывающую указанную целевую полосу частот, в качестве информации о втором положении в участок 203 кодирования и участок 204 мультиплексирования. Между тем участок 202 указания второго положения будет подробно описываться позднее.
Участок 203 кодирования кодирует ошибочные коэффициенты преобразования первого уровня, включенные в целевую полосу частот, указанную на основе информации о первом положении и информации о втором положении, чтобы сформировать кодированную информацию, и выводит кодированную информацию в участок 204 мультиплексирования. Между тем участок 203 кодирования будет подробно описываться позднее.
Участок 204 мультиплексирования мультиплексирует информацию о первом положении, информацию о втором положении и кодированную информацию, чтобы сформировать вторые кодированные данные, и выводит эти вторые кодированные данные. Более того, этот участок 204 мультиплексирования не является обязательным, и эти элементы информации могут выводиться непосредственно в участок 106 мультиплексирования, показанный на фиг.2.
Фиг.4 показывает полосу, указанную в участке 201 указания первого положения, показанном на фиг.3.
На фиг.4 участок 201 указания первого положения указывает одну из трех полос, установленных на основе заранее установленных полос пропускания, и выводит информацию о положении этой полосы в качестве информации о первом положении в участок 202 указания второго положения, участок 203 кодирования и участок 204 мультиплексирования. Каждая полоса, показанная на фиг.4, конфигурируется имеющей полосу пропускания, равную или шире целевой полосы частот (полоса 1 равна или выше F1 и ниже F3, полоса 2 равна или выше F2 и ниже F4, и полоса 3 равна или выше F3 и ниже F5). Более того, хотя с данным вариантом осуществления каждая полоса конфигурируется имеющей одинаковую полосу пропускания, каждая полоса может конфигурироваться имеющей разную полосу пропускания. Например, как критическая полоса пропускания восприятия человека, полосы пропускания у полос, помещенных в диапазон низких частот, могут быть установлены узкими, и полосы пропускания у полос, помещенных в диапазон высоких частот, могут быть установлены широкими.
Далее будет объясняться способ указания полосы в участке 201 указания первого положения. Здесь участок 201 указания первого положения указывает полосу на основе величины энергии у ошибочных коэффициентов преобразования первого уровня. Ошибочные коэффициенты преобразования первого уровня представляются в виде e1(k), и энергия ER(i) ошибочных коэффициентов преобразования первого уровня, включенных в каждую полосу, вычисляется в соответствии со следующим уравнением 1.
[1]
Здесь i - идентификатор, который указывает полосу, FRL(i) - наименьшая частота полосы i, и FRH(i) - наибольшая частота полосы i.
Таким образом, указывается полоса с большей энергией ошибочных коэффициентов преобразования первого уровня, и кодируются ошибочные коэффициенты преобразования первого уровня, включенные в полосу со значительной ошибкой, так что возможно уменьшить ошибки между декодированными сигналами и входными сигналами и повысить качество речи.
Между тем нормализованная энергия NER(i), нормализованная на основе полосы пропускания, как в следующем уравнении 2, может вычисляться вместо энергии ошибочных коэффициентов преобразования первого уровня.
[2]
Дополнительно в качестве базиса для указания полосы, вместо энергии ошибочных коэффициентов преобразования первого уровня может быть найдена энергия WER(i) и WNER(i) ошибочных коэффициентов преобразования первого уровня (нормализованная энергия, которая нормализуется на основе полосы пропускания), к которой применяется вес, учитывая характеристики восприятия человека, в соответствии с уравнениями 3 и 4. Здесь w(k) представляет вес, относящийся к характеристикам восприятия человека.
[3]
[4]
В этом случае участок 201 указания первого положения увеличивает вес для частоты с высокой важностью в характеристиках восприятия, так что скорее всего будет выбрана включающая эту частоту полоса, и уменьшает вес для частоты с низкой важностью, так что включающая эту частоту полоса вряд ли будет выбрана. Таким образом, предпочтительно выбирается важная для восприятия полоса, так что возможно обеспечить аналогичное преимущество повышения качества звука, как описано выше. Вес может вычисляться и использоваться с использованием, например, характеристик громкости человеческого восприятия или порога маскирующего эффекта восприятия, вычисленных на основе входного сигнала или декодированного сигнала первого уровня.
Более того, способ выбора полосы может выбирать полосу из полос, размещенных в диапазоне низких частот, имеющую более низкую частоту, чем опорная частота (Fx), которая устанавливается заранее. С примером из фиг.5 полоса выбирается с полосы 1 по полосу 8. Причина для указания ограничения (то есть опорной частоты) при выборе полосы выглядит следующим образом. Со структурой гармоники или структурой гармоник, которая является одной характеристикой речевого сигнала (то есть структурой, в которой возникают всплески в спектре на указанных интервалах частот), более крупные всплески появляются в диапазоне низких частот, чем в диапазоне высоких частот, и всплески появляются резче в диапазоне низких частот, чем в диапазоне высоких частот, аналогично ошибке квантования (то есть ошибочному спектру или ошибочным коэффициентам преобразования), созданной в кодировании. Поэтому, даже когда энергия ошибочного спектра (то есть ошибочных коэффициентов преобразования) в диапазоне низких частот ниже, чем в диапазоне высоких частот, всплески в ошибочном спектре (то есть ошибочные коэффициенты преобразования) в диапазоне низких частот появляются резче, чем в диапазоне высоких частот, и поэтому ошибочный спектр (то есть ошибочные коэффициенты преобразования) в диапазоне низких частот, вероятно, превышает порог маскирующего эффекта восприятия (то есть порог, при котором люди могут воспринимать звук), вызывая ухудшение воспринимаемого качества звука.
Этот способ заранее устанавливает опорную частоту, чтобы определить целевую частоту из диапазона низких частот, в которой всплески коэффициентов ошибки (или векторов ошибки) появляются резче, чем в диапазоне высоких частот, имеющую более высокую частоту, чем опорная частота (Fx), так что возможно подавить всплески ошибочных коэффициентов преобразования и повысить качество звука.
Дополнительно, с помощью способа выбора полосы может выбираться полоса из полос, размещенных в нижней и средней полосе частот. С примером на фиг.4 полоса 3 исключается из кандидатов на отбор, и полоса выбирается из полосы 1 и полосы 2. Таким образом, целевая полоса частот определяется из нижней и средней полосы частот.
В дальнейшем, в качестве информации о первом положении участок 201 указания первого положения выводит "1", когда указывается полоса 1, "2", когда указывается полоса 2, и "3", когда указывается полоса 3.
Фиг.6 показывает положение целевой полосы частот, указанной в участке 202 указания второго положения, показанном на фиг.3.
Участок 202 указания второго положения указывает целевую полосу частот в полосе, указанной в участке 201 указания первого положения, на основе меньших размеров шага, и выводит информацию о положении целевой полосы частот в качестве информации о втором положении в участок 203 кодирования и участок 204 мультиплексирования.
Далее будет объясняться способ указания целевой полосы частот в участке 202 указания второго положения. Здесь, ссылаясь на пример, где информация о первом положении, выведенная из участка 201 указания первого положения, показанного на фиг.3, равна "2", ширина целевой полосы частот изображается как "BW". Более того, наименьшая частота F2 в полосе 2 устанавливается в качестве исходного положения, и эта наименьшая частота F2 представляется как G1 для простоты объяснения. Тогда наименьшие частоты в целевой полосе частот, которая может быть указана в участке 202 указания второго положения, устанавливаются от G2 до GN. Более того, размеры шага целевых полос частот, которые задаются в участке 202 указания второго положения, равны Gn-Gn-1, а размеры шага полос, которые задаются в участке 201 указания первого положения, равны Fn-Fn-1(Gn-Gn-1<Fn-Fn-1).
Участок 202 указания второго положения указывает целевую полосу частот из кандидатов на целевую частоту, имеющих наименьшие частоты от G1 до GN, на основе энергии ошибочных коэффициентов преобразования первого уровня или на основе аналогичного базиса. Например, участок 202 указания второго положения вычисляет энергию ошибочных коэффициентов преобразования первого уровня в соответствии с уравнением 5 для всех из Gn кандидатов на целевую частоту, указывает целевую полосу частот, где вычисляется наибольшая энергия ER(n), и выводит информацию о положении этой целевой частоты в качестве информации о втором положении.
[5]
Более того, когда энергия WER(n) ошибочных коэффициентов преобразования первого уровня, к которой применяется вес, учитывая характеристики восприятия человека, как объяснялось выше, используется в качестве базиса, WER(n) вычисляется в соответствии со следующим уравнением 6. Здесь w(k) представляет вес, относящийся к характеристикам восприятия человека. Вес может вычисляться и использоваться с использованием, например, характеристик громкости человеческого восприятия или порога маскирующего эффекта восприятия, вычисленных на основе входного сигнала или декодированного сигнала первого уровня.
[6]
В этом случае участок 202 указания второго положения увеличивает вес для частоты с высокой важностью в характеристиках восприятия, так что скорее всего будет выбрана включающая эту частоту целевая полоса частот, и уменьшает вес для частоты с низкой важностью, так что включающая эту частоту целевая полоса частот вряд ли будет выбрана. Таким образом, предпочтительно выбирается важная для восприятия целевая полоса частот, так что возможно дополнительно повысить качество звука.
Фиг.7 - блок-схема, показывающая конфигурацию участка 203 кодирования, показанного на фиг.3. Участок 203 кодирования, показанный на фиг.7, имеет участок 301 формирования целевого сигнала, участок 302 вычисления ошибки, участок 303 поиска, кодовую книгу 304 формы и кодовую книгу 305 усиления.
Участок 301 формирования целевого сигнала использует информацию о первом положении, принятую от участка 201 указания первого положения, и информацию о втором положении, принятую от участка 202 указания второго положения, чтобы указать целевую полосу частот, извлекает включенную в целевую полосу частот часть на основе ошибочных коэффициентов преобразования первого уровня, принятых от участка 104 вычитания, и выводит извлеченные ошибочные коэффициенты преобразования первого уровня в качестве целевого сигнала в участок 302 вычисления ошибки. Эти первые ошибочные коэффициенты преобразования изображены в виде e1(k).
Участок 302 вычисления ошибки вычисляет ошибку E в соответствии со следующим уравнением 7 на основе: i-го кандидата по форме, принятого из кодовой книги 304 формы, которая хранит кандидаты (кандидаты по форме), которые представляют форму ошибочных коэффициентов преобразования; m-того кандидата по усилению, принятого из кодовой книги 305 усиления, которая хранит кандидаты (кандидаты по усилению), которые представляют усиление ошибочных коэффициентов преобразования; и целевого сигнала, принятого из участка 301 формирования целевого сигнала, и выводит вычисленную ошибку E в участок 303 поиска.
[7]
Здесь sh(i,k) представляет i-й кандидат по форме, а ga(m) представляет m-й кандидат по усилению.
Участок 303 поиска ищет сочетание кандидата по форме и кандидата по усилению, которое минимизирует ошибку E, на основе ошибки E, вычисленной в участке 302 вычисления ошибки, и выводит информацию о форме и информацию об усилении результата поиска в виде кодированной информации в участок 204 мультиплексирования, показанный на фиг.3. Здесь информация о форме является параметром m, который минимизирует ошибку E, и информация об усилении является параметром i, который минимизирует ошибку E.
Более того, участок 302 вычисления ошибки может вычислить ошибку E в соответствии со следующим уравнением 8 путем применения большого веса к важному для восприятия спектру и путем увеличения влияния важного для восприятия спектра. Здесь w(k) представляет вес, относящийся к характеристикам восприятия человека.
[8]
Таким образом, хотя увеличивается вес для частоты с высокой важностью в характеристиках восприятия и увеличивается влияние искажения квантования у частоты с высокой важностью в характеристиках восприятия, вес для частоты с низкой важностью уменьшается, и влияние искажения квантования у частоты с низкой важностью уменьшается, так что возможно повысить субъективное качество.
Фиг.8 - блок-схема, показывающая основную конфигурацию декодирующего устройства в соответствии с данным вариантом осуществления. Декодирующее устройство 600, показанное на фиг.8, имеет участок 601 демультиплексирования, участок 602 декодирования первого уровня, участок 603 декодирования второго уровня, участок 604 сложения, участок 605 переключения, участок 606 преобразования во временную область и выходной фильтр 607.
Участок 601 демультиплексирования демультиплексирует поток битов, принятый по каналу передачи, в кодированные данные первого уровня и кодированные данные второго уровня, и выводит кодированные данные первого уровня и кодированные данные второго уровня в участок 602 декодирования первого уровня и участок 603 декодирования второго уровня соответственно. Более того, когда введенный поток битов включает в себя как кодированные данные первого уровня, так и кодированные данные второго уровня, участок 601 демультиплексирования выводит "2" в качестве информации об уровне в участок 605 переключения. В отличие от этого, когда поток битов включает в себя только кодированные данные первого уровня, участок 601 демультиплексирования выводит "1" в качестве информации об уровне в участок 605 переключения. Более того, имеются случаи, где отбрасываются все кодированные данные, и в таких случаях участок декодирования в каждом уровне выполняет заранее установленную компенсацию погрешности, а выходной фильтр выполняет обработку, предполагающую, что информация об уровне показывает "1". Данный вариант осуществления будет объясняться при условии, что декодирующее устройство получает все кодированные данные или кодированные данные, из которых отбрасываются кодированные данные второго уровня.
Участок 602 декодирования первого уровня выполняет обработку декодированием кодированных данных первого уровня, чтобы сформировать декодированные коэффициенты преобразования первого уровня, и выводит декодированные коэффициенты преобразования первого уровня в участок 604 сложения и участок 605 переключения.
Участок 603 декодирования второго уровня выполняет обработку декодированием кодированных данных второго уровня, чтобы сформировать декодированные ошибочные коэффициенты преобразования первого уровня, и выводит декодированные ошибочные коэффициенты преобразования первого уровня в участок 604 сложения.
Участок 604 сложения складывает декодированные коэффициенты преобразования первого уровня и декодированные ошибочные коэффициенты преобразования первого уровня, чтобы сформировать декодированные коэффициенты преобразования второго уровня, и выводит декодированные коэффициенты преобразования второго уровня в участок 605 переключения.
На основе информации об уровне, принятой от участка 601 демультиплексирования, участок 605 переключения выводит декодированные коэффициенты преобразования первого уровня, когда информация об уровне показывает "1", и декодированные коэффициенты преобразования второго уровня, когда информация об уровне показывает "2", в качестве декодированных коэффициентов преобразования в участок 606 преобразования во временную область.
Участок 606 преобразования во временную область преобразует декодированные коэффициенты преобразования в сигнал временной области, чтобы сформировать декодированный сигнал, и выводит декодированный сигнал в выходной фильтр 607.
Выходной фильтр 607 выполняет постфильтрацию по отношению к декодированному сигналу, выведенному из участка 606 преобразования во временную область, чтобы сформировать выходной сигнал.
Фиг.9 показывает конфигурацию участка 603 декодирования второго уровня, показанного на фиг.8. Участок 603 декодирования второго уровня, показанный на фиг.9, имеет кодовую книгу 701 формы, кодовую книгу 702 усиления, участок 703 умножения и участок 704 размещения.
Кодовая книга 701 формы выбирает кандидата sh(i,k) по форме на основе информации о форме, включенной в кодированные данные второго уровня, выведенные из участка 601 демультиплексирования, и выводит кандидат sh(i,k) по форме в участок 703 умножения.
Кодовая книга 702 усиления выбирает кандидат ga(m) по усилению на основе информации об усилении, включенной в кодированные данные второго уровня, выведенные из участка 601 демультиплексирования, и выводит кандидат ga(m) по усилению в участок 703 умножения.
Участок 703 умножения умножает кандидат sh(i,k) по форме на кандидата ga(m) по усилению и выводит результат в участок 704 размещения.
Участок 704 размещения размещает кандидата по форме после умножения на кандидата по усилению, принятого от участка 703 умножения, в целевой частоте, указанной на основе информации о первом положении и информации о втором положении, включенных в кодированные данные второго уровня, выведенные из участка 601 демультиплексирования, и выводит результат в участок 604 сложения в качестве декодированных ошибочных коэффициентов преобразования первого уровня.
Фиг.10 показывает состояние декодированных ошибочных коэффициентов преобразования первого уровня, выведенных из участка 704 размещения, показанного на фиг.9. Здесь Fm представляет частоту, указанную на основе информации о первом положении, а Gn представляет частоту, указанную в информации о втором положении.
Таким образом, в соответствии с данным вариантом осуществления участок 201 указания первого положения ищет полосу со значительной ошибкой по всей полосе входного сигнала на основе заранее установленных полос пропускания и заранее установленных размеров шага, чтобы указать полосу со значительной ошибкой, и участок 202 указания второго положения ищет целевую частоту в полосе, указанной участком 201 указания первого положения, на основе более узких полос пропускания, чем заранее установленные полосы пропускания, и меньших размеров шага, чем заранее установленные размеры шага, так что можно точно указать полосы со значительной ошибкой из всей полосы с небольшой вычислительной сложностью и повысить качество звука.
(Вариант 2 осуществления)
Далее с помощью Варианта 2 осуществления будет объясняться другой способ указания целевой полосы частот в участке 202 указания второго положения. Фиг.11 показывает положение целевой частоты, указанной в участке 202 указания второго положения, показанном на фиг.3. Участок указания второго положения в кодирующем устройстве в соответствии с данным вариантом осуществления отличается от участка указания второго положения в кодирующем устройстве, объясненном в Варианте 1 осуществления, в указании единственной целевой частоты. Кандидаты по форме для ошибочных коэффициентов преобразования, соответствующие единственной целевой частоте, изображаются импульсом (или линейным спектром). Более того, при данном варианте осуществления конфигурация кодирующего устройства является такой же, как и кодирующего устройства, показанного на фиг.2, за исключением внутренней конфигурации участка 203 кодирования, и конфигурация декодирующего устройства является такой же, как и декодирующего устройства, показанного на фиг.8, за исключением внутренней конфигурации участка 603 декодирования второго уровня. Поэтому объяснение этих конфигураций будет пропущено, и будет объясняться только участок 203 кодирования, имеющий отношение к указанию второго положения, и участок 603 декодирования второго уровня в декодирующем устройстве.
С помощью данного варианта осуществления участок 202 указания второго положения указывает единственную целевую частоту в полосе, указанной в участке 201 указания первого положения. Соответственно, с помощью данного варианта осуществления единственный ошибочный коэффициент преобразования первого уровня выбирается в качестве объекта для кодирования. Здесь в качестве примера будет объясняться случай, где участок 201 указания первого положения указывает полосу 2. Когда полоса пропускания целевой частоты равна BW, BW=1 поддерживает данный вариант осуществления.
Если говорить точнее, как показано на фиг.11, по отношению к множеству кандидатов Gn на целевую частоту, включенных в полосу 2, участок 202 указания второго положения вычисляет энергию ошибочного коэффициента преобразования первого уровня в соответствии с вышеупомянутым уравнением 5 или вычисляет энергию ошибочного коэффициента преобразования первого уровня, к котором применяется вес, учитывая характеристики восприятия человека, в соответствии с уравнением 6. Более того, участок 202 указания второго положения указывает целевую частоту Gn(1≤n≤N), которая максимизирует вычисленную энергию, и выводит информацию о положении указанной целевой частоты Gn в качестве информации о втором положении в участок 203 кодирования.
Фиг.12 - блок-схема, показывающая другую особенность конфигурации участка 203 кодирования, показанного на фиг.7. Участок 203 кодирования, показанный на фиг.12, применяет конфигурацию, убирающую кодовую книгу 305 формы по сравнению с фиг.7. Более того, эта конфигурация поддерживает случай, где сигналы, выведенные из кодовой книги 304 формы, всегда показывают "1".
Участок 203 кодирования кодирует ошибочные коэффициенты преобразования первого уровня, включенные в целевую частоту Gn, указанную в участке 202 указания второго положения, чтобы сформировать кодированную информацию, и выводит кодированную информацию в участок 204 мультиплексирования. Здесь единственная целевая частота принимается от участка 202 указания второго положения, и единственный ошибочный коэффициент преобразования первого уровня является объектом для кодирования, и следовательно, участок 203 кодирования не требует информации о форме из кодовой книги 304 формы, осуществляет поиск только в кодовой книге 305 усиления и выводит информацию об усилении результата поиска в виде кодированной информации в участок 204 мультиплексирования.
Фиг.13 - блок-схема, показывающая другую особенность конфигурации участка 603 декодирования второго уровня, показанного на фиг.9. Участок 603 декодирования второго уровня, показанный на фиг.13, применяет конфигурацию, убирающую кодовую книгу 701 формы и участок 703 умножения по сравнению с фиг.9. Более того, эта конфигурация поддерживает случай, где сигналы, выведенные из кодовой книги 701 формы, всегда показывают "1".
Участок 704 размещения размещает кандидата по усилению, выбранного из кодовой книги усиления, на основе информации об усилении в единственной целевой частоте, указанной на основе информации о первом положении и информации о втором положении, включенных в кодированные данные второго уровня, выведенные из участка 601 демультиплексирования, и выводит результат в качестве декодированного ошибочного коэффициента преобразования первого уровня в участок 604 сложения.
Таким образом, в соответствии с данным вариантом осуществления участок 202 указания второго положения может точно представлять линейный спектр путем указания единственной целевой частоты в полосе, указанной в участке 201 указания первого положения, так что возможно повысить качество звука у сигналов строгой тональности, например у гласных звуков (сигналы со спектральными характеристиками, в которых наблюдаются несколько всплесков).
(Вариант 3 осуществления)
Далее с помощью Варианта 3 осуществления будет объясняться другой способ указания целевых полос частот в участке указания второго положения. Более того, при данном варианте осуществления конфигурация кодирующего устройства является такой же, как и кодирующего устройства, показанного на фиг.2, за исключением внутренней конфигурации участка 105 кодирования второго уровня, и поэтому ее объяснение будет пропущено.
Фиг.14 - блок-схема, показывающая конфигурацию участка 105 кодирования второго уровня в кодирующем устройстве в соответствии с данным вариантом осуществления. Участок 105 кодирования второго уровня, показанный на фиг.14, применяет конфигурацию, включающую участок 301 указания второго положения вместо участка 202 указания второго положения по сравнению с фиг.3. Одинаковым компонентам, как в участке 105 кодирования второго уровня, показанном на фиг.3, будут присвоены одинаковые номера ссылок, и их объяснение будет пропущено.
Участок 301 указания второго положения, показанный на фиг.14, имеет участок 311-1 указания первого субположения, участок 311-2 указания второго субположения, …, участок 311-J указания J-го субположения и участок 312 мультиплексирования.
Множество участков указания субположения (311-1, …, 311-J) задают разные целевые частоты в полосе, указанной в участке 201 указания первого положения. Если говорить точнее, участок 311-n указания n-го субположения указывает n-ю целевую частоту в полосе, исключающей целевые частоты, указанные в участках указания субположений с первого по (n-1)-е (311-1, …, 311-n-1), из полосы, указанной в участке 201 указания первого положения.
Фиг.15 показывает положения целевых частот, указанных в множестве участков указания субположений (311-1, …, 311-J) в кодирующем устройстве, в соответствии с данным вариантом осуществления. Здесь в качестве примера будет объясняться случай, где участок 201 указания первого положения указывает полосу 2, а участок 301 указания второго положения указывает положения J целевых частот.
Как показано на фиг.15А, участок 311-1 указания первого субположения указывает единственную целевую частоту из кандидатов на целевую частоту в полосе 2 (здесь G3) и выводит информацию о положении этой целевой частоты в участок 312 мультиплексирования и участок 311-2 указания второго субположения.
Как показано на фиг.15В, участок 311-2 указания второго субположения указывает единственную целевую частоту (здесь GN-1) из кандидатов на целевую частоту, которые исключают из полосы 2 целевую частоту G3, указанную в участке 311-1 указания первого субположения, и выводит информацию о положении целевой частоты в участок 312 мультиплексирования и участок 311-3 указания третьего субположения соответственно.
Аналогичным образом, как показано на фиг.15С, участок 311-J указания J-го субположения выбирает единственную целевую частоту (здесь G5) из кандидатов на целевую частоту, которые исключают из полосы 2 (J-1) целевые частоты, указанные в участках указания субположений с первого по (J-1)-й (311-1, …, 311-J-1), и выводит информацию о положении, которая указывает эту целевую частоту, в участок 312 мультиплексирования.
Участок 312 мультиплексирования мультиплексирует J элементов информации о положении, принятой из участков указания субположения (311-1 - 311-J), чтобы сформировать информацию о втором положении, и выводит информацию о втором положении в участок 203 кодирования и участок 204 мультиплексирования. Между тем, этот участок 312 мультиплексирования не является обязательным, и J элементов информации о положении могут выводиться непосредственно в участок 203 кодирования и участок 204 мультиплексирования.
Таким образом, участок 301 указания второго положения может представлять множество всплесков путем указания J целевых частот в полосе, указанной в участке 201 указания первого положения, так что можно дополнительно повысить качество звука у сигналов строгой тональности, например гласных звуков. Более того, нужно определить только J целевых частот из полосы, указанной в участке 201 указания первого положения, так что возможно значительно уменьшить количество сочетаний у множества целевых частот по сравнению со случаем, где J целевых частот определяются из всей полосы. Таким образом, возможно понизить скорость передачи битов и снизить вычислительную сложность.
(Вариант 4 осуществления)
С помощью Варианта 4 осуществления будет объясняться другой способ кодирования в участке 105 кодирования второго уровня. Более того, при данном варианте осуществления конфигурация кодирующего устройства является такой же, как и кодирующего устройства, показанного на фиг.2, за исключением внутренней конфигурации участка 105 кодирования второго уровня, и ее объяснение будет пропущено.
Фиг.16 - блок-схема, показывающая другую особенность конфигурации участка 105 кодирования второго уровня в кодирующем устройстве в соответствии с данным вариантом осуществления. Участок 105 кодирования второго уровня, показанный на фиг.16, применяет конфигурацию, дополнительно включающую участок 221 кодирования вместо участка 203 кодирования, показанного на фиг.3, без участка 202 указания второго положения, показанного на фиг.3.
Участок 221 кодирования определяет информацию о втором положении из условия, чтобы минимизировалась искажение квантования, вызванное, когда кодируются ошибочные коэффициенты преобразования, включенные в целевую частоту. Эта информация о втором положении сохраняется в кодовой книге 321 информации о втором положении.
Фиг.17 - блок-схема, показывающая конфигурацию участка 221 кодирования, показанного на фиг.16. Участок 221 кодирования, показанный на фиг.17, применяет конфигурацию, включающую участок 322 поиска вместо участка 303 поиска с добавлением кодовой книги 321 информации о втором положении по сравнению с участком 203 кодирования, показанным на фиг.7. Более того, одинаковым компонентам, как в участке 203 кодирования, показанном на фиг.7, будут присвоены одинаковые номера ссылок, и их объяснение будет пропущено.
Кодовая книга 321 информации о втором положении выбирает порцию информации о втором положении из сохраненных кандидатов в информацию о втором положении в соответствии с управляющим сигналом от участка 322 поиска (описан позже), и выводит информацию о втором положении в участок 301 формирования целевого сигнала. В кодовой книге 321 информации о втором положении на фиг.17 черные кружки представляют положения целевых частот кандидатов в информацию о втором положении.
Участок 301 формирования целевого сигнала указывает целевую частоту, используя информацию о первом положении, принятую от участка 201 указания первого положения, и информацию о втором положении, выбранную в кодовой книге 321 информации о втором положении, извлекает часть, включенную в указанную целевую частоту, из ошибочных коэффициентов преобразования первого уровня, принятых от участка 104 вычитания, и выводит извлеченные ошибочные коэффициенты преобразования первого уровня в качестве целевого сигнала в участок 302 вычисления ошибки.
Участок 322 поиска ищет сочетание кандидата по форме, кандидата по усилению и кандидатов в информацию о втором положении, которое минимизирует ошибку E, на основе ошибки Е, принятой от участка 302 вычисления ошибки, и выводит информацию о форме, информацию об усилении и информацию о втором положении результата поиска в виде кодированной информации в участок 204 мультиплексирования, показанный на фиг.16. Более того, участок 322 поиска выводит в кодовую книгу 321 информации о втором положении, управляющий сигнал для выбора и вывода кандидата в информацию о втором положении в участок 301 формирования целевого сигнала.
Таким образом, в соответствии с данным вариантом осуществления информация о втором положении определяется из условия, чтобы минимизировалось искажение квантования, вызванное, когда ошибочные коэффициенты преобразования, включенные в целевую частоту, и, следовательно, итоговое искажение квантования становится небольшим, так что возможно повысить качество речи.
Более того, хотя с данным вариантом осуществления объяснен пример, где кодовая книга 321 информации о втором положении, показанная на фиг.17, хранит кандидатов в информацию о втором положении, в которых в качестве элемента имеется единственная целевая частота, настоящее изобретение этим не ограничивается, и кодовая книга 321 информации о втором положении может хранить кандидатов в информацию о втором положении, в которых в качестве элементов имеется множество целевых частот, как показано на фиг.18. Фиг.18 показывает участок 221 кодирования в случае, когда кандидаты в информацию о втором положении, сохраненные в кодовой книге 321 информации о втором положении, включают в себя три целевые частоты.
Более того, хотя с данным вариантом осуществления объяснен пример, где участок 302 вычисления ошибки, показанный на фиг.17, вычисляет ошибку E на основе кодовой книги 304 формы и кодовой книги 305 усиления, настоящее изобретение этим не ограничивается, и ошибка E может вычисляться на основе одной кодовой книги 305 усиления без кодовой книги 304 формы. Фиг.19 - блок-схема, показывающая другую конфигурацию участка 221 кодирования, показанного на фиг.16. Эта конфигурация поддерживает случай, где сигналы, выведенные из кодовой книги 304 формы, всегда показывают "1". В этом случае форма образуется с помощью множества импульсов, и кодовая книга 304 формы не требуется, так что участок 322 поиска осуществляет поиск только в кодовой книге 305 усиления и кодовой книге 321 информации о втором положении и выводит информацию об усилении и информацию о втором положении результата поиска в виде кодированной информации в участок 204 мультиплексирования, показанный на фиг.16.
Более того, хотя данным вариантом осуществления объяснен с допущением, что кодовая книга 321 информации о втором положении принимает режим фактической защиты пространства хранения и хранения кандидатов в информацию о втором положении, настоящее изобретение этим не ограничивается, и кодовая книга 321 информации о втором положении может формировать кандидатов в информацию о втором положении в соответствии с заранее установленными этапами обработки. В этом случае в кодовой книге 321 информации о втором положении не требуется пространство хранения.
(Вариант 5 осуществления)
Другой способ указания полосы в участке указания первого положения будет объясняться с помощью варианта 5 осуществления. Более того, при данном варианте осуществления конфигурация кодирующего устройства является такой же, как и кодирующего устройства, показанного на фиг.2, за исключением внутренней конфигурации участка 105 кодирования второго уровня, и поэтому ее объяснение будет пропущено.
Фиг.20 - блок-схема, показывающая конфигурацию участка 105 кодирования второго уровня в кодирующем устройстве в соответствии с данным вариантом осуществления. Участок 105 кодирования второго уровня, показанный на фиг.20, применяет конфигурацию, включающую в себя участок 231 указания первого положения вместо участка 201 указания первого положения, показанного на фиг.3.
Участок вычисления (не показан) выполняет анализ основного тона по отношению к входному сигналу, чтобы найти период основного тона, и вычисляет частоту основного тона на основе обратной величины обнаруженного периода основного тона. Более того, участок вычисления может вычислить частоту основного тона на основе кодированных данных первого уровня, созданных при кодировании в участке 102 кодирования первого уровня. В этом случае передаются кодированные данные первого уровня, и поэтому дополнительно не нужно передавать информацию для указания частоты основного тона. Более того, участок вычисления выводит информацию о периоде основного тона для указания частоты основного тона в участок 106 мультиплексирования.
Участок 231 указания первого положения указывает полосу с заранее установленной относительно широкой полосой пропускания, на основе частоты основного тона, принятой из участка вычисления (не показан), и выводит информацию о положении указанной полосы в качестве информации о первом положении в участок 202 указания второго положения, участок 203 кодирования и участок 204 мультиплексирования.
Фиг.21 показывает положение полосы, указанной в участке 231 указания первого положения, показанном на фиг.20. Три полосы, показанные на фиг.21, находятся в окрестностях полос кратных целых опорных частот F1-F3, определенных на основе частоты PF основного тона, которую нужно ввести. Опорные частоты определяются путем добавления заранее установленных значений к частоте PF основного тона. В качестве конкретного примера значения опорных частот добавляют -1, 0 и 1 к PF, и опорные частоты удовлетворяют условиям F1=PF-1, F2=PF и F3=PF+1.
Полосы устанавливаются на основе кратных целых частоты основного тона, потому что речевой сигнал обладает характеристикой (одно из структуры гармоники или гармоник), где всплески растут в спектре в окрестности кратных целых обратной величины периода основного тона (то есть частоты основного тона), особенно в гласной части со строгой периодичностью основного тона, и ошибочные коэффициенты преобразования первого уровня, вероятно, создадут значительную ошибку в окрестности кратных целых частоты основного тона.
Таким образом, в соответствии с данным вариантом осуществления, участок 231 указания первого положения указывает полосу в окрестности кратных целых частоты основного тона, и в результате участок 202 указания второго положения в итоге указывает целевую частоту в окрестности частоты основного тона, так что возможно повысить качество речи при небольшой вычислительной сложности.
(Вариант 6 осуществления)
С помощью Варианта 6 осуществления будет объясняться случай, где способ кодирования в соответствии с настоящим изобретением применяется к кодирующему устройству, которое имеет участок кодирования первого уровня, использующий способ для замены приближенного сигнала, например шума, для диапазона высоких частот. Фиг.22 - блок-схема, показывающая основную конфигурацию декодирующего устройства 220 в соответствии с данным вариантом осуществления. Кодирующее устройство 220, показанное на фиг.22, имеет участок 2201 кодирования первого уровня, участок 2202 декодирования первого уровня, участок 2203 задержки, участок 104 вычитания, участок 101 преобразования в частотную область, участок 105 кодирования второго уровня и участок 106 мультиплексирования. Более того, в кодирующем устройстве 220 на фиг.22 одинаковым компонентам с кодирующим устройством 100, показанным на фиг.2, будут присвоены одинаковые номера ссылок, и их объяснение будет пропущено.
Участок 2201 кодирования первого уровня из данного варианта осуществления применяет схему замены приближенного сигнала, например шума, для диапазона высоких частот. Если говорить точнее, в результате представления диапазона высоких частот с низкой важностью восприятия с помощью приближенного сигнала и вместо этого увеличения количества разрядов для распределения в диапазоне низких частот (или диапазоне средних/низких частот) с важностью восприятия, точность этой полосы повышается относительно исходного сигнала. Таким образом, осуществляется общее повышение качества звука. Например, имеются схема AMR-WB (непатентный документ 3) или схема VMR-WB (непатентный документ 4).
Участок 2201 кодирования первого уровня кодирует входной сигнал, чтобы сформировать кодированные данные первого уровня, и выводит кодированные данные первого уровня в участок 106 мультиплексирования и участок 2202 декодирования первого уровня. Более того, участок 2201 кодирования первого уровня будет подробно описываться позднее.
Участок 2202 декодирования первого уровня выполняет обработку декодированием с использованием кодированных данных первого уровня, принятых от участка 2201 кодирования первого уровня, чтобы сформировать декодированный сигнал первого уровня, и выводит декодированный сигнал первого уровня в участок 104 вычитания. Более того, участок 2202 декодирования первого уровня будет подробно описываться позднее.
Далее будет подробно объясняться участок 2201 кодирования первого уровня с использованием фиг.23. Фиг.23 - блок-схема, показывающая конфигурацию участка 2201 кодирования первого уровня в кодирующем устройстве 220. Как показано на фиг.23, участок 2201 кодирования первого уровня образован участком 2210 понижающей дискретизации и участком 2220 основного кодирования.
Участок 2210 понижающей дискретизации понижает качество входного сигнала временной области, чтобы преобразовать частоту дискретизации входного сигнала временной области к нужной частоте дискретизации, и выводит сигнал временной области с пониженной дискретизацией в участок 2220 основного кодирования.
Участок 2220 основного кодирования выполняет обработку кодированием по отношению к выходному сигналу участка 2210 понижающей дискретизации, чтобы сформировать кодированные данные первого уровня, и выводит кодированные данные первого уровня в участок 2202 декодирования первого уровня и участок 106 мультиплексирования.
Далее будет подробно объясняться участок 2202 декодирования первого уровня с использованием фиг.24. Фиг.24 - блок-схема, показывающая конфигурацию участка 2202 декодирования первого уровня в кодирующем устройстве 220. Как показано на фиг.24, участок 2202 декодирования первого уровня образован участком 2230 основного декодирования, участком 2240 повышающей дискретизации и участком 2250 добавления составляющей диапазона высоких частот.
Участок 2230 основного декодирования выполняет обработку декодированием с использованием кодированных данных первого уровня, принятых от участка 2220 основного кодирования, чтобы сформировать декодированный сигнал, и выводит декодированный сигнал в участок 2240 повышающей дискретизации и выводит декодированные коэффициенты LPC, определенные при декодировании, в участок 2250 добавления составляющей диапазона высоких частот.
Участок 2240 повышающей дискретизации повышает качество декодированного сигнала, выведенного из участка 2230 основного декодирования, чтобы преобразовать частоту дискретизации декодированного сигнала в такую же частоту дискретизации, как у входного сигнала, и выводит сигнал с повышенной дискретизацией в участок 2250 добавления составляющей диапазона высоких частот.
Участок 2250 добавления составляющей диапазона высоких частот формирует приближенный сигнал для составляющих диапазона высоких частот в соответствии со способами, раскрытыми, например, в непатентном документе 3 и непатентном документе 4, по отношению к сигналу, у которого повышена дискретизация в участке 2240 повышающей дискретизации, и компенсирует отсутствующий диапазон высоких частот.
Фиг.25 - блок-схема, показывающая основную конфигурацию декодирующего устройства, которое поддерживает кодирующее устройство, в соответствии с данным вариантом осуществления. Декодирующее устройство 250 на фиг.25 имеет такую же основную конфигурацию, что и декодирующее устройство 600, показанное на фиг.8, и содержит участок 2501 декодирования первого уровня вместо участка 602 декодирования первого уровня. Аналогично участку 2202 декодирования первого уровня в кодирующем устройстве, участок 2501 декодирования первого уровня образован участком основного декодирования, участком повышающей дискретизации и участком добавления составляющей диапазона высоких частот (не показаны). Здесь подробное объяснение этих компонентов будет пропущено.
Сигнал, который может быть сформирован как шумовой сигнал в участке кодирования и участке декодирования без дополнительной информации, подается на синтезирующий фильтр, образованный с помощью декодированных коэффициентов LPC, указанных участком основного декодирования, так что выходной сигнал синтезирующего фильтра используется в качестве приближенного сигнала для составляющей диапазона высоких частот. В то же время составляющая диапазона высоких частот во входном сигнале и составляющая диапазона высоких частот в декодированном сигнале первого уровня показывают полностью разные формы сигнала, и поэтому энергия составляющей диапазона высоких частот в сигнале ошибки, вычисленном в участке вычитания, становится больше энергии составляющей диапазона высоких частот во входном сигнале. В результате этого возникает проблема в участке кодирования второго уровня, в котором, скорее всего, будет выбрана полоса, размещенная в диапазоне высоких частот с низкой важностью восприятия.
В соответствии с данным вариантом осуществления, кодирующее устройство 220, которое использует способ замены приближенного сигнала, например шума, для диапазона высоких частот, как описано выше в кодировании на участке 2201 кодирования первого уровня, выбирает полосу из диапазона низких частот с более низкой частотой, чем заранее установленная опорная частота, и, следовательно, может выбрать диапазон низких частот с высокой важностью восприятия в качестве объекта для кодирования участком кодирования второго уровня, даже когда увеличивается энергия диапазона высоких частот у сигнала ошибки (или ошибочных коэффициентов преобразования), так что возможно повысить качество звука.
Более того, хотя выше в качестве примера объяснена конфигурация, где информация, имеющая отношение к диапазону высоких частот, не передается на участок декодирования, настоящее изобретение этим не ограничивается, и, например, может быть возможна конфигурация, где, как раскрыто в непатентном документе 5, сигнал диапазона высоких частот кодируется с низкой скоростью передачи битов по сравнению с диапазоном низких частот и передается на участок декодирования.
Более того, хотя в кодирующем устройстве 220, показанном на фиг.22, участок 104 вычитания конфигурируется для нахождения разницы между сигналами временной области, участок вычитания может быть сконфигурирован для нахождения разницы между коэффициентам преобразования частотной области. В этом случае входные коэффициенты преобразования обнаруживаются путем размещения участка 101 преобразования в частотную область между участком 2203 задержки и участком 104 вычитания, и декодированные коэффициенты преобразования первого уровня обнаруживаются вновь путем добавления участка 101 преобразования в частотную область между участком 2202 декодирования первого уровня и участком 104 вычитания. Таким образом, участок 104 вычитания конфигурируется для нахождения разницы между входными коэффициентами преобразования и декодированными коэффициентами преобразования первого уровня и для передачи ошибочных коэффициентов преобразования непосредственно в участок кодирования второго уровня. Эта конфигурация обеспечивает вычитающую обработку, соответствующую каждой полосе, путем обнаружения разницы в указанной полосе и необнаружения разницы в других полосах, так что возможно дополнительно повысить качество звука.
(Вариант 7 осуществления)
С помощью Варианта 7 осуществления будет объясняться случай, где кодирующее устройство и декодирующее устройство другой конфигурации принимают способ кодирования в соответствии с настоящим изобретение. Фиг.26 - блок-схема, показывающая основную конфигурацию декодирующего устройства 260 в соответствии с данным вариантом осуществления.
Кодирующее устройство 260, показанное на фиг.26, применяет конфигурацию с добавлением участка 2601 взвешивающего фильтра по сравнению с кодирующим устройством 220, показанным на фиг.22. Более того, в кодирующем устройстве 260 на фиг.26 одинаковым компонентам с фиг.22 будут присвоены одинаковые номера ссылок, и их объяснение будет пропущено.
Участок 2601 взвешивающего фильтра выполняет фильтрацию из применения веса восприятия к сигналу ошибки, принятому от участка 104 вычитания, и выводит сигнал после фильтрации в участок 101 преобразования в частотную область. Участок 2601 взвешивающего фильтра обладает противоположными спектральными характеристиками к огибающей спектра у входного сигнала, и сглаживает (делает белым) спектр входного сигнала или заменяет его спектральными характеристиками, аналогичными сглаженному спектру входного сигнала. Например, взвешивающий фильтр W(z) конфигурируется как представленный следующим уравнением 9 с использованием декодированных коэффициентов LPC, полученных на участке 2202 декодирования первого уровня.
[9]
Здесь α(i) - декодированные коэффициенты LPC, NP - порядок коэффициентов LPC, и γ - параметр для управления степенью сглаживания спектра (то есть степенью приведения спектра в белый), и допускает значения в диапазоне 0≤γ≤1. Когда γ больше, степень сглаживания становится больше, и для γ используется значение 0,92, например.
Декодирующее устройство 270, показанное на фиг.27, применяет конфигурацию с добавлением участка 2701 синтезирующего фильтра по сравнению с декодирующим устройством 250, показанным на фиг.25. Более того, в декодирующем устройстве 270 на фиг.27 одинаковым компонентам с фиг.25 будут присвоены одинаковые номера ссылок, и их объяснение будет пропущено.
Участок 2701 синтезирующего фильтра выполняет фильтрацию из восстановления характеристик сглаженного спектра обратно в исходные характеристики по отношению к сигналу, принятому от участка 606 преобразования во временную область, и выводит сигнал после фильтрации в участок 604 сложения. Участок 2701 синтезирующего фильтра обладает противоположными спектральными характеристиками к взвешивающему фильтру, представленному в уравнении 9, то есть одинаковыми характеристиками с огибающей спектра входного сигнала. Синтезирующий фильтр B(z) представляется в следующем уравнении 10 с использованием уравнения 9.
[10]
Здесь α(i) - декодированные коэффициенты LPC, NP - порядок коэффициентов LPC, и γ - параметр для управления степенью спектрального сглаживания (то есть степенью приведения спектра в белый), и допускает значения в диапазоне 0≤γ≤1. Когда γ больше, степень сглаживания становится больше, и для γ используется значение 0,92, например. Как правило, в описанных выше кодирующем устройстве и декодирующем устройстве в диапазоне низких частот образуется большая энергия, чем в диапазоне высоких частот в огибающей спектра речевого сигнала, так что даже когда диапазон низких частот и диапазон высоких частот имеют равное искажение кодирования сигнала перед тем, как этот сигнал пройдет через синтезирующий фильтр, искажение кодирования становится больше в диапазоне низких частот после того, как этот сигнал пройдет через синтезирующий фильтр. В случае, где речевой сигнал сжимается до низкой скорости передачи битов и передается, искажение кодирования не может быть сильно уменьшено, и поэтому энергия диапазона низких частот, содержащего искажение кодирования, увеличивается из-за влияния синтезирующего фильтра в участке декодирования, как описано выше, и имеется проблема, что ухудшение качества, скорее всего, возникает в диапазоне низких частот.
В соответствии со способом кодирования из данного варианта осуществления целевая частота определяется из диапазона низких частот, помещенного в более низкой частоте, чем опорная частота, и следовательно, диапазон низких частот, скорее всего, будет выбран в качестве объекта для кодирования участком 105 кодирования второго уровня, так что возможно минимизировать искажение кодирования в диапазоне низких частот. То есть в соответствии с данным вариантом осуществления, хотя синтезирующий фильтр выделяет диапазон низких частот, искажение кодирования в диапазоне низких частот становится трудным для восприятия, так что возможно обеспечить преимущество повышения качества звука.
Более того, хотя участок 104 вычитания в кодирующем устройстве 260 конфигурируется с данным вариантом осуществления для нахождения ошибок между сигналами временной области, настоящее изобретение этим не ограничивается, и участок 104 вычитания может быть сконфигурирован для нахождения ошибок между коэффициентами преобразования частотной области. Если говорить точнее, то входные коэффициенты преобразования обнаруживаются путем размещения участка 2601 взвешивающего фильтра и участка 101 преобразования в частотную область между участком 2203 задержки и участком 104 вычитания, и декодированные коэффициенты преобразования первого уровня обнаруживаются вновь путем добавления участка 2601 взвешивающего фильтра и участка 101 преобразования в частотную область между участком 2202 декодирования первого уровня и участком 104 вычитания. Таким образом, участок 104 вычитания конфигурируется для нахождения ошибки между входными коэффициентами преобразования и декодированными коэффициентами преобразования первого уровня и для передачи этих ошибочных коэффициентов преобразования непосредственно в участок 105 кодирования второго уровня. Эта конфигурация обеспечивает вычитающую обработку, соответствующую каждой полосе, путем обнаружения ошибок в указанной полосе и необнаружения ошибок в других полосах, так что возможно дополнительно повысить качество звука.
Более того, хотя в качестве примера с помощью данного варианта осуществления объяснен случай, где количество уровней в кодирующем устройстве 220 равно двум, настоящее изобретение этим не ограничивается, и кодирующее устройство 220 может быть сконфигурировано для включения в себя двух или более уровней кодирования, как, например, в кодирующем устройстве 280, показанном на фиг.28.
Фиг.28 - блок-схема, показывающая основную конфигурацию кодирующего устройства 280. По сравнению с кодирующим устройством 100, показанным на фиг.2, кодирующее устройство 280 применяет конфигурацию, включающую три участка 104 вычитания с добавлениями участка 2801 декодирования второго уровня, участка 2802 кодирования третьего уровня, участка 2803 декодирования третьего уровня, участка 2804 кодирования четвертого уровня и двух сумматоров 2805.
Участок 2802 кодирования третьего уровня и участок 2804 кодирования четвертого уровня, показанные на фиг.28, имеют такую же конфигурацию и выполняют такую же работу, как участок 105 кодирования второго уровня, показанный на фиг.2, и участок 2801 декодирования второго уровня и участок 2803 декодирования третьего уровня имеют такую же конфигурацию и выполняют такую же работу, как участок 103 декодирования первого уровня, показанный на фиг.2. Здесь положения полос в участке кодирования каждого уровня будут объясняться с использованием фиг.29.
В качестве примера размещения полос в участке кодирования каждого уровня фиг.29А показывает положения полос в участке кодирования второго уровня, фиг.29В показывает положения полос в участке кодирования третьего уровня, и фиг.29С показывает положения полос в участке кодирования четвертого уровня, и количество полос равно четырем на каждой фигуре.
Если говорить точнее, четыре полосы размещаются в участке 105 кодирования второго уровня так, что четыре полосы не превышают опорную частоту Fx(L2) уровня 2, четыре полосы размещаются в участке 2802 кодирования третьего уровня так, что четыре полосы не превышают опорную частоту Fx(L3) уровня 3, и полосы размещаются в участке 2804 кодирования четвертого уровня так, что полосы не превышают опорную частоту Fx(L4) уровня 4. Кроме того, имеется соотношение Fx(L2)<Fx(L3)<Fx(L4) между опорными частотами уровней. То есть в уровне 2 с низкой скоростью передачи битов полоса, которая является объектом для кодирования, определяется из диапазона низких частот с высокой чувствительностью восприятия, а в более высоком уровне с большей скоростью передачи битов полоса, которая является объектом для кодирования, определяется из полосы, включающей диапазон вплоть до диапазона высоких частот.
С помощью применения такой конфигурации нижний уровень выделяет диапазон низких частот, а высокий уровень охватывает более широкую полосу, так что возможно создавать высококачественные речевые сигналы.
Фиг.30 - блок-схема, показывающая основную конфигурацию декодирующего устройства 300, поддерживающего кодирующее устройство 280, показанное на фиг.28. По сравнению с декодирующим устройством 600, показанным на фиг.8, декодирующее устройство 300 на фиг.30 применяет конфигурацию с добавлениями участка 3001 декодирования третьего уровня, участка 3002 декодирования четвертого уровня и двух сумматоров 604. Более того, участок 3001 декодирования третьего уровня и участок 3002 декодирования четвертого уровня применяют такую же конфигурацию и выполняют такую же работу, как участок 603 декодирования второго уровня в декодирующем устройстве 600, показанном на фиг.8, и поэтому их подробное объяснение будет пропущено.
В качестве другого пример размещения полос в участке кодирования каждого уровня, фиг.31А показывает положения четырех полос в участке 105 кодирования второго уровня, фиг.31В показывает положения шести полос в участке 2802 кодирования третьего уровня, и фиг.31С показывает восемь полос в участке 2804 кодирования четвертого уровня.
На фиг.31 полосы размещаются с равными интервалами в участке кодирования каждого уровня, и только полосы, размещенные в диапазон низких частот, являются объектами для кодирования нижним уровнем, показанным на фиг.31А, и количество полос, которые являются объектами для кодирования, увеличивается в верхнем уровне, показанном на фиг.31В или фиг.31С.
В соответствии с такой конфигурацией полосы размещаются с равными интервалами в каждом уровне, и когда на нижнем уровне выбираются полосы, которые являются объектами для кодирования, несколько полос размещаются в диапазоне низких частот в качестве кандидатов для выбора, так что возможно уменьшить вычислительную сложность и скорость передачи битов.
(Вариант 8 осуществления)
Вариант 8 осуществления настоящего изобретения отличается от Варианта 1 осуществления только в работе участка указания первого положения, и участку указания первого положения в соответствии с данным вариантом осуществления будет присвоен номер ссылки "801", чтобы показать это отличие. Чтобы указать полосу, которая может применяться целевой частотой в качестве объекта для кодирования, участок 801 указания первого положения заранее разделяет всю полосу на множество частичных полос и выполняет поиски в каждой частичной полосе на основе заранее установленных полос пропускания и заранее установленных размеров шага. Затем участок 801 указания первого положения объединяет полосы каждой частичной полосы, которую искали и которая обнаружена, для создания полосы, которая может применяться целевой частотой в качестве объекта для кодирования.
Работа участка 801 указания первого положения в соответствии с данным вариантом осуществления будет объясняться с использованием фиг.32. Фиг.32 иллюстрирует случай, где количество частичных полос равно N=2, и частичная полоса 1 конфигурируется для охвата диапазона низких частот, а частичная полоса 2 конфигурируется для охвата диапазона высоких частот. Одна полоса выбирается из множества полос, которые конфигурируются заранее, чтобы иметь заранее установленную полосу пропускания (информация о положении этой полосы называется "информацией о положении первой частичной полосы") в частичной полосе 1. Аналогичным образом одна полоса выбирается из множества полос, сконфигурированных заранее, чтобы иметь заранее установленную полосу пропускания (информация о положении этой полосы называется "информацией о положении второй частичной полосы") в частичной полосе 2.
Затем участок 801 указания первого положения объединяет полосу, выбранную в частичной полосе 1, и полосу, выбранную в частичной полосе 2, для образования объединенной полосы. Эта объединенная полоса является полосой для указания в участке 801 указания первого положения, а затем участок 202 указания второго положения указывает информацию о втором положении на основе объединенной полосы. Например в случае, где полоса, выбранная в частичной полосе 1, является полосой 2, и полоса, выбранная в частичной полосе 2, является полосой 4, участок 801 указания первого положения объединяет эти две полосы, как показано в нижней части на фиг.32, как полосу, которая может применяться полосой частот в качестве объекта для кодирования.
Фиг.33 - блок-схема, показывающая конфигурацию участка 801 указания первого положения, поддерживающую случай, где количество частичных полос равно N. На фиг.33 ошибочные коэффициенты преобразования первого уровня, принятые от участка 104 вычитания, передаются участку 811-1 указания частичной полосы 1 до участка 811-N указания частичной полосы N. Каждый участок 811-n указания частичной полосы n (где n=1 по N) выбирает одну полосу из заранее установленной частичной полосы n и выводит информацию, показывающую положение выбранной полосы (то есть информацию о положении n-й частичной полосы), в участок 812 формирования информации о первом положении.
Участок 812 формирования информации о первом положении образует информацию о первом положении, используя информацию о положении n-й частичной полосы (где n=1 по N), принятую от каждого участка 811-n указания частичной полосы n, и выводит эту информацию о первом положении в участок 202 указания второго положения, участок 203 кодирования и участок 204 мультиплексирования.
Фиг.34 иллюстрирует, как информация о первом положении формируется в участке 812 формирования информации о первом положении. На этой фиг. участок 812 формирования информации о первом положении образует информацию о первом положении с помощью расположения в порядке информации о положении первой частичной полосы (то есть разряда А1) до информации о положении n-й частичной полосы (то есть разряда AN). Здесь длина An в разрядах каждой информации о положении n-ой частичной полосы определяется на основе количества полос-кандидатов, включенных в каждую частичную полосу n, и может иметь разное значение.
Фиг.35 показывает, как обнаруживаются декодированные ошибочные коэффициенты преобразования первого уровня с использованием информации о первом положении и информации о втором положении в декодировании по данному варианту осуществления. Здесь в качестве примера будет объясняться случай, где количество частичных полос равно двум. Между тем в нижеследующем объяснении будут присвоены названия и номера каждого компонента, образующего участок 603 декодирования второго уровня в соответствии с Вариантом 1 осуществления.
Участок 704 размещения переставляет кандидаты по форме после умножения кандидатов по усилению, принятых от участка 703 умножения, используя информацию о втором положении. Затем участок 704 размещения переставляет кандидаты по форме после перестановки с использованием информации о втором положении в частичной полосе 1 и частичной полосе 2, используя информацию о первом положении. Участок 704 размещения выводит обнаруженный таким образом сигнал в качестве декодированных ошибочных коэффициентов преобразования первого уровня.
В соответствии с данным вариантом осуществления, участок указания первого положения выбирает одну полосу из каждой частичной полосы, и следовательно позволяет организовать по меньшей мере один декодированный спектр в каждой частичной полосе. Таким образом, по сравнению с вариантами осуществления, где из всей полосы определяется одна полоса, может быть заранее установлено множество полос, для которых нужно повысить качество звука. Данный вариант осуществления эффективен, например, когда нужно повысить одновременно качество диапазона низких частот и диапазона высоких частот.
Более того, в соответствии с данным вариантом осуществления, даже когда выполняется обработка кодированием с низкой скоростью передачи битов на нижнем уровне (то есть первом уровне с данным вариантом осуществления), возможно повысить субъективное качество декодированного сигнала. Конфигурация, применяющая схему CELP к нижнему уровню, является одним из тех примеров. Схема CELP является схемой кодирования на основе подбора формы волны, и поэтому выполняет обработку кодированием из условия, чтобы искажение квантования в диапазоне низких частот с большой энергией минимизировалось по сравнению с диапазоном высоких частот. В результате спектр диапазона высоких частот затухает и воспринимается как приглушенный (то есть отсутствие ощущения полосы). В отличие от этого кодирование на основе схемы CELP является схемой кодирования с низкой скоростью передачи битов, и поэтому искажение квантования в диапазоне низких частот нельзя сильно подавить, и это искажение квантования воспринимается как зашумленное. Данный вариант осуществления выбирает полосы в качестве объектов для кодирования из диапазона низких частот и диапазона высоких частот соответственно, так что возможно одновременно нейтрализовать два разных фактора ухудшения в виде шума в диапазоне низких частот и приглушенного звука в диапазоне высоких частот и повысить субъективное качество.
Дополнительно данный вариант осуществления образует объединенную полосу путем объединения полосы, выбранной из диапазона низких частот, и полосы, выбранной из диапазона высоких частот, и определяет спектральную форму в этой объединенной полосе, и следовательно, может выполнять адаптивную обработку, состоящую из выбора спектральной формы, выделяющей диапазон низких частот в кадре, для которого повышение качества нужнее в диапазоне низких частот, чем в диапазоне высоких частот, и выбора спектральной формы, выделяющей диапазон высоких частот в кадре, для которого повышение качества нужнее в диапазоне высоких частот, чем в диапазоне низких частот, так что возможно повысить субъективное качество. Например, для представления спектральной формы с помощью импульсов больше импульсов распределяются в диапазоне низких частот в кадре, для которого повышение качества нужнее в диапазоне низких частот, чем в диапазоне высоких частот, и больше импульсов распределяются в диапазоне высоких частот в кадре, для которого повышение качества нужнее в диапазоне высоких частот, чем в диапазоне низких частот, так что возможно повысить субъективное качество посредством такой адаптивной обработки.
Более того, в качестве разновидности данного варианта осуществления фиксированная полоса может выбираться всегда в конкретной частичной полосе, как показано на фиг.36. В примере, показанном на фиг.36, полоса 4 всегда выбирается в частичной полосе 2 и образует часть объединенной полосы. Таким образом, аналогично преимуществу данного варианта осуществления, полоса, для которой необходимо повысить качество звука, может быть установлена заранее, и не требуется, например, информация о положении частичной полосы по частичной полосе 2, так что возможно уменьшить количество разрядов для представления информации о первом положении, показанной на фиг.34.
Более того, хотя фиг.36 в качестве примера показывает случай, где фиксированная область всегда выбирается в диапазоне высоких частот (то есть частичной полосе 2), настоящее изобретение этим не ограничивается, и фиксированная область всегда может выбираться в диапазоне низких частот (то есть частичной полосе 1), либо фиксированная область всегда может выбираться в частичной полосе диапазона средних частот, который не показан на фиг.36.
Дополнительно, в качестве разновидности данного варианта осуществления, полоса пропускания у полос-кандидатов, расположенных в каждой частичной полосе, может меняться, как показано на фиг.37. Фиг.37 иллюстрирует случай, где полоса пропускания у частичной полосы, расположенной в частичной полосе 2, короче полос-кандидатов, расположенных в частичной полосе 1.
Объяснены варианты осуществления настоящего изобретения.
Более того, размещение полос в участке кодирования каждого уровня не ограничивается примерами, объясненными выше с помощью настоящего изобретения, и возможна, например, конфигурация, где полоса пропускания каждой полосы становится уже на нижнем уровне, и полоса пропускания каждой полосы становится шире на верхнем уровне.
Дополнительно с помощью вышеупомянутых вариантов осуществления полоса текущего кадра может выбираться совместно с полосами, выбранными в прошлых кадрах. Например, полоса текущего кадра может определяться из полос, расположенных в окрестностях полос, выбранных в предыдущих кадрах. Более того, путем перестановки полос-кандидатов для текущего кадра в окрестностях полос, выбранных в предыдущих кадрах, полоса текущего кадра может определяться из переставленных полос-кандидатов. Более того, путем передачи информации об области один раз в каждые несколько кадров область, показанная информацией об области, переданной в прошлом, может использоваться в кадре, в котором информация об области не передается (прерывистая передача информации о полосе).
Кроме того, с помощью вышеупомянутых вариантов осуществления полоса текущего уровня может выбираться совместно с полосой, выбранной на нижнем уровне. Например, полоса текущего уровня может выбираться из полос, размещенных в окрестностях полос, выбранных на нижнем уровне. Путем перестановки полос-кандидатов текущего уровня в окрестностях полос, выбранных на нижнем уровне, полоса текущий уровень может определяться от: полоса кандидаты. Более того, путем передачи информации об области один раз в каждые несколько кадров область, указанная информацией об области, переданной в прошлом, может использоваться в кадре, в котором информация об области не передается (прерывистая передача информации о полосе).
Кроме того, количество уровней в масштабируемом кодировании не ограничивается настоящим изобретением.
Более того, хотя вышеупомянутые варианты осуществления предполагают речевые сигналы в виде декодированных сигналов, настоящее изобретение этим не ограничивается, и декодированные сигналы могут быть, например, звуковыми сигналами.
Также, хотя с помощью вышеупомянутого варианта осуществления в качестве примеров описаны случаи, где настоящее изобретение конфигурируется посредством аппаратных средств, настоящее изобретение также может быть реализовано посредством программного обеспечения.
Каждый функциональный блок, примененный в описании каждого из вышеупомянутых вариантов осуществления, может быть реализован, как правило, в виде LSI, состоящей из интегральной схемы. Это могут быть отдельные микросхемы или частично либо полностью заключенные в одну микросхему. Здесь принята "LSI", но это также может называться "IC", "системной LSI", "супер-LSI" или "ультра-LSI" в зависимости от отличающихся степеней интеграции.
Более того, способ схемной интеграции не ограничен LSI, и также возможна реализация, использующая специализированные схемы или универсальные процессоры. После изготовления LSI также возможно использование программируемых FPGA (программируемых пользователем вентильных матриц) или процессора с перестраиваемой конфигурацией, где могут быть переконфигурированы соединения и настройки ячеек схемы в LSI.
Более того, если появляется технология интегральной схемы для замены LSI в результате прогресса полупроводниковой технологии или другой производной технологии, то конечно можно выполнять интеграцию функциональных блоков с использованием этой технологии. Также возможно применение биотехнологии.
Раскрытия заявки на патент Японии №2007-053498, зарегистрированной 2 марта 2007 г., заявки на патент Японии №2007-133525, зарегистрированной 18 мая 2007 г., заявки на патент Японии №2007-184546, зарегистрированной 13 июля 2007 г., и заявки на патент Японии №2008-044774, зарегистрированной 26 февраля 2008 г., включая описания, чертежи и рефераты, полностью включаются в этот документ путем отсылки.
Промышленная применимость
Настоящее изобретение подходит для использования в кодирующем устройстве, декодирующем устройстве и так далее, используемом в системе связи со схемой масштабируемого кодирования.
Изобретение относится к вычислительной технике. Технический результат заключается в повышении качества звука. Устройство кодирования речи содержит участок кодирования первого уровня, который выполняет обработку кодированием по отношению к входному речевому сигналу; участок декодирования первого уровня, который выполняет обработку декодированием с использованием кодированных данных первого уровня; участок вычисления ошибочных коэффициентов преобразования первого уровня, который преобразует ошибочный сигнал первого уровня в частотную область для вычисления ошибочных коэффициентов преобразования первого уровня; и участок кодирования второго уровня, который выполняет обработку кодированием по отношению к ошибочным коэффициентам преобразования первого уровня, причем участок кодирования второго уровня содержит: участок установки; участок выбора; участок конфигурирования соединенной полосы, который соединяет полосу, выбранную из низкочастотной полосы, и фиксированную полосу из высокочастотной полосы, чтобы конфигурировать соединенную полосу; и участок формирования кодированных данных, который кодирует ошибочные коэффициенты преобразования первого уровня, включенные в соединенную полосу, чтобы сформировать кодированные данные второго уровня. 4 н. и 4 з.п. ф-лы, 45 ил.
1. Устройство кодирования речи, содержащее:
участок кодирования первого уровня, который выполняет обработку кодированием по отношению к входному речевому сигналу, чтобы сформировать кодированные данные первого уровня;
участок декодирования первого уровня, который выполняет обработку декодированием с использованием кодированных данных первого уровня, чтобы сформировать декодированный сигнал первого уровня;
участок вычисления ошибочных коэффициентов преобразования первого уровня, который преобразует ошибочный сигнал первого уровня, представляющий собой ошибку между входным речевым сигналом и декодированным сигналом первого уровня, в частотную область для вычисления ошибочных коэффициентов преобразования первого уровня; и участок кодирования второго уровня, который выполняет обработку кодированием по отношению к ошибочным коэффициентам преобразования первого уровня, чтобы сформировать кодированные данные второго уровня,
причем участок кодирования второго уровня содержит:
участок установки, который устанавливает низкочастотную полосу и высокочастотную полосу для ошибочных коэффициентов преобразования первого уровня, устанавливает фиксированную полосу в высокочастотной полосе и устанавливает множество полос-кандидатов для низкочастотной полосы;
участок выбора, который вычисляет взвешенную по восприятию энергию для ошибочных коэффициентов преобразования первого уровня в каждой из множества полос-кандидатов и выбирает одну полосу из множества полос-кандидатов для низкочастотной полосы на основании упомянутой взвешенной по восприятию энергии;
участок конфигурирования соединенной полосы, который соединяет полосу, выбранную из низкочастотной полосы, и фиксированную полосу из высокочастотной полосы, чтобы конфигурировать соединенную полосу; и
участок формирования кодированных данных, который кодирует ошибочные коэффициенты преобразования первого уровня, включенные в соединенную полосу, чтобы сформировать кодированные данные второго уровня.
2. Устройство кодирования речи по п.1,
в котором участок формирования кодированных данных содержит участок указания положения импульсов, который указывает положения множества импульсов из набора кандидатов положений импульсов в соединенной полосе на основании ошибочных коэффициентов преобразования первого уровня, и формирует информацию о положении импульсов, показывающую указанные положения множества импульсов, и
формирует кодированные данные второго уровня с использованием информации о выборе, показывающей полосу, выбранную в низкочастотном диапазоне, и информации о положении импульсов.
3. Устройство кодирования речи по п.1, в котором полоса пропускания полосы-кандидата отлична от полосы пропускания фиксированной полосы.
4. Устройство декодирования речи, содержащее:
участок приема, который принимает:
кодированные данные первого уровня, полученные в устройстве кодирования речи путем выполнения обработки кодированием по отношению к входному речевому сигналу; и
кодированные данные второго уровня, полученные в устройстве кодирования речи путем преобразования ошибочного сигнала первого уровня, представляющего собой ошибку между декодированным сигналом первого уровня, полученным декодированием кодированных данных первого уровня, и входным речевым сигналом, в сигнал частотной области для вычисления ошибочных коэффициентов преобразования первого уровня, и путем выполнения обработки кодированием по отношению к ошибочным коэффициентам преобразования первого уровня;
участок декодирования первого уровня, который декодирует кодированные данные первого уровня, чтобы сформировать декодированный сигнал первого уровня;
участок декодирования второго уровня, который декодирует кодированные данные второго уровня, чтобы сформировать декодированные ошибочные коэффициенты преобразования первого уровня;
участок преобразования во временную область, который преобразует декодированные ошибочные коэффициенты преобразования первого уровня во временную область, чтобы сформировать декодированный ошибочный сигнал первого уровня; и
участок сложения, который складывает декодированный сигнал первого уровня и декодированный ошибочный сигнал первого уровня, чтобы сформировать декодированный сигнал,
причем участок декодирования второго уровня содержит:
участок установки, который устанавливает низкочастотную полосу и высокочастотную полосу для ошибочных коэффициентов преобразования первого уровня, устанавливает фиксированную полосу в высокочастотной полосе и устанавливает множество полос-кандидатов для низкочастотной полосы; и
участок формирования декодированных ошибочных коэффициентов преобразования, который декодирует кодированные данные второго уровня, чтобы сформировать информацию о выборе, показывающую положение конкретной полосы из множества полос-кандидатов, и информацию о положении импульсов, показывающую положения импульсов в соединенной полосе из упомянутой конкретной полосы и фиксированной полосы, указывает положения множества импульсов в низкочастотной полосе с использованием информации о положении импульсов, соответствующей упомянутой конкретной полосе, и информации о выборе, и указывает положения импульсов в высокочастотной полосе с использованием информации о положении импульсов, соответствующей упомянутой фиксированной полосе, чтобы сформировать декодированные ошибочные коэффициенты преобразования первого уровня.
5. Устройство декодирования речи по п.4, в котором кодированные данные второго уровня содержат упомянутую информацию о выборе и кодированную информацию, и
кодированная информация содержит информацию о положении для множества импульсов и информацию об усилении для множества импульсов.
6. Устройство декодирования речи по п.4, в котором полоса пропускания полосы-кандидата отлична от полосы пропускания фиксированной полосы.
7. Способ кодирования речи, содержащий:
этап кодирования первого уровня, на котором выполняют обработку кодированием по отношению к входному речевому сигналу, чтобы сформировать кодированные данные первого уровня;
этап декодирования первого уровня, на котором выполняют обработку декодированием с использованием кодированных данных первого уровня, чтобы сформировать декодированный сигнал первого уровня;
этап вычисления ошибочных коэффициентов преобразования первого уровня, на котором преобразуют ошибочный сигнал первого уровня, представляющий собой ошибку между входным речевым сигналом и декодированным сигналом первого уровня, в частотную область для вычисления ошибочных коэффициентов преобразования первого уровня; и этап кодирования второго уровня, на котором выполняют обработку кодированием по отношению к ошибочным коэффициентам преобразования первого уровня, чтобы сформировать кодированные данные второго уровня,
причем этап кодирования второго уровня содержит:
этап установки, на котором устанавливают низкочастотную полосу и высокочастотную полосу для ошибочных коэффициентов преобразования первого уровня, устанавливают фиксированную полосу в высокочастотной полосе и устанавливают множество полос-кандидатов для низкочастотной полосы;
этап выбора, на котором вычисляют взвешенную по восприятию энергию для ошибочных коэффициентов преобразования первого уровня в каждой из множества полос-кандидатов и выбирают одну полосу из множества полос-кандидатов для низкочастотной полосы на основании упомянутой взвешенной по восприятию энергии;
этап конфигурирования соединенной полосы, на котором соединяют полосу, выбранную из низкочастотной полосы, и фиксированную полосу из высокочастотной полосы, чтобы конфигурировать соединенную полосу; и
этап формирования кодированных данных, на котором кодируют ошибочные коэффициенты преобразования первого уровня, включенные в соединенную полосу, чтобы сформировать кодированные данные второго уровня.
8. Способ декодирования речи, содержащий:
этап приема, на котором принимают:
кодированные данные первого уровня, полученные с использованием способа кодирования речи путем выполнения обработки кодированием по отношению к входному речевому сигналу; и
кодированные данные второго уровня, полученные с использованием способа кодирования речи путем преобразования ошибочного сигнала первого уровня, представляющего собой ошибку между декодированным сигналом первого уровня, полученным декодированием кодированных данных первого уровня, и входным речевым сигналом, в сигнал частотной области для вычисления ошибочных коэффициентов преобразования первого уровня, и путем выполнения обработки кодированием по отношению к ошибочным коэффициентам преобразования первого уровня;
этап декодирования первого уровня, на котором декодируют кодированные данные первого уровня, чтобы сформировать декодированный сигнал первого уровня;
этап декодирования второго уровня, на котором декодируют кодированные данные второго уровня, чтобы сформировать декодированные ошибочные коэффициенты преобразования первого уровня;
этап преобразования во временную область, на котором преобразуют декодированные ошибочные коэффициенты преобразования первого уровня во временную область, чтобы сформировать декодированный ошибочный сигнал первого уровня; и
этап сложения, на котором складывают декодированный сигнал первого уровня и декодированный ошибочный сигнал первого уровня, чтобы сформировать декодированный сигнал,
причем этап декодирования второго уровня содержит:
этап установки, на котором устанавливают низкочастотную полосу и высокочастотную полосу для ошибочных коэффициентов преобразования первого уровня, устанавливают фиксированную полосу в высокочастотной полосе и устанавливают множество полос-кандидатов для низкочастотной полосы; и
этап формирования декодированных ошибочных коэффициентов преобразования, на котором декодируют кодированные данные второго уровня, чтобы сформировать информацию о выборе, показывающую положение конкретной полосы из множества полос-кандидатов, и информацию о положении импульсов, показывающую положения импульсов в соединенной полосе из упомянутой конкретной полосы и фиксированной полосы, указывают положения множества импульсов в низкочастотной полосе с использованием информации о положении импульсов, соответствующей упомянутой конкретной полосе, и информации о выборе, и указывают положения импульсов в высокочастотной полосе с использованием информации о положении импульсов, соответствующей упомянутой фиксированной полосе, чтобы сформировать декодированные ошибочные коэффициенты преобразования первого уровня.
Пресс для выдавливания из деревянных дисков заготовок для ниточных катушек | 1923 |
|
SU2007A1 |
Привод стана холодной прокатки труб | 1987 |
|
SU1533789A1 |
US 6377916 B1, 23.04.2002 | |||
US 7072366 B2, 04.07.2006 | |||
СПОСОБ КОДИРОВАНИЯ РЕЧИ (ВАРИАНТЫ), КОДИРУЮЩЕЕ И ДЕКОДИРУЮЩЕЕ УСТРОЙСТВО | 1998 |
|
RU2214048C2 |
RU 2000104010 A, 20.12.2001. |
Авторы
Даты
2013-07-27—Публикация
2012-04-18—Подача