Показать метаданные Скрыть метаданные

(19)

(11)

2 538 334

(13)

(51)

МПК

G10L19/02(2013-01-01)

(21) (22)

Заявка

2011135533/08, 2010-02-25

(24)

Дата начала отсчета патента

2010-02-25

(22)

дата подачи заявки

2010-02-25

(45)

опубликовано

2015-01-10

(72)

авторы

Яманаси ТомофумиОсикири МасахироЕхара Хироюки

(73)

патентообладатели

Панасоник Интеллекчуал Проперти Корпорэйшн Оф Америка

(56)

Документы, цитированные в отчете о поиске

КОДЕР, ДЕКОДЕР И СПОСОБ ДЛЯ НИХ Российский патент 2015 года по МПК G10L19/02

Описание патента на изобретение RU2538334C2

Область техники, к которой относится изобретение

Настоящая группа изобретений относится к устройству кодирования, устройству декодирования и способу для них, которые используются для системы связи, которая передает сигнал посредством кодирования сигнала.

Уровень техники

Когда речевые или звуковые сигналы передаются посредством системы связи с коммутацией пакетов, системы мобильной связи и т.п., как представлено посредством Интернет-связи, технологии сжатия и кодирования зачастую используются для того, чтобы повышать эффективность передачи речевых или звуковых сигналов. Дополнительно, в последние годы, при кодировании речевых или звуковых сигналов просто на низкой скорости передачи в битах, существует возрастающая потребность в технологии кодирования речевых или звуковых сигналов более широкой полосы частот.

Чтобы удовлетворять эти потребности, разработаны различные технологии для того, чтобы кодировать широкополосные речевые или звуковые сигналы без существенного увеличения объема информации после кодирования. Например, согласно технологии, раскрытой в патентном документе 1, устройство кодирования вычисляет параметр, чтобы формировать спектр высокочастотной части из спектральных данных, полученных посредством преобразования входного акустического сигнала в течение постоянного периода времени, и выводит этот параметр посредством его согласования с кодированной информацией низкочастотной части. В частности, устройство кодирования разделяет спектральные данные высокочастотной части частоты на множество подполос частот и вычисляет параметр, который указывает спектр низкочастотной части, которая является наиболее подобной спектру каждой подполосы частот. Затем, устройство кодирования регулирует наиболее подобный спектр низкочастотной части при помощи двух видов коэффициентов масштабирования так, что пиковая амплитуда или энергия подполосы частот (в дальнейшем в этом документе, "подполосная энергия") и форма в высокочастотном спектре, который должен быть сформирован, становится подобной пиковой амплитуде, подполосной энергии и форме спектра высокочастотной части входного сигнала в качестве цели.

Список библиографических ссылок

Патентные документы

PTL 1. Публикация WO № 2007/052088

Сущность изобретения

Техническая задача

Тем не менее, согласно вышеописанному патентному документу 1, при комбинировании высокочастотного спектра, устройство кодирования выполняет логарифмическое преобразование для всех выборок (MDCT-коэффициентов) спектральных данных входного сигнала и комбинированных данных высокочастотного спектра. Затем, устройство кодирования вычисляет параметр так, что соответствующая подполосная энергия и формы становятся подобными пиковой амплитуде, подполосной энергии и форме высокочастотного спектра входного сигнала в качестве цели. Следовательно, имеется проблема в том, что объем арифметических операций в устройстве кодирования является очень большим. Дополнительно, устройство кодирования применяет вычисленный параметр ко всем выборкам в подполосах частот и не учитывает размеры амплитуд отдельных выборок. Следовательно, объем арифметических операций в устройстве кодирования при формировании высокочастотного спектра при помощи вычисленного параметра также становится очень большим. Дополнительно, качество декодированной речи, которая должна быть сформирована, является недостаточным, и существует возможность того, что анормальный звук формируется, в зависимости от ситуации.

Следовательно, цель настоящего изобретения заключается в том, чтобы предоставлять устройство кодирования, устройство декодирования и способ для них, допускающие эффективное кодирование спектральных данных высокочастотной части и повышение качества декодированного сигнала на основе спектральных данных низкочастотной части широкополосного сигнала.

Решение задачи

Устройство кодирования настоящего изобретения выполнено с возможностью включать в себя: первое средство кодирования для формирования первой кодированной информации посредством кодирования более низкочастотной части, равной или меньшей предварительно определенной частоты входного сигнала; средство декодирования для формирования декодированного сигнала посредством декодирования первой кодированной информации; и второе средство кодирования для формирования второй кодированной информации посредством разделения высокочастотной части входного сигнала, превышающей предварительно определенную частоту, на множество подполос частот, оценки множества подполос частот, соответственно, из входного сигнала или декодированного сигнала, частичного выбора компонента спектра в каждой из подполос частот и вычисления параметра регулирования амплитуды для регулирования амплитуды для выбранного компонента спектра.

Устройство декодирования настоящего изобретения выполнено с возможностью включать в себя: средство приема для приема первой кодированной информации, полученной посредством кодирования более низкочастотной части входного сигнала, равной или меньшей предварительно определенной частоты, сформированной посредством устройства кодирования, и второй кодированной информации, сформированной посредством разделения высокочастотной части входного сигнала, превышающей предварительно определенную частоту, на множество подполос частот, оценки множества подполос частот, соответственно, из входного сигнала или из первого декодированного сигнала, полученного посредством декодирования первой кодированной информации, частичного выбора компонента спектра в каждой из подполос частот и вычисления параметра регулирования амплитуды для регулирования амплитуды для выбранного компонента спектра; первое средство декодирования для формирования второго декодированного сигнала посредством декодирования первой кодированной информации; и второе средство декодирования для формирования третьего декодированного сигнала посредством оценки высокочастотной части входного сигнала из второго декодированного сигнала.

Способ кодирования настоящего изобретения включает в себя: этап формирования первой кодированной информации посредством кодирования более низкочастотной части входного сигнала, равной или меньшей предварительно определенной частоты; этап формирования декодированного сигнала посредством декодирования первой кодированной информации; и этап формирования второй кодированной информации посредством разделения высокочастотной части входного сигнала, превышающей предварительно определенную частоту, на множество подполос частот, оценки множества подполос частот, соответственно, из входного сигнала или декодированного сигнала, частичного выбора компонента спектра в каждой из подполос частот и вычисления параметра регулирования амплитуды для регулирования амплитуды для выбранного компонента спектра.

Способ кодирования настоящего изобретения включает в себя: этап приема первой кодированной информации, полученной посредством кодирования более низкочастотной части входного сигнала, меньшей предварительно определенной частоты, сформированной посредством устройства кодирования, и второй кодированной информации, сформированной посредством разделения высокочастотной части входного сигнала, превышающей предварительно определенную частоту, на множество подполос частот, оценки множества подполос частот, соответственно, из входного сигнала или из первого декодированного сигнала, полученного посредством декодирования первой кодированной информации, частичного выбора компонента спектра в каждой из подполос частот и вычисления параметра регулирования амплитуды для регулирования амплитуды для выбранного компонента спектра; этап формирования второго декодированного сигнала посредством декодирования первой кодированной информации; и этап формирования третьего декодированного сигнала посредством оценки высокочастотной части входного сигнала из второго декодированного сигнала.

Положительный эффект изобретения

Согласно настоящему изобретению, спектральные данные высокочастотной части широкополосного сигнала могут быть эффективно кодированы/декодированы, объем арифметических операций может существенно уменьшаться, и качество декодированного сигнала также может быть повышено.

Краткое описание чертежей

Фиг. 2 является блок-схемой, показывающей релевантную конфигурацию внутренней части устройства кодирования, показанного на фиг. 1 согласно варианту 1 осуществления настоящего изобретения;

Фиг. 3 является блок-схемой, показывающей релевантную конфигурацию внутренней части секции кодирования второго слоя, показанной на фиг. 2 согласно варианту 1 осуществления настоящего изобретения;

Фиг. 4 является блок-схемой, показывающей релевантную конфигурацию секции кодирования усиления, показанной на фиг. 3 согласно варианту 1 осуществления настоящего изобретения;

Фиг. 5 является блок-схемой, показывающей релевантную конфигурацию секции кодирования логарифмического усиления, показанной на фиг. 4 согласно варианту 1 осуществления настоящего изобретения;

Фиг. 6 является схемой для пояснения подробностей процесса фильтрации в секции фильтрации согласно варианту 1 осуществления настоящего изобретения;

Фиг. 8 является блок-схемой, показывающей релевантную конфигурацию внутренней части устройства декодирования, показанного на фиг. 1 согласно варианту 1 осуществления настоящего изобретения;

Фиг. 9 является блок-схемой, показывающей релевантную конфигурацию внутренней части секции декодирования второго слоя, показанной на фиг. 8 согласно варианту 1 осуществления настоящего изобретения;

Фиг. 10 является блок-схемой, показывающей релевантную конфигурацию внутренней части секции регулирования спектра, показанной на фиг. 9 согласно варианту 1 осуществления настоящего изобретения;

Фиг. 11 является блок-схемой, показывающей релевантную конфигурацию внутренней части секции декодирования логарифмического усиления, показанной на фиг. 10 согласно варианту 1 осуществления настоящего изобретения;

Фиг. 12 является блок-схемой, показывающей релевантную конфигурацию внутренней части секции кодирования второго слоя согласно варианту 2 осуществления настоящего изобретения;

Фиг. 13 является блок-схемой, показывающей релевантную конфигурацию внутренней части секции кодирования усиления, показанной на фиг. 12 согласно варианту 2 осуществления настоящего изобретения;

Фиг. 14 является блок-схемой, показывающей релевантную конфигурацию внутренней части секции кодирования логарифмического усиления, показанной на фиг. 13 согласно варианту 2 осуществления настоящего изобретения; и

Фиг. 15 является блок-схемой, показывающей релевантную конфигурацию внутренней части секции декодирования логарифмического усиления согласно варианту 2 осуществления настоящего изобретения.

Подробное описание вариантов осуществления

Основная характеристика настоящего изобретения заключается в том, что устройство кодирования вычисляет параметр регулирования подполосной энергии и форму группы выборок, которая извлекается на основе положения выборки с максимальной амплитудой в подполосе частот, когда устройство кодирования формирует спектральные данные высокочастотной части сигнала, который должен быть кодирован, на основе спектральных данных низкочастотной части. Другая основная характеристика заключается в том, что устройство декодирования применяет вычисленный параметр к группе выборок, которая извлекается на основе положения выборки с максимальной амплитудой в подполосе частот. На основе этих характеристик настоящего изобретения, спектральные данные высокочастотной части широкополосного сигнала могут быть эффективно кодированы/декодированы, объем арифметических операций может существенно уменьшаться, и качество декодированного сигнала также может быть повышено.

Варианты осуществления настоящего изобретения подробнее поясняются ниже со ссылкой на чертежи. Устройство кодирования речи и устройство декодирования речи поясняются в качестве примера устройства кодирования и устройства декодирования согласно настоящему изобретению.

Вариант 1 осуществления

Фиг. 1 является блок-схемой, показывающей конфигурацию системы связи, которая имеет устройство кодирования и устройство декодирования согласно варианту 1 осуществления настоящего изобретения. На фиг. 1, система связи включает в себя устройство 101 кодирования и устройство 103 декодирования, и они могут обмениваться данными друг с другом через канал 102 передачи. Как устройство 101 кодирования, так и устройство 103 декодирования обычно используются посредством установки на устройстве базовой станции, устройстве терминала связи и т.п.

Устройство 101 кодирования разделяет входной сигнал на каждые N выборок (N является натуральным числом) и кодирует каждый кадр посредством задания N выборок в качестве одного кадра. Входной сигнал, который должен кодироваться, выражается как x_n (n=0,..., N-1). Это n обозначает (n+1)-вый порядок элемента сигнала для входного сигнала, который разделяется на каждые N выборок. Устройство 101 кодирования передает кодированную входную информацию (кодированную информацию) в устройство 103 декодирования через канал 102 передачи.

Устройство 103 декодирования принимает кодированную информацию, передаваемую из устройства 101 кодирования, через канал 102 передачи.

Фиг. 2 является блок-схемой, показывающей релевантную конфигурацию внутренней части устройства 101 кодирования, показанного на фиг. 1. Когда частотой дискретизации входного сигнала является SR₁, секция 201 обработки понижающей дискретизации понижающе дискретизирует частоту дискретизации входного сигнала от SR₁ до SR₂ (SR₂<SR₁) и выводит входной сигнал, который понижающе дискретизируется, в секцию 202 кодирования первого слоя в качестве входного сигнала после понижающей дискретизации. Операция поясняется ниже посредством рассмотрения примера, когда SR₂ является 1/2 частотой дискретизации SR₁.

Секция 202 кодирования первого слоя формирует кодированную информацию первого слоя посредством кодирования входного сигнала после понижающей дискретизации, который вводится из секции 201 обработки понижающей дискретизации, например, при помощи способа кодирования речи системы CELP (линейного прогнозирования с возбуждением по коду). В частности, секция 202 кодирования первого слоя формирует кодированную информацию первого слоя посредством кодирования более низкочастотной части входного сигнала, равной или меньшей предварительно определенной частоты. Секция 202 кодирования первого слоя выводит сформированную кодированную информацию первого слоя в секцию 203 декодирования первого слоя и секцию 207 мультиплексирования кодированной информации.

Секция 203 декодирования первого слоя формирует декодированный сигнал первого слоя посредством декодирования кодированной информации первого слоя, которая вводится из секции 202 кодирования первого слоя, например, при помощи способа декодирования речи CELP-системы. Секция 203 декодирования первого слоя выводит сформированный декодированный сигнал первого слоя в секцию 204 обработки повышающей дискретизации.

Секция 204 обработки повышающей дискретизации повышающе дискретизирует от SR₂ до SR₁ частоту дискретизации декодированного сигнала первого слоя, который вводится из секции 203 декодирования первого слоя, и выводит декодированный сигнал первого слоя, которая повышающе дискретизируется, в секцию 205 обработки ортогонального преобразования в качестве декодированного сигнала первого слоя после повышающей дискретизации.

Секция 205 обработки ортогонального преобразования имеет буферы buf₁n и buf₂n (n=0,..., N-1) во внутренней части и выполняет модифицированное дискретное косинусное преобразование (MDCT) для входного сигнала x_n и декодированного сигнала y_n первого слоя после повышающей дискретизации, который вводится из секции 204 обработки повышающей дискретизации.

Касаясь процесса ортогонального преобразования посредством секции 205 обработки ортогонального преобразования, этап вычисления и вывод данных во внутренний буфер поясняются ниже.

Во-первых, секция 205 обработки ортогонального преобразования инициализирует буферы buf₁n и buf₂n посредством задания "0" в качестве начального значения, соответственно, посредством следующих уравнений 1 и 2.

1 2

Затем, секция 205 обработки ортогонального преобразования выполняет MDCT для входного сигнала x_n и декодированного сигнала y_n первого слоя после повышающей дискретизации посредством следующих уравнений 3 и 4 и получает MDCT-коэффициент входного сигнала (в дальнейшем в этом документе, "входной спектр") S2(k) и MDCT-коэффициент декодированного сигнала y_n первого слоя после повышающей дискретизации (в дальнейшем в этом документе, "декодированный спектр первого слоя") S1(k).

3 4

В вышеприведенных уравнениях k обозначает индекс каждой выборки в одном кадре. Секция 205 обработки ортогонального преобразования получает x_n' в качестве вектора комбинирования входного сигнала x_n и буфера buf₁n посредством следующего уравнения 5. Секция 205 обработки ортогонального преобразования также получает y_n' в качестве вектора комбинирования декодированного сигнала y_n первого слоя после повышающей дискретизации и буфера buf₂n посредством следующего уравнения 6.

5 6

Затем, секция 205 обработки ортогонального преобразования обновляет буферы buf₁n и buf₂n посредством уравнений 7 и 8.

7 8

Секция 205 обработки ортогонального преобразования выводит входной спектр S2(k) и декодированный спектр S1(k) первого слоя в секцию 206 кодирования второго слоя.

Процесс ортогонального преобразования посредством секции 205 обработки ортогонального преобразования поясняется выше.

Секция 206 кодирования второго слоя формирует кодированную информацию второго слоя при помощи входного спектра S2(k) и декодированного спектра S1(k) первого слоя, которые вводятся из секции 205 обработки ортогонального преобразования, и выводит сформированную кодированную информацию второго слоя в секцию 207 мультиплексирования кодированной информации. Подробности секции 206 кодирования второго слоя описываются ниже.

Секция 207 мультиплексирования кодированной информации мультиплексирует кодированную информацию первого слоя, которая вводится из секции 202 кодирования первого слоя, и кодированную информацию второго слоя, которая вводится из секции 206 кодирования второго слоя, и выводит исходный код мультиплексированной информации в канал 102 передачи в качестве кодированной информации посредством добавления кода ошибки при передаче и т.п. к этому исходному коду информации при необходимости.

Релевантная конфигурация внутренней части секции 206 кодирования второго слоя, показанной на фиг. 2, поясняется далее со ссылкой на фиг. 3.

Секция 260 разделения полосы частот разделяет высокочастотную часть (FL≤k<FH) входного спектра S2(k), который вводится из секции 205 обработки ортогонального преобразования, превышающую предварительно определенную частоту, на P (где P является целым числом, превышающим 1) подполос SB_p частот (p=0, 1,..., P-1). Секция 260 разделения полосы частот выводит полосу BW_p пропускания (p=0, 1,..., P-1) и индекс BS_p заголовка (т.е. начальную позицию подполосы частот) (p=0, 1,..., P-1) (FL≤BS_p<FH) каждой разделенной подполосы частот, в качестве информации разделения полосы частот, в секцию 262 фильтрации, секция 263 поиска и секция 266 мультиплексирования. В дальнейшем в этом документе, из входного спектра S2(k), часть, соответствующая подполосе SB_p частот, описывается как спектр S2_p(k) подполосы частот (BS_p≤k<BS_p+BW_p).

Секция 261 задания состояний фильтра задает декодированный спектр S1(k) первого слоя (0≤k<FL), который вводится из секции 205 обработки ортогонального преобразования, в качестве состояния фильтра, которое должно использоваться посредством секции 262 фильтрации. Т.е. декодированный спектр S1(k) первого слоя сохраняется в качестве внутреннего состояния (состояния фильтра) в полосе частот 0≤k<FL спектра S(k) всей полосы частот 0≤k<FH в секции 262 фильтрации.

Секция 262 фильтрации включает в себя фильтр основного тона из нескольких отводов, фильтрует спектр декодирования первого слоя на основе состояния фильтра, которое задается посредством секции 261 задания состояний фильтра, коэффициента основного тона, который вводится из секции 264 задания коэффициентов основного тона, и информации разделения полосы частот, которая вводится из секции 260 разделения полосы частот, и вычисляет оцененное значение S2_p'(k) (BS_p≤k<BS_p+BW_p) (p=0, 1,..., P-1) (в дальнейшем в этом документе, "оцененный спектр S2_p' подполосы SB_p частот") каждой подполосы SB_p частот (p=0, 1,..., P-1). Секция 262 фильтрации выводит оцененный спектр S2_p'(k) подполосы SB_p частот в секцию 263 поиска. Подробности процесса фильтрации секции 262 фильтрации описываются ниже. Предполагается, что число отводов из нескольких отводов может быть произвольным значением (целым числом), равным или превышающим 1.

Секция 263 поиска вычисляет степень подобия между оцененным спектром S2_p'(k) подполосы SB_p частот, который вводится из секции 262 фильтрации, и спектром S2_p(k) каждой подполосы частот в высокочастотной части (FL≤k<FH) входного спектра S2(k), который вводится из секции 205 обработки ортогонального преобразования, на основе информации разделения полосы частот, которая вводится из секции 260 разделения полосы частот. Эта степень подобия вычисляется, например, посредством вычисления корреляции. Процессы секции 262 фильтрации, секция 263 поиска и секция 264 задания коэффициентов основного тона составляют процесс поиска замкнутого контура для каждой подполосы частот. В каждом замкнутом контуре секция 263 поиска вычисляет степень подобия, соответствующую каждому коэффициенту основного тона, посредством различного изменения коэффициента T основного тона, который вводится из секции 264 задания коэффициентов основного тона в секцию 262 фильтрации. В замкнутом контуре для каждой подполосы частот секция 263 поиска получает оптимальный коэффициент T_p' основного тона (в диапазоне Tmin-Tmax), в котором степень подобия становится максимальной в замкнутом контуре, соответствующем подполосе SB_p частот, и выводит P оптимальных коэффициентов основного тона в секцию 266 мультиплексирования. Подробности способа вычисления степени подобия посредством секции 263 поиска описываются ниже.

Секция 263 поиска вычисляет часть полосы частот (полосы частот, которая является наиболее подобной каждому спектру каждой подполосы частот) декодированного спектра первого слоя, подобного каждой подполосе SB_p частот при помощи каждого оптимального коэффициента T_p' основного тона. Дополнительно, секция 263 поиска выводит в секцию 265 кодирования усиления оцененный спектр S2_p'(k), соответствующий каждому оптимальному коэффициенту T_p' основного тона (p=0, 1,..., P-1) и идеальному усилению α1_p, в качестве параметра регулирования амплитуды, который используется для того, чтобы вычислять оптимальный коэффициент T_p' основного тона (p=0, 1,..., P-1), вычисляемый согласно уравнению 9. В уравнении 9, M' обозначает число выборок, чтобы использовать для того, чтобы вычислять степень подобия D, и оно может быть произвольным значением, равным или меньшим полосы пропускания каждой подполосы частот. Разумеется, M' может быть значением ширины BW_i подполосы частот. Подробности процесса поиска оптимального коэффициента T_p' основного тона (p=0, 1,..., P-1) посредством секции 263 поиска описываются ниже.

Секция 264 задания коэффициентов основного тона последовательно выводит в секцию 262 фильтрации коэффициент T основного тона посредством его небольшого изменения в предварительно определенном диапазоне Tmin-Tmax поиска вместе с секцией 262 фильтрации и секцией 263 поиска под управлением секции 263 поиска. Секция 264 задания коэффициентов основного тона может задавать коэффициент T основного тона посредством его небольшого изменения в предварительно определенном диапазоне Tmin-Tmax поиска в случае выполнения процесса поиска замкнутого контура, соответствующего первой подполосе частот, и может задавать коэффициент T основного тона посредством его небольшого изменения на основе оптимального коэффициента основного тона, полученного в процессе поиска замкнутого контура, соответствующего (m-1)-вой подполосе частот, в случае выполнения процесса поиска замкнутого контура, соответствующего m-той (m=2, 3,..., P) подполосе частот, например, в и после второй подполосы частот.

Секция 265 кодирования усиления вычисляет для каждой подполосы частот логарифмическое усиление в качестве параметра для регулирования энергетического отношения в нелинейной области на основе входного спектра S2(k) и оцененного спектра S2_p'(k) (p=0, 1,..., P-1) и идеального усиления α1_p каждой подполосы частот, которые вводятся из секции 263 поиска. Секция 265 кодирования усиления квантует идеальное усиление и логарифмическое усиление и выводит квантованное идеальное усиление и квантованное логарифмическое усиление в секцию 266 мультиплексирования.

Фиг. 4 показывает внутреннюю конфигурацию секции 265 кодирования усиления. Секция 265 кодирования усиления, главным образом, состоит из секции 271 кодирования идеального усиления и секции 272 кодирования логарифмического усиления.

Секция 271 кодирования идеального усиления конфигурирует оцененный спектр S2'(k) высокочастотной части входного спектра посредством продолжения в частотной части оцененного спектра S2_p'(k) (p=0, 1,..., P-1) каждой подполосы частот, который вводится из секции 263 поиска. Затем, секция 271 кодирования идеального усиления вычисляет оцененный спектр S3'(k) посредством умножения идеального усиления α1_p каждой подполосы, вводимого из секции 263 поиска, на оцененный спектр S2'(k) согласно уравнению 10. В уравнении 10, BL_p обозначает индекс заголовка каждой подполосы частот, а BH_p обозначает индекс конца каждой подполосы частот. Секция 271 кодирования идеального усиления выводит вычисленный оцененный спектр S3'(k) в секцию 272 кодирования логарифмического усиления. Секция 271 кодирования идеального усиления квантует идеальное усиление α1_p и выводит квантованное идеальное усиление αQ1_p в секцию 266 мультиплексирования в качестве кодированной информации идеального усиления.

Секция 272 кодирования логарифмического усиления вычисляет логарифмическое усиление в качестве параметра (параметра регулирования амплитуды) для регулирования энергетического отношения в нелинейной области для каждой подполосы частот между высокочастотной частью (FL≤k<FH) входного спектра S2(k), который вводится из секции 205 обработки ортогонального преобразования, и оцененного спектра S3'(k), который вводится из секции 271 кодирования идеального усиления. Секция 272 кодирования логарифмического усиления выводит вычисленное логарифмическое усиление в секцию 266 мультиплексирования в качестве кодированной информации логарифмического усиления.

Фиг. 5 показывает внутреннюю конфигурацию секции 272 кодирования логарифмического усиления. Секция 272 кодирования логарифмического усиления, главным образом, состоит из секции 281 поиска максимальных значений амплитуды, секции 282 извлечения групп выборок и секции 283 вычисления логарифмического усиления.

Секция 281 поиска максимальных значений амплитуды выполняет поиск, для каждой подполосы частот, максимального значения MaxValue_p амплитуды и индекса выборки (компонента спектра) выборки с максимальной амплитудой, т.е. максимального индекса MaxIndex_p амплитуды, для оцененного спектра S3'(k), который вводится из секции 271 кодирования идеального усиления, как выражается посредством уравнения 11.

Секция 281 поиска максимальных значений амплитуды выводит оцененный спектр S3'(k), максимальное значение MaxValue_p амплитуды и максимальный индекс MaxIndex_p амплитуды в секцию 282 извлечения групп выборок.

Секция 282 извлечения групп выборок определяет флаг SelectFlag(k) извлечения для каждой выборки, соответствующей вычисленному максимальному индексу MaxIndex_p амплитуды для каждой подполосы частот, как выражается посредством уравнения 12. Секция 282 извлечения групп выборок выводит оцененный спектр S3'(k), максимальное значение MaxValue_p амплитуды и флаг SelectFlag(k) извлечения в секцию 283 вычисления логарифмического усиления. В уравнении 12, Near_p обозначает пороговое значение, которое становится основой определения флага SelectFlag(k) извлечения.

Т.е. секция 282 извлечения групп выборок определяет значение флага SelectFlag(k) извлечения на основе такого стандарта, что значение флага SelectFlag(k) извлечения легко становится равным 1 для выборки (компонента спектра), которая ближе к выборке, имеющей максимальное значение MaxValue_p амплитуды в каждой подполосе частот, как выражается посредством уравнения 12. Т.е. секция 282 извлечения групп выборок частично выбирает выборку на основе весового коэффициента, который предоставляет возможность простого выбора выборки, которая ближе к выборке, имеющей максимальное значение MaxValue_p амплитуды в каждой подполосе частот. В частности, секция 282 извлечения групп выборок выбирает выборку с индексом, который указывает, что расстояние от максимального значения MaxValue_p амплитуды находится в диапазоне Near_p, как выражается посредством уравнения 12. Дополнительно, секция 282 извлечения групп выборок задает значение флага SelectFlag(k) извлечения равным 1 для выборки индекса с четным номером, даже когда выборка не находится близко к выборке, имеющей максимальное значение амплитуды, как выражается посредством уравнения 12. Соответственно, даже когда выборка, имеющая большую амплитуду, присутствует в полосе частот на значительном расстоянии от выборки, имеющей максимальное значение амплитуды, эта выборка или выборка, имеющая амплитуду рядом с амплитудой этой выборки, может быть извлечена.

Секция 283 вычисления логарифмического усиления вычисляет энергетическое отношение (логарифмическое усиление) α2_p в логарифмической области высокочастотной части (FL≤k<FH) оцененного спектра S3'(k) и входного спектра S2(k), согласно уравнению 13, для выборки, в которой значение флага SelectFlag(k) извлечения, которое вводится из секции 282 извлечения групп выборок, равняется 1. В уравнении 13, M' обозначает число выборок, чтобы использовать для того, чтобы вычислять логарифмическое усиление, и оно может быть произвольным значением, равным или меньшим полосы пропускания каждой подполосы частот. Разумеется, M' может быть значением ширины BW_i подполосы частот.

Т.е. секция 283 вычисления логарифмического усиления вычисляет логарифмическое усиление α2_p только для выборки, которая частично выбирается посредством секции 282 извлечения групп выборок. Секция 283 вычисления логарифмического усиления квантует логарифмическое усиление α2_p и выводит квантованное логарифмическое усиление α2Q_p в секцию 266 мультиплексирования в качестве кодированной информации логарифмического усиления.

Процесс посредством секции 265 кодирования усиления поясняется выше.

Секция 266 мультиплексирования мультиплексирует, в качестве кодированной информации второго слоя, информацию разделения полосы частот, которая вводится из секции 260 разделения полосы частот, оптимальный коэффициент T_p' основного тона для каждой подполосы SB_p частот (p=0, 1,..., P-1), который вводится из секции 263 поиска, индексы (кодированную информацию идеального усиления и кодированную информацию логарифмического усиления), надлежащим образом соответствующие идеальным усилениям α1Q_p, и логарифмическому усилению α2Q_p, которые вводятся из секции 265 кодирования усиления, и выводит кодированную информацию второго слоя в секцию 207 мультиплексирования кодированной информации. Индексы T_p' и α1Q_p и α2Q_p могут непосредственно вводиться в секцию 207 мультиплексирования кодированной информации и могут быть мультиплексированы в качестве кодированной информации первого слоя посредством секции 207 мультиплексирования кодированной информации.

Подробности процесса фильтрации посредством секции 262 фильтрации, показанной на фиг. 3, поясняются далее со ссылкой на фиг. 6.

Секция 262 фильтрации формирует оцененный спектр в полосе частот BS_p≤k<BS_p+BW_p (p=0, 1,..., P-1) для подполосы SB_p частот (p=0, 1,..., P-1), при помощи состояния фильтра, которое вводится из секции 261 задания состояний фильтра, коэффициента T основного тона, который вводится из секции 264 задания коэффициентов основного тона, и информации разделения полосы частот, которая вводится из секции 260 разделения полосы частот. Передаточная функция F(z) фильтра, который используется посредством секции 262 фильтрации, выражается посредством следующего уравнения 14.

Процесс формирования оцененного спектра S2_p'(k) для спектра S2_p(k) подполосы частот поясняется далее посредством рассмотрения подполосы SB_p частот в качестве примера.

В уравнении 14, T обозначает коэффициент основного тона, который предоставляется из секции 264 задания коэффициентов основного тона, и β_i обозначает коэффициент фильтрации, который сохраняется заранее во внутренней части. Например, когда число отводов равняется 3, вариантом коэффициента фильтрации является (β_-1, β₀, β₁)=(0, 1, 0,8, 0, 1). Дополнительно, значение (β_-1, β₀, β₁)=(0,2, 0,6, 0,2), (0,3, 0,4, 0,3) также является подходящим. Значение (β_-1, β₀, β₁)=(0,0, 1,0, 0,0) также является подходящим, и в этом случае, значение указывает, что часть полосы частот декодированного спектра первого слоя полосы частот 0≤k<FL непосредственно копируется в полосу частот BS_p≤k<BS_p+BW_p без изменения формы части полосы частот. В следующем пояснении, значение (β_-1, β₀, β₁)=(0,0, 1,0, 0,0) предполагается в качестве примера. В уравнении 14 предполагается, что M=1. M обозначает индекс, который является релевантным для числа отводов.

Декодированный спектр S1(k) первого слоя сохраняется в качестве внутреннего состояния (состояния фильтра) в полосе частот 0≤k<FL спектра S(k) всей полосы частот в секции 262 фильтрации.

Оцененный спектр S2_p'(k) подполосы SB_p частот сохраняется в полосе частот BS_p≤k<BS_p+BW_p S(k) посредством процесса фильтрации на следующем этапе. Т.е., как показано на фиг. 6, в основном, спектр S(k-T) частоты, которая меньше k на T, подставляется в S2_p'(k). Тем не менее, чтобы повышать гладкость спектра, фактически, спектр, который получается посредством добавления ко всем i спектра β_i·S (k-T+i) полученного посредством умножения близкого спектра S (k-T+1), который отстоит только на i от спектра S(k) на предварительно определенный коэффициент фильтрации β_i, подставляется в S2_p'(k). Эта обработка представляется посредством следующего уравнения 15.

Оцененный спектр S2_p'(k) в BS_p≤k<BS_p+BW_p вычисляется посредством выполнения вышеприведенного вычисления, последовательно от k=BS_p низкой частоты, посредством изменения k в диапазоне BS_p≤k<BS_p+BW_p.

Вышеуказанный процесс фильтрации выполняется посредством очистки от нулей S(k) каждый раз в диапазоне BS_p≤k<BS_p+BW_p, каждый раз, когда коэффициент T основного тона предоставляется из секции 264 задания коэффициентов основного тона. Этот S(k) вычисляется каждый раз, когда коэффициент T основного тона изменяется, и результат выводится в секцию 263 поиска.

Фиг. 7 является блок-схемой последовательности операций способа, показывающей этап процесса поиска оптимального коэффициента T_p' основного тона подполосы SB_p частот в секции 263 поиска, показанном на фиг. 3. Секция 263 поиска выполняет поиск оптимального коэффициента T_p' основного тона (p=0, 1,..., P-1), соответствующего каждой подполосе SB_p частот (p=0, 1,..., P-1), посредством повторения этапа, показанного на фиг. 7.

Во-первых, секция 263 поиска инициализирует минимальную степень подобия D_min в качестве переменной, чтобы сохранять минимальное значение степени подобия, равной "+∞" (ST2010). Затем, секция 263 поиска вычисляет степень подобия D между высокочастотной частью (FL≤k<FH) входного спектра S2(k) в определенном коэффициенте основного тона и оцененным спектром S2_p'(k) на основе следующего уравнения 16 (ST2020).

В уравнении 16, M' обозначает число выборок, чтобы вычислять степень подобия D, и это значение может быть произвольным значением, равным или меньшим полосы пропускания каждой подполосы частот. Разумеется, M' может принимать значение ширины BW_i подполосы частот. В уравнении 16, S2_p'(k) не присутствует, поскольку BS_p и S2'(k) используются для того, чтобы представлять S2_p'(k).

Секция 263 поиска определяет то, меньше или нет вычисленная степень подобия D минимальной степени подобия D_min (ST2030). Когда степень подобия D, вычисляемая на ST2020, меньше минимальной степени подобия D_min ("ДА" на ST2030), секция 263 поиска заменяет степень подобия D на минимальную степень подобия D_min (ST2040). С другой стороны, когда степень подобия, вычисляемая на ST2020, равна или превышает минимальную степень подобия D_min ("НЕТ" на ST2030), секция поиска определяет то, завершен или нет процесс в диапазоне поиска. Т.е. секция 263 поиска определяет то, вычислена или нет степень подобия для всех коэффициентов основного тона в диапазоне поиска согласно вышеприведенному уравнению 16 на ST2020 (ST2050). Когда процесс не завершен в диапазоне поиска ("НЕТ" на ST2050), секция 263 поиска возвращает процесс к ST2020. Секция поиска вычисляет степень подобия согласно уравнению 16 для коэффициентов основного тона, которые отличаются от коэффициента основного тона, для которого степень свободы вычисляется согласно уравнению 16, на последнем этапе ST2020. С другой стороны, когда процесс завершен в диапазоне поиска ("ДА" на ST2050), секция 263 поиска выводит коэффициент T основного тона, соответствующий минимальной степени подобия D_min, в секцию 266 мультиплексирования в качестве оптимального коэффициента T_p' основного тона (ST2060).

Устройство 103 декодирования, показанное на фиг. 1, поясняется далее.

Фиг. 8 является блок-схемой, показывающей релевантную конфигурацию внутренней части устройства 103 декодирования.

На фиг. 8, секция 131 демультиплексирования кодированной информации демультиплексирует кодированную информацию первого слоя и кодированную информацию второго слоя из числа входной кодированной информации (т.е. кодированной информации, принятой из устройства 101 кодирования), выводит кодированную информацию первого слоя в секцию 132 декодирования первого слоя и выводит кодированную информацию второго слоя в секцию 135 декодирования второго слоя.

Секция 132 декодирования первого слоя декодирует кодированную информацию первого слоя, которая вводится из секции 131 демультиплексирования кодированной информации, и выводит сформированный декодированный сигнал первого слоя в секцию 133 обработки повышающей дискретизации. Операции секции 132 декодирования первого слоя являются подобными операциям секции 203 декодирования первого слоя, показанной на фиг. 2, и, следовательно, подробное пояснение операций опускается.

Секция 133 обработки повышающей дискретизации выполняет процесс повышающей дискретизации частоты дискретизации от SR₂ до SR₁ для декодированного сигнала первого слоя, который вводится из секции 132 декодирования первого слоя, и выводит полученный декодированный сигнал первого слоя после повышающей дискретизации в секцию 134 обработки ортогонального преобразования.

Секция 134 обработки ортогонального преобразования выполняет процесс ортогонального преобразования (MDCT) для декодированного сигнала первого слоя после повышающей дискретизации, который вводится из секции 133 обработки повышающей дискретизации, и выводит MDCT-коэффициент полученного декодированного сигнала первого слоя после повышающей дискретизации (в дальнейшем в этом документе, "декодированный спектр первого слоя") S1(k) в секцию 135 декодирования второго слоя. Операции секции 134 обработки ортогонального преобразования являются подобными операциям секции 205 обработки ортогонального преобразования, показанной на фиг. 2, выполняемым для декодированного сигнала первого слоя после повышающей дискретизации, и, следовательно, подробное пояснение операций опускается.

Секция 135 декодирования второго слоя формирует декодированный сигнал второго слоя, содержащий высокочастотный компонент, при помощи декодированного спектра S1(k) первого слоя, который вводится из секции 134 обработки ортогонального преобразования, и кодированной информации второго слоя, которая вводится из секции 131 демультиплексирования кодированной информации, и выводит сформированный сигнал в качестве выходного сигнала.

Фиг. 9 является блок-схемой, показывающей релевантную конфигурацию внутренней части секции декодирования второго слоя, показанной на фиг. 8.

Секция 351 демультиплексирования демультиплексирует кодированную информацию второго слоя, которая вводится из секции 131 демультиплексирования кодированной информации, на информацию разделения полосы частот, которая содержит полосу BW_p пропускания (p=0, 1,..., P-1) и индекс BS_p заголовка (p=0, 1,..., P-1) (FL≤BS_p<FH) каждой подполосы частот, оптимальный коэффициент T_p' основного тона (p=0, 1,..., P-1) в качестве информации относительно фильтрации и индексы кодированной информации идеального усиления (j=0, 1,..., J-1) и кодированной информации логарифмического усиления (j=0, 1,..., J-1) в качестве информации относительно усиления. Секция 351 демультиплексирования выводит информацию разделения полосы частот и оптимальный коэффициент T_p' основного тона (p=0, 1,..., P-1) в секцию 353 фильтрации и выводит индексы кодированной информации идеального усиления и кодированной информации логарифмического усиления в секцию 354 декодирования усиления. В секции 131 демультиплексирования кодированной информации, когда кодированная информация второго слоя уже разделяется на информацию разделения полосы частот, оптимальный коэффициент T_p' основного тона (p=0, 1,..., P-1) и индексы кодированной информации идеального усиления и кодированной информации логарифмического усиления, секция 351 демультиплексирования не обязательно должен размещаться.

Секция 352 задания состояний фильтра задает декодированный спектр S1(k) первого слоя (0≤k<FL), который вводится из секции 134 обработки ортогонального преобразования, в качестве состояния фильтра, которое должно использоваться посредством секции 353 фильтрации. Когда спектр всей полосы частот 0≤k<FH в секции 353 фильтрации называется S(k) для удобства, декодированный спектр S1(k) первого слоя сохраняется в полосе частот 0≤k<FL S(k) в качестве внутреннего состояния (состояния фильтра) фильтра. Конфигурация и операции секции 352 задания состояний фильтра являются подобными конфигурации и операциям секции 261 задания состояний фильтра, показанной на фиг. 3, и, следовательно, подробное пояснение конфигурации и операций опускается.

Секция 353 фильтрации включает в себя фильтр основного тона с несколькими отводами (число отводов превышает 1). Секция 353 фильтрации фильтрует декодированный спектр S1(k) первого слоя и вычисляет оцененное значение S2_p'(k) (BS_p≤k<BS_p+BW_p) (p=0, 1,..., P-1) каждой подполосы SB_p частот (p=0, 1,..., P-1,), показанное в вышеприведенном уравнении 15, на основе информации разделения полосы частот, которая вводится из секции 351 демультиплексирования, состояния фильтра, которое задается посредством секции 352 задания состояний фильтра, коэффициента T_p' основного тона (p=0, 1,..., p-1) и коэффициента фильтрации, сохраненных во внутренней части заранее. Функция фильтра, показанная в вышеприведенном уравнении 14, также используется в секции 353 фильтрации. Тем не менее, процесс фильтрации и функция фильтра в этом случае отличаются тем, что T в уравнениях 14 и 15 подставляется вместо T_p'. Т.е. секция 353 фильтрации оценивает высокочастотную часть входного спектра в устройстве 101 кодирования из декодированного спектра первого слоя.

Секция 354 декодирования усиления декодирует индексы кодированной информации идеального усиления и кодированной информации логарифмического усиления, которые вводятся из секции 351 демультиплексирования, и получает квантованное идеальное усиление αQ1_p и квантованное логарифмическое усиление α2Q_p квантованных значений идеального усиления α1_p и логарифмического усиления α2_p.

Секция 355 регулирования спектра вычисляет декодированный спектр на основе оцененного значения S2_p'(k) (BS_p≤k<BS_p+BW_p) (p=0, 1,..., P-1) каждой подполосы SB_p частот (p=0, 1,..., P-1), которое вводится из секции 353 фильтрации, и идеального усиления αQ1_p для каждой подполосы частот, которое вводится из секции 354 декодирования усиления. Секция 355 регулирования спектра выводит вычисленный декодированный спектр в секцию 356 обработки ортогонального преобразования.

Фиг. 10 показывает внутреннюю конфигурацию секции 355 регулирования спектра. Секция 355 регулирования спектра, главным образом, состоит из секции 361 декодирования идеального усиления и секции 362 декодирования логарифмического усиления.

Секция 361 декодирования идеального усиления получает оцененный спектр S2'(k) входного спектра посредством продолжения в частотной части оцененного значения S2_p'(k) (BS_p≤k<BS_p+BW_p) (p=0, 1,..., P-1) каждой подполосы частот, которое вводится из секции 353 фильтрации. Затем, секция 361 декодирования идеального усиления вычисляет оцененный спектр S3'(k) посредством умножения идеального усиления αQ1_p для каждой подполосы частот, которое вводится из секции 354 декодирования усиления, на оцененный спектр S2'(k) на основе следующего уравнения 17. Секция 361 декодирования идеального усиления выводит оцененный спектр S3'(k) в секцию 362 декодирования логарифмического усиления.

Секция 362 декодирования логарифмического усиления выполняет энергетическое регулирование в логарифмической области для оцененного спектра S3'(k), который вводится из секции 361 декодирования идеального усиления, при помощи квантованного логарифмического усиления α2Q_p для каждой подполосы частот, которое вводится из секции 354 декодирования усиления, и выводит полученный спектр в секцию 356 обработки ортогонального преобразования в качестве декодированного спектра.

Фиг. 11 показывает внутреннюю конфигурацию секции 362 декодирования логарифмического усиления. Секция 362 декодирования логарифмического усиления, главным образом, состоит из секции 371 поиска максимальных значений амплитуды, секции 372 извлечения групп выборок и секции 373 применения логарифмического усиления.

Секция 371 поиска максимальных значений амплитуды выполняет поиск, для каждой подполосы частот, максимального значения MaxValue_p амплитуды и максимального индекса MaxIndex_p амплитуды в качестве индекса выборки (компонента выборки) максимальной амплитуды, для оцененного спектра S3'(k), который вводится из секции 361 декодирования идеального усиления, как выражается посредством уравнения 11. Секция 371 поиска максимальных значений амплитуды выводит оцененный спектр S3'(k), максимальное значение MaxValue_p амплитуды и максимальный индекс MaxIndex_p амплитуды в секцию 372 извлечения групп выборок.

Секция 372 извлечения групп выборок определяет флаг SelectFlag(k) извлечения для каждой выборки, соответствующей вычисленному максимальному индексу MaxIndex_p амплитуды для каждой подполосы частот, как выражается посредством уравнения 12. Т.е. секция 372 извлечения групп выборок частично выбирает выборку на основе весового коэффициента, который предоставляет возможность простого выбора выборки (компонента спектра), которая ближе к выборке, имеющей максимальное значение MaxValue_p амплитуды в каждой подполосе частот. Секция 372 извлечения групп выборок выводит оцененный спектр S3'(k), максимальное значение MaxValue_p амплитуды и максимальный индекс MaxIndex_p амплитуды и флаг SelectFlag(k) извлечения для каждой выборки в секцию 373 применения логарифмического усиления.

Процессы, выполняемые посредством секции 371 поиска максимальных значений амплитуды и секции 372 извлечения групп выборок, являются подобными процессам, выполняемым посредством секции 281 поиска максимальных значений амплитуды и секции 282 извлечения групп выборок устройства 101 кодирования.

Секция 373 применения логарифмического усиления вычисляет Sign_p(k), который указывает знак (+, -) извлеченной группы выборок, из оцененного спектра S3'(k) и флага SelectFlag(k) извлечения, которые вводятся из секции 372 извлечения групп выборок, как выражается посредством уравнения 18. Т.е. как выражается посредством уравнения 18, секция 373 применения логарифмического усиления вычисляет Sign_p(k)=1, когда знак извлеченной выборки - это "+" (когда S3'(k)≥0), и вычисляет Sign_p(k)= -1 в других случаях (когда знак извлеченной выборки - это "-" (когда Sign_p(k)≥0).

Секция 373 применения логарифмического усиления вычисляет декодированный спектр S5'(k) согласно уравнениям 19 и 20 для выборки, в которой значение флага SelectFlag(k) извлечения равняется 1, на основе оцененного спектра S3'(k), максимального значения MaxValue_p амплитуды и флага SelectFlag(k) извлечения, которые вводятся из секции 372 извлечения групп выборок, и на основе квантованного логарифмического усиления α2Q_p, которое вводится из секции 354 декодирования усиления, и знака Sign_p(k), который вычисляется согласно уравнению 18.

19 20

Т.е. секция 373 применения логарифмического усиления применяет логарифмическое усиление α2_p только к выборке, которая частично выбирается посредством секции 372 извлечения выборок (выборке флага извлечения SelectFlag (k=1)). Секция 373 применения логарифмического усиления выводит декодированный спектр S5'(k) в секцию 356 обработки ортогонального преобразования. В этом случае, низкочастотная часть (0≤k<FL) декодированного спектра S5'(k) состоит из декодированного спектра S1(k) первого слоя, а высокочастотная часть (FL≤k<FH) декодированного спектра S5'(k) состоит из спектра, полученного посредством выполнения энергетического регулирования в логарифмической области для оцененного спектра S3'(k). Тем не менее, для выборки, которая не выбирается посредством секции 372 извлечения выборок (выборки флага SelectFlag(k) извлечения=0) в высокочастотной части (FL≤k<FH) декодированного спектра S5'(k), значение этой выборки задается как значение оцененного спектра S3'(k).

Секция 356 обработки ортогонального преобразования ортогонально преобразует декодированный спектр S5'(k), который вводится из секции 355 регулирования спектра, в сигнал временной области и выводит полученный декодированный сигнал второго слоя в качестве выходного сигнала. В этом случае, надлежащие процессы кодирования со взвешиванием и сложения с наложением выполняются при необходимости, тем самым не допуская формирования неоднородности между кадрами.

Подробный процесс секции 356 обработки ортогонального преобразования поясняется ниже.

Секция 356 обработки ортогонального преобразования имеет буфер buf'(k) в своей внутренней части и инициализирует буфер buf'(k), как выражается посредством следующего уравнения 21.

Секция 356 обработки ортогонального преобразования также получает декодированный сигнал y_n'' второго слоя на основе следующего уравнения 22 при помощи декодированного спектра S5'(k) второго слоя, который вводится из секции 355 регулирования спектра.

В уравнении 22, Z4(k) является вектором, который комбинирует декодированный спектр S5'(k) и буфер buf'(k), как выражается посредством следующего уравнения 23.

Секция 356 обработки ортогонального преобразования обновляет буфер buf'(k) на основе следующего уравнения 24.

Секция 356 обработки ортогонального преобразования выводит декодированный сигнал y_n'' в качестве выходного сигнала.

Как пояснено выше, согласно настоящему варианту осуществления, при кодировании/декодировании для оценки спектра высокочастотной части посредством выполнения расширения полосы частот при помощи спектра низкочастотной части, спектр высокочастотной части оценивается при помощи декодированного низкочастотного спектра, и после этого выборка выбирается (прореживается) посредством наложения весового коэффициента на выборку на внешней границе максимального значения амплитуды в каждой подполосе частот оцененного спектра, и регулировка усиления в логарифмической области выполняется только для выбранной выборки. На основе этой конфигурации, объем арифметических операций, необходимый для регулировки усиления в логарифмической области, может существенно уменьшаться. Дополнительно, посредством выполнения регулировки усиления только для акустически важной выборки рядом с максимальным значением амплитуды, формирование анормального звука, который приводит к усилению выборки низкого значения амплитуды, может подавляться, и качество звука декодированного сигнала может быть повышено.

В настоящем варианте осуществления, при задании флага извлечения, значение флага извлечения задается равным 1, когда индекс является четным числом для выборки, которая не находится близко к выборке, имеющей максимальное значение амплитуды в подполосе частот. Тем не менее, вариант применения настоящего изобретения не ограничен этим, и изобретение может подобно применяться, например, к случаю, когда значение флага извлечения выборки, в которой остаток для индекса 3 равен 0, задается равным 1. Т.е. вариант применения настоящего изобретения не ограничен вышеуказанным способом задания флага извлечения, и настоящее изобретение может подобно применяться к способу извлечения выборки на основе весового коэффициента (масштаба), который предоставляет возможность простого задания значения флага извлечения равным 1 для выборки, которая ближе к выборке, имеющей максимальное значение амплитуды, соответствующее положению максимального значения амплитуды в подполосе частот. Например, существует способ задания флага извлечения в три этапа, когда устройство кодирования и устройство декодирования извлекают все выборки, которые находится очень близко к выборке, имеющей максимальное значение амплитуды (т.е. устройство кодирования и устройство декодирования задают значение флага извлечения равным 1), извлекают выборки, которые находятся на небольшом расстоянии от максимального значения амплитуды, только тогда, когда индекс является четным числом, и извлекают выборки, которые находятся на большем расстоянии от максимального значения амплитуды, когда остаток для индекса 3 равен 0. Разумеется, настоящее изобретение также может применяться к способу задания более чем на трех этапах.

В настоящем варианте осуществления, при задании флага извлечения, в качестве примера поясняется то, что после того как поиск выборки, которая имеет максимальное значение амплитуды в подполосе частот, выполнен, флаг извлечения задается согласно расстоянию от этой выборки. Тем не менее, применение настоящего варианта осуществления не ограничено этим, и изобретение также может применяться к случаю, когда устройство кодирования и устройство декодирования выполняют поиск выборки, которая имеет минимальное значение амплитуды, задают флаг извлечения каждой выборки, соответствующей расстоянию от выборки, которая имеет минимальное значение амплитуды, и вычисляют и применяют параметр регулирования амплитуды логарифмического усиления и т.п., например, только к извлеченной выборке (выборке, в которой значение флага извлечения задается равным 1). Эта конфигурация является допустимой, например, когда параметр регулирования амплитуды имеет эффект ослабления оцененного высокочастотного спектра. Хотя существует риск формирования анормального звука посредством ослабления высокочастотного спектра для выборки, имеющей большую амплитуду, существует возможность повышения качества звука посредством применения процесса ослабления только к внешней границе выборки, имеющей минимальное значение амплитуды. Существует также конфигурация, в которой устройство кодирования и устройство декодирования извлекают выборку при помощи весового коэффициента (масштаба), который предоставляет возможность простого извлечения выборки, которая находится на большем расстоянии от выборки, имеющей максимальное значение амплитуды, посредством поиска максимального значения амплитуды вместо поиска минимального значения амплитуды. Настоящее изобретение также может подобно применяться к этой конфигурации.

В настоящем варианте осуществления, поясняется случай, когда выборка частично выбирается посредством определения того, находится или нет выборка в каждой подполосе частот близко к выборке, которая имеет максимальное значение амплитуды, на основе порогового значения (Near_p, выражаемого в уравнении 12). В настоящем изобретении, устройство кодирования и устройство декодирования могут быть выполнены с возможностью выбирать выборку более широкого диапазона для подполосы частот на более высокой частоте из множества подполос частот, например, в качестве выборки, которая находится близко к выборке, имеющей максимальное значение амплитуды. Т.е. в настоящем изобретении, Near_p, которое выражается в уравнении 12, может принимать большее значение для подполосы частот с более высокой частотой из множества подполос частот. В этой компоновке, во время разделения полосы частот, даже когда ширина подполосы частот задается как большая для более высокой частоты, к примеру, по шкале Барка, например, выборка может частично выбираться без отклонения между подполосами частот, и ухудшение качества звука декодированного сигнала может предотвращаться. Экспериментально подтверждено то, что для значения Near_p, которое выражается посредством уравнения 12, хороший результат получается посредством задания приблизительно 5-21 (например, значение Near_p в самой низкой подполосе частот равняется 5, а значение Near_p в наивысшей подполосе частот равняется 21), когда число выборок (MDCT-коэффициентов) одного кадра составляет, например, приблизительно 320.

В настоящем варианте осуществления, поясняется конфигурация устройства кодирования и устройства декодирования, в которой секция обнаружения группы выборок частично выбирает выборку на основе весового коэффициента, который предоставляет возможность простого выбора выборки, которая ближе к выборке, имеющей максимальное значение MaxValue_p амплитуды в каждой подполосе частот, как выражается посредством уравнения 12. В этом случае, посредством способа извлечения группы выборок, который выражается посредством уравнения 12, выборка близко к максимальному значению амплитуды может легко выбираться независимо от границы подполосы частот, даже когда выборка, имеющая максимальное значение амплитуды, присутствует на границе каждой подполосы частот. Т.е. согласно конфигурации, поясненной в настоящем варианте осуществления, поскольку выборка выбирается посредством рассмотрения положения выборки, которая имеет максимальное значение амплитуды в смежной подполосе частот, акустически важная выборка может эффективно выбираться.

В настоящем варианте осуществления, секция поиска максимальных значений амплитуды вычисляет максимальную амплитуду в линейной области, а не в логарифмической области. Когда логарифмическое преобразование выполняется для всех выборок (MDCT-коэффициентов) (например, патентный документ 1 и т.п.), объем арифметических операций не увеличивается так, когда максимальное значение амплитуды вычисляется в логарифмической области или в линейной области. Тем не менее, как в конфигурации настоящего варианта осуществления, когда логарифмическое преобразование выполняется для частично выбранной выборки, объем арифметических операций при вычислении максимального значения амплитуды может уменьшаться в большей степени, чем объем арифметических операций посредством способа в патентном документе 1 и т.п., например, когда секция поиска максимальных значений амплитуды вычисляет максимальное значение амплитуды в линейной области, как описано выше.

Вариант 2 осуществления

В варианте 2 осуществления настоящего изобретения секция кодирования усиления в секции кодирования второго слоя дополнительно может уменьшать объем арифметических операций при помощи конфигурации, которая отличается от конфигурации, поясненной в варианте 1 осуществления.

Система связи (не показана) согласно варианту 2 осуществления в основном является подобной системе связи, показанной на фиг. 1, и отличается от устройства 101 кодирования и устройства 103 декодирования системы связи на фиг. 1 только в части конфигурации и операций устройства кодирования и устройства декодирования. Вариант 2 осуществления поясняется ниже посредством добавления ссылок с номерами 111 и 113, соответственно, к устройству кодирования и устройству декодирования согласно настоящему варианту осуществления.

Внутренняя часть устройства 111 кодирования (не показана) согласно настоящему варианту осуществления, главным образом, состоит из секции 201 обработки понижающей дискретизации, секции 202 кодирования первого слоя, секции 203 декодирования первого слоя, секции 204 обработки повышающей дискретизации, секции 205 обработки ортогонального преобразования, секции 206 кодирования второго слоя и секции 207 мультиплексирования кодированной информации. Составляющие элементы, отличные от секции 226 кодирования второго слоя, выполняют процессы, идентичные процессам в варианте 1 осуществления (фиг. 2), и, следовательно, их пояснение опускается.

Секция 226 кодирования второго слоя формирует кодированную информацию второго слоя при помощи входного спектра S2(k) и декодированного спектра S1(k) первого слоя, которые вводятся из секции 205 обработки ортогонального преобразования, и выводит сформированную кодированную информацию второго слоя в секцию 207 мультиплексирования кодированной информации.

Затем, релевантная конфигурация внутренней части секции 226 кодирования второго слоя поясняется со ссылкой на фиг. 12.

Секция 206 кодирования второго слоя включает в себя секцию 260 разделения полосы частот, секцию 261 задания состояний фильтра, секцию 262 фильтрации, секцию 263 поиска, секцию 264 задания коэффициентов основного тона, секцию 235 кодирования усиления и секцию 266 мультиплексирования, и каждая секция выполняет следующие операции. Составляющие элементы, отличные от секции 235 кодирования усиления, являются идентичными составляющим элементам, поясненным в варианте 1 осуществления (фиг. 3), и, следовательно, их пояснение опускается.

Секция 235 кодирования усиления вычисляет для каждой подполосы частот логарифмическое усиление в качестве параметра (параметра регулирования амплитуды) для регулирования энергетического отношения в нелинейной области на основе входного спектра S2(k) и оцененного спектра S2_p'(k) (p=0, 1,..., P-1) и идеального усиления α1_p каждой подполосы частот, которые вводятся из секции 263 поиска. Секция 235 кодирования усиления квантует идеальное усиление и логарифмическое усиление и выводит квантованное идеальное усиление и квантованное логарифмическое усиление в секцию 266 мультиплексирования.

Фиг. 13 показывает внутреннюю конфигурацию секции 235 кодирования усиления. Секция 235 кодирования усиления, главным образом, состоит из секции 241 кодирования идеального усиления и секции 242 кодирования логарифмического усиления. Секция 241 кодирования идеального усиления является составляющим элементом, идентичным составляющему элементу, поясненному в варианте 1 осуществления, и, следовательно, пояснение секции 241 кодирования идеального усиления опускается.

Секция 242 кодирования логарифмического усиления вычисляет логарифмическое усиление в качестве параметра (параметра регулирования амплитуды) для регулирования энергетического отношения в нелинейной области для каждой подполосы частот между высокочастотной частью (FL≤k<FH) входного спектра S2(k), который вводится из секции 205 обработки ортогонального преобразования, и оцененного спектра S3'(k), который вводится из секции 241 кодирования идеального усиления. Секция 242 кодирования логарифмического усиления выводит вычисленное логарифмическое усиление в секцию 266 мультиплексирования в качестве кодированной информации логарифмического усиления.

Фиг. 14 показывает внутреннюю конфигурацию секции 242 кодирования логарифмического усиления. Секция 242 кодирования логарифмического усиления, главным образом, состоит из секции 253 поиска максимальных значений амплитуды, секции 251 извлечения групп выборок и секции 252 вычисления логарифмического усиления.

Секция 253 поиска максимальных значений амплитуды выполняет поиск, для каждой подполосы частот, максимального значения MaxValue_p амплитуды и индекса выборки (компонента спектра) максимальной амплитуды, т.е. максимального индекса MaxIndex_p амплитуды, для оцененного спектра S3'(k), который вводится из секции 241 кодирования идеального усиления, как выражается посредством уравнения 25.

Т.е. секция 253 поиска максимальных значений амплитуды выполняет поиск максимального значения амплитуды только для выборки индекса с четным номером. В этой компоновке, объем арифметических операций, требуемый для того, чтобы выполнять поиск максимального значения амплитуды, может эффективно уменьшаться.

Секция 253 поиска максимальных значений амплитуды выводит оцененный спектр S3'(k), максимальное значение MaxValue_p амплитуды и максимальный индекс MaxIndex_p амплитуды в секцию 251 извлечения групп выборок.

Секция 251 извлечения групп выборок определяет значение флага SelectFlag(k) извлечения для каждой выборки (компонента спектра) для оцененного спектра S3'(k), который вводится из секции 253 поиска максимальных значений амплитуды, на основе следующего уравнения 26.

Т.е. секция 251 извлечения групп выборок задает значение флага SelectFlag(k) извлечения равным 0 для выборки индекса с нечетным номером и задает значение флага SelectFlag(k) извлечения равным 1 для выборки индекса с четным номером, как выражается посредством уравнения 26. Т.е. секция 251 извлечения групп выборок частично выбирает выборку (компонент спектра) (только выборку с индексом четного числа) для оцененного спектра S3'(k). Секция 251 извлечения групп выборок выводит флаг SelectFlag(k) извлечения, оцененный спектр S3'(k) и максимальное значение MaxValue_p амплитуды в секцию 252 вычисления логарифмического усиления.

Секция 252 вычисления логарифмического усиления вычисляет энергетическое отношение (логарифмическое усиление) α2_p в логарифмической области между оцененным спектром S3'(k) и высокочастотной частью (FL≤k<FH) входного спектра S2(k), на основе уравнения 13, для выборки, в которой значение флага SelectFlag(k) извлечения, которое вводится из секции 251 извлечения групп выборок, равняется 1. Т.е. секция 252 вычисления логарифмического усиления вычисляет логарифмическое усиление α2_p только для выборки, которая частично выбирается посредством секции 251 извлечения групп выборок.

Секция 252 вычисления логарифмического усиления квантует логарифмическое усиление α2_p и выводит квантованное логарифмическое усиление α2Q_p в секцию 266 мультиплексирования в качестве кодированной информации логарифмического усиления.

Процесс посредством секции 235 кодирования усиления поясняется выше.

Процесс устройства 111 кодирования согласно настоящему варианту осуществления является таким, как пояснено выше.

С другой стороны, внутренняя часть устройства 113 декодирования (не показана) согласно настоящему варианту осуществления, главным образом, состоит из секции 131 демультиплексирования кодированной информации, секции 132 декодирования первого слоя, секции 133 обработки повышающей дискретизации, секции 134 обработки ортогонального преобразования и секции 295 декодирования второго слоя. Составляющие элементы, отличные от секции 295 декодирования второго слоя, выполняют процессы, идентичные процессам в варианте 1 осуществления (фиг. 8), и, следовательно, их пояснение опускается.

Секция 295 декодирования второго слоя формирует декодированный сигнал второго слоя, содержащий высокочастотный компонент, при помощи декодированного спектра S1(k) первого слоя, который вводится из секции 134 обработки ортогонального преобразования, и кодированной информации второго слоя, которая вводится из секции 131 демультиплексирования кодированной информации, и выводит сформированный сигнал в качестве выходного сигнала.

Секция 295 декодирования второго слоя, главным образом, состоит из секции 351 демультиплексирования, секции 352 задания состояний фильтра, секции 353 фильтрации, секции 354 декодирования усиления, секции 396 регулирования спектра и секции 356 обработки ортогонального преобразования. Составляющие элементы, отличные от секции 396 регулирования спектра, выполняют процессы, идентичные процессам в варианте 1 осуществления (фиг. 9), и, следовательно, их пояснение опускается.

Секция 396 регулирования спектра, главным образом, состоит из секции 361 декодирования идеального усиления и секции 392 декодирования логарифмического усиления (не показаны). Секция 361 декодирования идеального усиления выполняет процесс, идентичный процессу в варианте 1 осуществления (фиг. 10), и, следовательно, пояснение секции 361 декодирования идеального усиления опускается.

Фиг. 15 показывает внутреннюю конфигурацию секции 392 декодирования логарифмического усиления. Секция 392 кодирования логарифмического усиления, главным образом, состоит из секции 381 поиска максимальных значений амплитуды, секции 382 извлечения групп выборок и секции 383 применения логарифмического усиления.

Секция 381 поиска максимальных значений амплитуды выполняет поиск, для каждой подполосы частот, максимального значения MaxValue_p амплитуды и индекса выборки (компонента спектра) выборки с максимальной амплитудой, т.е. максимального индекса MaxIndex_p амплитуды, для оцененного спектра S3'(k), который вводится из секции 361 декодирования идеального усиления, как выражается посредством уравнения 25. Т.е. секция 381 поиска максимальных значений амплитуды выполняет поиск максимального значения амплитуды только для выборки индекса с четным номером. Т.е. секция 381 поиска максимальных значений амплитуды выполняет поиск максимального значения амплитуды только для части выборки (компонента спектра) из оцененного спектра S3'(k). В этой компоновке, объем арифметических операций, требуемый для того, чтобы выполнять поиск максимального значения амплитуды, может эффективно уменьшаться. Секция 381 поиска максимальных значений амплитуды выводит оцененный спектр S3'(k), максимальное значение MaxValue_p амплитуды и максимальный индекс MaxIndex_p амплитуды в секцию 382 извлечения групп выборок.

Секция 382 извлечения групп выборок определяет флаг SelectFlag(k) извлечения для каждой выборки, соответствующей вычисленному максимальному индексу MaxIndex_p амплитуды для каждой подполосы частот, как выражается посредством уравнения 12. Т.е. секция 382 извлечения групп выборок частично выбирает выборку на основе весового коэффициента, который предоставляет возможность простого выбора выборки (компонента спектра), которая ближе к выборке, имеющей максимальное значение MaxValue_p амплитуды в каждой подполосе частот. В частности, секция 382 извлечения групп выборок выбирает выборку с индексом, который указывает, что расстояние от максимального значения MaxValue_p амплитуды находится в диапазоне Near_p, как выражается посредством уравнения 12. Дополнительно, секция 382 извлечения групп выборок задает значение флага SelectFlag(k) извлечения равным 1 для выборки индекса с четным номером, даже когда выборка не находится близко к выборке, имеющей максимальное значение амплитуды, как выражается посредством уравнения 12. Соответственно, даже когда выборка, имеющая большую амплитуду, присутствует в полосе частот на значительном расстоянии от выборки, имеющей максимальное значение амплитуды, этой выборки или выборки, имеющей амплитуду близко к выборке, эта выборка может быть извлечена. Секция 382 извлечения групп выборок выводит оцененный спектр S3'(k) и максимальное значение MaxValue_p амплитуды и флаг SelectFlag(k) извлечения для каждой подполосы частот в секцию 383 вычисления логарифмического усиления.

Процессы, выполняемые посредством секции 381 поиска максимальных значений амплитуды и секции 382 извлечения групп выборок, являются подобными процессам, выполняемым посредством секции 253 поиска максимальных значений амплитуды и секции 282 извлечения групп выборок устройства 101 кодирования.

Секция 383 применения логарифмического усиления вычисляет Sign_p(k), который указывает знак (+, -) извлеченной группы выборок, из оцененного спектра S3'(k) и флага SelectFlag(k) извлечения, которые вводятся из секции 382 извлечения групп выборок, как выражается посредством уравнения 18. Т.е. как выражается посредством уравнения 18, секция 383 применения логарифмического усиления вычисляет Sign_p(k)=1, когда знак извлеченной выборки - это "+" (когда S3'(k)≥0), и вычисляет Sign_p(k)=-1 в других случаях (когда знак извлеченной выборки - это "-" (когда Sign_p(k)≥0).

Секция 383 применения логарифмического усиления вычисляет декодированный спектр S5'(k) согласно уравнениям 19 и 20 для выборки, в которой значение флага SelectFlag(k) извлечения равняется 1, на основе оцененного спектра S3'(k), максимального значения MaxValue_p амплитуды и флага SelectFlag(k) извлечения, которые вводятся из секции 382 извлечения групп выборок, и на основе квантованного логарифмического усиления α2Q_p, которое вводится из секции 354 декодирования усиления, и знака Sign_p(k), который вычисляется согласно уравнению 18.

Т.е. секция 383 применения логарифмического усиления применяет логарифмическое усиление α2_p только к выборке, которая частично выбирается посредством секции 382 извлечения выборок (выборке флага извлечения SelectFlag (k=1)). Секция 383 применения логарифмического усиления выводит декодированный спектр S5'(k) в секцию 356 обработки ортогонального преобразования. В этом случае, низкочастотная часть (0≤k<FL) декодированного спектра S5'(k) состоит из декодированного спектра S1(k) первого слоя, а высокочастотная часть (FL≤k<FH) декодированного спектра S5'(k) состоит из спектра, полученного посредством выполнения энергетического регулирования в логарифмической области для оцененного спектра S3'(k). Тем не менее, для выборки, которая не выбирается посредством секции 382 извлечения выборок (выборки флага SelectFlag(k) извлечения=0) в высокочастотной части (FL≤k<FH) декодированного спектра S5'(k), значение этой выборки задается как значение оцененного спектра S3'(k).

Процесс секции 396 регулирования спектра поясняется выше.

Процесс устройства 113 декодирования согласно настоящему варианту осуществления является таким, как пояснено выше.

Как пояснено выше, согласно настоящему варианту осуществления, при кодировании/декодировании для оценки спектра высокочастотной части посредством выполнения расширения полосы частот при помощи спектра низкочастотной части, спектр высокочастотной части оценивается при помощи декодированного низкочастотного спектра, и после этого выборка выбирается (прореживается) в каждой подполосе частот оцененного спектра, и регулировка усиления в логарифмической области выполняется только для выбранной выборки. В отличие от варианта 1 осуществления, устройство кодирования и устройство декодирования вычисляют параметр регулировки усиления (логарифмическое усиление) без учета расстояния от максимального значения амплитуды, и устройство декодирования учитывает расстояние от максимального значения амплитуды в подполосе частот только тогда, когда применяется параметр регулировки усиления (логарифмическое усиление). На основе этой конфигурации, объем арифметических операций может уменьшаться в большей степени, чем объем арифметических операций в варианте 1 осуществления.

Как поясняется в настоящем варианте осуществления, посредством экспериментов подтверждается то, что нет ухудшения качества звука, даже когда устройство кодирования вычисляет параметр регулировки усиления только из выборки с четным индексом, и когда устройство декодирования учитывает расстояние от выборки, имеющей максимальное значение амплитуды в подполосе частот, и применяет параметр регулировки усиления для извлеченной выборки. Т.е. можно сказать, что нет проблем, даже когда группа выборок, которая должна использоваться для вычисления параметра регулировки усиления, не обязательно совпадает с группой выборок, которая должна использоваться для применения параметра регулировки усиления. Это указывает, как поясняется в настоящем варианте осуществления, например, что устройство кодирования и устройство декодирования могут эффективно вычислять параметр регулировки усиления, даже когда все выборки не извлекаются посредством равномерного извлечения выборок во всех подполосах частот. Это также указывает, что устройство декодирования может эффективно сокращать объем арифметических операций посредством применения полученного параметра регулировки усиления только для выборок, извлеченных посредством учета расстояния от выборки, имеющей максимальное значение амплитуды в подполосе частот. Согласно настоящему варианту осуществления, объем арифметических операций уменьшается в большей степени, чем объем арифметических операций в варианте 1 осуществления, без ухудшения качества звука, посредством использования этой конфигурации.

В настоящем варианте осуществления, в качестве примера поясняется то, что процесс кодирования/декодирования низкочастотного компонента входного сигнала и процесс кодирования/декодирования высокочастотного компонента входного сигнала выполняются отдельно, т.е. процесс кодирования/декодирования выполняется в многослойной структуре из двух слоев. Тем не менее, вариант применения настоящего изобретения не ограничен этим, и изобретение также может подобно применяться к случаю выполнения кодирования/декодирования в многослойной структуре из трех или более слоев. Когда многослойный секция кодирования из трех или более слоев рассматривается, в секции декодирования второго слоя, которая формирует локальный декодированный сигнал секции декодирования второго слоя, группа выборок, к которой применяется параметр регулировки усиления (логарифмическое усиление), может быть группой выборок, которая не учитывает расстояние от выборки, имеющей максимальное значение амплитуды, которое вычисляется в устройстве кодирования согласно настоящему варианту осуществления, или может быть группой выборок, которая учитывает расстояние от выборки, имеющей максимальное значение амплитуды, которое вычисляется в устройстве декодирования согласно настоящему варианту осуществления.

В настоящем варианте осуществления, при задании флага извлечения, значение флага извлечения задается равным 1 только тогда, когда индекс выборки является четным числом. Тем не менее, вариант применения настоящего изобретения не ограничен этим, и изобретение также может подобно применяться, например, к случаю, когда остаток для индекса 3 равен 0.

Каждый вариант осуществления настоящего изобретения поясняется выше.

В вышеописанных вариантах осуществления, в качестве примера поясняется то, что число J подполос частот, полученных посредством разделения высокочастотной части входного спектра S2(k) в секции 265 кодирования усиления (или секции 235 кодирования усиления), отличается от числа F подполос частот, полученных посредством разделения высокочастотной части входного спектра S2(k) в секции 263 поиска. Тем не менее, задание не ограничено этим способом в настоящем изобретении, и число подполос частот, полученных посредством разделения высокочастотной части входного спектра S2(k) в секции 265 кодирования усиления (или секции 235 кодирования усиления), может задаваться равным P.

В вышеописанных вариантах осуществления, поясняется конфигурация, которая оценивает высокочастотную часть входного спектра при помощи низкочастотной части декодированного спектра первого слоя, полученного из секции декодирования первого слоя. Тем не менее, конфигурация не ограничена этим в настоящем изобретении, и изобретение также может подобно применяться к конфигурации, которая оценивает высокочастотную часть входного спектра при помощи низкочастотной части входного спектра вместо декодированного спектра первого слоя. В этой конфигурации, устройство кодирования вычисляет кодированную информацию (кодированную информацию второго слоя) для формирования высокочастотного компонента входного спектра из низкочастотного компонента входного спектра, и устройство декодирования применяет эту кодированную информацию к декодированному спектру первого слоя и формирует высокочастотный компонент декодированного спектра.

В вышеописанных вариантах осуществления, в качестве примера поясняется процесс, который уменьшает объем арифметических операций и повышает качество звука в конфигурации, которая вычисляет и применяет параметр для регулирования энергетического отношения в логарифмической области, на основе процесса в патентном документе 1. Тем не менее, вариант применения настоящего изобретения не ограничен этим, и изобретение может подобно применяться к конфигурации, которая регулирует энергетическое отношение в преобразовании в нелинейной области, отличном от логарифмического преобразования. Изобретение также может применяться к преобразованию в линейной области, а также преобразованию в нелинейной области.

В вышеописанных вариантах осуществления, в качестве примера поясняется процесс, который уменьшает объем арифметических операций и повышает качество звука в конфигурации, которая вычисляет и применяет параметр для регулирования энергетического отношения в логарифмической области в процессе расширения полосы частот, на основе процесса в патентном документе 1. Тем не менее, вариант применения настоящего изобретения не ограничен этим, и изобретение также может подобно применяться к процессу, отличному от процесса расширения полосы частот.

Устройство кодирования, устройство декодирования и способ для них не ограничены вышеописанными вариантами осуществления, и различные модификации также могут быть реализованы. Например, эти варианты осуществления могут быть надлежащим образом комбинированы для реализации.

В вышеописанных вариантах осуществления, в качестве примера поясняется то, что устройство декодирования выполняет процесс при помощи кодированной информации, передаваемой из устройства кодирования в каждом варианте осуществления. Тем не менее, процесс не ограничен вышеуказанным в настоящем изобретении, и устройство декодирования также может выполнять процесс при помощи кодированной информации, которая содержит необходимые параметры и данные, не обязательно посредством использования кодированной информации из устройства кодирования в вышеописанных вариантах осуществления.

В вышеописанных вариантах осуществления, хотя речевой сигнал поясняется как надлежащий для кодирования, музыкальный сигнал также может быть кодирован, и акустический сигнал, который содержит оба из этих сигналов, также может быть кодирован.

Настоящее изобретение также может применяться к случаю регистрации и записи программы обработки сигналов на механически считываемый носитель записи, к примеру, запоминающее устройство, диск, ленту, CD и DVD, и выполнения операций, и также может получать операции и эффекты, подобные операциям и эффектам в настоящих вариантах осуществления.

Также, хотя в вышеприведенном варианте осуществления в качестве примеров описаны случаи, когда настоящее изобретение выполнено посредством аппаратных средств, настоящее изобретение также может быть реализовано посредством программного обеспечения.

Каждый функциональный блок, используемый в пояснении каждого из вышеприведенных вариантов осуществления, типично может быть реализован как LSI, состоящая из интегральной схемы. Это могут быть отдельные микросхемы либо они могут частично или полностью содержаться на одной микросхеме. В данном документе употребляется термин LSI, но она также может упоминаться как IC, "системная LSI", "супер-LSI" или "ультра-LSI" в зависимости от отличающейся степени интеграции.

Более того, способ интеграции микросхем не ограничен LSI, и реализация с помощью специализированных схем или процессора общего назначения также возможна. После изготовления LSI, использование программируемой FPGA (программируемой пользователем вентильной матрицы) или реконфигурируемого процессора, где соединения или разъемы ячеек схемы в рамках LSI могут быть переконфигурированы, также возможно.

Кроме того, если появится технология интегральных микросхем, чтобы заменять LSI, в результате усовершенствования полупроводниковой технологии или другой производной технологии, разумеется, также можно выполнять интеграцию функциональных блоков с помощью этой технологии.

Раскрытия сущности заявки на патент (Япония) номер 2009-044676, поданной 26 февраля 2009 года, заявки на патент (Япония) номер 2009-089656, поданной 2 апреля 2009 года, и заявки на патент (Япония) номер 2010-001654, поданной 7 января 2010 года, в этом числе подробное описание, чертежи и реферат, полностью содержатся в данном документе по ссылке.

Промышленная применимость

Устройство кодирования, устройство декодирования и способ для них согласно настоящему изобретению могут повышать качество декодированного сигнала при оценке спектра высокочастотной части посредством выполнения расширения полосы частот при помощи спектра низкочастотной части и могут применяться, например, к системе связи с коммутацией пакетов и системе мобильной связи.

Список номеров ссылок

101 - устройство кодирования

102 - канал передачи

103 - устройство декодирования

201 - секция обработки понижающей дискретизации

202 - секция кодирования первого слоя

132, 203 - секции декодирования первого слоя

133, 204 - секции обработки повышающей дискретизации

134, 205, 356 - секции обработки ортогонального преобразования

206, 226 - секции кодирования второго слоя

207 - секция мультиплексирования кодированной информации

260 - секция разделения полосы частот

261, 352 - секции задания состояний фильтра

262, 353 - секции фильтрации

263 - секция поиска

264 - секция задания коэффициентов основного тона

235, 265 - секции кодирования усиления

266 - секция мультиплексирования

241, 271 - секции кодирования идеального усиления

242, 272 - секция кодирования логарифмического усиления

253, 281, 371, 381 - секция поиска максимальных значений амплитуды

251, 282, 372, 382 - секции извлечения групп выборок

252, 283 - секции вычисления логарифмического усиления

131 - секция демультиплексирования кодированной информации

135 - секция декодирования второго слоя

351 - секция демультиплексирования

354 - секция декодирования усиления

355 - секция регулирования спектра

361 - секция декодирования идеального усиления

362 - секция декодирования логарифмического усиления

373, 383 - секции применения логарифмического усиления.

Иллюстрации к изобретению RU 2 538 334 C2

Реферат патента 2015 года КОДЕР, ДЕКОДЕР И СПОСОБ ДЛЯ НИХ

Группа изобретений относится к средствам кодирования и декодирования сигнала. Технический результат заключается в повышении эффективности кодирования спектральных данных высокочастотной части и повышении качества декодированного сигнала. Кодер содержит секцию кодирования первого слоя, которая кодирует входной сигнал в низкочастотном диапазоне ниже предварительно определенной частоты. Формируют первую кодированную информацию. Декодируют первую кодированную информацию, чтобы формировать декодированный сигнал. Разбивают входной сигнал в высокочастотном диапазоне выше предварительно определенной частоты на множество подполос частот. Частично выбирают компонент спектра в каждой подполосе частот. Вычисляют параметр регулирования амплитуды, используемый для того, чтобы регулировать амплитуду выбранного компонента спектра, чтобы тем самым формировать вторую информацию кодирования. 8 н. и 6 з.п. ф-лы, 15 ил.

Формула изобретения RU 2 538 334 C2

1. Устройство кодирования, содержащее:
первую секцию кодирования, которая формирует первую кодированную информацию посредством кодирования более низкочастотной части входного сигнала, равной или меньшей предварительно определенной частоты;
секцию декодирования, которая формирует декодированный сигнал посредством декодирования первой кодированной информации;
секцию разделения, которая разделяет высокочастотную часть входного сигнала, превышающую предварительно определенную частоту, на Р (Р является целым числом, превышающим 1) подполос частот, и выводит соответствующие начальные позиции и полосы пропускания Р подполос частот в качестве информации разделения полосы частот; и
вторую секцию кодирования, которая формирует вторую кодированную информацию посредством оценки спектров множества подполос частот, соответственно, из степени подобия между спектром входного сигнала и спектром, полученным путем фильтрации декодированного сигнала, основываясь на информации разделения полосы частот, частичного выбора компонента спектра в каждой из подполос частот, основываясь на весовом коэффициенте, который предоставляет возможность простого выбора компонента спектра, который ближе к компоненту спектра, имеющему максимальное значение амплитуды в каждой подполосе частот, и вычисления параметра регулирования амплитуды для регулирования амплитуды для выбранного компонента спектра.

2. Устройство кодирования по п.1, в котором вторая секция кодирования содержит:
секцию фильтрации, которая фильтрует декодированный сигнал и формирует Р р-тых (р=1, 2, …, Р) оцененных сигналов от первого оцененного сигнала до Р-того оцененного сигнала;
секцию задания, которая задает коэффициенты основного тона, которые должны использоваться посредством секции фильтрации, посредством изменения коэффициентов основного тона;
секцию поиска, которая выполняет поиск коэффициента основного тона, который формирует наивысшую степень подобия между р-тым оцененным сигналом и р-этой подполосой частот из коэффициентов основного тона, в качестве р-того оптимального коэффициента основного тона; и
секцию мультиплексирования, которая получает вторую кодированную информацию посредством мультиплексирования Р оптимальных коэффициентов основного тона от первого оптимального коэффициента основного тона до р-того оптимального коэффициента основного тона с информацией разделения полосы частот, и
секцию задания, которая задает коэффициенты основного тона, которые должны использоваться посредством секции фильтрации, чтобы оценивать первую подполосу частот, посредством изменения коэффициента основного тона в предварительно определенном диапазоне и задает коэффициенты основного тона, которые должны использоваться посредством секции фильтрации, чтобы оценивать m-тую (m=2, 3, …, Р) подполосу частот в и после второй подполосы частот, посредством изменения коэффициента основного тона в диапазоне, соответствующем (m-1)-вому оптимальному коэффициенту основного тона, или в предварительно определенном диапазоне.

3. Устройство кодирования по п.1, в котором вторая секция кодирования содержит:
секцию поиска подобных частей, которая выполняет поиск полосы частот, которая является наиболее подобной спектру каждой из множества подполос частот, и первого параметра регулирования амплитуды из входного сигнала или спектр декодированного сигнала;
секцию поиска значений амплитуды, которая выполняет поиск, для каждой из подполос частот, компонента спектра, имеющего максимальное или минимальное значение амплитуды для спектра высокой частоты, который оценивается посредством наиболее подобной полосы частот и первого параметра регулирования амплитуды;
секцию выбора компонентов спектра, которая частично выбирает компонент спектра на основе весового коэффициента, который предоставляет возможность простого выбора компонента спектра, который ближе к компоненту спектра, имеющему максимальное или минимальное значение амплитуды; и
секцию вычисления параметра регулирования амплитуды, которая вычисляет второй параметр регулирования амплитуды для частично выбранного компонента спектра.

4. Устройство кодирования по п.1, в котором вторая секция кодирования содержит:
секцию поиска подобных частей, которая выполняет поиск полосы частот, которая является наиболее подобной спектру каждой из множества подполос частот, и первого параметра регулирования амплитуды из входного сигнала или спектр декодированного сигнала;
секцию выбора компонентов спектра, которая частично выбирает компонент спектра для спектра высокой частоты, который оценивается посредством наиболее подобной полосы частот и первого параметра регулирования амплитуды; и
секцию вычисления параметра регулирования амплитуды, которая вычисляет второй параметр регулирования амплитуды для частично выбранного компонента спектра.

5. Устройство кодирования по п.3, в котором секция выбора компонентов спектра выбирает компонент спектра более широкого диапазона для подполосы частот на более высокой частоте из множества подполос частот, в качестве компонента спектра, который находится близко к компоненту спектра, имеющему максимальное или минимальное значение амплитуды.

6. Устройство терминала связи, содержащее устройство кодирования по п.1.

7. Устройство базовой станции, содержащее устройство кодирования по п.1.

8. Устройство декодирования, содержащее:
приемную секцию, которая принимает первую кодированную информацию, полученную посредством кодирования более низкочастотной части входного сигнала, равной или меньшей предварительно определенной частоты, сформированной посредством устройства кодирования, и вторую кодированную информацию, сформированную посредством разделения высокочастотной части входного сигнала, превышающей предварительно определенную частоту, на Р (Р является целым числом, превышающим 1) подполос частот, соответствующие начальные позиции и полосы пропускания Р подполос частот являются информацией разделения полосы частот, оценки спектров множества подполос частот, соответственно, из степени подобия между спектром входного сигнала и спектром, полученным путем фильтрации первого декодированного сигнала, полученного посредством декодирования первой кодированной информации, основываясь на информации разделения полосы частот, частичного выбора компонента спектра в каждой из подполос частот, основываясь на весовом коэффициенте, который предоставляет возможность простого выбора компонента спектра, который ближе к компоненту спектра, имеющему максимальное значение амплитуды в каждой подполосе частот, и вычисления параметра регулирования амплитуды для регулирования амплитуды для выбранного компонента спектра;
первую секцию декодирования, которая формирует второй декодированный сигнал посредством декодирования первой кодированной информации; и
вторую секцию декодирования, которая формирует третий декодированный сигнал, содержащий высокочастотную часть входного сигнала из спектра, полученного путем выполнения обработки ортогонального преобразования второго декодированного сигнала, используя вторую кодированную информацию.

9. Устройство декодирования по п.8, в котором вторая секция декодирования содержит:
секцию поиска значений амплитуды, которая выполняет поиск, для каждой из подполос частот, компонента спектра, имеющего максимальное или минимальное значение амплитуды, для полосы частот, которая является наиболее подобной соответствующим спектрам множества подполос частот, вычисляемых из спектра второго декодированного сигнала, и для спектра высокой частоты, который оценивается посредством первого параметра регулирования амплитуды, содержащегося во второй кодированной информации;
секцию выбора компонентов спектра, которая частично выбирает компонент спектра на основе весового коэффициента, который предоставляет возможность простого выбора компонента спектра, который ближе к компоненту спектра, имеющему максимальное или минимальное значение амплитуды; и
секцию применения параметров регулирования амплитуды, которая применяет второй параметр регулирования амплитуды для частично выбранного компонента спектра.

10. Устройство декодирования по п.9, в котором секция поиска значений амплитуды выполняет поиск, для каждой из подполос частот, компонента спектра, имеющего максимальное или минимальное значение амплитуды, для части компонента спектра из спектра высокой частоты, который оценивается.

11. Устройство терминала связи, содержащее устройство декодирования по п.8.

12. Устройство базовой станции, содержащее устройство декодирования по п.8.

13. Способ кодирования, содержащий:
первый этап, на котором формируют первую кодированную информацию посредством кодирования более низкочастотной части входного сигнала, равной или меньшей предварительно определенной частоты;
этап, на котором формируют декодированный сигнал посредством декодирования первой кодированной информации;
этап, на котором разделяют высокочастотную часть входного сигнала, превышающую предварительно определенную частоту, на Р (Р является целым числом, превышающим 1) подполос частот, и выводят соответствующие начальные позиции и полосы пропускания Р подполос частот в качестве информации разделения полосы частот; и
этап, на котором формируют вторую кодированную информацию посредством оценки спектров множества подполос частот, соответственно, из степени подобия между спектром входного сигнала и спектром, полученным путем фильтрации декодированного сигнала, основываясь на информации разделения полосы частот, частичного выбора компонента спектра в каждой из подполос частот, основываясь на весовом коэффициенте, который предоставляет возможность простого выбора компонента спектра, который ближе к компоненту спектра, имеющему максимальное значение амплитуды в каждой подполосе частот, и вычисления параметра регулирования амплитуды для регулирования амплитуды для выбранного компонента спектра.

14. Способ декодирования, содержащий:
этап, на котором принимают первую кодированную информацию, полученную посредством кодирования более низкочастотной части входного сигнала, равной или меньшей предварительно определенной частоты, сформированной посредством устройства кодирования, и второй кодированной информации, сформированной посредством разделения высокочастотной части входного сигнала, превышающей предварительно определенную частоту, на Р (Р является целым числом, превышающим 1) подполос частот, соответствующие начальные позиции и полосы пропускания Р подполос частот являются информацией разделения полосы частот, оценки спектров множества подполос частот, соответственно, из степени подобия между спектром входного сигнала и спектром, полученным путем фильтрации первого декодированного сигнала, полученного посредством декодирования первой кодированной информации, основываясь на информации разделения полосы частот, частичного выбора компонента спектра в каждой из подполос частот, основываясь на весовом коэффициенте, который предоставляет возможность простого выбора компонента спектра, который ближе к компоненту спектра, имеющему максимальное значение амплитуды в каждой подполосе частот, и вычисления параметра регулирования амплитуды для регулирования амплитуды для выбранного компонента спектра;
этап, на котором формируют второй декодированный сигнал посредством декодирования первой кодированной информации; и
этап, на котором формируют третий декодированный сигнал, содержащий высокочастотную часть входного сигнала из спектра, полученного путем выполнения обработки ортогонального преобразования второго декодированного сигнала, используя вторую кодированную информацию.

Документы, цитированные в отчете о поиске Патент 2015 года RU2538334C2

Способ и приспособление для нагревания хлебопекарных камер

1923

Иссерлис И.Л.

SU2003A1

RU 2 538 334 C2

Авторы

Яманаси Томофуми

Осикири Масахиро

Ехара Хироюки

Даты

2015-01-10—Публикация

2010-02-25—Подача

название	год	авторы	номер документа
УСТРОЙСТВО СГЛАЖИВАНИЯ СПЕКТРА, УСТРОЙСТВО КОДИРОВАНИЯ, УСТРОЙСТВО ДЕКОДИРОВАНИЯ, УСТРОЙСТВО ТЕРМИНАЛА СВЯЗИ, УСТРОЙСТВО БАЗОВОЙ СТАНЦИИ И СПОСОБ СГЛАЖИВАНИЯ СПЕКТРА	2009	Яманаси Томофуми Осикири Масахиро Мории Тосиюки Ехара Хироюки	RU2510536C9
ПРОЦЕССОР ДЛЯ ФОРМИРОВАНИЯ СПЕКТРА ПРОГНОЗИРОВАНИЯ НА ОСНОВЕ ДОЛГОСРОЧНОГО ПРОГНОЗИРОВАНИЯ И/ИЛИ ГАРМОНИЧЕСКОЙ ПОСТФИЛЬТРАЦИИ	2022	Маркович, Горан Эдлер, Бернд Байер, Штефан Кине, Ян Фредерик	RU2826967C2
КОДИРОВАНИЕ И ДЕКОДИРОВАНИЕ ИМПУЛЬСНЫХ И ОСТАТОЧНЫХ ЧАСТЕЙ ЗВУКОВОГО СИГНАЛА	2022	Маркович, Горан	RU2825308C2
УСТРОЙСТВО КОДИРОВАНИЯ РЕЧИ-АУДИО, УСТРОЙСТВО ДЕКОДИРОВАНИЯ РЕЧИ-АУДИО, СПОСОБ КОДИРОВАНИЯ РЕЧИ-АУДИО И СПОСОБ ДЕКОДИРОВАНИЯ РЕЧИ-АУДИО	2013	Кавасима Такуя Осикири Масахиро	RU2678657C1
УСТРОЙСТВО КОДИРОВАНИЯ РЕЧИ-АУДИО, УСТРОЙСТВО ДЕКОДИРОВАНИЯ РЕЧИ-АУДИО, СПОСОБ КОДИРОВАНИЯ РЕЧИ-АУДИО И СПОСОБ ДЕКОДИРОВАНИЯ РЕЧИ-АУДИО	2019	Кавасима, Такуя Осикири, Масахиро	RU2701065C1
УСТРОЙСТВО КОДИРОВАНИЯ РЕЧИ-АУДИО, УСТРОЙСТВО ДЕКОДИРОВАНИЯ РЕЧИ-АУДИО, СПОСОБ КОДИРОВАНИЯ РЕЧИ-АУДИО И СПОСОБ ДЕКОДИРОВАНИЯ РЕЧИ-АУДИО	2013	Кавасима Такуя Осикири Масахиро	RU2648629C2
ИНТЕГРАЛЬНОЕ ПАРАМЕТРИЧЕСКОЕ АУДИОКОДИРОВАНИЕ ДЛЯ КАЖДОЙ ПОЛОСЫ ЧАСТОТ	2022	Маркович, Горан	RU2834366C2
МНОГОКАНАЛЬНЫЙ АУДИОКОДЕР БЕЗ ПОТЕРЬ	2005	Фейзо Зоран	RU2387023C2
УСТРОЙСТВО КОДИРОВАНИЯ АУДИОСИГНАЛА, УСТРОЙСТВО ДЕКОДИРОВАНИЯ АУДИОСИГНАЛА, СПОСОБ КОДИРОВАНИЯ АУДИОСИГНАЛА И СПОСОБ ДЕКОДИРОВАНИЯ АУДИОСИГНАЛА	2015	Кавасима Такуя Эхара Хироюки	RU2669706C2
УСТРОЙСТВО И СПОСОБ ДЛЯ РАСШИРЕНИЯ ДИАПАЗОНА ЧАСТОТ ДЛЯ АКУСТИЧЕСКИХ СИГНАЛОВ	2014	Нагисетти Срикантх Лю Цзунсянь	RU2688247C2