ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ
[0001] Настоящее раскрытие относится к устройству, которое кодирует речевой сигнал и аудиосигнал (в дальнейшем упоминаемые как речевой сигнал и подобное), и устройству, которое декодирует речевой сигнал и подобное.
УРОВЕНЬ ТЕХНИКИ
[0002] Технология кодирования речи, которая сжимает речевой сигнал и подобное с низким битрейтом, является важной технологией, которая реализует эффективное использование радиоволн и подобное в мобильной связи. В дополнение, ожидания в отношении телефонной речи более высокого качества возросли в последние годы, и требуется телефонная услуга с улучшенным реалистическим ощущением. Чтобы реализовать это, является достаточным, чтобы речевой сигнал и подобное, имеющий широкую частотную полосу, кодировался при высоком битрейте. Однако этот подход противоречит эффективному использованию радиоволн или частотных полос.
[0003] В качестве способа, который кодирует сигнал, имеющий широкую частотную полосу, с высоким качеством с низким битрейтом, существует способ, который уменьшает полный битрейт посредством разделения спектра входного сигнала на два спектра низкополосной части и высокополосной части, и посредством дублирования низкополосного спектра и транспонирования высокополосного спектра с дублированным низкополосным спектром, то есть, посредством подстановки низкополосного спектра вместо высокополосного спектра (PTL 1). В этом способе, кодирование выполняется посредством назначения уменьшенного количества бит посредством выполнения следующей обработки в качестве базовой обработки: кодирование низкополосного спектра с высоким качеством посредством назначения большого количества бит и дублирование кодированного низкополосного спектра как высокополосного спектра.
[0004] Если способ, раскрытый в PTL 1, используется без какой-либо модификации, сигнал, имеющий сильную пиковую характеристику, видимую в низкополосном спектре, дублируется как есть в высокую полосу. Таким образом, генерируется шум, который звучит как звенящий колокольчик, уменьшая субъективное качество. Соответственно, существует способ, который использует низкополосный спектр с соответствующим образом отрегулированным динамическим диапазоном, в качестве высокополосного спектра (PTL 2).
СПИСОК ССЫЛОЧНЫХ МАТЕРИАЛОВ
ПАТЕНТНАЯ ЛИТЕРАТУРА
[0005] PTL 1: Публикация японской не прошедшей экспертизу патентной заявки (перевод заявки PCT), номер 2001-521648
PTL 2: Международная публикация, номер 2005/111568
СУЩНОСТЬ ИЗОБРЕТЕНИЯ
[0006] В способе, раскрытом в PTL 2, динамический диапазон определяется посредством учета всех компонент, составляющих низкополосный спектр. Однако спектр речевого сигнала и подобного включает в себя компоненту, имеющую сильную пиковую характеристику, то есть компоненту, имеющую большую амплитуду (тональную компоненту), и компоненту, имеющую слабую пиковую характеристику, то есть компоненту, имеющую малую амплитуду (нетональную компоненту). Способ, раскрытый в PTL 2, осуществляет оценку посредством учета всех компонент, включающих в себя обе из вышеупомянутых компонент, и, поэтому, не всегда формирует наилучший результат.
[0007] Один вариант осуществления настоящего раскрытия обеспечивает устройство, которое обеспечивает возможность кодирования речевого сигнала и подобного с более высоким качеством посредством выделения и использования тональной компоненты и нетональной компоненты индивидуально для кодирования при уменьшении полного битрейта, и устройство, которое обеспечивает возможность декодирования речевого сигнала и подобного.
[0008] Кодер согласно настоящему раскрытию использует такую конфигурацию, которая включает в себя первый блок кодирования, который кодирует низкополосный сигнал, имеющий частоту более низкую, чем или равную предварительно определенной частоте, из речевого или аудио входного сигнала, чтобы генерировать первый кодированный сигнал, и декодирует первый кодированный сигнал, чтобы генерировать низкополосный декодированный сигнал; второй блок кодирования, который кодирует, на основе низкополосного декодированного сигнала, высокополосный сигнал, имеющий полосу, более высокую, чем полоса низкополосного сигнала, чтобы генерировать высокополосный кодированный сигнал; и первый блок мультиплексирования, который мультиплексирует первый кодированный сигнал и высокополосный кодированный сигнал, чтобы генерировать и выводить кодированный сигнал. Второй блок кодирования вычисляет отношение энергии между высокополосной компонентой шума, которая является компонентой шума высокополосного сигнала, и высокополосной нетональной компонентой высокополосного декодированного сигнала, сгенерированного из низкополосного декодированного сигнала, и выводит вычисленное отношение в качестве высокополосного кодированного сигнала.
[0009] Следует отметить, что общие или конкретные варианты осуществления могут осуществляться как система, способ, интегральная схема, компьютерная программа, запоминающий носитель, или любая выбранная комбинация перечисленного.
[0010] Является возможным кодировать и декодировать речевой сигнал и подобное с более высоким качеством посредством использования кодера и декодера в одном варианте осуществления настоящего раскрытия.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
[0011]
[Фиг. 1] Фиг. 1 иллюстрирует полную конфигурацию кодера согласно настоящему раскрытию.
[Фиг. 2] Фиг. 2 иллюстрирует конфигурацию блока кодирования второго уровня в кодере согласно первому варианту осуществления настоящего раскрытия.
[Фиг. 3] Фиг. 3 иллюстрирует конфигурацию блока кодирования второго уровня в кодере согласно второму варианту осуществления настоящего раскрытия.
[Фиг. 4] Фиг. 4 иллюстрирует полную конфигурацию другого кодера согласно варианту осуществления настоящего раскрытия.
[Фиг. 5] Фиг. 5 иллюстрирует полную конфигурацию декодера согласно настоящему раскрытию.
[Фиг. 6] Фиг. 6 иллюстрирует конфигурацию блока декодирования второго уровня в декодере согласно третьему варианту осуществления настоящего раскрытия.
[Фиг. 7] Фиг. 7 иллюстрирует конфигурацию блока декодирования второго уровня в декодере согласно четвертому варианту осуществления настоящего раскрытия.
[Фиг. 8] Фиг. 8 иллюстрирует полную конфигурацию другого декодера согласно варианту осуществления настоящего раскрытия.
[Фиг. 9] Фиг. 9 иллюстрирует полную конфигурацию другого кодера согласно варианту осуществления настоящего раскрытия.
[Фиг. 10] Фиг. 10 иллюстрирует полную конфигурацию другого декодера согласно варианту осуществления настоящего раскрытия.
ОПИСАНИЕ ВАРИАНТОВ ОСУЩЕСТВЛЕНИЯ
[0012] Конфигурации и операции в вариантах осуществления настоящего раскрытия будут описываться ниже со ссылкой на чертежи. Отметим, что входной сигнал, который вводится в кодер согласно настоящему раскрытию, и выходной сигнал, который выводится из декодера согласно настоящему раскрытию, включают в себя, в дополнение к случаю только речевых сигналов в узком смысле, случай аудиосигналов, имеющих более широкие полосы частот, и случай, когда эти сигналы сосуществуют.
[0013] (ПЕРВЫЙ ВАРИАНТ ОСУЩЕСТВЛЕНИЯ)
Фиг. 1 является блок-схемой, иллюстрирующей конфигурацию кодера для речевого сигнала и подобного согласно первому варианту осуществления. Будет описываться иллюстративный случай, в котором кодированный сигнал имеет многоуровневую конфигурацию, включающую в себя множество уровней; то есть, будет описываться случай выполнения иерархического кодирования (масштабируемого кодирования). Пример, который охватывает кодирование, другое, нежели масштабируемое кодирование, будет описываться ниже со ссылкой на фиг. 4. Кодер 100, проиллюстрированный на фиг. 1, включает в себя блок 101 дискретизации с понижением, блок 102 кодирования первого уровня, блок 103 мультиплексирования, блок 104 декодирования первого уровня, блок 105 задержки, и блок 106 кодирования второго уровня. В дополнение, антенна, которая не проиллюстрирована, соединена с блоком 103 мультиплексирования.
[0014] Блок 101 дискретизации с понижением генерирует сигнал, имеющий низкую частоту дискретизации, из входного сигнала и выводит сгенерированный сигнал в блок 102 кодирования первого уровня в качестве низкополосного сигнала, имеющего частоту более низкую, чем или равную предварительно определенной частоте.
[0015] Блок 102 кодирования первого уровня, который является одним вариантом осуществления компонента первого блока кодирования, кодирует низкополосный сигнал. Примеры кодирования включают в себя кодирование CELP (линейного предсказания с кодовым возбуждением) и кодирование с преобразованием. Кодированный низкополосный сигнал выводится в блок 104 декодирования первого уровня и блок 103 мультиплексирования в качестве низкополосного кодированного сигнала, который является первым кодированным сигналом.
[0016] Блок 104 декодирования первого уровня, который также является одним вариантом осуществления компонента первого блока кодирования, декодирует низкополосный кодированный сигнал, тем самым, генерируя низкополосный декодированный сигнал. Затем, блок 104 декодирования первого уровня выводит низкополосный декодированный сигнал S1 в блок кодирования второго уровня 106.
[0017] С другой стороны, блок 105 задержки осуществляет задержку входного сигнала на предварительно определенный период. Этот период задержки используется, чтобы корректировать временную задержку, сгенерированную в блоке 101 дискретизации с понижением, блоке 102 кодирования первого уровня, и блоке 104 декодирования первого уровня. Блок 105 задержки выводит подвергнутый задержке входной сигнал S2 в блок 106 кодирования второго уровня.
[0018] На основе низкополосного декодированного сигнала S1, сгенерированного посредством блока 104 декодирования первого уровня, блок 106 кодирования второго уровня, который является одним вариантом осуществления второго блока кодирования, кодирует высокополосный сигнал, имеющий частоту, более высокую, чем или равную предварительно определенной частоте, из входного сигнала S2, тем самым, генерируя высокополосный кодированный сигнал. Низкополосный декодированный сигнал S1 и входной сигнал S2 вводятся в блок кодирования второго уровня после того, как подвергаются частотному преобразованию, такому как MDCT (модифицированное дискретное косинусное преобразование). Затем, блок 106 кодирования второго уровня выводит высокополосный кодированный сигнал в блок 103 мультиплексирования. Подробности блока 106 кодирования второго уровня будут описываться ниже.
[0019] Блок 103 мультиплексирования мультиплексирует низкополосный кодированный сигнал и высокополосный кодированный сигнал, тем самым, генерируя кодированный сигнал, и передает кодированный сигнал в декодер посредством антенны, которая не проиллюстрирована.
[0020] Фиг. 2 является блок-схемой, иллюстрирующей конфигурацию блока 106 кодирования второго уровня в этом варианте осуществления. Блок 106 кодирования второго уровня включает в себя блок 201 добавления шума, блок 202 выделения, блок 203 расширения полосы частот, блок 204 вычисления энергии компоненты шума (первый блок вычисления), блок 205 вычисления усиления (второй блок вычисления), блок 206 вычисления энергии, блок 207 мультиплексирования, и блок 208 расширения полосы частот.
[0021] Блок 201 добавления шума добавляет сигнал шума к низкополосному декодированному сигналу S1, который был введен из блока 104 декодирования первого уровня. Отметим, что признак "сигнал шума" указывает на сигнал, имеющий случайные характеристики, и является, например, сигналом, имеющим амплитуду интенсивности сигнала, которая флуктуирует нерегулярно по отношению к временной оси или частотной оси. Сигнал шума может генерироваться, как необходимо, на основе случайных чисел. Альтернативно, сигнал шума (например, белый шум, гауссовский шум, или розовый шум), который генерируется заранее, может храниться в устройстве хранения, таком как память, и может вызываться и выводиться. В дополнение, сигнал шума не ограничен одиночным сигналом, и один из множества сигналов шума может выбираться и выводиться в соответствии с предварительно определенными условиями.
[0022] Чтобы кодировать входной сигнал, если количество бит, которое может быть назначено, является малым, только некоторые из частотных компонент могут квантоваться, что дает результатом ухудшение в субъективном качестве. Однако посредством добавления шума посредством использования блока 201 добавления шума, сигналы шума компенсируют компоненты, которые были бы нулевыми в силу того, что не подвергаются квантованию, и, таким образом, может ожидаться эффект ослабления ухудшения.
[0023] Отметим, что блок 201 добавления шума имеет произвольную конфигурацию. Затем, блок 201 добавления шума выводит, в блок 202 выделения, низкополосный декодированный сигнал, к которому был добавлен сигнал шума.
[0024] Из низкополосного декодированного сигнала, к которому был добавлен сигнал шума, блок 202 выделения выделяет низкополосный нетональный сигнал, который является нетональной компонентой, и низкополосный тональный сигнал, который является тональной компонентой. Здесь, признак "тональная компонента" указывает на компоненту, имеющую амплитуду, большую, чем предварительно определенный порог, или компоненту, которая была квантована посредством модуля импульсного квантования. В дополнение, признак "нетональная компонента" указывает на компоненту, имеющую амплитуду, меньшую, чем или равную предварительно определенному порогу, или компоненту, которая стала нулевой в силу того, что не подвергается квантованию посредством модуля импульсного квантования.
[0025] В случае различения тональной компоненты и нетональной компоненты друг от друга посредством использования предварительно определенного порога, выполняется выделение в зависимости от того, является ли или нет амплитуда компоненты низкополосного декодированного сигнала более большой, чем предварительно определенный порог. В случае различения тональной компоненты и нетональной компоненты друг от друга в зависимости от того, была ли или нет компонента квантована посредством модуля импульсного квантования, так как этот случай соответствует случаю, когда пороговое значение является нулевым, низкополосный тональный сигнал может генерироваться посредством вычитания низкополосного декодированного сигнала S1 из низкополосного декодированного сигнала, к которому был добавлен шум посредством блока 201 добавления шума.
[0026] Затем, блок 202 выделения выводит низкополосный нетональный сигнал в блок 203 расширения полосы частот и выводит низкополосный тональный сигнал в блок 208 расширения полосы частот.
[0027] Блок 208 расширения полосы частот осуществляет поиск конкретной полосы низкополосного тонального сигнала, в которой корреляция между высокополосным сигналом из входного сигнала S2 и низкополосным тональным сигналом, сгенерированным для расширения полосы частот, становится максимальной. Поиск может выполняться посредством выбора кандидата, в котором корреляция становится максимальной, из числа конкретных положений кандидатов, которые были подготовлены заранее. Как низкополосный тональный сигнал, сгенерированный для расширения полосы частот, низкополосный тональный сигнал, который был выделен (квантован) посредством блока 202 выделения, может использоваться без какой-либо обработки, или может использоваться сглаженный или нормализованный тональный сигнал.
[0028] Затем, блок 208 расширения полосы частот выводит, в блок 207 мультиплексирования и блок 203 расширения полосы частот, информацию, которая определяет положение найденной конкретной полосы, другими словами, информацию запаздывания, которая определяет положение (частоту) низкополосного спектра, используемого, чтобы генерировать расширенные полосы частот. Отметим, что информация запаздывания не должна включать в себя всю информацию, соответствующую всем расширенным полосам частот, и может передаваться только некоторая информация, соответствующая некоторым из расширенных полос частот. Например, информация запаздывания может кодироваться для некоторых подполос, подлежащих генерированию посредством расширения полосы частот; и кодирование может не выполняться для оставшейся части подполос, и подполосы могут генерироваться посредством наложения спектра, сгенерированного посредством использования информации запаздывания, на стороне декодера.
[0029] Блок 208 расширения полосы частот выбирает компоненту, имеющую большую амплитуду, из высокополосного сигнала из входного сигнала S2 и вычисляет корреляцию посредством использования только выбранной компоненты, тем самым, уменьшая объем вычислений для вычисления корреляции, и выводит, в блок 204 вычисления энергии компоненты шума (первый блок вычисления), информацию положения частоты выбранной компоненты в качестве информации положения частоты высокополосной тональной компоненты.
[0030] На основе положения конкретной полосы, определенной посредством информации запаздывания, блок 203 расширения полосы частот извлекает низкополосный нетональный сигнал, устанавливает низкополосный нетональный сигнал в качестве высокополосного нетонального сигнала, и выводит высокополосный нетональный сигнал в блок 205 вычисления усиления.
[0031] Посредством использования информации положения частоты высокополосной тональной компоненты, блок 204 вычисления энергии компоненты шума вычисляет энергию высокополосной компоненты шума, которая является компонентой шума высокополосного сигнала, из входного сигнала S2, и выводит энергию в блок 205 вычисления усиления. Конкретно, посредством вычитания энергии компоненты в положении частоты высокополосной тональной компоненты в высокополосной части из энергии компонент во всей высокополосной части входного сигнала S2, получается энергия компонент, других, нежели высокополосная тональная компонента, и эта энергия выводится в блок 205 вычисления усиления в качестве энергии высокополосной компоненты шума.
[0032] Блок 205 вычисления усиления вычисляет энергию высокополосного нетонального сигнала, выведенного из блока 203 расширения полосы частот, вычисляет отношение между этой энергией и энергией высокополосной компоненты шума, выведенной из блока 204 вычисления энергии компоненты шума, и выводит это отношение в блок 207 мультиплексирования в качестве коэффициента масштабирования.
[0033] Блок 206 вычисления энергии вычисляет энергию входного сигнала S2 для каждой подполосы. Например, энергия может вычисляться из суммы квадратов спектров в подполосах, полученных посредством разделения входного сигнала S2 на подполосы. Например, энергия может определяться посредством следующего выражения.
[0034]
[Математическое выражение 1]
[0035] В выражении, X является коэффициентом MDCT, b является номером подполосы, и Epsilon является постоянной для скалярного квантования.
[0036] Затем, блок 206 вычисления энергии выводит индекс, представляющий степень полученной квантованной энергии полосы, в блок 207 мультиплексирования в качестве квантованной энергии полосы.
[0037] Блок 207 мультиплексирования кодирует и мультиплексирует информацию запаздывания, коэффициент масштабирования, и квантованную энергию полосы. Затем, сигнал, полученный посредством мультиплексирования, выводится в качестве высокополосного кодированного сигнала. Отметим, что блок 207 мультиплексирования и блок 103 мультиплексирования могут обеспечиваться отдельно или объединено.
[0038] В вышеизложенном способе, в этом варианте осуществления, блок 205 вычисления усиления (второй блок вычисления) вычисляет отношение между энергией высокополосной нетональной компоненты (шума) высокополосного сигнала из входного сигнала и энергией высокополосного нетонального сигнала (шума) из высокополосного декодированного сигнала, сгенерированного из низкополосного декодированного сигнала. Соответственно, этот вариант осуществления формирует эффект обеспечения возможности более точного воспроизведения энергии нетональной компоненты (шума) декодированного сигнала.
[0039] То есть, является возможным более точно воспроизводить энергию нетональной компоненты, которая является более малой, чем энергия тональной компоненты и имеет тенденцию содержать ошибки, и энергия нетональной компоненты декодированного сигнала стабилизируется. В дополнение, также является возможным более точно воспроизводить энергию тональной компоненты, вычисленную посредством использования энергии полосы и энергии нетональной компоненты. Дополнительно, является возможным выполнять кодирование посредством использования малого количества бит, чтобы генерировать высокополосный кодированный сигнал.
[0040] (ВТОРОЙ ВАРИАНТ ОСУЩЕСТВЛЕНИЯ)
Далее, конфигурация кодера согласно второму варианту осуществления настоящего раскрытия будет описываться со ссылкой на фиг. 3. Отметим, что полная конфигурация кодера 100 согласно этому варианту осуществления имеет конфигурацию, проиллюстрированную на фиг. 1, как в первом варианте осуществления.
[0041] Фиг. 3 является блок-схемой, иллюстрирующей конфигурацию блока 106 кодирования второго уровня в этом варианте осуществления, отличающегося от блока 106 кодирования второго уровня в первом варианте осуществления в том, что отношение положения блока добавления шума и блока выделения обращено и что содержатся блок 302 выделения и блок 301 добавления шума.
[0042] Из низкополосного декодированного сигнала, блок 302 выделения выделяет низкополосный нетональный сигнал, который является нетональной компонентой, и низкополосный тональный сигнал, который является тональной компонентой. Способ выделения, используемый является таким же как способ в описании первого варианта осуществления, и выделение выполняется согласно степени амплитуды на основе предварительно определенного порога. Порог может устанавливаться на нуль.
[0043] Блок 301 добавления шума добавляет сигнал шума к низкополосному нетональному сигналу, выведенному из блока 302 выделения. Чтобы не добавлять сигнал шума к компоненте, которая уже имеет некоторую амплитуду, может осуществляться ссылка на низкополосный декодированный сигнал S1.
[0044] Отметим, что примеры использования масштабируемого кодирования описываются в первом и втором вариантах осуществления. Однако первый и второй варианты осуществления могут применяться к случаям, когда используется кодирование, другое, нежели масштабируемое кодирование. Фиг. 4 и 9 являются примерами других кодеров, кодеров 110 и 610, соответственно. Сначала, будет описываться кодер 110, проиллюстрированный на фиг. 4.
[0045] Кодер 110, проиллюстрированный на фиг. 4, включает в себя блок 111 время-частотного преобразования, первый блок 112 кодирования, блок 113 мультиплексирования, блок 114 нормализации энергии полосы, и второй блок 115 кодирования.
[0046] Блок 111 время-частотного преобразования выполняет частотное преобразование над входным сигналом посредством MDCT или подобного.
[0047] Для каждой предварительно определенной полосы, блок 114 нормализации энергии полосы вычисляет, квантует, и кодирует энергию полосы входного спектра, которая является входным сигналом, подвергнутым частотному преобразованию, и выводит результирующий кодированный сигнал энергии полосы в блок 113 мультиплексирования. В дополнение, блок 114 нормализации энергии полосы вычисляет информацию B1 и B2 назначения битов относительно битов, подлежащих назначению первому блоку кодирования и второму блоку кодирования, соответственно, посредством использования квантованной энергии полосы, и выводит информацию B1 и B2 назначения битов в первый блок 112 кодирования и второй блок 115 кодирования, соответственно. В дополнение, блок 114 нормализации энергии полосы дополнительно нормализует входной спектр в каждой полосе посредством использования квантованной энергии полосы, и выводит нормализованный входной спектр S2 в первый блок 112 кодирования и второй блок 115 кодирования.
[0048] Первый блок 112 кодирования выполняет первое кодирование над нормализованным входным спектром S2, включающим в себя низкополосный сигнал, имеющий частоту более низкую, чем или равную предварительно определенной частоте, на основе информации B1 назначения битов, которая была введена. Затем, первый блок 112 кодирования выводит, в блок 113 мультиплексирования, первый кодированный сигнал, сгенерированный как результат кодирования. В дополнение, первый блок 112 кодирования выводит, во второй блок 115 кодирования, низкополосный декодированный сигнал S1, полученный в обработке кодирования.
[0049] Второй блок 115 кодирования выполняет второе кодирование над частью нормализованного входного спектра S2, где первый блок 112 кодирования потерпел неудачу в кодировании. Второй блок 115 кодирования может иметь конфигурацию блока 106 кодирования второго уровня, описанного со ссылкой на фиг. 2 и 3.
[0050] Далее, будет описываться кодер 610, проиллюстрированный на фиг. 9. Кодер 610, проиллюстрированный на фиг. 9, включает в себя блок 611 время-частотного преобразования, первый блок 612 кодирования, блок 613 мультиплексирования, и второй блок 614 кодирования.
[0051] Блок 611 время-частотного преобразования выполняет частотное преобразование над входным сигналом посредством MDCT или подобного.
[0052] Для каждой предварительно определенной полосы, первый блок 612 кодирования вычисляет, квантует, и кодирует энергию полосы входного спектра, которая является входным сигналом, подвергнутым частотному преобразованию, и выводит результирующий кодированный сигнал энергии полосы в блок 613 мультиплексирования. В дополнение, первый блок 612 кодирования вычисляет информацию назначения битов, подлежащую назначению первому кодированному сигналу и второму кодированному сигналу, посредством использования квантованной энергии полосы, и выполняет, на основе информации назначения битов, первое кодирование над нормализованным входным спектром S2, включающим в себя низкополосный сигнал, имеющий частоту более низкую, чем или равную предварительно определенной частоте. Затем, первый блок 612 кодирования выводит первый кодированный сигнал в блок 613 мультиплексирования и выводит, во второй блок 614 кодирования, низкополосный декодированный сигнал, который является низкополосной компонентой декодированного сигнала первого кодированного сигнала. Первое кодирование здесь может выполняться над входным сигналом, который был нормализован посредством квантованной энергии полосы. В этом случае, декодированный сигнал первого кодированного сигнала соответствует сигналу, полученному посредством обратной нормализации посредством квантованной энергии полосы. В дополнение, первый блок 612 кодирования выводит информацию назначения битов, подлежащую назначению второму кодированному сигналу, и высокополосную квантованную энергию полосы во второй блок 614 кодирования.
[0053] Второй блок 614 кодирования выполняет второе кодирование над частью нормализованного входного спектра S2, где первый блок 612 кодирования потерпел неудачу в кодировании. Второй блок 614 кодирования может иметь конфигурацию блока 106 кодирования второго уровня, описанного со ссылкой на фиг. 2 и 3. Отметим, что, хотя не проиллюстрировано явно на фиг. 2 или 3, информация назначения битов вводится в блок 208 расширения полосы частот, который кодирует информацию запаздывания, и блок вычисления усиления, который кодирует коэффициент масштабирования. В дополнение, блок 206 вычисления энергии вычисляет и квантует энергию полосы посредством использования входного сигнала на фиг. 2 и 3, но является ненужным на фиг. 9, так как первый блок 612 кодирования выполняет эту обработку.
[0054] (ТРЕТИЙ ВАРИАНТ ОСУЩЕСТВЛЕНИЯ)
Фиг. 5 является блок-схемой, иллюстрирующей конфигурацию декодера речевого сигнала согласно третьему варианту осуществления. В качестве примера, в последующем описании, кодированный сигнал является сигналом, который имеет многоуровневую конфигурацию, включающую в себя множество уровней, и который передается от кодера, и декодер декодирует этот кодированный сигнал. Отметим, что пример, в котором кодированный сигнал не имеет многоуровневую конфигурацию, будет описываться со ссылкой на фиг. 8.
[0055] Декодер 400, проиллюстрированный на фиг. 5, включает в себя блок 401 выделения, блок 402 декодирования первого уровня, и блок 403 декодирования второго уровня. Антенна, которая не проиллюстрирована, соединена с блоком 401 выделения.
[0056] Из кодированного сигнала, введенного посредством антенны, которая не проиллюстрирована, блок 401 выделения выделяет низкополосный кодированный сигнал, который является первым кодированным сигналом, и высокополосный кодированный сигнал. Блок 401 выделения выводит низкополосный кодированный сигнал в блок 402 декодирования первого уровня и выводит высокополосный кодированный сигнал в блок 403 декодирования второго уровня.
[0057] Блок 402 декодирования первого уровня, который является одним вариантом осуществления первого блока декодирования, декодирует низкополосный кодированный сигнал, тем самым, генерируя низкополосный декодированный сигнал S1. Примеры декодирования посредством блока 402 декодирования первого уровня включают в себя декодирование CELP. Блок 402 декодирования первого уровня выводит низкополосный декодированный сигнал в блок 403 декодирования второго уровня.
[0058] Блок 403 декодирования второго уровня, который является одним вариантом осуществления второго блока декодирования, декодирует высокополосный кодированный сигнал, тем самым, генерируя широкополосный декодированный сигнал посредством использования низкополосного декодированного сигнала, и выводит широкополосный декодированный сигнал. Подробности блока 403 декодирования второго уровня будут описываться ниже.
[0059] Затем, низкополосный декодированный сигнал и/или широкополосный декодированный сигнал воспроизводятся посредством усилителя и громкоговорителя, которые не проиллюстрированы.
[0060] Фиг. 6 является блок-схемой, иллюстрирующей конфигурацию блока 403 декодирования второго уровня в этом варианте осуществления. Блок 403 декодирования второго уровня включает в себя блок 501 декодирования и выделения, блок 502 добавления шума, блок 503 выделения, блок 504 расширения полосы частот, блок 505 масштабирования, блок 506 соединения, блок 507 добавления, блок 508 расширения полосы частот, блок 509 соединения, блок 510 оценки энергии тонального сигнала, и блок 511 масштабирования.
[0061] Блок 501 декодирования и выделения декодирует высокополосный кодированный сигнал и выделяет квантованную энергию A полосы, коэффициент B масштабирования, и информацию C запаздывания. Отметим, что блок 401 выделения и блок 501 декодирования и выделения могут обеспечиваться отдельно или объединенно.
[0062] Блок 502 добавления шума добавляет сигнал шума к низкополосному декодированному сигналу S1, введенному из блока 402 декодирования первого уровня. Используемый сигнал шума является таким же, как сигнал шума, который добавляется посредством блока 201 добавления шума в кодере 100. Затем, блок 502 добавления шума выводит, в блок 503 выделения, низкополосный декодированный сигнал, к которому был добавлен сигнал шума.
[0063] Из низкополосного декодированного сигнала, к которому был добавлен сигнал шума, блок 503 выделения выделяет нетональную компоненту и тональную компоненту, и выводит нетональную компоненту и тональную компоненту в качестве низкополосного нетонального сигнала и низкополосного тонального сигнала, соответственно. Способ для выделения низкополосного нетонального сигнала и низкополосного тонального сигнала является таким же, как способ, описанный для блока 202 выделения в кодере 100.
[0064] Посредством использования информации C запаздывания, блок 504 расширения полосы частот копирует низкополосный нетональный сигнал, имеющий конкретную полосу, в высокую полосу, тем самым, генерируя высокополосный нетональный сигнал.
[0065] Блок 505 масштабирования умножает высокополосный нетональный сигнал, сгенерированный посредством блока 504 расширения полосы частот, на коэффициент B масштабирования, тем самым, регулируя амплитуду высокополосного нетонального сигнала.
[0066] Затем, блок 506 соединения соединяет низкополосный нетональный сигнал и высокополосный нетональный сигнал, чья амплитуда была отрегулирована посредством блока 505 масштабирования, тем самым, генерируя широкополосный нетональный сигнал.
[0067] С другой стороны, низкополосный тональный сигнал, выделенный посредством блока 503 выделения, вводится в блок 508 расширения полосы частот. Затем, таким же способом как блок 504 расширения полосы частот, посредством использования информации C запаздывания, блок 508 расширения полосы частот копирует низкополосный тональный сигнал, имеющий конкретную полосу, в высокую полосу, тем самым, генерируя высокополосный тональный сигнал.
[0068] Блок 510 оценки энергии тонального сигнала вычисляет энергию высокополосного нетонального сигнала, который был введен из блока 505 масштабирования и который имеет отрегулированную амплитуду, и вычитает энергию высокополосного нетонального сигнала из значения квантованной энергии A полосы, тем самым, получая энергию высокополосного тонального сигнала. Затем, блок 510 оценки энергии тонального сигнала выводит отношение между энергией высокополосного нетонального сигнала и энергией высокополосного тонального сигнала в блок 511 масштабирования.
[0069] Блок 511 масштабирования умножает высокополосный тональный сигнал на отношение между энергией высокополосного нетонального сигнала и энергией высокополосного тонального сигнала, тем самым, регулируя амплитуду высокополосного тонального сигнала.
[0070] Затем, блок 509 соединения соединяет низкополосный тональный сигнал и высокополосный тональный сигнал, имеющий отрегулированную амплитуду, тем самым, генерируя широкополосный тональный сигнал.
[0071] Наконец, блок 507 добавления добавляет широкополосный нетональный сигнал и широкополосный тональный сигнал, тем самым, генерируя широкополосный декодированный сигнал, и выводит широкополосный декодированный сигнал.
[0072] В вышеизложенном способе, этот вариант осуществления имеет конфигурацию, в которой нетональная компонента генерируется посредством использования низкополосного квантованного спектра и малого количества бит и регулируется, чтобы иметь соответствующую энергию, посредством использования коэффициента масштабирования, и, в которой энергия высокополосного тонального сигнала регулируется посредством использования энергии отрегулированной нетональной компоненты. Соответственно, является возможным кодировать, передавать, и декодировать музыкальный сигнал и подобное с помощью малого объема информации и соответствующим образом воспроизводить энергию высокополосной нетональной компоненты. Также является возможным воспроизводить энергию соответствующей тональной компоненты посредством определения энергии тональной компоненты посредством использования информации квантованной энергии полосы и информации энергии нетональной компоненты.
[0073] (ЧЕТВЕРТЫЙ ВАРИАНТ ОСУЩЕСТВЛЕНИЯ)
Далее, конфигурация декодера согласно четвертому варианту осуществления настоящего раскрытия будет описываться со ссылкой на фиг. 7. Отметим, что полная конфигурация декодера 400 согласно этому варианту осуществления включает в себя конфигурацию, проиллюстрированную на фиг. 4, как в первом варианте осуществления.
[0074] Фиг. 7 является блок-схемой, иллюстрирующей конфигурацию блока 403 декодирования второго уровня в этом варианте осуществления, отличающегося от блока 403 декодирования второго уровня в третьем варианте осуществления в том, что отношение положения блока добавления шума и блока выделения обращено и содержатся блок 603 выделения и блок 602 добавления шума, как в отношении между первым вариантом осуществления и вторым вариантом осуществления. Отметим, что блок 501 декодирования и выделения опущен из иллюстрации на фиг. 7.
[0075] Из низкополосного декодированного сигнала, блок 603 выделения выделяет низкополосный нетональный сигнал, который является нетональной компонентой, и низкополосный тональный сигнал, который является тональной компонентой.
[0076] Блок 602 добавления шума добавляет сигнал шума к низкополосному нетональному сигналу, выведенному из блока 603 выделения.
[0077] Отметим, что пример использования масштабируемого кодирования был описан в третьем и четвертом вариантах осуществления. Однако третий и четвертый варианты осуществления могут применяться к случаям, когда используется кодирование, другое, нежели масштабируемое кодирование. Фиг. 8 и 10 иллюстрируют примеры других декодеров, декодеров 410 и 620, соответственно. Сначала, будет описываться декодер 410, проиллюстрированный на фиг. 8.
[0078] Декодер 410, проиллюстрированный на фиг. 8, включает в себя блок 411 выделения, первый блок 412 декодирования, второй блок 413 декодирования, блок 414 частотно-временного преобразования, блок 415 обратной нормализации энергии полосы, и блок 116 синтеза.
[0079] Из кодированного сигнала, введенного посредством антенны, которая не проиллюстрирована, блок 411 выделения выделяет первый кодированный сигнал, высокополосный кодированный сигнал, и кодированный сигнал энергии полосы. Блок 411 выделения выводит первый кодированный сигнал, высокополосный кодированный сигнал, и кодированный сигнал энергии полосы в первый блок 412 декодирования, второй блок 413 декодирования, и блок 415 обратной нормализации энергии полосы, соответственно.
[0080] Блок 415 обратной нормализации энергии полосы декодирует кодированный сигнал энергии полосы, тем самым, генерируя квантованную энергию полосы. На основе квантованной энергии полосы, блок 415 обратной нормализации энергии полосы вычисляет информацию B1 и B2 назначения битов и выводит информацию B1 и B2 назначения битов в первый блок декодирования и второй блок декодирования, соответственно. В дополнение, блок 415 обратной нормализации энергии полосы выполняет обратную нормализацию, в которой сгенерированная квантованная энергия полосы умножается на нормализованный широкополосный декодированный сигнал, введенный из блока 416 синтеза, тем самым, генерируя окончательный широкополосный декодированный сигнал, и выводит широкополосный декодированный сигнал в блок 414 частотно-временного преобразования.
[0081] Первый блок 412 декодирования декодирует первый кодированный сигнал в соответствии с информацией B1 назначения битов, тем самым, генерируя низкополосный декодированный сигнал S1 и высокополосный декодированный сигнал. Первый блок 412 декодирования выводит низкополосный декодированный сигнал и высокополосный декодированный сигнал во второй блок 413 декодирования и блок 416 синтеза, соответственно.
[0082] Второй блок 413 декодирования декодирует высокополосный кодированный сигнал в соответствии с информацией B2 назначения битов, тем самым, генерируя широкополосный декодированный сигнал посредством использования низкополосного декодированного сигнала, и выводит широкополосный декодированный сигнал. Второй блок 413 декодирования может иметь такую же конфигурацию, что и блок 403 декодирования второго уровня, описанный со ссылкой на фиг. 6 и 7.
[0083] Блок 416 синтеза добавляет высокополосный декодированный сигнал, декодированный посредством первого блока декодирования, к широкополосному декодированному сигналу, введенному из второго блока декодирования, тем самым, генерируя нормализованный широкополосный декодированный сигнал, и выводит широкополосный декодированный сигнал в блок 415 обратной нормализации энергии полосы.
[0084] Затем, широкополосный декодированный сигнал, выведенный из блока 415 обратной нормализации энергии полосы, преобразуется в сигнал временной области посредством блока 414 частотно-временного преобразования и воспроизводится посредством усилителя и громкоговорителя, которые не проиллюстрированы.
[0085] Далее, будет описываться декодер 620, проиллюстрированный на фиг. 10. Фиг. 10 является примером другого декодера, декодера 620. Декодер 620, проиллюстрированный на фиг. 10, включает в себя первый блок 621 декодирования, второй блок 622 декодирования, блок 623 синтеза, и блок 624 частотно-временного преобразования.
[0086] Кодированный сигнал (включающий в себя первый кодированный сигнал, высокополосный кодированный сигнал, и кодированный сигнал энергии полосы), введенный посредством антенны, которая не проиллюстрирована, вводится в первый блок 621 декодирования. Сначала, первый блок 621 декодирования выделяет и декодирует энергию полосы, и выводит высокополосную часть декодированной энергии полосы во второй блок 622 декодирования в качестве высокополосной энергии (A) полосы. Затем, на основе декодированной энергии полосы, первый блок 621 декодирования вычисляет информацию назначения битов и выделяет и декодирует первый кодированный сигнал. Эта обработка декодирования может включать в себя обработку обратной нормализации с использованием декодированной энергии полосы. Первый блок 621 декодирования выводит, во второй блок 621 декодирования, низкополосную часть первого декодированного сигнала, полученного посредством декодирования, в качестве низкополосного декодированного сигнала. Затем, первый блок 621 декодирования выделяет и декодирует высокополосный кодированный сигнал на основе информации назначения битов. Высокополосный декодированный сигнал, полученный посредством декодирования, включает в себя коэффициент (B) масштабирования и информацию (C) запаздывания, и коэффициент масштабирования и информация запаздывания выводятся во второй блок 622 декодирования. Первый блок 621 декодирования также выводит высокополосную часть первого декодированного сигнала в блок 623 синтеза в качестве высокополосного декодированного сигнала. Высокополосный декодированный сигнал может быть нулевым в некоторых случаях.
[0087] Второй блок 622 декодирования генерирует широкополосный декодированный сигнал посредством использования низкополосного декодированного сигнала, декодированной квантованной энергии полосы, коэффициента масштабирования, и информации запаздывания, введенных из первого блока 621 декодирования, и выводит широкополосный декодированный сигнал. Второй блок 622 декодирования может иметь такую же конфигурацию, что и блок 403 декодирования второго уровня, описанный со ссылкой на фиг. 6 и 7.
[0088] Блок 623 синтеза добавляет высокополосный декодированный сигнал, декодированный посредством первого блока 621 декодирования, к широкополосному декодированному сигналу, введенному из второго блока 622 декодирования, тем самым, генерируя широкополосный декодированный сигнал. Результирующий сигнал преобразуется в сигнал временной области посредством блока 624 частотно-временного преобразования и воспроизводится посредством усилителя и громкоговорителя, которые не проиллюстрированы.
[0089] (ЗАКЛЮЧЕНИЕ)
Вышеописанные первый по четвертый варианты осуществления описывают кодеры и декодеры согласно настоящему раскрытию. Кодеры и декодеры согласно настоящему раскрытию являются идеями, включающими в себя форму уровня наполовину законченного продукта или форму уровня компонентов, обычно системную печатную плату или полупроводниковый элемент, и включающими в себя форму уровня законченного продукта, как, например, терминальное устройство или устройство базовой станции. В случае, когда каждый из кодеров и декодеров согласно настоящему раскрытию находится в форме уровня наполовину законченного продукта или форме уровня компонентов, форма уровня законченного продукта реализуется посредством комбинирования с антенной, преобразователем DA/AD (цифроаналоговым/аналого-цифровым), усилителем, громкоговорителем, микрофоном, или подобным.
[0090] Отметим, что блок-схемы на фиг. 1 по 10 иллюстрируют конфигурации аппаратного обеспечения и операции (способы) специализированного дизайна и также включают в себя случаи, когда аппаратные конфигурации и операции реализуются посредством установки программ, которые исполняют операции (способы) согласно настоящему раскрытию в аппаратном обеспечении общего назначения, и исполняя программы посредством процессора. Примеры электронного модуля вычисления, служащего в качестве такого аппаратного обеспечения общего назначения, включают в себя персональные компьютеры, различные мобильные информационные терминалы, включающие в себя смартфоны, и сотовые телефоны.
[0091] В дополнение, аппаратное обеспечение специализированного дизайна не ограничено уровнем законченного продукта (потребительской электроникой), как, например, сотовым телефоном или телефоном наземной линии, и включает в себя уровень наполовину законченного продукта или уровень компонентов, как, например, системную печатную плату или полупроводниковый элемент.
[0092] Пример, когда настоящее раскрытие используется в базовой станции, может иметь место, что транскодирование для изменения схемы кодирования речи выполняется в базовой станции. Отметим, что базовая станция является идеей, включающей в себя различные узлы, существующие в линии связи.
ПРОМЫШЛЕННАЯ ПРИМЕНИМОСТЬ
[0093] Кодеры и декодеры согласно настоящему раскрытию являются применимыми к устройствам, относящимся к записи, передаче, и воспроизведению речевых сигналов и аудиосигналов.
СПИСОК ПОЗИЦИОННЫХ ОБОЗНАЧЕНИЙ
[0094]
100, 110, 610 кодер
101 блок дискретизации с понижением
102 блок кодирования первого уровня
103, 113, 613 блок мультиплексирования
104 блок декодирования первого уровня
105 блок задержки
106 блок кодирования второго уровня
201, 301 блок добавления шума
202, 302 блок выделения
203 блок расширения полосы частот
204 блок вычисления энергии компоненты шума (первый блок вычисления)
205 блок вычисления усиления (второй блок вычисления)
206 блок вычисления энергии
207 блок мультиплексирования
208 блок расширения полосы частот
400, 410, 620 декодер
401, 411 блок выделения
402 блок декодирования первого уровня
403 блок декодирования второго уровня
501 блок декодирования и выделения
502, 602 блок добавления шума
503, 603 блок выделения
504 блок расширения полосы частот
505 блок масштабирования
506 блок соединения
507 блок добавления
508 блок расширения полосы частот
509 блок соединения
510 блок оценки энергии тонального сигнала
511 блок масштабирования
112, 612 первый блок кодирования
115, 614 второй блок кодирования
412, 621 первый блок декодирования
413, 622 второй блок декодирования.
Изобретение относится к средствам для кодирования аудиосигналов. Технический результат заключается в повышении эффективности кодирования аудио. Кодируют низкополосный сигнал из речевого или аудио входного сигнала, чтобы генерировать первый кодированный сигнал. Декодируют первый кодированный сигнал, чтобы генерировать низкополосный декодированный сигнал. Кодируют, на основе низкополосного декодированного сигнала, высокополосный сигнал, имеющий полосу, более высокую, чем полоса низкополосного сигнала, чтобы генерировать высокополосный кодированный сигнал. Вычисляют отношение энергии между первой энергией, относящейся к энергии высокополосной компоненты шума, которая является компонентой шума высокополосного сигнала, и второй энергией, относящейся к энергии высокополосной нетональной компоненты высокополосного декодированного сигнала, сгенерированного из низкополосного декодированного сигнала. Мультиплексируют первый кодированный сигнал и высокополосный кодированный сигнал. 8 н. и 7 з.п. ф-лы, 10 ил.
1. Устройство кодирования, содержащее:
первый кодер, который при функционировании кодирует низкополосный сигнал среди речевого или аудио входного сигнала, чтобы генерировать первый кодированный сигнал, и декодирует первый кодированный сигнал, чтобы генерировать низкополосный декодированный сигнал;
второй кодер, который при функционировании кодирует, на основе низкополосного декодированного сигнала, высокополосный сигнал, имеющий полосу, более высокую, чем полоса низкополосного сигнала, чтобы генерировать высокополосный кодированный сигнал; и
первый мультиплексор, который при функционировании мультиплексирует первый кодированный сигнал и высокополосный кодированный сигнал, чтобы генерировать и выводить кодированный сигнал,
при этом второй кодер вычисляет отношение энергии между первой энергией, относящейся к энергии высокополосной компоненты шума, которая является компонентой шума высокополосного сигнала, и второй энергией, относящейся к энергии высокополосной нетональной компоненты высокополосного декодированного сигнала, сгенерированного из низкополосного декодированного сигнала, и выводит вычисленное отношение в качестве высокополосного кодированного сигнала.
2. Устройство кодирования по п. 1, дополнительно содержащее модуль вычисления энергии, который при функционировании вычисляет энергию речевого или аудио входного сигнала и выводит вычисленную энергию в качестве квантованной энергии полосы,
при этом первый мультиплексор мультиплексирует квантованную энергию полосы, первый кодированный сигнал и высокополосный кодированный сигнал и выводит кодированный сигнал, причем выводимый кодированный сигнал содержит квантованную энергию полосы, первый кодированный сигнал и высокополосный кодированный сигнал.
3. Устройство кодирования по п. 2,
при этом второй кодер включает в себя:
блок выделения, который выделяет из низкополосного декодированного сигнала низкополосный нетональный сигнал, который является нетональной компонентой низкополосного декодированного сигнала, и низкополосный тональный сигнал, который является тональной компонентой низкополосного декодированного сигнала,
первый блок расширения полосы частот, который выводит, в качестве информации запаздывания, информацию положения относительно конкретной полосы, в которой корреляция между высокополосным сигналом и низкополосным тональным сигналом становится максимальной,
второй блок расширения полосы частот, который выводит, в качестве высокополосного нетонального сигнала, низкополосный нетональный сигнал, соответствующий информации запаздывания,
первый блок вычисления, который вычисляет энергию высокополосной компоненты шума, которая является компонентой шума, из высокополосного сигнала, соответствующего информации запаздывания,
второй блок вычисления, который вычисляет отношение из отношения энергии между первой энергией, относящейся к энергии высокополосной компоненты шума, и второй энергией, относящейся к энергии высокополосного нетонального сигнала, и выводит вычисленное отношение в качестве коэффициента масштабирования, и
второй блок мультиплексирования, который мультиплексирует информацию запаздывания и коэффициент масштабирования в качестве высокополосного кодированного сигнала и выводит высокополосный кодированный сигнал.
4. Устройство кодирования по п. 3,
в котором второй кодер дополнительно включает в себя блок добавления шума, который добавляет сигнал шума к низкополосному декодированному сигналу, или
в котором второй кодер дополнительно включает в себя блок добавления шума, который добавляет сигнал шума к низкополосному нетональному сигналу, выводимому из блока выделения.
5. Устройство кодирования по п. 1, дополнительно содержащее:
модуль вычисления энергии, который при функционировании вычисляет энергию речевого или аудио входного сигнала и выводит вычисленную энергию в качестве квантованной энергии полосы;
при этом первый мультиплексор, при функционировании, также мультиплексирует квантованную энергию полосы,
при этом второй кодер включает в себя:
блок выделения, который выделяет, из низкополосного декодированного сигнала, низкополосный нетональный сигнал, который является нетональной компонентой низкополосного декодированного сигнала, и низкополосный тональный сигнал, который является тональной компонентой низкополосного декодированного сигнала, причем тональная компонента является компонентой, которая была квантована посредством модуля импульсного квантования, а нетональная компонента является компонентой, которая стала нулевой в силу того, что не подверглась квантованию посредством модуля импульсного квантования,
блок добавления шума, который добавляет сигнал шума к низкополосному декодированному сигналу или к низкополосному нетональному сигналу, выводимому из блока выделения,
первый блок расширения полосы частот, который выводит, в качестве информации запаздывания, информацию положения относительно конкретной полосы, в которой корреляция между высокополосным входным сигналом и низкополосным тональным сигналом становится максимальной,
второй блок расширения полосы частот, который выводит, в качестве высокополосного нетонального сигнала, низкополосный нетональный сигнал, соответствующий информации запаздывания, на основании информации положения относительно конкретной полосы,
блок вычисления, который вычисляет отношение энергии между высокополосной компонентой шума и высокополосным нетональным сигналом, полученным вторым блоком расширения полосы частот, и выводит вычисленное отношение в качестве коэффициента масштабирования, и
второй блок мультиплексирования, который мультиплексирует информацию запаздывания и коэффициент масштабирования в качестве высокополосного кодированного сигнала и выводит высокополосный кодированный сигнал.
6. Устройство декодирования, которое принимает первый кодированный сигнал и высокополосный кодированный сигнал, при этом устройство декодирования содержит:
демультиплексор, который при функционировании демультиплексирует первый кодированный сигнал и высокополосный кодированный сигнал;
первый декодер, который при функционировании декодирует первый кодированный сигнал, чтобы генерировать низкополосный декодированный сигнал; и
второй декодер, который при функционировании декодирует высокополосный кодированный сигнал, чтобы генерировать широкополосный декодированный сигнал посредством использования низкополосного декодированного сигнала,
при этом высокополосный кодированный сигнал включает в себя отношение энергии между первой энергией, относящейся к энергии высокополосной компоненты шума, которая является компонентой шума, и второй энергией, относящейся к энергии высокополосной нетональной компоненты высокополосного декодированного сигнала, сгенерированного из низкополосного декодированного сигнала, и
при этом второй декодер регулирует амплитуду низкополосного нетонального сигнала, который является нетональной компонентой низкополосного декодированного сигнала, посредством ссылки на упомянутое отношение, которое декодировано.
7. Устройство декодирования, которое принимает первый кодированный сигнал, высокополосный кодированный сигнал, и кодированный сигнал энергии полосы, при этом устройство декодирования содержит:
первый декодер, который при функционировании декодирует первый кодированный сигнал, чтобы генерировать низкополосный декодированный сигнал;
второй декодер, который при функционировании декодирует высокополосный кодированный сигнал, чтобы генерировать широкополосный декодированный сигнал посредством использования низкополосного декодированного сигнала; и
третий декодер, который при функционировании декодирует кодированный сигнал энергии полосы, чтобы генерировать квантованную энергию полосы,
при этом второй декодер включает в себя:
блок выделения, который выделяет из низкополосного декодированного сигнала низкополосный нетональный сигнал, который является нетональной компонентой низкополосного декодированного сигнала, и низкополосный тональный сигнал, который является тональной компонентой низкополосного декодированного сигнала,
первый блок расширения полосы частот, который копирует низкополосный нетональный сигнал в высокую полосу посредством использования информации запаздывания, полученной посредством декодирования высокополосного кодированного сигнала, чтобы генерировать высокополосный нетональный сигнал,
первый блок масштабирования, который регулирует амплитуду высокополосного нетонального сигнала посредством использования коэффициента масштабирования, полученного посредством декодирования высокополосного кодированного сигнала,
блок оценки энергии тонального сигнала, который оценивает энергию высокополосного тонального сигнала из энергии высокополосного нетонального сигнала и квантованной энергии полосы,
первый блок соединения, который соединяет низкополосный нетональный сигнал и высокополосный нетональный сигнал, чтобы генерировать широкополосный нетональный сигнал,
второй блок расширения полосы частот, который копирует низкополосный тональный сигнал в высокую полосу посредством использования информации запаздывания, чтобы генерировать высокополосный тональный сигнал,
второй блок масштабирования, который регулирует амплитуду высокополосного тонального сигнала на основе энергии высокополосного тонального сигнала,
второй блок соединения, который соединяет низкополосный тональный сигнал и высокополосный тональный сигнал, имеющий отрегулированную амплитуду, чтобы генерировать широкополосный тональный сигнал, и
блок добавления, который добавляет широкополосный нетональный сигнал и широкополосный тональный сигнал, чтобы генерировать широкополосный декодированный сигнал,
при этом информация запаздывания является информацией положения относительно конкретной полосы, в которой корреляция между высокополосным сигналом и низкополосным тональным сигналом становится максимальной, и
при этом коэффициент масштабирования является отношением энергии между первой энергией, относящейся к энергии высокополосной компоненты шума, которая является компонентой шума высокополосного сигнала, соответствующего информации запаздывания, и второй энергией, относящейся к энергии высокополосного нетонального сигнала.
8. Устройство декодирования по п. 6,
в котором второй декодер дополнительно включает в себя блок добавления шума, который добавляет сигнал шума к низкополосному декодированному сигналу.
9. Устройство декодирования по п. 6,
в котором второй декодер дополнительно включает в себя блок добавления шума, который добавляет сигнал шума к низкополосному нетональному сигналу, выведенному из блока выделения.
10. Способ кодирования, содержащий:
кодирование низкополосного сигнала из речевого или аудио входного сигнала, чтобы генерировать первый кодированный сигнал;
декодирование первого кодированного сигнала, чтобы генерировать низкополосный декодированный сигнал;
кодирование, на основе низкополосного декодированного сигнала, высокополосного сигнала, имеющего полосу, более высокую, чем полоса низкополосного сигнала, чтобы генерировать высокополосный кодированный сигнал;
вычисление отношения энергии между первой энергией, относящейся к энергии высокополосной компоненты шума, которая является компонентой шума высокополосного сигнала, и второй энергией, относящейся к энергии высокополосной нетональной компоненты высокополосного декодированного сигнала, сгенерированного из низкополосного декодированного сигнала; и
мультиплексирование первого кодированного сигнала и высокополосного кодированного сигнала, включающего в себя отношение, чтобы генерировать и выводить кодированный сигнал, причем выводимый кодированный сигнал содержит первый кодированный сигнал и высокополосный кодированный сигнал, высокополосный кодированный сигнал содержит упомянутое отношение.
11. Способ кодирования по п. 10, дополнительно содержащий:
вычисление энергии речевого или аудио входного сигнала и вывод вычисленной энергии в качестве квантованной энергии полосы;
выделение из низкополосного декодированного сигнала низкополосного нетонального сигнала, который является нетональной компонентой низкополосного декодированного сигнала, и низкополосного тонального сигнала, который является тональной компонентой низкополосного декодированного сигнала;
вывод, в качестве информации запаздывания, информации положения относительно конкретной полосы, в которой корреляция между высокополосным сигналом и низкополосным тональным сигналом становится максимальной;
вывод низкополосного нетонального сигнала, соответствующего информации запаздывания, в качестве высокополосного нетонального сигнала;
вычисление энергии высокополосной компоненты шума, которая является компонентой шума, из высокополосного сигнала, соответствующего информации запаздывания; и
вычисление отношения энергии между первой энергией, относящейся к энергии высокополосной компоненты шума и второй энергией, относящейся к энергии высокополосного нетонального сигнала, и вывод вычисленного отношения в качестве коэффициента масштабирования.
12. Способ декодирования для первого кодированного сигнала и высокополосного кодированного сигнала, при этом способ содержит:
демультиплексирование первого кодированного сигнала и высокополосного кодированного сигнала;
декодирование первого кодированного сигнала, чтобы генерировать низкополосный декодированный сигнал;
декодирование высокополосного кодированного сигнала, чтобы генерировать широкополосный декодированный сигнал посредством использования низкополосного декодированного сигнала,
при этом высокополосный кодированный сигнал включает в себя отношение энергии между первой энергией, относящейся к энергии высокополосной компоненты шума, которая является компонентой шума, и второй энергией, относящейся к энергии высокополосной нетональной компоненты высокополосного декодированного сигнала, сгенерированного из низкополосного декодированного сигнала; и
генерирование отношения, которое декодируется, и регулировку амплитуды низкополосного нетонального сигнала, который является нетональной компонентой низкополосного декодированного сигнала, посредством ссылки на упомянутое отношение.
13. Способ декодирования для первого кодированного сигнала, высокополосного кодированного сигнала и кодированного сигнала энергии полосы, при этом способ содержит:
декодирование первого кодированного сигнала, чтобы генерировать низкополосный декодированный сигнал;
декодирование высокополосного кодированного сигнала, чтобы генерировать широкополосный декодированный сигнал посредством использования низкополосного декодированного сигнала;
декодирование кодированного сигнала энергии полосы, чтобы генерировать квантованную энергию полосы;
демультиплексирование, из низкополосного декодированного сигнала, низкополосного нетонального сигнала, который является нетональной компонентой низкополосного декодированного сигнала, и низкополосного тонального сигнала, который является тональной компонентой низкополосного декодированного сигнала;
копирование низкополосного нетонального сигнала в высокую полосу посредством использования информации запаздывания, полученной посредством декодирования высокополосного кодированного сигнала, чтобы генерировать высокополосный нетональный сигнал;
регулировку амплитуды высокополосного нетонального сигнала посредством использования коэффициента масштабирования, полученного посредством декодирования высокополосного кодированного сигнала;
оценку энергии высокополосного тонального сигнала из энергии высокополосного нетонального сигнала и квантованной энергии полосы;
соединение низкополосного нетонального сигнала и высокополосного нетонального сигнала, чтобы генерировать широкополосный нетональный сигнал;
копирование низкополосного тонального сигнала в высокую полосу посредством использования информации запаздывания, чтобы генерировать высокополосный тональный сигнал;
регулировку амплитуды высокополосного тонального сигнала на основе энергии высокополосного тонального сигнала;
соединение низкополосного тонального сигнала и высокополосного тонального сигнала, имеющего отрегулированную амплитуду, чтобы генерировать широкополосный тональный сигнал; и
добавление широкополосного нетонального сигнала и широкополосного тонального сигнала, чтобы генерировать широкополосный декодированный сигнал,
при этом информация запаздывания является информацией положения относительно конкретной полосы, в которой корреляция между высокополосным сигналом и низкополосным тональным сигналом становится максимальной, и
при этом коэффициент масштабирования является отношением энергии между первой энергией, относящейся к энергии высокополосной компоненты шума, которая является компонентой шума высокополосного сигнала, соответствующего информации запаздывания, и второй энергией, относящейся к энергии высокополосного нетонального сигнала.
14. Невременный компьютерно-читаемый записывающий носитель, хранящий программу, предписывающую процессору исполнять:
обработку для кодирования низкополосного сигнала из речевого или аудио входного сигнала, чтобы генерировать первый кодированный сигнал;
обработку для декодирования первого кодированного сигнала, чтобы генерировать низкополосный декодированный сигнал;
обработку для кодирования, на основе низкополосного декодированного сигнала, высокополосного сигнала, имеющего полосу, более высокую, чем полоса низкополосного сигнала, чтобы генерировать высокополосный кодированный сигнал;
обработку для вычисления отношения энергии между первой энергией, относящейся к энергии высокополосной компоненты шума, которая является компонентой шума высокополосного сигнала, и второй энергией, относящейся к энергии высокополосного нетонального сигнала высокополосного декодированного сигнала, сгенерированного из низкополосного декодированного сигнала; и
обработку для мультиплексирования первого кодированного сигнала и высокополосного кодированного сигнала, включающего в себя отношение, чтобы генерировать и выводить кодированный сигнал, причем выводимый кодированный сигнал содержит первый кодированный сигнал и высокополосный кодированный сигнал, высокополосный кодированный сигнал содержит упомянутое отношение.
15. Невременный компьютерно-читаемый записывающий носитель, хранящий программу, предписывающую процессору исполнять, для первого кодированного сигнала и высокополосного кодированного сигнала:
обработку для демультиплексирования первого кодированного сигнала и высокополосного кодированного сигнала;
обработку для декодирования первого кодированного сигнала, чтобы генерировать низкополосный декодированный сигнал;
обработку для декодирования высокополосного кодированного сигнала, чтобы генерировать широкополосный декодированный сигнал посредством использования низкополосного декодированного сигнала,
при этом высокополосный кодированный сигнал включает в себя отношение энергии между первой энергией, относящейся к энергии высокополосной компоненты шума, которая является компонентой шума, и второй энергией, относящейся к энергии высокополосного нетонального сигнала высокополосного декодированного сигнала, сгенерированного из низкополосного декодированного сигнала; и
обработку для генерирования отношения, которое декодируется, и регулировки амплитуды низкополосного нетонального сигнала, который является нетональной компонентой низкополосного декодированного сигнала, посредством ссылки на упомянутое отношение.
JP 2010020251 A, 28.01.2010 | |||
JP 2011075728 A, 14.04.2011 | |||
Колосоуборка | 1923 |
|
SU2009A1 |
WO 2013035257 A1, 14.03.2013 | |||
WO 2000045379 A3, 03.08.2000 | |||
СПОСОБ И УСТРОЙСТВО ДЛЯ ОБНАРУЖЕНИЯ ЗВУКОВОЙ АКТИВНОСТИ И КЛАССИФИКАЦИИ ЗВУКОВЫХ СИГНАЛОВ | 2008 |
|
RU2441286C2 |
Авторы
Даты
2019-05-24—Публикация
2015-03-23—Подача