СПОСОБ КВАНТОВАНИЯ КОЭФФИЦИЕНТОВ КОДИРОВАНИЯ С ЛИНЕЙНЫМ ПРЕДСКАЗАНИЕМ, СПОСОБ КОДИРОВАНИЯ ЗВУКА, СПОСОБ ДЕКВАНТОВАНИЯ КОЭФФИЦИЕНТОВ КОДИРОВАНИЯ С ЛИНЕЙНЫМ ПРЕДСКАЗАНИЕМ, СПОСОБ ДЕКОДИРОВАНИЯ ЗВУКА И НОСИТЕЛЬ ЗАПИСИ Российский патент 2018 года по МПК H03M7/30 G10L19/00 

Описание патента на изобретение RU2675044C1

ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ

Способы и устройства, совместимые с настоящим раскрытием, относятся к квантованию и деквантованию коэффициентов кодирования с линейным предсказанием, и, более конкретно, к способу эффективного квантования коэффициентов кодирования с линейным предсказанием с низкой сложностью, способу кодирования звука, использующему способ квантования, способу деквантования коэффициентов кодирования с линейным предсказанием, способу декодирования звука, использующему способ деквантования, и носителю записи для этого.

УРОВЕНЬ ТЕХНИКИ

В системах для кодирования звука, такого как речь или аудио, коэффициенты кодирования с линейным предсказанием (LPC) используются, чтобы представлять кратковременную частотную характеристику звука. Коэффициенты LPC получаются в схеме разделения входного звука на единицы кадров и минимизации энергии ошибки предсказания в расчете на кадр. Однако, так как коэффициенты LPC имеют большой динамический диапазон и характеристика используемого фильтра LPC является очень чувствительной к ошибкам квантования коэффициентов LPC, устойчивость фильтра LPC не гарантируется.

Таким образом, квантование выполняется посредством преобразования коэффициентов LPC в другие коэффициенты, для которых легко проверять устойчивость фильтра, которые являются предпочтительными для интерполяции, и которые имеют хорошую характеристику квантования. Главным образом является предпочтительным, что квантование выполняется посредством преобразования коэффициентов LPC в коэффициенты частот спектральных линий (LSF) или частот спектрального иммитанса (ISF). В частности, способ квантования коэффициентов LPC может увеличивать усиление квантования посредством использования высокой межкадровой корреляции коэффициентов LSF в частотной области и временной области.

Коэффициенты LSF показывают частотную характеристику кратковременного звука, и для кадров, в которых частотная характеристика входного звука изменяется быстро, коэффициенты LSF кадров также быстро изменяются. Однако для модуля квантования, использующего высокую межкадровую корреляцию коэффициентов LSF, так как должное предсказание не может выполняться для быстро изменяющихся кадров, производительность квантования модуля квантования уменьшается.

РАСКРЫТИЕ ИЗОБРЕТЕНИЯ

ТЕХНИЧЕСКАЯ ЗАДАЧА

Одним аспектом является обеспечить способ эффективного квантования коэффициентов кодирования с линейным предсказанием (LPC) с низкой сложностью, способ кодирования звука, использующий способ квантования, способ деквантования коэффициентов LPC, способ декодирования звука, использующий способ деквантования, и носитель записи для этого.

РЕШЕНИЕ ЗАДАЧИ

Согласно одному аспекту одного или более примерных вариантов осуществления, обеспечивается способ квантования, содержащий квантование входного сигнала посредством выбора одной из первой схемы квантования, не использующей межкадровое предсказание, и второй схемы квантования, использующей межкадровое предсказание, при принятии в рассмотрение, по меньшей мере, одного из режима предсказания, ошибки предсказания и состояния канала передачи.

Согласно другому аспекту одного или более примерных вариантов осуществления, обеспечивается способ кодирования, содержащий определение режима кодирования входного сигнала; квантование входного сигнала посредством выбора одной из первой схемы квантования, не использующей межкадровое предсказание, и второй схемы квантования, использующей межкадровое предсказание, согласно информации пути, определенной при принятии в рассмотрение, по меньшей мере, одного из режима предсказания, ошибки предсказания и состояния канала передачи; кодирование квантованного входного сигнала в режиме кодирования; и генерирование битового потока, включающего в себя одно из результата, квантованного в первой схеме квантования, и результата, квантованного во второй схеме квантования, режима кодирования входного сигнала, и информации пути, относящейся к квантованию входного сигнала.

Согласно другому аспекту одного или более примерных вариантов осуществления, обеспечивается способ деквантования, содержащий деквантование входного сигнала посредством выбора одной из первой схемы деквантования, не использующей межкадровое предсказание, и второй схемы деквантования, использующей межкадровое предсказание, на основе информации пути, включенной в битовый поток, причем информация пути определяется при принятии в рассмотрение, по меньшей мере, одного из режима предсказания, ошибки предсказания и состояния канала передачи, в кодирующем конце.

Согласно другому аспекту одного или более примерных вариантов осуществления, обеспечивается способ декодирования, содержащий декодирование параметров кодирования с линейным предсказанием (LPC) и режима кодирования, включенных в битовый поток; деквантование декодированных параметров LPC посредством использования одной из первой схемы деквантования, не использующей межкадровое предсказание, и второй схемы деквантования, использующей межкадровое предсказание, на основе информации пути, включенной в битовый поток; и декодирование деквантованных параметров LPC в декодированном режиме кодирования, при этом информация пути определяется при принятии в рассмотрение, по меньшей мере, одного из режима предсказания, ошибки предсказания и состояния канала передачи в кодирующем конце.

Согласно другому аспекту одного или более примерных вариантов осуществления, обеспечивается способ определения типа модуля квантования, при этом способ содержит сравнение скорости передачи битов входного сигнала с первым опорным значением; сравнение ширины полосы входного сигнала со вторым опорным значением; сравнение частоты внутренней дискретизации с третьим опорным значением; и определение типа модуля квантования для входного сигнала в качестве одного из типа открытого контура и типа замкнутого контура на основе результатов одного или более сравнений.

Согласно другому аспекту одного или более примерных вариантов осуществления, обеспечивается электронное устройство, включающее в себя блок передачи данных, который принимает, по меньшей мере, одно из звукового сигнала и закодированного битового потока, или который передает, по меньшей мере, одно из закодированного звукового сигнала и восстановленного звука; и модуль кодирования, который квантует принятый звуковой сигнал посредством выбора одной из первой схемы квантования, не использующей межкадровое предсказание, и второй схемы квантования, использующей межкадровое предсказание, согласно информации пути, определенной при принятии в рассмотрение, по меньшей мере, одного из режима предсказания, ошибки предсказания и состояния канала передачи, и кодирует квантованный звуковой сигнал в режиме кодирования.

Согласно другому аспекту одного или более примерных вариантов осуществления, обеспечивается электронное устройство, включающее в себя блок передачи данных, который принимает, по меньшей мере, одно из звукового сигнала и закодированного битового потока, или который передает, по меньшей мере, одно из закодированного звукового сигнала и восстановленного звука; и модуль декодирования, который декодирует параметры кодирования с линейным предсказанием (LPC) и режим кодирования, включенные в битовый поток, деквантует декодированные параметры LPC посредством использования одной из первой схемы деквантования, не использующей межкадровое предсказание, и второй схемы деквантования, использующей межкадровое предсказание, на основе информации пути, включенной в битовый поток, и декодирует деквантованные параметры LPC в декодированном режиме кодирования, при этом информация пути определяется при принятии в рассмотрение, по меньшей мере, одного из режима предсказания, ошибки предсказания и состояния канала передачи в кодирующем конце.

Согласно другому аспекту одного или более примерных вариантов осуществления, обеспечивается электронное устройство, включающее в себя блок передачи данных, который принимает, по меньшей мере, одно из звукового сигнала и закодированного битового потока, или который передает, по меньшей мере, одно из закодированного звукового сигнала и восстановленного звука; модуль кодирования, который квантует принятый звуковой сигнал посредством выбора одной из первой схемы квантования, не использующей межкадровое предсказание, и второй схемы квантования, использующей межкадровое предсказание, согласно информации пути, определенной при принятии в рассмотрение, по меньшей мере, одного из режима предсказания, ошибки предсказания и состояния канала передачи, и который кодирует квантованный звуковой сигнал в режиме кодирования; и модуль декодирования, который декодирует параметры кодирования с линейным предсказанием (LPC) и режим кодирования, включенные в битовый поток, деквантует декодированные параметры LPC посредством использования одной из первой схемы деквантования, не использующей межкадровое предсказание, и второй схемы деквантования, использующей межкадровое предсказание, на основе информации пути, включенной в битовый поток, и декодирует деквантованные параметры LPC в декодированном режиме кодирования.

ПРЕДПОЧТИТЕЛЬНЫЕ ЭФФЕКТЫ ИЗОБРЕТЕНИЯ

Согласно представленной новой концепции, эффективное квантование аудио или речевого сигнала, посредством применения множества режимов кодирования согласно характеристикам аудио или речевого сигнала и назначения различных количеств битов аудио или речевому сигналу согласно отношению сжатия, применяемому к каждому из режимов кодирования, может выбираться оптимальный модуль квантования с низкой сложностью в каждом из режимов кодирования.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

Вышеописанные и другие аспекты станут более ясными из подробного описания их примерных вариантов осуществления со ссылкой на прилагаемые чертежи, на которых:

Фиг. 1 является блок-схемой устройства кодирования звука согласно одному примерному варианту осуществления;

Фиг. 2A-2D являются примерами различных режимов кодирования, которые могут выбираться модулем выбора режима кодирования устройства кодирования звука по фиг. 1;

Фиг. 3 является блок-схемой модуля квантования коэффициентов кодирования с линейным предсказанием (LPC) согласно одному примерному варианту осуществления;

Фиг. 4 является блок-схемой определителя весовой функции согласно одному примерному варианту осуществления;

Фиг. 5 является блок-схемой модуля квантования коэффициентов LPC согласно другому примерному варианту осуществления;

Фиг. 6 является блок-схемой модуля выбора пути квантования согласно одному примерному варианту осуществления;

Фиг. 7A и 7B являются блок-схемами последовательности операций, иллюстрирующими операции модуля выбора пути квантования по фиг. 6, согласно одному примерному варианту осуществления;

Фиг. 8 является блок-схемой модуля выбора пути квантования согласно другому примерному варианту осуществления;

Фиг. 9 иллюстрирует информацию относительно состояния канала, передаваемого в сетевом конце, когда обеспечивается служба кодека;

Фиг. 10 является блок-схемой модуля квантования коэффициентов LPC согласно другому примерному варианту осуществления;

Фиг. 11 является блок-схемой модуля квантования коэффициентов LPC согласно другому примерному варианту осуществления;

Фиг. 12 является блок-схемой модуля квантования коэффициентов LPC согласно другому примерному варианту осуществления;

Фиг. 13 является блок-схемой модуля квантования коэффициентов LPC согласно другому примерному варианту осуществления;

Фиг. 14 является блок-схемой модуля квантования коэффициентов LPC согласно другому примерному варианту осуществления;

Фиг. 15 является блок-схемой модуля квантования коэффициентов LPC согласно другому примерному варианту осуществления;

Фиг. 16A и 16B являются блок-схемами модулей квантования коэффициентов LPC согласно другим примерным вариантам осуществления;

Фиг. 17A по 17C являются блок-схемами модулей квантования коэффициентов LPC согласно другим примерным вариантам осуществления;

Фиг. 18 является блок-схемой модуля квантования коэффициентов LPC согласно другому примерному варианту осуществления;

Фиг. 19 является блок-схемой модуля квантования коэффициентов LPC согласно другому примерному варианту осуществления;

Фиг. 20 является блок-схемой модуля квантования коэффициентов LPC согласно другому примерному варианту осуществления;

Фиг. 21 является блок-схемой модуля выбора типа модуля квантования согласно одному примерному варианту осуществления;

Фиг. 22 является блок-схемой последовательности операций, иллюстрирующей работу способа выбора типа модуля квантования, согласно одному примерному варианту осуществления;

Фиг. 23 является блок-схемой устройства декодирования звука согласно одному примерному варианту осуществления;

Фиг. 24 является блок-схемой модуля деквантования коэффициентов LPC согласно одному примерному варианту осуществления;

Фиг. 25 является блок-схемой модуля деквантования коэффициентов LPC согласно другому примерному варианту осуществления;

Фиг. 26 является блок-схемой примера первой схемы деквантования и второй схемы деквантования в модуле деквантования коэффициентов LPC по фиг. 25, согласно одному примерному варианту осуществления;

Фиг. 27 является блок-схемой последовательности операций, иллюстрирующей способ квантования согласно одному примерному варианту осуществления;

Фиг. 28 является блок-схемой последовательности операций, иллюстрирующей способ деквантования согласно одному примерному варианту осуществления;

Фиг. 29 является блок-схемой электронного устройства, включающего в себя модуль кодирования, согласно одному примерному варианту осуществления;

Фиг. 30 является блок-схемой электронного устройства, включающего в себя модуль декодирования, согласно одному примерному варианту осуществления; и

фиг. 31 является блок-схемой электронного устройства, включающего в себя модуль кодирования и модуль декодирования, согласно одному примерному варианту осуществления.

ВАРИАНТ ОСУЩЕСТВЛЕНИЯ ИЗОБРЕТЕНИЯ

Представленная новая концепция может обеспечивать возможность различных типов изменения или модификации и различных изменений в форме, и конкретные примерные варианты осуществления иллюстрируются на чертежах и описываются подробно в описании. Однако следует понимать, что конкретные примерные варианты осуществления не ограничивают представленную новую концепцию конкретной формой раскрытия, но включают в себя каждую модифицированную, эквивалентную, или замененную форму в пределах сущности и технического объема представленной новой концепции. В последующем описании, хорошо известные функции или конструкции подробно не описываются, так как они затруднят понимание изобретения излишними деталями.

Хотя термины, такие как «первый» и «второй», могут использоваться, чтобы описывать различные элементы, элементы не могут быть ограниченными упомянутыми терминами. Термины могут использоваться, чтобы отличать некоторый элемент от другого элемента.

Терминология, используемая в заявке, используется только, чтобы описывать конкретные примерные варианты осуществления, и не имеет какого-либо намерения, чтобы ограничивать новую концепцию. Хотя общие термины, такие как используемые в текущее время широко насколько возможно, выбраны в качестве терминов, используемых в представленной новой концепции, при принятии в рассмотрение функций в представленной новой концепции, они могут изменяться согласно намерению специалистов в данной области техники, судебным прецедентам, или появлению новой технологии. В дополнение, в конкретных случаях, могут использоваться термины, намеренно выбранные заявителем, и в этом случае, смысл терминов будет раскрываться в соответствующем описании. Соответственно, термины, используемые в представленной новой концепции, должны определяться не посредством простых названий терминов, но посредством смысла терминов и содержания в соответствии с представленной новой концепцией.

Выражение в форме единственного числа включает в себя выражение в форме множественного числа, если они не являются явным образом отличающимися друг от друга в контексте. В заявке, следует понимать, что термины, такие как «включать в себя» и «иметь», используются, чтобы показывать существование осуществленного признака, количества, этапа, операции, элемента, части, или их комбинации без исключения заранее возможности существования или добавления одного или более других признаков, количеств, этапов, операций, элементов, частей, или их комбинаций.

Представленная новая концепция теперь будет описываться более полно со ссылкой на сопровождающие чертежи, на которых показаны примерные варианты осуществления настоящего изобретения. Сходные условные обозначения на чертежах обозначают сходные элементы, и, таким образом, их повторное описание будет пропускаться.

Выражения, такие как «по меньшей мере, одно из», когда предшествуют списку элементов, модифицируют весь список элементов и не модифицируют индивидуальные элементы списка.

Фиг. 1 является блок-схемой устройства 100 кодирования звука согласно одному примерному варианту осуществления.

Устройство 100 кодирования звука, показанное на фиг. 1, может включать в себя процессор предварительной обработки (например, центральный процессор (CPU)) 111, анализатор 113 спектра и линейного предсказания (LP), модуль 115 выбора режима кодирования, модуль 117 квантования коэффициентов кодирования с линейным предсказанием (LPC), кодировщик 119 переменного режима, и кодировщик 121 параметров. Каждый из компонентов устройства 100 кодирования звука может осуществляться посредством, по меньшей мере, одного процессора (например, центрального процессора (CPU)) посредством объединения в, по меньшей мере, одном модуле. Следует отметить, что звук может означать аудио, речь, или комбинацию перечисленного. Описание, которое следует, для удобства ссылается на звук в качестве речи. Однако следует понимать, что может обрабатываться любой звук.

Как показано на фиг. 1, процессор 111 предварительной обработки может предварительно обрабатывать входной речевой сигнал. В процессе предварительной обработки, нежелательный частотный компонент может удаляться из речевого сигнала, или частотная характеристика речевого сигнала может регулироваться, чтобы быть предпочтительной для кодирования. Подробно, процессор 111 предварительной обработки может выполнять фильтрацию верхних частот, предыскажение, или преобразование дискретизации.

Анализатор 113 спектра и LP может извлекать коэффициенты LPC посредством анализа характеристик в частотной области или выполнения анализа LP над предварительно обработанным речевым сигналом. Хотя, в общем, выполняется один анализ LP на кадр, два или более анализа LP на кадр могут выполняться для дополнительного улучшения качества звука. В этом случае, один анализ LP является LP для конца кадра, который выполняется как стандартный анализ LP, и другие могут быть LP для средних подкадров для улучшения качества звука. В этом случае, конец кадра текущего кадра показывает конечный подкадр среди подкадров, формирующих текущий кадр, и конец кадра предыдущего кадра показывает конечный подкадр среди подкадров, формирующих предыдущий кадр. Например, один кадр может состоять из 4 подкадров.

Средние подкадры указывают один или более подкадров среди подкадров, существующих между конечным подкадром, который является концом кадра предыдущего кадра, и конечным подкадром, который является концом кадра текущего кадра. Соответственно, анализатор 113 спектра и LP может извлекать в целом два или более наборов коэффициентов LPC. Коэффициенты LPC могут использовать порядок 10, когда входной сигнал является узким диапазоном, и могут использовать порядок от 16 до 20, когда входной сигнал является широким диапазоном. Однако размерность коэффициентов LPC не ограничена этим.

Модуль 115 выбора режима кодирования может выбирать один из множества режимов кодирования в соответствии с множеством скоростей. В дополнение, модуль 115 выбора режима кодирования может выбирать один из множества режимов кодирования посредством использования характеристик речевого сигнала, которые получаются из информации о диапазоне, информации об основном тоне, или информации анализа частотной области. В дополнение, модуль 115 выбора режима кодирования может выбирать один из множества режимов кодирования посредством использования множества скоростей и характеристик речевого сигнала.

Модуль 117 квантования коэффициентов LPC может квантовать коэффициенты LPC, извлеченные посредством анализатора 113 спектра и LP. Модуль 117 квантования коэффициентов LPC может выполнять квантование посредством преобразования коэффициентов LPC в другие коэффициенты, подходящие для квантования. Модуль 117 квантования коэффициентов LPC может выбирать один из множества путей, включающего в себя первый путь, не использующий межкадровое предсказание, и второй путь, использующий межкадровое предсказание, в качестве пути квантования речевого сигнала на основе первого критерия до квантования речевого сигнала и квантовать речевой сигнал посредством использования одной из первой схемы квантования и второй схемы квантования согласно выбранному пути квантования. В качестве альтернативы, модуль 117 квантования коэффициентов LPC может квантовать коэффициенты LPC как для первого пути посредством первой схемы квантования, не использующей межкадровое предсказание, так и для второго пути посредством второй схемы квантования, использующей межкадровое предсказание, и выбирать результат квантования одного из первого пути и второго пути на основе второго критерия. Первый и второй критерии могут быть идентичными друг с другом или отличающимися друг от друга.

Кодировщик 119 переменного режима может генерировать битовый поток посредством кодирования коэффициентов LPC, квантованных посредством модуля 117 квантования коэффициентов LPC. Кодировщик 119 переменного режима может кодировать квантованные коэффициенты LPC в режиме кодирования, выбранном модулем 115 выбора режима кодирования. Кодировщик 119 переменного режима может кодировать сигнал возбуждения коэффициентов LPC в единицах кадров или подкадров.

Примером алгоритмов кодирования, используемых в кодировщике 119 переменного режима, может быть кодовое линейное предсказание (CELP) или алгебраическое CELP (ACELP). Алгоритм кодирования преобразованием может дополнительно использоваться согласно режиму кодирования. Показательными параметрами для кодирования коэффициентов LPC в алгоритме CELP являются индекс адаптивной кодовой книги, усиление адаптивной кодовой книги, индекс фиксированной кодовой книги, и усиление фиксированной кодовой книги. Текущий кадр, закодированный посредством кодировщика 119 переменного режима, может сохраняться для кодирования последующего кадра.

Кодировщик 121 параметров может кодировать параметры, подлежащие использованию концом декодирования для декодирования, подлежащие включению в битовый поток. Является предпочтительным, если кодируются параметры, соответствующие режиму кодирования. Битовый поток, сгенерированный кодировщиком 121 параметров, может сохраняться или передаваться.

Фиг. 2A-2D являются примерами различных режимов кодирования, которые могут выбираться модулем 115 выбора режима кодирования устройства 100 кодирования звука по фиг. 1. Фиг. 2A и 2C являются примерами режимов кодирования, классифицированных в случае, когда количество битов, назначенное квантованию, является большим, т.е. случае высокой скорости передачи битов, и фиг. 2B и 2D являются примерами режимов кодирования, классифицированных в случае, когда количество битов, назначенное квантованию, является маленьким, т.е. в случае низкой скорости передачи битов.

Во-первых, в случае высокой скорости передачи битов, речевой сигнал может классифицироваться в режим общего кодирования (GC) и режим кодирования перехода (TC) для простой структуры, как показано на фиг. 2A. В этом случае, режим GC включает в себя режим невокализированного кодирования (UC) и режим вокализованного кодирования (VC). В случае высокой скорости передачи битов, режим неактивного кодирования (IC) и режим кодирования аудио (AC) могут дополнительно включаться сюда, как показано на фиг. 2C.

В дополнение, в случае низкой скорости передачи битов, речевой сигнал может классифицироваться в режим GC, режим UC, режим VC, и режим TC, как показано на фиг. 2B. В дополнение, в случае низкой скорости передачи битов, режим IC и режим AC могут дополнительно включаться сюда, как показано на фиг. 2D.

На фиг. 2A и 2C, режим UC может выбираться тогда, когда речевой сигнал является невокализированным звуком или шумом, имеющим характеристики, аналогичные невокализированному звуку. Режим VC может выбираться, когда речевой сигнал является вокализованным звуком. Режим TC может использоваться, чтобы кодировать сигнал интервала перехода, в котором характеристики речевого сигнала быстро изменяются. Режим GC может использоваться, чтобы кодировать другие сигналы. Режим UC, режим VC, режим TC, и режим GC основываются на определении и критерии классификации, раскрытых в ITU-T G.718, но не ограничены этим.

На фиг. 2B и 2D, режим IC может выбираться для тихого звука, и режим AC может выбираться тогда, когда характеристики речевого сигнала являются приближенными к аудио.

Режимы кодирования могут дополнительно классифицироваться согласно диапазонам речевого сигнала.

Диапазоны речевого сигнала могут классифицироваться, например, в узкий диапазон (NB), широкий диапазон (WB), супер широкий диапазон (SWB), и полный диапазон (FB). NB может иметь ширину полосы от приблизительно 300 Гц до приблизительно 3400 Гц или от приблизительно 50 Гц до приблизительно 4000 Гц, WB может иметь ширину полосы от приблизительно 50 Гц до приблизительно 7000 Гц или от приблизительно 50 Гц до приблизительно 8000 Гц, SWB может иметь ширину полосы от приблизительно 50 Гц до приблизительно 14000 Гц или от приблизительно 50 Гц до приблизительно 16000 Гц, и FB может иметь ширину полосы вплоть до приблизительно 20000 Гц. Здесь, численные значения, относящиеся к ширинам полос, установлены для удобства и не ограничены этим. В дополнение, классификация диапазонов может устанавливаться более просто или с большей сложностью, чем вышеизложенное описание.

Кодировщик 119 переменного режима из фиг. 1 может кодировать коэффициенты LPC посредством использования разных алгоритмов кодирования, соответствующих режимам кодирования, показанным на фиг. 2A-2D. Когда типы режимов кодирования и количество режимов кодирования определяются, может иметься необходимость обучения кодовой книги снова посредством использования речевых сигналов, соответствующих определенным режимам кодирования.

Таблица 1 показывает пример схем и структур квантования в случае 4 режимов кодирования. Здесь, способ квантования, не использующий межкадровое предсказание, может называться страховочной схемой, и способ квантования, использующий межкадровое предсказание, может называться схемой с предсказанием. В дополнение, VQ обозначает модуль векторного квантования, и BC-TCQ обозначает модуль ограниченного по блокам решетчато кодированного квантования.

[Таблица 1]

Таблица 1 Режим кодирования Схема квантования Структура UC, NB/WB Страховочная VQ+BC-TCQ VC, NB/WB Страховочная
С предсказанием
VQ+BC-TCQ с межкадровым предсказанием + BC-TCQ с внутрикадровым предсказанием
GC, NB/WB Страховочная
С предсказанием
VQ+BC-TCQ с межкадровым предсказанием + BC-TCQ с внутрикадровым предсказанием
TC, NB/WB Страховочная VQ+BC-TCQ

Режимы кодирования могут изменяться согласно применяемой скорости передачи битов. Как описано выше, чтобы квантовать коэффициенты LPC при высокой скорости передачи битов с использованием двух режимов кодирования, 40 или 41 бит на кадр могут использоваться в режиме GC, и 46 битов в расчете на кадр могут использоваться в режиме TC.

Фиг. 3 является блок-схемой модуля 300 квантования коэффициентов LPC согласно одному примерному варианту осуществления.

Модуль 300 квантования коэффициентов LPC, показанный на фиг. 3, может включать в себя первый преобразователь 311 коэффициентов, определитель 313 весовой функции, модуль 315 квантования частот спектрального иммитанса (ISF)/частот спектральных линий (LSF), и второй преобразователь 317 коэффициентов. Каждый из компонентов модуля 300 квантования коэффициентов LPC может осуществляться посредством, по меньшей мере, одного процессора (например, центрального процессора (CPU)) посредством объединения, по меньшей мере, в одном модуле.

Как показано на фиг. 3, первый преобразователь 311 коэффициентов может преобразовывать коэффициенты LPC, извлеченные посредством выполнения анализа LP над концом кадра текущего или предыдущего кадра речевого сигнала, в коэффициенты в другом формате. Например, первый преобразователь 311 коэффициентов может преобразовывать коэффициенты LPC конца кадра текущего или предыдущего кадра в любой формат коэффициентов LSF и коэффициентов ISF. В этом случае, коэффициенты ISF или коэффициенты LSF показывают пример форматов, в которых коэффициенты LPC могут легко квантоваться.

Определитель 313 весовой функции может определять весовую функцию, относящуюся к важности коэффициентов LPC по отношению к концу кадра текущего кадра и концу кадра предыдущего кадра, посредством использования коэффициентов ISF или коэффициентов LSF, преобразованных из коэффициентов LPC. Определенная весовая функция может использоваться в процессе выбора пути квантования или поиска индекса кодовой книги, посредством которого минимизируются ошибки взвешивания в квантовании. Например, определитель 313 весовой функции может определять весовую функцию по амплитуде и весовую функцию по частоте.

В дополнение, определитель 313 весовой функции может определять весовую функцию посредством принятия в рассмотрение, по меньшей мере, одного из частотного диапазона, режима кодирования, и информации анализа спектра. Например, определитель 313 весовой функции может выводить оптимальную весовую функцию в расчете на режим кодирования. В дополнение, определитель 313 весовой функции может выводить оптимальную весовую функцию по частотному диапазону. Дополнительно, определитель 313 весовой функции может выводить оптимальную весовую функцию на основе информации частотного анализа речевого сигнала. Информация частотного анализа может включать в себя информацию наклона спектра. Определитель 313 весовой функции будет описываться более подробно ниже.

Модуль 315 квантования ISF/LSF может квантовать коэффициенты ISF или коэффициенты LSF, преобразованные из коэффициентов LPC конца кадра текущего кадра. Модуль 315 квантования ISF/LSF может получать оптимальный индекс квантования во входном режиме кодирования. Модуль 315 квантования ISF/LSF может квантовать коэффициенты ISF или коэффициенты LSF посредством использования весовой функции, определенной посредством определителя 313 весовой функции. Модуль 315 квантования ISF/LSF может квантовать коэффициенты ISF или коэффициенты LSF посредством выбора одного из множества путей квантования при использовании весовой функции, определенной посредством определителя 313 весовой функции. Как результат квантования, могут получаться индекс квантования коэффициентов ISF или коэффициентов LSF и коэффициенты квантованных ISF (QISF) или квантованных LSF (QLSF) по отношению к концу кадра текущего кадра.

Второй преобразователь 317 коэффициентов может преобразовывать коэффициенты QISF или QLSF в квантованные коэффициенты LPC (QLPC).

Теперь будет описываться отношение между векторным квантованием коэффициентов LPC и весовой функцией.

Векторное квантование указывает процесс выбора индекса кодовой книги, имеющего наименьшую ошибку, посредством использования меры среднеквадратического отклонения, при принятии в рассмотрение, что все элементы в векторе имеют одну и ту же важность. Однако, так как важность является разной в каждом из коэффициентов LPC, если ошибки важных коэффициентов уменьшаются, воспринимаемое качество конечного синтезированного сигнала может увеличиваться. Таким образом, когда коэффициенты LSF квантуются, устройства декодирования могут увеличивать характеристику синтезированного сигнала посредством применения весовой функции, представляющей важность каждого из коэффициентов LSF по отношению к мере среднеквадратического отклонения, и выбора оптимального индекса кодовой книги.

Согласно одному примерному варианту осуществления, весовая функция по амплитуде может определяться на основе того, что каждый из коэффициентов ISF или LSF фактически влияет на огибающую спектра, посредством использования частотной информации и фактических спектральных амплитуд коэффициентов ISF или LSF. Согласно одному примерному варианту осуществления, дополнительная эффективность квантования может получаться посредством комбинирования весовой функции по амплитуде и весовой функции по частоте при принятии в рассмотрение характеристик восприятия и распределения формант частотной области. Согласно одному примерному варианту осуществления, так как используется фактическая амплитуда частотной области, информация огибающей всех частот может отражаться хорошо, и вес каждого из коэффициентов ISF или LSF может корректно выводиться.

Согласно одному примерному варианту осуществления, когда выполняется векторное квантование коэффициентов ISF или LSF, преобразованных из коэффициентов LPC, если важность каждого коэффициента является разной, может определяться весовая функция, показывающая то, какой элемент является относительно более важным в векторе. В дополнение, чтобы улучшать точность кодирования, может определяться весовая функция, способная обеспечивать больший вес части высокой энергии, посредством анализа спектра кадра, подлежащего кодированию. Высокая спектральная энергия показывает высокую корреляцию во временной области.

Описывается пример применения такой весовой функции к функции ошибки.

Во-первых, если изменение входного сигнала является высоким, когда квантование выполняется без использования межкадрового предсказания, функция ошибки для поиска индекса кодовой книги посредством коэффициентов QISF может представляться посредством Уравнения 1 ниже. В противном случае, если изменение входного сигнала является низким, когда квантование выполняется с использованием межкадрового предсказания, функция ошибки для поиска индекса кодовой книги посредством коэффициентов QISF может представляться посредством Уравнения 2. Индекс кодовой книги указывает значение для минимизации соответствующей функции ошибки.

Здесь, w(i) обозначает весовую функцию, z(i) и r(i) обозначают вводы модуля квантования, z(i) обозначает вектор, в котором среднее значение удалено из ISF(i) на фиг. 3, и r(i) обозначает вектор, в котором значение межкадрового предсказания удалено из z(i). Ewerr(k) может использоваться, чтобы осуществлять поиск в кодовой книге в случае, когда межкадровое предсказание не выполняется, и Ewerr(p) может использоваться, чтобы осуществлять поиск в кодовой книге в случае, когда межкадровое предсказание выполняется. В дополнение, c(i) обозначает кодовую книгу, и p обозначает порядок коэффициентов ISF, который обычно равняется 10 в NB и от 16 до 20 в WB.

Согласно одному примерному варианту осуществления, устройства кодирования могут определять оптимальную весовую функцию посредством комбинирования весовой функции по амплитуде при использовании спектральных амплитуд, соответствующих частотам коэффициентов ISF или LSF, преобразованных из коэффициентов LPC, и весовой функции по частоте при принятии в рассмотрение характеристик восприятия и распределения формант входного сигнала.

Фиг. 4 является блок-схемой определителя 400 весовой функции согласно одному примерному варианту осуществления. Определитель 400 весовой функции показан вместе с оконным процессором 421, блоком 423 частотного преобразования, и модулем 425 вычисления амплитуды анализатора 410 спектра и LP.

Как показано на фиг. 4, оконный процессор 421 может применять окно к входному сигналу. Окно может быть прямоугольным окном, окном Хэмминга, или синусным окном.

Блок 423 частотного преобразования может преобразовывать входной сигнал во временной области во входной сигнал в частотной области. Например, блок 423 частотного преобразования может преобразовывать входной сигнал в частотную область посредством быстрого преобразования Фурье (FFT) или модифицированного дискретного косинусного преобразования (MDCT).

Модуль 425 вычисления амплитуды может вычислять амплитуды интервалов частотного спектра по отношению к входному сигналу, преобразованному в частотную область. Количество интервалов частотного спектра может быть таким же, как количество для нормализации коэффициентов ISF или LSF посредством определителя 400 весовой функции.

Информация анализа спектра может вводиться в определитель 400 весовой функции как результат, выполненный посредством анализатора 410 спектра и LP. В этом случае, информация анализа спектра может включать в себя наклон спектра.

Определитель 400 весовой функции может нормализовывать коэффициенты ISF или LSF, преобразованные из коэффициентов LPC. Диапазон, к которому нормализация фактически применяется из числа коэффициентов ISF p-ого порядка с 0-ого по (p-2)-ой порядок. Обычно, коэффициенты ISF с 0-ого по (p-2)-ой порядок существуют между 0 и π. Определитель 400 весовой функции может выполнять нормализацию с таким же числом K, что и количество интервалов частотного спектра, которое выведено посредством блока 423 частотного преобразования, чтобы использовать информацию анализа спектра.

Определитель 400 весовой функции может определять амплитудную весовую функцию W1(n), в которой коэффициенты ISF или LSF влияют на огибающую спектра для среднего подкадра, посредством использования информации анализа спектра. Например, определитель 400 весовой функции может определять амплитудную весовую функцию W1(n) посредством использования частотной информации коэффициентов ISF или LSF и фактических спектральных амплитуд входного сигнала. Амплитудная весовая функция W1(n) может определяться для коэффициентов ISF или LSF, преобразованных из коэффициентов LPC.

Определитель 400 весовой функции может определять амплитудную весовую функцию W1(n) посредством использования амплитуды интервала частотного спектра, соответствующего каждому из коэффициентов ISF или LSF.

Определитель 400 весовой функции может определять амплитудную весовую функцию W1(n) посредством использования амплитуд интервала спектра, соответствующего каждому из коэффициентов ISF или LSF, и, по меньшей мере, одного смежного интервала спектра, расположенного около упомянутого интервала спектра. В этом случае, определитель 400 весовой функции может определять амплитудную весовую функцию W1(n), относящуюся к огибающей спектра, посредством извлечения репрезентативного значения каждого интервала спектра и, по меньшей мере, одного смежного интервала спектра. Пример репрезентативного значения является максимальным значением, средним значением, или промежуточным значением интервала спектра, соответствующего каждому из коэффициентов ISF или LSF и, по меньшей мере, одному смежному интервалу спектра.

Определитель 400 весовой функции может определять частотную весовую функцию W2(n) посредством использования частотной информации коэффициентов ISF или LSF. Подробно, определитель 400 весовой функции может определять частотную весовую функцию W2(n) посредством использования характеристик восприятия и распределения формант входного сигнала. В этом случае, определитель 400 весовой функции может извлекать характеристики восприятия входного сигнала согласно шкале барков. Затем, определитель 400 весовой функции может определять частотную весовую функцию W2(n) на основе первой форманты распределения формант.

Частотная весовая функция W2(n) может давать результатом относительно низкий вес в супер низкой частоте и высокой частоте и давать результатом постоянный вес в частотном интервале низкой частоты, например, интервале, соответствующем первой форманте.

Определитель 400 весовой функции может определять конечную весовую функцию W(n) посредством комбинирования амплитудной весовой функции W1(n) и частотной весовой функции W2(n). В этом случае, определитель 400 весовой функции может определять конечную весовую функцию W(n) посредством умножения или добавления амплитудной весовой функции W1(n) на или к частотной весовой функции W2(n).

В качестве другого примера, определитель 400 весовой функции может определять амплитудную весовую функцию W1(n) и частотную весовую функцию W2(n) посредством принятия в рассмотрение режима кодирования и информации частотного диапазона входного сигнала.

Для этого, определитель 400 весовой функции может проверять режимы кодирования входного сигнала для случая, когда ширина полосы входного сигнала является NB, и случая, когда ширина полосы входного сигнала является WB, посредством проверки ширины полосы входного сигнала. Когда режим кодирования входного сигнала является режимом UC, определитель 400 весовой функции может определять и комбинировать амплитудную весовую функцию W1(n) и частотную весовую функцию W2(n) в режиме UC.

Когда режим кодирования входного сигнала не является режимом UC, определитель 400 весовой функции может определять и комбинировать амплитудную весовую функцию W1(n) и частотную весовую функцию W2(n) в режиме VC.

Если режим кодирования входного сигнала является режимом GC или режимом TC, определитель 400 весовой функции может определять весовую функцию посредством такого же процесса, что и в режиме VC.

Например, когда входной сигнал частотно преобразовывается посредством алгоритма FFT, амплитудная весовая функция W1(n), использующая спектральные амплитуды FFT коэффициентов, может определяться посредством Уравнения 3 ниже.

Где

Например, частотная весовая функция W2(n) в режиме VC может определяться посредством Уравнения 4, и частотная весовая функция W2(n) в режиме UC может определяться посредством Уравнения 5. Постоянные в Уравнениях 4 и 5 могут изменяться согласно характеристикам входного сигнала:

Для, (4)

Для,

Для,

Для, .(5)

Для,

В конечном счете выводимая весовая функция W(n) может определяться посредством Уравнения 6.

для (6)

Фиг. 5 является блок-схемой модуля квантования коэффициентов LPC согласно одному примерному варианту осуществления.

Как показано на фиг. 5, модуль 500 квантования коэффициентов LPC может включать в себя определитель 511 весовой функции, определитель 513 пути квантования, первую схему 515 квантования, и вторую схему 517 квантования. Так как определитель 511 весовой функции был описан на фиг. 4, здесь его описание пропускается.

Определитель 513 пути квантования может определять, что один из множества путей, включающего в себя первый путь, не использующий межкадровое предсказание, и второй путь, использующий межкадровое предсказание, выбирается в качестве пути квантования входного сигнала, на основе некоторого критерия до квантования входного сигнала.

Первая схема 515 квантования может квантовать входной сигнал, обеспеченный от определителя 513 пути квантования, когда в качестве пути квантования входного сигнала выбирается первый путь. Первая схема 515 квантования может включать в себя первый модуль квантования (не показан) для грубого квантования входного сигнала и второй модуль квантования (не показан) для точного квантования сигнала ошибки квантования между входным сигналом и выходным сигналом первого модуля квантования.

Вторая схема 517 квантования может квантовать входной сигнал, обеспеченный от определителя 513 пути квантования, когда в качестве пути квантования входного сигнала выбирается второй путь. Первая схема 515 квантования может включать в себя элемент для выполнения ограниченного по блокам решетчато кодированного квантования над ошибкой предсказания входного сигнала и значением межкадрового предсказания и элемент межкадрового предсказания.

Первая схема 515 квантования является схемой квантования, не использующей межкадровое предсказание, и может называться страховочной схемой. Вторая схема 517 квантования является схемой квантования, использующей межкадровое предсказание, и может называться схемой с предсказанием.

Первая схема 515 квантования и вторая схема 517 квантования не ограничены текущим примерным вариантом осуществления и могут осуществляться посредством использования первой и второй схем квантования согласно различным примерным вариантам осуществления, описанным ниже, соответственно.

Соответственно, в соответствии с низкой скоростью передачи битов для высоко эффективной интерактивной услуги передачи речи до высокой скорости передачи битов для обеспечения услуги различимого качества, может выбираться оптимальный модуль квантования.

Фиг. 6 является блок-схемой определителя пути квантования согласно одному примерному варианту осуществления. Как показано на фиг. 6, определитель 600 пути квантования может включать в себя модуль 611 вычисления ошибки предсказания и модуль 613 выбора схемы квантования.

Модуль 611 вычисления ошибки предсказания может вычислять ошибку предсказания различными способами посредством приема значения межкадрового предсказания p(n), весовой функции W(n), и коэффициента LSF z(n), из которого значение постоянного тока (DC) удалено. Во-первых, может использоваться модуль межкадрового предсказания (не показан), который является таким же как используемый во второй схеме квантования, т.е. схеме с предсказанием. Здесь, может использоваться любой из метода авторегрессии (AR) и метода скользящих средних (MA). Сигнал z(n) предыдущего кадра для межкадрового предсказания может использовать квантованное значение или неквантованное значение. В дополнение, ошибка предсказания может получаться посредством использования или не использования весовой функции w(n). Соответственно, полное количество комбинаций равняется 8, 4 из которых являются следующими:

Во-первых, взвешенная AR ошибка предсказания, использующая квантованный сигнал предыдущего кадра, может представляться посредством Уравнения 7.

(7)

Во-вторых, AR ошибка предсказания, использующая квантованный сигнал предыдущего кадра, может представляться посредством Уравнения 8.

(8)

В-третьих, взвешенная AR ошибка предсказания, использующая сигнал z(n) предыдущего кадра, может представляться посредством Уравнения 9.

(9)

В-четвертых, AR ошибка предсказания, использующая сигнал z(n) предыдущего кадра, может представляться посредством Уравнения 10.

(10)

В Уравнениях 7-10, M обозначает порядок коэффициентов LSF и M обычно равняется 16, когда ширина полосы входного речевого сигнала является WB, и обозначает коэффициент предсказания метода AR. Как описано выше, в общем, используется информация относительно непосредственно предыдущего кадра, и схема квантования может определяться посредством использования ошибки предсказания, полученной из вышеизложенного описания.

В дополнение, для случая, когда информация относительно предыдущего кадра не существует вследствие ошибок кадров в предыдущем кадре, вторая ошибка предсказания может получаться посредством использования кадра непосредственно перед предыдущим кадром, и схема квантования может определяться посредством использования второй ошибки предсказания. В этом случае, вторая ошибка предсказания может представляться посредством Уравнения 11 ниже по сравнению с Уравнением 7.

(11)

Модуль 613 выбора схемы квантования определяет схему квантования текущего кадра посредством использования, по меньшей мере, одного из ошибки предсказания, полученной посредством модуля 611 вычисления ошибки предсказания, и режима кодирования, полученного посредством определителя режима кодирования (115 на фиг. 1).

Фиг. 7A является блок-схемой последовательности операций, иллюстрирующей работу определителя пути квантования по фиг. 6, согласно одному примерному варианту осуществления. В качестве примера, в качестве режима предсказания могут использоваться 0, 1 и 2. В режиме предсказания 0, может использоваться только страховочная схема, и в модели предсказания может использоваться только схема с предсказанием. В режиме предсказания 2, страховочная схема и схема с предсказанием могут переключаться.

Сигнал, подлежащий кодированию в режиме предсказания 0, имеет нестационарную характеристику. Нестационарный сигнал имеет большое изменение между соседними кадрами. Поэтому, если межкадровое предсказание выполняется над нестационарным сигналом, ошибка предсказания может быть более большой, чем исходный сигнал, что дает результатом ухудшение в производительности модуля квантования. Сигнал, подлежащий кодированию в режиме предсказания 1, имеет стационарную характеристику. Так как стационарный сигнал имеет маленькое изменение между соседними кадрами, его межкадровая корреляция является высокой. Оптимальная производительность может получаться посредством выполнения в режиме предсказания 2 квантования сигнала, в котором нестационарная характеристика и стационарная характеристика смешаны. Даже хотя сигнал имеет как нестационарную характеристику, так и стационарную характеристику, может устанавливаться либо режим предсказания 0, либо режим предсказания 1, на основе отношения смешивания. Тем временем, отношение смешивания, подлежащее установке в режиме предсказания 2, может определяться как оптимальное значение заранее экспериментально или посредством моделирований.

Как показано на фиг. 7A, в операции 711, определяется, равняется ли режим предсказания текущего кадра 0, т.е. имеет ли речевой сигнал текущего кадра нестационарную характеристику. Как результат определения в операции 711, если режим предсказания равняется 0, например, когда изменение речевого сигнала текущего кадра является большим как в режиме TC или режиме UC, так как межкадровое предсказание является трудоемким, в качестве пути квантования в операции 714 может определяться страховочная схема, т.е. первая схема квантования.

Как результат определения в операции 711, если режим предсказания не равняется 0, в операции 712 определяется, равняется ли режим предсказания 1, т.е. имеет ли речевой сигнал текущего кадра стационарную характеристику. Как результат определения в операции 712, если режим предсказания равняется 1, так как производительность межкадрового предсказания является превосходной, в качестве пути квантования в операции 715 может определяться схема с предсказанием, т.е. вторая схема квантования.

Как результат определения в операции 712, если режим предсказания не равняется 1, определяется, что режим предсказания равняется 2, чтобы использовать первую схему квантования и вторую схему квантования способом переключения. Например, когда речевой сигнал текущего кадра не имеет нестационарную характеристику, т.е. когда режим предсказания равняется 2 в режиме GC или режиме VC, одна из первой схемы квантования и второй схемы квантования может определяться в качестве пути квантования посредством принятия в рассмотрение ошибки предсказания. Для этого, в операции 713 определяется, является ли первая ошибка предсказания между текущим кадром и предыдущим кадром более большой, чем первое пороговое значение. Первое пороговое значение может определяться заранее в качестве оптимального значения экспериментально или посредством моделирований. Например, в случае WB, имеющего порядок 16, первое пороговое значение может устанавливаться на 2085975.

Как результат определения в операции 713, если первая ошибка предсказания больше, чем или равна первому пороговому значению, в операции 714 в качестве пути квантования может определяться первая схема квантования. Как результат определения в операции 713, если первая ошибка предсказания не больше, чем первое пороговое значение, в операции 715 в качестве пути квантования может определяться схема с предсказанием, т.е. вторая схема квантования.

Фиг. 7B является блок-схемой последовательности операций, иллюстрирующей работу определителя пути квантования по фиг. 6, согласно другому примерному варианту осуществления.

Как показано на фиг. 7B, операции 731 по 733 являются идентичными операциям 711 по 713 из фиг. 7A, и дополнительно содержится операция 734, в которой вторая ошибка предсказания между кадром непосредственно перед предыдущим кадром и текущим кадром должна сравниваться со вторым пороговым значением. Второе пороговое значение может определяться заранее в качестве оптимального значения экспериментально или посредством моделирований. Например, в случае WB, имеющего порядок 16, второе пороговое значение может устанавливаться на (первое пороговое значение ×1,1).

Как результат определения в операции 734, если вторая ошибка предсказания больше, чем или равна второму пороговому значению, страховочная схема, т.е. первая схема квантования, может определяться в качестве пути квантования в операции 735. Как результат определения в операции 734, если вторая ошибка предсказания не больше, чем второе пороговое значение, схема с предсказанием, т.е. вторая схема квантования, может определяться в качестве пути квантования в операции 736.

Хотя на фиг. 7A и 7B количество режимов предсказания равняется 3, настоящее изобретение не ограничено этим.

Тем временем, в определении схемы квантования, может дополнительно использоваться дополнительная информация помимо режима предсказания или ошибки предсказания.

Фиг. 8 является блок-схемой определителя пути квантования согласно одному примерному варианту осуществления. Как показано на фиг. 8, определитель 800 пути квантования может включать в себя модуль 811 вычисления ошибки предсказания, анализатор 813 спектра, и модуль 815 выбора схемы квантования.

Так как модуль 811 вычисления ошибки предсказания является идентичным модулю 611 вычисления ошибки предсказания по фиг. 6, его подробное описание пропускается.

Анализатор 813 спектра может определять характеристики сигнала текущего кадра посредством анализа информации спектра. Например, в анализаторе 813 спектра, взвешенное расстояние D между N (N является целым числом, большим, чем 1) предыдущими кадрами и текущим кадром может получаться посредством использования информации спектральной амплитуды в частотной области, и когда взвешенное расстояние больше, чем пороговое значение, т.е. когда межкадровое изменение является большим, в качестве схемы квантования может определяться страховочная схема. Так как количество объектов, подлежащих сравнению, увеличивается по мере того, как N увеличивается, сложность увеличивается по мере того, как N увеличивается. Взвешенное расстояние D может получаться с использованием Уравнения 12 ниже. Чтобы получить взвешенное расстояние D с низкой сложностью, текущий кадр может сравниваться с предыдущими кадрами посредством использования только спектральных амплитуд около частоты, определенной посредством LSF/ISF. В этом случае, среднее значение, максимальное значение, или промежуточное значение амплитуд M частотных интервалов около частоты, определенной посредством LSF/ISF, может сравниваться с предыдущими кадрами.

, где M=16 (12)

В Уравнении 12, весовая функция Wk(i) может получаться посредством Уравнения 3, описанного выше, и является идентичной W1(n) из Уравнения 3. В Dn, n обозначает разность между предыдущим кадром и текущим кадром. Случай n=1 показывает взвешенное расстояние между непосредственно предыдущим кадром и текущим кадром, и случай n=2 показывает взвешенное расстояние между вторым предыдущим кадром и текущим кадром. Когда значение Dn больше, чем пороговое значение, может определяться, что текущий кадр имеет нестационарную характеристику.

Модуль 815 выбора схемы квантования может определять путь квантования текущего кадра посредством приема ошибок предсказания, обеспечиваемых от модуля 811 вычисления ошибки предсказания, и характеристик сигнала, режима предсказания, и информации канала передачи, обеспечиваемых от анализатора 813 спектра. Например, информации, вводимой в модуль 815 выбора схемы квантования, могут назначаться приоритеты для последовательного рассмотрения, когда выбирается путь квантования. Например, когда режим высокой частоты ошибок кадров (FER) включен в информацию канала передачи, отношение выбора страховочной схемы может устанавливаться относительно высоким, или может выбираться только страховочная схема. Отношение выбора страховочной схемы может переменным образом устанавливаться посредством регулировки порогового значения, относящегося к ошибкам предсказания.

Фиг. 9 иллюстрирует информацию относительно состояния канала, передаваемого в сетевом конце, когда обеспечивается служба кодека.

Так как состояние канала является плохим, ошибки канала увеличиваются, и, как результат, межкадровое изменение может быть большим, давая результатом возникновение ошибок кадров. Таким образом, отношение выбора схемы с предсказанием в качестве пути квантования уменьшается и отношение выбора страховочной схемы увеличивается. Когда состояние канала является в высшей степени плохим, в качестве пути квантования может использоваться только страховочная схема. Для этого, значение, показывающее состояние канала посредством комбинирования множества частей информации канала передачи, выражается с помощью одного или более уровней. Высокий уровень показывает состояние, в котором вероятность ошибки канала является высокой. Наиболее простой случай является случаем, когда количество уровней равняется 1, т.е. случаем, когда состояние канала определяется как режим высокой FER посредством определителя 911 режима высокой FER, как показано на фиг. 9. Так как режим высокой FER показывает, что состояние канала является очень нестабильным, кодирование выполняется посредством использования наивысшего отношения выбора страховочной схемы или с использованием только страховочной схемы. Когда количество уровней является множественным, отношение выбора страховочной схемы может устанавливаться уровень за уровнем.

Как показано на фиг. 9, алгоритм определения режима высокой FER в определителе 911 режима высокой FER может выполняться посредством, например, 4 частей информации. Подробно, 4 части информации могут быть (1) информацией быстрой обратной связи (FFB), которая является обратной связью гибридного автоматического запроса повторения (HARQ), передаваемой в физический слой, (2) информацией медленной обратной связи (SFB), которая обеспечивается из сетевой сигнализации, передаваемой в более высокий слой, чем физический слой, (3) информацией внутри-диапазонной обратной связи (ISB), которая сигнализируется внутри диапазона от декодера 913 EVS в дальнем конце, и (4) информацией кадра высокой чувствительности (HSF), которая выбирается кодировщиком 915 EVS по отношению к конкретному критическому кадру, подлежащему передаче избыточным способом. В то время как информация FFB и информация SFB являются независимыми от кодека EVS, информация ISB и информация HSF являются зависящими от кодека EVS и могут требовать конкретных алгоритмов для кодека EVS.

Алгоритм определения состояния канала как режима высокой FER посредством использования 4 частей информации, может быть выражен посредством, например, следующего кода как таблицы 2-4.

[Таблица 2]

Таблица 2 Определения SFBavg: Средняя частота ошибок по Ns кадрам
FFBavg: Средняя частота ошибок по Nf кадрам
ISBavg: Средняя частота ошибок по Ni кадрам
Ts: Пороговое значение для частоты ошибок медленной обратной связи
Tf: Пороговое значение для частоты ошибок быстрой обратной связи
Ti: Пороговое значение для частоты ошибок обратной связи внутри диапазона

[Таблица 3]

Таблица 3 Установка в течение инициализации Ns=100 Nf=10 Ni=100 Ts=20 Tf=2 Ti=20

[Таблица 4]

Таблица 4 Алгоритм Цикл по каждому кадру {HFM=0; ЕСЛИ((HiOK) И SFBavg>Ts) ТОГДА HFM=1; ИНАЧЕ ЕСЛИ ((HiOK) И FFBavg>Tf) ТОГДА HFM=1; ИНАЧЕ ЕСЛИ ((HiOK) И ISBavg>TI) ТОГДА HFM=1; ИНАЧЕ ЕСЛИ ((HiOK) И (HSF=1) ТОГДА HFM=1; Обновление SFBavg; Обновление FFBavg; Обновление ISBavg;}

Как выше, кодек EVS может даваться указание, чтобы входить в режим высокой FER на основе информации анализа, обработанной с помощью одной или более из 4 частей информации. Информация анализа может быть, например, (1) SFBavg, выведенной из вычисленной средней частоты ошибок Ns кадров посредством использования информации SFB, (2) FFBavg, выведенной из вычисленной средней частоты ошибок Nf кадров посредством использования информации FFB, и (3) ISBavg, выведенной из вычисленной средней частоты ошибок Ni кадров посредством использования информации ISB, и пороговыми значениями Ts, Tf, и Ti информации SFB, информации FFB, и информации ISB, соответственно. Может определяться, что определяется, что кодек EVS входит в режим высокой FER, на основе результата сравнения SFBavg, FFBavg, и ISBavg с пороговыми значениями Ts, Tf, и Ti, соответственно. Для всех условий, может проверяться HiOK в отношении того, поддерживает ли обыкновенно каждый кодек режим высокой FER.

Определитель 911 режима высокой FER может включаться в качестве компонента кодировщика 915 EVS или кодировщика другого формата. Альтернативно, определитель 911 режима высокой FER может осуществляться в другом внешнем устройстве, другом, нежели компонент кодировщика 915 EVS или кодировщика другого формата.

Фиг. 10 является блок-схемой модуля 1000 квантования коэффициентов LPC согласно другому примерному варианту осуществления.

Как показано на фиг. 10, модуль 1000 квантования коэффициентов LPC может включать в себя определитель 1010 пути квантования, первую схема 1030 квантования, и вторую схему 1050 квантования.

Определитель 1010 пути квантования определяет один из первого пути, включающего в себя страховочную схему, и второго пути, включающего в себя схему с предсказанием, в качестве пути квантования текущего кадра, на основе, по меньшей мере, одного из ошибки предсказания и режима кодирования.

Первая схема 1030 квантования выполняет квантование без использования межкадрового предсказания, когда в качестве пути квантования определяется первый путь, и может включать в себя модуль многоэтапного векторного квантования (MSVQ) 1041 и модуль решеточного векторного квантования (LVQ) 1043. MSVQ 1041 может предпочтительно включать в себя два этапа. MSVQ 1041 генерирует индекс квантования посредством грубого выполнения векторного квантования коэффициентов LSF, из которых значение DC удалено. LVQ 1043 генерирует индекс квантования посредством выполнения квантования посредством приема ошибок квантования LSF между обратными коэффициентами QLSF, выводимыми из MSVQ 1041, и коэффициентов LSF, из которых значение DC удалено. Конечные коэффициенты QLSF генерируются посредством сложения вывода MSVQ 1041 и вывода LVQ 1043 и затем добавления значения DC к результату сложения. Первая схема 1030 квантования может осуществлять очень эффективную структуру модуля квантования посредством использования комбинации MSVQ 1041, имеющего превосходную производительность при низкой скорости передачи битов, хотя большой размер памяти является необходимым для кодовой книги, и LVQ 1043, который является эффективным на низкой скорости передачи битов с малым размером памяти и низкой сложностью.

Вторая схема 1050 квантования выполняет квантование с использованием межкадрового предсказания, когда в качестве пути квантования определяется второй путь, и может включать в себя BC-TCQ 1063, который имеет модуль 1065 внутрикадрового предсказания, и модуль 1061 межкадрового предсказания. Модуль 1061 межкадрового предсказания может использовать любой из метода AR и метода MA. Например, применяется метод AR первого порядка. Коэффициент предсказания определяется заранее, и вектор, выбранный в качестве оптимального вектора в предыдущем кадре, используется в качестве последнего вектора для предсказания. Ошибки предсказания LSF, полученные из значений предсказания модуля 1061 межкадрового предсказания, квантуются посредством BC-TCQ 1063, имеющего модуль 1065 внутрикадрового предсказания. Соответственно, может максимизироваться характеристика BC-TCQ 1063, имеющего превосходную производительность квантования с маленьким размером памяти и низкой сложностью при высокой скорости передачи битов.

Как результат, когда используются первая схема 1030 квантования и вторая схема 1050 квантования, может осуществляться оптимальный модуль квантования в соответствии с характеристиками входного речевого сигнала.

Например, когда 41 бит используется в модуле 1000 квантования коэффициентов LPC, чтобы квантовать речевой сигнал в режиме GC с WB 8 кГц, 12 битов и 28 битов могут назначаться MSVQ 1041 и LVQ 1043 первой схемы 1030 квантования, соответственно, за исключением 1 бита, показывающего информацию пути квантования. В дополнение, 40 битов могут назначаться BC-TCQ 1063 второй схемы 1050 квантования за исключением 1 бита, показывающего информацию пути квантования.

Таблица 5 показывает пример, в котором биты назначаются речевому сигналу WB диапазона 8 кГц.

[Таблица 5]

Таблица 5 Режим кодирования Схема квантования LSF/ISF MSVQ-LVQ [биты] BC-TCQ [биты] GC, WB Страховочная
С предсказанием
40/41- -40/41
TC, WB Страховочная 41 -

Фиг. 11 является блок-схемой модуля квантования коэффициентов LPC согласно другому примерному варианту осуществления. Модуль 1100 квантования коэффициентов LPC, показанный на фиг. 11, имеет структуру, противоположную структуре, показанной на фиг. 10.

Как показано на фиг. 11, модуль 1100 квантования коэффициентов LPC может включать в себя определитель 1110 пути квантования, первую схему 1130 квантования, и вторую схему 1150 квантования.

Определитель 1110 пути квантования определяет один из первого пути, включающего в себя страховочную схему, и второго пути, включающего в себя схему с предсказанием, в качестве пути квантования текущего кадра, на основе, по меньшей мере, одного из ошибки предсказания и режима предсказания.

Первая схема 1130 квантования выполняет квантование без использования межкадрового предсказания, когда в качестве пути квантования выбирается первый путь, и может включать в себя модуль векторного квантования (VQ) 1141 и BC-TCQ 1143, имеющий модуль 1145 внутрикадрового предсказания. VQ 1141 генерирует индекс квантования посредством грубого выполнения векторного квантования коэффициентов LSF, из которых значение DC удалено. BC-TCQ 1143 генерирует индекс квантования посредством выполнения квантования посредством приема ошибок квантования LSF между обратными коэффициентами QLSF, выводимыми из VQ 1141, и коэффициентами LSF, из которых значение DC удалено. Конечные коэффициенты QLSF генерируются посредством сложения вывода VQ 1141 и вывода BC-TCQ 1143 и затем добавления значения DC к результату добавления.

Вторая схема 1150 квантования выполняет квантование с использованием межкадрового предсказания, когда в качестве пути квантования определяется второй путь, и может включать в себя LVQ 1163 и модуль 1161 межкадрового предсказания. Модуль 1161 межкадрового предсказания может осуществляться таким же, как или аналогичным модулю межкадрового предсказания из фиг. 10. Ошибки предсказания LSF, полученные из значений предсказания модуля 1161 межкадрового предсказания, квантуются посредством LVQ 1163.

Соответственно, так как количество битов, назначаемое BC-TCQ 1143, является маленьким, BC-TCQ 1143 имеет низкую сложность, и так как LVQ 1163 имеет низкую сложность при высокой скорости передачи битов, квантование может, в общем, выполняться с низкой сложностью.

Например, когда 41 бит используется в модуле 1100 квантования коэффициентов LPC, чтобы квантовать речевой сигнал в режиме GC с WB 8 кГц, 6 битов и 34 бита могут назначаться VQ 1141 и BC-TCQ 1143 первой схемы 1130 квантования, соответственно, за исключением 1 бита, показывающего информацию пути квантования. В дополнение, 40 битов могут назначаться LVQ 1163 второй схемы 1150 квантования за исключением 1 бита, показывающего информацию пути квантования.

Таблица 6 показывает пример, в котором биты назначаются речевому сигналу WB диапазона 8 кГц.

[Таблица 6]

Таблица 6 Режим кодирования Схема квантования LSF/ISF MSVQ-LVQ [биты] BC-TCQ [биты] GC, WB Страховочная
С предсказанием
-40/41 40/41-
TC, WB Страховочная - 41

Оптимальный индекс, относящийся к VQ 1141, используемому в большинстве режимов кодирования, может получаться посредством поиска индекса для минимизации Ewerr(p) из Уравнения 13.

(13)

В Уравнении 13, w(i) обозначает весовую функцию, определенную в определителе весовой функции (313 по фиг. 3), r(i) обозначает ввод VQ 1141, и c(i) обозначает вывод VQ 1141. То есть, получается индекс для минимизации взвешенного искажения между r(i) и c(i).

Мера искажения d(x, y), используемая в BC-TCQ 1143, может представляться посредством Уравнения 14.

(14)

Согласно одному примерному варианту осуществления, взвешенное искажение может получаться посредством применения весовой функции wk к мере искажения d(x, y), как представлено посредством Уравнения 15.

(15)

То есть, оптимальный индекс может получаться посредством получения взвешенного искажения во всех этапах BC-TCQ 1143.

Фиг. 12 является блок-схемой модуля квантования коэффициентов LPC согласно другому примерному варианту осуществления.

Как показано на фиг. 12, модуль 1200 квантования коэффициентов LPC может включать в себя определитель 1210 пути квантования, первую схему 1230 квантования, и вторую схему 1250 квантования.

Определитель 1210 пути квантования определяет один из первого пути, включающего в себя страховочную схему, и второго пути, включающего в себя схему с предсказанием, в качестве пути квантования текущего кадра, на основе, по меньшей мере, одного из ошибки предсказания и режима предсказания.

Первая схема 1230 квантования выполняет квантование без использования межкадрового предсказания, когда в качестве пути квантования определяется первый путь, и может включать в себя VQ или MSVQ 1241 и LVQ или TCQ 1243. VQ или MSVQ 1241 генерирует индекс квантования посредством грубого выполнения векторного квантования коэффициентов LSF, из которых значение DC удалено. LVQ или TCQ 1243 генерирует индекс квантования посредством выполнения квантования посредством приема ошибок квантования LSF между обратными коэффициентами QLSF, выводимыми из VQ 1141, и коэффициентами LSF, из которых значение DC удалено. Конечные коэффициенты QLSF генерируются посредством сложения вывода VQ или MSVQ 1241 и вывода LVQ или TCQ 1243 и затем добавления значения DC к результату сложения. Так как VQ или MSVQ 1241 имеет хорошую частоту появления ошибочных битов, хотя VQ или MSVQ 1241 имеет высокую сложность и использует большую величину памяти, количество этапов VQ или MSVQ 1241 может увеличиваться от 1 до n посредством принятия в рассмотрение полной сложности. Например, когда используется только первый этап, VQ или MSVQ 1241 становится VQ, и когда используются два или более этапов, VQ или MSVQ 1241 становится MSVQ. В дополнение, так как LVQ или TCQ 1243 имеет низкую сложность, ошибки квантования LSF могут эффективно квантоваться.

Вторая схема 1250 квантования выполняет квантование с использованием межкадрового предсказания, когда в качестве пути квантования определяется второй путь, и может включать в себя модуль 1261 межкадрового предсказания и LVQ или TCQ 1263. Модуль 1261 межкадрового предсказания может осуществляться таким же, как или аналогичным модулю межкадрового предсказания на фиг. 10. Ошибки предсказания LSF, полученные из значений предсказания модуля 1261 межкадрового предсказания, квантуются посредством LVQ или TCQ 1263. Подобным образом, так как LVQ или TCQ 1243 имеет низкую сложность, ошибки предсказания LSF могут эффективно квантоваться. Соответственно, квантование может, в общем, выполняться с низкой сложностью.

Фиг. 13 является блок-схемой модуля квантования коэффициентов LPC согласно другому примерному варианту осуществления.

Как показано на фиг. 13, модуль 1300 квантования коэффициентов LPC может включать в себя определитель 1310 пути квантования, первую схему 1330 квантования, и вторую схему 1350 квантования.

Определитель 1310 пути квантования определяет один из первого пути, включающего в себя страховочную схему, и второго пути, включающего в себя схему с предсказанием, в качестве пути квантования текущего кадра, на основе, по меньшей мере, одного из ошибки предсказания и режима предсказания.

Первая схема 1330 квантования выполняет квантование без использования межкадрового предсказания, когда в качестве пути квантования определяется первый путь, и так как первая схема 1330 квантования является такой же как, схема, показана на фиг. 12, его описание пропускается.

Вторая схема 1350 квантования выполняет квантование с использованием межкадрового предсказания, когда в качестве пути квантования определяется второй путь, и может включать в себя модуль 1361 межкадрового предсказания, VQ или MSVQ 1363, и LVQ или TCQ 1365. Модуль 1361 межкадрового предсказания может осуществляться таким же, как или аналогичным модулю межкадрового предсказания из фиг. 10. Ошибки предсказания LSF, полученные с использованием значений предсказания модуля 1361 межкадрового предсказания, грубо квантуются посредством VQ или MSVQ 1363. Вектор ошибок между ошибками предсказания LSF и деквантованными ошибками предсказания LSF, выведенными из VQ или MSVQ 1363, квантуется посредством LVQ или TCQ 1365. Подобным образом, так как LVQ или TCQ 1365 имеет низкую сложность, ошибки предсказания LSF могут эффективно квантоваться. Соответственно, квантование может, в общем, выполняться с низкой сложностью.

Фиг. 14 является блок-схемой модуля квантования коэффициентов LPC согласно другому примерному варианту осуществления. По сравнению с модулем 1200 квантования коэффициентов LPC, показанным на фиг. 12, модуль 1400 квантования коэффициентов LPC имеет отличие в том, что первая схема 1430 квантования включает в себя BC-TCQ 1443, имеющий модуль 1445 внутрикадрового предсказания, вместо LVQ или TCQ 1243, и вторая схема 1450 квантования включает в себя BC-TCQ 1463, имеющий модуль 1465 внутрикадрового предсказания, вместо LVQ или TCQ 1263.

Например, когда 41 бит используется в модуле 1400 квантования коэффициентов LPC, чтобы квантовать речевой сигнал в режиме GC с WB 8 кГц, 5 битов и 35 битов могут назначаться VQ 1441 и BC-TCQ 1443 первой схемы 1430 квантования, соответственно, за исключением 1 бита, показывающего информацию пути квантования. В дополнение, 40 битов могут назначаться BC-TCQ 1463 второй схемы 1450 квантования за исключением 1 бита, показывающего информацию пути квантования.

Фиг. 15 является блок-схемой модуля квантования коэффициентов LPC согласно другому примерному варианту осуществления. Модуль 1500 квантования коэффициентов LPC, показанный на фиг. 15, является конкретным примером модуля 1300 квантования коэффициентов LPC, показанного на фиг. 13, при этом MSVQ 1541 первой схемы 1530 квантования и MSVQ 1563 второй схемы 1550 квантования имеют два этапа.

Например, когда 41 бит используется в модуле 1500 квантования коэффициентов LPC, чтобы квантовать речевой сигнал в режиме GC с WB 8 кГц, 6+6=12 битов и 28 битов могут назначаться двухэтапному MSVQ 1541 и LVQ 1543 первой схемы 1530 квантования, соответственно, за исключением 1 бита, показывающего информацию пути квантования. В дополнение, 5+5=10 битов и 30 битов могут назначаться двухэтапному MSVQ 1563 и LVQ 1565 второй схемы 1550 квантования, соответственно.

Фиг. 16A и 16B являются блок-схемами модулей квантования коэффициентов LPC согласно другим примерным вариантам осуществления. В частности, модули 1610 и 1630 квантования коэффициентов LPC, показанные на фиг. 16A и 16B, соответственно, могут использоваться, чтобы формировать страховочную схему, т.е. первую схему квантования.

Модуль 1610 квантования коэффициентов LPC, показанный на фиг. 16A, может включать в себя VQ 1621 и TCQ или BC-TCQ 1623, имеющий модуль 1625 внутрикадрового предсказания, и модуль 1630 квантования коэффициентов LPC, показанный на фиг. 16B, может включать в себя VQ или MSVQ 1641 и TCQ или LVQ 1643.

Как показано на фиг. 16A и 16B, VQ 1621 или VQ или MSVQ 1641 грубо квантует весь входной вектор с маленьким количеством битов, и TCQ или BC-TCQ 1623 или TCQ или LVQ 1643 точно квантует ошибки квантования LSF.

Когда для каждого кадра используется только страховочная схема, т.е. первая схема квантования, способ списочного алгоритма Витерби (LVA) может применяться для дополнительного улучшения производительности. То есть, так как имеется пространство в терминах сложности по сравнению со способом переключения, когда используется только первая схема квантования, может применяться способ LVA, достигающий улучшение производительности посредством увеличения сложности в операции поиска. Например, посредством применения способа LVA к BC-TCQ, может устанавливаться таким образом, что сложность структуры LVA является более низкой, чем сложность структуры переключения, даже хотя сложность структуры LVA увеличивается.

Фиг. 17A-17C являются блок-схемами модулей квантования коэффициентов LPC согласно другим примерным вариантам осуществления, которые в частности имеют структуру BC-TCQ, использующую весовую функцию.

Как показано на фиг. 17A, модуль квантования коэффициентов LPC может включать в себя определитель 1710 весовой функции и схему 1720 квантования, включающую в себя BC-TCQ 1721, имеющий модуль 1723 внутрикадрового предсказания.

Как показано на фиг. 17B, модуль квантования коэффициентов LPC может включать в себя определитель 1730 весовой функции и схему 1740 квантования, включающую в себя BC-TCQ 1743, который имеет модуль 1745 внутрикадрового предсказания, и модуль 1741 межкадрового предсказания. Здесь, 40 битов могут назначаться BC-TCQ 1743.

Как показано на фиг. 17C, модуль квантования коэффициентов LPC может включать в себя определитель 1750 весовой функции и схему 1760 квантования, включающую в себя BC-TCQ 1763, который имеет модуль 1765 внутрикадрового предсказания, и VQ 1761. Здесь, 5 битов и 40 битов могут назначаться VQ 1761 и BC-TCQ 1763, соответственно.

Фиг. 18 является блок-схемой модуля квантования коэффициентов LPC согласно другому примерному варианту осуществления.

Как показано на фиг. 18, модуль 1800 квантования коэффициентов LPC может включать в себя первую схему 1810 квантования, вторую схему 1830 квантования, и определитель 1850 пути квантования.

Первая схема 1810 квантования выполняет квантование без использования межкадрового предсказания и может использовать комбинацию MSVQ 1821 и LVQ 1823 для улучшения производительности квантования. MSVQ 1821 может предпочтительно включать в себя два этапа. MSVQ 1821 генерирует индекс квантования посредством грубого выполнения векторного квантования коэффициентов LSF, из которых значение DC удалено. LVQ 1823 генерирует индекс квантования посредством выполнения квантования посредством приема ошибок квантования LSF между обратными коэффициентами QLSF, выводимыми из MSVQ 1821, и коэффициентами LSF, из которых значение DC удалено. Конечные коэффициенты QLSF генерируются посредством сложения вывода MSVQ 1821 и вывода LVQ 1823 и затем добавления значения DC к результату сложения. Первая схема 1810 квантования может осуществлять очень эффективную структуру модуля квантования посредством использования комбинации MSVQ 1821, имеющего превосходную производительность на низкой скорости передачи битов, и LVQ 1823, который является эффективным на низкой скорости передачи битов.

Вторая схема 1830 квантования выполняет квантование с использованием межкадрового предсказания и может включать в себя BC-TCQ 1843, который имеет модуль 1845 внутрикадрового предсказания, и модуль 1841 межкадрового предсказания. Ошибки предсказания LSF, полученные с использованием значений предсказания модуля 1841 межкадрового предсказания, квантуются посредством BC-TCQ 1843, имеющего модуль 1845 внутрикадрового предсказания. Соответственно, может максимизироваться характеристика BC-TCQ 1843, имеющего превосходную производительность квантования при высокой скорости передачи битов.

Определитель 1850 пути квантования определяет один из вывода первой схемы 1810 квантования и вывода второй схемы 1830 квантования в качестве конечного вывода квантования посредством принятия в рассмотрение режима предсказания и взвешенного искажения.

Как результат, когда используются первая схема 1810 квантования и вторая схема 1830 квантования, оптимальный модуль квантования может осуществляться в соответствии с характеристиками входного речевого сигнала. Например, когда 43 бита используются в модуле 1800 квантования коэффициентов LPC, чтобы квантовать речевой сигнал в режиме VC с WB 8 кГц, 12 битов и 30 битов могут назначаться MSVQ 1821 и LVQ 1823 первой схемы 1810 квантования, соответственно, за исключением 1 бита, показывающего информацию пути квантования. В дополнение, 42 бита могут назначаться BC-TCQ 1843 второй схемы 1830 квантования за исключением 1 бита, показывающего информацию пути квантования.

Таблица 7 показывает пример, в котором биты назначаются речевому сигналу WB диапазона 8 кГц.

[Таблица 7]

Таблица 7 Режим кодирования Схема квантования LSF/ISF MSVQ-LVQ [биты] BC-TCQ [биты] VC, WB Страховочная
С предсказанием
43- -43

Фиг. 19 является блок-схемой модуля квантования коэффициентов LPC согласно другому примерному варианту осуществления.

Как показано на фиг. 19, модуль 1900 квантования коэффициентов LPC может включать в себя первую схему 1910 квантования, вторую схему 1930 квантования, и определитель 1950 пути квантования.

Первая схема 1910 квантования выполняет квантование без использования межкадрового предсказания и может использовать комбинацию VQ 1921 и BC-TCQ 1923, имеющего модуль 1925 внутрикадрового предсказания для улучшения производительности квантования.

Вторая схема 1930 квантования выполняет квантование с использованием межкадрового предсказания и может включать в себя BC-TCQ 1943, который имеет модуль 1945 внутрикадрового предсказания, и модуль 1941 межкадрового предсказания.

Определитель 1950 пути квантования определяет путь квантования посредством приема режима предсказания и взвешенного искажения с использованием оптимально квантованных значений, полученных посредством первой схемы 1910 квантования и второй схемы 1930 квантования. Например, определяется, равняется ли режим предсказания текущего кадра 0, т.е. имеет ли речевой сигнал текущего кадра нестационарную характеристику. Когда изменение речевого сигнала текущего кадра является большим как в режиме TC или режиме UC, так как межкадровое предсказание является трудоемким, страховочная схема, т.е. первая схема 1910 квантования, всегда определяется в качестве пути квантования.

Если режим предсказания текущего кадра равняется 1, т.е. если речевой сигнал текущего кадра находится в режиме GC или режиме VC, не имеющем нестационарную характеристику, определитель 1950 пути квантования определяет одну из первой схемы 1910 квантования и второй схемы 1930 квантования в качестве пути квантования посредством принятия в рассмотрение ошибок предсказания. Для этого, прежде всего рассматривается взвешенное искажение первой схемы 1910 квантования, так что модуль 1900 квантования коэффициентов LPC является устойчивым к ошибкам кадров. То есть, если значение взвешенного искажения первой схемы 1910 квантования меньше, чем предопределенное пороговое значение, выбирается первая схема 1910 квантования независимо от значения взвешенного искажения второй схемы 1930 квантования. В дополнение, вместо простого выбора схемы квантования, имеющей меньшее значение взвешенного искажения, первая схема 1910 квантования выбирается посредством принятия в рассмотрение ошибок кадров в случае одного и того же значения взвешенного искажения. Если значение взвешенного искажения первой схемы 1910 квантования в некоторое количество раз больше, чем значение взвешенного искажения второй схемы 1930 квантования, может выбираться вторая схема 1930 квантования. Некоторое количество раз может быть, например, установлено на 1,15. Как таковой, когда определяется путь квантования, передается индекс квантования, сгенерированный посредством схемы квантования определенного пути квантования.

Считая, что количество режимов предсказания равняется 3, можно осуществить, чтобы выбирать первую схему 1910 квантования, когда режим предсказания равняется 0, выбирать вторую схему 1930 квантования, когда режим предсказания равняется 1, и выбирать одну из первой схемы 1910 квантования и второй схемы 1930 квантования, когда режим предсказания равняется 2, в качестве пути квантования.

Например, когда 37 битов используются в модуле 1900 квантования коэффициентов LPC, чтобы квантовать речевой сигнал в режиме GC с WB 8 кГц, 2 бита и 34 бита могут назначаться VQ 1921 и BC-TCQ 1923 первой схемы 1910 квантования, соответственно, за исключением 1 бита, показывающего информацию пути квантования. В дополнение, 36 битов могут назначаться BC-TCQ 1943 второй схемы 1930 квантования за исключением 1 бита, показывающего информацию пути квантования.

Таблица 8 показывает пример, в котором биты назначаются речевому сигналу WB диапазона 8 кГц.

[Таблица 8]

Таблица 8 Режим кодирования Схема квантования LSF/ISF Количество используемых битов VC, WB Страховочная
С предсказанием
4343
GC, WB Страховочная
С предсказанием
3737
TC, WB Страховочная 44

Фиг. 20 является блок-схемой модуля квантования коэффициентов LPC согласно другому примерному варианту осуществления.

Как показано на фиг. 20, модуль 2000 квантования коэффициентов LPC может включать в себя первую схему 2010 квантования, вторую схему 2030 квантования, и определитель 2050 пути квантования.

Первая схема 2010 квантования выполняет квантование без использования межкадрового предсказания и может использовать комбинацию VQ 2021 и BC-TCQ 2023, имеющего модуль 2025 внутрикадрового предсказания, для улучшения производительности квантования.

Вторая схема 2030 квантования выполняет квантование с использованием межкадрового предсказания и может включать в себя LVQ 2043 и модуль 2041 межкадрового предсказания.

Определитель 2050 пути квантования определяет путь квантования посредством приема режима предсказания и взвешенного искажения с использованием оптимально квантованных значений, полученных посредством первой схемы 2010 квантования и второй схемы 2030 квантования.

Например, когда 43 бита используются в модуле 2000 квантования коэффициентов LPC, чтобы квантовать речевой сигнал в режиме VC с WB 8 кГц, 6 битов и 36 битов могут назначаться VQ 2021 и BC-TCQ 2023 первой схемы 2010 квантования, соответственно, за исключением 1 бита, показывающего информацию пути квантования. В дополнение, 42 бита могут назначаться LVQ 2043 второй схемы 2030 квантования за исключением 1 бита, показывающего информацию пути квантования.

Таблица 9 показывает пример, в котором биты назначаются речевому сигналу WB диапазона 8 кГц.

[Таблица 9]

Таблица 9 Режим кодирования Схема квантования LSF/ISF MSVQ-LVQ [биты] BC-TCQ [биты] VC, WB Страховочная
С предсказанием
-43 43-

Фиг. 21 является блок-схемой модуля выбора типа модуля квантования согласно одному примерному варианту осуществления. Модуль 2100 выбора типа модуля квантования, показанный на фиг. 21, может включать в себя определитель 2110 скорости передачи битов, определитель 2130 ширины полосы, определитель 2150 частоты внутренней дискретизации, и определитель 2107 типа модуля квантования. Каждый из компонентов может осуществляться посредством, по меньшей мере, одного процессора (например, центрального процессора (CPU)) посредством объединения, по меньшей мере, в одном модуле. Модуль 2100 выбора типа модуля квантования может использоваться в режиме предсказания 2, в котором переключаются две схемы квантования. Модуль 2100 выбора типа модуля квантования может содержаться как компонент модуля 117 квантования коэффициентов LPC устройства 100 кодирования звука из фиг. 1 или компонент устройства 100 кодирования звука из фиг. 1.

Как показано на фиг. 21, определитель 2110 скорости передачи битов определяет скорость передачи битов кодирования речевого сигнала. Скорость передачи битов кодирования может определяться для всех кадров или в единице кадра. Тип модуля квантования может изменяться в зависимости от скорости передачи битов кодирования.

Определитель 2130 ширины полосы определяет ширину полосы речевого сигнала. Тип модуля квантования может изменяться в зависимости от ширины полосы речевого сигнала.

Определитель 2150 частоты внутренней дискретизации определяет частоту внутренней дискретизации на основе верхнего предела ширины полосы, используемой в модуле квантования. Когда ширина полосы речевого сигнала равняется или является более широкой, чем WB, т.е. WB, SWB, или FB, частота внутренней дискретизации изменяется согласно тому, равняется ли верхний предел ширины полосы кодирования 6,4 кГц или 8 кГц. Если верхний предел ширины полосы кодирования равняется 6,4 кГц, частота внутренней дискретизации равняется 12,8 кГц, и если верхний предел ширины полосы кодирования равняется 8 кГц, частота внутренней дискретизации равняется 16 кГц. Верхний предел ширины полосы кодирования не ограничен этим.

Определитель 2107 типа модуля квантования выбирает один из открытого контура и замкнутого контура в качестве типа модуля квантования посредством приема вывода определителя 2110 скорости передачи битов, вывода определителя 2130 ширины полосы, и вывода определителя 2150 частоты внутренней дискретизации. Определитель 2107 типа модуля квантования может выбирать открытый контур в качестве типа модуля квантования, когда скорость передачи битов кодирования больше, чем предварительно определенное опорное значение, ширина полосы сигнала речи равняется или является более широкой, чем WB, и частота внутренней дискретизации равняется 16 кГц. В противном случае, в качестве типа модуля квантования может выбираться замкнутый контур.

Фиг. 22 является блок-схемой последовательности операций, иллюстрирующей способ выбора типа модуля квантования, согласно одному примерному варианту осуществления.

Как показано на фиг. 22, в операции 2201, определяется, является ли скорость передачи битов более большой, чем опорное значение. Опорное значение устанавливается на 16,4 Кбит/с на фиг. 22, но не ограничено этим. Как результат определения в операции 2201, если скорость передачи битов равняется или меньше, чем опорное значение, в операции 2209 выбирается тип замкнутого контура.

Как результат определения в операции 2201, если скорость передачи битов больше, чем опорное значение, в операции 2203 определяется, является ли ширина полосы входного сигнала более широкой, чем NB. Как результат определения в операции 2203, если ширина полосы входного сигнала является NB, в операции 2209 выбирается тип замкнутого контура.

Как результат определения в операции 2203, если ширина полосы входного сигнала является более широкой, чем NB, т.е. если ширина полосы входного сигнала является WB, SWB, или FB, в операции 2205 определяется, является ли частота внутренней дискретизации некоторой частотой. Например, на фиг. 22 некоторая частота устанавливается на 16 кГц. Как результат определения в операции 2205, если частота внутренней дискретизации не является некоторой опорной частотой, в операции 2209 выбирается тип замкнутого контура.

Как результат определения в операции 2205, если частота внутренней дискретизации равняется 16 кГц, в операции 2207 выбирается тип открытого контура.

Фиг. 23 является блок-схемой устройства декодирования звука согласно одному примерному варианту осуществления.

Как показано на фиг. 23, устройство 2300 декодирования звука может включать в себя декодер 2311 параметров, модуль 2313 деквантования коэффициентов LPC, декодер 2315 переменного режима, и постпроцессор 2319. Устройство 2300 декодирования звука может дополнительно включать в себя модуль 2317 восстановления ошибок. Каждый из компонентов устройства 2300 декодирования звука может осуществляться посредством, по меньшей мере, одного процессора (например, центрального об процессора (CPU)) посредством объединения, по меньшей мере, в одном модуле.

Декодер 2311 параметров может декодировать параметры, подлежащие использованию для декодирования из битового потока. Когда режим кодирования включен в битовый поток, декодер 2311 параметров может декодировать режим кодирования и параметры, соответствующие режиму кодирования. Деквантование коэффициентов LPC и декодирование возбуждения могут выполняться в соответствии с декодированным режимом кодирования.

Модуль 2313 деквантования коэффициентов LPC может генерировать декодированные коэффициенты LSF посредством деквантования квантованных коэффициентов ISF или LSF, квантованных ошибок квантования ISF или LSF или квантованных ошибок предсказания ISF или LSF, включенных в параметры LPC, и генерирует коэффициенты LPC посредством преобразования декодированных коэффициентов LSF.

Декодер 2315 переменного режима может генерировать синтезированный сигнал посредством декодирования коэффициентов LPC, сгенерированных посредством модуля 2313 деквантования коэффициентов LPC. Декодер 2315 переменного режима может выполнять декодирование в соответствии с режимами кодирования, как показано на фиг. 2A-2D, согласно устройствам кодирования, соответствующим устройствам декодирования.

Модуль 2317 восстановления ошибок, если содержится, может восстанавливать или скрывать текущий кадр речевого сигнала, когда ошибки возникают в текущем кадре как результат декодирования декодера 2315 переменного режима.

Постпроцессор (например, центральный процессор (CPU)) 2319 может генерировать конечный синтезированный сигнал, т.е. восстановленный звук, посредством выполнения различных типов фильтрации и процесса улучшения качества речи синтезированного сигнала, сгенерированного посредством декодера 2315 переменного режима.

Фиг. 24 является блок-схемой модуля деквантования коэффициентов LPC согласно одному примерному варианту осуществления.

Как показано на фиг. 24, модуль 2400 деквантования коэффициентов LPC может включать в себя модуль 2411 деквантования ISF/LSF и преобразователь 2413 коэффициентов.

Модуль 2411 деквантования ISF/LSF может генерировать декодированные коэффициенты ISF или LSF посредством деквантования квантованных коэффициентов ISF или LSF, квантованных ошибок квантования ISF или LSF, или квантованных ошибок предсказания ISF или LSF, включенных в параметры LPC, в соответствии с информацией пути квантования, включенной в битовый поток.

Преобразователь 2413 коэффициентов может преобразовывать декодированные коэффициенты ISF или LSF, полученные как результат деквантования посредством модуля 2411 деквантования ISF/LSF, в пары спектрального иммитанса (ISP) или пары спектральных линий (LSP) и выполняет интерполяцию для каждого подкадра. Интерполяция может выполняться посредством использования пар ISP/LSP предыдущего кадра и пар ISP/LSP текущего кадра. Преобразователь 2413 коэффициентов может преобразовывать деквантованные и интерполированные пары ISP/LSP каждого подкадра в коэффициенты LSP.

Фиг. 25 является блок-схемой модуля деквантования коэффициентов LPC согласно другому примерному варианту осуществления.

Как показано на фиг. 25, модуль 2500 деквантования коэффициентов LPC может включать в себя определитель 2511 пути деквантования, первую схему 2513 деквантования, и вторую схему 2515 деквантования.

Определитель 2511 пути деквантования может обеспечивать параметры LPC в одну из первой схемы 2513 деквантования и второй схемы 2515 деквантования на основе информации пути квантования, включенной в битовый поток. Например, информация пути квантования может представляться посредством 1 бита.

Первая схема 2513 деквантования может включать в себя элемент для грубого деквантования параметров LPC и элемент для точного деквантования параметров LPC.

Вторая схема 2515 деквантования может включать в себя элемент для выполнения ограниченного по блокам решетчато кодированного деквантования и элемент межкадрового предсказания по отношению к параметрам LPC.

Первая схема 2513 деквантования и вторая схема 2515 деквантования не ограничены текущим примерным вариантом осуществления и могут осуществляться посредством использования обратных процессов первой и второй схем квантования описанных выше примерных вариантов осуществления согласно устройствам кодирования, соответствующим устройствам декодирования.

Конфигурация модуля 2500 деквантования коэффициентов LPC может применяться независимо от того, является ли способ квантования типом открытого контура или типом замкнутого контура.

Фиг. 26 является блок-схемой первой схемы 2513 деквантования и второй схемы 2515 деквантования в модуле 2500 деквантования коэффициентов LPC по фиг. 25, согласно одному примерному варианту осуществления.

Как показано на фиг. 26, первая схема 2610 деквантования может включать в себя модуль многоэтапного векторного квантования (MSVQ) 2611 для деквантования квантованных коэффициентов LSF, включенных в параметры LPC посредством использования первого индекса кодовой книги, сгенерированного посредством MSVQ (не показан) кодирующего конца (не показан), и модуль решеточного векторного квантования (LVQ) 2613 для деквантования ошибок квантования LSF, включенных в параметры LPC, посредством использования второго индекса кодовой книги, сгенерированного посредством LVQ (не показан) кодирующего конца. Конечные декодированные коэффициенты LSF генерируются посредством сложения деквантованных коэффициентов LSF, полученных посредством MSVQ 2611, и деквантованных ошибок квантования LSF, полученных посредством LVQ 2613, и затем добавления среднего значения, которое является предварительно определенным значением DC, к результату сложения.

Вторая схема 2630 деквантования может включать в себя модуль ограниченного по блокам решетчато кодированного квантования (BC-TCQ) 2631 для деквантования ошибок предсказания LSF, включенных в параметры LPC, посредством использования третьего индекса кодовой книги, сгенерированного посредством BC-TCQ (не показан) кодирующего конца, модуль 2633 внутрикадрового предсказания, и модуль 2635 межкадрового предсказания. Процесс деквантования начинается с самого нижнего вектора из числа векторов LSF, и модуль 2633 внутрикадрового предсказания генерирует значение предсказания для последующего элемента вектора посредством использования декодированного вектора. Модуль 2635 межкадрового предсказания генерирует значения предсказания посредством межкадрового предсказания посредством использования коэффициентов LSF, декодированных в предыдущем кадре. Конечные декодированные коэффициенты LSF генерируются посредством сложения коэффициентов LSF, полученных посредством BC-TCQ 2631 и модуля 2633 внутрикадрового предсказания, и значений предсказания, сгенерированных посредством модуля 2635 межкадрового предсказания, и затем добавления среднего значения, которое является предварительно определенным значением DC, к результату сложения.

Первая схема 2610 деквантования и вторая схема 2630 деквантования не ограничены текущим примерным вариантом осуществления и могут осуществляться посредством использования обратных процессов первой и второй схем квантования вышеописанных примерных вариантов осуществления согласно устройствам кодирования, соответствующим устройствам декодирования.

Фиг. 27 является блок-схемой последовательности операций, иллюстрирующей способ квантования согласно одному примерному варианту осуществления.

Как показано на фиг. 27, в операции 2710, путь квантования принятого звука определяется на основе предварительно определенного критерия до квантования принятого звука. В одном примерном варианте осуществления, может определяться один из первого пути, не использующего межкадровое предсказание, и второго пути, использующего межкадровое предсказание.

В операции 2730, проверяется путь квантования, определенный из числа первого пути и второго пути.

Если первый путь определяется в качестве пути квантования как результат проверки в операции 2730, принятый звук квантуется с использованием первой схемы квантования в операции 2750.

С другой стороны, если второй путь определяется в качестве пути квантования как результат проверки в операции 2730, принятый звук квантуется с использованием второй схемы квантования в операции 2770.

Процесс определения пути квантования в операции 2710 может выполняться посредством различных примерных вариантов осуществления, описанных выше. Процессы квантования в операциях 2750 и 2770 могут выполняться посредством использования различных примерных вариантов осуществления, описанных выше, и первой и второй схем квантования, соответственно.

Хотя в текущем примерном варианте осуществления первый и второй пути устанавливаются как пути квантования, которые могут выбираться, множество путей, включающее в себя первый и второй пути, может устанавливаться, и блок-схема последовательности операций по фиг. 27 может изменяться в соответствии с множеством установленных путей.

Фиг. 28 является блок-схемой последовательности операций, иллюстрирующей способ деквантования согласно одному примерному варианту осуществления.

Как показано на фиг. 28, в операции 2810, декодируются параметры LPC, включенные в битовый поток.

В операции 2830, путь квантования, включенный в битовый поток, проверяется, и в операции 2850 определяется, является ли проверенный путь квантования первым путем или вторым путем.

Если путь квантования является первым путем как результат определения в операции 2850, декодированные параметры LPC деквантуются посредством использования первой схемы деквантования в операции 2870.

Если путь квантования является вторым путем как результат определения в операции 2850, декодированные параметры LPC деквантуются посредством использования второй схемы деквантования в операции 2890.

Процессы деквантования в операциях 2870 и 2890 могут выполняться посредством использования обратных процессов первой и второй схем квантования различных примерных вариантов осуществления, описанных выше, соответственно, согласно устройствам кодирования, соответствующим устройствам декодирования.

Хотя первый и второй пути устанавливаются как проверенные пути квантования в текущем примерном варианте осуществления, множество путей, включающее в себя первый и второй пути, может устанавливаться, и блок-схема последовательности операций по фиг. 28 может изменяться в соответствии с множеством установленных путей.

Способы по фиг. 27 и 28 могут программироваться и могут выполняться посредством, по меньшей мере, одного обрабатывающего устройства. В дополнение, примерные варианты осуществления могут выполняться в единице кадра или единице подкадра.

Фиг. 29 является блок-схемой электронного устройства, включающего в себя модуль кодирования, согласно одному примерному варианту осуществления.

Как показано на фиг. 29, электронное устройство 2900 может включать в себя блок 2910 передачи данных и модуль 2930 кодирования. В дополнение, электронное устройство 2900 может дополнительно включать в себя блок 2950 хранения для хранения звукового битового потока, полученного как результат кодирования согласно использованию звукового битового потока. В дополнение, электронное устройство 2900 может дополнительно включать в себя микрофон 2970. То есть, блок 2950 хранения и микрофон 2970 могут необязательно включаться сюда. Электронное устройство 2900 может дополнительно включать в себя произвольный модуль декодирования (не показан), например, модуль декодирования для выполнения общей функции декодирования или модуль декодирования согласно одному примерному варианту осуществления. Модуль 2930 кодирования может осуществляться посредством, по меньшей мере, одного процессора (например, центрального процессора (CPU)) (не показан) посредством объединения с другими компонентами (не показаны), включенными в электронное устройство 2900 как один корпус.

Блок 2910 передачи данных может принимать, по меньшей мере, одно из звука или закодированного битового потока, обеспеченного извне, или передавать, по меньшей мере, одно из декодированного звука или звукового битового потока, полученного как результат кодирования посредством модуля 2930 кодирования.

Блок 2910 передачи данных выполнен с возможностью передавать и принимать данные в и от внешнего электронного устройства посредством беспроводной сети, такой как беспроводная сеть Интернет, беспроводная внутренняя сеть, беспроводная телефонная сеть, беспроводная локальная сеть (WLAN), Wi-Fi, прямой Wi-Fi (WFD), третье поколение (3G), четвертое поколение (4G), Bluetooth, стандарт ассоциации инфракрасной передачи данных (IrDA), радиочастотная идентификация (RFID), ультра широкий диапазон (UWB), Zigbee, или связь ближнего поля (NFC), или посредством проводной сети, такой как проводная телефонная сеть или проводная сеть Интернет.

Модуль 2930 кодирования может генерировать битовый поток посредством выбора одного из множества путей, включающего в себя первый путь, не использующий межкадровое предсказание, и второй путь, использующий межкадровое предсказание, в качестве пути квантования звука, обеспеченного посредством блока 2910 передачи данных или микрофона 2970, на основе предварительно определенного критерия до квантования звука, квантования звука посредством использования одной из первой схемы квантования и второй схемы квантования согласно выбранному пути квантования, и кодирования квантованного звука.

Первая схема квантования может включать в себя первый модуль квантования (не показан) для грубого квантования звука и второй модуль квантования (не показан) для точного квантования сигнала ошибки квантования между звуком и выходным сигналом первого модуля квантования. Первая схема квантования может включать в себя MSVQ (не показан) для квантования звука и LVQ (не показан) для квантования сигнала ошибки квантования между звуком и выходным сигналом MSVQ. В дополнение, первая схема квантования может осуществляться посредством одного из различных примерных вариантов осуществления, описанных выше.

Вторая схема квантования может включать в себя модуль межкадрового предсказания (не показан) для выполнения межкадрового предсказания звука, модуль внутрикадрового предсказания (не показан) для выполнения внутрикадрового предсказания ошибок предсказания, и BC-TCQ (не показан) для квантования ошибок предсказания. Подобным образом, вторая схема квантования может осуществляться посредством одного из различных примерных вариантов осуществления, описанных выше.

Блок 2950 хранения может хранить закодированный битовый поток, сгенерированный посредством модуля 2930 кодирования. Блок 2950 хранения может хранить различные программы, необходимые, чтобы управлять электронным устройством 2900.

Микрофон 2970 может обеспечивать звук пользователя вне модуля 2930 кодирования.

Фиг. 30 является блок-схемой электронного устройства, включающего в себя модуль декодирования, согласно одному примерному варианту осуществления.

Как показано на фиг. 30, электронное устройство 3000 может включать в себя блок 3010 передачи данных и модуль 3030 декодирования. В дополнение, электронное устройство 3000 может дополнительно включать в себя блок 3050 хранения для хранения восстановленного звука, полученного как результат декодирования согласно использованию восстановленного звука. В дополнение, электронное устройство 3000 может дополнительно включать в себя громкоговоритель 3070. То есть, блок 3050 хранения и громкоговоритель 3070 могут необязательно включаться сюда. Электронное устройство 3000 может дополнительно включать в себя произвольный модуль кодирования (не показан), например, модуль кодирования для выполнения общей функции кодирования или модуль кодирования согласно одному примерному варианту осуществления настоящего изобретения. Модуль 3030 декодирования может осуществляться посредством, по меньшей мере, одного процессора (например, центрального процессора (CPU)) (не показан) посредством объединения с другими компонентами (не показаны), включенными в электронное устройство 3000 как один корпус.

Блок 3010 передачи данных может принимать, по меньшей мере, одно из звука или закодированного битового потока, обеспеченного извне, или передавать, по меньшей мере, одно из восстановленного звука, полученного как результат декодирования модуля 3030 декодирования, или звукового битового потока, полученного как результат кодирования. Блок 3010 передачи данных может, по существу, осуществляться как блок 2910 передачи данных по фиг. 29.

Модуль 3030 декодирования может генерировать восстановленный звук посредством декодирования параметров LPC, включенных в битовый поток, обеспеченный посредством блока 3010 передачи данных, деквантования декодированных параметров LPC посредством использования одной из первой схемы деквантования, не использующей межкадровое предсказание, и второй схемы деквантования, использующей межкадровое предсказание, на основе информации пути, включенной в битовый поток, и декодирования деквантованных параметров LPC в декодированном режиме кодирования. Когда режим кодирования включен в битовый поток, модуль 3030 декодирования может декодировать деквантованные параметры LPC в декодированном режиме кодирования.

Первая схема деквантования может включать в себя первый модуль деквантования (не показан) для грубого деквантования параметров LPC и второй модуль деквантования (не показан) для точного деквантования параметров LPC. Первая схема деквантования может включать в себя MSVQ (не показан) для деквантования параметров LPC посредством использования первого индекса кодовой книги и LVQ (не показан) для деквантования параметров LPC посредством использования второго индекса кодовой книги. В дополнение, так как первая схема деквантования выполняет обратную операцию первой схемы квантования, описанной на фиг. 29, первая схема деквантования может осуществляться посредством одного из обратных процессов различных примерных вариантов осуществления, описанных выше, соответствующих первой схеме квантования согласно устройствам кодирования, соответствующим устройствам декодирования.

Вторая схема деквантования может включать в себя BC-TCQ (не показан) для деквантования параметров LPC посредством использования третьего индекса кодовой книги, модуль внутрикадрового предсказания (не показан), и модуль межкадрового предсказания (не показан). Подобным образом, так как вторая схема деквантования выполняет обратную операцию второй схемы квантования, описанной на фиг. 29, вторая схема деквантования может осуществляться посредством одного из обратных процессов различных примерных вариантов осуществления, описанных выше, соответствующих второй схеме квантования согласно устройствам кодирования, соответствующим устройствам декодирования.

Блок 3050 хранения может хранить восстановленный звук, сгенерированный посредством модуля 3030 декодирования. Блок 3050 хранения может хранить различные программы для управления электронным устройством 3000.

Громкоговоритель 3070 может выводить восстановленный звук, сгенерированный посредством модуля 3030 декодирования, во вне.

Фиг. 31 является блок-схемой электронного устройства, включающего в себя модуль кодирования и модуль декодирования, согласно одному примерному варианту осуществления.

Электронное устройство 3100, показанное на фиг. 31, может включать в себя блок 3110 передачи данных, модуль 3120 кодирования, и модуль 3130 декодирования. В дополнение, электронное устройство 3100 может дополнительно включать в себя блок 3140 хранения для хранения звукового битового потока, полученного как результат кодирования, или восстановленного звука, полученного как результат декодирования, согласно использованию звукового битового потока или восстановленного звука. В дополнение, электронное устройство 3100 может дополнительно включать в себя микрофон 3150 и/или громкоговоритель 3160. Модуль 3120 кодирования и модуль 3130 декодирования может осуществляться посредством, по меньшей мере, одного процессора (например, центрального процессора (CPU)) (не показано) посредством объединения с другими компонентами (не показаны), включенными в электронное устройство 3100 как один корпус.

Так как компоненты электронного устройства 3100, показанного на фиг. 31, соответствуют компонентам электронного устройства 2900, показанного на фиг. 29, или компонентам электронного устройства 3000, показанного на фиг. 30, их подробное описание пропускается.

Каждое из электронных устройств 2900, 3000, и 3100, показанных на фиг. 29, 30, и 31, может включать в себя терминал только речевой связи, такой как телефон или мобильный телефон, устройство только широковещания или музыки, такое как TV или проигрыватель MP3, или гибридное терминальное устройство терминала только речевой связи и устройства только широковещания или музыки, но не ограничены этим. В дополнение, каждое из электронных устройств 2900, 3000, и 3100 может использоваться в качестве клиента, сервера, или преобразователя, размещенного между клиентом и сервером.

Когда электронное устройство 2900, 3000, или 3100 является, например, мобильным телефоном, хотя не показано, электронное устройство 2900, 3000, или 3100 может дополнительно включать в себя блок пользовательского ввода, такой как клавиатура, блок отображения для отображения информации, обработанной посредством пользовательского интерфейса или мобильного телефона, и процессор (например, центральный процессор (CPU)) для управления функциями мобильного телефона. В дополнение, мобильный телефон может дополнительно включать в себя блок камеры, имеющий функцию съема изображения, и, по меньшей мере, один компонент для выполнения функции для мобильного телефона.

Когда электронное устройство 2900, 3000, или 3100 является, например, TV, хотя не показано, электронное устройство 2900, 3000, или 3100 может дополнительно включать в себя блок пользовательского ввода, такой как клавиатура, блок отображения для отображения принятой широковещательной информации, и процессор (например, центральный процессора (CPU)) для управления всеми функциями TV. В дополнение, TV может дополнительно включать в себя, по меньшей мере, один компонент для выполнения функции TV.

Относящееся к BC-TCQ содержимое, воплощенное в связи с квантованием/деквантованием коэффициентов LPC, раскрывается подробно в патенте США, номер 7,630,890 (Block-constrained TCQ method, and method and apparatus for quantizing LSF parameter employing the same in speech coding system). Содержимое, связанное со способом LVA, раскрывается подробно в патентной заявке США, номер 2007/0233473 (Multi-path trellis coded quantization method and Multi-path trellis coded quantizer using the same). Содержимое патента США номер 7,630,890 и патентной заявки США номер 2007/0233473 включаются сюда по ссылке.

Способ квантования, способ деквантования, способ кодирования, и способ декодирования согласно примерным вариантам осуществления могут быть записаны как компьютерные программы и могут осуществляться в цифровых компьютерах общего использования, которые исполняют программы с использованием компьютерно-читаемого записывающего носителя. В дополнение, структура данных, программная команда, или файл данных, доступные в примерных вариантах осуществления, могут быть записаны в компьютерно-читаемом записывающем носителе различными способами. Компьютерно-читаемый записывающий носитель является любым устройством хранения данных, которое может хранить данные, которые могут впоследствии считываться посредством компьютерной системы. Примеры компьютерно-читаемого записывающего носителя включают в себя магнитные носители записи, такие как жесткие диски, гибкие диски, и магнитные ленты, оптические носители записи, такие как CD-ROM и DVD, магнитооптические носители записи, такие как флоптические диски, и аппаратные устройства, такие как ROM, RAM, и флэш-памяти, конкретно выполненные с возможностью хранить и исполнять программную команду. Компьютерно-читаемый записывающий носитель также может быть носителем передачи данных для передачи сигнала, в котором назначены программная команда и структура данных. Примеры программной команды могут включать в себя коды машинного языка, созданные посредством компилятора, и коды высокоуровневого языка, исполнимые посредством компьютера с помощью интерпретатора.

В то время как представленная новая концепция была конкретно показана и описана со ссылкой на ее примерные варианты осуществления, специалистам в данной области техники следует понимать, что различные изменения в форме и деталях могут делаться здесь без отхода от сущности и объема представленной новой концепции, как определено посредством последующей формулы изобретения.

Похожие патенты RU2675044C1

название год авторы номер документа
СПОСОБ КВАНТОВАНИЯ КОЭФФИЦИЕНТОВ КОДИРОВАНИЯ С ЛИНЕЙНЫМ ПРЕДСКАЗАНИЕМ, СПОСОБ КОДИРОВАНИЯ ЗВУКА, СПОСОБ ДЕКВАНТОВАНИЯ КОЭФФИЦИЕНТОВ КОДИРОВАНИЯ С ЛИНЕЙНЫМ ПРЕДСКАЗАНИЕМ, СПОСОБ ДЕКОДИРОВАНИЯ ЗВУКА И НОСИТЕЛЬ ЗАПИСИ 2012
  • Ох Еун-Ми
  • Сунг Хо-Санг
RU2647652C1
СПОСОБ КВАНТОВАНИЯ КОЭФФИЦИЕНТОВ КОДИРОВАНИЯ С ЛИНЕЙНЫМ ПРЕДСКАЗАНИЕМ, СПОСОБ КОДИРОВАНИЯ ЗВУКА, СПОСОБ ДЕКВАНТОВАНИЯ КОЭФФИЦИЕНТОВ КОДИРОВАНИЯ С ЛИНЕЙНЫМ ПРЕДСКАЗАНИЕМ, СПОСОБ ДЕКОДИРОВАНИЯ ЗВУКА И НОСИТЕЛЬ ЗАПИСИ 2012
  • Сунг Хо-Санг
  • Ох Еун-Ми
RU2619710C2
УСТРОЙСТВО ДЛЯ КВАНТОВАНИЯ КОЭФФИЦИЕНТОВ КОДИРОВАНИЯ С ЛИНЕЙНЫМ ПРЕДСКАЗАНИЕМ, УСТРОЙСТВО КОДИРОВАНИЯ ЗВУКА, УСТРОЙСТВО ДЛЯ ДЕКВАНТОВАНИЯ КОЭФФИЦИЕНТОВ КОДИРОВАНИЯ С ЛИНЕЙНЫМ ПРЕДСКАЗАНИЕМ, УСТРОЙСТВО ДЕКОДИРОВАНИЯ ЗВУКА, И ЭЛЕКТРОННОЕ УСТРОЙСТВО ДЛЯ ЭТОГО 2012
  • Сунг Хо-Санг
  • Ох Еун-Ми
RU2669139C1
УСТРОЙСТВО ДЛЯ КВАНТОВАНИЯ КОЭФФИЦИЕНТОВ КОДИРОВАНИЯ С ЛИНЕЙНЫМ ПРЕДСКАЗАНИЕМ, УСТРОЙСТВО КОДИРОВАНИЯ ЗВУКА, УСТРОЙСТВО ДЛЯ ДЕКВАНТОВАНИЯ КОЭФФИЦИЕНТОВ КОДИРОВАНИЯ С ЛИНЕЙНЫМ ПРЕДСКАЗАНИЕМ, УСТРОЙСТВО ДЕКОДИРОВАНИЯ ЗВУКА И ЭЛЕКТРОННОЕ УСТРОЙСТВО ДЛЯ ЭТОГО 2012
  • Сунг Хо-Санг
  • Ох Еун-Ми
RU2606552C2
УСТРОЙСТВО ОБРАБОТКИ АУДИОСИГНАЛА, СПОСОБ ОБРАБОТКИ АУДИОСИГНАЛА И ПРОГРАММА ОБРАБОТКИ АУДИОСИГНАЛА 2019
  • Цуцуми, Кимитака
  • Кикуири, Кей
  • Ямагути, Ацуси
RU2701075C1
УСТРОЙСТВО ОБРАБОТКИ АУДИОСИГНАЛА, СПОСОБ ОБРАБОТКИ АУДИОСИГНАЛА И ПРОГРАММА ОБРАБОТКИ АУДИОСИГНАЛА 2014
  • Цуцуми Кимитака
  • Кикуири Кей
  • Ямагути Ацуси
RU2651234C2
УСТРОЙСТВО ОБРАБОТКИ АУДИОСИГНАЛА, СПОСОБ ОБРАБОТКИ АУДИОСИГНАЛА И ПРОГРАММА ОБРАБОТКИ АУДИОСИГНАЛА 2014
  • Цуцуми Кимитака
  • Кикуири Кей
  • Ямагути Ацуси
RU2680748C1
УСТРОЙСТВО ОБРАБОТКИ АУДИОСИГНАЛА, СПОСОБ ОБРАБОТКИ АУДИОСИГНАЛА И ПРОГРАММА ОБРАБОТКИ АУДИОСИГНАЛА 2019
  • Цуцуми, Кимитака
  • Кикуири, Кей
  • Ямагути, Ацуси
RU2707727C1
ОСНОВАННОЕ НА ЛИНЕЙНОМ ПРЕДСКАЗАНИИ КОДИРОВАНИЕ АУДИО С ИСПОЛЬЗОВАНИЕМ УЛУЧШЕННОЙ ОЦЕНКИ РАСПРЕДЕЛЕНИЯ ВЕРОЯТНОСТЕЙ 2013
  • Бякстрем Том
  • Хельмрих Кристиан
  • Фукс Гийом
  • Мултрус Маркус
  • Дитц Мартин
RU2651187C2
УСТРОЙСТВО ОБРАБОТКИ АУДИОСИГНАЛА, СПОСОБ ОБРАБОТКИ АУДИОСИГНАЛА И ПРОГРАММА ОБРАБОТКИ АУДИОСИГНАЛА 2014
  • Цуцуми Кимитака
  • Кикуири Кей
  • Ямагути Ацуси
RU2682927C2

Иллюстрации к изобретению RU 2 675 044 C1

Реферат патента 2018 года СПОСОБ КВАНТОВАНИЯ КОЭФФИЦИЕНТОВ КОДИРОВАНИЯ С ЛИНЕЙНЫМ ПРЕДСКАЗАНИЕМ, СПОСОБ КОДИРОВАНИЯ ЗВУКА, СПОСОБ ДЕКВАНТОВАНИЯ КОЭФФИЦИЕНТОВ КОДИРОВАНИЯ С ЛИНЕЙНЫМ ПРЕДСКАЗАНИЕМ, СПОСОБ ДЕКОДИРОВАНИЯ ЗВУКА И НОСИТЕЛЬ ЗАПИСИ

Изобретение относится к квантованию речевого или аудиосигнала. Технический результат – увеличение производительности квантования модуля квантования. Для этого, в частности, предусмотрено сравнивать ошибку предсказания с пороговым значением; выбирать один из множества модулей квантования способом открытого контура в ответ на результат сравнения ошибки предсказания с упомянутым пороговым значением; квантовать входной сигнал, включающий в себя по меньшей мере одно из речевого сигнала или аудиосигнала, без межкадрового предсказания на основании выбранного модуля квантования и квантовать упомянутый входной сигнал с межкадровым предсказанием на основании выбранного модуля квантования. 3 н. и 8 з.п. ф-лы, 38 ил., 9 табл.

Формула изобретения RU 2 675 044 C1

1. Устройство квантования для речевого или аудиосигнала, содержащее:

процессор, выполненный с возможностью:

сравнивать ошибку предсказания с пороговым значением;

выбирать один из множества модулей квантования способом открытого контура в ответ на результат сравнения ошибки предсказания с упомянутым пороговым значением;

квантовать входной сигнал, включающий в себя по меньшей мере одно из речевого сигнала или аудиосигнала, без межкадрового предсказания на основании выбранного модуля квантования; и

квантовать упомянутый входной сигнал с межкадровым предсказанием на основании выбранного модуля квантования.

2. Устройство по п. 1, в котором выбранный модуль квантования содержит квантователь с решетчатой структурой и модуль внутрикадрового предсказания.

3. Устройство по п. 1, в котором выбранный модуль квантования содержит квантователь с решетчатой структурой, модуль внутрикадрового предсказания и модуль межкадрового предсказания.

4. Устройство по п. 1, в котором выбранный модуль квантования содержит квантователь с решетчатой структурой и модуль векторного квантования.

5. Устройство квантования для речевого или аудиосигнала, содержащее:

процессор, выполненный с возможностью:

выбирать один из множества модулей квантования на основании ошибки предсказания способом открытого контура;

квантовать входной сигнал, включающий в себя по меньшей мере одно из речевого сигнала или аудиосигнала, без межкадрового предсказания на основании выбранного модуля квантования; и

квантовать упомянутый входной сигнал с межкадровым предсказанием на основании выбранного модуля квантования,

причем режим кодирования упомянутого входного сигнала представляет собой либо режим общего кодирования, либо режим вокализованного кодирования.

6. Устройство по п. 5, в котором выбранный модуль квантования содержит квантователь с решетчатой структурой и модуль внутрикадрового предсказания.

7. Устройство по п. 5, в котором выбранный модуль квантования содержит квантователь с решетчатой структурой, модуль внутрикадрового предсказания и модуль межкадрового предсказания.

8. Устройство по п. 5, в котором выбранный модуль квантования содержит квантователь с решетчатой структурой и модуль векторного квантования.

9. Способ декодирования для речевого или аудиосигнала, содержащий:

выбор на основании параметра из битового потока одного из первого модуля декодирования и второго модуля декодирования;

когда первый модуль декодирования выбран, декодирование битового потока без межкадрового предсказания; и

когда второй модуль декодирования выбран, декодирование битового потока с межкадровым предсказанием;

при этом первый модуль декодирования содержит деквантователь с решетчатой структурой с ограничениями по блокам, модуль внутрикадрового предсказания и модуль векторного квантования.

10. Способ по п. 9, в котором второй модуль декодирования содержит деквантователь с решетчатой структурой с ограничениями по блокам, модуль внутрикадрового предсказания, модуль межкадрового предсказания и модуль векторного деквантования.

11. Способ по п. 9, в котором режим кодирования, ассоциированный с битовым потоком, представляет собой режим вокализованного кодирования.

Документы, цитированные в отчете о поиске Патент 2018 года RU2675044C1

US 20090245351 A1, 01.10.2009
WO 2007106637 A2, 20.09.2007
US 5956672 A1, 21.09.1999
СПОСОБ И УСТРОЙСТВО ДЛЯ ДЕКОДИРОВАНИЯ/КОДИРОВАНИЯ СИГНАЛА ВИДЕО 2007
  • Дзеон Биеонг Моон
  • Парк Сеунг Воок
  • Коо Хан Сух
  • Дзеон Йонг Дзоон
  • Парк Дзи Хо
RU2395174C1
RU 2009133184 A, 10.03.2011.

RU 2 675 044 C1

Авторы

Сунг Хо-Санг

Ох Еун-Ми

Даты

2018-12-14Публикация

2018-02-19Подача