УСТРОЙСТВО И СПОСОБ ОПРЕДЕЛЕНИЯ ВЕЛИЧИНЫ ШАГА КВАНТОВАТЕЛЯ Российский патент 2008 года по МПК G10L19/02 

Описание патента на изобретение RU2329549C2

Настоящее изобретение относится к аудиокодерам, в частности к аудиокодерам, которые основаны на преобразованиях, то есть в которых перед началом конвейерной обработки кодера осуществляется преобразование временного представления в спектральное представление.

Известный аудиокодер, основанный на преобразованиях, изображен на фиг. 3. Показанный на фиг. 3 кодер представлен в международном стандарте ISO/IEC 14496-3: 2001 (E), подраздел 4, страница 4, и известен в технике как ААС-кодер.

Ниже представлено описание известного кодера. На вход 1000 вводится аудиосигнал, подлежащий кодированию. Он сначала подается на блок 1002 масштабирования, в котором проводится так называемое ААС-управление усилением, чтобы установить уровень аудиосигнала. Информация разностного стереосигнала из блока масштабирования подается на блок 1004 форматирования битового потока, как это показано стрелкой между блоком 1002 и блоком 1004. Масштабированный аудиосигнал подается затем на блок 1006 фильтров модифицированного дискретного косинусного преобразования (МДКТ). В случае ААС-кодера блок фильтров реализует МДКП с перекрывающимися на 50% окнами, причем длина окна определяется посредством блока 1008.

Вообще говоря, блок 1008 применяется для того, чтобы сигналы переходных процессов подвергать взвешиванию с использованием более коротких окон, а более стационарные сигналы - с использованием более длинных окон. Это служит тому, что на основе более коротких окон для сигналов переходных процессов достигается более высокое разрешение по времени (ценой разрешения по частоте), в то время как для более стационарных сигналов за счет более длинных окон достигается более высокое разрешение по частоте (ценой разрешения по времени), причем традиционно более длинные окна считаются более предпочтительными, так как с ними связывается более высокий выигрыш от кодирования. На выходе блока 1006 фильтров, при рассмотрении во временной области, имеются следующие друг за другом блоки спектральных значений, которые, в зависимости от формы выполнения блока фильтров, могут являться коэффициентами МДКП, коэффициентами Фурье или сигналами поддиапазонов, причем каждый сигнал поддиапазона имеет определенную ограниченную ширину полосы, которая устанавливается посредством соответствующего канала поддиапазона в блоке 1006 фильтров, и каждый сигнал поддиапазона имеет определенное число значений выборок поддиапазона.

Ниже для примера представлен случай, в котором блок фильтров выдает, при рассмотрении во времени, следующие друг за другом блоки спектральных коэффициентов МДКП, которые, вообще говоря, представляют следующие друг за другом кратковременные спектры кодируемого аудиосигнала на входе 1000. Блок спектральных значений МДКП вводится затем в блок 1010 обработки, реализующей временное преобразование шумов (TNS). Метод TNS применяется для того, чтобы выполнить формирование временного представления шумов квантователя внутри каждого окна преобразования. Это достигается тем, что применяется процесс фильтрации на частях спектральных данных каждого канала. Кодирование проводится на основе окон. В частности, осуществляются следующие этапы, чтобы механизм TNS применить к окну спектральных данных, то есть к блоку спектральных значений.

Прежде всего выбирается частотный диапазон для механизма TNS. Подходящий выбор состоит в том, чтобы частотный диапазон 1,5 кГц до наивысшего возможного диапазона коэффициента масштабирования перекрыть одним фильтром. Следует отметить, что этот частотный диапазон зависит от частоты дискретизации, как это определено стандартом AAC (ISO/IEC 14496-3: 2001 (E)).

Затем проводится вычисление на основе кодирования с линейным предсказанием (LPC), а именно: со спектральными коэффициентами МДКП, которые лежат в выбранном целевом частотном диапазоне. Для повышенной устойчивости коэффициенты, которые соответствуют частотам ниже 2,5 кГц, исключаются из этого процесса обработки. Обычные процедуры LPC, как это известно из обработки речевых сигналов, могут применяться для вычисления на основе LPC, например, известный алгоритм Левинсона-Дарбина. Вычисление выполняется для максимально допустимого порядка фильтра преобразования шумов.

В качестве результата вычисления на основе LPC получают ожидаемый выигрыш предсказания PG. Кроме того, получают коэффициенты отображения или Parcor-коэффициенты.

Если выигрыш предсказания не превышает определенный порог, то механизм TNS не применяется. В этом случае в битовый поток записывается управляющая информация, чтобы в кодере было известно, что обработка на основе механизма TNS не выполнялась.

Однако если выигрыш предсказания превышает определенный порог, то обработка на основе механизма TNS применяется.

На следующем этапе производится квантование коэффициентов отображения. Порядок применяемого фильтра преобразования шумов определяется путем удаления всех коэффициентов отражения с абсолютным значением, меньшим, чем порог, из «хвоста» массива коэффициентов отражения. Число оставшихся коэффициентов отражения имеет порядок величины фильтра преобразования шумов. Подходящий порог составляет примерно 0,1.

Оставшиеся коэффициенты отражения преобразуются в типовом случае в коэффициенты линейного предсказания, причем этот метод также известен как процедура ступенчатого увеличения.

Вычисленные коэффициенты линейного предсказания (LPC) применяются затем как коэффициенты фильтра преобразования шумов, таким образом, как коэффициенты фильтра предсказания. Этот FIR-фильтр (с конечным импульсным откликом) проводится через определенный диапазон целевых частот. При декодировании применяется авторегрессионный фильтр, в то время как при кодировании применяется так называемый фильтр со скользящим средним. Наконец, для механизма TNS на блок форматирования битового потока еще подводится информация разностного стереосигнала, как показано на фиг. 3 стрелкой между блоком 1010 TNS-обработки и блоком 1004 форматирования битового потока.

Затем проводятся не показанные факультативные механизмы обработки, такие как механизм долговременного прогнозирования, механизм интенсивности/связи, механизм прогнозирования, механизм шумовой подстановки, пока, наконец, обработка не дойдет до кодера 1012 центрального/боковых сигналов. Кодер 1012 центрального/боковых сигналов активизируется в том случае, если кодируемый аудиосигнал представляет собой многоканальный сигнал, то есть стереосигнал с левым каналом и правым каналом. До сих пор, то есть в направлении обработки от блока 1012 на фиг. 3, левый и правый стереоканалы обрабатывались отдельно друг от друга, то есть масштабировались, преобразовывались набором фильтров, подвергались TNS-обработке или пропускали ее и т.д.

Тогда в кодере 1012 центрального/боковых сигналов сначала проверяется, целесообразно ли проводить кодирование центрального/боковых сигналов, то есть обеспечивает ли оно вообще выигрыш от кодирования. Кодирование центрального/боковых сигналов обеспечивает выигрыш кодирования в том случае, если левый и правый каналы подобны, так как тогда центральный канал, то есть сумма левого и правого каналов, примерно равен левому или правому каналу, без учета масштабирования посредством коэффициента 1/2, в то время как разностный стереосигнал имеет всего лишь малые значения, так как равен разности между левым и правым каналом. Тем самым можно видеть, что в том случае, когда левый и правый каналы приближенно одинаковы, разность приближенно равна нулю или имеет очень малые значения, которые, можно надеяться, в последующем квантователе 1014 будут квантованы к нулю и, тем самым, могут передаваться очень эффективным образом, так как за квантователем 1014 включен энтропийный кодер 1016.

На квантователь 1014 из психоакустической модели 1020 подается разрешенная помеха, приходящаяся на диапазон коэффициента масштабирования. Квантователь работает итеративным способом, то есть сначала опрашивается внешний итерационный контур, который затем опрашивает внутренний итерационный контур. Вообще говоря, сначала, исходя из величины шага и начальных значений квантователя, предпринимается квантование блока значений на входе квантователя 1014. В частности, внутренний контур квантует коэффициенты МДКП, при этом применяется определенное количество битов. Внешний контур рассчитывает искажения и модифицированную энергию коэффициентов с применением коэффициента масштабирования, чтобы снова обратиться к внутреннему контуру. Этот процесс итеративно повторяется до тех пор, пока не будет выполнено определенное условие. Для каждой итерации во внешнем итерационном контуре при этом реконструируется сигнал, чтобы вычислить помеху, обусловленную квантованием, и сравнить с разрешенной помехой, выдаваемой из психоакустической модели 1020. Кроме того, коэффициенты масштабирования частотных диапазонов, все еще оцениваемых после этого сравнения как содержащие помехи, увеличиваются от итерации к итерации на одну или более ступеней, а именно для каждой итерации внешнего итерационного контура.

Затем, если достигнута ситуация, при которой помеха квантователя, введенная вследствие квантования, ниже разрешенной помехи, определенной психоакустической моделью, и если одновременно выполняются требования к битам, а именно, максимальная скорость битов не превышена, то итерация, то есть способ анализа через синтез, завершается, и полученные коэффициенты масштабирования кодируются, как это выполняется в блоке 1014, и в кодированной форме подаются на блок 1004 форматирования битового потока, как показано стрелкой между блоком 1014 и блоком 1004. Квантованные значения подаются затем на энтропийный кодер 1016, который в типовом случае с применением множества таблиц кодов Хафмана проводит энтропийное кодирование для различных диапазонов коэффициентов масштабирования, чтобы перевести квантованные значения в двоичный формат. Известно, что при энтропийном кодировании в форме кодирования Хафмана осуществляется обращение к кодовым таблицам, которые формируются на основе ожидаемой статистики сигналов, и в которых часто встречающиеся значения становятся более короткими кодовыми словами, чем более редко встречающиеся значения. Энтропийно кодированные значения затем также подаются в качестве собственно основной информации на блок 1004 форматирования битового потока, который затем выдает на выходе кодированный аудиосигнал, соответствующий определенному синтаксису битового потока.

Как уже упоминалось, при таком итеративном квантовании, если помеха, обусловленная величиной шага квантования, больше, чем порог, то применяется меньшая величина шага квантования, а именно, в надежде на то, что тем самым шумы квантования будут снижены, вследствие более точного квантования.

Этот принцип имеет недостаток, заключающийся в том, что, естественно, за счет меньшей величины шага квантователя, подлежащий передаче объем данных возрастает, и, тем самым, выигрыш от сжатия снижается.

Задача изобретения заключается в том, чтобы создать принцип определения величины шага квантователя, который, с одной стороны, вводит меньшую помеху квантования и, с другой стороны, обеспечивает получение хорошего выигрыша от сжатия.

Эта задача в соответствии с изобретением решается устройством для определения величины шага квантователя согласно пункту 1 формулы изобретения, способом определения величины шага квантователя согласно пункту 8 формулы изобретения или компьютерной программой согласно пункту 9 формулы изобретения.

В основе изобретения лежит знание того, что дополнительное снижение помеховой мощности с одной стороны, и одновременно повышение или, по меньшей мере, сохранение величины выигрыша от кодирования может достигаться за счет того, что и в том случае, когда введенная помеха больше, чем порог, не применяется более точное квантование, как известно в уровне техники, а испытывается, по меньшей мере, несколько более грубых величин шага квантователя. Оказалось, что и при более грубых величинах шага квантователя могут быть достигнуты снижения помех, обусловленных квантованием, а именно, в том случае, когда более грубая величина шага квантователя лучше «подходит» к значению, подлежащему квантованию, чем более точная величина шага квантователя. Этот эффект основывается на том, что ошибка квантования зависит не только от величины шага квантователя, но и, естественно, также от значений, подлежащих квантованию. Если подлежащие квантованию значения близки к величинам шага для более грубых величин шага квантователя, то достигается снижение шумов квантования при одновременном, более высоком выигрыше сжатия (ввиду более грубого квантования).

Соответствующий изобретению принцип особенно выгоден в том случае, когда уже для первой величины шага квантователя, исходя из которой проводится сравнение с порогом, имеются хорошо оцененные величины шага квантователя. В предпочтительном примере выполнения настоящего изобретения более целесообразным является определение первой величины шага квантователя путем непосредственного вычисления на основе средней энергии шума, а не на основе сценария наихудшего случая. Тем самым итерационные циклы, соответствующие уровню техники, могут быть значительно сокращены или полностью исключены.

Соответствующая изобретению последующая обработка величины шага квантователя еще только однократно испытывает более грубую величину шага квантователя, с целью получения выгоды из описанного эффекта «наилучшего соответствия» для подлежащего квантованию значения. Если затем устанавливается, что помеха, полученная за счет более грубой величины шага квантователя, меньше, чем предшествующая помеха, или даже меньше порога, то затем может производиться дополнительная итерация для испытания еще более грубой величины шага квантователя. Этот процесс проверки последующих более грубых величин шага квантователя продолжается до тех пор, пока вводимая помеха вновь не начнет возрастать. Это означает, что достигнут критерий прерывания, так что квантование проводится с использованием сохраненной величины шага квантователя, которая обуславливала наименьшую вводимую помеху, и затем выполняется, как это требуется, процедура кодирования.

В альтернативном примере выполнения настоящего изобретения для оценки первой величины шага квантователя может проводиться процедура анализа через синтез, как в уровне техники, которая проводится до тех пор, пока не будет достигнут соответствующий ей критерий прерывания. Затем может вводиться последующая обработка, соответствующая изобретению, чтобы в заключение проверить, нельзя ли все-таки с использованием более грубой величины шага квантователя прийти к настолько же хорошим результатам или даже к лучшим результатам по помехе. Если при этом устанавливается, что более грубая величина шага квантователя дает настолько же хороший результат или даже лучший результат, что касается вводимой помехи, то она применяется для квантования. Если, напротив, устанавливается, что более грубое квантование не дает ничего, то для окончательного квантования применяется первоначально определенная величина шага квантователя, то есть полученная методом анализа через синтез.

В соответствии с изобретением могут, таким образом, использоваться любые величины шага квантователя, чтобы осуществить первое сравнение с порогом. При этом несущественно, определена ли эта первая величина шага квантователя уже согласно схеме анализа через синтез, или даже посредством прямого вычисления величины шага квантования.

В предпочтительном примере выполнения заявленного изобретения этот принцип квантования используется для квантования аудиосигнала, имеющегося в частотном диапазоне. Однако этот принцип может использоваться также для квантования сигнала временного диапазона, содержащего аудио и/или видеоинформацию.

Кроме того, следует отметить, что порог, с которым выполняется сравнение, представляет собой психоакустическую или психооптическую разрешенную помеху, или другой порог, в отношении которого желательно, чтобы он не был превышен. Так этот порог может в действительности представлять собой разрешенную помеху, формируемую соответствующей психоакустической моделью. Однако такой порог может представлять собой предварительно определенную вводимую помеху, соответствующую первоначальной величине шага квантователя, или какой-либо иной порог.

Следует отметить, что квантованные значения необязательно должны быть кодированы кодом Хафмана, альтернативно, они могут быть кодированы с использованием другого энтропийного кодирования, например, арифметического кодирования. Альтернативным образом, квантованные значения могут также кодироваться двоичным способом, так как и такое кодирование приводит к тому, что для передачи меньших значений или значений, равных нулю, требуется меньше битов, чем для передачи больших значений или, в общем случае, значений, не равных нулю.

Предпочтительным образом, для определения выходных значений, то есть первых величин шага квантования, можно полностью или в значительной части отказаться от итеративного подхода, если величина шага квантователя определяется из прямой оценки энергии шумов. Вычисление величины шага квантования из точной оценки энергии шумов является значительно более быстрым, чем вычисление в контуре анализа через синтез, так как значения для вычисления непосредственно доступны. Не требуется сначала предпринимать несколько попыток квантования и сравнения, прежде чем будет найдена благоприятная для кодирования величина шага квантователя.

Однако так как в случае применяемой характеристики квантователя речь идет о нелинейной характеристике, то нелинейная характеристика должна приниматься во внимание и при оценке шумов. Больше не может применяться простая оценка энергии шумов для линейного квантователя, так как она является неточной. В соответствии с изобретением применяется квантователь со следующей характеристикой квантования:

В приведенном выше уравнении xi представляют собой спектральные значения, подлежащие квантованию. Выходные значения обозначены через yi, причем yi являются, таким образом, квантованными спектральными значениями. Через q обозначена величина шага квантователя. Символом "round" обозначена функция округления, которая предпочтительно является функцией "nint", где "nint" (от англ. "nearest integer") обозначает «ближайшее целое число». Показатель степени, который делает квантователь нелинейным квантователем, обозначен символом α, причем α не равно 1. В типовом случае показатель степени α должен быть меньше, чем 1, так что квантователь имеет сжимающую характеристику. В случае уровня 3 и для ААС показатель степени α равен 0,75. Параметр s является аддитивной постоянной, имеющей величину, которая также может принимать значение, равное нулю.

В соответствии с изобретением, для вычисления величины шага квантования применяется следующее соотношение:

В случае α, равного 3/4, получается следующее уравнение:

В этих уравнениях левый член соответствует разрешенной в частотном диапазоне помехе THR, которая создается психоакустическим модулем для диапазона коэффициента масштабирования с частотными линиями от i, равного i1, до i, равного i2. Приведенное выше уравнение обеспечивает возможность практически точной оценки помехи, вводимой вследствие величины q шага квантователя, для нелинейного квантователя с вышеуказанной характеристикой квантования с показателем степени α, не равным 1, причем функция "nint" из уравнения квантователя проводит собственно уравнение квантования, а именно округление до ближайшего целого числа.

Следует отметить, что вместо функции "nint" может применяться любая функция округления round, например, округление до ближайшего четного числа или ближайшего нечетного числа, или округление до следующего 10-го числа и т.д. В общем случае функция округления обеспечивает то, что значение из множества значений с предварительно определенным количеством разрешенных значений отображается на множество значений с меньшим определенным вторым количеством значений.

В предпочтительном варианте выполнения заявленного изобретения квантованные спектральные значения уже перед этим были подвергнуты обработке TNS, и если речь идет о, например, стереосигналах, то есть кодированию центрального/боковых сигналов, если только каналы были такого типа, что позволяли активировать кодер центрального/боковых сигналов.

Во взаимосвязи между величиной шага квантователя и коэффициента масштабирования, который задается согласно следующей формуле:

коэффициент масштабирования может, тем самым, быть непосредственно указан для каждого диапазона коэффициентов масштабирования и может быть подан на соответствующий аудиокодер. Коэффициент масштабирования получается из следующего уравнения:

В предпочтительном примере выполнения настоящего изобретения может еще использоваться итерация после обработки, которая основывается на принципе анализа через синтез, чтобы непосредственно без итерации вычисленную величину шага квантователя для каждого диапазона коэффициента масштабирования еще в некоторой степени изменить, чтобы добиться действительного оптимума.

По сравнению с уровнем техники, уже очень точное вычисление начальных значений обеспечивает возможность очень короткой итерации, хотя было найдено, что в большинстве случае можно совсем отказаться от последующей итерации.

Предпочтительный принцип, который базируется на вычислении величины шага квантователя с помощью средней энергии шумов, обеспечивает, таким образом, хорошую и реалистичную оценку, так как она, в отличие от решений, известных из уровня техники, работает не согласно сценарию наихудшего случая, а применяет ожидаемое значение ошибки квантования в качестве основы и, тем самым, при субъективно эквивалентном качестве обеспечивает возможность более эффективного кодирования данных со значительно меньшим числом битов. Кроме того, ввиду того факта, что от итерации можно вообще отказаться, или что число шагов итерации можно значительным образом снизить, может быть реализован кодер со значительно более высоким быстродействием. Это, в частности, имеет значение потому, что итерационные циклы в известных кодерах составляли существенную часть полного требуемого времени обработки. Тем самым сокращение уже на один или несколько итерационных циклов ведет в целом к заметной экономии времени для кодера.

Предпочтительные варианты выполнения заявленного изобретения поясняются ниже со ссылками на чертежи, на которых показано следующее:

Фиг. 1 - блок-схема устройства для определения квантованного аудиосигнала;

Фиг. 2 - блок-схема процесса обработки согласно предпочтительному варианту выполнения настоящего изобретения;

Фиг. 3 - блок-схема известного кодера согласно стандарту ААС;

Фиг. 4 - иллюстрация снижения помехи квантования за счет более грубой величины шага квантователя и

Фиг. 5 - блок-схема соответствующего изобретению устройства для определения величины шага квантователя для квантования сигнала.

Далее со ссылкой на фиг. 5 представлен принцип, соответствующий изобретению. На фиг. 5 показано схематичное представление устройства для определения величины шага квантователя для квантования сигнала, который содержит аудио- или видеоинформацию и подается на сигнальный вход 500. Сигнал подается на устройство 502 для выработки первой величины шага квантователя (QSW) и для выработки порога помехи, которая далее обозначается как вводимая помеха. Следует отметить, что порог помехи может быть любым порогом. Предпочтительным образом, он может представлять собой психоакустическую или психооптически вводимую помеху, причем этот порог выбирается таким образом, что сигнал, в который введена помеха, все еще воспринимается слушателем или наблюдателем как не имеющий помех.

Порог (THR), а также первая величина шага квантователя подаются на устройство 504 для определения первой помехи, действительно вводимой за счет первой величины шага квантователя. Определение действительно вводимой помехи осуществляется предпочтительным образом посредством квантования с первой величиной шага квантователя, посредством повторного квантования с применением первой величины шага квантователя и за счет вычисления расстояния (меры различия) между первоначальным сигналом и квантованным сигналом. Предпочтительным образом, если обрабатываются спектральные значения, то из корреспондирующих спектральных значений первоначального сигнала и повторно квантованного сигнала формируются квадраты, чтобы затем определить разность квадратов. Могут использоваться альтернативные методы определения расстояния.

Устройство 504 вырабатывает значение для первой помехи, действительно введенной за счет первой величины шага квантователя. Оно вместе с порогом THR подается на устройство 506 для сравнения. Устройство 506 выполняет сравнение между порогом THR и первой действительно введенной помехой. Если первая действительно введенная помеха больше, чем порог, то устройство 506 активизирует устройство 508 для выбора второй величины шага квантователя, причем устройство 508 выполнено таким образом, чтобы выбирать вторую величину шага квантователя более грубой, то есть большей, чем первая величина шага квантователя. Выбранная устройством 508 вторая величина шага квантователя подается на устройство 510 для определения действительно введенной второй помехи. Для этого устройство 510 получает первоначальный сигнал, а также вторую величину шага квантователя и вновь проводит квантование с использованием второй величины шага квантователя, то есть повторное квантование с использованием второй величины шага квантователя, и вычисление расстояния между повторно квантованным сигналом и первоначальным сигналом, чтобы ввести меру действительно введенной второй помехи в устройство 512 для сравнения. Устройство 512 для сравнения сравнивает действительно введенную вторую помеху с действительно введенной первой помехой или с порогом THR. Если действительно введенная вторая помеха меньше, чем действительно введенная первая помеха, или даже меньше, чем порог THR, то для квантования сигнала применяется вторая величина шага квантователя.

Следует отметить, что показанный фиг. 5 принцип является всего лишь схематичным. Разумеется, для проведения операций сравнения в блоках 506 и 512 необязательно должны предусматриваться раздельные устройства сравнения, а может также предусматриваться единственное устройство сравнения, которое управляется соответствующим образом. То же самое справедливо для устройств 504 и 510 для определения действительно введенных помех. Также и они необязательно должны выполняться как раздельные устройства.

Кроме того, следует отметить, что устройство для квантования необязательно должно выполняться как отдельное устройство от устройства 510. В типовом случае сигналы, квантованные с использованием второй величины шага квантователя, формируются уже в устройстве 510, если устройство 510 проводит квантование и повторное квантование, чтобы определить действительно введенную помеху. Полученные там квантованные значения могут также сохраняться и затем, когда устройство 512 для сравнения вырабатывает положительный результат, выдаваться в качестве квантованного сигнала, так что устройство 514 для квантования в известной мере «сливается» с устройством для определения действительно введенной второй помехи.

В предпочтительном примере выполнения предложенного изобретения порог THR представляет собой психоакустически определяемую максимальную вводимую помеху, причем в этом случае сигнал является аудиосигналом. Порог THR при этом вырабатывается из психоакустической модели, которая работает обычным образом и для каждого диапазона коэффициентов масштабирования вырабатывает оцениваемую в этом диапазоне коэффициентов масштабирования вводимую максимальную помеху квантования. Максимально вводимая помеха базируется на пороге маскирования в той мере, что она идентична порогу маскирования или выводится из порога маскирования в той степени, что, например, кодирование проводится с доверительным интервалом таким образом, что вводимая помеха меньше, чем порог маскирования, или что проводится скорее «агрессивное» кодирование в смысле сокращения битовой скорости, а именно, что разрешенная помеха лежит выше порога маскирования.

Далее со ссылкой на фиг. 1 представлен предпочтительный способ реализации устройства 502 для выработки первой величины шага квантователя. В остальном функции устройства 50 по фиг. 2 и устройства 502 по фиг. 5 одинаковы. Предпочтительным образом, устройство 502 выполнено таким образом, чтобы иметь функции устройства 10 и устройства 12, показанных на фиг. 1. Кроме того, в этом примере квантователь 514 на фиг. 1 выполнен подобно квантователю 14 на фиг. 1.

Далее со ссылкой на фиг. 2 показана полная процедура, которая в том случае, если введенная помеха больше, чем порог, также проводит проверку более грубых величин шага квантования.

Кроме того, левая ветвь на фиг. 2, которая представляет соответствующий изобретению принцип, расширена за счет того, что в случае, если введенная помеха больше, чем порог, и выбор более грубой величины шага квантования ничего не дает, и если требования битовой скорости не особенно строги, или в «битовом резерве» еще имеется место, то проводится итерация с меньшей, то есть более точной величиной шага квантования.

Наконец, со ссылкой на фиг. 4 представлен эффект, на котором базируется настоящее изобретение, а именно то, что несмотря на выбор более грубой величины шага квантователя, может быть получен меньший шаг квантования и, тем самым, до некоторой степени повышение выигрыша за счет сжатия.

На фиг. 1 показано устройство для определения квантованного аудиосигнала, который задан как спектральное представление в форме спектральных значений. В частности, следует отметить, что если, ссылаясь на фиг. 3, не предпринимается никакая обработка TNS и никакое кодирование центрального/боковых сигналов, то спектральные значения являются непосредственно выходными значениями блока фильтров. Если, однако, осуществляется обработка TNS, но без кодирования центрального/боковых сигналов, то вводимые в квантователь 1015 спектральные значения являются спектральными остаточными значениями в том виде, как они возникают на основе фильтрации предсказания по процедуре TNS.

Если используется обработка TNS вместе с кодированием центрального/боковых сигналов, то вводимые в соответствующее изобретению устройство спектральные значения являются спектральными значениями центрального канала или спектральными значениями боковых каналов.

Соответствующее изобретению устройство включает в себя, прежде всего, устройство для выработки разрешенной помехи, которая на фиг. 1 обозначена ссылочной позицией 10. В качестве устройства для выработки разрешенной помехи может служить показанная на фиг. 3 психоакустическая модель 1020, которая в типовом случае выполнена таким образом, чтобы для каждого диапазона коэффициентов масштабирования, то есть для группы из нескольких спектрально граничащих друг с другом спектральных значений, вырабатывать разрешенную помеху или порог, которая также обозначается как THR. Разрешенная помеха базируется на психоакустическом пороге маскирования и указывает, какое количество энергии может быть введено в исходный аудиосигнал, не вызывая восприятия помехи человеческим ухом. Иными словами, разрешенная помеха является искусственно введенной (за счет квантования) сигнальной составляющей, которая маскируется собственно аудиосигналом.

Устройство 10 выполнено таким образом, чтобы вычислить разрешенную помеху THR для частотного диапазона, предпочтительно, диапазона коэффициентов масштабирования и подать ее на следующее подключенное устройство 12. Устройство 12 служит для вычисления информации о величине шага квантователя для частотного диапазона, для которого указана разрешенная помеха THR. Устройство 12 выполнено таким образом, чтобы информацию q о величине шага квантователя подавать на следующее подключенное устройство 14 для квантования. Устройство 14 для квантования работает согласно записанному в блоке 14 предписанию квантования, причем информация о величине шага квантователя в показанном на фиг.1 случае применяется для того, чтобы спектральное значение xi сначала разделить на значение q, и затем результат возвести в степень с показателем α, не равным 1, и затем, при необходимости, еще добавить аддитивный коэффициент s.

Затем этот результат вводится в функцию округления, которая в примере выполнения, показанном на фиг. 1, обеспечивает выбор ближайшего целого числа. Целое число может, по определению, быть получено отсечением разрядов после запятой, то есть вырабатываться по принципу «всегда округление с недостатком». В качестве альтернативы ближайшее целое число может формироваться путем округления с недостатком чисел до 0,499 и путем округления с избытком чисел с 0,5. Также в качестве альтернативы ближайшее целое число может определяться по принципу «всегда округление с избытком», в зависимости от конкретной реализации. Вместо функции "nint" может использоваться любая функция округления, которая, вообще говоря, отображает округляемое значение из первого большего множества значений на второе меньшее множество значений.

На выходе устройства 14 имеется квантованное спектральное значение в частотном диапазоне. Как видно из уравнения, показанного в блоке 14, на устройство 14, наряду с величиной q шага квантователя, разумеется, также подается квантуемое спектральное значение в рассматриваемом частотном диапазоне.

Следует отметить, что устройство 12 необязательно должно непосредственно вычислять величину q шага квантователя, а в качестве альтернативной информации о величине шага квантователя может вычислять также коэффициент масштабирования, как он применяется в известных аудиокодерах, основанных на преобразованиях. Коэффициент масштабирования связан с действительной величиной шага квантователя посредством соотношения, показанного справа от блока 12. Если устройство для вычисления выполнено таким образом, чтобы в качестве информации о величине шага квантователя вычислять коэффициент масштабирования scf, то этот коэффициент масштабирования подается на устройство 14 для квантования, которое в этом случае вместо значения q в блоке 14 применяет для вычисления квантования значение 21/4 scf.

Ниже приводится вывод формулы, показанной в блоке 12.

Как описано выше, квантователь экспоненциального закона, как он показан в блоке 14, подчиняется следующему соотношению:

Инверсная операция представляется следующим образом:

Это уравнение представляет, таким образом, операцию, необходимую для повторного квантования, причем yi является спектральным значением, а x'i является повторно квантованным спектральным значением. q вновь представляет величину шага квантователя, которая взаимосвязана с коэффициентом масштабирования соотношением, показанным справа от блока 12 на фиг. 1.

Можно ожидать, что результат совместим с этим уравнением для случая α, равного 1.

Если вышеуказанное уравнение просуммировать по вектору спектральных значений, то вся мощность шумов в диапазоне, который определен индексом i, определяется следующим образом:

В целом, ожидаемое значение шумов квантования вектора определяется посредством величины q шага квантователя и так называемого коэффициента формы, который описывает распределение компонентов вектора.

Коэффициент формы, который является крайним правым членом в вышеприведенном уравнении, зависит от действительных входных значений и должен вычисляться только однократно, и в случае, когда вышеприведенное уравнение вычисляется для различных желательных уровней помех THR.

Как уже изложено, это уравнение упрощается при α, равном 3/4, следующим образом:

Левая сторона этого уравнения является, таким образом, оценкой энергии шумов квантования, которая в граничном случае совпадает с разрешенной энергией шумов (порогом).

Также выполняется следующее условие:

Сумма по корням частотных линий в правой части уравнения соответствует мере равномерности частотных линий и как коэффициент формы предпочтительно известна уже в кодере:

Также получается следующий результат:

Здесь q соответствует величине шага квантователя. Это определяется для ААС следующим образом:

scf является коэффициентом масштабирования. В случае, если коэффициент формы должен быть определен, то уравнение на основе связи между величиной шага и коэффициентом формы вычисляется следующим образом:

Представленное выше уравнение создает, таким образом, замкнутую взаимосвязь между коэффициентом масштабирования scf для диапазона коэффициентов масштабирования, который имеет определенный коэффициент формы, и для определенного порога помехи THR, который в типовом случае определяется психоакустической моделью.

Как изложено выше, вычисление величины шага с помощью средней энергии шумов дает лучшую оценку, так как исходит не из сценария наихудшего случая, а поскольку в качестве основы применяется ожидаемое значение ошибки квантования.

Соответствующий изобретению принцип пригоден, таким образом, для определения величины шага квантователя или, эквивалентно, коэффициента масштабирования для диапазона коэффициентов масштабирования без каких-либо итераций.

Однако, если требования по времени вычислений не очень строги, то может проводиться последующая обработка, как она представлена на фиг. 2. На первом этапе на фиг. 2 оценивается первая величина шага квантователя (этап 50). Оценка первой величины шага квантоватея (QSW) производится с применением процедуры, показанной на фиг. 1. Затем на этапе 52 проводится квантование с использованием первой величины шага квантователя, предпочтительно в соответствии с квантователем, как он представлен с помощью блока 14 на фиг. 1. Затем проводится повторное квантование значений, полученных посредством первой величины шага квантователя, чтобы затем вычислить введенную помеху. После этого на этапе 54 проверяется, является ли введенная помеха большей, чем заданный порог.

Следует отметить, что величина q шага квантования (или scf), вычисленная посредством соотношения, представленного в блоке 12, является аппроксимацией. Если бы соотношение, представленное в блоке 12, было бы действительно точным, то в блоке 54 должно устанавливаться, что введенная помеха точно соответствует введенной помехе. На основе приближенного характера соотношения в блоке 12 на фиг. 1 введенная помеха может быть, однако, больше или меньше, чем порог THR.

Кроме того, следует отметить, что отклонение от порога не должно быть особенно большим, хотя оно должно иметься. Если на этапе 54 устанавливается, что введенная помеха с применением первой величины шага квантователя меньше, чем порог, то ответом на вопрос на этапе 54 будет «нет», так что обработка следует по правой ветви на фиг. 3. Если введенная помеха меньше, чем порог, то это означает, что оценка в блоке 12 на фиг. 1 была слишком пессимистичной, так что на этапе 56 устанавливается более грубая величина шага квантователя в качестве второй величины шага квантователя.

Мера того, насколько более грубой является вторая величина шага квантователя по сравнению с первой величиной шага квантователя, может выбираться. Однако предпочтительным является использовать относительно малые приращения, так как оценка в блоке 50 уже относительно точна.

На этапе 58 предпринимается квантование спектральных значений с использованием второй, более грубой (большей) величины шага квантователя, последующее повторное квантование и вычисление второй помехи, соответствующей второй величине шага квантователя.

На этапе (60) затем проверяется, является ли вторая помеха, которая соответствует второй величине шага квантователя, все еще меньшей, чем первоначальный порог. Если это имеет место, то вторая величина шага квантователя сохраняется (62), и начинается новая итерация, чтобы снова на следующем этапе (56) установить еще более грубую величину шага квантователя. Затем с этой, еще более грубой величиной шага квантователя снова проводится этап 58, этап 60 и, при необходимости, этап 62, чтобы снова начать новую итерацию. Если во время некоторой итерации на этапе 60 устанавливается, что вторая помеха не меньше, чем порог, то есть больше, чем порог, то достигается критерий прерывания, и при достижении критерия прерывания производится квантование (64) с использованием последней сохраненной величины шага квантования.

После того как первая оцененная величина шага квантования уже была относительно хорошим значением, количество итераций по сравнению с плохо оцененными начальными значениями сокращается, что приводит к значительной экономии времени на вычисления при кодировании, так как итерации для вычисления величины шага квантователя занимают большую долю времени вычислений кодера.

Далее, с использованием левой ветви на фиг. 2, рассматривается соответствующая изобретению процедура, которая применяется в том случае, когда введенная помеха действительно больше, чем порог.

В соответствии с изобретением, однако, несмотря на тот факт, что введенная помеха уже больше, чем порог, устанавливается (70) еще более грубая вторая величина шага квантователя, причем затем на этапе 72 проводится квантование, повторное квантование и вычисление второй шумовой помехи, соответствующей второй величине шага квантователя. Затем на этапе 74 проверяется, является ли теперь вторая шумовая помеха меньшей, чем порог. Если это имеет место, то ответом на вопрос на этапе 74 будет «да», и сохраняется (76) вторая величина шага квантователя. Если, напротив, устанавливается, что вторая шумовая помеха больше, чем второй порог, то производится либо квантование с сохраненной величиной шага квантователя, либо, если не было сохранено лучшей второй величины шага квантователя, проводится итерация, при которой, как и в уровне техники, выбирается более точная вторая квантованная величина шага, чтобы введенную помеху «подавить» до величины, ниже порога.

Далее поясняется, каким образом, особенно в том случае, когда введенная помеха превышает порог, все-таки может достигаться улучшение, если работать с более грубой величиной шага квантователя. До сих пор всегда исходили из того, что более точная величина шага квантователя приводит к меньшей вводимой энергии квантования, а большая величина шага квантователя приводит к более высокой введенной помехе квантования. Хотя это в среднем могло быть так, однако так будет не всегда и, в частности, при довольно слабо заполненных диапазонах коэффициентов масштабирования и, в особенности, если квантователь имеет нелинейную характеристику, будет точно противоположным. В соответствии с изобретением было обнаружено, что при не слишком заниженном количестве случаев более грубая величина шага квантователя приводит к меньшей введенной помехе. Это можно свести к тому, что также может иметь место случай, когда более грубая величина шага квантователя лучше подходит к квантуемому спектральному значению, чем точная величина шага квантователя, как описывается на следующем примере со ссылкой на фиг. 4.

На фиг. 4 для примера показана характеристика квантования (60), которая вырабатывает четыре ступени квантования 0, 1, 2, 3, если входные сигналы квантуются между 0 и 1. Квантованные значения соответствуют 0,0; 0,25; 0,5 и 0,75. Для сравнения на фиг. 4 пунктиром показана другая более грубая характеристика квантования (62), которая имеет только 3 степени квантования, которые соответствуют абсолютным значениям 0,0; 0,33 и 0,66. Так величина шага квантователя в первом случае, то есть для характеристики квантования 60, равна 0,25; в то время как величина шага квантователя во втором случае, то есть для характеристики квантователя 62, равна 0,33. Вторая характеристика квантователя (62) имеет поэтому более грубую величину шага квантователя, чем первая характеристика квантования (60), которая должна представлять более точную величину шага квантователя. Если рассматривается подлежащее квантованию значение xi=0,33, то, как можно видеть также из фиг. 4, ошибка при квантовании с более точной величиной шага квантователя с четырьмя ступенями равна разности между 0,33 и 0,25 и, таким образом, составляет 0,08. Напротив, ошибка при квантовании с тремя ступенями равна нулю, ввиду того факта, что ступень квантования в известной степени точно соответствует квантуемому значению.

Из фиг. 4 можно видеть, что более грубое квантование может привести к меньшей ошибке квантования, чем более точное квантование.

Более грубое квантование к тому же имеет решающее значение в том смысле, что требуется меньшая выходная битовая скорость, так как возможными состояниями являются только три состояния, а именно 0, 1, 2, в противоположность случаю более точного квантователя, при котором должны сигнализироваться четыре ступени, а именно 0, 1, 2, 3. Кроме того, более грубая величина шага квантователя имеет преимущество, состоящее в том, что имеет место тенденция большего числа значений, квантуемых в нуль, чем при более точной величине шага квантователя, при которой меньше значений квантуются в нуль. Хотя, если рассматривается больше спектральных значений в диапазоне коэффициента масштабирования, «квантование в 0» приводит к повышению ошибки квантования, это необязательно может становиться проблематичным, так как более грубая величина шага квантователя, возможно, более точно соответствует другим более важным спектральным значениям, так что ошибка квантования устраняется посредством более грубого квантования других спектральных значений и даже перекомпенсируется, причем к тому же должна использоваться меньшая битовая скорость.

Иными словами, за счет изобретения достигается в целом лучший результат кодера, так как реализуется меньшее число подлежащих сигнализации состояний и к тому же лучшее соответствие ступеней квантования.

В соответствии с изобретением, как представлено на фиг. 2 в левой ветви, исходя из значений оценки (этап 50 на фиг. 2), если введенная помеха больше, чем порог, то все же испытывается еще более грубая величина шага квантователя, чтобы получить выгоду из эффекта, представленного на фиг. 4. Кроме того, оказалось, что этот эффект при нелинейном квантовании проявляется еще более заметно, чем в представленном на фиг. 4 случае двух линейных характеристик квантователя.

Представленный принцип последующей обработки величины шага квантователя или последующей обработки коэффициента масштабирования служит, таким образом, для улучшения результата блока оценки коэффициента масштабирования.

Исходя из величин шага квантователя, которые были определены в блоке оценки коэффициента масштабирования (50 на фиг. 2), на этапе анализа через синтез определяются максимально большие величины шага квантователя, для которых энергия ошибки меньше, чем заданное пороговое значение.

Прежде всего, таким образом, спектр с рассчитанными величинами шага квантователя квантуется, и определяется энергия сигнала ошибки, то есть, предпочтительно, сумма квадратов разности из исходных и квантованных спектральных значений. Альтернативным образом, для определения ошибки может также применяться соответствующий временной сигнал, хотя применение спектральных значений является предпочтительным.

Величина шага квантователя и сигнал ошибки сохраняются как наилучший до текущего момента результат. Если вычисленная помеха выше порогового значения, то осуществляется следующая процедура:

Коэффициент масштабирования в пределах заданного диапазона варьируется относительно первоначально вычисленного значения, причем применяются, в частности, также более грубые величины шага квантования (70).

Для каждого нового коэффициента масштабирования спектр заново квантуется, и вычисляется энергия сигнала ошибки. Если сигнал ошибки меньше, чем наименьшее до сих пор вычисленное значение, то текущие величины шага квантователя вместе с энергией соответствующего сигнала ошибки сохраняется промежуточным образом в качестве наилучшего текущего результата.

При этом в соответствии с изобретением принимаются во внимание не только меньшие, но также и большие коэффициенты масштабирования, чтобы, в частности, в случае, когда квантователь является нелинейным квантователем, получить выигрыш на основе принципа, иллюстрируемого на фиг. 4.

Если, напротив, вычисленная ошибка ниже порогового значения, то это означает, что оценка на этапе 50 была чересчур пессимистичной, так что коэффициент ошибки варьируется внутри заданного диапазона относительно первоначально вычисленного значения.

Для каждого нового коэффициента масштабирования спектр квантуется заново, и вычисляется энергия сигнала ошибки.

Если сигнал ошибки меньше, чем наименьшее до сих пор вычисленное значение, то текущая величина шага квантователя вместе с энергией соответствующего сигнала ошибки сохраняется промежуточным образом в качестве наилучшего текущего результата.

При этом, однако, принимаются во внимание только более грубые коэффициенты масштабирования, чтобы сократить число битов, необходимое для кодирования аудиоспектра.

В зависимости от конкретных условий применения, соответствующий изобретению способ может быть реализован аппаратными средствами или программным обеспечением. Реализация может осуществляться на цифровом носителе для хранения данных, например, на дискете или на компакт-диске (CD) с электронным способом, считываемыми управляющими сигналами, которые могут взаимодействовать с программируемой компьютерной системой таким образом, чтобы выполнить способ.

Таким образом, изобретение также относится к компьютерному программному продукту с сохраненным на машиночитаемом носителе программным кодом для выполнения соответствующего изобретению способа, если компьютерный программный продукт выполняется на вычислительном устройстве. Иными словами, изобретение также может быть реализовано как компьютерная программа с программным кодом для выполнения способа, когда компьютерная программа выполняется на компьютере.

Похожие патенты RU2329549C2

название год авторы номер документа
УСТРОЙСТВО И СПОСОБ ОПРЕДЕЛЕНИЯ ОЦЕНОЧНОГО ЗНАЧЕНИЯ 2005
  • Шуг Михель
  • Хильперт Йоханнес
  • Геиэрсбергер Штефан
  • Нойендорф Макс
RU2337414C2
УСТРОЙСТВО И СПОСОБ ОБРАБОТКИ МНОГОКАНАЛЬНОГО СИГНАЛА 2005
  • Херре Юрген
  • Шуг Михель
  • Грешль Александр
RU2332727C2
КОДИРОВАНИЕ ИНФОРМАЦИОННОГО СИГНАЛА 2007
  • Хиршфельд Йенс
  • Шуллер Геральд
  • Лутцки Манфред
  • Кремер Ульрих
  • Вабник Штефан
RU2407145C2
СПОСОБ И УСТРОЙСТВО ДЛЯ КВАНТОВАНИЯ ИНФОРМАЦИОННОГО СИГНАЛА 2005
  • Шуллер Геральд
  • Вабник Штефан
  • Ширшфельд Йенс
  • Физель Вольфганг
RU2337413C2
УСТРОЙСТВО И СПОСОБ ФОРМИРОВАНИЯ РАСШИРЕННОГО СИГНАЛА С ИСПОЛЬЗОВАНИЕМ ЗАПОЛНЕНИЯ НЕЗАВИСИМЫМ ШУМОМ 2015
  • Диш Саша
  • Гайгер Ральф
  • Нидермайер Андреас
  • Нойзингер Маттиас
  • Шмидт Константин
  • Вильде Штефан
  • Шуберт Беньямин
  • Нойкам Кристиан
RU2665913C2
УСТРОЙСТВО И СПОСОБ ФОРМИРОВАНИЯ РАСШИРЕННОГО СИГНАЛА С ИСПОЛЬЗОВАНИЕМ ЗАПОЛНЕНИЯ НЕЗАВИСИМЫМ ШУМОМ 2015
  • Диш Саша
  • Гайгер Ральф
  • Нидермайер Андреас
  • Нойзингер Маттиас
  • Шмидт Константин
  • Вильде Штефан
  • Шуберт Беньямин
  • Нойкам Кристиан
RU2667376C2
АУДИОКОДЕР С ЗАВИСИМЫМ ОТ СИГНАЛА УПРАВЛЕНИЕМ ТОЧНОСТЬЮ И ЧИСЛОМ, АУДИОДЕКОДЕР И СВЯЗАННЫЕ СПОСОБЫ И КОМПЬЮТЕРНЫЕ ПРОГРАММЫ 2020
  • Бюте, Ян
  • Шнелль, Маркус
  • Дёла, Штефан
  • Грилл, Бернхард
  • Дитц, Мартин
RU2782182C1
УСТРОЙСТВО И СПОСОБ ДЛЯ КОДИРОВАНИЯ И ДЕКОДИРОВАНИЯ АУДИОСИГНАЛА С ИСПОЛЬЗОВАНИЕМ ПОНИЖАЮЩЕЙ ДИСКРЕТИЗАЦИИ ИЛИ ИНТЕРПОЛЯЦИИ МАСШТАБНЫХ ПАРАМЕТРОВ 2018
  • Равелли, Эммануэль
  • Шнелль, Маркус
  • Бенндорф, Конрад
  • Лутцки, Манфред
  • Дитц, Мартин
  • Корсе, Срикантх
RU2762301C2
УСОВЕРШЕНСТВОВАННЫЙ КВАНТОВАТЕЛЬ 2021
  • Клейса, Януш
  • Виллемоес, Ларс
  • Хеделин, Пер
RU2823174C2
СПОСОБ ЦИФРОВОГО КОДИРОВАНИЯ ДЛЯ ПЕРЕДАЧИ И/ИЛИ НАКОПЛЕНИЯ АКУСТИЧЕСКИХ СИГНАЛОВ 1990
  • Бернхард Грилл
  • Томас Спорер
  • Бернд Кюртен
  • Эрнст Эберлейн
  • Карл-Хейнц Бранденбург
RU2141166C1

Иллюстрации к изобретению RU 2 329 549 C2

Реферат патента 2008 года УСТРОЙСТВО И СПОСОБ ОПРЕДЕЛЕНИЯ ВЕЛИЧИНЫ ШАГА КВАНТОВАТЕЛЯ

Изобретение относится к аудиокодерам, в частности к аудиокодерам, в которых осуществляется преобразование временного представления в спектральное представление. Сущность изобретения состоит в том, что для определения величины шага квантователя для квантования сигнала, содержащего аудио- или видеоинформацию, вырабатывается первая величина шага квантователя, а также порог помехи. Затем определяется помеха, действительно введенная за счет первой величины шага квантователя, и эта помеха сравнивается с порогом помехи. Несмотря на тот факт, что сравнение указывает на то, что действительно введенная помеха больше, чем порог, применяют вторую, более грубую величину шага квантователя, которую затем используют для квантования, если выясняется, что помеха, введенная за счет более грубой второй величины шага квантования, меньше, чем порог или помеха, введенная за счет первой величины шага квантователя. Технический результат, достигаемый при реализации изобретения, состоит в том, что за счет выбора более грубой величины шага квантования и, тем самым, повышения выигрыша за счет сжатия, снижается помеха квантования. 3 н. и 7 з.п. ф-лы, 5 ил.

Формула изобретения RU 2 329 549 C2

1. Устройство для определения величины шага квантователя для квантования сигнала, содержащего аудио или видеоинформацию, содержащее:

средство (502) для выработки первой величины шага квантователя и порога помехи для сигнала;

средство (504) для определения первой помехи, введенной за счет первой величины шага квантователя в сигнал;

средство (506) для сравнения помехи, введенной за счет первой величины шага квантователя в сигнал, с порогом помехи для сигнала;

средство (508) для выбора второй величины шага квантователя, которая больше, чем первая величина шага квантователя, если первая помеха, введенная в сигнал, больше, чем порог помехи для сигнала;

средство (510) для определения второй помехи, введенной за счет второй величины шага квантователя в сигнал;

средство (512) для сравнения второй помехи, введенной в сигнал, с порогом помехи для сигнала или с первой помехой, введенной в сигнал, и

средство (514) для квантования сигнала с использованием второй величины шага квантователя, если вторая помеха, введенная в сигнал, меньше, чем первая помеха, введенная в сигнал, или меньше, чем порог помехи для сигнала.

2. Устройство по п.1, в котором сигнал представляет собой аудиосигнал и содержит спектральные значения спектрального представления аудиосигнала, причем упомянутое устройство (502) для выработки первой величины шага квантователя и порога помехи для сигнала выполнено как психоакустическая модель, которая вычисляет разрешенную помеху для частотного диапазона на основе психоакустического порога маскирования.3. Устройство по п.1, в котором упомянутое устройство (504) для определения первой помехи, введенной в сигнал, или упомянутое устройство (510) для вычисления второй помехи, введенной в сигнал, выполнено с возможностью осуществления квантование с применением величины шага квантователя, повторного квантования с применением величины шага квантователя и вычисления меры различия между повторно квантованным сигналом и упомянутым сигналом, чтобы получить помеху, введенную в сигнал.4. Устройство по п.1, в котором упомянутое устройство (502) для выработки первой величины шага квантователя и порога помехи для сигнала выполнено с возможностью вычисления величины шага квантователя согласно следующему равенству:

в котором упомянутое устройство (514) для квантования выполнено таким образом, чтобы осуществлять квантование согласно следующему равенству:

причем xi является квантуемым спектральным значением, q представляет информацию о величинах шага квантования, s является числом, не равным или равным нулю, α является показателем степени, не равным 1, round является функцией округления, которая отображает значение из первого большего диапазона значений на значение из второго меньшего диапазона значений, является разрешенной помехой, и i является текущим индексом для спектральных значений в частотном диапазоне.

5. Устройство по п.1, в котором упомянутое устройство (508) для выбора второй величины шага квантователя выполнено таким образом, чтобы в случае, если помеха, введенная в сигнал, меньше, чем разрешенная помеха, выбирать большую величину шага квантователя.6. Устройство по п.1, в котором упомянутое устройство (502) для выработки первой величины шага квантователя и порога помехи для сигнала выполнено таким образом, чтобы вырабатывать первую величину шага квантователя в качестве результата определения по процедуре анализа через синтез.7. Устройство по п.1, в котором упомянутое устройство (508) для выбора второй величины шага квантователя выполнено таким образом, чтобы изменять величину шага квантователя для частотного диапазона независимо от величины шага квантователя для другого частотного диапазона.8. Устройство по п.1, в котором упомянутое устройство (502) для выработки первой величины шага квантователя и порога помехи для сигнала выполнено таким образом, чтобы определять первую величину шага квантователя как результат предшествующего этапа итерации с более грубой величиной шага квантователя, и в котором порог помехи представляет собой помеху, введенную в сигнал на предыдущем этапе итерации для определения первой величины шага квантователя.9. Способ определения величины шага квантователя для квантования сигнала, содержащего аудио или видеоинформацию, содержащий следующие этапы:

выработка (502) первой величины шага квантователя и порога помехи для сигнала;

определение (504) первой помехи, введенной за счет первой величины шага квантователя в сигнал;

сравнение (506) помехи, введенной за счет первой величины шага квантователя, с порогом помехи для сигнала;

выбор (508) второй величины шага квантователя, которая больше, чем первая величина шага квантователя, если первая помеха, введенная в сигнал, больше, чем порог помехи для сигнала;

определение (510) второй помехи, введенной за счет второй величины шага квантователя в сигнал;

сравнение (512) второй помехи, введенной в сигнал, с порогом помехи или с первой помехой, введенной в сигнал, и

квантование (514) сигнала с использованием второй величины шага квантователя, если вторая помеха, введенная в сигнал, меньше, чем первая помеха, введенная в сигнал, или меньше, чем порог помехи для сигнала.

10. Машиночитаемый носитель, предназначенный для взаимодействия с программируемой компьютерной системой под действием управляющих сигналов в виде программных кодов, которые могут быть сохранены и считаны с машиночитаемого носителя, для определения величины шага квантования способом по п.9.

Документы, цитированные в отчете о поиске Патент 2008 года RU2329549C2

СПОСОБ КОДИРОВАНИЯ СИГНАЛОВ 1992
  • Кензо Акагири[Jp]
RU2090973C1
СПОСОБ И УСТРОЙСТВО МАСШТАБИРОВАННОГО КОДИРОВАНИЯ И ДЕКОДИРОВАНИЯ ЗВУКА 1998
  • Парк Сунг-Хи
  • Ким Йеон-Бае
RU2185024C2
СПОСОБ И УСТРОЙСТВО ДЛЯ МАСШТАБИРУЕМОГО КОДИРОВАНИЯ/ДЕКОДИРОВАНИЯ АУДИОСИГНАЛОВ 1997
  • Парк Сунг-Хии
RU2214047C2
Способ приготовления мыла 1923
  • Петров Г.С.
  • Таланцев З.М.
SU2004A1
Топчак-трактор для канатной вспашки 1923
  • Берман С.Л.
SU2002A1
Катод для электрохимического получения гипохлорита щелочного металла 1979
  • Любушкин Виталий Иванович
  • Любушкина Евгения Трофимовна
SU899720A1

RU 2 329 549 C2

Авторы

Грилл Бернхард

Шуг Михель

Тайхманн Бодо

Реттельбах Николаус

Даты

2008-07-20Публикация

2005-02-17Подача