Данное изобретение имеет отношение к звуковому кодированию и, в частности, к схеме звукового кодирования с низкой скоростью передачи битов (битрейт).
В этой области техники известны схемы кодирования частотной области, такие как MP3 или AAC. Эти кодирующие устройства частотной области основаны на преобразовании временной области/частотной области, последующей стадии квантования, в которой ошибка квантования регулируется посредством использования информации из психоакустического модуля, и стадии кодирования, в которой квантованные спектральные коэффициенты и соответствующая дополнительная информация энтропийно (статистически) закодированы с использованием кодовых таблиц.
С другой стороны, существуют кодирующие устройства, которые очень хорошо подходят для обработки речи, такие как AMR-WB+, как описано в 3GPP TS 26.290. Такие схемы кодирования речи выполняют Линейное фильтрование (LP) с предсказанием сигнала временной области. Такое LP фильтрование основывается на линейном предиктивном анализе входного сигнала временной области. Получающиеся коэффициенты LP фильтрования затем квантуются/кодируются и передаются как дополнительная информация. Этот процесс известен как линейное кодирование с предсказанием (LPC). На выходе фильтра остаточный сигнал прогнозирования или сигнал ошибки предсказания, известный также как сигнал возбуждения, кодируется посредством использования стадии анализа через синтез кодирующего устройства ACELP или, альтернативно, кодируется посредством использования кодирующего устройства с преобразованием, которое использует преобразование Фурье с перекрыванием. Принятие решения о выборе между кодированием ACELP и кодированием Преобразования закодированного возбуждения, которое также называют кодированием ТСХ, выполняется посредством использования алгоритма замкнутого контура или разомкнутого контура.
Схемы звукового кодирования частотной области, такие как высокоэффективная AAC схема кодирования, которая комбинирует AAC схему кодирования и технику репликации спектральной полосы, могут также объединяться с совместным стерео или многоканальным инструментом кодирования, который известен под названием «MPEG surround (окружающий)».
С другой стороны, речевые кодирующие устройства, такие как AMR-WB+, также имеют высокочастотную стадию усиления и стерео функциональные возможности.
Схемы кодирования частотной области выгодны тем, что они обеспечивают высокое качество при низкой скорости передачи битов (битрейт) для музыкальных сигналов. Однако проблематичным является качество речевых сигналов при низкой скорости передачи битов (битрейт).
Схемы речевого кодирования показывают высокое качество для речевых сигналов даже при низкой скорости передачи битов (битрейт), но показывают низкое качество для музыкальных сигналов при низкой скорости передачи битов (битрейт).
Схемы кодирования частотной области часто используют так называемое MDCT (MDCT=измененное дискретное косинусное преобразование). MDCT было первоначально описано в работе Дж. Принсена, А. Брэдли, «Схема анализирующей/синтезирующей гребенки фильтров, основанная на отмене совмещения имен временной области», IEEE Транс. ASSP, ASSP-34 (5): 1153-1161, 1986. MDCT или MDCT гребенка фильтров широко используется в современных и эффективных звуковых кодирующих устройствах. Этот вид обработки сигнала обеспечивает следующие преимущества:
Плавное взаимное ослабление между блоками обработки: Даже если сигнал в каждом блоке обработки изменяется по-разному (например, благодаря квантизации спектральных коэффициентов), не возникают никакие артефакты блокирования из-за резких переходов от блока к блоку из-за реализуемой посредством организации окон операции перекрывания/добавления.
Критическая выборка: число спектральных значений на выходе гребенки фильтров равно числу входных значений временной области на ее входе, и должны быть переданы дополнительные служебные величины.
MDCT гребенка фильтров обеспечивает высокочастотную селективность и эффективность кодирования.
Эти свойства достигаются посредством использования техники отмены совмещения имен временной области. Отмена совмещения имен временной области выполняется во время синтеза путем перекрывания-добавления двух смежных сигналов, реализуемых посредством организации окна. Если не применяется квантизация между стадиями анализа и синтеза MDCT, получается прекрасное восстановление оригинального сигнала. Однако MDCT используется для схем кодирования, которые специально приспосабливаются для музыкальных сигналов. Такие схемы кодирования частотной области имеют, как было заявлено ранее, пониженное качество при низких скоростях передачи битов (битрейт) или речевые сигналы, в то время как специально приспособленные речевые кодирующие устройства имеют более высокое качество при сопоставимых скоростях передачи битов (битрейт) или даже имеют значительно более низкие скорости передачи битов (битрейт) для того же самого качества, по сравнению со схемами кодирования частотной области.
Техники кодирования речи, такие как так называемый AMR-WB+ кодер-декодер, как определено в Технической Спецификации «Расширенный адаптивный мультискоростной - широкополосный (AMR- WB+) кодер-декодер», 3GPP TS, 26.290 V6.3.0, 2005-06, не применяют MDCT и, поэтому, не могут извлекать выгоду из превосходных свойств MDCT, которые, в частности, полагаются на обработку критической выборкой с одной стороны и переход от одного блока к другому с другой стороны. Поэтому, переход от одного блока к другому, полученный посредством MDCT без какого-либо ухудшения в отношении скорости передачи битов (битрейт) и, поэтому, свойство критической выборки MDCT еще не было получено в речевых кодирующих устройствах.
Когда будут объединены речевые кодирующие устройства и звуковые кодирующие устройства в пределах единой гибридной схемы кодирования, все еще останется проблема того, как получить переключение от одного режима кодирования на другой режим кодирования при низкой скорости передачи битов (битрейт) и с высоким качеством.
Задача данного изобретения - обеспечить улучшенную концепцию кодирования/декодирования.
Эта задача достигается посредством устройства кодирования звукового сигнала по п.1, устройства декодирования кодированного звукового сигнала по п.8, кодированного звукового сигнала по п.14, способа кодирования звукового сигнала по п.15, способа декодирования кодированного звукового сигнала по п.16 или компьютерной программы по п.17.
Аспектом данного изобретения является применение гибридной схемы кодирования, в которой применяется первый режим кодирования, специально приспособленный для определенных сигналов и действующий в одной области, и в которой последующий режим кодирования, специально приспособленный для других сигналов, и функционирование в другой области используются вместе. В этой концепции кодирования/декодирования критически выбранное переключение от одного режима кодирования на другой режим кодирования становится возможным, при этом, на стороне кодирующего устройства тот же самый блок звуковых сэмплов (образцов), который был генерирован посредством одной операции управления окнами, обрабатывается по-разному. В частности, часть совмещения имен блока звукового сигнала обрабатывается преобразованием подблока, связанного с частью совмещения имен окна, от одной области в другую область, вслед за управлением окнами этого подблока, где другой подблок, полученный посредством той же самой операции управления окнами, преобразуется от одной области в другую область до управления окнами этого подблока посредством использования окна анализа.
Обработанный первый подблок и обработанный второй подблок, впоследствии, преобразуются в последующую область, используя то же самое правило преобразования блока, чтобы получить преобразованный первый блок звукового сигнала, который затем может далее обрабатываться, используя любой из известных алгоритмов сжатия данных, таких как квантование, энтропийное кодирование и так далее.
На стороне декодера этот блок снова обрабатывается по-другому, в зависимости от того, обрабатывается ли часть совмещения имен блока, или обрабатывается другая последующая часть блока. Часть совмещения имен преобразуется в целевую область до выполнения управления окном синтеза, в то время как последующая часть подвергается управлению окном синтеза до выполнения преобразования в целевую область. Дополнительно, чтобы получить свойство критической выборки, выполняется отмена совмещения имен временной области, в которой реализованная посредством организации окон часть совмещения имен и реализованная посредством организации окон часть совмещения имен закодированного другого блока звуковых данных объединяются вслед за преобразованием части совмещения имен блока кодированного звукового сигнала в целевую область так, чтобы получить декодированный звуковой сигнал, соответствующий части совмещения имен первого блока. Ввиду этого существует два подблока/части в окне. Одна часть/подбок (подблок совмещения имен) имеет компоненты совмещения имен, которые перекрывают второй блок, закодированный в другой области, и второй подблок/часть (последующий подблок), который может иметь или не иметь компонентов совмещения имен, которые перекрывают второй блок или блок, отличный от второго блока.
Предпочтительно, чтобы совмещение имен, введенное в определенные части, которые соответствуют друг другу, но которые закодированы в различных областях, с выгодой использовалось для получения критически выбранного переключения от одного режима кодирования на другой режим кодирования, посредством другой обработки части совмещения имен и последующей части в пределах одного и того же блока звукового сэмпла (образца), реализуемого посредством организации окна.
Это в отличие от прототипной обработки, основанной на окнах анализа и окнах синтеза, так как, до сих пор, полный блок данных, полученный посредством применения окна анализа, подвергался той же самой обработке. В соответствии с данным изобретением, однако, часть совмещения имен блока, реализуемого посредством организации окон, обрабатывается иначе, по сравнению с последующей частью этого блока.
Последующая часть может включать часть несовмещения имен, появляющуюся, когда используются определенные окна начала/остановки (начальные/стоповые окна). Альтернативно, последующая часть может включать часть совмещения имен, перекрывающуюся частью результата смежного процесса управления окнами. Тогда, последующая часть (совмещения имен) перекрывается частью совмещения имен соседнего фрейма, обработанного в той же самой области, что и последующая часть (совмещения имен) обрабатываемого фрейма, и часть совмещения имен перекрывается частью совмещения имен соседнего фрейма, обработанного в другой области, по сравнению с частью совмещения имен обрабатываемого фрейма.
В зависимости от выполнения, последующая часть и часть совмещения имен вместе формируют полный результат применения функции окна к блоку звуковых сэмплов (образцов). Последующая часть может быть полностью без совмещения имен, или может быть полностью с совмещением имен, или может включать подчасть совмещения имен, и подчасть без совмещения имен. Кроме того, порядок этих подчастей и порядок части совмещения имен и последующей части могут быть отобраны произвольно.
В предпочтительном осуществлении переключенной схемы звукового кодирования смежные сегменты входного сигнала могли быть обработаны в двух различных областях. Например, AAC вычисляет MDCT в области сигнала, и МТРС (Шон А. Рампрашад, «Принцип многорежимного предиктивного кодирования с преобразованием», IEEE Операция речевой и звуковой обработки, т.11, №2, март 2003) вычисляет MDCT в LPC остаточной области. Это может быть проблематично, в частности, когда перекрывающиеся зоны имеют компоненты совмещения имен временной области вследствие использования MDCT. Действительно, совмещение имен временной области не может быть отменено в переходах от одного кодирующего устройства к другому, потому что они были произведены в двух различных областях. Одно решение состоит в том, чтобы выполнить переходы реализуемыми посредством организации окон сигналами с взаимным ослаблением без совмещения имен. Переключаемое кодирующее устройство тогда уже больше не является критически выбранным и производит информацию о служебных сигналах. Осуществления позволяют поддерживать преимущество критической выборки посредством отмены компонентов совмещения имен временной области, вычисленных в двух различных областях.
В предпочтительном осуществлении данного изобретения два переключателя предоставлены в последовательном порядке, где первый переключатель выбирает между кодированием в спектральной области, используя кодирующее устройство частотной области, и кодированием в LPC-области, то есть, обрабатывая сигнал на входе LPC стадии анализа. Второй переключатель предоставлен для переключения в LPC-область, чтобы кодировать сигнал LPC-области либо в LPC-области, например, используя кодирующее устройство ACELP, или чтобы кодировать сигнал LPC-области в LPC-спектральной области, для чего необходим преобразователь для преобразования сигнала LPC-области в LPC-спектральную область, которая отличается от спектральной области, так как LPC-спектральная область показывает спектр LPC отфильтрованного сигнала, а не спектр сигнала временной области.
Первый переключатель выбирает между двумя ветвями обработки, где одна ветвь, главным образом, мотивируется стоковой моделью и/или психоакустической моделью, то есть, слуховой маскировкой, а другой, главным образом, мотивируется исходной моделью и сегментальными SNR (отношение сигнал/шум) вычислениями. Например, одна ветвь имеет кодирующее устройство частотной области, а другая ветвь имеет кодирующее устройство, основанное на LPC, такое как речевое кодирующее устройство. Исходная модель обычно обрабатывает речь и поэтому обычно использует LPC.
Второй переключатель снова выбирает между двумя ветвями обработки, но в области, отличающейся от «внешней» первой области ветви. Снова одна «внутренняя» ветвь, главным образом, мотивируется исходной моделью или SNR (отношение сигнал/шум) вычислениями, а другая «внутренняя» ветвь может мотивироваться стоковой моделью и/или психоакустической моделью, то есть, маскировкой, или, по крайней мере, включает аспекты кодирования частотной/спектральной области. Например, одна «внутренняя» ветвь имеет кодирующее устройство частотной области/спектральный преобразователь, а другая ветвь имеет кодирующее устройство, кодирующее в другой области, такой как LPC область, где это кодирующее устройство, например, - CELP или ACELP квантизатор/счетчик, обрабатывающий входной сигнал без спектрального преобразования.
Последующее предпочтительное осуществление - звуковое кодирующее устройство, включающее первую ветвь кодирования, ориентированную на стоковую информацию, такую как ветвь кодирования спектральной области, вторую ветвь кодирования, ориентированную на информацию об источнике или на SNR (отношение сигнал/шум), такую как ветвь кодирования LPC-области, и переключатель для переключения между первой ветвью кодирования и второй ветвью кодирования, где вторая ветвь кодирования включает преобразователь в определенную область, отличающуюся от временной области, такую как LPC стадия анализа, генерирующая сигнал возбуждения, и где вторая ветвь кодирования, кроме того, включает определенную область, такую как ветвь обработки LPC области и определенную спектральную область, такую как ветвь обработки LPC спектральнаой области, и дополнительный переключатель для переключения между ветвью кодирования определенной области и ветвью кодирования определенной спектральной области.
Последующее осуществление изобретения - звуковой декодер, включающий первую область, такую как ветвь декодирования спектральной области, вторую область, такую как ветвь декодирования LPC области, для декодирования сигнала, такого как сигнал возбуждения во второй области, и третью область, такую как ветвь декодирования LPC-спектральной области для декодирования сигнала, такого как сигнал возбуждения в третьей области, такой как LPC спектральная область, где третья область получается посредством выполнения частотного преобразования от второй области, где предоставляется первый переключатель для сигнала второй области и сигнала третьей области, и где предоставляется второй переключатель для переключения между декодером первой области и декодером для второй области или третьей области.
Предпочтительные осуществления данного изобретения далее описываются со ссылкой на приложенные рисунки, в которых:
Фиг.1A - схематическое представление предпочтительного устройства или способа кодирования звукового сигнала;
Фиг.1B - схематическое представление перехода от MDCT-TCX к ААС;
Фиг.1C - схематическое представление перехода от ААС к MDCT-TCX;
Фиг.1D - иллюстрация предпочтительного осуществления изобретательной концепции в виде блок-схемы;
Фиг.2 - схематическое представление для иллюстрации четырех различных областей и их соотношений, которые возникают в осуществлениях изобретения;
Фиг.3A - схема, иллюстрирующая изобретательное устройство/способ декодирования звукового сигнала;
Фиг.3B - следующая иллюстрация схем декодирования в соответствии с осуществлениями данного изобретения;
Фиг.4A - иллюстрирует детали совмещения имен - преобразований, таких как MDCT, применимое в обоих режимах кодирования;
Фиг.4B - иллюстрирует функции окна, сопоставимые с функцией окна на фиг.4A, но с частью совмещения имен и частью несовмещения имен;
Фиг.5 - схематическое представление кодирующего устройства и декодера в одном режиме кодирования, таком как AAC-MDCT режим кодирования;
Фиг.6 - представление кодирующего устройства и декодера, применяющего MDCT в другой области, такой как область LPC в контексте ТСХ кодирования в AMR-WB+;
Фиг.7 - определенная последовательность окон для переходов между ААС и AMR-ВБ+;
Фиг.8A - представление предпочтительного осуществления кодирующего устройства и декодера в контексте переключения от режима ТСХ на режим AAC;
Фиг.8B - предпочтительное осуществление иллюстрации кодирующего устройства и декодера для перехода от ААС к ТСХ;
Фиг.9A - блок-схема предпочтительной гибридной переключаемой схемы кодирования, в которой применено данное изобретение;
Фиг.9B - блок-схема, иллюстрирующая процесс, выполняемый в контроллере фиг.9A;
Фиг.10A - предпочтительное осуществление декодера в гибридной переключаемой схеме кодирования;
Фиг.1B - блок-схема, иллюстрирующая процедуру, выполняемую в переходном контроллере фиг.10А;
Фиг.11A - иллюстрирует предпочтительное осуществление кодирующего устройства, в котором предпочтительно применяется данное изобретение; и
Фиг.11B - иллюстрирует предпочтительный декодер, в котором предпочтительно применяется данное изобретение.
Фиг.11A иллюстрирует осуществление изобретения, имеющего два каскадных переключателя.
Моно сигнал, сигнал стерео или многоканальный сигнал вводятся в переключатель 200. Переключатель 200 управляется стадией принятия решения 300. Стадия принятия решения получает, в качестве входа, вход сигнала в блок 200. Альтернативно, стадия принятия решения 300 может также получать дополнительную информацию, которая включается в моно сигнал, стерео сигнал или многоканальный сигнал или, по крайней мере, связанный с таким сигналом, где существует информация, которая была, например, получена при первоначальном производстве моно сигнала, стерео сигнала или многоканального сигнала.
Стадия принятия решения 300 приводит в действие переключатель 200, чтобы подавать сигнал или в частотно-кодирующую часть 400, проиллюстрированную в верхней ветви фиг.11A, или в кодирующую часть LPC-области 500, проиллюстрированную в нижней ветви фиг.11A. Ключевым элементом кодирующей ветви частотной области является спектральный блок преобразования 411, предназначенный для преобразования обычного выходного сигнала стадии предварительной обработки (как будет обсуждено позже) в спектральную область. Спектральный блок преобразования может включать алгоритм MDCT, QMF, алгоритм FFT, вейвлет-анализ или гребенку фильтров, такую как критически выбранная гребенка фильтров, имеющая определенное число каналов гребенки фильтров, где сигналы поддиапазона в этой гребенке фильтров могут быть действительнозначными сигналами, или комплекснозначными сигналами. Выход спектрального блока преобразования 411 кодируется посредством использования спектрального звукового кодирующего устройства 421, которое может включать блоки обработки, как известно из AAC схемы кодирования.
Обычно, обработка в ветви 400 является обработкой в модели, основывающейся на восприятии, или информационной стоковой модели. Таким образом, эта ветвь моделирует слуховую систему человека, получающую звук. В противоположность этому, обработка в ветви 500 должна генерировать сигнал в области возбуждения, остаточной или LPC области. Обычно, обработка в ветви 500 является обработкой в речевой модели или информационной генерационной модели. Для речевых сигналов эта модель - модель генерационной речевой/звуковой системы человека, генерирующей звук. Если, однако, должен быть закодирован звук из другого источника, для чего требуется другая звуковая генерационная модели, то обработка в ветви 500 может быть другой.
В нижней ветви кодирования 500, ключевой элемент - устройство LPC 510, которое производит LPC информацию, которая используется для управления характеристиками LPC фильтра. Эта LPC информация передается декодеру. Выходной сигнал LPC стадии 510 - сигнал LPC-области, который состоит из сигнала возбуждения и/или взвешенного сигнала.
Устройство LPC обычно производит сигнал LPC области, который может быть любым сигналом в LPC области, таким как сигнал возбуждения или взвешенный (ТСХ) сигнал или любой другой сигнал, который был произведен посредством применения LPC коэффициентов фильтрации к звуковому сигналу. Кроме того, LPC устройство также может определять эти коэффициенты и может также квантовать/кодировать эти коэффициенты.
Решение на стадии принятия решения может быть сигнально-адаптивным, так чтобы стадия принятия решения выполняла дифференциацию музыки/речи и управляла переключателем 200 таким образом, чтобы музыкальные сигналы вводились в верхнюю ветвь 400, а речевые сигналы вводились в нижнюю ветвь 500. В одном осуществлении стадия принятия решения подает свою информацию о принятии решения в выходной битовый поток так, чтобы декодер мог использовать эту информацию о принятии решения для выполнения корректной операции декодирования.
Такой декодер проиллюстрирован на фиг.11B. Сигнал, произведенный спектральным звуковым кодирующим устройством 421, после передачи вводится в спектральный звуковой декодер 431. Выход спектрального звукового декодера 431 вводится в преобразователь временной области 440. Аналогично, выход ветви кодирования LPC области 500 на фиг.11A получается на стороне декодера и обрабатывается элементами 536 и 537 для получения LPC сигнала возбуждения. LPC сигнал возбуждения вводится в LPC стадию синтеза 540, которая получает, в качестве следующего входа, LPC информацию, генерированную соответствующей LPC стадией анализа 510. Выход преобразователя временной области 440 и/или выход LPC стадии синтеза 540 вводятся в переключатель 600. Переключатель 600 регулируется управляющим сигналом переключателя, который был, например, генерирован стадией принятия решения 300, или который внешне предоставлялся, как произведенный создателем оригинального моно сигнала, стерео сигнала или многоканального сигнала. Выход переключателя 600 является полностью моно сигналом, стерео сигналом или многоканальным сигналом.
Входной сигнал в переключатель 200 и стадию принятия решения 300 может быть моно сигналом, стерео сигналом, многоканальным сигналом или, обычно, звуковым сигналом. В зависимости от решения, которое может быть получено из входного сигнала переключателя 200 или из любого внешнего источника, такого как производитель оригинального звукового сигнала, лежащего в основе входного сигнала в стадию 200, переключатель переключается между частотной кодирующей ветвью 400 и LPC кодирующей ветвью 500. Частотная кодирующая ветвь 400 включает спектральную стадию преобразования 411 и, впоследствии, связанную со стадией квантования/кодирования 421. Стадия квантования/кодирования может включать любую из функциональных возможностей, как известно из современных кодирующих устройств частотной области, таких как кодирующее устройство AAC. Кроме того, операция квантизации на стадии квантования/кодирования 421 может регулироваться психоакустическим модулем, который производит психоакустическую информацию, такую как психоакустический порог маскировки по частоте, где эта информация вводится в стадию 421.
В LPC кодирующей ветви, выходной сигнал переключателя обрабатывается на LPC стадии анализа 510, производящей LPC дополнительную информацию и сигнал LPC-области. Кодирующее устройство возбуждения включает дополнительный переключатель 521 для переключения последующей обработки сигнала LPC-области между операцией квантизации/кодирования 526 в LPC-области или стадией квантизации/кодирования 527, которая обрабатывает значения в LPC-спектральной области. В завершение, предоставляется спектральный преобразователь 527. Переключатель 521 регулируется способом разомкнутого контура или способом замкнутого контура в зависимости от определенных параметров настройки как, например, описано в AMR-WB+технической спецификации.
Для режима управления замкнутым контуром кодирующее устройство дополнительно включает инверсный квантизатор/кодирующее устройство для сигнала LPC области, инверсный квантизатор/кодирующее устройство для сигнала LPC спектральной области и инверсный спектральный преобразователь для выхода инверсного квантизатора/кодирующего устройства. И закодированные и снова декодированные сигналы в ветвях обработки второй ветви кодирования вводятся в управляющее устройство переключателя. В управляющем устройстве переключателя эти два выходных сигнала сравниваются друг с другом и/или с целевой функцией, или вычисляется целевая функция, которая может основываться на сравнении искажения в обоих сигналах так, чтобы сигнал, имеющий более низкое искажение, использовался для принятия решения о том, какое положение должен занимать переключатель 521. Альтернативно, в случае, если обе ветви обеспечивают непостоянные скорости передачи битов (битрейт), ветвь, обеспечивающая более низкую скорость передачи битов (битрейт), может выбираться, даже когда отношение сигнала к шуму этой ветви ниже чем отношение сигнала к шуму другой ветви. Альтернативно, целевая функция может использовать, в качестве входа, отношение сигнала к шуму каждого сигнала и скорость передачи битов (битрейт) каждого сигнала и/или дополнительные критерии, чтобы найти лучшее решение для конкретной цели. Если, например, цель такова, что скорость передачи битов (битрейт) должна быть насколько возможно низкой, то целевая функция будет в большой мере основываться на скорость передачи битов (битрейт) двух сигналов, произведенных инверсным квантизатором/кодирующим устройством и инверсным спектральным преобразователем. Однако, когда главная цель состоит в том, чтобы иметь лучшее качество при определенной скорости передачи битов (битрейт), тогда управление переключателем может, например, отбрасывать каждый сигнал, скорость передачи битов (битрейт) которого выше допустимой скорости передачи битов (битрейт), и когда скорость передачи битов (битрейт) обоих сигналов ниже допустимой скорости передачи битов (битрейт), управление переключателем выберет сигнал, имеющий лучшее отношение сигнала к шуму, то есть, имеющий меньшие искажения квантизации/кодирования.
Схема декодирования в соответствии с данным изобретением, как указано выше, проиллюстрирована на фиг.11В. Для каждого из трех возможных видов выходного сигнала существует определенная стадия декодирования/реквантизации 431, 536 или 537. В то время как стадия 431 производит частотный спектр, который может также быть назван «временным спектром» (частотный спектр сигнала временной области) и который преобразуется во временную область посредством преобразователя частоты/времени 440, стадия 536 производит сигнал LPC-области, и позиция 537 получает частотный спектр сигнала LPC-области, который может также быть назван «LPC-спектром». Чтобы удостовериться, что сигналы, входящие в переключатель 532, оба находятся в LPC-области, преобразователь частоты/времени 537 предоставляется в LPC области. Выходные данные переключателя 532 преобразуются обратно во временную область посредством LPC стадии синтеза 540, которая управляется произведенной и переданной на стороне кодирующего устройства LPC информацией. Затем, вслед за блоком 540, обе ветви имеют информацию временной области, которая переключается в соответствии с управляющим сигналом переключателя, чтобы, в конечно итоге, получить звуковой сигнал, такой как моно сигнал, стерео сигнал или многоканальный сигнал, который зависит от сигнала, входящего в схему кодирования фиг.11A.
Фиг.11A. поэтому иллюстрирует предпочтительную схему кодирования в соответствии с изобретением. Общая схема предварительной обработки, соединенная с входом переключателя 200, может включать блок окружения/совместного стерео 101, который генерирует, в качестве выхода, объединенные стерео параметры и моно выходной сигнал, который генерируется посредством понижающего микширования входного сигнала, который является сигналом, имеющим два или больше каналов. Обычно, сигнал на выходе блока 101 может также быть сигналом, имеющим больше каналов, но, благодаря функциональным возможностям понижающего микширования блока 101, число каналов на выходе блока 101 будет меньше, чем число каналов, входящих в блок 101.
Общая схема предварительной обработки может включать, альтернативно блоку 101 или в дополнение к блоку 101, стадию расширения полосы пропускания 102. В осуществлении фиг.11A выход блока 101 вводится в блок расширения полосы пропускания 102, который, в кодирующем устройстве фиг.11A, производит сигнал с ограниченной полосой, такой как сигнал низкой полосы или сигнал низкой частоты на его выходе. Предпочтительно, чтобы этот сигнал также дискретизировался с пониженной частотой (например, с коэффициентом два). Кроме того, для высокой полосы сигнала, входящего в блок 102, параметры расширения полосы пропускания, такие как параметры огибающей спектра, параметры инверсной фильтрации, параметры минимального уровня шума и т.д., как известно из HE-AAC профиля MPEG-4, генерируются и направляются в мультиплексор битового потока 800.
Предпочтительно, чтобы стадия принятия решения 300 получала сигнал, входящий в блок 101 или входящий в блок 102, чтобы сделать выбор между, например, музыкальным режимом или речевым режимом. В музыкальном режиме выбирается верхняя ветвь кодирования 400, в то время как в речевом режиме выбирается более низкая ветвь кодирования 500. Предпочтительно, чтобы стадия принятия решения дополнительно управляла блоком стерео объединения 101, и/или блоком расширения полосы пропускания 102, чтобы приспособить функциональные возможности этих блоков к конкретному сигналу. Таким образом, когда стадия принятия решения решает, что определенная временная часть входного сигнала относится к первому режиму, такому как музыкальный режим, тогда определенные характеристики блока 101 и/или блока 102 могут управляться стадией принятия решения 300. Альтернативно, когда стадия принятия решения 300 решает, что сигнал относится к речевому режиму или, обычно, ко второму режиму LPC-области, тогда определенные характеристики блоков 101 и 102 могут управляться в соответствии с выходом стадии принятия решения.
Предпочтительно, чтобы спектральное преобразование ветви кодирования 400 выполнялось посредством операции MDCT, которая, еще более предпочтительно, является операцией MDCT с деформацией времени, где сила или, обычно, сила деформации может регулироваться между нулем и высокой силой деформации. При нулевой силе деформации, операция MDCT в блоке 411 является непосредственно операцией MDCT, известной в этой области техники. Сила деформации времени вместе с дополнительной информацией о деформации времени может передаваться/вводиться в мультиплексор битового потока 800 как дополнительная информация.
В LPC ветви кодирования, кодирующее устройство LPC-области может включать ACELP основное 526 вычисление усиления основного тона, информацию о задержке основного тона и/или шифровальной книге, такую как индекс шифровальной книги и эффективность. Режим ТСХ, как известно из 3GPP TS 26.290, несет ответственность за обработку перцепционно взвешенного сигнала в области преобразования. Фурье-преобразованный взвешенный сигнал квантуется посредством расщепленной многоскоростной решеточной квантизации (алгебраический VQ) с квантизацией шум-фактора. Преобразование вычисляется в 1024, 512 или 256 окнах выборки. Сигнал возбуждения восстанавливается инверсной фильтрацией квантованного взвешенного сигнала посредством инверсного взвешивающего фильтра.
В первой ветви кодирования 400, спектральный преобразователь предпочтительно включает специально приспособленную MDCT операцию, имеющую определенные функции окна, за которой следует кодирующая стадия квантизации/энтропии, которая может состоять из единственной стадии векторной квантизации, но, предпочтительно, является объединенным скалярным квантизатором/энтропийным кодирующим устройством, подобным квантизатору/кодирующему устройству в ветви кодирования частотной области, то есть, в позиции 421 фиг.11A.
Во второй ветви кодирования имеется LPC блок 510, за которым следует переключатель 521, за которым следует ACELP блок 526, или ТСХ блок 527. ACELP описан в 3GPP, TS 26.190, а TCX описан в 3GPP TS 26.290. В общем, ACELP блок 526 получает LPC сигнал возбуждения. TCX блок 527 получает взвешенный сигнал.
В ТСХ преобразование применяется к взвешенному сигналу, вычисленному фильтрованием входного сигнала посредством взвешивающего фильтра на LPC-основе. Взвешивающий фильтр, используемый в предпочтительных осуществлениях изобретения, представлен формулой (1-A(z/γ))/(1-µz-1). Таким образом, взвешенный сигнал - сигнал LPC области, а его преобразование - LPC-спектральная область. Сигнал, обработанный ACELP блоком 526, является сигналом возбуждения и отличается от сигнала, обработанного блоком 527, но оба сигнала находятся в LPC области. Сигнал возбуждения получается фильтрованием входного сигнала посредством (1-A(z/γ)) анализирующего фильтра.
На стороне декодера, проиллюстрированной на фиг.11В, после инверсного спектрального преобразования в блоке 537 применяется инверсный взвешивающий фильтр, то есть (1-µz-1)/(1-A(z/γ)). По выбору, сигнал может дополнительно фильтроваться через (1-A(z)), чтобы попасть в LPC область возбуждения. Таким образом, сигнал от ТСХ-1 блока 537 может быть преобразован из взвешенной области в область возбуждения фильтрованием посредством
Хотя позиция 510 на фиг.11А иллюстрирует единственный блок, блок 510 может производить различные сигналы, пока эти сигналы находятся в LPC области. Фактический режим блока 510, такой как режим сигнала возбуждения или режим взвешенного сигнала, может зависеть от фактического состояния переключателя. Альтернативно, блок 510 может иметь два параллельных устройства обработки. Следовательно, LPC область на выходе 510 может представлять или LPC сигнал возбуждения, или LPC взвешенный сигнал, или любой другой сигнал LPC области.
Во второй ветви кодирования (ACELP/TCX) фиг.11a или 11b, предпочтительно, чтобы сигнал был предыскажен через фильтр 1-0.68z-1 перед кодированием. В декодере ACELP/TCX на фиг.11В синтезированный сигнал подвергается корректировке предыскажения фильтром 1/(1-0.68z-1). Предыскажение может быть частью LPC блока 510, где сигнал предыскажается перед LPC анализом и квантизацией. Точно так же, корректировка предыскажения может быть частью синтезирующего блока LPC-1 540.
В предпочтительном осуществлении первый переключатель 200 (см. фиг.11A) управляется решением разомкнутого контура, и второй переключатель управляется решением замкнутого контура.
Например, может возникнуть ситуация, что в первой ветви обработки, первая LPC область представляет LPC возбуждение, а во второй ветви обработки, вторая LPC область представляет LPC взвешенный сигнал. Таким образом, первый сигнал LPC области получается фильтрованием посредством (1-A(z)), чтобы преобразовать в LPC остаточную область, в то время как второй сигнал LPC области получается фильтрованием посредством (1-A(z/γ))/(1-µz-1), чтобы преобразовать в LPC взвешенную область. В предпочтительном режиме µ равен 0,68.
Фиг.11B иллюстрирует схему декодирования, соответствующую схеме кодирования фиг.11A. Битовый поток, генерированный мультиплексором битового потока 800 на фиг.11a, вводится в демультиплексор битового потока 900. В зависимости от информации, полученной, например, из битового потока посредством блока детектирования режима 601, переключатель на стороне декодера 600 регулируется, чтобы или направлять сигналы от верхней ветви или сигналы от нижней ветви в блок расширения полосы пропускания 701. Блок расширения полосы пропускания 701 получает из демультиплексора битового потока 900 дополнительную информацию и, основываясь на этой дополнительной информации и выходе режима принятия решения 601, восстанавливает высокую полосу, основанную на низкой полосе, произведенной переключателем 600.
Сигнал полной полосы, генерированный блоком 701, поступает на стадию объединенной стерео/окружающей обработки 702, которая восстанавливает два стерео канала или несколько мультиканалов. В общем, блок 702 произведет больше каналов, чем были введены в этот блок. В зависимости от применения, вход в блок 702 может даже включать два канала, такие как в стерео режиме, и может даже включать больше каналов, поскольку выход этого блока имеет больше каналов, чем вход в этот блок.
Переключатель 200 предназначен для переключения между обеими ветвями так, чтобы только одна ветвь получила сигнал, подлежащий обработке, а другая ветвь не получала сигнал, подлежащий обработке. В альтернативном осуществлении, однако, переключатель может также быть расположен, например, за кодирующим устройством частотной области 421 и кодирующим устройством LPC области 510, 521, 526, 527, что означает, что обе ветви 400, 500 параллельно обрабатывают тот же самый сигнал. Чтобы не удваивать скорость передачи битов (битрейт), однако, только сигнал, произведенный одной из этих ветвей кодирования 400 или 500, выбирается, чтобы быть вписанным в выходной битовый поток. Стадия принятия решения, затем, будет работать так, чтобы сигнал, вписанный в битовый поток, минимизировал определенную функцию стоимости, где функция стоимости может быть генерированной скоростью передачи битов (битрейт) или генерированным перцепционным искажением или объединенной функцией стоимости скорости/искажения. Поэтому, или в этом режиме, или в режиме, проиллюстрированном на рисунках, стадия принятия решения может также работать в режиме замкнутого контура, чтобы удостовериться в том, что, в конце концов, только выход ветви кодирования вписывается в битовый поток, который имеет для данного перцепционного искажения самую низкую скорость передачи битов (битрейт) или для данной скорости передачи битов (битрейт) имеет самое низкое перцепционное искажение.
В выполнении, имеющем два переключателя, то есть, первый переключатель 200 и второй переключатель 521, предпочтительно, чтобы временное разрешение для первого переключателя было ниже, чем временное разрешение для второго переключателя. Установленные по-другому блоки входного сигнала в первый переключатель, который может переключаться посредством операции переключения, больше, чем блоки, переключаемые вторым переключателем, работающим в LPC-области. Например, переключатель частотной области/LPC-области 200 может переключать блоки длиной 1024 сэмплов (образцов), а второй переключатель 521 может переключать блоки, имеющие 256 или 512 сэмплов (образцов) каждый.
В общем, алгоритм звукового кодирования, используемый в первой ветви кодирования 400, отражает и моделирует ситуацию в звуковом стоке. Сток звуковой информации, обычно, - человеческое ухо. Человеческое ухо может быть смоделировано как частотный анализатор. Поэтому, первая ветвь кодирования производит закодированную спектральную информацию. Предпочтительно, чтобы первая ветвь кодирования, кроме того, включала психоакустическую модель для того, чтобы дополнительно применить психоакустический порог маскировки. Этот психоакустический порог маскировки используется при квантовании звуковых спектральных значениий, где, предпочтительно, квантизация выполняется таким образом, что шум квантизации вводится квантизацией звуковых спектральных значений, которые скрыты ниже психоакустического порога маскировки.
Вторая ветвь кодирования представляет модель источника информации, которая отражает генерирование звука. Поэтому, модели источника информации могут включать речевую модель, которая отражается стадией LPC анализа, то есть, преобразованием сигнала временной области в LPC область и последующей обработкой LPC остаточного сигнала, то есть, сигнала возбуждения. Альтернативные модели источника звука, однако, являются моделями источника звука для представления определенного инструмента или любыми другими генераторами звука, такими как определенный источник звука, существующий в реальном мире. Выбор между различными моделями источника звука может быть сделан, когда доступны несколько моделей источника звука, например, основанных на SNR (отношение сигнала к шуму) вычислении, то есть, основаны на вычислении того, какая из моделей источника лучше всего подходит для кодирования определенной временной части и/или частотной части звукового сигнала. Однако предпочтительно, чтобы переключение между ветвями кодирования выполнялось во временной области, то есть, чтобы определенная временная часть кодировалась с использованием одной модели, и определенная другая временная часть промежуточного сигнала кодировалась посредством другой ветви кодирования.
Модели источника информации представляются определенными параметрами. Что касается речевой модели, параметры являются LPC параметрами и кодированными параметрами возбуждения, когда рассматривается современное речевое кодирующее устройство, такое как AMR-WB+. AMR-WB+включает ACELP кодирующее устройство и TCX кодирующее устройство. В этом случае, кодированные параметры возбуждения могут быть глобальным усилением, минимальным уровнем шума и кодами переменной длины.
Входной звуковой сигнал на фиг.11A присутствует в первой области, которая может, например, быть временной областью, но которая может также быть любой другой областью, такой как частотная область, LPC область, LPC спектральная область или любая другая область. В общем, преобразование от одной области в другую область выполняется посредством алгоритма преобразования, такого как любой из известных алгоритмов преобразования времени/частоты или алгоритмов преобразования частоты/времени.
Альтернативное преобразование от временной области, например, в LPC область является результатом LPC фильтрования сигнала временной области, который приводит к LPC остаточному сигналу или сигналу возбуждения. Любые другие операции фильтрования, производящие фильтрованный сигнал, который оказывает влияние на существенное число сэмплов (образцов) сигнала перед преобразованием, могут использоваться как алгоритм преобразования в зависимости от обстоятельств. Поэтому, взвешивание звукового сигнала с использованием основанного на LPC взвешивающего фильтра, является последующим преобразованием, которое генерирует сигнал в LPC области. В преобразовании времени/частоты модификация единственного спектрального значения окажет влияние на все значения временной области до преобразования. Аналогично, модификация любого сэмпла (образца) временной области окажет влияние на каждый образец частотной области. Точно так же модификация сэмпла (образца) сигнала возбуждения в ситуации LPC области будет иметь, благодаря длине LPC фильтра, воздействие на существенное число сэмплов (образцов) до LPC фильтрования. Точно так же, модификация сэмпла (образца) до LPC преобразования окажет влияние на многие сэмплы (образцы), полученные посредством этого LPC преобразования благодаря эффекту внутренней памяти LPC фильтра.
Фиг.1A иллюстрирует предпочтительное осуществление устройства для кодирования звукового сигнала 10. Звуковой сигнал, предпочтительно, вводится в кодирующее устройство, имеющее первую ветвь кодирования, такую как 400 на фиг.11a, для кодирования звукового сигнала в третьей области, которая может, например, быть непосредственной частотной областью. Кодирующее устройство, кроме того, может включать вторую ветвь кодирования для кодирования звукового сигнала, основанного на четвертой области, которая может быть, например, LPC частотной областью такой, какая получается TCX блоком 527 на фиг.11A.
Предпочтительно, чтобы изобретательное устройство включало устройство управления окнами 11 для управления окнами первого блока звукового сигнала в первой области с использованием первого окна анализа, имеющего форму окна анализа, окна анализа, имеющего часть совмещения имен, такую как Lk или Rk, как обсуждается в контексте фиг.8a и фиг.8B или других рисунков, и имеющего часть несовмещения имен, такую как Mk, проиллюстрированную на фиг.5 или других рисунках.
Устройство, кроме того, включает процессор 12 для обработки первого подблока звукового сигнала, связанного с частью совмещения имен окна анализа, посредством преобразования подблока от первой области, такой как область сигнала или непосредственная временная область, во вторую область, такую как LPC область, следующую за управлением окнами первого подблока, чтобы получить обработанный первый подблок, и для обработки второго подблока звукового сигнала, связанного с последующей частью окна анализа, посредством преобразования второго подблока от первой области, такой как непосредственная временная область, во вторую область, такую как LPC область, до управления окнами второго подблока, чтобы получить обработанный второй подблок. Изобретательное устройство, кроме того, включает преобразователь 13 для преобразования обработанного первого подблока и обработанного второго подблока от второй области в четвертую область, такую как LPC частотная область, посредством использования того же самого правила преобразования блока, чтобы получить преобразованный первый блок. Этот преобразованный первый блок может, затем, далее обрабатываться в последующей стадии обработки 14 для выполнения сжатия данных.
Предпочтительно, чтобы последующая обработка также получала, в качестве входа, второй блок звукового сигнала в первой области, перекрывающий первый блок, где второй блок звукового сигнала в первой области, такой как временная область, обрабатывался в третьей области, то есть, непосредственно частотной области, посредством использования второго окна анализа. Это второе окно анализа имеет часть совмещения имен, которая соответствует части совмещения имен первого окна анализа. Часть совмещения имен первого окна анализа и часть совмещения имен второго окна анализа, предпочтительно, связаны с теми же самыми звуковыми сэмплами (образцами) оригинального звукового сигнала до управления окнами, и эти части подвергаются отмене совмещения имен временной области, то есть, процедуре перекрывания - добавления на стороне декодера.
Фиг.1В иллюстрирует возникновение ситуации, когда имеет место переход от блока, закодированного в четвертой области, например, LPC частотная область, в третью область, такую как частотная область. В осуществлении, четвертая область - MDCT-TCX область, а третья область - AAC область. Окно, применяемое к звуковому сигналу, закодированному в MDCT-TCX области, имеет часть совмещения имен 20 и часть несовмещения имен 21. Тот же самый блок, который называется «первым блоком» на фиг.1B, может иметь или не иметь последующую часть совмещения имен 22. То же самое верно для части несовмещения имен. Это может присутствовать или не присутствовать.
Второй блок звукового сигнала, закодированный в другой области, такой как AAC область, включает соответствующую часть совмещения имен 23, и этот второй блок может включать последующие части, такие как часть несовмещения имен или часть совмещения имен в зависимости от обстоятельств, которая обозначена цифрой 24 на фиг.1B. Поэтому, фиг.1B иллюстрирует перекрывающую обработку звукового сигнала такую, чтобы звуковые сэмплы (образцы) в части совмещения имен 20 первого блока до управления окнами были идентичны звуковым сэмплам (образцам) в соответствующей части совмещения имен 23 второго блока до управления окнами. Следовательно, звуковые сэмплы (образцы) в первом блоке получаются при применении окна анализа к звуковому сигналу, который является потоком звуковых сэмплов (образцов), а второй блок получается при применении второго окна анализа к ряду звуковых сэмплов (образцов), которые включают сэмплы (образцы) в соответствующей части совмещения имен 23 и сэмплы (образцы) в последующей части 24 второго блока. Поэтому, звуковые сэмплы (образцы) в части совмещения имен 20 являются первым блоком звукового сигнала, связанного с частью совмещения имен 20, а звуковые сэмплы (образцы) в последующей части 21 звукового сигнала соответствуют второму подблоку звукового сигнала, связанного с последующей частью 21.
Фиг.1C иллюстрирует ситуацию, подобную той, которая изображена на фиг.1B, но как переход от AAC, то есть, третьей области в MDCT-TCX область, то есть, в четвертую область.
Различие между фиг.1B и фиг.1C, в общем, состоит в том, что часть совмещения имен 20 на фиг.1B включает звуковые сэмплы (образцы), встречающиеся во времени, следующем за звуковыми сэмплами (образцами) в последующей части 21, в то время, как на фиг.1C звуковые сэмплы (образцы) в части совмещения имен 20 встречаются во времени, перед звуковыми сэмплами (образцами) в последующей части 21.
Фиг.1D иллюстрирует детальное представление шагов, выполненных со звуковыми сэмплами (образцами) в первом подблоке и втором подблоке одного и того же блока, реализуемого посредством организации окна, звуковых сэмплов (образцов). В общем, окно имеет увеличивающуюся часть и уменьшающуюся часть, и в зависимости от формы окна относительно постоянная средняя часть может быть или не быть.
На первом этапе 30, выполняется операция формирования блока, в котором берется определенное число звуковых сэмплов (образцов) из потока звуковых сэмплов (образцов). Конкретно, операция формирования блока 30 определит, какие звуковые сэмплы (образцы) принадлежат первому блоку, и какие звуковые сэмплы (образцы) принадлежат второму блоку фиг.1B и фиг.1C.
Звуковые (сэмплы) образцы в части совмещения имен 20 реализуются посредством организации окон на этапе 31а. Важно, однако, что звуковые сэмплы (образцы) в части несовмещения имен, то есть, во втором подблоке, преобразуются во вторую область, то есть, LPC область в предпочтительном осуществлении, на этапе 32. Затем, вслед за преобразованием звуковых сэмплов (образцов) во втором подблоке, выполняется операция управления окнами 31b. Звуковые сэмплы (образцы), требуемые операцией управления окнами 31b, формируют сэмплы (образцы), которые вводятся в операцию преобразования блока в четвертую область, проиллюстрированную в фиг.1D, позиция 35.
Операция управления окнами в блоке 31a, 31b может включать или не включать операцию свертывания, как обсуждалось в связи с фиг.8A, 8B, 9A, 10A. Предпочтительно, чтобы операция управления окнами 31a, 31b дополнительно включала операцию свертывания.
Однако часть совмещения имен преобразовывается во вторую область, такую как LPC область в блоке 33. Таким образом, блок сэмплов (образцов), подлежащий преобразованию в четвертую область, которая обозначена цифрой 34, заканчивается, и блок 34 составляет один блок данных, входящих в одну операцию преобразования блока, такую как операция времени/частоты. Так как вторая область в предпочтительном осуществлении является LPC областью, выход операции преобразования блока, как на этапе 35, будет в четвертой области, то есть, в LPC частотной области. Этот блок, произведенный преобразованием блока 35, будет преобразованный первым блоком 36, который, затем, сначала обрабатывается на этапе 37, чтобы применить любой вид сжатия данных, который включает, например, операции сжатия данных, применяемые к ТСХ данным в AMR-WB+ кодирующем устройстве. Естественно, все другие операции сжатия данных могут выполняться также в блоке 37. Поэтому, блок 37 соответствует позиции 14 на фиг.1A, а блок 35 на фиг.1D соответствует позиции 13 на фиг.1A, и операции управления окнами соответствуют 31b, и 31a на фиг.1D соответствуют позиции 11 на фиг.1A, а планирование очередности преобразования и управления окнами, которая различна для последующей части и части совмещения имен, выполняется процессором 12 на фиг.1A.
Фиг.1D иллюстрирует случай, в котором последующая часть состоит из подчасти несовмещения имен 21 и подчасти совмещения имен 22 фиг.1B или 1C. Альтернативно, последующая часть может включать только часть совмещения имен без части несовмещения имен. В этом случае, цифры 21 на фиг.1B и 1C там не будет, а цифра 22 будет простираться от границы блока до границы части совмещения имен 20. В любом случае, последующая часть/последующий подблок обрабатывается таким же образом (независимо от того, является ли он полностью без совмещения имен или полностью с совмещением имен или имеет ли подчасть совмещения имен или подчасть несовмещения имен), но иначе, чем подблок совмещения имен.
Фиг.2 иллюстрирует краткий обзор различных областей, которые встречаются в привилегированных осуществлениях данного изобретения.
Обычно, звуковой сигнал находится в первой области 40, которая может, например, быть временной областью. Однако изобретение фактически относится ко всем ситуациям, которые возникают, когда звуковой сигнал подлежит кодированию в двух различных областях, и когда переключение от одной области в другую область должно быть выполнено при оптимальной скорости передачи битов (битрейт), то есть, используя критическую выборку.
Вторая область будет, в предпочтительном осуществлении, LPC областью 41. Преобразование от первой области во вторую область будет осуществлено посредством LPC фильтрования/преобразования, как показано на фиг.2.
Третья область, в предпочтительном осуществлении, - непосредственная частотная область 42, которая получается посредством любых известных преобразований времени/частоты, таких как DCT (дискретное косинусное преобразование), DST (дискретное синусное преобразование), преобразование Фурье, или быстрое преобразование Фурье, или любое другое преобразование времени/частоты.
Соответственно, преобразование от второй области в четвертую область 43, такую как LPC частотная область или, обычно, частотная область относительно второй области 41 может также быть получена посредством любых известных алгоритмов преобразования времени/частоты, такие как DCT, DST, FT, FFT.
Тогда фиг.2 сравнивается с фиг.11A или 11B, выход блока 421 будет иметь сигнал в третьей области. Кроме того, выход блока 526 будет иметь сигнал во второй области, а выход блока 527 будет включать сигнал в четвертой области. Другой вход сигнала в переключатель 200 или, обычно, вход в стадию принятия решения 300 или окружающую/объединяющую стерео стадию 101 будет находиться в первой области, такой как временная область.
Фиг.3A иллюстрирует предпочтительное осуществление изобретательного устройства для декодирования кодированного звукового сигнала, имеющего кодированный первый блок 50 звуковых данных, где кодированный блок имеет часть совмещения имен и последующую часть. Изобретательный декодер, кроме того, включает процессор 51 для обработки части совмещения имен посредством преобразования части совмещения имен в целевую область для выполнения управления окном синтеза, чтобы получить реализуемую посредством организации окна часть совмещения имен 52, и для выполнения управления окном синтеза последующей части до выполнения преобразования реализуемой посредством организации окна последующей части в целевую область.
Поэтому, на стороне декодера части блока, принадлежащего тому же самому окну, обрабатываются по-разному. Подобная обработка была применена на стороне кодирующего устройства, чтобы обеспечить критически выбранное переключение между различными областями.
Изобретательный декодер, кроме того, включает компенсатор совмещения имен временной области 53 для объединения реализуемой посредством организации окна части совмещения имен первого блока, то есть, входа 52, и реализуемой посредством организации окна части совмещения имен кодированного второго блока звуковых данных, следующего за преобразованием части совмещения имен кодированного второго блока в целевую область, чтобы получить декодированный звуковой сигнал 55, который соответствует части совмещения имен первого блока. Реализуемая посредством организации окна часть совмещения имен кодированного второго блока вводится через 54 в компенсатор совмещения имен временной области 53.
Предпочтительно, компенсатор совмещения имен временной области 53 выполняется как перекрывающее/добавляющее устройство, которое, например, применяет 50%-ное перекрывание. Это означает, что результат окна синтеза одного блока перекрывается результатом обработки окна синтеза смежного кодированного блока звуковых данных, где это перекрывание предпочтительно включает 50% блока. Это означает, что вторая часть реализуемых посредством организации окна синтеза звуковых данных более раннего блока добавляется по сэмплу (образцу) к первой части более позднего второго блока кодированных звуковых данных так, чтобы в конце декодированные звуковые сэмплы (образцы) представляли сумму соответствующих реализуемых посредством организации окна сэмплов (образцов) двух смежных блоков. В других осуществлениях перекрывающийся диапазон может составлять больше или меньше 50%. Эта объединенная характеристика компенсатора совмещения имен временной области обеспечивает непрерывное взаимное ослабление от одного блока к следующему, которое полностью удаляет любые артефакты блокирования, происходящие в любой схеме кодирования с преобразованием, основанной на блоках. Вследствие того, что части совмещения имен различных областей могут быть объединены в соответствии с данным изобретением, получается критически выбранная операция переключения от блока одной области к блоку другой области.
По сравнению с кодирующим устройством переключения без какого бы то ни было взаимного ослабления, в котором выполняется жесткое переключение от одного блока к другому блоку, звуковое качество улучшается в соответствии с изобретательной процедурой, так как жесткое переключение неизбежно приведет к блокированию артефактов, таких как слышимый треск или любой другой нежелательный шум на границе блока.
По сравнению с некритически выбранным взаимным ослаблением, которое действительно могло бы удалить такой нежелательный резкий шум на границе блока, однако, данное изобретение не приводит к увеличению скорости передачи данных из-за переключения. Так как в прототипе те же самые звуковые сэмплы (образцы) кодировались бы в первом блоке посредством первой ветви кодирования и кодировались бы во втором блоке посредством второй ветви кодирования, количество сэмплов (образцов), закодированных в обеих ветвях кодирования, расходовало бы скорость передачи битов (битрейт) при обработке без введения совмещения имен. В соответствии с данным изобретением, однако, совмещение имен вводится на границах блока. Это введение совмещения имен, которое получается посредством сокращения сэмплов (образцов), что, однако, приводит к возможности применения операции взаимного ослабления посредством компенсатора совмещения имен временной области 53 без неудобства в виде увеличенной скорости передачи битов (битрейт) или некритически выбранного переключения.
В самом предпочтительном осуществлении выполняется действительно критически выбранное переключение. Однако в определенных ситуациях могут также быть менее эффективные осуществления, в которых вводится только определенное количество совмещения имен, и допускается определенная величина скорости передачи битов служебных сигналов. Вследствие того, что части совмещения имен используются и объединяются, однако, все эти менее эффективные осуществления, тем не менее, всегда лучше, чем переход, полностью без совмещения имен, со взаимным ослаблением или, в отношении качества, лучше, чем жесткое переключение от одной ветви кодирования на другую ветвь кодирования.
В этом контексте следует заметить, что часть несовмещения имен в ТСХ все еще производит критически выбранные кодированные сэмплы (образцы). Добавление части несовмещения имен в ТСХ не согласуется с критической выборкой, но согласуется с качеством перехода (нижний переход) и качеством спектрального представления (нижнее уплотнение энергии). Ввиду этого, предпочтительно иметь часть несовмещения имен в ТСХ насколько возможно маленькой или даже близкой к нулю так, чтобы последующая часть была полностью с совмещением имен и не имела подчасти без совмещения имен.
Впоследствии, будет обсужден фиг.3B, чтобы проиллюстрировать предпочтительное осуществление процедуры на фиг.3А.
На стадии 56, выполняется обработка декодером кодированного первого блока, который находится, например, в четвертой области. Эта обработка декодером может быть энтропийным декодированием, таким как декодирование Хаффмана или арифметическое декодирование, соответствующим последующим операциям обработки в блоке 14 фиг.1А на стороне кодирующего устройства. На этапе 57, преобразование частоты/времени полного первого блока выполняется, как показано на этапе 57. В соответствии с фиг.2, эта процедура на этапе 57 дает в результате полный первый блок во второй области. Теперь, в соответствии с данным изобретением, части первого блока обрабатываются по-другому. Конкретно, часть совмещения имен, то есть, первый подблок выхода этапа 57, будет преобразована в целевую область до выполнения операции управления окнами посредством использования окна синтеза. Это обозначено последовательностью шага преобразования 58a и шага управления окнами 59a. Второй подблок, то есть, подблок без совмещения имен, реализуется посредством организации окон с использованием окна синтеза, как обозначено цифрой 59b, то есть, без операции преобразования в позиции 58а на фиг.3B. Операция управления окнами в блоке 59a или 59b может включать или не включать операцию свертывания (развертывания). Предпочтительно, однако, чтобы операция управления окнами включала операцию свертывания (развертывания).
В зависимости от того, является ли второй подблок, соответствующий последующей части, действительно подблоком совмещения имен или подблоком несовмещения имен, операция преобразования в целевую область, как обозначено цифрой 59b, выполняется без любой TDAC операции/ операции объединения в случае второго подблока, являющегося подблоком несовмещения имен. Однако, когда второй подблок является подблоком совмещения имен, операция TDAC, то есть, операция объединения 60b, выполняется с соответствующей частью другого блока, прежде чем будет получена операция преобразования в целевую область на этапе 59b, чтобы вычислить декодированный звуковой сигнал для второго блока.
В другой ветви, то есть, для части совмещения имен, соответствующей первому подблоку, результат операции управления окнами на этапе 59a вводится в стадию объединения 60а. Эта стадия объединения 60а также получает, в качестве входа, часть совмещения имен второго блока, то есть, блока, который был закодирован в другой области, такой как AAC область в примере фиг.2. Затем, выход блока 60а создает декодированный звуковой сигнал для первого подблока.
Когда сравнивается фиг.3A и фиг.3B, становится ясно, что операция объединения 60a соответствует обработке, выполненной в блоке 53 фиг.3A. Кроме того, операция преобразования и операция управления окнами, выполненные процессором 51, соответствуют позициям 58а, 58b относительно операции преобразования и 59а и 59b относительно операции управления окнами, где процессор 51 на фиг.3А, кроме того, гарантирует сохранение правильной последовательности для части совмещения имен и другой части, то есть, второго подблока.
В предпочтительном осуществлении измененное дискретное косинусное преобразование (MDCT) применяется, чтобы получить критически выбранное переключение от операции кодирования в одной области на операцию кодирования в отличной другой области. Однако могут также применяться все другие преобразования. Однако, так как MDCT является предпочтительным осуществление MDCT будет обсуждено более подробно относительно фиг.4A и фиг.4B.
Фиг.4А иллюстрирует окно 70, которое имеет увеличивающуюся часть слева и уменьшающуюся часть справа, где это окно может быть разделено на четыре части: a, b, c, и d. Окно 70 имеет, как можно видеть по рисунку, только части совмещения имен в проиллюстрированной 50% ситуации перекрывания/добавления. Конкретно, первая часть, имеющая сэмплы (образцы) от ноля до N, соответствует вторым частям предыдущего окна 69, и вторая половина, простирающаяся между образцом N и образцом 2N окна 70, перекрывается с первой частью окна 71, которое, в проиллюстрированном осуществлении, является окном i+1, в то время как окно 70 является окном i.
Операция MDCT может рассматриваться как каскадирование операции свертывания и последующей операции преобразования, и в частности, последующей операции DCT, где применяется DCT типа-IV (DCT-IV). В частности, операция свертывания получается посредством вычисления первой части N/2 блока свертывания как -cR-d, и вычисления второй части N/2 сэмплов (образцов) выхода свертывания как a-bR, где R - инверсный оператор. Таким образом, операция свертывания приводит к N выходным значениям, в то время как получены 2N входные значения.
Соответствующая операция развертывания на стороне декодера проиллюстрирована в форме уравнения также на фиг.4A.
Вообще, операция MDCT на (a, b, c, d) приводит к точно тем же самым выходным значениям, что и DCT-IV (-cR-d, а-bR), как показано на фиг.4A.
Соответственно, и используя операцию развертывания, операция IMDCT приводит к выходу операции развертывания, применяемой к выходу DCT-IV инверсного преобразования.
Поэтому, совмещение имен времени вводится посредством выполнения операции свертывания на стороне декодера. Затем, результат операции свертывания преобразовывается в частотную область, используя DCT-IV блок преобразования, требующий N входных значений.
На стороне декодера, N входные значения преобразуются назад во временную область, используя операцию DCT-IV-1, и выход этой операции инверсного преобразования, таким образом, заменяется на операцию развертывания, чтобы получить 2N выходные значения, которые, однако, являются выходными значениями с совмещением имен.
Чтобы удалить совмещение имен, которое было введено операцией свертывания и которое все еще находится там, следуя за операцией развертывания, требуется операция перекрыванния/добавления, выполняемая компенсатором совмещения имен временной области 53 из фиг.3A.
Поэтому, когда результат операции развертывания добавляется результатом предыдущего IMDCT в перекрывающейся половине, обратные термы отменяются в уравнении в низу фиг.4A, и каждый получает просто, например, b и d, таким образом, возвращая оригинальные данные.
Чтобы получить TDAC для реализуемого посредством организации окон MDCT, существует требование, известное как условие «Принсена-Брэдли», что означает, что коэффициенты окна, поднятые до 2 для соответствующих сэмплов (образцов), которые объединяются в компенсаторе совмещения имен временной области, чтобы привести к единице (1) для каждого сэмпла (образца).
В то время как фиг.4A иллюстрирует последовательность окон такую, какая, например, применяется в AAC-MDCT для длинных окон или коротких окон, фиг.4D иллюстрирует другую функцию окна, которая имеет, в дополнение к частям совмещения имен, также часть несовмещения имен.
Фиг.4D иллюстрирует функцию окна анализа 72, имеющую нулевую часть a1 и d2, имеющую часть совмещения имен 72a, 72b, и имеющую часть несовмещения имен 72c.
Часть совмещения имен 72b, простирающаяся по c2, d1 имеет соответствующую часть совмещения имен последующего окна 73, которое обозначено цифрой 73b. Соответственно, окно 73 дополнительно включает часть несовмещения имен 73a. При сравнении фиг.4B с фиг.4A становится ясно, что, вследствие того, что имеются нулевые части a1, d1, для окна 72 или c1 для окна 73, оба окна получают часть несовмещения имен, и функция окна в части совмещения имен является более крутой, чем на фиг.4А. Ввиду этого, часть совмещения имен 72а соответствует Lk, часть несовмещения имен 72c соответствует части Mk, и часть совмещения имен 72b соответствует Rk на фиг.4B.
Когда операция свертывания применяется к блоку сэмплов (образцов), реализуемых посредством организации окна 72, получается такая ситуация, как проиллюстрировано на фиг.4B. Левая часть, простирающаяся по первым N/4 сэмплам (образцам), имеет совмещение имен. Вторая часть, простирающаяся по N/2 сэмплам (образцам), без совмещения имен, так как операция свертывания применяется к частям окна, имеющим нулевые значения, и последние N/4 сэмплы (образцы) снова оказываются под влиянием совмещения имен. Благодаря операции свертывания, число выходных значений операции свертывания равно N, в то время как вход был 2N, хотя, фактически, N/2 значения в этом осуществлении были установлены на нуль, вследствие операции управления окнами с использованием окна 72.
Теперь, DCT IV применяется к результату операции свертывания, но, важно, чтобы часть совмещения имен 72, которая находится на переходе от одного режима кодирования к другому режиму кодирования, обрабатывается иначе, чем часть несовмещения имен, хотя обе части принадлежат тому же самому блоку звуковых сэмплов (образцов) и, важно, чтобы они вводились в тот же самый блок операции преобразования, выполненный преобразователем 30 на фиг.1A.
Фиг.4B, кроме того, иллюстрирует последовательность окон 72, 73, 74, где окно 73 является переходным окном от ситуации, где существуют части несовмещения имен, к ситуации, где существуют только части совмещения имен. Это достигается асимметричным формированием функции окна. Правая часть окна 73 аналогична правой части окон в последовательности окон фиг.4A, в то время как левая часть имеет часть несовмещения имен и соответствующую нулевую часть (в c1). Поэтому, фиг.4В иллюстрирует переход от MDCT-ТСХ к AAC, когда AAC должен быть выполнен посредством использования полностью перекрывающихся окон или, альтернативно, переход от AAC к MDCT-TCX иллюстрируется, когда окно 74 организует окна блока данных TCX способом полного перекрывания, что является стандартной операцией для MDCT-TCX, с одной стороны, и MDCT-AAC, с другой стороны, когда нет причин для переключения с одного режима на другой режим.
Поэтому, окно 73 может называться «окном начала» или «окном остановки», которое имеет, кроме того, предпочтительную характеристику, состоящую в том, что длина этого окна идентична длине, по крайней мере, одного соседнего окна так, чтобы сохранялся общий растр блока или растр фрейма, когда блок устанавливается так, чтобы он имел то же самое число, что и коэффициенты окна, то есть, 2n сэмплов (образцов), как в примере фиг.4D или фиг.4A.
Впоследствии, процедура AAC-MDCT на стороне кодирующего устройства и на стороне декодера обсуждается относительно фиг.5.
В операции управления окнами 80, применяется функция окна, проиллюстрированная цифрой 81. Функция окна имеет две части совмещения имен Lk и Rk, и часть несовмещения имен Mk. Поэтому, функция окна 81 аналогична функции окна 72 на фиг.4В. Применение этой функции окна к соответствующему множеству звуковых сэмплов (образцов) приводит к появлению реализуемого посредством организации окон блока звуковых сэмплов (образцов), имеющих подблок совмещения имен, соответствующий Rk/Lk и подблоку несовмещения имен, соответствующему Mk.
Операция свертывания, проиллюстрированная цифрой 82, выполняется, как обозначено на фиг.4B, и приводит к N выходам, что означает, что части Lk, Rk уменьшаются, чтобы иметь меньшее число сэмплов (образцов).
Тогда, DCT IV 83 выполняется, как было обсуждено в связи с уравнением MDCT на фиг.4A. MDCT выход далее обрабатывается любым доступным компрессором данных, таким как квантизатор 84 или любое другое устройство, выполняющее любой из известных инструментов AAC.
На стороне декодера выполняется инверсная обработка 85. Затем, преобразование от третьей области в первую область выполняется посредством DCT-1 IV 86. Затем, операция развертывания 87 выполняется, как было обсуждено в связи с фиг.4А. Затем, в блоке 88, выполняется операция управления окном синтеза, и позиции 89а и 89b вместе выполняют отмену совмещения имен временной области. Позиция 89b является устройством задержки, применяющим задержку Mk+Rk, сэмплов (образцов), чтобы получить перекрывание, как обсуждалось в связи с фиг.4A, а сумматор 89а выполняет соединение обрабатываемой части звуковых сэмплов (образцов), таких как первая часть Lk обрабатываемого выхода окна и последней части Rk-1 предыдущего окна. В результате, как обозначено цифрой 90, получаются части без совмещения имен Lk и M. Следует заметить, что Mk был сначала без совмещения имен, но обработка устройствами 89а, 89b отменила совмещение имен в части совмещения имен Lk.
В предпочтительном осуществлении AAC-MDCT может также применяться только с окнами, имеющими части совмещения имен, как обозначено на фиг.4 А, но, для переключения с одного режима кодирования на другой режим кодирования, предпочтительно, чтобы применялось окно AAC, имеющее часть совмещения имен и имеющее часть несовмещения имен.
Осуществление данного изобретения используется в переключаемом звуковом кодировании, которое переключает между AAC и AMR-WB+[4].
AAC использует MDCT, как описано на фиг.5. AAC хорошо подходит для музыкального сигнала. Переключаемое кодирование использует ААС, когда входной сигнал обнаруживается в предыдущей обработке, как музыка, или маркирован пользователем, как музыка.
Фрейм входного сигнала k управляется окном с тремя частями размером Lk, Mk и Rk. MDCT вводит компоненты совмещения имен временной области до преобразования сигнала в частотную область, где выполняется квантизация. После добавления перекрывающегося предыдущего управляемого окнами сигнала размера Rk-1=Lk, Lk+Mk первые сэмплы (образцы) фрейма оригинального сигнала могут быть восстановлены, если была введена какая-то ошибка квантизации. Совмещение имен временной области отменяется.
Впоследствии, процедура TCX-MDCT, относительно данного изобретения, обсуждается в связи с фиг.6.
В отличие от кодирующего устройства на фиг.5, преобразование во вторую область выполняется позицией 92. Позиция 92 является LPC преобразователем, который или генерирует LPC остаточный сигнал или взвешенный сигнал, который может быть вычислен взвешиванием LPC остаточного сигнала с использованием взвешивающего фильтра, как известно из обработки TCX. Естественно, сигнал TCX может также быть вычислен с использованием одиночного фильтра посредством фильтрования сигнала временной области, чтобы получить TCX сигнал, который является сигналом в LPC области или, обычно, во второй области. Поэтому, преобразователь первой области /второй области 92 обеспечивает, на его выходной стороне, вход сигнала в устройство управления окнами 80. Кроме преобразователя 92, процедура в кодирующем устройстве на фиг.6 подобна процедуре в кодирующем устройстве фиг.5. Естественно, можно применять различные алгоритмы сжатия данных в блоках 84 на фиг.5 и фиг.6, которые становятся очевидны, когда AAC инструменты кодирования сравниваются с ТСХ инструментами кодирования.
На стороне декодера выполняются те же самые этапы, которые обсуждались в связи с фиг.5, но эти этапы не выполняются на кодированном сигнале в непосредственной частотной области (третья область), но выполняются на кодированном сигнале, который генерируется в четвертой области, то есть, LPC частотной области.
Поэтому, процедура перекрывания/ добавления выполняется устройствами 89a, 89b на фиг.6 во второй области, а не в первой области, как проиллюстрировано на фиг.5.
AMR-WB+основывается на речевом кодировании ACELP и кодировании TCX, основанном на преобразовании. Для каждого суперфрейма 1024 сэмплов (образцов) AMR-WB+ выбирает, используя решение в замкнутом контуре, из 17 различных комбинаций TCX и ACELP, лучшую согласно замкнутому решению, используя объективную оценку SegSNR. AMR-WB+ подходит для речи и речи поверх музыкальных сигналов. Оригинальный DFT TCX был заменен на MDCT, чтобы обладать его большими возможностями. ТСХ AMR-WB+ тогда эквивалентен MPTC кодированию, за исключением случая квантизации, которая сохраняется, как есть. Измененный AMR-WB+ используется переключаемым звуковым кодирующим устройством, когда входной сигнал обнаружен или маркирован как речь или речь поверх музыки.
TCX-MDCT выполняет MDCT не прямо на области сигнала, но после фильтрования сигнала анализирующим фильтром W (z), основанным на LPC коэффициенте. Фильтр называется взвешивающим анализирующим фильтром и позволяет TCX в то же самое время отбеливать сигнал и формировать шум квантизации посредством основанной на форманте кривой, которая соответствует психоакустическим теориям.
Обработка, проиллюстрированная на фиг.5, выполняется для непосредственного режима AAC-MDCT без любого переключения на TCX режим или любой другой режим, используя полностью перекрывающиеся окна на фиг.4A. Однако, когда обнаруживается переход, применяется определенное окно, которое является AAC окном начала для перехода к другому режиму кодирования или AAC окном остановки для перехода от другого режима кодирования в AAC режим, как проиллюстрировано на фиг.7. AAC окно остановки 93 имеет часть совмещения имен, проиллюстрированную цифрой 93b, и часть несовмещения имен, проиллюстрированную цифрой 93a, то есть, обозначенную на рисунке, как горизонтальная часть окна 93. Соответственно, AAC окно остановки 94 иллюстрируется, как имеющее часть совмещения имен 94b и части несовмещения имен 94а. В AMR-WB+ части окно применяется аналогично окну 72 фиг.4В, где это окно имеет часть совмещения имен 72a и часть несовмещения имен 72с. Хотя только одиночное AMR-WB+ окно, которое может рассматриваться как окно начала/остановки, как проиллюстрировано на фиг.7, может быть множеством окон, которые, предпочтительно, имеют 50%-ное перекрывание и могут, поэтому, быть аналогичными окнам на фиг.4A. Обычно TCX в AMR-WB+ не использует 50%-ного перекрывания. Только маленькое перекрывание применяется для быстрого переключения на/с ACELP, которое использует, по сути, прямоугольное окно, то есть 0% перекрывания.
Однако, когда имеет место переход, применяется AMR-WB+ окно начала, проиллюстрированное слева в центральной части на фиг.7, и когда принято решение, что должен быть выполнен переход от AMR-WB+ к AAC, применяется AMR-WB+ окно остановки. Окно начала имеет часть совмещения имен слева, а окно остановки имеет часть совмещения имен справа, где эти части совмещения имен обозначены, как 72а, и где эти части совмещения имен соответствуют частям совмещения имен соседних AAC окон начала/остановки, обозначенных цифрой 93b или 94b.
Специальная обработка происходит в двух перекрывающихся областях 128 сэмплов (образцов) фиг.7. Для отмены совмещения имен временной области AAC, первый и последний фрейм сегмента AMR-WB+ вынуждены быть TCX, а не ACELP. Это достигается посредством смещения метки SegSNR в решении замкнутого контура. Кроме того, первые 128 сэмплов (образцов) TCX-MDCT обрабатываются определенным образом, как показано на фиг.8A, где Lk=128.
Последние 128 сэмплов (образцов) AMR-WB+ обрабатываются, как проиллюстрировано на фиг.8B, где Rk=128.
Фиг.8A иллюстрирует обработку для части совмещения имен Rk справа от части несовмещения имен для перехода от TCX к AAC, а фиг.8В иллюстрирует специальную обработку части совмещения имен Lk слева от части несовмещения имен для перехода от AAC к TCX. Обработка аналогична показанной на фиг.6, но операция взвешивания, то есть, преобразование от первой области во вторую область позиционируется по-другому. В частности, на фиг.6, преобразование выполняется до управления окнами, в то время как на фиг.8B преобразование 92 выполняется после управления окнами 80 (и свертывания 82), то есть, операция введения совмещения имен временной области, обозначенная «TDA».
На стороне декодера, снова, выполняются стадии обработки, аналогичные показанным на фиг.6, но, снова, инверсное взвешивание для части совмещения имен выполняется до управления окнами 88 (и до развертывания 87) и после преобразования от первой области во вторую область, обозначенную цифрой 86 на фиг.8A.
Поэтому, в соответствии с привилегированным осуществлением данного изобретения, часть совмещения имен окна перехода для ТСХ обрабатывается, как показано на фиг.1A или фиг.1B, и часть несовмещения имен для того же самого окна обрабатывется в соответствии с фиг.6.
Обработка для любого AAC-MDCT окна остается той же самой, кроме того, что окно начала или окно остановки выбирается на переходе. В других осуществлениях, однако, TCX обработка может оставаться той же самой, и часть совмещения имен AAC-MDCT окна обрабатывается иначе, чем часть несовмещения имен.
Кроме того, обе части совмещения имен обоих окон, то есть, AAC окно или TCX окно, могут быть обработаны иначе, чем их части несовмещения имен в зависимости от обстоятельств. В предпочтительном осуществлении, однако, желательно, чтобы обработка AAC выполнялась, как есть, так как она уже находится в области сигнала, следующей за процедурой перекрывания - добавления, как это ясно из фиг.5, и чтобы TCX окно перехода обрабатывалось, как проиллюстрировано в контексте фиг.6 для части несовмещения имен, и как проиллюстрировано на фиг.8A или 8B для части совмещения имен.
Впоследствии, будет обсуждена фиг.9A, на которой процессор 12 фиг.1А обозначался как контроллер 98.
Устройства на фиг.9A, имеющие соответствующие номера ссылки, которые соответствуют позициям фиг.11A, имеют аналогичные функциональные возможности и не обсуждаются повторно.
В частности, контроллер 98, проиллюстрированный на фиг.9A, действует, как обозначено на фиг.9B. На стадии 98a, обнаруживается переход, где этот переход обозначен стадией принятия решений 300. Тогда, контроллер 98 приспосабливается для смещения переключателя 521 таким образом, чтобы переключатель 521 сделал выбор (2b) в любом случае.
Тогда, контроллер 98 выполняет стадию 98b. В частности, контроллер предназначен для получения данных в части совмещения имен, но не для непосредственной передачи данных в LPC 510, а для передачи данных до LPC фильтра 510 без взвешивания LPC фильтром непосредственно в TDA блок 527a. Тогда, эти данные принимаются контроллером 98 и взвешиваются и, затем, подаются в DCT блок 527b, то есть, будучи взвешенными взвешивающим фильтром на выходе контроллера 98. Взвешивающий фильтр в контроллере 98 использует LPC коэффициенты, вычисленные в LPC блоке 510 после анализа сигнала. LPC блок может питать либо ACELP, либо ТСХ и, кроме того, выполнять LPC анализ для получения LPC коэффициентов. DCT часть 527b MDCT устройства состоит из TDA устройства 527a и DCT устройства 527b. Взвешивающий фильтр на выходе контроллера 98 имеет ту же самую характеристику, что и фильтр в LPC блоке 510, и потенциально предоставляет дополнительный взвешивающий фильтр, такой как перцепционный фильтр в AMR-WB+ТСХ обработке. Следовательно, на стадии 98b, TDA-, LPC-, и DCT обработка выполняется в этом порядке.
Данные в последующей части подаются в LPC блок 510 и, впоследствии, в MDCT блок 527a, 527b, как обозначено обычным путем прохождения сигнала на фиг.9A. В этом случае, TCX взвешивающий фильтр не явно проиллюстрирован на фиг.9A, потому что он принадлежит LPC блоку 510.
Как сказано ранее, данные в части совмещения имен, как обозначено на фиг.8А, являются реализуемыми посредством организации окон в блоке 527а, и реализуемые посредством организации окон данные, генерированные в блоке 527, являются LPC фильтрованными на выходе контроллера, и тогда результат фильтрования LPC применяется к преобразованной части 527b MDCT блока 527. TCX взвешивающий фильтр для взвешивания LPC остаточного сигнала, генерированного LPC устройством 510, не показанным на фиг.9А. Дополнительно, устройство 527a включает стадию управления окнами 80 и, стадию свертывания 82, а устройство 527b включают DCT IV стадию 83, как обсуждалось в связи с фиг.8A. Затем DCT IV стадия 83/527b получает часть совмещения имен после обработки и последующую часть после соответствующей обработки, и выполняет обычную MDCT операцию, и последующее сжатие данных в блоке 528 выполняется, как обозначено стадией 98d на фиг.9B. Поэтому, в случае кодирующего устройства, контролируемого аппаратным решением или программным обеспечением, как обсуждалось в связи с фиг.9А, контроллер 98 выполняет распределение данных, как обозначено на фиг.9D, между различными блоками 510 и 527a, 527b.
На стороне декодера, переходный контроллер 99 предоставляется в дополнение к блокам, обозначенным на фиг.11B, которые уже обсуждались.
Функциональные возможности переходного контроллера 99 обсуждаются в связи с фиг.10B.
Как только переходный контроллер 99 обнаружил переход, как в общих чертах показано на стадии 99а фиг.10B, целый фрейм подается в MDCT-1 стадию 537b, вслед за декомпрессией данных в декомпрессоре данных 537a. Эта процедура обозначена на стадии 99b фиг.10B. Затем, как обозначено на стадии 99с, часть совмещения имен подается непосредственно в LPC-1 стадию до выполнения обработки TDAC. Однако часть совмещения имен не подвергается полной «MDCT» обработке, а только, как проиллюстрировано на фиг.8B, подвергается инверсному преобразованию от четвертой области во вторую область.
Подача части совмещения имен, вслед за DCT-1 IV стадией 86/стадией 537b фиг.8B в дополнительную LPC-1 стадию 537d фиг.10А обеспечивает выполнение преобразования от второй области в первую область, и, впоследствии, операция развертывания 87 и операция управления окнами 88 фиг.8B выполняются в блоке 537c. Поэтому, переходный контроллер 99 получает данные от блока 537b вслед за DCT-1 операцией стадии 86, и затем подает эти данные LPC-1 блоку 537d. Выход этой процедуры, затем, подается в блок 537d для выполнения развертывания 87 и управления окнами 88. Тогда, результат управления окнами части совмещения имен направляется TDAC блоку 440b, чтобы выполнить операцию перекрывания - добавления с соответствующей частью совмещения имен AAC-MDCT блока. Ввиду этого, порядок обработки для блока совмещения имен следующий: декомпрессия данных в 537a, DCT-1 в 537b, инверсное LPC и инверсное TCX перцепционное взвешивание (вместе обозначающее инверсное взвешивание) в 537d, TDA-1 обработка в 537c и, затем, перекрывание и добавление в 440b.
Однако остающаяся часть фрейма подается в стадию управления окнами до TDAC и инверсного фильтрования/взвешивания в 540, как обсуждалось в связи с фиг.6, и как проиллюстрировано обычным потоком сигналов, проиллюстрированным на фиг.10A, когда не учитываются стрелки, соединенные с блоком 99.
Ввиду этого, стадия 99c имеет результатом декодированный звуковой сигнал для части совмещения имен, следующей за TDAC 440b, а стадия 99d имеет результатом декодированный звуковой сигнал для остающейся/последующей части, следующей за TDAC 537c в LPC области и инверсным взвешиванием в блоке 540.
В зависимости от определенных требований выполнения, осуществления изобретения могут быть реализованы в аппаратных средствах или в программном обеспечении. Выполнение может быть осуществлено при использовании цифрового носителя данных, например дискета, DVD, компакт-диск, ROM (постоянное запоминающее устройство, ПЗУ), PROM (программируемое постоянное запоминающее устройство, ППЗУ), EPROM (стираемое программируемое постоянное запоминающее устройство СППЗУ), EEPROM (электрически стираемое программируемое постоянное запоминающее устройство, ЭСППЗУ), или флэш-память, имеющего сохраненные на нем электронно-считываемые управляющие сигналы, которые взаимодействуют (или могут взаимодействовать) с программируемой вычислительной системой таким образом, что реализуется соответствующий способ.
Некоторые осуществления согласно изобретению включают носитель информации, имеющий электронно-считываемые управляющие сигналы, которые способны взаимодействовать с программируемой вычислительной системой таким образом, что реализуется один из описанных здесь способов.
В общем, осуществления данного изобретения могут быть выполнены как компьютерный программный продукт с управляющей программой; управляющая программа служит для выполнения одного из способов, когда компьютерный программный продукт запущен на компьютере. Управляющая программа может, например, сохраняться на машиночитаемом носителе.
Другие осуществления включают компьютерную программу для реализации одного из описанных здесь способов, сохраненную на машиночитаемом носителе.
Другими словами, осуществлением изобретательного способа, поэтому, является компьютерная программа, имеющая управляющую программу для реализации одного из описанных здесь способов, когда компьютерная программа запущена на компьютере.
Дальнейшим осуществлением изобретательных способов, поэтому, является носитель информации (или цифровой носитель информации, или считываемая компьютером информация), включающий записанную на нем компьютерную программу для реализации одного из описанных здесь способов.
Дальнейшим осуществлением изобретательного способа, поэтому, является поток данных или последовательность сигналов, представляющих компьютерную программу для реализации одного из описанных здесь способов. Поток данных или последовательность сигналов могут, например, формироваться, чтобы быть переданными через канал передачи данных, например, через Интернет.
Дальнейшее осуществление включает средство обработки, например компьютер, или программируемое логическое устройство, формируемое для или приспособленное для выполнения одного из описанных здесь способов.
Дальнейшее осуществление включает компьютер с установленной на нем компьютерной программой для реализации одного из описанных здесь способов.
В некоторых осуществлениях программируемое логическое устройство (например, промысловая программируемая логическая матрица) может использоваться для выполнения некоторых или всех функциональных возможностей описанных здесь способов. В некоторых осуществлениях промысловая программируемая логическая матрица может взаимодействовать с микропроцессором, чтобы выполнить один из описанных здесь способов.
Вышеописанные осуществления являются только иллюстрацией принципов данного изобретения. Имеется в виду, что модификации и изменения расположения и деталей, описанных здесь, будут понятны специалистам, квалифицированным в этой области. Поэтому, целью является то, чтобы ограничиваться только объемом формулы изобретения, а не специфическими деталями, представленными посредством приведенных здесь описаний и объяснений осуществлений.
название | год | авторы | номер документа |
---|---|---|---|
ПЕРЕКЛЮЧАЕМАЯ АУДИО КОДИРУЮЩАЯ/ДЕКОДИРУЮЩАЯ СХЕМА С МУЛЬТИРАЗРЕШЕНИЕМ | 2009 |
|
RU2520402C2 |
ЗВУКОВОЕ КОДИРУЮЩЕЕ УСТРОЙСТВО И ДЕКОДЕР ДЛЯ КОДИРОВАНИЯ ДЕКОДИРОВАНИЯ ФРЕЙМОВ КВАНТОВАННОГО ЗВУКОВОГО СИГНАЛА | 2009 |
|
RU2507572C2 |
СХЕМА АУДИОКОДИРОВАНИЯ/ДЕКОДИРОВАНИЯ С ПЕРЕКЛЮЧЕНИЕМ БАЙПАС | 2009 |
|
RU2483364C2 |
КОДЕР, ИСПОЛЬЗУЮЩИЙ ПРЯМОЕ ПОДАВЛЕНИЕ ПОМЕХ ДИСКРЕТИЗАЦИИ | 2011 |
|
RU2575809C2 |
КОДЕР АУДИОСИГНАЛА, ДЕКОДЕР АУДИОСИГНАЛА, СПОСОБ КОДИРОВАНИЯ ИЛИ ДЕКОДИРОВАНИЯ АУДИОСИГНАЛА С УДАЛЕНИЕМ АЛИАСИНГА (НАЛОЖЕНИЯ СПЕКТРОВ) | 2010 |
|
RU2591011C2 |
УСТРОЙСТВО И СПОСОБ ДЛЯ КОДИРОВАНИЯ ЧАСТИ АУДИОСИГНАЛА С ИСПОЛЬЗОВАНИЕМ ОБНАРУЖЕНИЯ НЕУСТАНОВИВШЕГОСЯ СОСТОЯНИЯ И РЕЗУЛЬТАТА КАЧЕСТВА | 2012 |
|
RU2573231C2 |
УСТРОЙСТВО АУДИО КОДИРОВАНИЯ И ДЕКОДИРОВАНИЯ ДЛЯ КОДИРОВАНИЯ ФРЕЙМОВ, ПРЕДСТАВЛЕННЫХ В ВИДЕ ВЫБОРОК ЗВУКОВЫХ СИГНАЛОВ | 2009 |
|
RU2498419C2 |
УСТРОЙСТВО И СПОСОБ ДЛЯ КОДИРОВАНИЯ И ДЕКОДИРОВАНИЯ АУДИОСИГНАЛА С ИСПОЛЬЗОВАНИЕМ ВЫРОВНЕННОЙ ЧАСТИ ОПЕРЕЖАЮЩЕГО ПРОСМОТРА | 2012 |
|
RU2574849C2 |
СХЕМА КОДИРОВАНИЯ/ДЕКОДИРОВАНИЯ АУДИО СИГНАЛОВ С НИЗКИМ БИТРЕЙТОМ С ПРИМЕНЕНИЕМ КАСКАДНЫХ ПЕРЕКЛЮЧЕНИЙ | 2009 |
|
RU2485606C2 |
КОДЕР И ДЕКОДЕР АУДИОСИГНАЛА, ИСПОЛЬЗУЮЩИЕ ПРОЦЕССОР ЧАСТОТНОЙ ОБЛАСТИ, ПРОЦЕССОР ВРЕМЕННОЙ ОБЛАСТИ И КРОССПРОЦЕССОР ДЛЯ НЕПРЕРЫВНОЙ ИНИЦИАЛИЗАЦИИ | 2015 |
|
RU2668397C2 |
Устройство для кодирования звукового сигнала включает устройство управления окнами (11) для управления окнами первого блока звукового сигнала посредством использования окна анализа, имеющего часть совмещения имен и последующую часть, кроме того, включает процессор (12) для обработки первого подблока звукового сигнала, связанного с частью совмещения окна анализа посредством преобразования подблока от области в другую область, вслед за управлением окнами первого подблока для получения обработанного первого подблока, и для обработки второго подблока звукового сигнала, связанного с последующей частью, посредством преобразования второго подблока от области в другую область до управления окнами второго подблока для получения обработанного второго подблока. Устройство, кроме того, включает преобразователь (13) для преобразования обработанного первого подблока и обработанного второго подблока от другой области в последующую другую область посредством использования того же самого правила преобразования блока для получения преобразованного первого блока, который сжимают посредством использования любого из известных алгоритмов сжатия данных. Таким образом, получено критически выбранное переключение между двумя режимами кодирования, так как части совмещения окна анализа, появляющиеся в двух различных областях, подходят друг к другу. Технический результат - обеспечить улучшенную концепцию кодирования/декодирования при низкой скорости передачи с высоким качеством. 6 н. и 11 з.п. ф-лы, 20 ил.
1. Устройство кодирования звукового сигнала, включающее устройство управления окнами (11) для управления окнами первого блока звукового сигнала посредством использования окна анализа; окно анализа имеет часть совмещения (Lk, Rk), и последующую часть (Mk);
процессор (12) для обработки первого подблока (20) звукового сигнала, связанного с частью совмещения окна анализа посредством преобразования первого подблока в область, отличную от области, в которой находится звуковой сигнал, вслед за управлением окнами первого подблока, чтобы получить обработанный первый подблок, и для обработки второго подблока (21) звукового сигнала, связанного с последующей частью посредством преобразования второго подблока в другую область до управления окнами второго подблока, чтобы получить обработанный второй подблок; и
преобразователь (13) для преобразования обработанного первого подблока и обработанного второго подблока от другой области в последующую область, используя то же самое правило преобразования блока, чтобы получить преобразованный первый блок,
где устройство формируется для последующей обработки (14) преобразованного первого блока посредством использования алгоритма сжатия данных.
2. Устройство по п.1, которое выполнено с возможностью обработки второго блока звукового сигнала, перекрывающегося с первым блоком, посредством использования второго окна анализа (73), имеющего часть совмещения (73b), соответствующую части совмещения (72b) первого окна анализа.
3. Устройство по п.1, в котором область, в которой размещен звуковой сигнал, является временной областью, в котором другая область является LPC областью, в котором третья область, в которой закодирован второй блок звукового сигнала, перекрывающийся с первым блоком звукового сигнала, является частотной областью, и в котором последующая область, в которой формируется преобразователь (13) для преобразования, является LPC частотной областью, и
где процессор (12) включает LPC фильтр для преобразования от первой области во вторую область, или где преобразователь (13) включает алгоритм преобразования, основанный на преобразовании Фурье, для преобразования входных данных в частотную область входных данных, таких как DCT, DST, FFT или DFT.
4. Устройство по п.1, в котором устройство управления окнами (11) включает функцию свертывания (82) для свертывания входных значений для получения выходных значений; число выходных значений меньше, чем число входных значений, где функция свертывания такова, что временное совмещение окна анализа вводится в выходные значения.
5. Устройство по п.1, в котором устройство управления окнами (11) предназначено для выполнения управления окнами, чтобы получить входные значения для впоследствии выполненной функции свертывания (82).
6. Устройство по п.1, в котором устройство включает первую ветвь кодирования (400) для кодирования звукового сигнала в частотной области и вторую ветвь кодирования (500) для кодирования звукового сигнала, основанного на другой частотной области, где вторая ветвь кодирования имеет первую подветвь (527, 528) для кодирования звукового сигнала в другой частотной области, и вторая подветвь (526) для кодирования звукового сигнала в другой области;
устройство далее включает стадию принятия решений (300) для принятия решения о том, представлен ли блок звуковых данных в выходном битовом потоке данными, генерированными посредством использования первой ветви кодирования или первой подветви или второй подветви второй ветви кодирования, и
где контроллер (98) формируется для управления стадией принятия решений (300) для принятия решения в пользу первой подветви, когда должен быть выполнен переход от первой ветви кодирования ко второй ветви кодирования или от второй ветви кодирования к первой ветви кодирования.
7. Устройство по п.1, в котором последующая часть окна анализа включает часть несовмещения (Mk) и дополнительная часть совмещения окна анализа или часть совмещения окна анализа, перекрывающаяся с соответствующей частью совмещения окна анализа соседнего блока звукового сигнала.
8. Устройство для декодирования кодированного звукового сигнала, имеющее кодированный первый блок звуковых данных, кодированный блок, имеющий часть совмещения окна анализа и последующую часть окна анализа, включающее
процессор (51) для обработки части совмещения окна анализа (Lk, Rk) посредством преобразования (86) части совмещения окна анализа в целевую область до выполнения управления окном синтеза (88) для получения реализуемой посредством организации окна части совмещения окна анализа и для выполнения управления окном синтеза (88) последующей части окна анализа до выполнения преобразования (98) в целевую область; и
компенсатор совмещения окна анализа временной области (53) для объединения реализуемой посредством организации окна части совмещения окна анализа и реализуемой посредством организации окна части совмещения окна анализа кодированного второго блока звуковых данных, вслед за преобразованием (91) части совмещения окна анализа кодированного первого блока звуковых данных в целевую область, чтобы получить декодированный звуковой сигнал, соответствующий части совмещения окна анализа первого блока.
9. Устройство по п.8, в котором процессор (51) включает преобразователь (86) для преобразования части совмещения окна анализа от четвертой области во вторую область, и где процессор, кроме того, включает преобразователь (91) для преобразования части совмещения окна анализа, представленной во второй области, в первую область, где преобразователь (86) предназначен для выполнения основанного на блоках алгоритма преобразования времени/частоты.
10. Устройство по п.8, в котором процессор (12) предназначен для выполнения операции развертывания (87) для получения выходных данных, имеющих число значений большее, чем число значений входа в операцию развертывания (87).
11. Устройство по п.8, в котором процессор (12) предназначен для использования функции управления окном синтеза (88), связанной с функцией окна анализа, используемой при генерировании кодированного звукового сигнала.
12. Устройство по п.8, в котором кодированный звуковой сигнал включает указатель режима кодирования, показывающий режим кодирования для кодированного первого блока и кодированного второго блока,
где устройство далее включает переходной контроллер (99) для управления процессором (12), когда индикатор режима кодирования показывает изменение режима кодирования с первого режима кодирования на другой второй режим кодирования или наоборот, и для управления процессором (12) для выполнения того же самого действия для полного блока кодирования, когда не сообщается об изменении режима кодирования между двумя блоками кодирования.
13. Устройство по п.8, в котором первый режим кодирования и второй режим кодирования включают стадию энтропийного декодированиия, стадию деквантизации, стадию преобразования частоты/времени, включающую операцию развертывания, и стадию управления окном синтеза,
в котором компенсатор совмещения окна анализа временной области (53) включает сумматор (89а) для добавления соответствующих частей совмещения окна анализа кодированных блоков, полученных на стадии управления окном синтеза (88), соответствующих частей совмещения окна анализа, полученных перекрывающей обработкой (89b) звукового сигнала, и
в котором в первом режиме кодирования компенсатор совмещения окна анализа временной области (53) формируется для добавления частей блоков, полученных посредством управления окном синтеза, для получения, в качестве выхода добавления (89а), декодированного сигнала в целевой области, и
в котором во втором режиме кодирования выход добавления (89a) обрабатывается процессором (12) для выполнения преобразования (91) выхода добавления в целевую область.
14. Способ кодирования звукового сигнала, включающий управление окнами (11) первого блока звукового сигнала посредством использования окна анализа; окно анализа имеет часть совмещения окна анализа (Lk, Rk) и последующую часть окна анализа (Mk);
обработку (12) первого подблока (20) звукового сигнала, связанного с частью совмещения окна анализа, посредством преобразования первого подблока в область, отличную от области, в которой находится звуковой сигнал, вслед за управлением окнами первого подблока для получения обработанного первого подблока;
обработку второго подблока (21) звукового сигнала, связанного с последующей частью, посредством преобразования второго подблока в другую область до управления окнами второго подблока для получения обработанного второго подблока;
преобразование (13) обработанного первого подблока и обработанного второго подблока от другой области в последующую область посредством использования того же самого правила преобразования блока для получения обработанного первого блока; и
дальнейшую обработку (14) преобразованного первого блока посредством использования алгоритма сжатия данных.
15. Способ декодирования кодированного звукового сигнала, имеющего кодированный первый блок звуковых данных, кодированный блок, имеющий часть совмещения окна анализа и последующую часть, включающий обработку (51) части совмещения окна анализа (Lk, Rk) посредством преобразования (86) части совмещения окна анализа в целевую область до выполнения управления окном синтеза (88) для получения реализуемой посредством организации окон части совмещения окна анализа;
управление окном синтеза (88) последующей части до выполнения преобразования (98) в целевую область; и
объединение (53) реализуемой посредством организации окон части совмещения окна анализа и реализуемой посредством организации окон части совмещения окна анализа кодированного второго блока звуковых данных для получения отмены совмещения окна анализа временной области, вслед за преобразованием (91) части совмещения окна анализа кодированного первого блока звуковых данных в целевую область для получения декодированного звукового сигнала, соответствующего части совмещения окна анализа первого блока.
16. Машиночитаемый носитель информации с записанной на нем компьютерной программой, имеющей управляющую программу, для выполнения способа кодирования по п.15, когда программа запущена на компьютере.
17. Машиночитаемый носитель информации с записанной на нем компьютерной программой, имеющей управляющую программу, для выполнения способа декодирования по п.16, когда программа запущена на компьютере.
Станок для изготовления деревянных ниточных катушек из цилиндрических, снабженных осевым отверстием, заготовок | 1923 |
|
SU2008A1 |
US 2006247928 A1, 02.11.2006 | |||
EP 1396844 A1, 10.03.2004 | |||
RU 2005135650 A, 20.03.2006 | |||
US 6226608 В1, 01.05.2001 | |||
СПОСОБ ЦИФРОВОГО КОДИРОВАНИЯ ДЛЯ ПЕРЕДАЧИ И/ИЛИ НАКОПЛЕНИЯ АКУСТИЧЕСКИХ СИГНАЛОВ | 1990 |
|
RU2141166C1 |
Авторы
Даты
2013-09-10—Публикация
2009-06-17—Подача