СПОСОБ И УСТРОЙСТВО ДЛЯ МАСШТАБИРУЕМОГО КОДИРОВАНИЯ/ДЕКОДИРОВАНИЯ АУДИОСИГНАЛОВ Российский патент 2003 года по МПК H03M7/30 

Описание патента на изобретение RU2214047C2

Область техники
Настоящее изобретение относится к кодированию и декодированию аудиосигналов и, в частности, к способу и устройству для масштабируемого кодирования/декодирования аудиосигналов для многоуровневых потоков битов путем представления данных различных уровней расширения на основе базового уровня внутри потока битов.

Известный уровень техники
Обычно сигнал, содержащий в себе информацию, является по существу непрерывным аналоговым сигналом. Для представления сигнала в виде дискретного сигнала необходимо аналого-цифровое преобразование.

Для выполнения аналого-цифрового преобразования необходимы две процедуры: 1) процедура дискретизации для преобразования непрерывного во времени сигнала в дискретный сигнал; и 2) процедура квантования амплитуды для ограничения количества возможных амплитуд до ограниченного значения, то есть для преобразования входной амплитуды х(n) в элемент у(n), принадлежащий конечному набору возможных амплитуд в момент n.

Благодаря развитию в последние годы технологии обработки цифровых сигналов был предложен и широко используется способ запоминания /восстановления аудиосигнала для преобразования аналогового сигнала в цифровые данные с импульсно-кодовой модуляцией посредством дискретизации и квантования, запоминания преобразованного сигнала на носителе записи/ хранения, таком как компакт-диск или цифровая магнитофонная лента, и затем воспроизведения записанного сигнала по требованию пользователя. Цифровой способ запоминания /восстановления, решает проблему качества звука и значительно улучшает его по сравнению с известным аналоговым способом. Однако при этом способе все еще существует проблема запоминания и передачи данных в случае большого объема цифровых данных.

Чтобы уменьшить объем цифровых данных, был разработан способ дифференциальной импульсно-кодовой модуляции или адаптивной дифференциальной импульсно-кодовой модуляции для сжатия цифрового аудиосигнала. Однако такой способ имеет недостаток, заключающийся в том, что возникает большое различие в эффективности в соответствии с типом сигнала. В способе MPEG (Экспертная группа по движущимся изображениям)/ аудио, недавно стандартизированном Международной организацией по стандартизации (ISO), и способе AC-2/AC-3 Dolby для уменьшения количества данных используется психоакустическая модель человека.

В известном способе сжатия аудиосигналов, таком как MPEG-1/аудио, MPEG-2/аудио или АС-2/АС-3 сигналы временной области преобразуются в сигналы частотной области посредством объединения в блоки, имеющие постоянный размер. Затем преобразованные сигналы подвергаются масштабному квантованию с использованием психоакустической модели человека. Этот способ квантования прост, но не оптимален, даже если входные выборки являются статистически независимыми. Кроме того, если входные выборки являются статистически зависимыми друг от друга, квантование дает не такие подходящие результаты. Таким образом выполняется кодирование, включая кодирование без потерь, такое как статистическое кодирование или конкретный вид адаптивного квантования. Следовательно, процедура кодирования становится существенно сложнее, чем в простом способе запоминания ИКМ-данных. Поток бит включает в себя дополнительную информацию для сжатия сигналов, а также квантованные ИКМ-данные.

Стандарты MPEG/аудио или способ АС-2/AC-3 обеспечивают почти то же самое качество звука, что и компакт-диск со скоростью передачи в битах 64~384 кбит/с, которая составляет от одной шестой до одной восьмой скорости передачи при известном способе цифрового кодирования. По этой причине MPEG/аудио стандарты играют важную роль в запоминании и передаче аудиосигналов, как это имеет место в цифровом аудиовещании, межсетевой телефонной связи или "аудио по запросу".

В известных способах в кодере задается фиксированная скорость передачи в битах и определяется оптимальное состояние, подходящее для данной скорости передачи в битах, чтобы затем выполнить квантование и кодирование, чем значительно повышается эффективность. Однако с появлением технологии мультимедиа возрастают требования к многофункциональному кодеру/декодеру (кодеку), выполняющему эффективное кодирование при низкой скорости передачи в битах. Одним из таких требований является наличие масштабируемого аудиокодека. Масштабируемый аудиокодек может преобразовать потоки битов, закодированные при высокой скорости передачи в битах, в потоки битов с низкой скоростью передачи, чтобы затем восстанавливать только некоторые из них. Благодаря такому преобразованию сигналы могут восстанавливаться с приемлемой эффективностью, причем только некоторые из потоков битов с незначительным ухудшением рабочих характеристик из-за пониженных скоростей передачи в битах, когда в сети возникает перегрузка или когда недостаточна пропускная способность декодера или по запросу пользователя.

Согласно известным способам кодирования звука фиксированная скорость передачи в битах задается в устройстве кодирования, определяется оптимальное состояние для заданной скорости передачи в битах, чтобы затем выполнить квантование и кодирование, тем самым формируя потоки битов, соответствующие данной скорости передачи в битах. Один поток битов содержит информацию только для одной скорости передачи в битах. Другими словами, информация о скорости передачи в битах содержится в заголовке потока битов и используется фиксированная скорость передачи в битах. Таким образом можно использовать способ, дающий максимальную эффективность при конкретной скорости передачи в битах. Например, если поток битов формируется кодером со скоростью передачи 96 кбит/с, звук с наилучшим качеством может быть восстановлен с помощью декодера, соответствующего кодеру, имеющему скорость передачи 96 кбит/с.

Согласно таким способам потоки битов формируются без учета других скоростей передачи в битах, но при этом формируются потоки битов, имеющие размер, подходящий для данной скорости передачи в битах, но не порядок потоков битов. Действительно, если сформированные таким образом потоки битов передаются через сеть связи, то эти потоки разбиваются на несколько сегментов для последующей передачи. Если в канале передачи возникает перегрузка или из-за узкой полосы пропускания канала передачи только некоторые из сегментов, посланных передающим концом, принимаются на приемном конце, поэтому данные не смогут быть правильно восстановлены. Также, поскольку потоки битов не формируются в соответствии с их значимостью, если только некоторые из потоков битов восстанавливаются, то качество значительно ухудшается. В случае аудио-цифровых данных воспроизводится звук, неприятный для человеческого уха.

Например, если вещательная станция формирует потоки битов и передает их различным пользователям, то пользователям могут потребоваться различные скорости передачи в битах. С другой стороны, пользователи могут иметь декодеры различной эффективности. В таком случае, если от вещательной станции для удовлетворения запросов пользователей передаются только потоки битов, где поддерживается фиксированная скорость передачи в битах, то потоки битов должны передаваться соответствующим пользователям по отдельности, что сильно удорожает передачу и форматирование потоков битов.

Однако, если поток битов аудиосигналов имеет скорости передачи различных уровней, то можно должным образом удовлетворить запросы различных пользователей и требования, предъявляемые данным оборудованием. Для этой цели просто выполняется кодирование более низких уровней, как показано на фиг.1, а затем выполняется декодирование. После этого различие между сигналом, полученным посредством декодирования, и исходным сигналом снова вводится в кодер для следующего уровня для последующей обработки. Другими словами сначала кодируется базовый уровень для генерации потока битов, а затем кодируется различие между исходным сигналом и кодированным сигналом для генерации потока битов следующего уровня, и так далее. При этом способе возрастает сложность кодера. Кроме того, чтобы восстановить исходный сигнал, декодер повторяет эту процедуру в обратном порядке, что увеличивает сложность декодера. Таким образом при возрастании количества уровней кодер и декодер становятся более сложными.

Сущность изобретения
Для разрешения вышеуказанных проблем задачей настоящего изобретения является создание способа масштабируемого кодирования/декодирования аудиосигналов и устройства для его осуществления, который может управлять размером потоков битов и сложностью декодера в соответствии с состоянием канала передачи, характеристиками декодера или запросом пользователя путем представления данных для скоростей передачи в битах различных уровней в одном потоке.

Для решения этой задачи предложен способ масштабируемого кодирования аудиосигналов для кодирования аудиосигналов в многоуровневый поток данных, имеющий базовый уровень и заданное количество уровней расширения, включающий следующие этапы: (а) обработка входных аудиосигналов и их квантование для каждой предварительно определенной полосы кодирования; (b) кодирование квантованных данных, соответствующих базовому уровню, в пределах предварительно определенного размера уровня; (с) кодирование квантованных данных, соответствующих следующему уровню расширения кодированного базового уровня, и остальных некодированных и принадлежащих кодируемому уровню квантованных данных, в пределах предварительно определенного размера уровня; и (d) последовательное выполнение этапов кодирования уровня для всех уровней, при этом каждый из этапов (b), (с) и (d) включает следующие этапы: (е) представление квантованных данных, соответствующих уровню, подлежащему кодированию, с помощью одного и того же предварительно определенного количества цифр; и (f) кодирование самых старших цифровых последовательностей, образованных из наиболее значимых из цифр данных, образующих представляемые цифровые данные.

Этапы (е) и (f) выполняются последовательно от низкой частоты к высокой частоте.

Этапы (b), (с) и (d) выполняются с использованием дополнительной информации, имеющей, по меньшей мере, информацию о размере шага квантования и информацию о бите квантования, выделенных каждой полосе, посредством предварительно определенного способа кодирования.

Цифры для этапов (е) и (f) представляют собой биты, а кодирование на этапе (f) выполняется посредством объединения битов, образующих битовые последовательности, в блоки с предварительно определенным количеством битов.

Заданный способ кодирования является кодированием без потерь, а кодирование без потерь представляет собой кодирование Хаффмена или арифметическое кодирование.

Если квантованные данные состоят из знаковых данных и данных модуля, то этап (f) включает следующие этапы: i) кодирование последовательностей самых старших цифр, образованных из самых старших цифр данных модуля, образующих представляемые цифровые данные, с использованием предварительно определенного способа кодирования; ii) кодирование знаковых данных, соответствующих ненулевым данным из кодированных последовательностей самых старших цифр; iii) кодирование последовательностей самых старших цифр из некодированных данных модуля цифровых данных с использованием предварительно определенного способа кодирования; iv) кодирование некодированых знаковых данных из знаковых данных, соответствующих ненулевым данным модуля, среди цифровых последовательностей, закодированных на этапе (iii); и v) выполнение этапов (iii) и (iv) для соответствующих цифр цифровых данных.

Этап (е) заключается в представлении цифровых данных в виде двоичных данных, имеющих одно и то же количество битов, а цифры являются битами.

Этапы кодирования выполняются посредством объединения битов, образующих соответствующие битовые последовательности для данных модуля и знаковых данных, в блоки с предварительно определенным количеством битов.

Квантование выполняется на этапах преобразования входных аудиосигналов временной области в сигналы частотной области, объединения преобразованных сигналов в виде сигналов предварительно определенных субполос путем отображения время/частота и вычисления порога маскирования на каждой субполосе, и квантования сигналов для каждой предварительно определенной полосы кодирования, так чтобы шум квантования каждой полосы был меньше порога маскирования.

Согласно другому аспекту настоящего изобретения предлагается устройство масштабируемого кодирования аудиосигналов для кодирования аудиосигналов, чтобы иметь данные с заданным количеством уровней скорости передачи в битах, содержащее: блок квантования для обработки входных аудиосигналов и их квантования для каждой полосы кодирования; и блок компоновки битов для генерации потоков битов путем кодирования дополнительной информации, соответствующей базовому уровню и квантованным данным, и кодирования дополнительной информации, соответствующей следующему уровню базового уровня и квантованным данным, для выполнения кодирования на всех уровнях, при этом блок компоновки битов выполняет кодирование путем представления квантованных данных с помощью двоичных данных, имеющих одно и то же заданное количество битов, чтобы разбить их на блоки битов, и кодирования разделенных на биты данных от самой старшей битовой последовательности до самой младшей битовой последовательности, с использованием предварительно определенного способа кодирования.

Если цифровые данные состоят из знаковых данных и данных модуля, то блок компоновки битов собирает и кодирует данные модуля для битов, имеющих тот же самый уровень значимости среди разделенных на биты данных, кодирует некодированные знаковые данные из числа знаковых данных, соответствующих ненулевым данным модуля, причем кодирование данных модуля и знака выполняется последовательно от самых старших битов к младшим битам.

Когда блок компоновки битов собирает и кодирует биты согласно значимости, кодирование выполняется путем объединения битов в блок с предварительно определенным количеством битов.

Также предлагается способ масштабируемого декодирования аудиосигналов для декодирования аудиоданных, закодированных, чтобы иметь многоуровневые скорости передачи в битах, включающий следующие этапы: декодирование дополнительной информации, имеющей по меньшей мере информацию о размере шага квантования и информацию о бите квантования, выделенные каждой полосе, в порядке создания уровней в потоках данных, имеющих многоуровневые скорости передачи в битах, путем анализа значимости битов, образующих потоки данных, от старших битов к младшим битам; восстановление декодированного размера шага квантования и квантованных данных в сигналы, имеющие исходные уровни; и преобразование сигналов, прошедших обратное квантование, в сигналы временной области.

Цифры на этапе декодирования являются битами, а потоки данных - потоками битов.

Этап декодирования в соответствии со значимостью выполняется блоками векторов, содержащими заданное количество битов.

Если квантованные данные образованы из знаковых данных и данных модуля, то этап декодирования выполняется путем декодирования дополнительной информации, имеющей по меньшей мере информацию о размере шага квантования и информацию о бите квантования, выделенных каждой полосе, и квантованных данных в порядке создания уровней в потоках данных, имеющих многоуровневые скорости передачи в битах, путем анализа значимости битов, образующих потоки данных, от старших битов к младшим битам; и декодирования данных знака квантованных данных и объединения их с декодированными данными модуля.

Этап декодирования выполняется посредством арифметического декодирования или декодирования Хаффмена.

Как вариант, согласно настоящему изобретению предлагается устройство масштабируемого декодирования аудиосигналов для декодирования аудиоданных, закодированных, чтобы иметь многоуровневые скорости передачи в битах, содержащее: блок анализа потока битов для декодирования дополнительной информации, имеющей по меньшей мере информацию о размере шага квантования и информацию о бите квантования, выделенных каждой полосе, и квантованных данных в порядке создания уровней в многоуровневых потоках битов, путем анализа значимости битов, образующих потоки битов, от старших битов к младшим битам; блок обратного квантования для восстановления декодированного размера шага квантования и квантованных данных в сигналы, имеющие исходные уровни; и блок отображения частота/время для преобразования сигналов, прошедших обратное квантование, в сигналы временной области.

Краткое описание чертежей
Вышеупомянутые задачи и преимущества настоящего изобретения станут более очевидными из последующего подробного описания предпочтительного варианта его воплощения со ссылками на чертежи, на которых представлено следующее:
фиг. 1 - блок-схема простого устройства масштабируемого кодирования/декодирования (кодека);
фиг. 2 - блок-схема устройства кодирования согласно настоящему изобретению;
фиг.3 показывает структуру потока битов согласно настоящему изобретению; и
фиг. 4 - блок-схема устройства декодирования согласно настоящему изобретению.

Предпочтительные варианты осуществления изобретения
Ниже со ссылками на чертежи подробно описываются предпочтительные варианты осуществления настоящего изобретения.

На фиг.2 представлена блок-схема устройства масштабируемого кодирования звука согласно настоящему изобретению, которое включает в себя блок квантования 230 и блок компоновки битов 240.

Блок квантования 230 для обработки входных аудиосигналов и их квантования для заданной полосы кодирования включает в себя блок отображения время/частота 200, блок 210 психоакустической обработки и блок квантования 220.

Блок преобразования время/частота 200 преобразует входные аудиосигналы временной области в сигналы частотной области. Воспринимаемое человеческим ухом различие между характеристиками сигнала во времени не очень велико. Однако согласно психоакустическим моделям человека для каждой полосы получается большое различие. Таким образом, эффективность сжатия может быть повышена посредством предварительного выделения разных битов квантования в зависимости от частотных полос.

Блок 210 психоакустической обработки объединяет преобразованные сигналы с помощью сигналов заданных субполос посредством блока отображения время/частота 200 и вычисляет порог маскирования для каждой субполосы, используя явление маскирования, возникающее в результате взаимодействия с соответствующими сигналами.

Блок квантования 220 квантует сигналы для каждой заданной полосы кодирования, так чтобы шум квантования каждой полосы был меньше порога маскирования. Другими словами, частотные сигналы каждой полосы используются для масштабного квантования, так чтобы уровень шума квантования каждой полосы был меньше порога маскирования, с тем чтобы его нельзя было воспринимать. Квантование выполняется таким образом, что значение отношение "шум - маска", которое представляет собой отношение порога маскирования, вычисляемого блоком 210 психоакустической обработки к шуму, генерируемому на каждой полосе, было меньше или равно 0 дБ. Значение отношения шума к маскированию, меньшее или равное 0 дБ, означает, что порог маскирования выше шума квантования. Другими словами, шум квантования не слышен.

Блок компоновки битов 240 кодирует дополнительную информацию, соответствующую базовому уровню, имеющему самую низкую скорость в битах, и квантованные данные, последовательно кодирует дополнительную информацию, соответствующую следующему уровню от базового уровня, и квантованные данные и выполняет эту процедуру для всех уровней, чтобы сформировать потоки битов. Кодирование квантованных данных соответствующих уровней выполняется на этапах разделения каждых квантованных данных на блоки битов путем представления данных в виде двоичных данных, содержащих одно и то же заданное количество битов, и кодирования разделенных на биты данных последовательно от самой старшей битовой последовательности к самой младшей битовой последовательности, с помощью предварительно определенного способа кодирования. Если цифровые данные состоят из знаковых данных и данных модуля, то блок компоновки битов 240 собирает каждые данные модуля для битов, имеющих один и тот же уровень значимости среди разделенных на биты данных, кодирует их и затем кодирует знаковые данные, соответствующие ненулевым данным модуля из числа кодированных данных модуля. Здесь процедура кодирования для знаковых данных и данных модуля выполняется последовательно от самых старших битов к младшим битам.

Ниже будет описана работа устройства кодирования. Входные аудиосигналы кодируются и генерируются в виде потоков битов. С этой целью входные сигналы преобразуются в сигналы частотной области посредством модифицированного дискретного косинусного преобразования или субполосовой фильтрации в блоке отображения время/частота 200. Блок 210 психоакустической обработки объединяет частотные сигналы с помощью соответствующих субполос, чтобы получить порог маскирования. Субполосы используются в основном для квантования и поэтому называются полосами квантования. Блок квантования 220 выполняет масштабное квантование, так чтобы уровень шума квантования каждой полосы квантования был ниже порога маскирования, то есть является слышимым, но не воспринимается. Если выполняется квантование, удовлетворяющее таким условиям, то генерируются значения размера этапа квантования для соответствующих полос и значения квантуемой частоты.

С точки зрения психоакустики человека близкие частотные составляющие могут легко различаться на более низкой частоте. Однако с ростом частоты интервал различаемых частот становится шире. Как показано в Таблице 1 (см. в конце описания), полоса квантования более низкой частоты - узкая, а более высокой частоты - широкая.

Однако для удобства кодирования полосы квантования, указанные в Таблице 1, не используются для кодирования, а вместо них используются полосы кодирования, имеющие ширину, подобную ширине полос квантования. Другими словами, как показано в Таблице 1, в случае узких полос для получения полосы кодирования объединяются несколько полос квантования. В случае широких полос одна полоса квантования дает одну полосу кодирования. Следовательно, все полосы кодирования подбираются таким образом, чтобы иметь близкую величину.

1. Кодирование в зависимости от значимости данных
Значения знака квантованных значений запоминаются отдельно, а их абсолютные значения берутся для получения данных, представляемых как положительные значения. Среди квантованных значений частот каждой полосы кодирования отыскивается значение, имеющее большое абсолютное значение, и вычисляется количество битов квантования, необходимое для представления сигналов для каждой полосы.

Обычно значимость единичного бита самого старшего разряда гораздо больше, чем значимость единичного бита самого младшего разряда. Однако согласно известному способу кодирование выполняется независимо от значимости. Таким образом, если должны быть использованы только некоторые из головных потоков битов среди всех потоков битов, то в головные потоки битов включается значительный объем информации, менее важной, чем информация, включенная в неиспользуемые хвостовые потоки битов.

По указанной причине в настоящем изобретении квантованные сигналы соответствующих полос кодируются последовательно от старших битов до младших битов. Другими словами, соответствующие квантованные сигналы представляются в двоичной системе счисления, и квантованные значения соответствующих частотных составляющих обрабатываются последовательно блоками битов от низкочастотных составляющих к высокочастотным составляющим. Сначала получают старшие биты соответствующих частотных составляющих, а затем последовательно по одному биту кодируются следующие старшие биты вплоть до младших битов. При таком способе более важная информация кодируется первой, так что потоки битов генерируются с переднего конца.

Предположим, что 8 квантованных значений, каждое из которых имеет 4 бита, представлены в двоичной форме следующим образом (см. схему в конце описания).

Обычно кодируется 1001 самой низкочастотной составляющей, а затем последовательно кодируются 1000, 0101, 0010 (то есть по горизонтали для каждой частотной составляющей). Однако согласно настоящему изобретению последовательно обрабатываются 1, то есть старший бит самой низкочастотной составляющей и 0, 1, 0, 0,.... старшие биты других частотных составляющих посредством объединения по несколько битов. Например, в случае кодирования блоками по 4 бита кодируется 1010, а затем 1000. Если кодирование старших битов завершено, то получают значения следующих старших битов, чтобы затем их кодировать в порядке 0001, 0000,...., вплоть до младших битов. Здесь в качестве способа кодирования может быть использовано кодирование без потерь, такое как кодирование Хаффмена или арифметическое кодирование.

2. Кодирование, включающее бит знака
Обычно бит знака - это старший бит. Таким образом, если кодирование выполняется от старшего бита, то бит знака рассматривается как самая важная информация и кодируется, что может привести к неэффективному кодированию. Другими словами, поскольку значения, квантованные от старшего бита до первого старшего бита, являющегося единичным, рассматриваются как нулевые, их значения знака не имеют смысла. Например, если квантованное значение представляется 5 битами 00011 и при кодировании используются только 3 старших бита, квантованное значение восстанавливается как 00000. Следовательно, даже если это значение имеет бит знака, эта информация окажется бесполезной. Однако, если используются 4 бита из 5 бит, то квантованное значение будет 00010. Таким образом значение знака будет иметь гораздо больший смысл, поскольку значение 1, которое появляется первым в старших битах, означает, что квантованное значение декодируется в значение, отличное от нуля.

При представлении соответствующих частотных составляющих от соответствующих старших битов, если первой появляется 1, а не 0, то значение знака кодируется до кодирования другого значения, в зависимости то того, каково значение знака: положительное или отрицательное. Например, при кодировании старшего бита сначала кодируется 1010, а затем определяется, есть ли необходимость кодирования бита знака. В то же время, поскольку в первой и третьей частотных составляющих сначала кодируется ненулевое значение, биты знака для этих двух составляющих кодируются последовательно, чтобы затем кодировать 0000. Чтобы закодировать младшие биты, кодируется 1100, а затем определяется, необходим ли бит знака. В этом случае первая из двух единиц уже вошла в старший разряд, что означает, что бит знака закодирован. Следовательно, нет необходимости кодировать бит знака. Однако поскольку вторая из двух единиц не появляется в старших битах, то бит знака кодируется. После кодирования бита знака кодируется 0100 младших битов.

3. Улучшенный способ кодирования
При использовании вышеописанного способа кодирования в случае низкой скорости передачи в битах более эффективно изменить порядок кодирования можно следующим образом. Обычно слуховая система человека очень чувствительна к частотным составляющим в контуре, либо положительным, либо отрицательным. При предложенном здесь способе кодирования кодируются только частотные составляющие, имеющие некодированные биты знака, подлежащие восстановлению как 0, в то время как кодирование частотных составляющих, чьи биты знака кодируются, задерживается. После завершения кодирования битов знака таким способом задержанные данные кодируются с помощью вышерассмотренного способа кодирования, который будет подробно описан с использованием ранее рассмотренного примера.

Сначала, коль скоро нет частотной составляющей, имеющей среди старших битов закодированный бит знака, кодируются все старшие биты. Следующими старшими битами являются 0001, 0000,..... Здесь для 0001 первый 0 и третий 0 не кодируются, поскольку биты знака уже кодируются в старших битах, а затем кодируются второй и четвертый биты 0 и 1. Здесь, поскольку среди старших битов нет 1, бит знака для частотной составляющей четвертого бита 1 кодируется. Для 0000, поскольку среди старших битов нет кодированного бита знака, кодируются все четыре бита. Подобным же образом биты знака кодируются вплоть до младших битов, а затем последовательно кодируется остальная некодированная информация от старших битов с использованием вышеописанного способа кодирования.

4. Формирование масштабируемых потоков битов
В настоящем изобретении аудиосигналы кодируются в виде многоуровневых потоков битов, содержащих базовый уровень и несколько уровней расширения. Базовый уровень имеет самую низкую скорость передачи в битах, а уровни расширения имеют более высокую скорость передачи, чем базовый уровень. Верхние уровни расширения имеют более высокие скорости передачи в битах, чем нижние уровни.

В головной части базового уровня представляются только старшие биты, так что кодируется только контур для всех частотных составляющих. Чем больше битов представлено в младших битах, тем более подробная информация может быть выражена. Поскольку значения детальных информационных данных кодируются с возрастающими скоростями передачи, то есть с расширением уровней, качество звука может быть улучшено.

Ниже будет описан способ формирования масштабируемых потоков битов с использованием такого представления данных. Сначала в дополнительной информации, подлежащей использованию для базового уровня, кодируется информация о бите квантования для каждой полосы квантования. Информация квантованных значений кодируется последовательно от старших битов до младших битов и от низкочастотных составляющих к высокочастотным составляющим. Если биты квантования некоторой полосы меньше, чем биты полосы, кодируемой в настоящий момент, то кодирование не выполняется. Если биты квантования полосы равны битам полосы, которая в данный момент кодируется, то кодирование выполняется. Здесь, если нет ограничения полосы при кодировании сигналов соответствующих уровней, то может генерироваться звук, неприятный для слухового восприятия. Причина этого заключается в том, что при восстановлении сигналов уровней, имеющих низкие скорости передачи в битах, сигналы, в случае выполнения кодирования от старших битов до младших битов независимо от полос, то включаются, то отключаются. Следовательно, желательно должным образом ограничить полосы в соответствии со скоростями передачи в битах.

После кодирования базового уровня кодируются дополнительная информация и квантованное значение аудиоданных для следующего уровня расширения. Таким же образом кодируются данные всех уровней. Закодированная таким образом информация собирается вместе, образуя потоки битов.

Как было описано выше, потоки битов, формируемые устройством кодирования, имеют многоуровневую структуру, в которой потоки битов уровней с более низкими скоростями передачи содержатся в потоках битов уровней с более высокими скоростями передачи, как показано на фиг.3. Обычно сначала кодируется дополнительная информация, а затем кодируется остальная информация для формирования потоков битов. Однако в настоящем изобретении, как показано на фиг. 3, дополнительная информация для каждого уровня кодируется отдельно. Также, хотя все квантованные данные обычно кодируются последовательно блоками из выборок, в настоящем изобретении квантованные данные представляются двоичными данными и кодируются от старших битов для формирования потоков битов в пределах допуска на количество битов.

Ниже будет подробно описана работа устройства кодирования. В настоящем изобретении информация для скоростей передачи в битах различных уровней кодируется в потоке битов с многоуровневой структурой, как показано на фиг. 3, начиная от более важных сигнальных составляющих. Используя сформированные таким образом потоки битов, можно сформировать потоки битов, имеющих низкую скорость передачи в битах, посредством простой перестановки потоков с низкими скоростями передачи, содержащихся в потоке битов, который имеет самую высокую скорость передачи в битах, по запросу пользователя или в соответствии с состоянием каналов передачи. Другими словами, потоки битов, формируемые устройством кодирования в реальном времени, или потоки битов, записанные на носителе, могут быть перегруппированы в соответствии с желаемой скоростью передачи в битах по запросу пользователя, для последующей их передачи. Также, если рабочие характеристики аппаратуры пользователя неудовлетворительны или пользователь хочет уменьшить сложность декодера даже при подходящих потоках битов, только некоторые потоки битов могут быть восстановлены, что позволяет контролировать сложность декодера.

Например, при формировании масштабируемого потока битов скорость передачи в битах базового уровня составляет 16 кбит/с, скорость передачи верхнего уровня составляет 64 кбит/с, а соответствующие уровни расширения имеют интервал скорости передачи в битах, составляющий 8 кбит/с, то есть поток имеет 7 уровней: 16, 24, 32, 40, 48, 56 и 64 кбит/с. Поскольку поток битов, формируемый устройством кодирования, имеет многоуровневую структуру, как показано на фиг.3, поток битов верхнего уровня 64 кбит/с содержит потоки битов соответствующих уровней расширения (16, 24, 32, 40, 48, 56 и 64 кбит/с). Если пользователь запрашивает данные для верхнего уровня, поток битов для верхнего уровня передается без какой-либо его обработки. Также, если другой пользователь запрашивает данные для базового уровня (соответствующего 16 кбит/с), то передаются только головные потоки битов.

Соответствующие уровни имеют ограниченные по ширине полосы в соответствии со скоростями передачи в битах, как показано в Таблице 4 (см. в конце описания), а конечные полосы квантования различаются. Входные данные представляют собой данные ИКМ с частотой выборки 48 кГц, а величина одного кадра составляет 1024. Количество битов, используемых для одного кадра для скорости передачи 64 кбит/с, составляет в среднем 1365.333 (=64000 бит/с* (1024 / 48000)).

Подобным же образом в соответствии с соответствующими скоростями передачи в битах может быть вычислено количество битов, используемых для одного кадра, как показано в Таблице 3 (см. в конце описания).

Перед квантованием сначала из входных данных с использованием психоакустической модели генерируются тип группы кадра, обрабатываемого в данные момент (длинная, начальная, короткая или стоп), значения отношения сигнала к маскированию соответствующих полос обработки, секционированная информация короткой группы и данные ИКМ с временной задержкой для синхронизации отображения время / частота с психоакустической моделью, а затем передаются в блок отображения время / частота. Для расчета психоакустической модели используется Модель 2 ISO/IES 11172-3.

Блок отображения время / частота преобразует данные временной области в данные частотной области, используя MDCT в соответствии с выходным сигналом типа группы с использованием психоакустической модели. В то же время размеры группы составляют соответственно 2048 и 256 в случае длинных /начальных/ стоп-групп и в случае короткой группы, а MDCT выполняется 8 раз. Здесь использовалась та же самая процедура, что и в известном MPEG-2 NBC.

Данные, преобразованные в данные частотной области, квантуются с возрастающим размером шага, так что значение отношения сигнал/шум полосы квантования, показанной в Таблице 1, меньше, чем отношение сигнала к маскированию в качестве выходного значения психоакустической модели. Здесь выполняется масштабное квантование, и размер базового шага квантования составляет 21/4. Квантование выполняется так, чтобы отношение шума к маскированию было равно или больше 0 дБ. Здесь получаемый результат соответствует информации для размеров шага квантования для соответствующих полос обработки. Для кодирования квантованных сигналов отыскиваются их абсолютные значения для соответствующих полос кодирования, а затем вычисляется наибольший бит квантования, необходимый для кодирования.

Для синхронизации сигналов потоков битов к потокам битов добавляется 12 битов, чтобы получить информацию для начала потоков битов. Затем кодируется величина всех потоков битов. Кодируется информация для потока битов с самой большой скоростью передачи из числа кодированных потоков битов. Эта информация используется при создании потоков битов с более низкими скоростями передачи. Если запрашивается более высокая скорость передачи в битах, то ни один дополнительный бит не может быть передан. Затем должен кодироваться тип группы. Процесс последовательного кодирования может несколько отличаться в зависимости от типа группы. Для кодирования входных сигналов кадра в соответствии с характеристиками сигнала преобразованию может подвергаться либо длинная группа, либо 8 более коротких групп. Поскольку при таком способе размер группы изменяется, то кодирование несколько отличается.

Сначала, в случае длинной группы, поскольку ширина полосы базового уровня составляет 4 кГц, полосы обработки простираются до 12-ой полосы квантования. Теперь из битовой информации, заранее выделенной каждой полосе кодирования, получают максимальное значение бита квантования, и кодирование выполняется от максимального значения бита квантования с помощью ранее описанного способа кодирования. Затем последовательно кодируются следующие квантованные биты. Если биты квантования некоторой полосы меньше, чем биты квантования полосы, кодируемой в данный момент, то кодирование не выполняется. Если биты квантования полосы равны битам квантования полосы, кодируемой в данный момент, то кодирование выполняется. При кодировании полосы первый раз кодируется информация о размере шага квантования полосы квантования, а затем отбираются значения, соответствующие битам квантования квантуемых частотных составляющих, для последующего кодирования. Поскольку скорость передачи в битах нижнего уровня составляет 16 бит/с, то битовый допуск в целом составляет 336 битов. Таким образом непрерывно вычисляется общее количество используемых битов, и кодирование прекращается в тот момент, когда количество битов превысит 336. Для кодирования информации о битах квантования или размере шага квантования получают минимальное и максимальное значения бита квантования или размера шага квантования, чтобы получить затем разность между этими двумя значениями, в результате чего получается количество необходимых битов. На практике перед кодированием дополнительной информации сначала с помощью арифметического кодирования кодируются минимальное значение и величина, необходимая для представления битов, а затем они запоминаются в потоках битов. Если кодирование в действительности выполняется позже, то кодируется разница между минимальным значением и дополнительной информацией. Затем последовательно кодируются следующие квантованные сигналы.

Подобным же образом 8 коротких групп, получаемых путем деления длинной группы, имеющих одну восьмую величины длинной группы, подвергаются отображению время/частота и квантованию, а затем для квантованных данных выполняется кодирование без потерь. Здесь квантование не выполняется отдельно для каждой из 8 групп. Вместо этого с использованием информации, подаваемой из блока психоакустической обработки для 8 групп, разделенных на 3 секции, собираются полосы квантования в этих секциях, как показано в таблице 2 (см. в конце описания), чтобы их затем обработать как одну полосу в длинной группе. Таким образом может быть получена информация о размере шага квантования для каждой полосы в этих трех секциях. Для согласования ширины полосы базового уровня с шириной для длинной группы полосы ограничиваются в диапазоне вплоть до четвертой полосы. Поскольку короткая группа имеет 8 подгрупп, как показано в Таблице 2 (см. в конце описания), одна подгруппа делится на полосы кодирования в блоках из 4 выборок. Полосы кодирования из 8 подгрупп объединяются и информация о бите квантования получается из 32 квантованных сигналов. Сначала кодируется информация о бите квантования в ограниченной полосе. Затем в составляющих ограниченной полосы получают максимальный бит квантования и выполняется кодирование с помощью вышеописанного способа кодирования, как в длинной группе. Если бит квантования некоторой полосы меньше, чем бит, кодируемый в данный момент, то кодирование не выполняется. Если бит квантования некоторой полосы становится равным биту квантования, кодируемому в данный момент, то кодирование выполняется. Когда полоса кодируется, то сначала кодируется информация о размере шага для полосы квантования, а затем для последующего кодирования отбираются значения, соответствующие битам квантования из числа квантованных частотных составляющих.

После того, как сформированы все потоки битов для базового уровня (16 кбит/с), формируются все потоки битов для следующего уровня (24 кбит/с). Поскольку ширина полосы уровня 24 кбит/с составляет 8 кГц, кодируются частотные составляющие полос вплоть до 19-й. Поскольку дополнительная информация полос вплоть до 19-й уже записана, то записывается дополнительная информация только для полос с 13-й по 19-ую. В нижнем уровне для получения максимального бита квантования сравниваются некодированные биты квантования для каждой полосы и биты квантования вновь добавленной полосы. Кодирование выполняется от максимального бита квантования тем же способом, как и в базовом уровне. Если общее количество используемых битов больше, чем используемое количество битов при 24 кбит/с, то кодирование прекращается, и выполняется подготовка для формирования потоков битов следующего уровня. Таким способом могут быть сформированы потоки битов для остальных уровней 32, 40, 48, 56 и 64 кбит/с. Сформированные таким способом потоки битов будут иметь такую же структуру, что и на фиг.3.

Теперь будет подробно рассмотрено устройство декодирования для декодирования потоков битов, генерируемых устройством кодирования. Фиг.4 представляет собой блок-схему устройства кодирования, которая включает в себя блок анализа потока битов 400, блок обратного квантования 410 и блок отображения частота/время 420.

Блок анализа потока битов 400 декодирует дополнительную информацию, имеющую, по меньшей мере, биты квантования и размер шага квантования, и квантованные данные в порядке генерации потоков битов, имеющих многоуровневую структуру, от старших к младшим битам для соответствующих уровней путем анализа значимости битов, образующих потоки. Блок обратного квантования 410 восстанавливает декодированный размер шага квантования и квантованные данные в сигналы, имеющие исходные уровни. Блок отображения частота/время 420 осуществляет обратное преобразование квантованных сигналов в сигналы временной области, так чтобы пользователь их мог воспроизвести.

Далее будет описана работа устройства декодирования. Порядок декодирования потоков битов, генерируемых устройством кодирования, является обратным порядку кодирования. Кратко опишем процесс декодирования. Сначала из дополнительной информации базового уровня декодируется информация о бите квантования каждой полосы квантования. Из числа декодированных битов квантования получают максимальное значение. Квантованные значения декодируются последовательно от старших битов до младших битов и от низкочастотных составляющих к высокочастотным составляющим, как в процессе кодирования. Если бит квантования некоторой полосы меньше, чем декодируемый в данный момент бит квантования, декодирование не выполняется. Если бит квантования некоторой полосы становится равным биту, декодируемому в данный момент, то декодирование выполняется. Когда сигналы некоторой полосы квантования сначала декодируются в ходе декодирования квантованных значений, коль скоро информация о размере шага для полосы квантования записана в потоке битов, то сначала кодируется эта информация, а затем непрерывно кодируются значения, соответствующие битам квантования.

После завершения декодирования потоков битов для базового уровня декодируются дополнительная информация и квантованные значения аудиоданных для следующего уровня. Таким способом могут быть декодированы данные всех уровней. Данные, квантованные в процессе декодирования, восстанавливаются в виде исходных сигналов, проходя через блок обратного квантования 410 и блок отображения частота/время 420, как показано на фиг.4, в порядке, обратном порядку кодирования.

Как было описано выше, согласно настоящему изобретению для удовлетворения запросов различных пользователей формируются гибкие потоки битов. Другими словами, по запросу пользователя информация для скоростей передачи в битах различных уровней комбинируется с одним потоком битов без перекрытия, тем самым обеспечивая потоки битов с хорошим качеством звука. Также нет необходимости иметь преобразователь между передающим терминалом и приемным терминалом. Кроме того, система может приспособиться к любому состоянию каналов передачи и различным запросам пользователей. Поскольку потоки битов являются масштабируемыми, один поток битов может содержать различные потоки битов, имеющие несколько скоростей передачи в битах. Следовательно, можно просто генерировать потоки битов различных уровней. Также в настоящем изобретении, после того как один раз выполняется квантование, так чтобы отношение шума к маскированию было меньше или равно 0 дБ, нет необходимости в контроллере с большой разрядностью. Следовательно, устройство кодирования получается несложным.

Также, поскольку кодирование выполняется в соответствии со значимостью битов квантования, вместо выполнения кодирования после обработки различия между квантованными сигналами предыдущего уровня и исходным сигналом для каждого уровня, сложность устройства кодирования уменьшается.

Кроме того, поскольку дополнительная информация для соответствующих полос используется только раз во всех потоках битов, качество звука может быть улучшено. Если скорость передачи в битах низкая из-за ограниченных полос, то сложность фильтра, который является главной причиной сложного кодирования и декодирования, значительно уменьшается. Соответственно уменьшается сложность устройства кодирования и декодирования. Также в соответствии с рабочими характеристиками декодеров пользователей и шириной полосы/перегрузкой каналов передачи или по запросу пользователя могут задаваться скорости передачи данных в битах или сложность устройств кодирования/декодирования.

Похожие патенты RU2214047C2

название год авторы номер документа
СПОСОБ И УСТРОЙСТВО ДЛЯ МАСШТАБИРУЕМОГО КОДИРОВАНИЯ/ДЕКОДИРОВАНИЯ АУДИОСИГНАЛОВ 1997
  • Ким Йеон-Бае
RU2224302C2
СПОСОБ И УСТРОЙСТВО МАСШТАБИРОВАННОГО КОДИРОВАНИЯ И ДЕКОДИРОВАНИЯ ЗВУКА 1998
  • Парк Сунг-Хи
  • Ким Йеон-Бае
RU2185024C2
СПОСОБ И УСТРОЙСТВО МАСШТАБИРУЕМОГО КОДИРОВАНИЯ-ДЕКОДИРОВАНИЯ СТЕРЕОФОНИЧЕСКОГО ЗВУКОВОГО СИГНАЛА (ВАРИАНТЫ) 1998
  • Парк Сунг-Хи
  • Ким Еон-Бае
RU2197776C2
СПОСОБЫ КОДИРОВАНИЯ/ДЕКОДИРОВАНИЯ ЦИФРОВЫХ ДАННЫХ АУДИО/ВИДЕО СИГНАЛОВ И УСТРОЙСТВА ДЛЯ ИХ ОСУЩЕСТВЛЕНИЯ 1997
  • Парк Сунг-Хии
  • Ким Йеон-Бае
  • Син Дзае-Сеоб
RU2194361C2
СПОСОБ И УСТРОЙСТВО КОДИРОВАНИЯ АУДИОСИГНАЛА С ИСПОЛЬЗОВАНИЕМ ИЗВЛЕЧЕНИЯ ГАРМОНИК 2002
  • Ха Хо-Дзин
RU2289858C2
СПОСОБ И УСТРОЙСТВО ДЛЯ МАСШТАБИРУЕМОГО ПО ЦВЕТОВОМУ ПРОСТРАНСТВУ ВИДЕОКОДИРОВАНИЯ И ДЕКОДИРОВАНИЯ 2006
  • Ча Санг-Чанг
  • Мэтью Ману
  • Ли Кио-Хиук
RU2316909C2
УСТРОЙСТВО И СПОСОБ ОСНОВАННОГО НА КОНТЕКСТЕ АРИФМЕТИЧЕСКОГО КОДИРОВАНИЯ И УСТРОЙСТВО И СПОСОБ ОСНОВАННОГО НА КОНТЕКСТЕ АРИФМЕТИЧЕСКОГО ДЕКОДИРОВАНИЯ 2010
  • Чоо Ки Хиун
  • Ким Дзунг-Хое
  • Ох Еун Ми
RU2493652C2
УСТРОЙСТВО И СПОСОБ ДЛЯ КОДИРОВАНИЯ/ДЕКОДИРОВАНИЯ ДЛЯ РАСШИРЕНИЯ ДИАПАЗОНА ВЫСОКИХ ЧАСТОТ 2011
  • Чоо Ки-Хиун
  • Ох Еун-Ми
  • Сунг Хо-Санг
RU2575680C2
СПОСОБ МАСШТАБИРУЕМОГО КОДИРОВАНИЯ И ДЕКОДИРОВАНИЯ ВИДЕОСИГНАЛА И УСТРОЙСТВО ДЛЯ ЕГО ОСУЩЕСТВЛЕНИЯ 2004
  • Хан Воо-Дзин
RU2329615C2
СИСТЕМА КОДИРОВАНИЯ ВИДЕОДАННЫХ И СИСТЕМА ДЕКОДИРОВАНИЯ ВИДЕОДАННЫХ 2004
  • Парк Дзеонг-Хоон
RU2341911C2

Иллюстрации к изобретению RU 2 214 047 C2

Реферат патента 2003 года СПОСОБ И УСТРОЙСТВО ДЛЯ МАСШТАБИРУЕМОГО КОДИРОВАНИЯ/ДЕКОДИРОВАНИЯ АУДИОСИГНАЛОВ

Изобретение относится к кодированию и декодированию аудиосигналов, в частности к масштабируемому кодированию, декодированию аудиосигналов для многоуровневых потоков битов путем представления данных различных уровней расширения на основе базового уровня внутри потока битов. Технический результат - повышение эффективности кодирования аудиосигналов. Способ кодирования включает в себя следующие этапы: (а) обработка входных аудиосигналов и их квантование для каждой предварительно определенной полосы кодирования, (b) кодирование квантованных данных, соответствующих базовому уровню, в пределах предварительно определенного размера уровня, (c) кодирование квантованных данных, соответствующих следующему уровню расширения кодированного базового уровня и остальных некодированных и принадлежащих кодируемому уровню квантованных данных в пределах предварительно определенного размера уровня, и (d) последовательное выполнение этапов кодирования уровня для всех уровней, в котором каждый из этапов (b), (с) и (d) включает этапы: (е) представление квантованных данных, соответствующих уровню, подлежащему кодированию, цифрами из одного и того же предварительно определенного количества, и (f) кодирование самых старших цифровых последовательностей, образованных из самых старших цифр данных модуля, составляющих представляемые цифровые данные. Способ может адаптироваться к запросам различных пользователей и каналам передачи, а сложность кодера и декодера могут быть уменьшены. Также в соответствии с рабочими характеристиками декодеров или шириной полосы/перегрузкой каналов передачи, или по запросам пользователей могут задаваться скорость передачи в битах или сложность устройств кодирования/декодирования. 3 с. и 35 з.п. ф-лы, 5 ил., 4 табл.

Формула изобретения RU 2 214 047 C2

1. Способ масштабируемого кодирования аудиосигналов для кодирования аудиосигналов в многоуровневый поток данных, имеющий базовый уровень и предварительно определенное количество уровней расширения, отличающийся тем, что содержит следующие этапы: (а) квантование входных аудосигналов для каждой предварительно определенной полосы кодирования; (b) кодирование квантованных данных, соответствующих базовому уровню, в пределах предварительно определенного размера уровня; (с) кодирование квантованных данных, соответствующих следующему уровню расширения кодированного базового уровня, и некодирование остальных квантованных данных, принадлежащих кодируемому уровню, в пределах предварительно определенного размера уровня и (d) последовательное выполнение этапов кодирования уровня для всех уровней, в котором каждый из этапов (b), (с) и (d) содержит следующие этапы: (е) представление квантованных данных, соответствующих уровню, подлежащему кодированию, с помощью предварительно определенного количества цифр и (f) кодирование самых старших цифровых последовательностей, образованных из самых старших цифр данных модуля, упомянутых квантованных обработанных входных аудиосигналов. 2. Способ масштабируемого кодирования аудиосигналов по п.1, отличающийся тем, что этапы (е) и (f) выполняются последовательно от низкой частоты к высокой частоте. 3. Способ масштабируемого кодирования аудиосигналов по п.1, отличающийся тем, что этапы (b), (с) и (d) выполняются над дополнительной информацией, имеющей, по меньшей мере, информацию о размере шага квантования и информацию о бите квантования, выделенные каждой полосе, с помощью предварительно определенного способа кодирования. 4. Способ масштабируемого кодирования аудиосигналов по п.1 или 3, отличающийся тем, что цифры, используемые на этапах (е) и (f), представляют собой биты. 5. Способ масштабируемого кодирования аудиосигналов по п.4, отличающийся тем, что кодирование на этапе (f) выполняют путем объединения битов, образующих битовые последовательности, в блоки с заданным количеством битов. 6. Способ масштабируемого кодирования аудиосигналов по п.4, отличающийся тем, что предварительно определенный способ кодирования представляет собой способ кодирования без потерь. 7. Способ масштабируемого кодирования аудиосигналов по п.5, отличающийся тем, что предварительно определенный способ кодирования представляет собой способ кодирования без потерь. 8. Способ масштабируемого кодирования аудиосигналов по п.6 или 7, отличающийся тем, что кодирование без потерь представляет собой кодирование Хаффмена. 9. Способ масштабируемого кодирования аудиосигналов по п.6 или 7, отличающийся тем, что кодирование без потерь представляет собой арифметическое кодирование. 10. Способ масштабируемого кодирования аудиосигналов по п.1, отличающийся тем, что если квантованные данные состоят из данных знака и данных модуля, этап (f) содержит следующие этапы: i) кодирование самых старших цифровых последовательностей, составленных из самых старших цифр данных модуля, образующих представленные цифровые данные, с помощью предварительно определенного способа кодирования, ii) кодирование данных знака, соответствующих ненулевым данным из числа кодированных самых старших цифровых последовательностей, iii) кодирование самых старших цифровых последовательностей из числа некодированных данных модуля цифровых данных с помощью предварительно определенного способа кодирования, iv) кодирование некодированных данных знака из данных знака, соответствующих ненулевым данным модуля из числа цифровых последовательностей, закодированных на этапе (iii), и v) выполнение этапов (iii) и (iv) над соответствующими цифрами цифровых данных. 11. Способ масштабируемого кодирования аудиосигналов по п.10, отличающийся тем, что этап (е) состоит в представлении цифровых данных в виде двоичных данных, имеющих одно и то же количество битов, а цифры представляют собой биты. 12. Способ масштабируемого кодирования аудиосигналов по п.10, отличающийся тем, что этапы кодирования выполняются путем объединения битов, образующих соответствующие битовые последовательности для данных модуля и данных знака, в блоки с предварительно определенным количеством битов. 13. Способ масштабируемого кодирования аудиосигналов по п.11 или 12, отличающийся тем, что предварительно определенный способ кодирования представляет собой арифметическое кодирование. 14. Способ масштабируемого кодирования аудиосигналов по п.10, отличающийся тем, что этапы (b), (с) и (d) кодирования выполняются над дополнительной информацией, имеющей, по меньшей мере, информацию о размере шага квантования и информацию о бите квантования, выделенные каждой полосе, с помощью предварительно определенного способа кодирования. 15. Способ масштабируемого кодирования аудиосигналов по п.1 или 10, отличающийся тем, что квантование выполняют посредством следующих этапов: преобразование входных аудиосигналов временной области в сигналы частотной области, объединение преобразованных сигналов в виде сигналов предварительно определенных субполос посредством отображения время/частота и вычисление порога маскирования для каждой субполосы и квантование сигналов для каждой предварительно определенной полосы кодирования так, чтобы шум квантования каждой полосы был меньше порога маскирования. 16. Способ масштабируемого кодирования аудиосигналов для кодирования аудиосигналов в многоуровневый поток данных, имеющий базовый уровень и предварительно определенное количество уровней расширения, отличающийся тем, что содержит следующие этапы: (а) обработка входных аудиосигналов и их квантование для каждой предварительно определенной полосы кодирования; (b) кодирование квантованных данных первого диапазона частот, соответствующих базовому уровню, в пределах предварительно определенного размера уровня; (с) кодирование квантованных данных второго диапазона частот, соответствующих следующему уровню расширения, в пределах предварительно определенного размера уровня, и (d) последовательное выполнение этапов кодирования уровня для всех уровней, в котором каждый из этапов (b), (с) и (d) содержит следующие этапы: (е) представление квантованных данных, соответствующих уровню, подлежащему кодированию, с помощью одного и того же предварительно определенного количества цифр и (f) кодирование самых старших цифровых последовательностей, образованных из самых старших цифр данных модуля, образующих представленные цифровые данные. 17. Способ масштабируемого кодирования аудиосигналов по п.16, отличающийся тем, что упомянутый второй диапазон частот включает в себя частоты, отличные от упомянутого первого диапазона частот, причем самые старшие цифры квантованных данных упомянутых частот, отличающиеся от упомянутого первого диапазона частот, кодируют до кодирования следующих по старшинству цифр квантованных данных, принадлежащих соответствующему уровню расширения. 18. Способ масштабируемого кодирования аудиосигналов по п.17, отличающийся тем, что этапы (е) и (f) выполняют последовательно от более низкой частоты к более высокой частоте для цифр, имеющих одну и ту же степень старшинства. 19. Способ масштабируемого кодирования аудиосигналов по п.17, отличающийся тем, что этапы (b), (с) и (d) выполняются над дополнительной информацией, имеющей, по меньшей мере, информацию о размере шага квантования и информацию о бите квантования, выделенные каждой полосе, с помощью предварительно определенного способа кодирования. 20. Способ масштабируемого кодирования аудиосигналов по п.18, отличающийся тем, что цифры, используемые на этапах (е) и (f), представляют собой биты. 21. Способ масштабируемого кодирования аудиосигналов по п.19, отличающийся тем, что цифры, используемые на этапах (е) и (f), представляют собой биты. 22. Способ масштабируемого кодирования аудиосигналов по п.21, отличающийся тем, что кодирование на этапе (f) выполняют путем объединения битов, образующих битовые последовательности, в блоки с заданным количеством битов. 23. Способ масштабируемого кодирования аудиосигналов по п.21, отличающийся тем, что предварительно определенный способ кодирования представляет собой способ кодирования без потерь. 24. Способ масштабируемого кодирования аудиосигналов по п.22, отличающийся тем, что предварительно определенный способ кодирования представляет собой способ кодирования без потерь. 25. Способ масштабируемого кодирования аудиосигналов по п.23, отличающийся тем, что кодирование без потерь представляет собой кодирование Хаффмена. 26. Способ масштабируемого кодирования аудиосигналов по п.24, отличающийся тем, что кодирование без потерь представляет собой кодирование Хаффмена. 27. Способ масштабируемого кодирования аудиосигналов по п.23, отличающийся тем, что кодирование без потерь представляет собой арифметическое кодирование. 28. Способ масштабируемого кодирования аудиосигналов по п.24, отличающийся тем, что кодирование без потерь представляет собой арифметическое кодирование. 29. Способ масштабируемого кодирования аудиосигналов по п.16, отличающийся тем, что если квантованные данные состоят из данных знака и данных модуля, этап (f) содержит следующие этапы: i) кодирование самых старших цифровых последовательностей, составленных из самых старших цифр данных модуля, образующих представляемые цифровые данные, с помощью предварительно определенного способа кодирования, ii) кодирование данных знака, соответствующих ненулевым данным из числа кодированных самых старших цифровых последовательностей, iii) кодирование самых старших цифровых последовательностей из числа некодированных данных модуля цифровых данных с помощью предварительно определенного способа кодирования, iv) кодирование некодированных данных знака из данных знака, соответствующих ненулевым данным модуля из цифровых последовательностей, закодированных на этапе (iii), и v) выполнение этапов (iii) и (iv) для соответствующих цифр цифровых данных. 30. Способ масштабируемого кодирования аудиосигналов по п.29, отличающийся тем, что этап (е) состоит в представлении цифровых данных в виде двоичных данных, имеющих одно и то же количество битов, а цифры представляют собой биты. 31. Способ масштабируемого кодирования аудиосигналов по п.29, отличающийся тем, что этапы кодирования выполняются путем объединения битов, образующих соответствующие битовые последовательности для данных модуля и данных знака, в блоки с предварительно определенным количеством битов. 32. Способ масштабируемого кодирования аудиосигналов по п.30, отличающийся тем, что предварительно определенный способ кодирования представляет собой арифметическое кодирование. 33. Способ масштабируемого кодирования аудиосигналов по п.31, отличающийся тем, что предварительно определенный способ кодирования представляет собой арифметическое кодирование. 34. Способ масштабируемого кодирования аудиосигналов по п.33, отличающийся тем, что упомянутый второй диапазон частот включает в себя частоты, отличные от упомянутого первого диапазона частот, причем самые старшие цифры квантованных данных упомянутых частот, отличающиеся от упомянутого первого диапазона частот, кодируют до кодирования следующих по старшинству цифр квантованных данных, принадлежащих соответствующему уровню расширения. 35. Способ масштабируемого кодирования аудиосигналов по п.29, отличающийся тем, что этапы (b), (с) и (d) выполняются над дополнительной информацией, имеющей, по меньшей мере, информацию о размере шага квантования и информацию о бите квантования, выделенные каждой полосе, с помощью предварительно определенного способа кодирования. 36. Способ масштабируемого кодирования аудиосигналов по п.16, отличающийся тем, что квантование выполняют посредством следующих этапов: преобразование входных аудиосигналов временной области в сигналы частотной области, объединение преобразованных сигналов в виде сигналов предварительно определенных субполос посредством отображения время/частота и вычисление порога маскирования для каждой субполосы, и квантование сигналов для каждой предварительно определенной полосы кодирования так, чтобы шум квантования каждой полосы был меньше порога маскирования. 37. Способ масштабируемого кодирования аудиосигналов по п.29, отличающийся тем, что квантование выполняют посредством следующих этапов: преобразование входных аудиосигналов временной области в сигналы частотной области, объединение преобразованных сигналов в виде сигналов предварительно определенных субполос посредством отображения время/частота и вычисление порога маскирования для каждой субполосы, и квантование сигналов для каждой предварительно определенной полосы кодирования так, чтобы шум квантования каждой полосы был меньше порога маскирования. 38. Способ масштабируемого декодирования аудиосигналов для декодирования кодированного многоуровневого потока данных, имеющего базовый уровень и предварительно определенное количество уровней расширения, в аудиосигналы, отличающийся тем, что включает следующие этапы: (а) декодирование кодированного базового уровня первого диапазона частот, имеющего предварительно определенный размер уровня, в квантованные данные, (b) декодирование кодированного следующего уровня расширения второго диапазона частот, имеющего предварительно определенный размер уровня, в квантованные данные, (с) последовательное выполнение этапов декодирования уровня для всех уровней, (d) деквантование упомянутых квантованных данных в упомянутые аудиосигналы, причем каждый из этапов (а), (b) и (с) содержит этапы, (е) определение количества квантованных цифр каждой квантованной полосы, и (f) декодирование кодированных данных в виде самых старших цифровых последовательностей, которые представляют собой модуль упомянутых квантованных данных, причем количество квантованных цифр соответствующей полосы квантования равно одному и тому же количеству.

Документы, цитированные в отчете о поиске Патент 2003 года RU2214047C2

Способ размножения копий рисунков, текста и т.п. 1921
  • Левенц М.А.
SU89A1
УСТРОЙСТВО ДЛЯ СЖАТИЯ ДАННЫХ (ВАРИАНТЫ) 1994
  • Михайлов Б.А.
RU2093957C1
Система для передачи и приема информации кодом переменной длины 1983
  • Финаев Валерий Иванович
  • Горбиков Владимир Николаевич
SU1124436A1
US 5392037 А, 21.02.1995
US 5034965 А, 23.07.1991
US 4933762 А, 12.06.1990.

RU 2 214 047 C2

Авторы

Парк Сунг-Хии

Даты

2003-10-10Публикация

1997-12-30Подача