Настоящее изобретение относится к способу и устройству для кодирования звукового сигнала или множества звуковых сигналов, в которых кодированные сигналы, сформированные на основе звукового сигнала или сигналов соответственно путем кодирования с низким качеством и с низкой скоростью передачи битов в секунду и, возможно, вместе с высококачественными сигналами с высокой скоростью передачи битов подаются на декодер для декодирования на выбор с низким или высоким качеством.
Хотя масштабируемые системы кодирования звуковых сигналов разрабатываемого стандарта MPEG-4 в настоящее время еще не используются, масштабируемость является необходимым условием обеспечения функционирования будущего стандарта MPEG-4, разработанного Международной организацией по стандартизации (ISO).
Под масштабируемостью, как правило, понимается возможность декодирования частичного пакета данных из потока битов, представляющего кодированный звуковой сигнал, используемый для формирования полезного сигнала. Это свойство особенно желательно, когда, например, канал передачи данных не предоставляет всю ширину полосы частот для передачи полного потока двоичных разрядов. Другим примером является неполное декодирование в декодере низкого уровня сложности. Хотя непрерывная и полная масштабируемость является желательной, практическое применение находят и различные дискретные уровни масштабируемости.
Таким образом, масштабируемость различного типа является составной частью перечня требований для будущего нового стандарта MPEG-4 звуковых частот.
Первые предложения по масштабируемой системе скорости передачи битов были описаны X. Бранденбургом и Б. Гриллем в 1994 году в докладе "First Ideas on Scalable Audio Coding" ("Основы масштабируемого аудиокодирования") на 9-ом съезде Американского электротехнического общества, Сан-Франциско, 1995 г., препринт 3924.
В способе, описываемом в этой технической публикации, звуковой сигнал кодируется сначала в полной полосе частот посредством самого внутреннего, так называемого "слоя", который создается звуковым кодеком, работающим с низкой частотой дискретизации. Разностный сигнал, формируемый путем вычитания декодируемого сигнала самого внутреннего уровня из начального или первичного сигнала, затем кодируется в дополнительном звуковом кодере или с помощью двух каскадных звуковых кодеров, работающих на том же принципе. Конкретные кодированные сигналы подаются на декодер в общем потоке битов.
Основной недостаток этой предложенной, но пока еще не внедренной технологии можно увидеть в том, что для кодирования сигнала ниже 10 кбит/с и получения приемлемых результатов в первом каскаде необходимо использовать частоту дискретизации 8 кГц.
Следовательно, общая задержка системы может быть порядка одной секунды или даже больше.
Используя это предшествующее техническое решение, целью настоящего изобретения является разработка способа кодирования вышеописанного типа с тем, который снижает задержку передачи сигнала, вызываемую кодированием.
Эта цель достигается способом в соответствии с пунктом 1 или пунктом 2 патентной формулы.
В соответствии с первым аспектом изобретения оно обеспечивает способ кодирования, по меньшей мере, одного звукового сигнала, содержащий следующие операции:
- формирование первого кодированного сигнала путем кодирования звукового сигнала с низкой скоростью передачи битов и малой задержкой по сравнению с задержкой при кодировании звукового сигнала с высоким качеством и
- передачу первого кодированного сигнала на декодер перед передачей, по меньшей мере, одного дополнительного кодированного сигнала на декодер, который один или вместе с первым кодированным сигналом обеспечивает высокое качество декодированного сигнала после декодирования.
В соответствии со вторым аспектом изобретения разработан способ кодирования, по меньшей мере, одного звукового сигнала, в котором кодированные сигналы, полученные, по меньшей мере, из одного звукового сигнала, путем кодирования с низким качеством и низкой скоростью передачи битов и, на выбор, с высоким качеством и высокой скоростью передачи, передаются на декодер для их декодирования, причем указанный способ включает следующие операции:
- формирование первого кодированного сигнала путем кодирования звукового сигнала с низкой скоростью передачи битов и малой задержкой по сравнению с задержкой при кодировании звукового сигнала с высоким качеством;
- формирование второго кодированного сигнала путем кодирования указанного звукового сигнала или, по меньшей мере, одного дополнительного сигнала, сформированного из звукового сигнала, с высокой скоростью передачи битов, причем второй кодированный сигнал, один или вместе с первым кодированным сигналом, обеспечивает высокое качество сигнала после декодирования;
- подачу первого кодированного сигнала на декодер;
- если требуется декодирование с высоким качеством, второй кодированный сигнал подается на декодер после передачи первого кодированного сигнала на декодер.
По способу согласно изобретению осуществляется передача звуковых данных с низким качеством, но с малой задержкой этих данных, фактически с задержкой только первой операции кодирования, т.е. передачу данных с задержкой, которая значительно ниже, чем задержка общей системы.
Декодер на стороне приемника может также формировать высококачественный декодируемый сигнал с общей задержкой, требуемой системой. Если достаточны низкокачественные декодированные сигналы с малой задержкой, достаточно передать на приемник только первый кодированный сигнал.
На основе упомянутого известного уровня еще одной целью настоящего изобретения является разработка устройства кодирования вышеописанного типа, в котором обеспечено уменьшение задержки, вызванной кодированием.
Эта цель достигается в устройстве в соответствии с пунктом 9 или 10 патентной формулы. В соответствии с третьим аспектом изобретения разработано устройство для декодирования, по меньшей мере, одного звукового сигнала для формирования кодированных сигналов с низким качеством и низкой скоростью передачи битов и, как вариант, дополнительно с высоким качеством и высокой скоростью передачи битов, причем указанное устройство содержит:
- первое кодирующее средство для формирования первого кодированного сигнала путем кодирования звукового сигнала с низкой скоростью передачи битов и малой задержкой по сравнению с задержкой при кодировании звукового сигнала с высоким качеством;
- первый декодер, получающий первый кодированный сигнал;
- первую цепь задержки, имеющей задержку, соответствующую задержке первого кодирующего средства, и первый декодер;
- сумматор, устанавливающий разницу во времени между выходными сигналами первого декодера и первой цепью задержки;
- второе кодирующее средство для формирования второго кодированного сигнала путем кодирования звукового сигнала или, по меньшей мере, одного дополнительного сигнала, полученного из звукового сигнала с высокой скоростью передачи битов со вторым кодированным сигналом в единственном числе или вместе с первым кодированным сигналом, обеспечивая декодированный сигнал с высоким качеством после декодирования;
- каскад принятия решений, который подает на второе кодирующее средство либо звуковой сигнал, задержанный во времени первой цепью задержки, либо разностный сигнал времени, сформированный сумматором;
- мультиплексор потока битов, на который подается первый кодированный сигнал.
В соответствии с четвертой целью изобретения разработано кодирующее устройство для кодирования, по меньшей мере, одного звукового сигнала для формирования кодированных сигналов низкого качества и с низкой скоростью передачи битов и, как вариант и дополнительно, с высоким качеством и высокой скоростью передачи битов, причем указанное устройство содержит:
- средство для преобразования звукового сигнала в спектральную область;
- первый каскад квантования и кодирования для формирования первого квантованного сигнала со сравнительно низкой скоростью передачи битов;
- каскад повторного квантования, подключенный за первой ступенью квантования и кодирования;
- спектральный сумматор, предназначенный для формирования спектральной разности между выходными сигналами ступени повторного квантования и средства для преобразования звукового сигнала в спектральную область;
- второй каскад квантования и кодирования для формирования на основе выходного сигнала спектрального сумматора второго сигнала, который по сравнению с первым сигналом является более точно квантованным и имеет более высокую скорость передачи в битах первого сигнала;
- цепь задержки, введенную за второй ступенью квантования и кодирования;
- форматер потока битов, введенный в цепь за первой ступенью квантования и кодирования, и цепь задержки для передачи потока битов первого каскада квантования и кодирования в общем потоке битов выходного каскада с временным разделением потока второго каскада квантования и кодирования.
Ниже подробно описаны предпочтительные варианты изобретения с приложенными чертежами, на которых:
фиг. 1 - блок-схема цепи для осуществления способа coгласно изобретению, в котором установлена разница во временной области;
фиг. 2 - блок-схема цепи для осуществления способа согласно изобретению, в котором установлена разница в спектральной области.
Цепь, показанная на фиг.1 и обозначенная позицией 10, содержит первый кодер 11 для кодирования входного бокового звукового сигнала со сравнительно низким качеством и низкой скоростью передачи битов.
Задержка, вызванная таким кодированием, как показано ниже, значительно меньше задержки всей системы для выполнения полной операции кодирования входного бокового звукового сигнала с высоким качеством и высокой скоростью передачи битов. Полученный таким образом первый кодированный сигнал подается, с одной стороны, непосредственно на вход мультиплексора потока битов 12, а с другой - к первому декодеру 13, включенному в цепь кодека вместе с указанным первым кодером 11.
Кроме того, звуковой сигнал подается на первую цепь задержки 14, время задержки которой соответствует времени задержки цепи кодека 11, 13. В сумматоре 15 устанавливается разница во времени между выходными сигналами цепи кодека 11, 13 и первой цепью задержки 14.
Каскад принятия решений 16 через переключатель 17 выбирает либо звуковой сигнал, задержанный первой цепью задержки 14, либо временную разницу сигнала, сформированного в сумматоре 15, для дальнейшей обработки сигнала, т.е. для кодирования вторым кодером 18, который кодирует либо разностный сигнал во времени, либо задержанный звуковой сигнал с высокой скоростью передачи битов. В процессе этого кодирования выполняется психоакустический расчет для учета маскирующего порога на основе звукового сигнала и, возможно, также на основе разностного сигнала. С этой целью второй кодер 18 снабжен психоакустическим модулем 19. Выходной сигнал второго кодера 18 подается через вторую цепь задержки 20 на второй вход мультиплексора потока битов 12.
Поток битов первого кодера 11 подается мультиплексором 12 с выходной стороны полного потока битов в режиме с временным разделением потока битов второго кодера 18. При передаче битов первого кодированного сигнала, сформированного первым кодером 11, происходит его кодирование вторым кодером 18 с учетом необходимых задержек, причем поток битов указанного второго кодера передается на декодер после передачи первого кодированного сигнала.
Способ согласно изобретению позволяет обеспечить низкокачественную передачу звуковых данных с малой задержкой во времени, фактически с задержкой первого кодера 11, и, таким образом, обработку данных с задержкой, которая значительно ниже задержки полной системы. При полной задержке, требуемой системой, декодер на стороне приемника может также выдавать высококачественный декодированный сигнал.
Если для работы системы достаточны низкокачественные декодированные сигналы с малой временной задержкой, можно ограничиться передачей данных с первого кодера непосредственно на приемник. Каскад принятия решений 16 передает на мультиплексор потока битов 12 двоичный разряд, определяющий необходимость дальнейшей обработки разностного или задержанного звукового сигнала во втором кодере 18. Благодаря передаче этой дополнительной информации декодер на стороне приемника обеспечивает соответствующий сбор сигналов. Для каждого отрезка времени с предопределенным числом выборок предпочтительно передать один бит, указывающий, был ли определен разностный сигнал в данной временной области.
На фиг. 2 позицией 40 представлена блок-схема цепи, которая реализует способ согласно изобретению, в котором, однако, установлена разница в спектральной области.
Звуковой сигнал преобразуется в спектральной области с помощью средства 41 для преобразования звукового сигнала в спектральную область (например, блока фильтров) и подается как на первый каскад квантования и кодирования 42, так и на спектральный сумматор 43. Выходной сигнал первого каскада квантования и кодирования 42 подается на форматер потока битов 44, с одной стороны, и на каскад повторного квантования 45, с другой стороны, причем выходной сигнал последнего подается с отрицательным знаком на спектральный сумматор 43 для формирования спектральной разности.
Разностный сигнал подается на второй каскад квантования и кодирования 46, выходной сигнал которого подается на форматер потока битов 44 через каскад задержки 47. Поток битов первого каскада квантования и кодирования 42 передается форматером потока битов 44 в общем потоке двоичных разрядов на выходе каскада с временным разнесением перед подачей на второй каскад квантования и кодирования 46.
После этого звуковой сигнал пропускается через психоакустический модуль как в первом, так и во втором каскадах квантования и кодирования 42, 46 для учета маскирующего порога.
Первый каскад квантования 42 обрабатывает, в основном, предварительно квантованный сигнал со сравнительно низкой скоростью передачи битов, используя, например, код Хаффмана. Это осуществляется при управлении вторым выходом психоакустического модуля 48. Этот второй выход указывает на действия, с помощью которых частоты уровня шума могут быть увеличены при поддержании самой низкой степени слышимости погрешности квантования.
За этим каскадом 42 в каскаде 46 формируется более точно квантованный сигнал, вводящий масштабный коэффициент и дополнительное слово кода, например кодовое слово широтно-импульсной модуляции. Эта концепция может быть расширена до дальнейших нижних значений битов в слое с еще более высоким качеством.
Изобретение относится к способу и устройству для кодирования звукового сигнала или множества звуковых сигналов. Технический результат - повышение помехоустойчивости. Сущность изобретения заключается в том, что при кодировании звукового сигнала кодированные сигналы с низким качеством и скоростью передачи битов, с одной стороны, и кодированные сигналы с высоким качеством и скоростью передачи битов, с другой стороны, передаются в декодер. Сначала звуковой сигнал кодируется с низкой скоростью передачи информации в битах в секунду и поступает на декодер прежде, чем на него подается дополнительный кодированный сигнал, который один или вместе с первым кодированным сигналом после его декодирования формируют декодированный сигнал с высоким качеством внутри декодера. Таким образом, возможно формировать в декодере низкокачественный декодируемый сигнал перед декодированием высококачественного сигнала. 4 с. и 6 з.п.ф-лы, 2 ил.
R.BRANDENBURG, B | |||
GRILL | |||
FIRST IDEAS ON SCALABLE AUDIO CODING, PRESENTED AT THE 97TH CONVENTION | |||
Прибор для охлаждения жидкостей в зимнее время | 1921 |
|
SU1994A1 |
AES, SAN-FRANCISCO | |||
Разборный с внутренней печью кипятильник | 1922 |
|
SU9A1 |
Устройство частотного компандирования звуковых сигналов | 1990 |
|
SU1795561A1 |
Прибор для очистки паром от сажи дымогарных трубок в паровозных котлах | 1913 |
|
SU95A1 |
УСТРОЙСТВО ДЛЯ РЕГИСТРАЦИИ ИМПУЛЬСОВ ГИДРОМЕТРИЧЕСКИХ ВЕРТУШЕК | 1971 |
|
SU423050A1 |
DE 4212339 A1, 18.02.1993. |
Авторы
Даты
2000-10-27—Публикация
1996-08-16—Подача