Настоящее изобретение относится к области аудиокодирования и, в частности, к области стерео- или многоканального кодирования/декодирования.
Современные способы параметрического кодирования стереосигналов с потерями на низких битовых скоростях основаны на параметрическом стерео, стандартизированном в части 3 MPEG-4. Общая идея состоит в том, чтобы сократить количество каналов посредством вычисления микшированного с понижением сигнала на основе двух входных каналов после извлечения параметров стерео, которые отправляются декодеру как вспомогательная информация. Этими параметрами стерео обычно являются разность уровней между каналами (ILD), разность фаз между каналами (IPD) и когерентность между каналами (ICC), которые вычисляются в частотных подполосах, и которые до некоторой степени захватывают пространственное изображение.
Декодер выполняет повышающее микширование моно входа, создавая два канала, удовлетворяющие отношениям ILD, IPD и ICC. Это делается посредством матрицирования входного сигнала вместе с декоррелированной версией этого сигнала, которая формируется в декодере.
Было найдено, например, что использование таких параметров влечет за собой значительную сложность для вычисления и обработки этих параметров. В частности, параметр ILD является проблематичным, поскольку он может иметь значения, которые очень малы или очень велики, и этот почти неограниченный диапазон значений поднимает проблемы в отношении эффективного вычисления, квантования и т.д.
Задача настоящего изобретения состоит в создании улучшенной концепции обработки многоканальных данных.
Эта задача решается устройством для понижающего микширования многоканального сигнала по пункту 1 формулы, устройством для повышающего микширования кодированного многоканального сигнала по пункту 17 формулы, способом понижающего микширования многоканального сигнала по пункту 33 формулы, способом повышающего микширования кодированного многоканального сигнала по пункту 34 формулы, или компьютерной программой по пункту 35 формулы изобретения.
Настоящее изобретение по первому аспекту основано на обнаружении того, что в отличие от уровня техники принята другая процедура параметрического кодирования, которая основана на двух параметрах усиления, т.е. на параметре бокового усиления и параметре разностного усиления. Оба параметра усиления вычисляются на основе первого канала по меньшей мере из двух каналов многоканального сигнала и второго канала по меньшей мере из двух каналов многоканального сигнала. Оба из этих параметров усиления, т.е. боковое усиление и разностное усиление, передаются или сохраняются, или в целом выдаются вместе с микшированным с понижением сигналом, который вычисляется на основе многоканального сигнала блоком понижающего микширования.
Варианты осуществления настоящего изобретения по первому аспекту основаны на новом подходе «средний/боковой» (mid/side), приводящем к новому набору параметров: в кодере преобразование «средний/боковой» применяется к входным каналам, которые вместе захватывают полную информацию двух входных каналов. Средний (mid) сигнал представляет собой взвешенное среднее значение левого и правого каналов, где весовые коэффициенты являются комплексными и выбираются таким образом, чтобы компенсировать разности фаз. Соответственно, боковой (side) сигнал представляет собой соответствующую взвешенную разность входных каналов. Только средний сигнал представляет собой кодированную форму сигнала, в то время как боковой сигнал моделируется параметрически. Кодер работает в частотных подполосах, где он извлекает IPD и два параметра усиления в качестве параметров стерео. Первое усиление, которое будет упоминаться как боковое усиление, следует из предсказания бокового сигнала посредством среднего сигнала, и второе усиление, которое будет упоминаться как разностное усиление, захватывает энергию остатка относительно энергии среднего сигнала. Средний сигнал затем служит в качестве микшированного с понижением сигнала, который передается вместе с параметрами стерео декодеру.
Декодер синтезирует два канала посредством оценки потерянного бокового канала на основе бокового усиления и разностного усиления, и используя замену для остатка.
Настоящее изобретение по первому аспекту имеет преимущество в том, что боковое усиление, с одной стороны, и разностное усиление, с другой стороны, являются усилениями, которые ограничены некоторым малым диапазоном чисел. В частности, боковое усиление в предпочтительных вариантах осуществления ограниченных диапазоном от -1 до +1, и разностное усиление даже ограничено диапазоном от 0 до 1. И, что еще более полезно в предпочтительном варианте осуществления, разностное усиление зависит от бокового усиления таким образом, что диапазон значений, которые может иметь разностное усиление, становится тем меньше, чем больше становится боковое усиление.
В частности, боковое усиление вычисляется как боковое усиление предсказания, которое применимо к среднему сигналу первого и второго канала, чтобы предсказать боковой сигнал первого и второго каналов. И блок вычисления параметров также выполнен с возможностью вычисления разностного усиления в виде разностного усиления предсказания, указывающего энергию или амплитуду разностного сигнала такого предсказания бокового сигнала посредством среднего сигнала и бокового усиления.
Однако важно то, что фактически нет необходимости выполнять предсказание на стороне кодера или фактически кодировать боковой сигнал на стороне кодера. Вместо этого могут быть вычислены лишь боковое усиление и разностное усиление с использованием относящихся к амплитуде показателей, таких как энергии, мощности или другие характеристики, относящиеся к амплитудам левого и правого каналов. Кроме того, вычисление бокового усиления и разностного усиления относится только к внутреннему произведению между обоими каналами, т.е. любые другие каналы кроме левого канала и правого канала, такие как сам микшированный с понижением канал или сам боковой канал, не являются необходимыми для вычисления в вариантах осуществления. Однако в других вариантах осуществления боковой сигнал может быть вычислен, различные испытания для предсказаний могут быть вычислены, и параметры усиления, такие как боковое усиление и разностное усиление, могут быть вычислены на основе разностного сигнала, который имеет отношение к некоторому предсказанию бокового усиления, и это приводит к заданному критерию при различных испытаниях, такому как минимальная энергия остаточного сигнала. Таким образом, имеется большая гибкость и, тем не менее, низкая сложность для вычисления бокового усиления, с одной стороны, и разностного усиления, с другой стороны.
Имеются два иллюстративных преимущества параметров усиления над ILD и ICC. Во-первых, они естественным образом лежат в конечных интервалах (боковое усиление в интервале [-1,1] и разностное усиление в интервале [0,1]) в противоположность параметру ILD, который может принимать произвольно большие или маленькие значения. И, во-вторых, вычисление является менее сложным, поскольку оно включает в себя лишь единственную специальную оценку функции, тогда как вычисление ILD и ICC включают в себя две.
Предпочтительные варианты осуществления первого аспекта полагаются на вычисление параметров в спектральной области, т.е. параметры вычисляются для разных элементов разрешения по частоте или, более предпочтительно, для разных частотных подполос, причем каждая частотная подполоса содержит определенное количество элементов разрешения по частоте. В предпочтительном варианте осуществления количество элементов разрешения по частоте, включенных в частотную подполосу, увеличивается от более низких до более высоких частотных подполос, чтобы подражать характеристике человеческого слухового восприятия, т.е. высокие частотные полосы покрывают диапазоны более высокой частоты, и низкие частотные полосы покрывают диапазоны более низкой частоты.
В предпочтительном варианте осуществления блок понижающего микширования вычисляет микшированный с понижением сигнал с абсолютной фазовой компенсацией, причем на основе параметра IPD к левому и правому каналам применяются повороты фаз, но фазовая компенсация выполняется таким образом, что к каналу, имеющему больше энергии, поворот фазы применяется меньше, чем к каналу, имеющему меньше энергии. Для управления фазовой компенсацией может предпочтительно использоваться боковое усиление, однако в других вариантах осуществления может использоваться любое другое понижающее микширование, и особым преимуществом настоящего изобретения также является то, что параметрическое представление бокового сигнала, т.е. боковое усиление, с одной стороны, и разностное усиление, с другой стороны, вычисляется только на основе первоначальных первого и второго каналов, и любая информация о переданном понижающем микшировании не требуется. Таким образом, любое понижающее микширование может использоваться вместе с новым параметрическим представлением, состоящим из бокового усиления и разностного усиления, но настоящее изобретение также, в частности, является полезным для применения вместе с абсолютной фазовой компенсацией, которая основана на боковом усилении.
В дополнительном варианте осуществления абсолютной фазовой компенсации параметр фазовой компенсации, в частности, вычисляется на основе заданного заданного числа таким образом, что сингулярность функции арктангенса (atan или tan-1), которая возникает при вычислении параметра фазовой компенсации, перемещена из центра в некоторую боковую позицию. Это смещение сингулярности гарантирует, что не возникнет каких-либо проблем из-за сингулярности для смещений фазы +/-180° и параметра усиления, близкого к 0, т.е. когда левый и правый каналы имеют довольно сходные энергии. Такие сигналы, как было обнаружено, возникают довольно часто, а сигналы, находящиеся не в фазе друг с другом, но имеющие разность, например, между 3 и 12 дБ или около 6 дБ, в естественных ситуациях не возникают. Таким образом, хотя только смещены сингулярности, было обнаружено, что это смещение, тем не менее, улучшает общие рабочие характеристики блока понижающего микширования, поскольку это смещение гарантирует, что сингулярность возникает в ситуации с созвездием сигналов, которая возникает в обычных ситуациях намного меньше, чем когда простая функция арктангенса имеет свою точку сингулярности.
Дополнительные варианты осуществления используют зависимость бокового усиления и разностного усиления для реализации эффективной процедуры квантования. С этой целью предпочтительно выполнять совместное квантование, которое в первом варианте осуществления выполняется таким образом, что сначала квантуется боковое усиление, и затем квантуется разностное усиление с использованием этапов квантования, которые основаны на значении бокового усиления. Однако другие варианты осуществления полагаются на совместное квантование, в котором оба параметра квантуются в единый код, и некоторые участки этого кода полагаются на некоторые группы точек квантования, которые принадлежат характеристике разности на определенном уровне двух каналов, которые кодированы кодером.
Второй аспект относится к устройству для понижающего микширования многоканального сигнала, содержащего по меньшей мере два канала, причём устройство содержит: блок понижающего микширования для вычисления микшированного с понижением сигнала на основе многоканального сигнала, причем блок понижающего микширования выполнен с возможностью вычисления понижающего микширования с использованием абсолютной фазовой компенсации таким образом, что поворот фазы применяется только к каналу, имеющему более низкую энергию среди по меньшей мере двух каналов, или к этому каналу поворот фазы применяется сильнее, чем к каналу, имеющему более высокую энергию, при вычислении микшированного с понижением сигнала; и выходной интерфейс для формирования выходного сигнала, выходной сигнал, содержит информацию о микшированном с понижением сигнале.
Предпочтительно поворот фазы применяется предпочтительно к меньшему каналу, но в ситуациях с малой разностью энергий может быть случай, что к меньшему каналу не всегда поворот фазы применяется больше, чем к большему каналу. Но если отношение энергии достаточно велико или достаточно мало, то предпочтительный вариант осуществления применяет поворот фазы к меньшему канал больше, чем большему каналу. Таким образом, предпочтительно к меньшему каналу поворот фазы применяется больше, чем к большему каналу, только когда разность энергий является значительной или больше заданной пороговой величины, например, 1 дБ или больше. Это применяется не только для блока понижающего микширования, но также и для блока повышающего микширования.
Предпочтительные варианты осуществления настоящего изобретения описаны ниже с обращением к приложенным чертежам, на которых:
Фиг. 1 - блок-схема устройства для кодирования многоканального сигнала варианта осуществления;
Фиг. 2 - блок-схема варианта осуществления блока вычисления параметров;
Фиг. 3 - дополнительный вариант осуществления блока вычисления параметров;
Фиг. 4 - вариант осуществления блока понижающего микширования, выполняющего абсолютную фазовую компенсацию;
Фиг. 5a - блок-схема варианта осуществления выходного интерфейса, выполняющего заданное квантование;
Фиг. 5b указывает иллюстративное кодовое слово;
Фиг. 6 вариант осуществления устройства для декодирования кодированного многоканального сигнала;
Фиг. 7 - вариант осуществления блока повышающего микширования;
Фиг. 8 - вариант осуществления блока синтеза разностного сигнала;
Фиг. 9 - вариант осуществления для входного интерфейса;
Фиг. 10a иллюстрирует обработку перекрывающихся кадров;
Фиг. 10b иллюстрирует вариант осуществления блока временно-спектрального преобразования;
Фиг. 10c иллюстрирует спектр левого канала или правого канала и построение разных подполос;
Фиг. 10d иллюстрирует вариант осуществления для блока спектрально-временного преобразования;
Фиг. 11 иллюстрирует линии для условного квантования в первом варианте осуществления;
Фиг. 12 иллюстрирует линии для совместного квантования в соответствии с дополнительным вариантом осуществления; и
Фиг. 13 иллюстрирует точки совместного квантования для бокового усиления и разностного усиления.
Фиг. 1 иллюстрирует устройство для кодирования многоканального сигнала, содержащего по меньшей мере два канала. В частности, многоканальный сигнал проиллюстрирован позицией 100 на фиг. 1 и имеет первый канал 101 и второй канал 102, и не имеет дополнительных каналов или имеет произвольным образом выбранное количество дополнительных каналов, где еще один дополнительный канал проиллюстрирован позицией 103.
Многоканальный сигнал 100 подается в блок 120 понижающего микширования для вычисления микшированного с понижением сигнала 122 на основе многоканального сигнала 100. Блок понижающего микширования может использовать для вычисления многоканального сигнала первый канал 101, второй канал 102 и третий канал 103, или только первый и второй каналы, или все каналы многоканального сигнала в зависимости от определенной реализации.
Кроме того, устройство для кодирования содержит блок 140 вычисления параметров для вычисления бокового усиления 141 на основе первого канала 101 и второго канала 102 из этих по меньшей мере двух каналов и, кроме того, блок 104 вычисления параметров вычисляет разностное усиление 142 на основе первого канала и второго канала. В других вариантах осуществления также вычисляется факультативная разность фаз между каналами (IPD), как проиллюстрировано позицией 143. Микшированный с понижением сигнал 122, боковое усиление 141 и разностное усиление 142 переадресуются на выходной интерфейс 160, который формирует кодированный многоканальный сигнал 162, содержащий информацию о микшированном с понижением сигнале 122, о боковом усилении 141 и разностном усилении 142.
Следует отметить, что боковое усиление и разностное усиление, как правило, вычисляются для кадров таким образом, что для каждого кадра было вычислено единственное боковое усиление и единственное разностное усиление. Однако в других вариантах осуществления для каждого кадра вычисляется не только единственное боковое усиление и единственное разностное усиление, а группа боковых усилений и группа разностных усилений, где каждое боковое усиление и каждое разностное усиление относятся к определенной подполосе первого канала и второго канала. Таким образом, в предпочтительных вариантах осуществления блок вычисления параметров вычисляет для каждого кадра первого и второго каналов группы боковых усилений и группы разностных усилений, причем количество боковых и разностных усилений для кадра обычно равно количеству подполос. Когда применяется временно-спектральное преобразование с высоким разрешением, такое как DFT, боковое усиление и разностное усиление для некоторой подполосы вычисляются на основе группы элементов разрешения по частоте первого канала и второго канала. Однако, когда к этим результатам в подполосных сигналах применяется временно-спектральное преобразование с низким разрешением, тогда блок 140 вычисления параметров вычисляет боковое усиление и разностное усиление для каждой подполосы или даже для группы подполос.
Когда боковое усиление и разностное усиление вычислены для группы подполосных сигналов, тогда разрешение параметров сокращается, приводя к низкой битовой скорости, но также проведя и к низкокачественному представлению параметрического представления бокового сигнала. В других вариантах осуществления временное разрешение также может быть модифицировано таким образом, что боковое усиление и разностное усиление не вычисляются для каждого кадра, а вычисляются для группы кадров, причем группа кадров имеет два или более кадров. Таким образом, в таком варианте осуществления предпочтительно вычислить связанные с подполосами боковые/разностные усиления, причем боковые/разностные усиления относятся к некоторой подполосе, но относятся к группе кадров, содержащих два или более кадров. Таким образом, в соответствии с настоящим изобретением временное и частотное разрешения вычисления параметров, выполняемого блоком 140, могут быть модифицированы с высокой гибкостью.
Блок 140 вычисления параметров предпочтительно реализован, как изложено на фиг. 2 в отношении первого варианта осуществления, или, как изложено на фиг. 3 в отношении второго варианта осуществления. В вариантах осуществления на фиг. 2 блок вычисления параметров содержит первый блок 21 временно-спектрального преобразования и второй блок 22 временно-спектрального преобразования. Кроме того, блок 140 вычисления параметров на фиг. 1 содержит блок 23 вычисления для вычисления первой связанной с амплитудой характеристики, блок 24 вычисления для вычисления второй связанной с амплитудой характеристики и блок 25 вычисления для вычисления внутреннего произведения выхода блоков 21 и 22, т.е. спектрального представления первого и второго каналов.
Выходы блоков 23, 24, 25 вычисления переадресуются блоку 26 вычисления бокового усиления, а также переадресуются блоку 27 вычисления разностного усиления. Блок 26 вычисления бокового усиления и блок 27 вычисления разностного усиления применяют некоторое отношение среди первой связанной с амплитудой характеристики, второй связанной с амплитудой характеристики и внутренним произведением, и отношение, применяемое блоком вычисления разностного усиления для комбинирования обоих входов, отличается от отношения, которое применяется блоком 26 вычисления бокового усиления.
В предпочтительном варианте осуществления первая и вторая связанные с амплитудой характеристики представляют собой энергии в подполосах. Однако другие связанные с амплитудой характеристики относятся к амплитудам в самих подполосах, к мощностям сигнала в подполосах или к любым другим степеням амплитуд с показателем больше 1, где показатель может представлять собой действительное число больше 1 или целое число больше 1, например, целое число 2 относится к мощности сигнала и энергии, или число относится к уровню громкости и т.д. Таким образом, каждая связанная с амплитудой характеристика может использоваться для вычисления бокового усиления и разностного усиления.
В предпочтительном варианте осуществления блок вычисления бокового усиления и блок 27 вычисления разностного усиления выполнены с возможностью вычисления бокового усиления в качестве бокового усиления предсказания, которое применимо к среднему сигналу первого и вторых каналов, чтобы предсказать боковой сигнал первого и второго каналов или блока вычисления параметров и, в частности, блок 27 вычисления разностного усиления выполнен с возможностью вычисления разностного усиления в качестве разностного усиления предсказания, указывающего связанный с амплитудой показатель разностного сигнала предсказания бокового сигнала посредством среднего сигнала с использованием бокового усиления.
В частности, блок 140 вычисления параметров и блок 26 вычисления бокового усиления на фиг. 2 выполнены с возможностью вычисления бокового сигнала с использованием дроби, имеющей числитель и знаменатель, причем числитель содержит характеристики амплитуды первого и второго каналов, и знаменатель содержит характеристику амплитуды первого и вторых каналов и значение, выведенное из внутреннего произведения. Значение, выведенное из внутреннего произведения, предпочтительно является абсолютным значением внутреннего произведения, но в качестве альтернативы может являться любой степенью абсолютного значения, например, степенью больше 1, или даже может являться характеристикой, отличающейся от абсолютного значения, такого как комплексно-сопряженное выражение, или само внутреннее произведение, и так далее.
В дополнительном варианте осуществления блок вычисления параметров и блок 27 вычисления разностного усиления на фиг. 2 также используют дробь, имеющую числитель и знаменатель, в обоих из которых используется значение, выведенное из внутреннего произведения, а также другие параметры. Вновь значение, выведенное из внутреннего произведения, предпочтительно является абсолютным значением внутреннего произведения, но в качестве альтернативы может являться любой степенью абсолютного значения, например, степенью больше 1, или даже может являться характеристикой, отличающейся от абсолютного значения, такого как комплексно-сопряженное выражение, или само внутреннее произведение, и так далее.
В частности, блок 26 вычисления бокового усиления на фиг. 2 выполнен с возможностью использования для вычисления бокового усиления разности энергий первых каналов, и знаменатель использует сумму энергий или характеристики амплитуды обоих каналов и дополнительно внутреннее произведение, и предпочтительно удвоенное внутреннее произведение, но также могут использоваться другие множители для внутреннего произведения.
Блок 27 вычисления разностного усиления выполнен с возможностью использования в числителе взвешенной суммы характеристик амплитуды первого и второго каналов и внутреннего произведения, причем внутреннее произведение вычитается из взвешенной суммы характеристик амплитуды первого и второго каналов. Знаменатель для вычисления блока вычисления разностного усиления содержит сумму характеристик амплитуды первого и второго каналов и внутреннего произведения, причем внутреннее произведение предпочтительно умножено на два, но также может быть умножено на другие коэффициенты.
Кроме того, как проиллюстрировано соединительной линией 28, блок 27 вычисления разностного усиления выполнен с возможностью вычисления разностного усиления с использованием бокового усиления, вычисленного блоком вычисления бокового усиления.
В предпочтительном варианте осуществления разностное усиление и боковое усиление работают следующим образом. В частности, разности фаз между каналами по полосам, которые будут описаны позже, могут вычисляться или не вычисляться. Однако, в частности, перед построением схемы вычисления бокового усиления, как проиллюстрировано позже в уравнении (9), и особенно предпочтительного вычисления бокового усиления, как проиллюстрировано позже в уравнении (10), дается дополнительное описание кодера, которое также относится к вычислению IPD и понижающему микшированию, в дополнение к вычислению параметров усиления.
Кодирование параметров стерео и вычисление микшированного с понижением сигнала выполняются в частотной области. С этой целью формируются частотно-временные векторы и левого и правого каналов посредством одновременного применения окно анализа, за которым следует дискретное преобразование Фурье (DFT): элементы разрешения DFT затем группируются в подполосы соответственно , где обозначает набор индексов подполос.
Вычисление IPD и понижающее микширование
Для понижающего микширования разность фаз между каналами (IPD) по полосам вычисляется как
IPDt,b=arg( (1)
где z* обозначает комплексное сопряжение z. Это используется, чтобы сформировать средний и боковой сигнал по полосам
(2)
и
(3)
для k ∈ . Параметр поворота абсолютной фазы β задается как
β=) (4)
где обозначает боковое усиление, которое будет определено ниже. Здесь, atan2(y,x) - функции арктангенс с двумя аргументами, значением которой является угол между точкой (x,y) и положительной осью X. Она предназначена для выполнения компенсации IPD вместо выполнения на канале, который имеет меньше энергии. Коэффициент 2 перемещает сингулярность из =±π и gt,b=0 в =±π и =-1/3. Такое переключение β избегается в ситуациях несовпадения по фазе с приблизительно равным энергетическим распределением в левом и правом каналах. Микшированный с понижением сигнал формируется посредством применения обратного DFT к , за которым следует окно синтеза и наложение с суммированием.
В других вариантах осуществления также могут использоваться другие функции арктангенса, отличающиеся от функции atan2, такие как прямая функция тангенса, но функция atan2 является предпочтительной благодаря ее безопасному применению к поставленной задаче.
Вычисление параметров усиления
В дополнение к IPD по полосам извлекаются два дополнительных параметра стерео. Оптимальное усиление для предсказания посредством , т.е. такое число , что энергия остатка
(5)
является минимальной, и коэффициент усиления , который при его применении к среднему сигналу уравнивает энергию и в каждой частотной полосе, т.е.
(6)
Оптимальное усиление предсказания может быть вычислено на основе энергий в подполосах
(7)
и абсолютное значение внутреннего произведения и
(8)
как
(9)
Из этого следует, что находится в диапазоне [-1,1]. Разностное усиление может быть вычислено аналогичным образом, на основе энергий и внутреннего произведения как
(10)
что подразумевает
0 ≤ ≤ (11)
В частности, это показывает, что ∈ [0,1]. Таким образом, параметры стерео могут быть вычислены независимо на основе понижающего микширования посредством вычисления соответствующих энергий и внутреннего произведения. В частности, нет необходимости вычислять разностный , чтобы вычислить его энергию. Это примечательно, что вычисление усилений включает в себя только одну специальную оценку функции, тогда как вычисление ILD и ICC на основе , и включают в себя две, а именно, квадратный корень и логарифм:
IL (12)
и
(13)
Понижение разрешения параметров
Если желательно более низкое разрешение параметров, заданное длиной окна, можно вычислять параметры усиления по h последовательным окнам, заменив на
(14)
и соответственно на
(15)
в (9) и (10). Боковое усиление тогда является взвешенным средним боковых усилений для индивидуальных окон, причем весовые коэффициенты зависят от энергии или зависят от энергий по полосам , где s - индекс суммирования в уравнениях 14 и 15.
Аналогичным образом, значения IPD тогда вычисляются по нескольким окнам как
(16)
Предпочтительно блок 140 вычисления параметров, проиллюстрированный на фиг. 1, выполнен с возможностью вычисления представления по подполосам в качестве последовательности комплекснозначных спектров, причем каждый спектр относится к временному кадру первого канала или второго канала, причем временные кадры последовательности являются смежными друг с другом, и смежные временные кадры накладываются друг на друга.
Кроме того, блок 140 формирования параметров выполнен с возможностью вычисления первого и второго связанных с амплитудой показателей посредством возведения в квадрат комплексных спектральных значений в подполосе и посредством суммирования возведенных в квадрат величин в подполосе, как, например, также проиллюстрировано ранее в уравнении (7), где индекс b обозначает подполосу.
Кроме того, так же, как изложено в уравнении 8, блок 140 вычисления параметров и, в частности, блок 25 вычисления внутреннего произведения на фиг. 2 выполнен с возможностью вычисления внутреннего произведения посредством суммирования в подполосе, произведений, причем каждое произведение включает в себя спектральное значение в элементе разрешения по частоте первого канала и комплексно-сопряженное спектральное значение второго канала для элемента разрешения по частоте. Впоследствии формируется величина результата совместного суммирования.
Так же, как изложено в уравнениях 1-4, предпочтительно использовать абсолютную фазовую компенсацию. Таким образом, в этом варианте осуществления блок 120 понижающего микширования выполнен с возможностью вычисления понижающего микширования 122 с использованием абсолютной фазовой компенсации таким образом, что только к каналу, имеющему низкую энергию среди двух каналов, применяется поворот фазы, или к каналу, имеющему низкую энергию среди двух каналов, применяется более сильный поворот фазы, чем к другому каналу, который имеет большую энергию, при вычислении микшированного с понижением сигнала. Такой блок 120 понижающего микширования проиллюстрирован на фиг. 4. В частности, блок понижающего микширования содержит блок 30 вычисления разности фаз между каналами (IPD), блок 32 вычисления поворота абсолютной фазы, блок 34 вычисления понижающего микширования и блок 36 вычисления разности энергий или бокового усиления. Следует подчеркнуть, что блок 36 вычисления разности энергий или бокового усиления может быть реализован в виде блока 26 вычисления бокового усиления на фиг. 2. В качестве альтернативы, однако, для поворота фазы также может осуществляться разная реализация в блоке 36, который вычисляет только разность энергий или, в общем смысле, разность связанных с амплитудой характеристик, которая может представлять собой энергию, мощность или сами амплитуды, или степени амплитуд, которые складываются вместе, причем степень отличается от 2, например, степень составляет от 1 до 2 или больше 2.
В частности, показатель степени 3 соответствует, например, уровню громкости, а не энергии.
В частности, блок 30 вычисления IPD на фиг. 4 выполнен с возможностью вычисления разности фаз между каналами, как правило, для каждой подполосы из множества подполос каждого из первого и второго каналов 101, 102, введенных в блок 30. Кроме того, блок понижающего микширования имеет параметр поворота абсолютной фазы, вновь, как правило, для каждой подполосы из множества подполос, который работает на основе разности энергий, обеспеченной блоком 36, между первым и вторым каналами или, в общем случае, на основе разности связанных с амплитудой характеристик между обоими каналами 101, 102. Кроме того, блок 34 вычисления понижающего микширования выполнен с возможностью, при вычислении микшированного с понижением сигнала, взвешивания первого и второго каналов с использованием параметров IPD и параметров поворота абсолютной фазы, обозначенных как β.
Предпочтительно блок 36 реализован в виде блока вычисления бокового усиления таким образом, что блок вычисления поворота абсолютной фазы работает на основе бокового усиления.
Таким образом, блок 30 на фиг. 4 выполнен с возможностью реализации уравнения (1), блок 32 выполнен с возможностью реализации уравнения (4), и блок 34 выполнен с возможностью реализации уравнения (2) в предпочтительном варианте осуществления.
В частности, коэффициент 2 в уравнении (4) перед выражением, включающим в себя боковое усиление gt,b, может быть установлен, отличающимся от 2, и, может являться значением предпочтительно между 0,1 и 100. Естественно, также могут использоваться -0,1 и -100. Это значение гарантируют, что сингулярность, существующая в IPD, равной +-180° для почти равных левого и правого каналов, перемещается в другое место, т.е. в другое боковое усиление, например, -1/3 для коэффициента 2. Однако могут использоваться другие коэффициенты, отличающиеся от 2. Тогда эти другие коэффициенты перемещают сингулярность в другой параметр бокового усиления, отличный от -1/3. Было показано, что все эти разные коэффициенты являются полезными, поскольку эти коэффициенты достигают этого, чтобы проблематичная сингулярность находилась в "месте" в звуковой сцене, имеющем ассоциированные сигналы левого и правого каналов, которые обычно возникают менее часто, чем сигналы, находящиеся не в фазе и имеющие одинаковую или почти одинаковую энергию.
В предпочтительном варианте осуществления выходной интерфейс 160 на фиг. 1 выполнен с возможностью выполнения квантования параметрической информации, т.е. квантования бокового усиления, как предусмотрено на линии 141, посредством блока 140 вычисления параметров и разностного усиления, как предусмотрено на линии 142, из блока 140 вычисления параметров на фиг. 1.
В частности, в варианте осуществления, в котором разностное усиление зависит от бокового усиления, если предпочтительно квантовать боковое усиление и затем квантовать разностное усиление, причем в этом варианте осуществления этап квантования для разностного усиления зависит от значения бокового усиления.
В частности, это проиллюстрировано на фиг. 11 и аналогично на фиг. 12 и 13 также.
Фиг. 1 показывает линии для условного квантования. В частности, было показано, что разностное усиление всегда находится в диапазоне, определенном как (1-g2)1/2. Таким образом, когда g=0, тогда r может находиться в диапазоне между 0 и 1. Однако, когда g=0,5, тогда r может находиться в диапазоне между 0,866 и 0. Кроме того, когда, например, g=0,75, тогда диапазон r ограничен между 0 и 0,66. В экстремальном варианте осуществления, когда g=0,9, тогда r может располагаться только между 0 и 0,43. Кроме того, когда g=0,99, тогда r может находиться в диапазоне только между 0 и 0,14, например.
Таким образом, эта зависимость может использоваться посредством понижения размера шага квантования для квантования разностного усиления для более высоких боковых усилений. Таким образом, при рассмотрении фиг. 11, вертикальные линии, которые показывают диапазон значений для r, всегда могут быть разделены на некоторое целое число, например, 8 таким образом, что каждая линия имеет восемь шагов квантования. Таким образом, ясно, что для линий, отражающих более высокие боковые усиления, шаг квантования меньше, чем для линий, которые имеют более низкие боковые усиления. Таким образом, более высокие боковые усиления могут быть квантованы более точно без какого-либо увеличения битовой скорости.
В дополнительном варианте осуществления блок квантования выполнен с возможностью выполнения совместного квантования с использованием группы точек квантования, причем каждая группа точек квантования определена фиксированным связанным с амплитудой отношением между первым и вторым каналами. Одним примером для связанного с амплитудой отношения является энергия между левым и правым, т.е. это означает линии для одного и того же ILD между первым и вторым каналом, как проиллюстрировано на фиг. 12. В этом варианте осуществления выходной интерфейс сконфигурирован, как проиллюстрировано на фиг. 5a, и содержит блок вычисления ILD по подполосам, который принимает в качестве ввода первый канал и второй канал или в качестве альтернативы боковое усиление g и разностное усиление r. Блок вычисления ILD по подполосам, обозначенный позицией 50, выдает некоторый ILD для значений параметров g, r, для квантования. ILD или в общем случае связанное с амплитудой отношение переадресуется блоку 52 обнаружения совпадения групп. Блок 52 обнаружения совпадения групп определяет наилучшую совпадающую группу и переадресует эту информацию блоку 54 обнаружения совпадения точек. И блок 52 обнаружения совпадения групп, и блок 54 обнаружения совпадения точек подают информацию блоку 56 построения кода, который наконец выдает код, такой как кодовое слово из кодовой книги.
В частности, блок построения кода принимает знак бокового усиления g и определяет знаковый бит 57a, проиллюстрированный на фиг. 5b, показывающий код для g, r для подполосы. Кроме того, блок обнаружения совпадения групп, который определил некоторую группу точек квантования, совпадающих с определенным ILD, выдает биты 2-5, проиллюстрированные позицией 57b, как идентификатор группы. Наконец, блок обнаружения совпадения точек выдает биты 6-8 в варианте осуществления на фиг. 5b, проиллюстрированные позицией 57c, причем эти биты указывают идентификатор точки, т.е. идентификатор точки квантования в группе, обозначенной битами 57b. Хотя фиг. 5b указывает восьмибитовый код, имеющий один знаковый бит, могут использоваться четырхбитовые группы и биты на три точки, другие коды, имеющие знаковый бит и больше или меньше битов групп и больше или меньше битов точек. Вследствие того, что боковое усиление имеет положительные и отрицательные значения, биты группы и биты точки, т.е. набор битов 57b и набор битов 57c, имеют только либо чисто отрицательные, либо предпочтительно чисто положительные значения, и если знаковый бит указывает знак минус, тогда разностное усиление всегда декодируется как положительное значение, но тогда боковое усиление декодируется как отрицательное значение, и это означает, что энергия левого канала ниже, чем энергия правого канала, когда правило, проиллюстрированное в уравнении 9, применяется для вычисления бокового усиления.
Далее изложены дополнительные варианты осуществления для квантования
Квантование бокового и разностного усилений
Неравенства в (11) раскрывают сильную зависимость разностного усиления от бокового усиления, поскольку последнее определяет диапазон первого. Квантование бокового усиления g и разностного усиления r, независимо от выбора точки квантования в [-1, 1] и [0, 1], таким образом, является неэффективным, поскольку количество возможных точек квантования для r уменьшилось бы по мере стремления g к ±1.
Условное квантование
Существуют разные способы решить эту проблему. Самый легкий путь состоит в том, чтобы сначала квантовать g, и затем квантовать r условно от квантованного значения , таким образом, точки квантования лягут в интервале [0, ]. Тогда точки квантования, например, могут быть выбраны однородно на этих линиях квантования, некоторые из которых изображены на фиг. 11.
Совместное квантование
Более сложный способ выбора точек квантования состоит в том, чтобы посмотреть на линии в (g, r)-плоскости, которая соответствуют фиксированному энергетическому отношению между L и R. Если c2 ≥ 1 обозначает такое энергетическое отношение, то соответствующая линия задана либо (0, s) для 0 ≤ s ≤ 1 если c=1, либо
(s, ) для ≤ s ≤ (22)
Это также покрывает случай c2<1, поскольку обмен Lt и Rt изменяет лишь знак gt,b и оставляет rt,b неизменным.
Этот подход покрывает более крупную область тем же самым количеством точек квантования, как видно из фиг. 12. Вновь точки квантования на линиях, например, могут быть выбраны однородно в соответствии с длиной индивидуальных линий. Другие возможности включают в себя такой выбор, чтобы они совпали с предварительно выбранными значениями ICC, или их оптимизация акустическим способом.
Схема квантования, которая была обнаружена как хорошо работающая, основана на энергетических линиях, соответствующих значениям ILD
±{0,2,4,6,8,10,13,16,19,22,25,30,35,40,45,50}, (23)
на каждой из которых выбираются 8 точек квантования. Это дает начало кодовой книге с 256 записями, которая организована как таблица размером 8×16 точек квантования, содержащая значения, соответствующие неотрицательным значениям g, и знаковый бит. Это дает начало представлению 8-битного целого числа точек квантования (g, r), где, например, первый бит определяет знак g, следующие четыре бита содержат индекс столбца в таблице размером 8×16, и последние три бита содержат индекс строки.
Квантование (gt,b, rt,b) может быть сделано посредством поиска с полным перебором в кодовой книге, но более эффективно сначала вычислить ILD подполосы и ограничить поиск наиболее хорошо совпадающей энергетической линией. Таким образом, нужно рассмотреть только 8 точек.
Обратное квантование выполняется посредством простого поиска по таблице.
128 точек квантования для этой схемы, охватывающей неотрицательные значения g, отображены на фиг. 12.
Хотя процедура была раскрыта для вычисления бокового усиления и разностного усиления без фактического вычисления бокового сигнала, т.е. сигнала разности между левым и правым сигналами, как проиллюстрировано в уравнении (9) и уравнении (10), дополнительный вариант осуществления работает для вычисления бокового усиления и разностного усиление по-другому, т.е. с фактическим вычислением бокового сигнала. Эта процедура проиллюстрирована на фиг. 3.
В этом варианте осуществления блок 140 вычисления параметров, проиллюстрированный на фиг. 1, содержит блок 60 вычисления бокового сигнала, который принимает в качестве ввода первый канал 101 и второй канал 102 и выдает фактический боковой сигнал, который может находиться во временной области, но предпочтительно вычисляется в частотной области, как, например, проиллюстрировано уравнением 3. Однако, хотя уравнение 3 указывает ситуацию вычисления бокового сигнала с параметром поворота абсолютной фазы β и параметром IPD на каждую частотную полосу и кадр, боковой сигнал также может быть вычислен без фазовой компенсации. Уравнение 3 становится уравнением, в котором возникают только Lt,k и Rt,k. Таким образом, боковой сигнал также может быть вычислен как простая разность между левым и правым, или первым и вторым каналами и может использоваться или не использоваться нормализация с помощью квадратного корня из 2.
Боковой сигнал, вычисленный блоком 60 вычисления бокового сигнала, переадресуется блоку 61 вычисления разностного сигнала. Блок 62 вычисления разностного сигнала выполняет процедуру, проиллюстрированную, например, в уравнении (5). Блок 61 вычисления разностного сигнала выполнен с возможностью использования разных тестовых боковых усилений, т.е. разных значений для бокового усиления gd,b, т.е. разных тестовых боковых усилений для одной и той же частотной полосы и кадра, и, следовательно, получаются разные разностные сигналы, как проиллюстрировано несколькими выходами блока 61.
Блок 62 выбора бокового усиления на фиг. 3 принимает все разные разностные сигналы и выбирает один из разных разностных сигналов или тестовое боковое усиление, ассоциированное с одним из разных разностных сигналов, который выполняет заданное условие. Это заданное условие, например, может состоять в том, что выбрано боковое усиление, которое привело к разностному сигналу, имеющему самую малую энергию среди всех разных разностных сигналов. Однако могут использоваться другие заданные условия, такие как связанное с самой малой с амплитудой условие, отличающееся от энергии, например, уровень громкости. Однако также могут быть применены другие процедуры, например, в которых используется разностный сигнал, который не имеет самую малую энергию, а энергию, которая находится среди пяти самых малых энергий. Фактически заданное условие также может состоять в том, чтобы выбрать разностный сигнал, который показывает некоторую другую аудио характеристику, такую как некоторые признаки в некоторых частотных диапазонах.
Выбранное тестовое заданное боковое усиление определяется блоком 62 выбора бокового усиления в качестве параметра бокового усиления для некоторого кадра или для некоторой частотной полосы и некоторого кадра. Выбранный разностный сигнал переадресуется блоку 63 вычисления разностного усиления, и блок вычисления разностного усиления в варианте осуществления может просто вычислить связанную с амплитудой характеристику выбранного разностного сигнала или предпочтительно может вычислить разностное усиление как отношение между связанной с амплитудой характеристикой разностного сигнала в отношении связанной с амплитудой характеристикой микшированного с понижением сигнала или среднего сигнала. Даже когда используется понижающее микширование, которое отличается от понижающего микширования с фазовой компенсацией или отличается от понижающего микширования, состоящего из суммы левого и правого, тогда разностное усиление тем не менее может быть отнесено к сложению левого и правого без базовой компенсации в зависимости от обстоятельств.
Таким образом, фиг. 3 иллюстрирует метод вычисления бокового усиления и разностного усиления с фактическим вычислением бокового сигнала, в то время как в варианте осуществления на фиг. 2, который примерно отражает уравнение 9 и уравнение 10, боковое усиление и разностное усиление вычисляются без явного вычисления бокового сигнала и без выполнения вычисления разностного сигнала с разными тестовыми боковыми усилениями. Таким образом, становится ясно, что оба варианта осуществления приводят к боковому усилению и разностному усилению, которые параметризуют разностный сигнал на основе предсказания и других процедур вычисления бокового усиления и разностного усиления, кроме проиллюстрированных на фиг. 2 и 3, или также возможно посредством соответствующих уравнений 5-10.
Кроме того, здесь следует отметить, что все заданные уравнения всегда являются предпочтительными вариантами осуществления для значений, определенных соответствующими уравнениями. Однако было обнаружено, что значения, которые отличаются в диапазоне предпочтительно +-20% от значений, определенных соответствующими уравнениями, также являются полезными и уже обеспечивают преимущества перед предшествующим уровнем техники, хотя преимущества становятся больше, когда отклонение от значений, определенных уравнениями, становится меньше. Таким образом, в других вариантах осуществления предпочтительно использовать значения, которые отличаются от значений, определенных соответствующими уравнениями, только на +-10%, и в самом предпочтительном варианте осуществления значения, определенные уравнениями, являются значениями, используемыми для вычисления этих нескольких элементов данных.
Фиг. 6 иллюстрирует устройство для декодирования кодированного многоканального сигнала 200. Устройство для декодирования содержит входной интерфейс 204, блок 208 синтеза разностного сигнала, соединенный с входным интерфейсом 204, и блок 212 повышающего микширования, соединенный с входным интерфейсом 204, с одной стороны, и блоком 208 синтеза разностного сигнала, с другой стороны. В предпочтительном варианте осуществления декодер дополнительно содержит блок 260 спектрально-временного преобразования, чтобы в конечном итоге выдать первый и второй каналы во временной области, как проиллюстрировано позициями 217 и 218.
В частности, входной интерфейс 204 выполнен с возможностью приема кодированного многоканального сигнала 200 и для получения микшированного с понижением сигнала 207, бокового усиления g 206 и разностного усиления r 205 на основе кодированного многоканального сигнала 200. Блок 208 синтеза разностного сигнала синтезирует разностный сигнал с использованием разностного усиления 205, и блок 212 повышающего микширования выполнен с возможностью повышающего микширования микшированного с понижением сигнала 207 с использованием бокового усиления 206 и разностный сигнала 209, как определено блоком 208 синтеза разностного сигнала, чтобы получить восстановленный первый канал 213 и восстановленный второй канал 214. В варианте осуществления, в котором блок 208 синтеза разностного сигнала и блок 212 повышающего микширования работают в спектральной области, или по меньшей мере блок 212 повышающего микширования работает в спектральной области, восстановленные первый и второй каналы 213, 214 заданы в представлении спектральной области, и представление спектральной области для каждого канала может быть преобразовано во временную область блоком 216 спектрально-временного преобразования, чтобы в конечном итоге выдать первый и второй восстановленные каналы во временной области.
В частности, блок 212 повышающего микширования выполнен с возможностью выполнения первой операции взвешивания с использованием первого блока 70 взвешивания, проиллюстрированного на фиг. 7, чтобы получить первый взвешенный микшированный с понижением канал. Кроме того, блок повышающего микширования выполняет вторую операцию взвешивания с использованием второго блока взвешивания, снова с использованием бокового усиления 206, с одной стороны, и микшированного с понижением сигнала 207, с другой стороны, чтобы получить второй взвешенный микшированный с понижением сигнал. Предпочтительно первая операция взвешивания, выполняемая блоком 70, отличается от второй операции взвешивания, выполняемой блоком 71, таким образом, что первое взвешенное понижающее микширование 76 отличается от второго взвешенного понижающего микширования 77. Кроме того, блок 212 повышающего микширования выполнен с возможностью вычисления восстановленного первого канала с использованием комбинации, выполняемой первым блоком 72 комбинации, первого взвешенного микшированного с понижением сигнала 76 и разностного сигнала 209. Кроме того, блок повышающего микширования дополнительно содержит второй блок 73 комбинации для выполнения второй комбинации второго взвешенного микшированного с понижением сигнала 77 и разностного сигнала 209.
Предпочтительно правила комбинации, выполняемые первым блоком 72 комбинации и вторым блоком 73 комбинации, отличаются друг от друга таким образом, что выход блока 72, с одной стороны, и блока 73, с другой стороны, в значительной степени отличаются друг от друга вследствие разных правил комбинации в блоке 72, 73 и вследствие разных правил взвешивания, выполняемого блоком 70 и блоком 71.
Предпочтительно первое и второе правила комбинации отличаются друг от друга вследствие того, что одно правило комбинации представляет собой операцию сложения, и другое правило комбинации представляет собой операцию вычитания. Однако также могут использоваться другие пары первого и второго правил комбинации.
Кроме того, правила взвешивания, используемые в блоке 70 и блоке 71, отличаются друг от друга, поскольку одно правило взвешивания использует взвешивание с весовым коэффициентом, определенным разностью между заданным числом и боковым усилением, и другое правило взвешивания использует весовой коэффициент, определенный суммой между заданным числом и боковым усилением. Заданные числа могут быть равны друг другу в обоих блоках взвешивания или могут отличаться друг от друга, и заданные числа отличаются от нуля и могут являться целым числом или нецелым числом, и предпочтительно равны 1.
Фиг. 8 иллюстрирует предпочтительную реализацию блок 208 синтеза разностного сигнала. Блок 208 синтеза разностного сигнала содержит своего рода блок выбора необработанного разностного сигнала или, в общем, блок 80 вычисления декоррелированного сигнала. Кроме того, сигнал, выдаваемый блоком 80, вводится в блок 82 взвешивания, который принимает в качестве входа разностное усиление, выданное входных интерфейсом 204 на фиг. 6, обозначенное позицией 205. Кроме того, блок синтеза разностного сигнала предпочтительно содержит блок 84 нормализации, который принимает в качестве входа средний сигнал текущего кадра 85 и в качестве дополнительного входа сигнал, выданный блоком 80, т.е. необработанный сигнал или декоррелированный сигнал 86. На основе этих двух сигналов вычисляется коэффициент нормализации 87, причем коэффициент нормализации 87 предпочтительно используется блоком 82 взвешивания вместе с разностным усилением r, чтобы в конечном итоге получить синтезированный разностный сигнал 209.
В предпочтительном варианте осуществления блок 80 выбора необработанного разностного сигнала выполнен с возможностью выбора микшированного с понижением сигнала предыдущего кадра, такого как непосредственно предыдущий кадр или еще более ранний кадр. Однако в зависимости от реализации селектор 80 необработанного разностного сигнала выполнен с возможностью выбора левого или правого сигнала, или сигнала первого или второго каналов, как вычисленного для предыдущего кадра, или блок 80 выбора необработанного разностного сигнала также может определить разностный сигнал, например, на основе комбинации, такой как сумма, разность и т.п. сигнала левого и правого каналов, определенной либо для непосредственно предыдущего кадра, либо для еще более раннего предыдущего кадра. В других вариантах осуществления блок 80 вычисления декоррелированного сигнала также может быть фактически выполнен с возможностью формирования декоррелированного сигнала. Однако предпочтительно блок 80 выбора необработанного разностного сигнала работает без заданного декоррелятора, такого как фильтр декорреляции, такого как фильтр реверберации, но по соображениям низкой сложности только выбирает уже существующий сигнал из прошлого, например, средний сигнал, восстановленный сигнал левого канала, восстановленный сигнал правого канала или сигнал, выведенный из ранее восстановленного сигнала левого и правого каналов простыми операциями, такими как взвешенная комбинация, т.е. (взвешенное) сложение, (взвешенное) вычитание и т.п., чтобы не полагаться на заданный фильтр реверберации или декорреляции.
Обычно блок 82 взвешивания выполнен с возможностью вычисления разностного сигнала таким образом, что энергия разностного сигнала равна энергии сигнала, обозначенной разностным усилением r, причем эта энергия может быть указана в абсолютных выражениях, но предпочтительно указана в относительных выражениях в отношении среднего сигнала 207 текущего кадра.
В предпочтительных вариантах осуществления для стороны кодера и стороны декодера значения бокового усиления и, в надлежащем случае, из разностного усиления отличаются от нуля.
Далее дополнительные предпочтительные варианты осуществления для декодера даны в форме уравнения.
Повышающее микширование снова выполнено в частотной области. С этой целью частотно-временное преобразование из кодера применяется к декодированному понижающему микшированию, приводя к частотно-временным векторам M˜t,b. С использованием деквантованных значений IP˜Dt,b, , и , левый и правый каналы вычисляются как
= (17)
и
= (18)
для k ∈ Ib, где является заменой за недостающего разностного от кодера, и gnorm является коэффициентом регулировки энергии
(19)
это превращает относительный коэффициента усиления в абсолютный. Например, можно взять
=, (20)
где db > 0 обозначает задержку кадров по полосам. Коэффициент поворота фазы β ˜ снова вычисляется как
β ˜=) (21)
Левый канал и правый канал тогда формируются посредством применения обратного DFT к L˜t, и R˜t, за которым следует окно синтез и наложение с суммированием.
Фиг. 9 иллюстрирует дополнительный вариант осуществления входного интерфейса 204. Этот вариант осуществления отражает операцию обратного квантования, описанную выше для стороны кодера в отношении фиг. 5a и 5b. В частности, входной интерфейс 204 содержит блок 90 извлечения, извлекающий совместный код из кодированного многоканального сигнала. Этот совместный код 91 переадресуется книге 92 совместного кода, которая выполнена с возможностью выдачи для каждого кода информации о знаке, информации о группе или информации о точке, или выдачи для каждого кода окончательного деквантованного значения g и окончательного деквантованного значения r, т.е. деквантованных бокового и разностного усилений.
Фиг. 10a иллюстрирует схематическое представление временной области первого и второй каналов или левого и правого каналов l(t) и r(t).
В варианте осуществления, в котором боковое усиление и разностное усиление вычисляются в спектральной области, левый и правый каналы или первый и второй каналы разделяются на предпочтительно перекрывающиеся кадры F(1), F(2), F(3) и F(4), и так далее. В варианте осуществления, проиллюстрированном на фиг. 10a, кадры накладываются на 50%, но другие наложения также являются полезными. Кроме того, показано наложение только с двумя кадрами, т.е. всегда накладываются друг на друга только два последующих кадров. Однако также могут использоваться кадры с множественным наложением, например, три, четыре или пять накладывающихся кадров. Тогда значение продвижения, т.е. насколько следующий кадр отличается от текущего кадра, составляет на 50%, как в варианте осуществления, проиллюстрированном на фиг. 10a, а лишь составляет менее чем 10%, 20% или 30%, или около этого.
Фиг. 10b иллюстрирует предпочтительную реализацию блока временно-спектрального преобразования, такого как блок 21 или блок 22, проиллюстрированные на фиг. 2. Такой блок временно-частотного преобразования принимает в качестве входа последовательность кадров l(t) или r(t). Блок 1300 аналитического оконной обработки затем выдает последовательность обработанных с помощью оконной функции кадров, все из которых были обработаны с помощью оконной функции предпочтительно с одинаковым окном анализа. Окна анализа могут представлять собой синусные окна или любые другие окна, и отдельная последовательность вычисляется для первого канала, и дополнительная отдельная последовательность вычисляется для второго канала.
Затем последовательности обработанных с помощью оконной функции кадров вводятся в блок 1302 преобразования. Предпочтительно блок 1302 преобразования выполняет алгоритм преобразования, приводящий к комплексным спектральным значениям, такой как DFT и, в частности, FFT. Однако в других вариантах осуществления также может быть использован алгоритм полностью действительного преобразования, такой как преобразование DCT или преобразование MDCT (модифицированное дискретное косинусное преобразование), и затем мнимые части могут быть оценены на основе полностью действительных частей, как известно в области техники, и как, например, реализовано в стандарте USAC (унифицированное кодирование речи и звука). Другие алгоритмы преобразования могут представлять собой наборы фильтров подполос, такие как наборы фильтров QMF, которые приводят к комплекснозначным подполосным сигналам. Как правило, группы фильтров подполосных сигналов имеют более низкое частотное разрешение, чем алгоритмы FFT, и спектр FFT или DFT, имеющий определенное количество элементов разрешения DFT, может быть преобразован в представление по подполосам посредством сбора некоторых элементов разрешения. Это проиллюстрировано на фиг. 10c.
В частности, фиг. 10c иллюстрирует комплексный спектр представления в частотной области первого или второго каналов Lk, Rk для заданного кадра t. Спектральные значения заданы в представлении величины/фазы или в представлении действительной части/мнимой части. Как правило, DFT приводит к элементам разрешения по частоте, имеющим одинаковое частотное разрешение или пропускную способность. Однако предпочтительно боковое и разностное усиления вычисляются по подполосам, чтобы сократить количество битов для передачи разностного и бокового усилений. Предпочтительно представление подполос формируется с использованием подполос, которые увеличиваются от более низких до более высоких частот. Таким образом, в примере подполоса 1 может иметь первое количество элементов разрешения по частоте, например, два элемента, и вторая более высокая подполоса, такая как подполоса 2, подполоса 3 или любая другая подполоса, могут иметь более высокое количество элементов разрешения по частоте, например, восемь элементов, как проиллюстрировано с помощью подполосы 3. Таким образом, пропускная способность частоты индивидуальных подполос может предпочтительно регулироваться для характеристик человеческого уха, как известно в области техники в отношении барк-шкалы.
Таким образом, фиг. 10c иллюстрирует разные элементы разрешения по частоте, обозначенные параметрами k в раскрытых ранее уравнениях, и индивидуальные подполосы, проиллюстрированные на фиг. 10c, обозначены индексом подполосы b.
Фиг. 10d иллюстрирует реализацию блока спектрально-временного преобразования, как, например, реализовано в виде блока 216 на фиг. 6. Блок спектрально-временного преобразования требует, чтобы обратный преобразователь 1310, соединенный далее блок 1312 оконной обработки синтеза и соединенный далее блок 1314 наложения со сложением в конечном итоге получили каналы во временной области. Таким образом, на входе в блок 1310 находятся восстановленные каналы 213, 214 в спектральной области, проиллюстрированные на фиг. 6, и на выходе блока 1340 наложения со сложением существуют восстановленные первый и второй каналы 217, 218 во временной области.
Обратный преобразователь 1310 выполнен с возможностью выполнения алгоритма, приводящего к обратному преобразованию и, в частности, алгоритма, который предпочтительно является обратным по отношению к алгоритму, применяемому в блоке 1302 на фиг. 10b на стороне кодера. Кроме того, блок 1312 оконной обработки синтеза выполнен с возможностью применения окна синтеза, которое соответствует соответствующему окну анализа, и предпочтительно используются одни и те же окна анализа и синтеза, но это не обязательно имеет место. Блок 1314 наложения со сложением выполнен с возможностью выполнения наложения, как проиллюстрировано на фиг. 10a. Таким образом, блок 1314 наложения со сложением, например, берет обработанный с помощью оконной функции синтеза кадр, соответствующий F(3) на фиг. 10a, и дополнительно берет обработанный с помощью оконной функции синтеза кадр F(4) на фиг. 10a, и затем добавляет соответствующие отсчеты второй половины F(3) к соответствующим отсчетам первой половины F(4) отсчет за отсчетом, чтобы в конечном итоге получить отсчеты фактического выходного канала во временной области.
Далее различные конкретные аспекты настоящего изобретения даны в краткой форме.
- M/S стерео с компенсацией IPD и абсолютной фазовой компенсацией в соответствии с уравнением (4).
- M/S стерео с компенсацией IPD и предсказанием S посредством M в соответствии с уравнением (10)
- M/S стерео с компенсацией IPD, предсказание S посредством M в соответствии с уравнением (9) и разностное предсказание в соответствии с коэффициентом усиления (10)
- Эффективное квантование бокового и разностного коэффициентов усиления посредством совместного квантования
- Совместное квантование бокового и разностного коэффициентов усиления на линиях, соответствующих фиксированному энергетическому отношению Lt и Rt в (g, r)-плоскости.
Следует отметить, что предпочтительно все вышеупомянутые пять разных аспектов реализованы в одной и той же структуре кодера/декодера. Однако следует дополнительно отметить, что вышеприведённые отдельные аспекты также могут быть реализованы отдельно друг от друга. Таким образом, первый аспект с компенсацией IPD и абсолютной фазовой компенсацией может быть выполнен в любом блоке понижающего микширования независимо от вычисления какого-либо бокового/разностного усиления. Кроме того, например, аспект вычисления бокового усиления и вычисления разностного усиления может быть выполнен с любым понижающим микшированием, т.е. также с понижающим микшированием, которое не вычислено посредством какой-либо фазовой компенсации.
Кроме того, даже вычисление бокового усиления, с одной стороны, и разностного усиления, с другой стороны, может быть выполнено независимо друг от друга, причем вычисление одного только бокового усиления или вместе с любым другим параметром, отличающимся от разностного усиления, также является выгодным в области техники, в частности, в отношении вычисления ICC или ILD, и даже вычисление одного только разностного усиления или вместе с любым другим параметром, отличающимся от бокового усиления, также уже является полезным.
Кроме того, эффективное совместное или условное квантование бокового и разностного усилений или коэффициентов усиления является полезным с каким-либо конкретным понижающим микшированием. Таким образом, эффективное квантование также может использоваться вообще без какого-либо понижающего микширования. И это эффективное квантование также может быть применено к любым другим параметрам, причем второй параметр зависит в отношении его диапазон значений от первого параметра таким образом, что может быть выполнено очень эффективное квантование с низкой сложностью для таких зависимых параметров, которые, безусловно, могут являться параметрами, также отличающимися от бокового усиления и разностного усиления.
Таким образом, все вышеупомянутые пять аспектов могут быть выполнены и реализованы независимо друг от друга или вместе в некоторой реализации кодера/декодера, а также может быть реализована вместе только подгруппа аспектов, т.е. три аспекта реализованы вместе без других двух аспектов, или только два из этих пяти аспектов реализованы вместе без других трех аспектов в зависимости от обстоятельств.
Хотя некоторые аспекты были описаны в контексте устройства, понятно, что эти аспекты также представляют описание соответствующего способа, причем блок или устройство соответствуют этапу способа или признаку этапа способа. Аналогичным образом, аспекты, описанные в контексте этапа способа, также представляют описание соответствующего блока, элемента или признака соответствующего устройства.
В зависимости от конкретных требований реализации варианты осуществления изобретения могут быть реализованы в аппаратных средствах или в программном обеспечении. Реализация может быть выполнена с использованием цифрового запоминающего носителя, например гибкого диска, DVD, CD, ПЗУ, ППЗУ, СППЗУ), ЭСППЗУ или флэш-памяти, имеющего сохраненные на нем считываемые электронными средствами управляющие сигналы, которые взаимодействуют (или способны взаимодействовать) с программируемой компьютерной системой таким образом, что выполняется соответствующий способ.
Некоторые варианты осуществления в соответствии с изобретением содержат носитель данных, имеющий электронно-читаемые управляющие сигналы, которые способны взаимодействовать с программируемой компьютерной системой таким образом, что выполняется один из способов, описанных в настоящем документе.
В общем варианты осуществления настоящего изобретения могут быть реализованы в виде компьютерного программного продукта с программным кодом, причём программный код выполнен с возможностью выполнения одного из способов, когда компьютерный программный продукт исполняется на компьютере. Программный код программы, например, может быть сохранен на машиночитаемом носителе.
Другие варианты осуществления содержат компьютерную программу для выполнения одного из описанных в настоящем документе способов, сохраненную на машиночитаемом носителе или на запоминающем носителе долговременного хранения.
Другими словами, вариант осуществления способа изобретения, таким образом, представляет собой компьютерную программу, имеющую программный код для выполнения одного из описанных здесь способов, когда компьютерная программа выполняется на компьютере.
Дополнительный вариант осуществления способов изобретения, таким образом, представляет собой носитель информации (или цифровой запоминающий носитель, или машиночитаемый носитель), содержащий записанную на нем компьютерную программу для выполнения одного из описанных здесь способов.
Дополнительный вариант осуществления способа изобретения, таким образом, представляет собой поток данных или последовательность сигналов, представляющих компьютерную программу для выполнения одного из описанных здесь способов. Поток данных или последовательность сигналов могут быть выполнены с возможностью передачи через соединение передачи данных, например, через Интернет.
Дополнительный вариант осуществления содержит средство обработки, например, компьютер или программируемое логическое устройство, выполненное с возможностью осуществления одного из описанных здесь способов.
Дополнительный вариант осуществления содержит компьютер, имеющий установленную на нем компьютерную программу для выполнения одного из описанных в настоящем документе способов.
В некоторых вариантах осуществления программируемое логическое устройство (например, программируемая пользователем вентильная матрица) может использоваться для выполнения некоторых или всех функциональных возможностей описанных здесь способов. В некоторых вариантах осуществления программируемая пользователем вентильная матрица может взаимодействовать с микропроцессором, чтобы выполнять один из описанных здесь способов. В целом способы предпочтительно выполняются любым аппаратным устройством.
Описанные выше варианты осуществления являются лишь иллюстративными в отношении принципов настоящего изобретения. Подразумевается, что специалистам в данной области техники будут очевидны модификации и изменения описанных здесь конфигураций и подробностей. Таким образом, изобретение ограничено только объемом нижеследующей формулы изобретения, а не конкретными подробностями, представленными в порядке описания и пояснения вариантов осуществления настоящего изобретения.
Литература
MPEG-4 High Efficiency Advanced Audio Coding (HE-AAC) v2
FROM JOINT STEREO TO SPATIAL AUDIO CODING - RECENT PROGRESS AND STANDARDIZATION, Proc. of the 7th Int. Conference on digital Audio Effects (DAFX-04), Naples, Italy, October 5-8, 2004.
название | год | авторы | номер документа |
---|---|---|---|
УСТРОЙСТВО И СПОСОБ КОДИРОВАНИЯ ИЛИ ДЕКОДИРОВАНИЯ МНОГОКАНАЛЬНОГО СИГНАЛА С ИСПОЛЬЗОВАНИЕМ ПАРАМЕТРА ШИРОКОПОЛОСНОГО ВЫРАВНИВАНИЯ И МНОЖЕСТВА ПАРАМЕТРОВ УЗКОПОЛОСНОГО ВЫРАВНИВАНИЯ | 2017 |
|
RU2704733C1 |
УСТРОЙСТВО И СПОСОБ ДЛЯ КОДИРОВАНИЯ ИЛИ ДЕКОДИРОВАНИЯ МНОГОКАНАЛЬНОГО СИГНАЛА С ИСПОЛЬЗОВАНИЕМ КОЭФФИЦИЕНТА ПЕРЕДАЧИ ПОБОЧНОГО СИГНАЛА И КОЭФФИЦИЕНТА ПЕРЕДАЧИ ОСТАТОЧНОГО СИГНАЛА | 2017 |
|
RU2725178C1 |
УМЕНЬШЕНИЕ АРТЕФАКТОВ ГРЕБЕНЧАТОГО ФИЛЬТРА ПРИ МНОГОКАНАЛЬНОМ ПОНИЖАЮЩЕМ МИКШИРОВАНИИ С АДАПТИВНЫМ ФАЗОВЫМ СОВМЕЩЕНИЕМ | 2014 |
|
RU2678161C2 |
МНОГОКАНАЛЬНОЕ КОДИРОВАНИЕ АУДИО | 2019 |
|
RU2778832C2 |
УСТРОЙСТВО, СПОСОБ ИЛИ КОМПЬЮТЕРНАЯ ПРОГРАММА ДЛЯ ОБРАБОТКИ КОДИРОВАННОЙ АУДИОСЦЕНЫ С ИСПОЛЬЗОВАНИЕМ СГЛАЖИВАНИЯ ПАРАМЕТРОВ | 2021 |
|
RU2818033C1 |
УСТРОЙСТВО, СПОСОБ ИЛИ КОМПЬЮТЕРНАЯ ПРОГРАММА ДЛЯ ОБРАБОТКИ КОДИРОВАННОЙ АУДИОСЦЕНЫ С ИСПОЛЬЗОВАНИЕМ ПРЕОБРАЗОВАНИЯ ПАРАМЕТРОВ | 2021 |
|
RU2822446C1 |
УСТРОЙСТВО, СПОСОБ ИЛИ КОМПЬЮТЕРНАЯ ПРОГРАММА ДЛЯ ОБРАБОТКИ КОДИРОВАННОЙ АУДИОСЦЕНЫ С ИСПОЛЬЗОВАНИЕМ РАСШИРЕНИЯ ПОЛОСЫ ПРОПУСКАНИЯ | 2021 |
|
RU2820946C1 |
СПОСОБЫ И УСТРОЙСТВА ДЛЯ ФОРМИРОВАНИЯ ИЛИ ДЕКОДИРОВАНИЯ БИТОВОГО ПОТОКА, СОДЕРЖАЩЕГО ИММЕРСИВНЫЕ АУДИОСИГНАЛЫ | 2019 |
|
RU2802677C2 |
ВРЕМЕННОЕ И ПРОСТРАНСТВЕННОЕ ГЕНЕРИРОВАНИЕ МНОГОКАНАЛЬНЫХ АУДИОСИГНАЛОВ | 2006 |
|
RU2388068C2 |
УСТРОЙСТВО И СПОСОБ ОЦЕНИВАНИЯ МЕЖКАНАЛЬНОЙ РАЗНИЦЫ ВО ВРЕМЕНИ | 2017 |
|
RU2711513C1 |
Изобретение относится к средствам для повышающего и понижающего микширования. Технический результат заключается в повышении эффективности обработки многоканальных данных. Вычисляют микшированный с понижением сигнал на основе многоканального сигнала, причем вычисление содержит вычисление понижающего микширования с использованием абсолютной фазовой компенсации таким образом, что поворот фазы применяется только к каналу, имеющему более низкую энергию среди по меньшей мере двух каналов, или к каналу сильнее применяется поворот фазы, чем к каналу, имеющему более высокую энергию, при вычислении микшированного с понижением сигнала. Формируют выходной сигнал, который содержит информацию о микшированном с понижением сигнале. 6 н. и 30 з.п. ф-лы, 13 ил.
1. Устройство для понижающего микширования многоканального сигнала (100), содержащего по меньшей мере два канала (101, 102), причём устройство содержит:
блок (120) понижающего микширования для вычисления (34) микшированного с понижением сигнала (122) на основе многоканального сигнала (100), причем блок понижающего микширования выполнен с возможностью вычисления (34) понижающего микширования с использованием абсолютной фазовой компенсации таким образом, что поворот фазы применяется только к каналу, имеющему более низкую энергию среди по меньшей мере двух каналов, или к этому каналу поворот фазы применяется сильнее, чем к каналу, имеющему более высокую энергию, при вычислении микшированного с понижением сигнала (122); и
выходной интерфейс (160) для формирования выходного сигнала, причём выходной сигнал содержит информацию о микшированном с понижением сигнале (122).
2. Устройство по п. 1,
в котором блок (120) понижающего микширования выполнен с возможностью вычисления (30) разности фаз между каналами с использованием по меньшей мере двух каналов, и
при этом блок (120) понижающего микширования выполнен с возможностью вычисления (32) параметра поворота абсолютной фазы, и
при этом блок (120) понижающего микширования выполнен с возможностью взвешивания (34), при вычислении микшированного с понижением сигнала, первого канала и второго канала с использованием разности фаз между каналами и параметра поворота абсолютной фазы.
3. Устройство по п. 2,
причем устройство дополнительно содержит блок (140) вычисления параметров для вычисления бокового усиления (141) на основе первого канала (101) и второго канала (102) из по меньшей мере двух каналов, и
при этом блок (120) понижающего микширования выполнен с возможностью вычисления (32) параметра поворота абсолютной фазы на основании бокового усиления (141), определенного блоком (140) вычисления параметров.
4. Устройство по п. 2,
в котором блок (120) понижающего микширования выполнен с возможностью вычисления (30) разности фаз между каналами для каждой подполосы кадра, и в котором блок (120) понижающего микширования выполнен с возможностью вычисления (32) параметра поворота абсолютной фазы для каждой подполосы кадра.
5. Устройство по п. 1,
в котором блок (120) понижающего микширования выполнен с возможностью вычисления параметра поворота абсолютной фазы таким образом, что параметр поворота абсолютной фазы находится в переделах ±20% от значений, определенных следующим уравнением:
β=atan ),
где atan является функцией арктангенса, β является параметром поворота абсолютной фазы, IPD является разностью фаз между каналами, t является индексом кадра, b является индексом подполосы, и является боковым усилением для кадра t и подполосы b, и A является значением между 0,1 и 100 или между -0,1 и -100.
6. Устройство по п. 5, в котором функция atan содержит функцию atan2, функцию atan2(y, x), представляющую собой функцию арктангенса с двумя аргументами, значением которой является угол между точкой (x, y) и положительной осью X.
7. Устройство по п. 1,
в котором блок (120) понижающего микширования выполнен с возможностью вычисления (34) микшированного с понижением сигнала (122) таким образом, что микшированный с понижением сигнал (122) имеет значения в пределах ±20% от значений, определенных следующим уравнением:
,
где является микшированным с понижением сигналом для кадра t и элемента разрешения по частоте k, является первым каналом для кадра t и элемента разрешения по частоте k, является вторым каналом для кадра t и элемента разрешения по частоте k, является разностью фаз между каналами для кадра t и подполосы b, включающей в себя элемент разрешения по частоте k, и ß является параметром поворота фазы.
8. Устройство по п. 1, дополнительно содержащее:
блок (140) вычисления параметров для вычисления бокового усиления (141) на основе первого канала (101) из по меньшей мере двух каналов и второго канала (102) из по меньшей мере двух каналов, или для вычисления разностного усиления (142) на основе первого канала (101) и второго канала (102); и
выходной интерфейс (160) для формирования выходного сигнала, выходной сигнал содержит информацию о микшированном с понижением сигнале (122), о боковом усилении (141) и разностном усилении (142).
9. Устройство по п. 3, в котором блок (140) вычисления параметров выполнен с возможностью:
формирования (21) представления по подполосам первого канала и второго канала,
вычисления (21, 22, 23, 24) первой связанной с амплитудой характеристики первого канала в подполосе и вычисления второй связанной с амплитудой характеристики второго канала в подполосе,
вычисления (25) внутреннего произведения первого канала и второго канала в подполосе;
вычисления (26) бокового усиления в подполосе с использованием первого отношения, включающего в себя первую связанную с амплитудой характеристику, вторую связанную с амплитудой характеристику и внутреннее произведение; или
вычисления (27) разностного усиления в подполосе с использованием второго отношения, включающего в себя первую связанную с амплитудой характеристику, вторую связанную с амплитудой характеристику и внутреннее произведение, причём второе отношение отличается от первого отношения,
причем связанная с амплитудой характеристика определена на основании амплитуд, на основании мощностей, на основании энергий или на основании любых степеней амплитуд с показателем больше 1.
10. Устройство по п. 3,
в котором блок (140) вычисления параметров выполнен с возможностью вычисления для каждой подполосы из множества подполос первого канала и второго канала бокового усиления (141) или разностного усиления (142), или
в котором блок вычисления параметров выполнен с возможностью вычисления бокового усиления в качестве бокового усиления предсказания, которое применимо к среднему сигналу первого и второго каналов, чтобы предсказать боковой сигнал первого и второго каналов, или
в котором блок (140) вычисления параметров выполнен с возможностью вычисления разностного усиления в качестве разностного усиления предсказания, указывающего связанную с амплитудой характеристику разностного сигнала предсказания бокового сигнала посредством среднего сигнала с использованием бокового усиления.
11. Устройство по п. 3,
в котором блок (140) вычисления параметров выполнен с возможностью вычисления (26) бокового усиления с использованием дроби, имеющей числитель и знаменатель, причём числитель включает в себя связанную с амплитудой характеристику первого канала и связанную с амплитудой характеристику второго канала, и знаменатель включает в себя связанную с амплитудой характеристику первого канала и связанную с амплитудой характеристику второго канала и значение, выведенное из внутреннего произведения, или
в котором блок (140) вычисления параметров выполнен с возможностью вычисления (27) разностного усиления с использованием дроби, имеющей числитель и знаменатель, причём числитель включает в себя значение, выведенное из внутреннего произведения, и знаменатель включает в себя внутреннее произведение.
12. Устройство по п. 11,
в котором блок (140) вычисления параметров выполнен с возможностью вычисления (26) бокового усиления, причем числитель содержит разность первой связанной с амплитудой характеристики первого канала и второй связанной с амплитудой характеристики второго канала, и при этом знаменатель содержит сумму первой связанной с амплитудой характеристики первого канала и второй связанной с амплитудой характеристики второго канала и значения, выведенного из внутреннего произведения, или
в котором блок (140) вычисления параметров выполнен с возможностью вычисления (27) разностного усиления с использованием дроби, имеющей числитель и знаменатель, причем числитель содержит разность между взвешенной суммой первой связанной с амплитудой характеристики первого канала и второй связанной с амплитудой характеристики второго канала и значением, выведенным из внутреннего произведения, и при этом знаменатель содержит сумму связанной с амплитудой характеристики первого канала, связанной с амплитудой характеристики второго канала и значения, выведенного из внутреннего произведения.
13. Устройство по п. 3,
в котором блок (140) вычисления параметров выполнен с возможностью вычисления бокового усиления для подполосы и вычисления разностного усиления для подполосы с использованием (28) бокового усиления для подполосы.
14. Устройство по п. 3,
в котором блок (140) вычисления параметров выполнен с возможностью вычисления бокового усиления таким образом, что значения для бокового усиления находятся в диапазоне ±20% от значений, определенных на основе следующего уравнения:
, или
в котором блок (140) вычисления параметров выполнен с возможностью вычисления разностного усиления таким образом, что значения для разностного усиления находятся в диапазоне ±20% от значений, определенных на основе следующего уравнения:
,
где t является индексом кадра, b является индексом подполосы, является энергией левого канала в кадре и подполосе, является энергией второго канала в кадре t и подполоса b, и X является внутренним произведением между первым каналом и вторым каналом в кадре t и подполосе b.
15. Устройство по п. 3,
в котором блок (140) вычисления параметров выполнен с возможностью вычисления представления по подполосам первого канала и второго канала как последовательность комплекснозначных спектров, причем каждый спектр относится к временному кадру первого или второго канала, причем временные кадры последовательности являются смежным в последовательности спектров и накладываются друг на друга, или
в котором блок (140) вычисления параметров выполнен с возможностью вычисления первого связанного с амплитудой показателя и второго связанного с амплитудой показателя посредством возведения в квадрат величин комплексных спектральных значений в подполосе и суммирования возведенных в квадрат величин в подполосе, или
в котором блок (140) вычисления параметров выполнен с возможностью вычисления внутреннего произведения посредством суммирования в подполосе произведений, причем каждое произведение включает спектральное значение в элемент разрешения по частоте первого канала и комплексно-сопряженное спектральное значение второго канала для элемента разрешения по частоте, и посредством формирования величины результата суммирования.
16. Устройство по п. 1,
в котором выходной интерфейс (160) содержит кодер формы сигнала, выполненный с возможностью кодирования формы микшированного с понижением сигнала (122) для получения информации о микшированном с понижением сигнале (122), или
в котором блок понижающего микширования выполнен с возможностью применения более сильного поворота фазы только к каналу, имеющему более низкую энергию, чем к каналу, имеющему более высокую энергию, когда разность энергий между каналами больше заданной пороговой величины.
17. Устройство для повышающего микширования кодированного многоканального сигнала (200), содержащее:
входной интерфейс (204) для приема кодированного многоканального сигнала (200) и для получения микшированного с понижением сигнала (207) из кодированного многоканального сигнала (200);
блок (212) повышающего микширования для повышающего микширования микшированного с понижением сигнала (207), причем блок повышающего микширования выполнен с возможностью вычисления восстановленного первого канала (213) и восстановленного второго канала (214) с использованием абсолютной фазовой компенсации таким образом, что поворот фазы применяется только к микшированному с понижением сигналу при восстановлении канала, имеющего более низкую энергию среди восстановленного первого канала (213) и восстановленного второго канала (214), или к нему применяется более сильный поворот фазы, чем к каналу, имеющему более высокую энергию среди восстановленного первого канала (213) и восстановленного второго канала (214) среди восстановленного первого канала (213) и восстановленного второго канала (214).
18. Устройство по п. 17,
в котором входной интерфейс (204) выполнен с возможностью получения из кодированного многоканального сигнала (200) значений разности фаз между каналами, и
при этом блок (212) повышающего микширования выполнен с возможностью применения значений разности фаз между каналами при вычислении восстановленных первого и второго каналов.
19. Устройство по п. 18, в котором блок (212) повышающего микширования выполнен с возможностью
вычисления параметра поворота фазы на основании значения разности фаз между каналами и
применения параметра поворота фазы при вычислении восстановленного первого канала первым методом и применения значения разности фаз между каналами и/или параметра поворота фазы при вычислении восстановленного второго канала вторым методом, причем первый метод отличается от второго метода.
20. Устройство по п. 19,
в котором входной интерфейс (204) выполнен с возможностью приема кодированного многоканального сигнала (200) и получения бокового усиления (206) из кодированного многоканального сигнала (200);
при этом блок (212) повышающего микширования выполнен с возможностью вычисления параметра поворота фазы таким образом, что параметр поворота абсолютной фазы находится в диапазоне ±20% от значений, определенных следующим уравнением:
β=atan ),
где atan является функцией арктангенса, β является параметром поворота абсолютной фазы, IPD является разностью фаз между каналами, t является индексом кадра, b является индексом подполосы, и является боковым усилением для кадра t и подполосы b, и A является значением между 0,1 и 100 или между -0,1 и -100.
21. Устройство по п. 20, в котором функция atan содержит функцию atan2, функцию atan2(y, x), представляющую собой функцию арктангенса с двумя аргументами, значением которой является угол между точкой (x, y) и положительной осью X.
22. Устройство по п. 20,
в котором блок (212) повышающего микширования выполнен с возможностью вычисления восстановленного первого канала и восстановленного второго канала таким образом, что восстановленный первый канал и восстановленный второй канал имеют значения, которые находятся в диапазоне ±20%, в отношении значений, определенных следующими уравнениями:
=
и
=
где является микшированным с понижением сигналом для кадра t и элемента разрешения по частоте k.
23. Устройство по п. 19,
в котором блок (212) повышающего микширования выполнен с возможностью вычисления восстановленного первого канала и восстановленного второго канала таким образом, что восстановленный первый канал и восстановленный второй канал имеют значения, которые находятся в диапазоне ±20%, в отношении значений, определенных следующими уравнениями:
=
и
=
где является микшированным с понижением сигналом для кадра t и элемента разрешения по частоте k, является боковым усилением для кадра t и подполосы b, является разностным усилением для кадра t и подполосы b, gnorm является коэффициентом регулировки энергии, который может быть присутствовать или не присутствовать, и является необработанным разностным сигналом для кадра t и элемента разрешения по частоте k.
24. Устройство по п. 17,
в котором входной интерфейс (204) выполнен с возможностью приема кодированного многоканального сигнала (200) и получения бокового усиления (206) и разностного усиления (205) от кодированного многоканального сигнала (200);
при этом устройство дополнительно содержит блок (208) синтеза разностного сигнала для синтезирования разностного сигнала (209) с использованием разностного усиления (205);
причём блок (212) повышающего микширования выполнен с возможностью выполнения первой операции (70) взвешивания микшированного с понижением сигнала (207) с использованием бокового усиления (206) для получения первого взвешенного микшированного с понижением сигнала (76),
причём блок (212) повышающего микширования выполнен с возможностью выполнения второй операции (71) взвешивания с использованием бокового усиления (206) и микшированного с понижением сигнала (207) для получения второго взвешенного микшированного с понижением сигнала (77),
причём первая операция (70) взвешивания отличается от второй операции (71) взвешивания таким образом, что первый взвешенный микшированный с понижением сигнал (76) отличается от второго взвешенного микшированного с понижением сигнала (77), и
при этом блок (212) повышающего микширования выполнен с возможностью вычисления восстановленного первого канала с использованием комбинации (72) первого взвешенного микшированного с понижением сигнала (76) и разностного сигнала (209) и использования второй комбинации (73) второго взвешенного микшированного с понижением сигнала (77) и разностного сигнала (209).
25. Устройство по п. 24,
в котором блок (212) повышающего микширования выполнен с возможностью комбинирования (72) взвешенного микшированного с понижением сигнала (76) и разностного сигнала (209) при вычислении восстановленного первого канала, и
при этом блок (212) повышающего микширования выполнен с возможностью комбинирования (73) второго взвешенного микшированного с понижением сигнала (77) и разностного сигнала (209) с использованием второго правила (73) комбинации при вычислении восстановленного второго канала, причем первое правило (72) комбинации и второе правило (73) комбинации отличаются друг от друга, или
при этом одно из первого и второго правил (72, 73) комбинации является операцией сложения, и другое из первого и второго правил комбинации является операцией вычитания.
26. Устройство по п. 23,
в котором блок (212) повышающего микширования выполнен с возможностью выполнения первой операции (70) взвешивания, содержащей весовой коэффициент, выведенный из суммы бокового усиления и первого заданного числа, и
при этом блок (212) повышающего микширования выполнен с возможностью выполнения второй операции (71) взвешивания, содержащей весовой коэффициент, выведенный из разности между вторым заданным числом и боковым усилением, причем первое и второе заданные числа равны друг другу или отличаются друг от друга.
27. Устройство по п. 23,
в котором блок (208) синтеза разностного сигнала выполнен с возможностью взвешивания микшированного с понижением сигнала (207) из предыдущего кадра с использованием разностного усиления (209) для текущего кадра, чтобы получить разностный сигнал (209) для текущего кадра, или
взвешивания (88) декоррелированного сигнала, выведенного (80) из текущего кадра или из одного или более предыдущих кадров с использованием разностного усиления (205) для текущего кадра, чтобы получить разностный сигнал (209) для текущего кадра.
28. Устройство по п. 23,
в котором блок (208) вычисления разностного сигнала выполнен с возможностью вычисления разностного сигнала (209) таким образом, что энергия разностного сигнала (209) равна энергии сигнала, указанной разностным усилением (205).
29. Устройство по п. 23,
в котором блок (208) вычисления разностного сигнала выполнен с возможностью вычисления разностного сигнала таким образом, что значения разностного сигнала находятся в диапазоне ±20% от значений, определенных на основании следующего уравнения:
=,
где является разностным сигналом для кадра t и элемента разрешения по частоте k, является разностным усилением для кадра t и подполосы b, содержащей элемент разрешения по частоте k, и является разностным сигналом, и является коэффициентом регулировки энергии, который может присутствовать или не присутствовать.
30. Устройство по п. 23,
в котором является коэффициентом нормализации энергии, имеющим значения в диапазоне ±20% от значений, определенных следующим уравнением:
,
где является энергией микшированного с понижением сигнала для кадра t и подполосы b, и является энергией разностного сигнала для подполосы b и кадра t, или
в котором необработанный сигнал для разностного сигнала определяется на основании следующего уравнения:
=,
где является необработанным сигналом для разностного сигнала,
где является микшированным с понижением сигналом для кадра t- и элемента разрешения по частоте k, является задержкой кадра больше 0, или
в котором блок (212) повышающего микширования выполнен с возможностью вычисления восстановленного первого канала и восстановленного второго канала таким образом, что восстановленный первый канал и восстановленный второй канал имеют значения, которые находятся в диапазоне ±20%, в отношении значений, определенных следующими уравнениями:
=
и
=
где является микшированным с понижением сигналом для кадра t и элемента разрешения по частоте k, является боковым усилением для кадра t и подполосы b, является разностным усилением для кадра t и подполосы b, gnorm является коэффициентом регулировки энергии, который может быть присутствовать или не присутствовать, и является необработанным разностным сигналом для кадра t и элемента разрешения по частоте k.
31. Устройство по п. 17,
в котором блок (212) повышающего микширования выполнен с возможностью вычисления восстановленного первого канала (213) и восстановленного второго канала (214) в спектральной области,
причем устройство дополнительно содержит блок (216) спектрально-временного преобразования для преобразования восстановленного первого канала и восстановленного второго канала во временную область,
причем блок повышающего микширования выполнен с возможностью применения более сильного поворота фазы к каналу, имеющему более низкую энергию, чем к каналу, имеющему более высокую энергию, только когда разность энергий между каналами больше заданной пороговой величины.
32. Устройство по п. 31,
в котором блок (216) спектрально-временного преобразования выполнен с возможностью (301) выполнения для каждого из первого и второго восстановленных каналов преобразования последующих кадров во временную последовательность кадров,
взвешивания (1312) каждого временного кадра с использованием окна синтеза; и
выполнения наложения со сложением (1314) последующих обработанных с помощью оконной функции временных кадров, чтобы получить временной блок первого восстановленного канала (217) и временной блок второго восстановленного канала (218).
33. Способ понижающего микширования многоканального сигнала (100), содержащего по меньшей мере два канала (101, 102), причём способ содержит этапы, на которых:
вычисляют (34) микшированный с понижением сигнал (122) на основе многоканального сигнала (100), причем вычисление содержит вычисление понижающего микширования с использованием абсолютной фазовой компенсации таким образом, что поворот фазы применяется только к каналу, имеющему более низкую энергию среди по меньшей мере двух каналов, или к каналу сильнее применяется поворот фазы, чем к каналу, имеющему более высокую энергию, при вычислении микшированного с понижением сигнала (122); и
формируют (160) выходной сигнал, выходной сигнал содержит информацию о микшированном с понижением сигнале (122).
34. Способ повышающего микширования кодированного многоканального сигнала (200), причём способ содержит этапы, на которых:
принимают (204) кодированный многоканальный сигнал (200) и для получения микшированного с понижением сигнала (207) на основе кодированного многоканального сигнала (200);
выполняют повышающее микширование (212) микшированного с понижением сигнала (207), повышающее микширование содержит вычисление восстановленного первого канала (213) и восстановленного второго канала (214) с использованием абсолютной фазовой компенсации таким образом, что поворот фазы применяется только к микшированному с понижением сигналу при восстановлении канала, имеющего более низкую энергию среди восстановленного первого канала (213) и восстановленного второго канала (214), или к нему применяется более сильный поворот фазы, чем к каналу, имеющему большую энергию среди восстановленного первого канала (213) и восстановленного второго канала (214).
35. Физический носитель данных, на котором сохранена компьютерная программа для выполнения при ее работе на компьютере или в процессоре способа по п. 33.
36. Физический носитель данных, на котором сохранена компьютерная программа для выполнения при ее работе на компьютере или в процессоре способа по п. 34.
Станок для изготовления деревянных ниточных катушек из цилиндрических, снабженных осевым отверстием, заготовок | 1923 |
|
SU2008A1 |
ПАРАМЕТРИЧЕСКОЕ КОДИРОВАНИЕ И ДЕКОДИРОВАНИЕ | 2010 |
|
RU2560790C2 |
СПОСОБ И УСТРОЙСТВО ДЛЯ ГЕНЕРАЦИИ БИНАУРАЛЬНОГО АУДИОСИГНАЛА | 2008 |
|
RU2443075C2 |
КОДИРОВАНИЕ ЗВУКА С ИСПОЛЬЗОВАНИЕМ ДЕКОРРЕЛИРОВАННЫХ СИГНАЛОВ | 2005 |
|
RU2369982C2 |
Приспособление для суммирования отрезков прямых линий | 1923 |
|
SU2010A1 |
US 9269361 B2, 23.02.2016 | |||
US 8817991 B2, 26.08.2014 | |||
US 8964994 B2, 24.02.2015. |
Авторы
Даты
2020-07-24—Публикация
2017-10-30—Подача