ОБОРУДОВАНИЕ ДЛЯ КОДИРОВАНИЯ ИЛИ ДЕКОДИРОВАНИЯ КОДИРОВАННОГО МНОГОКАНАЛЬНОГО СИГНАЛА С ИСПОЛЬЗОВАНИЕМ ЗАПОЛНЯЮЩЕГО СИГНАЛА, СФОРМИРОВАННОГО ПОСРЕДСТВОМ ШИРОКОПОЛОСНОГО ФИЛЬТРА Российский патент 2021 года по МПК G10L19/08 

Описание патента на изобретение RU2741379C1

Настоящее изобретение относится к аудиообработке и, в частности, к многоканальной аудиообработке в оборудовании или способе для декодирования кодированного многоканального сигнала.

Кодек предшествующего уровня техники для параметрического кодирования стереосигналов на низких скоростях передачи битов представляет собой MPEG-кодек xHE-AAC. Он содержит режим полнопараметрического стереокодирования на основе понижающего мономикширования и стереопараметров межканальной разности уровней (ILD) и межканальной когерентности (ICC), которые оцениваются в подполосах частот. Вывод синтезируется из понижающего мономикширования посредством матрицирования в каждой подполосе частот подполосного сигнала понижающего микширования и декоррелированной версии этого подполосного сигнала понижающего микширования, которая получается посредством применения подполосных фильтров в QMF-гребенке фильтров.

Имеются некоторые недостатки, связанные с xHE-AAC для кодирования речевых элементов. Фильтры, посредством которых формируется второй синтетический сигнал, формируют сильно реверберирующую версию входного сигнала, что требует дакера. Следовательно, обработка в большой степени размывает спектральную форму входного сигнала со временем. Это хорошо работает для многих типов сигналов, но для речевых сигналов, в которых спектральная огибающая изменяется быстро, это вызывает неестественное окрашивание и слышимые артефакты, такие как одновременный разговор или фантомный голос. Кроме того, фильтры зависят от временного разрешения базовой QMF-гребенки фильтров, которая изменяется с частотой дискретизации. Следовательно, выходной сигнал не является согласованным для различных частот дискретизации.

Кроме этого, 3GPP-кодек AMR-WB+ содержит полупараметрический стереорежим, поддерживающий скорости передачи битов от 7 до 48 Кбит/с. Он основан на среднем/боковом преобразовании левого и правого входного канала. В низкочастотном диапазоне, боковой сигнал s прогнозируется посредством среднего сигнала m, чтобы получать усиление баланса, и m и остаток прогнозирования кодируются и передаются, наряду с коэффициентом прогнозирования, в декодер. В диапазоне средних частот, кодируется только сигнал m понижающего микширования, и отсутствующий сигнал s прогнозируется из m с использованием FIR-фильтра низшего порядка, который вычисляется в кодере. Это комбинируется с расширением полосы пропускания для обоих каналов. Кодек, в общем, дает в результате более естественный звук, чем xHE-AAC для речи, но сталкивается с несколькими проблемами. Процедура прогнозирования s посредством m посредством FIR-фильтра низшего порядка не работает очень хорошо, если входные каналы являются только слабокоррелированными, например, как в случае эховых речевых сигналов или одновременного разговора. Кроме того, кодек не может обрабатывать несинфазные сигналы, что может приводить к существенным потерям по качеству, и наблюдается то, что стереоизображение декодированного вывода обычно является очень сжатым. Кроме того, способ не является полнопараметрическим и в силу этого не является эффективным с точки зрения скорости передачи битов.

Обычно полнопараметрический способ может приводить к ухудшениям качества звука вследствие такого факта, что любые части сигнала, потерянные вследствие параметрического кодирования, не реконструируются на стороне декодера.

С одной стороны, процедуры с сохранением формы сигнала, такие как среднее/боковое кодирование и т.п., не обеспечивают существенного снижения скоростей передачи битов, которое может получаться из параметрических многоканальных кодеров.

Цель настоящего изобретения заключается в том, чтобы предложить усовершенствованный принцип для декодирования кодированного многоканального аудиосигнала.

Эта цель достигается посредством оборудования для декодирования кодированного многоканального сигнала, способа декодирования кодированного многоканального сигнала по п. 37, компьютерной программы по п. 38 и декоррелятора аудиосигналов по п. 39, способа декорреляции входного аудиосигнала по п. 49 или компьютерной программы по п. 50.

Настоящее изобретение основано на таких выявленных микшированиях, что смешанный подход является применимым для декодирования кодированного многоканального сигнала. Этот смешанный подход основывается на использовании заполняющего сигнала, сформированного посредством декорреляционного фильтра, и этот заполняющий сигнал затем используется посредством многоканального процессора, такого как параметрический или другой многоканальный процессор, для того чтобы формировать декодированный многоканальный сигнал. В частности, декорреляционный фильтр представляет собой широкополосный фильтр, и многоканальный процессор выполнен с возможностью применять узкополосную обработку к спектральному представлению. Таким образом, заполняющий сигнал предпочтительно формируется во временной области, например, посредством процедуры всечастотной фильтрации, и многоканальная обработка осуществляется в спектральной области с использованием спектрального представления декодированного базового канала и, дополнительно, с использованием спектрального представления заполняющего сигнала, сформированного из заполняющего сигнала, вычисленного во временной области.

Таким образом, преимущества многоканальной обработки в частотной области, с одной стороны, и декорреляции во временной области, с другой стороны, комбинируются применимым способом для того, чтобы получать декодированный многоканальный сигнал, имеющий высокое качество звука. Тем не менее скорость передачи битов для передачи кодированного многоканального сигнала сохраняется максимально возможно низкой вследствие того факта, что кодированный многоканальный сигнал типично имеет не формат кодирования с сохранением формы сигнала, а, например, формат параметрического многоканального кодирования. Следовательно, для формирования заполняющего сигнала, используются только доступные для декодера данные, такие как декодированный базовый канал, и в конкретных вариантах осуществления, дополнительные стереопараметры, такие как параметр усиления или параметр прогнозирования либо, альтернативно, ILD, ICC или любые другие стереопараметры, известные в данной области техники.

Далее поясняются несколько предпочтительных вариантов осуществления. Наиболее эффективный способ кодировать стереосигналы состоит в том, чтобы использовать параметрические способы, такие как бинауральное кодирование по сигнальным меткам или параметрическое стерео. Они направлены на реконструирование пространственного впечатления из понижающего мономикширования посредством восстановления нескольких пространственных сигнальных меток в подполосах частот и, по сути, основаны на психоакустике. Имеется другой способ рассмотрения параметрических способов: можно просто пытаться параметрически моделировать один канал посредством другого, пытаясь использовать межканальную избыточность. Таким образом, можно восстанавливать часть вторичного канала из первичного канала, но обычно остается остаточный компонент. Опускание этого компонента обычно приводит к нестабильному стереоизображению декодированного вывода. Следовательно, необходимо заполнять подходящую замену для таких остаточных компонентов. Поскольку такая замена является слепой, безопаснее всего извлекать такие части из второго сигнала, который имеет аналогичные временные и спектральные свойства с сигналом понижающего микширования.

Следовательно, варианты осуществления настоящего изобретения, в частности, являются применимыми в контексте параметрического аудиокодера и, в частности, параметрического аудиодекодера, в котором замены для отсутствующих остаточных частей извлекаются из искусственного сигнала, сформированного посредством декорреляционного фильтра на стороне декодера.

Дополнительные варианты осуществления относятся к процедурам для формирования искусственного сигнала. Варианты осуществления относятся к способам формирования искусственного второго канала, из которого извлекаются замены для отсутствующих остаточных частей, и его использования в полнопараметрическом стереокодере, называемым "улучшенным стереозаполнением". Сигнал является более подходящим для кодирования речевых сигналов, чем xHE-AAC-сигнал, поскольку его спектральная форма ближе во времени к входному сигналу. Он формируется во временной области посредством применения специальной структуры фильтров и в силу этого независимо от гребенки фильтров, в которой выполняется повышающее стереомикширование. В силу этого он может использоваться в различных процедурах повышающего микширования. Например, он может использоваться в xHE-AAC, чтобы заменять искусственные сигналы после преобразования в QMF-область, что должно повышать производительность для речи, а также в среднем диапазоне AMR-WB+, чтобы замещать остаток в среднем/боковом прогнозировании, что должно повышать производительность для слабокоррелированных входных каналов и улучшать стереоизображение. В частности, он представляет интерес для кодеков, содержащих различные стереорежимы (такие как стереообработка во временной области и в частотной области).

В предпочтительных вариантах осуществления, декорреляционный фильтр содержит, по меньшей мере, одну ячейку всечастотного фильтра, причем, по меньшей мере, одна ячейка всечастотного фильтра содержит две ячейки всечастотного фильтра Шредера, вложенные в третий всечастотный фильтр Шредера, и/или всечастотный фильтр, содержит, по меньшей мере, одну ячейку всечастотного фильтра, причем ячейка всечастотного фильтра содержит два каскадных всечастотных фильтра Шредера, при этом ввод в первый каскадный всечастотный фильтр Шредера и вывод из второго каскадного всечастотного фильтра Шредера соединяются, в направлении последовательности сигналов, перед каскадом задержки третьего всечастотного фильтра Шредера.

В дополнительном варианте осуществления, несколько таких ячеек всечастотного фильтра, содержащих три вложенных всечастотных фильтра Шредера, каскадируются, чтобы получать специфически применимый всечастотный фильтр, который имеет хороший импульсный отклик для целей стерео- или многоканального декодирования.

Здесь следует подчеркнуть, что хотя несколько аспектов настоящего изобретения поясняются относительно стереодекодирования, формирующего, из базового моноканала, левый канал повышающего микширования и правый канал повышающего микширования, настоящее изобретение также является применимым для многоканального декодирования, в котором сигнал, например, четырех каналов кодируется с использованием двух базовых каналов, при этом первые два канала повышающего микширования формируются из первого базового канала, и третий и четвертый канал повышающего микширования формируются из второго базового канала. В других альтернативах, настоящее изобретение также является применимым для того, чтобы формировать, из одного базового канала, три или более каналов повышающего микширования всегда с использованием предпочтительно идентичного заполняющего сигнала. Тем не менее во всех таких процедурах заполняющий сигнал формируется широкополосным способом, т.е. предпочтительно во временной области, и многоканальная обработка для формирования, из декодированного базового канала, двух или более каналов повышающего микширования проводится в частотной области.

Декорреляционный фильтр предпочтительно работает полностью во временной области. Тем не менее также являются применимыми другие гибридные подходы, в которых, например, декорреляция выполняется посредством декорреляции части полосы низких частот, с одной стороны, и части полосы высоких частот, с другой стороны, тогда как, например, многоканальная обработка выполняется при гораздо более высоком спектральном разрешении. Таким образом, примерно, спектральное разрешение многоканальной обработки, например может составлять не ниже спектрального разрешения обработки каждой DFT- или FFT-линии отдельно, и параметрические данные задаются для нескольких полос частот, причем каждая полоса частот, например, содержит две, три или более DFT/FFT/MDCT-линий, и фильтрация декодированного базового канала для того, чтобы получать сигнал регистрации, выполняется широкополосно, т.е. во временной области, или полуполосно, например, в полосе низких частот и полосе высоких частот либо, вероятно, в трех различных полосах частот. Таким образом, в любом случае, спектральное разрешение стереообработки, которая типично выполняется для отдельных линий или подполосных сигналов, составляет наибольшее спектральное разрешение. Типично, стереопараметры, сформированные в кодере и передаваемые и используемые посредством предпочтительного декодера, имеют среднее спектральное разрешение. Таким образом, параметры задаются для полос частот, полосы частот могут иметь варьирующиеся полосы пропускания, но каждая полоса частот содержит, по меньшей мере, две или более линий или подполосных сигналов, сформированных и используемых посредством многоканальных процессоров. Кроме того, спектральное разрешение декорреляционной фильтрации является очень низким, а в случае фильтрации во временной области чрезвычайно низким, либо является средним в случае формирования различных декоррелированных сигналов для различных полос частот, но это среднее спектральное разрешение является еще более низким, чем разрешение, при котором задаются параметры для параметрической обработки.

В предпочтительном варианте осуществления, характеристика фильтра для декорреляционного фильтра представляет собой всечастотный фильтр, имеющий область постоянных абсолютных величин по всему интересующему спектральному диапазону. Тем не менее другие декорреляционные фильтры, которые не имеют этого идеального поведения всечастотного фильтра, также являются применимыми при условии, что, в предпочтительном варианте осуществления, область постоянной абсолютной величины характеристики фильтра превышает степень спектральной детализации спектрального представления декодированного базового канала и степень спектральной детализации спектрального представления заполняющего сигнала.

Таким образом, необходимо удостоверяться в том, что степень спектральной детализации заполняющего сигнала или декодированного базового канала, для которого выполняется многоканальная обработка, не оказывает влияние на декорреляционную фильтрацию таким образом, что высококачественный заполняющий сигнал формируется, предпочтительно регулируется с использованием коэффициента нормирования энергии и затем используется для формирования двух или более каналов повышающего микширования.

Кроме того, следует отметить, что формирование декоррелированного сигнала, к примеру, как описано относительно поясненных ниже фиг. 4, 5 или 6, может использоваться в контексте многоканального декодера, но также может использоваться в любом другом варианте применения, в котором декоррелированный сигнал является применимым, к примеру, при любом рендеринге аудиосигналов, в любой операции реверберации и т.д.

Далее поясняются предпочтительные варианты осуществления относительно прилагаемых чертежей, на которых:

Фиг. 1a иллюстрирует формирование искусственных сигналов при использовании с базовым EVS-кодером;

Фиг. 1b иллюстрирует формирование искусственных сигналов при использовании с базовым EVS-кодером в соответствии с другим вариантом осуществления;

Фиг. 2a иллюстрирует интеграцию в DFT-стереообработку, включающую в себя повышающее микширование с расширением полосы пропускания во временной области;

Фиг. 2b иллюстрирует интеграцию в DFT-стереообработку, включающую в себя повышающее микширование с расширением полосы пропускания во временной области в соответствии с другим вариантом осуществления;

Фиг. 3 иллюстрирует интеграцию в систему, содержащую несколько модулей стереообработки;

Фиг. 4 иллюстрирует базовый всечастотный модуль;

Фиг. 5 иллюстрирует модуль всечастотного фильтра;

Фиг. 6 иллюстрирует импульсный отклик предпочтительного всечастотного фильтра;

Фиг. 7a иллюстрирует оборудование для декодирования кодированного многоканального сигнала;

Фиг. 7b иллюстрирует предпочтительную реализацию декорреляционного фильтра;

Фиг. 7c иллюстрирует комбинацию базового канального декодера и спектрального преобразователя;

Фиг. 8 иллюстрирует предпочтительную реализацию многоканального процессора;

Фиг. 9a иллюстрирует дополнительную реализацию оборудования для декодирования кодированного многоканального сигнала с использованием обработки расширения полосы пропускания;

Фиг. 9b иллюстрирует предпочтительные варианты осуществления для формирования сжатого коэффициента нормирования энергии;

Фиг. 10 иллюстрирует оборудование для декодирования кодированного многоканального сигнала в соответствии с дополнительным вариантом осуществления, работающим с использованием канального преобразования в базовом канальном декодере;

Фиг. 11 иллюстрирует взаимодействие между модулем повторной дискретизации для базового канального декодера и последующим соединенным декорреляционным фильтром;

Фиг. 12 иллюстрирует примерный параметрический многоканальный кодер, применимый с оборудованием для декодирования в соответствии с настоящим изобретением;

Фиг. 13 иллюстрирует предпочтительную реализацию оборудования для декодирования кодированного многоканального сигнала; и

Фиг. 14 иллюстрирует дополнительную предпочтительную реализацию многоканального процессора.

Фиг. 7a иллюстрирует предпочтительный вариант осуществления оборудования для декодирования кодированного многоканального сигнала. Кодированный многоканальный сигнал содержит кодированный базовый канал, который вводится в базовый канальный декодер 700 для декодирования кодированного базового канала для того, чтобы получать декодированный базовый канал.

Кроме того, декодированный базовый канал вводится в декорреляционный фильтр 800 для фильтрации, по меньшей мере, части декодированного базового канала для того, чтобы получать заполняющий сигнал.

Как декодированный базовый канал, так и заполняющий сигнал вводятся в многоканальный процессор 900 для выполнения многоканальной обработки с использованием спектрального представления декодированного базового канала и, дополнительно, спектрального представления заполняющего сигнала. Многоканальный процессор выводит декодированный многоканальный сигнал, который содержит, например, левый канал повышающего микширования и правый канал повышающего микширования в контексте стереообработки либо три или более каналов повышающего микширования в случае многоканальной обработки, охватывающей более двух выходных каналов.

Декорреляционный фильтр 800 сконфигурирован как широкополосный фильтр, и многоканальный процессор 900 выполнен с возможностью применять узкополосную обработку к спектральному представлению декодированного базового канала и спектральному представлению заполняющего сигнала. Важно, что широкополосная фильтрация также выполняется, когда сигнал, который должен фильтроваться, понижающе дискретизируется с более высокой частоты дискретизации, к примеру, понижающе дискретизируется до 16 кГц или 12,8 кГц с более высокой частоты дискретизации, такой как 22 кГц или ниже.

Таким образом, многоканальный процессор работает со степенью спектральной детализации, которая значительно выше степени спектральной детализации, с которой формируется заполняющий сигнал. Другими словами, характеристика фильтра для декорреляционного фильтра выбирается таким образом, что область постоянной абсолютной величины характеристики фильтра превышает степень спектральной детализации спектрального представления декодированного базового канала и степень спектральной детализации спектрального представления заполняющего сигнала.

Таким образом, например, когда степень спектральной детализации многоканального процессора является такой, что для каждой спектральной линии, например, DFT-спектра с 1024 линиями, выполняется обработка повышающего микширования, в таком случае декорреляционный фильтр задается таким образом, что область постоянной абсолютной величины характеристики фильтра для декорреляционного фильтра имеет частотную ширину, которая выше двух или более спектральных линий DFT-спектра. Типично, декорреляционный фильтр работает во временной области и используемой полосе спектра, например, от 20 Гц до 20 кГц. Такие фильтры известны как всечастотные фильтры, и здесь следует отметить, что диапазон идеально постоянных абсолютных величин, в котором абсолютная величина является идеально постоянной, типично может не получаться посредством всечастотных фильтров, но варьирования относительно постоянной абсолютной величины посредством +/-10% среднего значения также выявляются как применимые для всечастотного фильтра и в силу этого также представляют "постоянную абсолютную величину характеристики фильтра".

Фиг. 7b иллюстрирует реализацию декорреляционного фильтра 800 с каскадом 802 фильтра временной области и последующим соединенным спектральным преобразователем 804, формирующим спектральное представление заполняющего сигнала. Спектральный преобразователь 804 типично реализуется в качестве FFT- или DFT-процессора, хотя другие алгоритмы преобразования в частотно-временной области также являются применимыми.

Фиг. 7c иллюстрирует предпочтительную реализацию взаимодействия между базовым канальным декодером 700 и базовым канальным спектральным преобразователем 902. Типично, базовый канальный декодер выполнен с возможностью работать в качестве базового канального декодера во временной области, формирующего базовый канальный сигнал временной области, в то время как многоканальный процессор 900 работает в спектральной области. Таким образом, многоканальный процессор 900 по фиг. 7a имеет, в качестве входного каскада, базовый канальный спектральный преобразователь 902 по фиг. 7c и спектральное представление базового канального спектрального преобразователя 902 затем перенаправляется в обрабатывающие элементы многоканального процессора, которые, например, проиллюстрированы на фиг. 8, фиг. 13, фиг. 14, фиг. 9a или фиг. 10. В этом контексте, следует указывать, что, в общем, ссылки с номерами, начинающиеся с "7", представляют элементы, которые предпочтительно принадлежат базовому канальному декодеру 700 по фиг. 7a. Элементы, имеющие ссылку с номером, начинающуюся с "8", предпочтительно принадлежат декорреляционному фильтру 800 по фиг. 7a, и элементы со ссылкой с номером, начинающейся с "9" на чертежах, предпочтительно принадлежат многоканальному процессору 900 по фиг. 7a. Тем не менее, здесь следует отметить, что разделения между отдельными элементами проводятся только для описания настоящего изобретения, и любая фактическая реализация может иметь другие, типично аппаратные или альтернативно программные, или смешанные аппаратные/программные блоки обработки, которые разделяются способом, отличающимся от логического разделения, проиллюстрированного на фиг. 7a и на других чертежах.

Фиг. 4 иллюстрирует предпочтительную реализацию каскада 802 фильтра, которая указывается в качестве 802'. В частности, фиг. 4 иллюстрирует базовый всечастотный модуль, который может быть включен в декорреляционный фильтр отдельно или вместе с дополнительными такими каскадными всечастотными модулями, как, например, проиллюстрировано на фиг. 5. Фиг. 5 иллюстрирует декорреляционный фильтр 802 примерно с пятью каскадными базовыми всечастотными модулями 502, 504, 506, 508, 510, в то время как каждый из базовых всечастотных модулей может реализовываться так, как указано на фиг. 4. Тем не менее, альтернативно, декорреляционный фильтр может включать в себя один базовый всечастотный модуль 403 по фиг. 4 и в силу этого представляет альтернативную реализацию каскада 802' декорреляционного фильтра.

Предпочтительно, каждый базовый всечастотный модуль содержит два всечастотных фильтра 401, 402 Шредера, вложенные в третий всечастотный фильтр 403 Шредера. В этой реализации, ячейка 403 всечастотного фильтра соединяется с двумя каскадными всечастотными фильтрами 401, 402 Шредера, при этом ввод в первый каскадный всечастотный фильтр 401 Шредера и вывод из второго каскадного всечастотного фильтра 402 Шредера соединяются, в направлении последовательности сигналов, перед каскадом 423 задержки третьего всечастотного фильтра Шредера.

В частности, всечастотный фильтр, проиллюстрированный на фиг. 4, содержит: первый сумматор 411, второй сумматор 412, третий сумматор 413, четвертый сумматор 414, пятый сумматор 415 и шестой сумматор 416; первый каскад 421 задержки, второй каскад 422 задержки и третий каскад 423 задержки; первую подачу 431 в прямом направлении с первым усилением в прямом направлении, первую подачу 431 в обратном направлении с первым усилением в обратном направлении, вторую подачу 442 в прямом направлении со вторым усилением в прямом направлении и вторую подачу 432 в обратном направлении со вторым усилением в обратном направлении; и третью подачу 443 в прямом направлении с третьим усилением в прямом направлении и третью подачу 433 в обратном направлении с третьим усилением в обратном направлении.

Соединения, проиллюстрированные на фиг. 4, являются следующим. Ввод в первый сумматор 411 представляет ввод во всечастотный фильтр 802, при этом второй ввод в первый сумматор 411 соединяется с выводом третьего каскада 423 задержки фильтра и содержит третью подачу 433 в обратном направлении с третьим усилением в обратном направлении. Вывод первого сумматора 411 соединяется с вводом во второй сумматор 412 и соединяется с вводом шестого сумматора 416 через третью подачу 443 в прямом направлении с третьим усилением в прямом направлении. Ввод во второй сумматор 412 соединяется с первым каскадом 421 задержки через первую подачу 431 в обратном направлении с первым усилением в обратном направлении. Вывод второго сумматора 412 соединяется с вводом первого каскада 421 задержки и соединяется с вводом третьего сумматора 413 через первую подачу 431 в прямом направлении с первым усилением в прямом направлении. Вывод первого каскада 421 задержки соединяется с дополнительным вводом третьего сумматора 413. Вывод третьего сумматора 413 соединяется с вводом четвертого сумматора 414. Дополнительный ввод в четвертый сумматор 414 соединяется с выводом второго каскада 422 задержки через вторую подачу 432 в обратном направлении со вторым усилением в обратном направлении. Вывод четвертого сумматора 414 соединяется с вводом во второй каскад 422 задержки и соединяется с вводом в пятый сумматор 415 через вторую подачу 442 в прямом направлении со вторым усилением в прямом направлении. Вывод второго каскада задержки 421 соединяется с дополнительным вводом в пятый сумматор 415. Вывод пятого сумматора 415 соединяется с вводом третьего каскада 423 задержки. Вывод третьего каскада 423 задержки соединяется с вводом в шестой сумматор 416. Дополнительный ввод в шестой сумматор 416 соединяется с выводом первого сумматора 411 через третью подачу 443 в прямом направлении с третьим усилением в прямом направлении. Вывод шестого сумматора 416 представляет вывод всечастотного 802 фильтра.

Предпочтительно, как проиллюстрировано на фиг. 8, многоканальный процессор 900 выполнен с возможностью определять первый канал повышающего микширования и второй канал повышающего микширования с использованием различных комбинирований со взвешиванием полос спектра декодированного базового канала и соответствующих полос спектра заполняющего сигнала. В частности, различные комбинирования со взвешиванием зависят от коэффициента прогнозирования и/или коэффициента усиления, извлеченного из кодированной параметрической информации, включенной в кодированный многоканальный сигнал. Кроме того, комбинирования со взвешиванием предпочтительно зависят от коэффициента нормирования по огибающей или, предпочтительно, коэффициента нормирования энергии, вычисленного с использованием полосы спектра декодированного базового канала и соответствующей полосы спектра заполняющего сигнала. Таким образом, процессор 904 по фиг. 8 принимает спектральное представление декодированного базового канала и спектральное представление заполняющего сигнала и выводит, предпочтительно во временной области, первый канал повышающего микширования и второй канал повышающего микширования, и коэффициент прогнозирования, коэффициент усиления и коэффициент нормирования энергии вводятся в расчете на полосу частот, и эти коэффициенты затем используются для всех спектральных линий в полосе частот, но изменяются для другой полосы частот, в которой эти данные извлекаются из кодированного сигнала или локально определяются в декодере.

В частности, коэффициент прогнозирования и коэффициент усиления типично представляют кодированные параметры, которые декодируются на стороне декодера и затем используются в повышающем микшировании параметрического стерео. В отличие от этого, коэффициент нормирования энергии вычисляется на стороне декодера типично с использованием полосы спектра декодированного базового канала и полосы спектра заполняющего сигнала. То же справедливо для коэффициента нормирования огибающей. Предпочтительно, нормирование по огибающей соответствует нормированию энергии в расчете на каждую полосу частот.

Хотя настоящее изобретение поясняется для конкретного опорного кодера, проиллюстрированного на фиг. 12, и конкретного декодера, проиллюстрированного на фиг. 13 или фиг. 14, тем не менее следует отметить, что формирование широкополосного заполняющего сигнала и применение широкополосного заполняющего сигнала в многоканальном стереодекодировании, работающем в узкополосной спектральной области, также может применяться к любым другим технологиям параметрического стереокодирования, известным в данной области техники. Они представляют собой параметрическое стереокодирование, известное из HE-AAC-стандарта или из стандарта объемного звучания MPEG, или из бинаурального кодирования по сигнальным меткам (BCC-кодирование), либо любые другие инструментальные средства стереокодирования/декодирования или любые другие инструментальные средства многоканального кодирования/декодирования.

Фиг. 9a иллюстрирует дополнительный предпочтительный вариант осуществления многоканального декодера, содержащего каскад 904 многоканального процессора, формирующий первый канал повышающего микширования и второй канал повышающего микширования и последующие соединенные элементы 908, 910 расширения полосы пропускания во временной области, которые выполняют расширение полосы пропускания во временной области направленным или ненаправленным способом в первый канал повышающего микширования и второй канал повышающего микширования отдельно. Типично, модуль 912 кодирования со взвешиванием и вычисления коэффициентов нормирования энергии предоставляется для того, чтобы вычислять коэффициент нормирования энергии, который должен использоваться посредством многоканального процессора 904. Тем не менее в альтернативных вариантах осуществления, которые поясняются относительно фиг. 1a или фиг. 1b и фиг. 2a или фиг. 2b, расширение полосы пропускания выполняется с моно- или декодированным базовым сигналом, и только один элемент 960 стереообработки по фиг. 2a или фиг. 2b предоставляется для формирования, из моносигнала полосы высоких частот, сигнала левого канала полосы высоких частот и сигнала правого канала полосы высоких частот, которые затем суммируются с сигналом левого канала полосы низких частот и сигнал правого канала полосы низких частот с использованием сумматоров 994a и 994b.

Это суммирование, проиллюстрированное на фиг. 2a или 2b, например, может выполняться во временной области. Далее, этап 960 формирует сигнал временной области. Это представляет собой предпочтительную реализацию. Тем не менее, альтернативно, стереообработка 904 на фиг. 2a или 2b и сигналы левого канала и правого канала из блока 960 могут формироваться в спектральной области, и сумматоры 994a и 994b, например, реализуются посредством гребенки синтезирующих фильтров таким образом, что данные полосы низких частот из блока 904 вводятся во ввод полосы низких частот гребенки синтезирующих фильтров, и вывод полосы высоких частот блока 960 вводится во ввод полосы высоких частот гребенки синтезирующих фильтров, и вывод гребенки синтезирующих фильтров представляет собой соответствующий сигнал временной области для левого канала или сигнал временной области для правого канала.

Предпочтительно, модуль 912 кодирования со взвешиванием и вычисления коэффициентов на фиг. 9a формирует и вычисляет значение энергии сигнала полосы высоких частот, например, как также проиллюстрировано в 961 на фиг. 1a или фиг. 1b, и использует эту энергетическую оценку для формирования первого и второго каналов повышающего микширования полосы высоких частот, поясняется ниже относительно уравнений 28-31 в предпочтительном варианте осуществления.

Предпочтительно, процессор 904 для вычисления комбинирования со взвешиванием принимает, в качестве ввода, коэффициент нормирования энергии в расчете на полосу частот. Тем не менее в предпочтительном варианте осуществления сжатие коэффициента нормирования энергии выполняется, и различные комбинирования со взвешиванием вычисляются с использованием сжатого коэффициента нормирования энергии. Таким образом, относительно фиг. 8, процессор 904 принимает, вместо несжатого коэффициента нормирования энергии, сжатый коэффициент нормирования энергии. Эта процедура проиллюстрирована, относительно различных вариантов осуществления, на фиг. 9b. Этап 920 принимает энергию остаточного или заполняющего сигнала в расчете на частотно-временной элемент разрешения и энергию декодированного базового канала в расчете на временной и частотный элемент разрешения и затем вычисляет абсолютный коэффициент нормирования энергии для полосы частот, содержащей несколько таких частотно-временных элементов разрешения. Затем на этапе 921, выполняется сжатие коэффициента нормирования энергии, и это сжатие, например, может представлять собой использование логарифмической функции, например, как поясняется относительно уравнения 22 ниже.

На основе сжатого коэффициента нормирования энергии, сформированного посредством этапа 921, задаются различные процедуры для формирования сжатого коэффициента нормирования энергии. В первой альтернативе, функция применяется к сжатому коэффициенту, как проиллюстрировано в 922, и эта функция предпочтительно представляет собой нелинейную функцию. Затем на этапе 923, оцененный коэффициент разворачивается, чтобы получать конкретный сжатый коэффициент нормирования энергии. Следовательно, этап 922, например, может реализовываться в функциональном выражении в уравнении (22), которое приводится ниже, и этап 923 выполняется посредством "экспоненциальной" функции в уравнении (22). Тем не менее, другая альтернатива, приводящая к аналогичному сжатому коэффициенту нормирования энергии, приводится на этапе 924 и 925. На этапе 924, коэффициент оценки определяется, и на этапе 925, коэффициент оценки применяется к коэффициенту нормирования энергии, полученному из этапа 920. Таким образом, применение коэффициента в коэффициент нормирования энергии, как указано на этапе 912, например, может реализовываться посредством проиллюстрированного ниже уравнения 27.

Таким образом, например, как проиллюстрировано в уравнении 27 ниже, коэффициент оценки определяется, и этот коэффициент представляет собой просто коэффициент, который может умножаться на коэффициент gnorm нормирования энергии, определенный посредством этапа 920, без фактического выполнения специальных оценок функций. Следовательно, вычисление этапа 925 также может опускаться, т.е. конкретное вычисление сжатого коэффициента нормирования энергии не требуется, как только исходный несжатый коэффициент нормирования энергии и коэффициент оценки и дополнительный операнд в пределах умножения, такой как спектральное значение заполняющего сигнала, умножаются между собой, чтобы получать нормированную спектральную линию заполняющих сигналов.

Фиг. 10 иллюстрирует дополнительную реализацию, в которой кодированный многоканальный сигнал не просто представляет собой моносигнал, а, например, содержит кодированный средний сигнал и кодированный боковой сигнал. В такой ситуации, базовый канальный декодер 700 не только декодирует кодированный средний сигнал и кодированный боковой сигнал или, в общем, кодированный первый сигнал и кодированный второй сигнал, а дополнительно выполняет канальное преобразование 705, например, в форме среднего/бокового преобразования и обратного среднего/бокового преобразования, чтобы вычислять первичный канал, такой как L, и вторичный канал, такой как R, либо преобразование представляет собой преобразование Карунена-Лоэва.

Тем не менее результат канального преобразования и, в частности, результат операции декодирования заключается в том, что первичный канал представляет собой широкополосный канал, в то время как вторичный канал представляет собой узкополосный канал. После этого широкополосный канал вводится в декорреляционный фильтр 800, и фильтрация верхних частот выполняется в блоке 930, чтобы формировать декоррелированный сигнал верхних частот, и этот декоррелированный сигнал далее частот затем суммируется с узкополосным вторичным каналом в модуле 934 комбинирования полос частот, чтобы получать широкополосный вторичный канал таким образом, что, в конечном счете, выводятся широкополосный первичный канал и широкополосный вторичный канал.

Фиг. 11 иллюстрирует дополнительную реализацию, в которой декодированный базовый канал, полученный посредством базового канального декодера 700 на определенной частоте дискретизации, ассоциированной с кодированным базовым каналом, вводится в модуль 710 повторной дискретизации, чтобы получать повторно дискретизированный базовый канал, который затем используется в многоканальном процессоре, который работает для повторно дискретизированного канала.

Фиг. 12 иллюстрирует предпочтительную реализацию опорного стереокодирования. На этапе 1200, межканальная разность IPD фаз вычисляется для первого канала, такого как L, и второго канала, такого как R. Это IPD-значение затем типично квантуется и выводится для каждой полосы частот в каждом временном кадре в качестве выходных данных 1206 кодера. Кроме того, IPD-значения используются для вычисления параметрических данных для стереосигнала, таких как параметр gt,b прогнозирования для каждой полосы b частот в каждом временном кадре t и параметр rt,b усиления для каждой полосы b частот в каждом временном кадре t.

Кроме того, первый и второй каналы также используются в среднем/боковом процессоре 1203 для того, чтобы вычислять, для каждой полосы частот, средний сигнал и боковой сигнал.

В зависимости от реализации, только средний сигнал M может перенаправляться в кодер 1204, и боковой сигнал не перенаправляется в кодер 1204 таким образом, что выходные данные 1206 содержат только кодированный базовый канал, параметрические данные, сформированные посредством блока 1202, и IPD-информацию, сформированную посредством блока 1200.

Далее предпочтительный вариант осуществления поясняется относительно опорного кодера, но следует отметить, что также могут использоваться любые другие стереокодеры, как пояснено выше.

Опорный стереокодер

Стереокодер на основе DFT указывается для ссылки. Как обычно, частотно-временные векторы Lt и Rt левого и правого канала формируются посредством одновременного применения функции аналитического кодирования со взвешиванием с последующим дискретным преобразованием Фурье (DFT). DFT-элементы разрешения затем группируются в подполосы частот (Lt,k)k ∈ Ib resp. (Rt, kk)k ∈ Ib, где Ib обозначает набор индексов подполос частот.

Вычисление IPDS и понижающее микширование. Для понижающего микширования, межканальная разность фаз (IPD) для каждой полосы частот вычисляется следующим образом:

(1) ,

где z* обозначает комплексно-сопряженное число z. Она используется для того, чтобы формировать средний и боковой сигнал для каждой полосы частот:

(2)

и

(3)

для , где β является параметром абсолютного вращения фаз, например, заданным следующим образом:

(4) .

Вычисление параметров. В дополнение к IPD для каждой полосы частот, извлекаются два дополнительных стереопараметра. Оптимальный коэффициент для прогнозирования St,b посредством Mt,b, т.е. число gt,b таким образом, что энергия остатка:

(5)

является минимальной, и относительный коэффициент rt,b усиления, который, если применяется средний сигнал Mt, частотно корректирует энергию pt и Mt в каждой полосе частот, т.е.:

(6)

Оптимальный коэффициент прогнозирования может вычисляться из энергий в подполосах частот:

(7) и

и абсолютного значения внутреннего произведения Lt и Rt:

(8)

следующим образом:

(9) .

Из этого следует, что gt,b находится в [-1, 1]. Остаточное усиление может вычисляться аналогично из энергий и внутреннего произведения следующим образом:

(10) ,

что подразумевает:

(11) .

Фиг. 13 иллюстрирует предпочтительную реализацию стороны декодера. В блоке 700, представляющем базовый канальный декодер по фиг. 7a, кодированный базовый канал M декодируется.

Затем в блоке 940a, вычисляется первичный канал повышающего микширования, такой как L. Кроме того, в блоке 940b, вторичный канал повышающего микширования вычисляется, который, например, представляет собой канал R.

Оба блока 940a и 940b соединяются с генератором 800 заполняющих сигналов и принимают параметрические данные, сформированные посредством блока 1200 на фиг. 12 или 1202 по фиг. 12.

Предпочтительно, параметрические данные задаются в полосах частот, имеющих второе спектральное разрешение, и блоки 940a, 940b работают при высокой степени детализации спектрального разрешения и формируют спектральные линии с первым спектральным разрешением, которое выше второго спектрального разрешения.

Вывод блоков 940a, 940b, например, представляет собой ввод в частотно-временные преобразователи 961, 962. Эти преобразователи могут представлять собой DFT или любое другое преобразование и типично также содержат последующую обработку функции синтезирующего кодирования со взвешиванием и дополнительную операцию суммирования с перекрытием.

Дополнительно, генератор заполняющих сигналов принимает коэффициент нормирования энергии, и предпочтительно, сжатый коэффициент нормирования энергии и этот коэффициент используются для формирования корректно выровненной/взвешенной спектральной линии заполняющих сигналов для блоков 940a и 940b.

Далее приводится предпочтительная реализация блоков 940a, 940b. Оба блока содержат вычисление 941a коэффициента вращения фаз, вычисление первого весового коэффициента для спектральной линии декодированного базового канала, как указано посредством 942a и 942b. Кроме того, оба блока содержат вычисление 943a и 943b для вычисления второго весового коэффициента для спектральной линии заполняющего сигнала.

Кроме того, генератор 800 заполняющих сигналов принимает коэффициент нормирования энергии, сформированный посредством блока 945. Этот блок 945 принимает заполняющий сигнал в расчете на полосу частот и базовый канальный сигнал в расчете на полосу частот и затем вычисляет идентичный коэффициент нормирования энергии, используемый для всех линий в полосе частот.

В завершение, эти данные перенаправляются в процессор 946 для вычисления спектральных линий для первого и второго каналов повышающего микширования. С этой целью, процессор 946 принимает данные из блоков 941a, 941b, 942a, 942b, 943a, 943b и спектральной линии для декодированного базового канала и спектральной линии для заполняющего сигнала. Вывод блока 946 в таком случае представляет собой соответствующую спектральную линию для первого и второго канала повышающего микширования.

Далее приводятся предпочтительные реализации декодера.

Опорный декодер

Для ссылки указывается декодер на основе DFT, который соответствует кодеру, описанному выше. Частотно-временное преобразование из кодера применяется к декодированному понижающему микшированию, выдавая в результате частотно-временные векторы . С использованием деквантованных значений , и , левый и правый канал вычисляются следующим образом:

(12)

и

(13)

для k ∈ Ib, где является заменой для отсутствующего остатка pt,k из кодера, и gnorm является коэффициентом нормирования энергии:

(14)

который превращает относительное остаточное усиление rt,b прогнозирования в абсолютное усиление. Простой выбор для должен представлять собой следующее:

(15) ,

где db> обозначает кадровую задержку для каждой полосы частот, но это имеет определенные недостатки, а именно:

и могут иметь существенно отличающиеся спектральные и временные формы,

даже в случае совпадения спектральной и временной огибающих, использование (15) в (12) и (13) вызывает частотно-зависимые ILD и IPD, которые варьируются медленно только в диапазоне низких и средних частот. Это вызывает проблемы, например, для тональных элементов или речевых сигналов, задержка должна выбираться небольшой, так что она остается ниже порогового значения эхо-сигнала, но это вызывает сильное окрашивание вследствие гребенчатой фильтрации.

В силу этого лучше использовать частотно-временные элементы разрешения искусственного сигнала, который описывается ниже.

Коэффициент β вращения фаз снова вычисляется следующим образом:

(16) .

Формирование синтетических сигналов

Для замены отсутствующих остаточных частей при повышающем стереомикшировании, второй сигнал формируется из входного сигнала временной области, выводя второй сигнал . Проектное ограничение для этого фильтра представляет собой необходимость иметь короткий, плотный импульсный отклик. Это достигается посредством применения нескольких каскадов базовых всечастотных фильтров, полученных посредством вложения двух всечастотных фильтров Шредера в третий фильтр Шредера, т.е.:

(17) ,

где:

(18)

и

(19) .

Эти элементарные всечастотные фильтры:

(20)

предложены Шредером в контексте формирования искусственной реверберации, в котором они применяются как с большими усилениями, так и с большими задержками. Поскольку в этом контексте нежелательно иметь реверберирующий выходной сигнал, усиления и задержки выбираются довольно небольшими. Аналогично случаю реверберации, плотный и случайный импульсный отклик лучше всего получается посредством выбора задержек di, которые являются попарно взаимно-простыми для всех всечастотных фильтров.

Фильтр работает при фиксированной частоте дискретизации, независимо от полосы пропускания или частоты дискретизации сигнала, который доставляется посредством базового кодера. При использовании с EVS-кодером это необходимо, поскольку полоса пропускания может изменяться посредством детектора полосы пропускания в ходе работы, и фиксированная частота дискретизации гарантирует согласованный вывод. Предпочтительная частота дискретизации для всечастотного фильтра составляет 32 кГц, собственную сверхширокополосную частоту дискретизации, поскольку отсутствие остаточных частей выше 16 кГц обычно более не является слышимым. При использовании с EVS-кодером сигнал, непосредственно конструируется из ядра, что включает несколько процедур повторной дискретизации, как отображается на фиг. 1.

Фильтр, который, как выявлено, хорошо работает на частоте дискретизации в 32 кГц, представляет собой следующее:

(21) ,

где Bi являются базовыми всечастотными фильтрами с усилениями и задержками, отображаемыми в таблице 1. Импульсный отклик этого фильтра проиллюстрирован на фиг. 6. По причинам сложности, можно также применять такой фильтр на более низких частотах дискретизации и/или сокращать число модулей базового всечастотного фильтра.

Модуль всечастотного фильтра также предоставляет функциональность, чтобы перезаписывать части входного сигнала посредством нулей, что управляется посредством кодера. Это, например, может использоваться для того, чтобы удалять атаки из входа фильтра.

Сжатие коэффициента gnorm

Чтобы получать более плавный вывод, обнаружено преимущественным применять модуль сжатия к усилению gnorm с регулированием энергии, который сжимает значения к единице. Он также немного компенсирует тот факт, что часть объемного окружения типично теряется после кодирования понижающего микширования на более низких скоростях передачи битов.

Такой модуль сжатия может конструироваться с учетом следующего:

(22) ,

где:

(23)

и функция c удовлетворяет:

(24) .

Значение c вокруг t затем указывает то, насколько сильно эта область сжимается, при этом значение 0 соответствует отсутствию сжатия, и значение 1 соответствует полному сжатию. Кроме того, схема сжатия является симметричной, если c является четной, т.е. c(t)=c(-t) Один пример является следующим:

(25)

что обуславливает следующее:

(26) .

В этом случае, (22) может упрощаться до следующего:

(27)

,

и можно сохранять специальные оценки функций.

Использование в комбинации с повышающим стереомикшированием во временной области расширения полосы пропускания для ACELP-кадров

При использовании с EVS-кодеком, аудиокодеком с низкой задержкой для сценариев связи, желательно выполнять повышающее стереомикширование для расширения полосы пропускания во временной области, для безопасной задержки, вызванной посредством расширения полосы пропускания во временной области (TBE). Повышающее стереомикширование для расширения полосы пропускания направлено на восстановление корректного панорамирования в диапазоне расширения полосы пропускания, но не добавляет замену для отсутствующего остатка. В силу этого, желательно добавлять замену в стереообработке в частотной области, как проиллюстрировано на фиг. 2.

Используется обозначение как для входного сигнала в декодере, для фильтрованного входного сигнала, для частотно-временных элементов разрешения и для частотно-временных элементов разрешения .

В таком случае можно сталкиваться с такой проблемой, что не известно в диапазоне расширения полосы пропускания, в силу чего коэффициент нормирования энергии:

(28)

не может вычисляться непосредственно, если некоторые индексы k∈Ib находятся в диапазоне расширения полосы пропускания. Эта проблема разрешается следующим образом: пусть IHB и ILB обозначают индексы полосы высоких частот относительно полосы низких частот для частотных элементов разрешения. В таком случае оценка получается посредством вычисления энергии кодированного со взвешиванием сигнала полосы высоких частот во временной области. Теперь, если Ib,LB и Ib, HB обозначают индексы полосы низких частот и полосы высоких частот в Ib, индексы полосы b частот, то можно иметь следующее:

(29) .

Теперь слагаемые во второй сумме в правой части являются неизвестными, но поскольку получается из посредством всечастотного фильтра, можно предполагать, что энергия и распределяется аналогично, и в силу этого получается следующее:

(30) .

Следовательно, вторая сумма в правой части (29) может оцениваться следующим образом:

(31) .

Использование с кодерами, которые кодируют первичный и вторичный канал

Искусственный сигнал также является применимым для стереокодеров, которые кодируют первичный и вторичный канал. В этом случае, первичный канал служит в качестве ввода для модуля всечастотного фильтра. Фильтрованный вывод затем может использоваться для того, чтобы заменять остаточные части в стереообработке, возможно после применения формирующего фильтра к нему. В простейшей настройке, первичный и вторичный канал могут представлять собой преобразование входных каналов, такое как среднее/боковое или KL-преобразование, и вторичный канал может быть ограничен меньшей полосой пропускания. Отсутствующая часть вторичного канала затем может заменяться посредством фильтрованного первичного канала после применения фильтра верхних частот.

Использование с декодером, который допускает переключение между стереорежимами

Особенно интересный случай для искусственного сигнала возникает, когда декодер содержит различные способы стереообработки, как проиллюстрировано на фиг. 3. Способы могут применяться одновременно (например, разделяться посредством полосы пропускания) или исключительно (например, обработка в частотной области по сравнению с обработкой во временной области) и связываться с решением по переключению. Использование идентичного искусственного сигнала во всех способах стереообработки сглаживает разрывности как в случае с переключением, так и в одновременном случае.

Выгоды и преимущества предпочтительных вариантов осуществления

Новый способ имеет множество выгод и преимуществ по сравнению со способами предшествующего уровня техники, например, применяемыми в xHE-AAC.

Обработка во временной области предоставляет возможность гораздо более высокого временного разрешения в качестве подполосной обработки, которая применяется в параметрическом стерео, что позволяет проектировать фильтр, импульсный отклик которого является плотным и быстрозатухающим. Это приводит к меньшей размытости спектральной огибающей входных сигналов со временем или к меньшему окрашиванию и в силу этого более естественному звучанию выходного сигнала.

Лучшая пригодность для речи, в которой оптимальная пиковая область импульсного отклика фильтра должна составлять между 20 и 40 мс.

Модуль фильтрации содержит функциональность повторной дискретизации для входных сигналов с различными частотами дискретизации. Это предоставляет возможность работы фильтры на фиксированной частоте дискретизации, которая является применимой, поскольку это гарантирует аналогичный вывод на различных частотах дискретизации; или сглаживает разрывности при переключении между сигналами с другой частотой дискретизации. По причинам сложности, внутренняя частота дискретизации должна выбираться таким образом, что фильтрованный сигнал покрывает только перцепционно релевантный частотный диапазон.

Поскольку сигнал формируется во вводе декодера и не соединяется с гребенкой фильтров, он может использоваться в различных модулях стереообработки. Это помогает сглаживать разрывности при переключении между различными модулями или при работе различных модулей для различных частей сигнала.

Это также снижает сложность, поскольку повторная инициализация не требуется при переключении между модулями.

Схема сжатия динамического диапазона усиления помогает компенсировать потери объемного окружения вследствие базового кодирования.

Способ, связанный с расширением полосы пропускания ACELP-кадров, уменьшает нехватку отсутствующих остаточных компонентов в повышающем микшировании с расширением полосы пропускания во временной области на основе панорамирования, что повышает стабильность при переключении между обработкой полосы высоких частот в DFT-области и во временной области.

Ввод может заменяться посредством нулей на очень точной временной шкале, которая является применимой для обработки атак.

Далее поясняются дополнительные подробности относительно фиг. 1a или 1b, фиг. 2a или 2b и фиг. 3.

Фиг. 1a или фиг. 1b иллюстрирует базовый канальный декодер 700 как содержащий первую ветвь декодирования, имеющую декодер 721 полосы низких частот, и декодер 720 расширения полосы пропускания, чтобы формировать первую часть декодированного базового канала. Кроме того, базовый канальный декодер 700 содержит вторую ветвь 722 декодирования, имеющую полнополосный декодер, чтобы формировать вторую часть декодированного базового канала.

Переключение между обоими элементами выполняется посредством контроллера 713, проиллюстрированного в качестве переключателя, управляемого посредством управляющего параметра, включенного в кодированный многоканальный сигнал для подачи части кодированного базового канала либо в первую ветвь декодирования, содержащую блок 720, 721, либо во вторую ветвь 722 декодирования. Декодер 721 полосы низких частот реализуется, например, как кодер ACELP на основе линейного прогнозирования с возбуждением по алгебраическому коду, и второй полнополосный декодер реализуется как высококачественный (HQ) базовый декодер на основе возбуждения по кодированию с преобразованием (TCX).

Декодированное понижающее микширование из блоков 722 или декодированный базовый сигнал из блока 721 и, дополнительно, сигнал расширения полосы пропускания из блока 720 принимаются и перенаправляются в процедуру на фиг. 2a или 2b. Дополнительно, последующий соединенный декорреляционный фильтр содержит модули 810, 811, 812 повторной дискретизации и, при необходимости и целесообразности, элементы 813, 814 компенсации задержки. Сумматор комбинирует сигнал расширения полосы пропускания во временной области из блока 720 и базовый сигнал из блока 721 и перенаправляет их в переключатель 815, управляемый посредством кодированных многоканальных данных в форме переключающего контроллера, чтобы переключаться между первой ветвью кодирования или между второй ветвью кодирования в зависимости того, какой сигнал доступен.

Кроме того, решение 817 по переключению конфигурируется, т.е., например, реализуется в качестве детектора переходных частей. Тем не менее, детектор переходных частей не обязательно должен представлять собой фактический детектор для обнаружения переходной части посредством анализа сигналов, но детектор переходных частей также может быть выполнен с возможностью определять вспомогательную информацию или конкретный управляющий параметр в кодированном многоканальном сигнале, указывающий переходную часть в базовом канале.

Решение 817 по переключению задает переключатель с тем, чтобы подавать либо сигнал, выводимый из переключателя 815 в модуль 802 всечастотного фильтра, либо нулевой ввод, что приводит к фактической деактивации суммирования заполняющих сигналов в многоканальном процессоре для определенных очень специфически выбираемых временных областей, поскольку EVS-генератор всечастотных сигналов (APSG), указанный в 1000 на фиг. 1a или 1b, работает полностью во временной области. Таким образом, нулевой ввод может выбираться на основе выборок без ссылок на длины окон кодирования со взвешиванием, уменьшающие спектральное разрешение, что требуется для обработки в спектральной области.

Устройство, проиллюстрированное на фиг. 1a, отличается от устройства, проиллюстрированного на фиг. 1b, тем, что модули повторной дискретизации и каскады задержки опускаются на фиг. 1b, т.е. элементы 810, 811, 812, 813, 814 не требуются в устройстве по фиг. 1b. Следовательно, в варианте осуществления по фиг. 1b, модули всечастотного фильтра работают при 16 кГц, а не при 32 кГц, как показано на фиг. 1a.

Фиг. 2a или фиг. 2b иллюстрирует интеграцию генератора 1000 всечастотных сигналов в DFT-стереообработку, включающую в себя повышающее микширование с расширением полосы пропускания во временной области. Блок 1000 выводит сигнал расширения полосы пропускания, сформированный посредством блока 720, в повышающий микшер 960 полосы высоких частот (повышающее TBE-микширование – повышающее микширование с расширением полосы пропускания (во временной области)) для формирования левого сигнала полосы высоких частот и правого сигнала полосы высоких частот из моносигнала расширения полосы пропускания, сформированного посредством блока 720. Кроме того, модуль 821 повторной дискретизации предоставляется соединенным перед DFT для заполняющего сигнала, указываемого в 804. Дополнительно, предоставляется DFT 922 для декодированного базового канала, который представляет собой либо (полнополосное) декодированное понижающее микширование, либо декодированный базовый сигнал (полосы низких частот).

В зависимости от реализации, когда декодированный сигнал понижающего микширования из полнополосного декодера 722 доступен, то блок 960 деактивируется, и блок 904 стереообработки уже выводит полнополосные сигналы повышающего микширования, такие как полнополосный левый и правый канал.

Тем не менее, когда декодированный базовый сигнал вводится в DFT-блок 922, то блок 960 активируется, и сигнал левого канала и сигнал правого канала суммируются посредством сумматоров 994a и 994b. Тем не менее, суммирование заполняющего сигнала при этом выполняется в спектральной области, указываемой посредством блока 904, в соответствии с процедурами, например, поясненными в предпочтительном варианте осуществления на основе уравнений 28-31. Таким образом, в такой ситуации, сигнал, выводимый посредством DFT-блока 902, соответствующий среднему сигналу полосы низких частот, не имеет данных полосы высоких частот. Тем не менее, сигнал, выводимый посредством блока 804, т.е. заполняющий сигнал имеет данные полосы низких частот и данные полосы высоких частот.

В блоке стереообработки, данные полосы низких частот, выводимые посредством блока 904, формируются посредством декодированного базового канала и заполняющего сигнала, но данные полосы высоких частот, выводимые посредством блока 904, состоят только из заполняющего сигнала и не имеют информации полосы высоких частот из декодированного базового канала, поскольку декодированный базовый канал имеет ограниченную полосу частот. Информация полосы высоких частот из декодированного базового канала формируется посредством блока 720 расширения полосы пропускания, повышающе микшируется в левый канал полосы высоких частот и правый канал полосы высоких частот посредством блока 960 и затем суммируется посредством сумматоров 994a, 994b.

Устройство, проиллюстрированное на фиг. 2a, отличается от устройства, проиллюстрированного на фиг. 2b, тем, что модуль повторной дискретизации опускается на фиг. 2b, т.е. элемент 821 не требуется в устройстве по фиг. 2b.

Фиг. 3 иллюстрирует предпочтительную реализацию системы, имеющей несколько модулей 904a-904b, 904c стереообработки, как пояснено выше относительно переключения между стереорежимами. Каждый блок стереообработки принимает вспомогательную информацию и, дополнительно, определенный первичный сигнал, но совершенно идентичный заполняющий сигнал независимо от того, обрабатывается определенная временная часть входного сигнала с использованием алгоритма 904a стереообработки, алгоритма 904b стереообработки или другого алгоритма 904c стереообработки.

Хотя некоторые аспекты описаны в контексте оборудования, очевидно, что эти аспекты также представляют описание соответствующего способа, при этом блок или оборудование соответствует этапу способа либо признаку этапа способа. Аналогично, аспекты, описанные в контексте этапа способа, также представляют описание соответствующего блока или элемента, или признака соответствующего оборудования. Некоторые или все этапы способа могут выполняться посредством (или с использованием) аппаратного оборудования, такого как, например, микропроцессор, программируемый компьютер либо электронная схема. В некоторых вариантах осуществления, один или более из самых важных этапов способа могут выполняться посредством этого оборудования.

Изобретаемый кодированный аудиосигнал может сохраняться на цифровом носителе данных или может передаваться по среде передачи, такой как беспроводная среда передачи или проводная среда передачи, к примеру, Интернет.

В зависимости от определенных требований к реализации, варианты осуществления изобретения могут реализовываться в аппаратных средствах или в программном обеспечении. Реализация может выполняться с использованием энергонезависимого носителя данных или цифрового носителя данных, например, гибкого диска, DVD, Blu-Ray, CD, ROM, PROM, EPROM, EEPROM или флэш-памяти, имеющего сохраненные электронночитаемые управляющие сигналы, которые взаимодействуют (или допускают взаимодействие) с программируемой компьютерной системой таким образом, что осуществляется соответствующий способ. Следовательно, цифровой носитель данных может быть машиночитаемым.

Некоторые варианты осуществления согласно изобретению содержат носитель данных, имеющий электронночитаемые управляющие сигналы, которые допускают взаимодействие с программируемой компьютерной системой таким образом, что осуществляется один из способов, описанных в данном документе.

В общем, варианты осуществления настоящего изобретения могут реализовываться как компьютерный программный продукт с программным кодом, при этом программный код выполнен с возможностью осуществления одного из способов, когда компьютерный программный продукт работает на компьютере. Программный код, например, может сохраняться на машиночитаемом носителе.

Другие варианты осуществления содержат компьютерную программу для осуществления одного из способов, описанных в данном документе, сохраненную на машиночитаемом носителе.

Другими словами, вариант осуществления изобретаемого способа в силу этого представляет собой компьютерную программу, имеющую программный код для осуществления одного из способов, описанных в данном документе, когда компьютерная программа работает на компьютере.

Следовательно, дополнительный вариант осуществления изобретаемых способов представляет собой носитель данных (цифровой носитель данных или машиночитаемый носитель), содержащий записанную компьютерную программу для осуществления одного из способов, описанных в данном документе. Носитель данных, цифровой носитель данных или носитель с записанными данными типично является материальным и/или энергонезависимым.

Следовательно, дополнительный вариант осуществления изобретаемого способа представляет собой поток данных или последовательность сигналов, представляющих компьютерную программу для осуществления одного из способов, описанных в данном документе. Поток данных или последовательность сигналов, например, может быть выполнена с возможностью передачи через соединение для передачи данных, например, через Интернет.

Дополнительный вариант осуществления содержит средство обработки, например, компьютер или программируемое логическое устройство, выполненное с возможностью осуществлять один из способов, описанных в данном документе.

Дополнительный вариант осуществления содержит компьютер, имеющий установленную компьютерную программу для осуществления одного из способов, описанных в данном документе.

Дополнительный вариант осуществления согласно изобретению содержит оборудование или систему, выполненную с возможностью передавать (например, электронно или оптически) компьютерную программу для осуществления одного из способов, описанных в данном документе, в приемное устройство. Приемное устройство, например, может представлять собой компьютер, мобильное устройство, запоминающее устройство и т.п. Оборудование или система, например, может содержать файловый сервер для передачи компьютерной программы в приемное устройство.

В некоторых вариантах осуществления, программируемое логическое устройство (например, программируемая пользователем вентильная матрица) может использоваться для того, чтобы выполнять часть или все из функциональностей способов, описанных в данном документе. В некоторых вариантах осуществления, программируемая пользователем вентильная матрица может взаимодействовать с микропроцессором, чтобы осуществлять один из способов, описанных в данном документе. В общем, способы предпочтительно осуществляются посредством любого аппаратного оборудования.

Оборудование, описанное в данном документе, может реализовываться с использованием аппаратного оборудования либо с использованием компьютера, либо с использованием комбинации аппаратного оборудования и компьютера.

Оборудование, описанное в данном документе, или любые компоненты оборудования, описанного в данном документе, могут реализовываться, по меньшей мере, частично в аппаратных средствах и/или в программном обеспечении.

Способы, описанные в данном документе, могут осуществляться с использованием аппаратного оборудования либо с использованием компьютера, либо с использованием комбинации аппаратного оборудования и компьютера.

Способы, описанные в данном документе, или любые компоненты оборудования, описанного в данном документе, могут выполняться, по меньшей мере, частично посредством аппаратных средств и/или посредством программного обеспечения.

Вышеописанные варианты осуществления являются просто иллюстративными в отношении принципов настоящего изобретения. Следует понимать, что модификации и изменения компоновок и подробностей, описанных в данном документе, должны быть очевидными для специалистов в данной области техники. Следовательно, они подразумеваются как ограниченные только посредством объема нижеприведенной формулы изобретения, а не посредством конкретных подробностей, представленных посредством описания и пояснения вариантов осуществления в данном документе.

В вышеприведенном описании, можно видеть, что различные признаки группируются в вариантах осуществления с целью упрощения раскрытия. Этот способ раскрытия не должен интерпретироваться как отражающий намерение того, что заявленные варианты осуществления требуют большего числа признаков, чем явно изложено в каждом пункте формулы изобретения. Наоборот, как отражает прилагаемая формула изобретения, предмет изобретения может заключаться не во всех признаках одного раскрытого варианта осуществления. Таким образом, прилагаемая формула изобретения в силу этого включается в подробное описание, при этом каждый ее пункт является независимым как отдельный вариант осуществления. Хотя каждый пункт формулы изобретения может непосредственно означать отдельный вариант осуществления, следует отметить, что хотя зависимый пункт формулы изобретения может ссылаться в формуле изобретения на конкретную комбинацию с одним или более другими пунктами формулы изобретения, другие варианты осуществления также могут включать в себя комбинацию зависимого пункта формулы изобретения с предметом каждого другого зависимого пункта формулы изобретения либо комбинацию каждого признака с другими зависимыми или независимыми пунктами формулы изобретения. Такие комбинации предлагаются в данном документе, если не указывается то, что конкретная комбинация не является намеченной. Кроме того, целесообразно также включать признаки пункта формулы изобретения в любой другой независимый пункт формулы изобретения, даже если этот пункт формулы изобретения не становится непосредственно зависимым относительно независимого пункта формулы изобретения.

Дополнительно следует отметить, что способы, раскрытые в описании изобретения или в формуле изобретения, могут реализовываться посредством устройства, имеющего средство для выполнения каждого из соответствующих этапов этих способов.

Кроме того, в некоторых вариантах осуществления один может включать в себя или может разбиваться на несколько подэтапов. Такие подэтапы могут быть включены и составлять часть раскрытия этого одного этапа, если явно не исключаются.

Похожие патенты RU2741379C1

название год авторы номер документа
УСТРОЙСТВО И СПОСОБ ДЛЯ КОДИРОВАНИЯ ИЛИ ДЕКОДИРОВАНИЯ МНОГОКАНАЛЬНОГО СИГНАЛА С ИСПОЛЬЗОВАНИЕМ СИХРОНИЗАЦИИ УПРАВЛЕНИЯ КАДРАМИ 2017
  • Фукс, Гийом
  • Равелли, Эммануэль
  • Мультрус, Маркус
  • Шнелль, Маркус
  • Дёла, Штефан
  • Дитц, Мартин
  • Маркович, Горан
  • Фотопоулоу, Элени
  • Байер, Штефан
  • Егерс, Вольфганг
RU2705007C1
УСТРОЙСТВО, СПОСОБ ИЛИ КОМПЬЮТЕРНАЯ ПРОГРАММА ДЛЯ ОБРАБОТКИ КОДИРОВАННОЙ АУДИОСЦЕНЫ С ИСПОЛЬЗОВАНИЕМ СГЛАЖИВАНИЯ ПАРАМЕТРОВ 2021
  • Ройтельхубер, Франц
  • Фукс, Гийом
  • Мультрус, Маркус
  • Фотопоулоу, Элени
  • Байер, Штефан
  • Бюте, Ян
  • Дёла, Штефан
RU2818033C1
УСТРОЙСТВО, СПОСОБ ИЛИ КОМПЬЮТЕРНАЯ ПРОГРАММА ДЛЯ ОБРАБОТКИ КОДИРОВАННОЙ АУДИОСЦЕНЫ С ИСПОЛЬЗОВАНИЕМ ПРЕОБРАЗОВАНИЯ ПАРАМЕТРОВ 2021
  • Ройтельхубер, Франц
  • Фукс, Гийом
  • Мультрус, Маркус
  • Фотопоулоу, Элени
  • Байер, Штефан
  • Бюте, Ян
  • Дёла, Штефан
RU2822446C1
УСТРОЙСТВО, СПОСОБ ИЛИ КОМПЬЮТЕРНАЯ ПРОГРАММА ДЛЯ ОБРАБОТКИ КОДИРОВАННОЙ АУДИОСЦЕНЫ С ИСПОЛЬЗОВАНИЕМ РАСШИРЕНИЯ ПОЛОСЫ ПРОПУСКАНИЯ 2021
  • Ройтельхубер, Франц
  • Фукс, Гийом
  • Мультрус, Маркус
  • Фотопоулоу, Элени
  • Байер, Штефан
  • Бюте, Ян
  • Дёла, Штефан
RU2820946C1
АУДИОКОДЕР ДЛЯ КОДИРОВАНИЯ МНОГОКАНАЛЬНОГО СИГНАЛА И АУДИОДЕКОДЕР ДЛЯ ДЕКОДИРОВАНИЯ КОДИРОВАННОГО АУДИОСИГНАЛА 2016
  • Диш Саша
  • Фукс Гийом
  • Равелли Эммануэль
  • Нойкам Кристиан
  • Шмидт Константин
  • Бенндорф Конрад
  • Нидермайер Андреас
  • Шуберт Беньямин
  • Гайгер Ральф
RU2680195C1
АУДИОКОДЕР ДЛЯ КОДИРОВАНИЯ МНОГОКАНАЛЬНОГО СИГНАЛА И АУДИОДЕКОДЕР ДЛЯ ДЕКОДИРОВАНИЯ КОДИРОВАННОГО АУДИОСИГНАЛА 2016
  • Диш Саша
  • Фукс Гийом
  • Равелли Эммануэль
  • Нойкам Кристиан
  • Шмидт Константин
  • Бенндорф Конрад
  • Нидермайер Андреас
  • Шуберт Беньямин
  • Гайгер Ральф
RU2679571C1
УСТРОЙСТВО И СПОСОБ ДЛЯ КОДИРОВАНИЯ ИЛИ ДЕКОДИРОВАНИЯ МНОГОКАНАЛЬНОГО СИГНАЛА С ИСПОЛЬЗОВАНИЕМ ПОВТОРНОЙ ДИСКРЕТИЗАЦИИ СПЕКТРАЛЬНОЙ ОБЛАСТИ 2017
  • Фукс Гийом
  • Равелли Эммануэль
  • Мультрус Маркус
  • Шнелль Маркус
  • Дела Штефан
  • Дитц Мартин
  • Маркович Горан
  • Фотопоулоу Элени
  • Байер Штефан
  • Егерс Вольфганг
RU2693648C2
УСТРОЙСТВО, СПОСОБ ИЛИ КОМПЬЮТЕРНАЯ ПРОГРАММА ДЛЯ ФОРМИРОВАНИЯ ВЫХОДНОГО ПРЕДСТАВЛЕНИЯ ПОНИЖАЮЩЕГО МИКШИРОВАНИЯ 2020
  • Ройтельхубер, Франц
  • Фотопоулоу, Элени
  • Мультрус, Маркус
RU2791872C1
УСТРОЙСТВО И СПОСОБ КОДИРОВАНИЯ ИЛИ ДЕКОДИРОВАНИЯ МНОГОКАНАЛЬНОГО СИГНАЛА С ИСПОЛЬЗОВАНИЕМ ПАРАМЕТРА ШИРОКОПОЛОСНОГО ВЫРАВНИВАНИЯ И МНОЖЕСТВА ПАРАМЕТРОВ УЗКОПОЛОСНОГО ВЫРАВНИВАНИЯ 2017
  • Байер, Штефан
  • Фотопоулоу, Элени
  • Мультрус, Маркус
  • Фукс, Гийом
  • Равелли, Эммануэль
  • Шнелль, Маркус
  • Дола, Штефан
  • Ягерс, Вольфганг
  • Дитц, Мартин
  • Маркович, Горан
RU2704733C1
ГЕНЕРАТОР МНОГОКАНАЛЬНЫХ СИГНАЛОВ, АУДИОКОДЕР И СООТВЕТСТВУЮЩИЕ СПОСОБЫ, ОСНОВАННЫЕ НА ШУМОВОМ СИГНАЛЕ МИКШИРОВАНИЯ 2021
  • Равелли, Эммануэль
  • Кине, Ян Фредерик
  • Фукс, Гийом
  • Корсе, Срикантх
  • Мультрус, Маркус
  • Фотопоулоу, Элени
RU2809646C1

Иллюстрации к изобретению RU 2 741 379 C1

Реферат патента 2021 года ОБОРУДОВАНИЕ ДЛЯ КОДИРОВАНИЯ ИЛИ ДЕКОДИРОВАНИЯ КОДИРОВАННОГО МНОГОКАНАЛЬНОГО СИГНАЛА С ИСПОЛЬЗОВАНИЕМ ЗАПОЛНЯЮЩЕГО СИГНАЛА, СФОРМИРОВАННОГО ПОСРЕДСТВОМ ШИРОКОПОЛОСНОГО ФИЛЬТРА

Изобретение относится к области обработки аудиоданных. Технический результат заключается в повышении точности декодирования кодированного многоканального аудиосигнала. Технический результат достигается за счет декодирования кодированного базового канала, чтобы получать декодированный базовый канал, выполнения декорреляционной фильтрации, по меньшей мере, части декодированного базового канала, чтобы получать заполняющий сигнал, и выполнения многоканальной обработки с использованием спектрального представления декодированного базового канала и спектрального представления заполняющего сигнала, при этом декорреляционная фильтрация представляет собой широкополосную фильтрацию, и многоканальная обработка содержит этап, на котором применяют узкополосную обработку к спектральному представлению декодированного базового канала и спектральному представлению заполняющего сигнала. 3 н. и 35 з.п. ф-лы, 19 ил.

Формула изобретения RU 2 741 379 C1

1. Устройство для декодирования кодированного многоканального сигнала, содержащее:

базовый канальный декодер (700) для декодирования кодированного базового канала, чтобы получать декодированный базовый канал;

декорреляционный фильтр (800) для фильтрации, по меньшей мере, части декодированного базового канала, чтобы получать заполняющий сигнал; и

многоканальный процессор (900) для выполнения многоканальной обработки с использованием спектрального представления декодированного базового канала и спектрального представления заполняющего сигнала,

при этом декорреляционный фильтр (800) представляет собой широкополосный фильтр, и многоканальный процессор (900) выполнен с возможностью применять узкополосную обработку к спектральному представлению декодированного базового канала и спектральному представлению заполняющего сигнала.

2. Устройство по п.1, в котором характеристика фильтра для декорреляционного фильтра (800) выбирается таким образом, чтобы область постоянной абсолютной величины характеристики фильтра превышала степень спектральной детализации спектрального представления декодированного базового канала и степень спектральной детализации спектрального представления заполняющего сигнала.

3. Устройство по п.1, в котором декорреляционный фильтр содержит:

каскад (802) фильтра для фильтрации декодированного базового канала, чтобы получать широкополосный заполняющий сигнал или заполняющий сигнал временной области; и

спектральный преобразователь (804) для преобразования широкополосного заполняющего сигнала или заполняющего сигнала временной области в спектральное представление заполняющего сигнала.

4. Устройство по п.1, дополнительно содержащее базовый канальный спектральный преобразователь (902) для преобразования декодированного базового канала в спектральное представление декодированного базового канала.

5. Устройство по п.1, в котором декорреляционный фильтр (800) содержит всечастотный фильтр (802) временной области или по меньшей мере один всечастотный фильтр (802) Шредера.

6. Устройство по п.1, в котором декорреляционный фильтр (800) содержит по меньшей мере один всечастотный фильтр Шредера, имеющий первый сумматор (411), каскад (423) задержки, второй сумматор (416), средство подачи (443) в прямом направлении с усилением в прямом направлении и средство подачи (433) в обратном направлении с усилением в обратном направлении.

7. Устройство по п.5, в котором

всечастотный фильтр (802) содержит по меньшей мере одну ячейку всечастотного фильтра, каковая по меньшей мере одна ячейка всечастотного фильтра содержит два всечастотных фильтра (401, 402) Шредера, вложенные в третий всечастотный фильтр (403) Шредера, или

всечастотный фильтр содержит по меньшей мере одну ячейку (403) всечастотного фильтра, каковая по меньшей мере одна ячейка всечастотного фильтра содержит два каскадных всечастотных фильтра (401, 402) Шредера, при этом ввод в первый каскадный всечастотный фильтр Шредера и вывод из второго каскадного всечастотного фильтра Шредера соединены, в направлении потока сигналов, перед каскадом (423) задержки третьего всечастотного фильтра Шредера.

8. Устройство по п.5, в котором всечастотный фильтр содержит:

первый сумматор (411), второй сумматор (412), третий сумматор (413), четвертый сумматор (414), пятый сумматор (415) и шестой сумматор (416);

первый каскад (421) задержки, второй каскад (422) задержки и третий каскад (423) задержки;

первое средство подачи (431) в прямом направлении с первым усилением в прямом направлении, первое средство подачи (441) в обратном направлении с первым усилением в обратном направлении,

второе средство подачи (442) в прямом направлении со вторым усилением в прямом направлении и второе средство подачи (432) в обратном направлении со вторым усилением в обратном направлении; и

третье средство подачи (443) в прямом направлении с третьим усилением в прямом направлении и третье средство подачи (433) в обратном направлении с третьим усилением в обратном направлении.

9. Устройство по п.8, в котором

ввод в первый сумматор (411) представляет ввод во всечастотный фильтр (802), при этом второй ввод в первый сумматор (411) соединен с выводом третьего каскада (423) задержки и содержит третье средство подачи (433) в обратном направлении с третьим усилением в обратном направлении,

вывод первого сумматора (411) соединен с вводом во второй сумматор (412) и соединен с вводом шестого сумматора через третье средство подачи в прямом направлении с третьим усилением в прямом направлении,

дополнительный ввод во второй сумматор (412) соединен с первым каскадом (421) задержки через первое средство подачи (441) в обратном направлении с первым усилением в обратном направлении,

вывод второго сумматора (412) соединен с вводом первого каскада (421) задержки и соединен с вводом третьего сумматора (413) через первое средство подачи (431) в прямом направлении с первым усилением в прямом направлении,

вывод первого каскада (421) задержки соединен с дополнительным вводом третьего сумматора (413),

вывод третьего сумматора (413) соединен с вводом четвертого сумматора (414),

дополнительный ввод в четвертый сумматор (414) соединен с выводом второго каскада (422) задержки через второе средство подачи (432) в обратном направлении со вторым усилением в обратном направлении,

вывод четвертого сумматора (414) соединен с вводом во второй каскад (422) задержки и соединен с вводом в пятый сумматор (415) через второе средство подачи (442) в прямом направлении со вторым усилением в прямом направлении,

вывод второго каскада (421) задержки соединен с дополнительным вводом в пятый сумматор (415),

вывод пятого сумматора (415) соединен с вводом третьего каскада (423) задержки,

вывод третьего каскада (423) задержки соединен с вводом в шестой сумматор (416),

дополнительный ввод в шестой сумматор (416) соединен с выводом первого сумматора (411) через третье средство подачи (443) в прямом направлении с третьим усилением в прямом направлении, и

вывод шестого сумматора (416) представляет вывод всечастотного фильтра (802).

10. Устройство по п.7, в котором всечастотный фильтр (802) содержит две или более ячеек (401, 402, 403, 502, 504, 506, 508, 510) всечастотного фильтра, при этом значения задержки задержек ячеек всечастотного фильтра являются взаимно простыми.

11. Устройство по п.5, при этом усиление в прямом направлении и усиление в обратном направлении всечастотного фильтра Шредера равны или отличаются друг от друга менее чем на 10% от большего значения усиления из усиления в прямом направлении и усиления в обратном направлении.

12. Устройство по п.5, в котором декорреляционный фильтр (800) содержит две или более ячеек всечастотного фильтра, при этом одна из ячеек всечастотного фильтра имеет два положительных усиления и одно отрицательное усиление, и другая из ячеек всечастотного фильтра имеет одно положительное усиление и два отрицательных усиления.

13. Устройство по п.5, при этом

значение задержки первого каскада (421) задержки ниже значения задержки второго каскада (422) задержки, причем значение задержки второго каскада (422) задержки ниже значения задержки третьего каскада (423) задержки ячейки всечастотного фильтра, содержащей три всечастотных фильтра Шредера, или

сумма значения задержки первого каскада (421) задержки и значения задержки второго каскада (422) задержки меньше значения задержки третьего каскада (423) задержки ячейки (502, 504, 506, 508, 510) всечастотного фильтра, содержащей три всечастотных фильтра Шредера.

14. Устройство по п.5, в котором всечастотный фильтр (802) содержит по меньшей мере две ячейки (502, 504, 506, 508, 510) всечастотного фильтра в каскаде, при этом наименьшее значение задержки всечастотного фильтра позже в этом каскаде меньше наибольшего или второго по величине значения задержки ячейки всечастотного фильтра раньше в данном каскаде.

15. Устройство по п.5, в котором всечастотный фильтр содержит по меньшей мере две ячейки (502, 504, 506, 508, 510) всечастотного фильтра в каскаде, при этом

каждая ячейка (502, 504, 506, 508, 510) всечастотного фильтра имеет первое усиление в прямом направлении или первое усиление в обратном направлении, второе усиление в прямом направлении или второе усиление в обратном направлении и третье усиление в прямом направлении или третье усиление в обратном направлении, первый каскад задержки, второй каскад задержки и третий каскад задержки,

значения для усилений и задержек задаются в пределах диапазона допусков в ±20% значений, указываемых в следующей таблице:

Фильтр g1 d1 g2 d2 g3 d3 B1(z) 0,5 2 -0,2 73 0,5 83 B2(z) -0,4 11 0,2 67 -0,5 97 B3(z) 0,4 19 -0,3 61 0,5 103 B4(z) -0,4 29 0,3 47 -0,5 109 B5(z) 0,3 37 -0,3 41 0,5 127

где

B1(z) является первой ячейкой (502) всечастотного фильтра в каскаде,

B2(z) является второй ячейкой (504) всечастотного фильтра в каскаде,

B3(z) является третьей ячейкой (506) всечастотного фильтра в каскаде,

B4(z) является четвертой ячейкой (508) всечастотного фильтра в каскаде, и

B5(z) является пятой ячейкой (510) всечастотного фильтра в каскаде, при этом

каскад содержит только первую ячейку B1 всечастотного фильтра и вторую ячейку B2 всечастотного фильтра или любые другие две ячейки всечастотного фильтра группы ячеек всечастотного фильтра, состоящих из B1-B5, или

каскад содержит три ячейки всечастотного фильтра, выбранные из группы пяти ячеек B1-B5 всечастотного фильтра, или

каскад содержит четыре ячейки всечастотного фильтра, выбранные из группы ячеек всечастотного фильтра, состоящих из B1-B5, или

каскад содержит все пять ячеек B1-B5 всечастотного фильтра, при этом

g1 представляет первое усиление в прямом направлении или усиление в обратном направлении ячейки всечастотного фильтра, g2 представляет второе усиление в обратном направлении или усиление в прямом направлении ячейки всечастотного фильтра, и g3 представляет третье усиление в прямом направлении или усиление в обратном направлении ячейки всечастотного фильтра, причем d1 представляет задержку первого каскада задержки ячейки всечастотного фильтра, d2 представляет задержку второго каскада задержки ячейки всечастотного фильтра, и d3 представляет задержку третьего каскада задержки ячейки всечастотного фильтра, или

g1 представляет второе усиление в прямом направлении или усиление в обратном направлении ячейки всечастотного фильтра, g2 представляет первое усиление в обратном направлении или усиление в прямом направлении ячейки всечастотного фильтра, и g3 представляет третье усиление в прямом направлении или усиление в обратном направлении ячейки всечастотного фильтра, причем d1 представляет задержку второго каскада задержки ячейки всечастотного фильтра, d2 представляет задержку первого каскада задержки ячейки всечастотного фильтра, и d3 представляет задержку третьего каскада задержки ячейки всечастотного фильтра.

16. Устройство по п.1, в котором многоканальный процессор (900) выполнен с возможностью определять (946) первый канал повышающего микширования и второй канал повышающего микширования с использованием различных комбинирований со взвешиванием полос спектра декодированного базового канала и соответствующей полосы спектра заполняющего сигнала, причем эти различные комбинирования со взвешиванием зависят от коэффициента прогнозирования и/или коэффициента усиления и/или коэффициента нормирования огибающей или энергии, вычисленного с использованием полосы спектра декодированного базового канала и соответствующей полосы спектра заполняющего сигнала.

17. Устройство по п.16, в котором многоканальный процессор выполнен с возможностью сжимать (945) коэффициент нормирования энергии и вычислять различные комбинирования со взвешиванием с использованием сжатого коэффициента нормирования энергии.

18. Устройство по п.17, в котором коэффициент нормирования энергии сжимается с использованием следующего:

вычисление (921) логарифма коэффициента нормирования энергии;

применение (922) к данному логарифму нелинейной функции; и

вычисление (923) результата возведения в степень результата этой нелинейной функции.

19. Устройство по п.18, при этом

нелинейная функция задается на основе , где

функция c основывается на ,

t является действительным числом, и

τ является переменной интегрирования.

20. Устройство по п.16, в котором многоканальный процессор (900, 924, 925) выполнен с возможностью сжимать (921) коэффициент нормирования энергии и вычислять различные комбинирования со взвешиванием с использованием сжатого коэффициента нормирования энергии и с использованием нелинейной функции, при этом

нелинейная функция задается на основе , где

α является предварительно определенным граничным значением, и

t является значением между -α и +α.

21. Устройство по п.1, в котором многоканальный процессор (900) выполнен с возможностью вычислять (904) первый канал повышающего микширования полосы низких частот и второй канал повышающего микширования полосы низких частот, при этом

устройство дополнительно содержит расширитель (960) полосы пропускания во временной области для расширения первого канала повышающего микширования полосы низких частот и второго канала повышающего микширования полосы низких частот или базового канала полосы низких частот,

многоканальный процессор (904) выполнен с возможностью определять (946) первый канал повышающего микширования и второй канал повышающего микширования с использованием различных комбинирований со взвешиванием полос спектра декодированного базового канала и соответствующей полосы спектра заполняющего сигнала, причем эти различные комбинирования со взвешиванием зависят от коэффициента нормирования энергии, вычисленного (945) с использованием энергии полосы спектра декодированного базового канала и полосы спектра заполняющего сигнала,

коэффициент нормирования энергии вычисляется с использованием энергетической оценки, полученной (961) из энергии кодированного со взвешиванием сигнала полосы высоких частот.

22. Устройство по п.21, в котором расширитель (960) полосы пропускания во временной области выполнен с возможностью использовать сигнал полосы высоких частот без операции кодирования со взвешиванием, используемой для вычисления коэффициента нормирования энергии.

23. Устройство по п.1, в котором

базовый канальный декодер (700, 705) выполнен с возможностью предоставлять декодированный первичный базовый канал и декодированный вторичный базовый канал,

декорреляционный фильтр (800) выполнен с возможностью фильтрации декодированного первичного базового канала, чтобы получать заполняющий сигнал,

многоканальный процессор (900) выполнен с возможностью выполнения многоканальной обработки посредством синтезирования одной или более остаточных частей в многоканальной обработке с использованием заполняющего сигнала, или

формирующий фильтр (930) применяется к заполняющему сигналу.

24. Устройство по п.23, при этом

первичный и вторичный базовые каналы представляют собой результат преобразования исходных входных каналов, причем данное преобразование, например, представляет собой среднее/боковое преобразование или преобразование Карунена-Лоэва (KL), при этом декодированный вторичный базовый канал ограничен меньшей полосой пропускания,

многоканальный процессор выполнен с возможностью фильтрации (930) верхних частот заполняющего сигнала и использования фильтрованного по верхним частотам заполняющего сигнала в качестве вторичного канала для полосы пропускания, не включенного в декодированный вторичный базовый канал с ограниченной полосой пропускания.

25. Устройство по п.1, в котором

многоканальный процессор (900) выполнен с возможностью осуществления различных способов (904a, 904b, 904c) стереообработки, и

многоканальный процессор (900) дополнительно выполнен с возможностью осуществлять эти различные способы многоканальной обработки одновременно, например, разделенные посредством полосы пропускания, либо на исключительной основе, например обработка в частотной области в противовес обработке во временной области, и связанные с решением по переключению, и

многоканальный процессор (900) выполнен с возможностью использовать идентичный заполняющий сигнал во всех способах (904a, 904b, 904c) многоканальной обработки.

26. Устройство по п.1, в котором декорреляционный фильтр (800) содержит в качестве фильтра (802) временной области, имеющего оптимальную пиковую область импульсного отклика фильтра временной области между 20 мс и 40 мс.

27. Устройство по п.1, в котором

декорреляционный фильтр (800) выполнен с возможностью передискретизации (811, 812) декодированного базового канала до предварительно заданной или зависимой от ввода целевой частоты дискретизации,

декорреляционный фильтр (800) выполнен с возможностью фильтровать передискретизированный декодированный базовый канал с использованием каскада декорреляционного фильтра (802), и

многоканальный процессор (900) выполнен с возможностью преобразовывать (710) декодированный базовый канал для дополнительной временной части до той же самой частоты дискретизации, с тем чтобы многоканальный процессор (900) работал с использованием спектральных представлений декодированного базового канала и заполняющего сигнала, которые основаны на идентичной частоте дискретизации независимо от различных частот дискретизации декодированного базового канала для различных временных частей, или

устройство выполнено с возможностью выполнять передискретизацию до или при преобразовании (804, 702) в частотную область либо после преобразования (804, 702) в частотную область.

28. Устройство по п.1, дополнительно содержащее детектор переходных частей для нахождения переходной части в кодированном или декодированном базовом канале, при этом декорреляционный фильтр (800) выполнен с возможностью подачи в каскад (802) декорреляционного фильтра значений шума или нулевых значений (816) во временной части, в которой детектор переходных частей обнаруживает выборки переходных сигналов, при этом декорреляционный фильтр (800) выполнен с возможностью подачи в каскад (802) декорреляционного фильтра выборок декодированного базового канала в дополнительной временной части, в которой детектор переходных частей не обнаруживает переходную часть в кодированном или декодированном базовом канале.

29. Устройство по п.1, в котором базовый канальный декодер (700) содержит:

первую ветвь декодирования, содержащую декодер (721) полосы низких частот и декодер (720) расширения полосы пропускания, чтобы формировать первую часть декодированного канала;

вторую ветвь (722) декодирования, имеющую полнополосный декодер, чтобы формировать вторую часть декодированного базового канала; и

контроллер (713) для подачи части кодированного базового канала в первую ветвь декодирования или во вторую ветвь декодирования в соответствии с управляющим сигналом.

30. Устройство по п.1, в котором декорреляционный фильтр (800) содержит:

первый модуль (810, 811) передискретизации для передискретизации первой части до предварительно определенной частоты дискретизации;

второй модуль (812) передискретизации для передискретизации второй части до этой предварительно определенной частоты дискретизации; и

модуль (802) всечастотного фильтра для всечастотной фильтрации входного сигнала всечастотного фильтра, чтобы получать заполняющий сигнал; и

контроллер (815) для подачи передискретизированной первой части или передискретизированной второй части в модуль (802) всечастотного фильтра.

31. Устройство по п.30, в котором контроллер (815) выполнен с возможностью подавать, в ответ на управляющий сигнал, либо передискретизированную первую часть, либо передискретизированную вторую часть, либо нулевые данные (816) в модуль всечастотного фильтра.

32. Устройство по п.1, в котором декорреляционный фильтр (800) содержит время-спектральный преобразователь (804) для преобразования заполняющего сигнала в спектральное представление, содержащее спектральные линии с первым спектральным разрешением, при этом

многоканальный процессор (900) содержит время-спектральный преобразователь (902) для преобразования декодированного базового канала в спектральное представление с использованием спектральных линий с первым спектральным разрешением,

многоканальный процессор (904) выполнен с возможностью формировать спектральные линии для первого канала повышающего микширования или второго канала повышающего микширования, причем спектральные линии имеют первое спектральное разрешение, с использованием, для конкретной спектральной линии, спектральной линии заполняющего сигнала, спектральной линии декодированного базового канала и одного или более параметров,

упомянутые один или более параметров имеют связанное с ними второе спектральное разрешение, ниже первого спектрального разрешения, и

упомянутые один или более параметров используются для формирования группы спектральных линий, каковая группа спектральных линий содержит упомянутую конкретную спектральную линию и по меньшей мере одну смежную по частоте спектральную линию.

33. Устройство по п.1, в котором многоканальный процессор выполнен с возможностью формировать спектральную линию для первого канала повышающего микширования или второго канала повышающего микширования с использованием следующего:

коэффициент (941a, 941b) вращения фазы в зависимости от одного или более передаваемых параметров;

спектральная линия декодированного базового канала;

первый весовой коэффициент (942a, 942b) для спектральной линии декодированного базового канала, причем первый весовой коэффициент зависит от передаваемого параметра;

спектральная линия заполняющих сигналов;

второй весовой коэффициент (943a, 943b) для спектральной линии заполняющего сигнала, причем второй весовой коэффициент зависит от передаваемого параметра; и

коэффициент (945) нормирования энергии.

34. Устройство по п.33, при этом

для вычисления второго канала повышающего микширования, знак второго весового коэффициента отличается от знака второго весового коэффициента, используемого в вычислении первого канала повышающего микширования, или

для вычисления второго канала повышающего микширования, коэффициент вращения фазы отличается от коэффициента вращения фазы, используемого в вычислении первого канала повышающего микширования, или

для вычисления второго канала повышающего микширования, первый весовой коэффициент отличается от первого весового коэффициента, используемого в вычислении первого канала повышающего микширования.

35. Устройство по п.1, в котором базовый канальный декодер выполнен с возможностью получать декодированный базовый канал с первой полосой пропускания, при этом

многоканальный процессор (900) выполнен с возможностью формировать спектральное представление первого канала повышающего микширования и второго канала повышающего микширования, причем спектральное представление имеет первую полосу пропускания и дополнительную вторую полосу пропускания, содержащую полосу частот выше первой полосы пропускания относительно частоты,

первая полоса пропускания формируется с использованием декодированного базового канала и заполняющего сигнала,

вторая полоса пропускания формируется с использованием заполняющего сигнала без декодированного базового канала,

многоканальный процессор выполнен с возможностью преобразовывать первый канал повышающего микширования или второй канал повышающего микширования в представление во временной области,

многоканальный процессор дополнительно содержит процессор (960) расширения полосы пропускания во временной области для формирования сигнала расширения во временной области для первого сигнала повышающего микширования или второго сигнала повышающего микширования или базового канала, причем сигнал расширения во временной области содержит вторую полосу пропускания; и

модуль (994a, 994b) комбинирования для комбинирования сигнала расширения во временной области и временного представления первого или второго канала повышающего микширования или базового канала, чтобы получать широкополосный канал повышающего микширования.

36. Устройство по п.35, в котором многоканальный процессор (900) выполнен с возможностью вычислять (945) коэффициент нормирования энергии, используемый для вычисления первого или второго канала повышающего микширования во второй полосе пропускания:

с использованием энергии декодированного базового канала в первой полосе пропускания,

с использованием энергии кодированной со взвешиванием версии сигнала расширения времени для первого канала или второго канала либо для сигнала понижающего микширования с расширенной полосой пропускания, и

с использованием энергии заполняющего сигнала во второй полосе пропускания.

37. Способ декодирования кодированного многоканального сигнала, содержащий этапы, на которых:

декодируют (700) кодированный базовый канал, чтобы получать декодированный базовый канал;

выполняют декорреляционную фильтрацию (800), по меньшей мере, части декодированного базового канала, чтобы получать заполняющий сигнал; и

выполняют (900) многоканальную обработку с использованием спектрального представления декодированного базового канала и спектрального представления заполняющего сигнала,

при этом декорреляционная фильтрация (800) представляет собой широкополосную фильтрацию, и многоканальная обработка (900) содержит этап, на котором применяют узкополосную обработку к спектральному представлению декодированного базового канала и спектральному представлению заполняющего сигнала.

38. Физический носитель данных, на котором сохранена компьютерная программа для осуществления, при ее исполнении на компьютере или процессоре, способа по п.37.

Документы, цитированные в отчете о поиске Патент 2021 года RU2741379C1

КОДИРОВАНИЕ ЗВУКА С ИСПОЛЬЗОВАНИЕМ ДЕКОРРЕЛИРОВАННЫХ СИГНАЛОВ 2005
  • Пурнхаген Хейко
  • Энгдегард Йонас
  • Бребарт Ерун
  • Схейерс Эрик
RU2369982C2
Способ обработки целлюлозных материалов, с целью тонкого измельчения или переведения в коллоидальный раствор 1923
  • Петров Г.С.
SU2005A1
Станок для изготовления деревянных ниточных катушек из цилиндрических, снабженных осевым отверстием, заготовок 1923
  • Григорьев П.Н.
SU2008A1
Способ приготовления лака 1924
  • Петров Г.С.
SU2011A1
Многоступенчатая активно-реактивная турбина 1924
  • Ф. Лезель
SU2013A1

RU 2 741 379 C1

Авторы

Бюте, Ян

Ройтельхубер, Франц

Диш, Саша

Фукс, Гийом

Мультрус, Маркус

Гайгер, Ральф

Даты

2021-01-25Публикация

2018-07-26Подача