Область техники, к которой относится изобретение
Настоящее изобретение относится к способу и к устройству для формирования из представления HOA-сигналов в области коэффициентов смешанного представления упомянутых HOA-сигналов в пространственной области/области коэффициентов, в котором количество HOA-сигналов может быть переменным.
Уровень техники
Обозначаемые в качестве HOA (Higher Order Ambisonics) Амбиофонические Звуки Высокого Порядка являются математическим описанием двух- или трехмерного звукового поля. Звуковое поле может быть захвачено набором микрофонов, образовано из синтетических звуковых источников либо представляет собой сочетание обоих вариантов. HOA могут использоваться в качестве транспортного формата для двух- или трехмерного объемного звука. В отличие от основанных на громкоговорителе представлений объемного звука преимущество HOA заключается в воспроизведении звукового поля на разных установках громкоговорителей. Поэтому, HOA подходят для универсального звукового формата.
Пространственное разрешение HOA определяется порядком HOA. Данный порядок задает количество HOA-сигналов, которые описывают звуковое поле. Существует два представления для HOA, которые называются пространственной областью и областью коэффициентов, соответственно. В большинстве случаев HOA первоначально представлены в области коэффициентов, и такое представление может быть преобразовано в пространственную область посредством матричного умножения (или преобразования), как описано в документе EP 2469742 A2. Пространственная область состоит из одного и того же количества сигналов, что и область коэффициентов. Однако в пространственной области каждый сигнал относится к направлению, причем направления равномерно распределены по единичной сфере. Это содействует анализу пространственного распределения HOA-представления. Представления в области коэффициентов, так же как и представления в пространственной области являются представлениями во временной области.
Раскрытие изобретения
В нижеследующем, в основном, цель состоит в максимально возможном использовании для PCM-передачи HOA-представлений пространственной области для обеспечения идентичного динамического диапазона для каждого направления. Это означает, что дискретные PCM-отсчеты HOA-сигналов в пространственной области должны быть пронормированы до диапазона предварительно заданных значений. Однако недостаток такого нормирования состоит в том, что динамический диапазон HOA-сигналов в пространственной области меньше, чем в области коэффициентов. Это обуславливается матрицей преобразования, которая формирует сигнал в пространственной области из сигналов в области коэффициентов.
В некоторых применениях HOA-сигналы передаются в области коэффициентов, например, при обработке, описанной в документе EP 13305558.2, в которой все сигналы передаются в области коэффициентов, потому что должно быть передано постоянное количество HOA-сигналов и переменное количество дополнительных HOA-сигналов. Однако, как уже упомянуто выше и показано в документе EP 2469742 A2, передача в области коэффициентов не выгодна. В качестве решения, постоянное количество HOA-сигналов может быть передано в пространственной области, и лишь дополнительные HOA-сигналы с переменным количеством передается в области коэффициентов. Передача дополнительных HOA-сигналов в пространственной области не возможна, так как изменяющееся во времени количество HOA-сигналов приведет в результате к изменяющимся во времени матрицам преобразования из области коэффициентов в пространственную область, и во всех сигналах в пространственной области могут возникать разрывы, которые являются неоптимальными для последующего перцепционного кодирования PCM-сигналов.
Для обеспечения передачи этих дополнительных HOA-сигналов без превышения диапазона предварительно заданных значений может использоваться обработка обратимого нормирования, которая разработана для предотвращения таких разрывов сигналов, и которая также достигает эффективной передачи инверсионных параметров.
Относительно динамического диапазона упомянутых двух HOA-представлений и нормирования HOA-сигналов для PCM-кодирования в нижеследующем делается вывод о том, должно ли такое нормирование иметь место в области коэффициентов или в пространственной области.
Во временной области коэффициентов HOA-представление состоит из последовательных кадров состоящих из N коэффициентов сигналов dn(k),n=0, …, N-1, где k обозначает индекс дискретного отсчета, а n обозначает индекс сигнала.
Эти состоящие из коэффициентов сигналы собраны в вектор d(k)=[d0(k), …, dN-1(k)]T для получения компактного представления.
Преобразование в пространственную область выполняется посредством матрицы NxN преобразования
как это определено в документе EP 12306569.0, см. определение для ΞGRID совместно с уравнениями (21) и (22).
Вектор w(k)=[w0(k), …, wN-1(k)]T в пространственной области получается из w(k)=Ψ-1d(k), (1)
где Ψ-1 является обратной матрицей матрицы Ψ.
Обратное преобразование из пространственной области в область коэффициентов выполняется посредством
d(k)=Ψw(k). (2)
Если диапазон значений дискретных отсчетов задан в одной области, то матрица Ψ преобразования автоматически задает диапазон значений другой области. Термин (k) для k-ого дискретного отсчета далее опускается.
Поскольку HOA-представление фактически воспроизводится в пространственной области, то диапазон значений, громкость и динамический диапазон задаются в данной области. Динамический диапазон задается битовым разрешением PCM-кодирования. В данной заявке «PCM–кодирование» означает преобразование дискретных отсчетов в представлении с плавающей запятой в дискретные отсчеты в целочисленном представлении в обозначении с фиксированной запятой.
Для PCM-кодирования HOA-представления, N сигналов в пространственной области должны быть отнормированы до диапазона значений -1 ≤ wn < 1 так, чтобы они могли быть отмасштабированы до максимального PCM-значения Wmax и округлены до целочисленного PCM-обозначения с фиксированной запятой
w’n=⎣wn Wmax⎦. (3)
Замечание: это обобщенное представление PCM-кодирования.
Диапазон значений для дискретных отсчетов в области коэффициентов может быть вычислен посредством бесконечной матричной нормой матрицы Ψ, которая определена следующим образом
, (4)
и максимальное абсолютное значение в пространственной области wmax=1 для -║Ψ║∞wmax ≤ dn < ║Ψ║∞wmax. Поскольку значение ║Ψ║∞ больше '1' для используемого определения матрицы Ψ, то диапазон значений dn увеличивается.
Обратный ход означает, что нормирование на ║Ψ║∞ необходимо для PCM-кодирования сигналов в области коэффициентов поскольку -1 ≤ dn/║Ψ║∞ < 1. Однако данное нормирование уменьшает динамический диапазон сигналов в области коэффициентов, что приведет в результате к пониженному соотношению сигнала к шуму квантования. Поэтому предпочтительным должно быть PCM-кодирование сигналов в пространственной области.
Проблема, которая должна быть решена посредством настоящего изобретения, состоит в том, как передать в области коэффициентов часть желаемых HOA-сигналов в пространственной области с использованием нормирования без уменьшения динамического диапазона в области коэффициентов. Дополнительно, нормированные сигналы не должны содержать скачки уровня сигнала так, чтобы они могли быть подвержены перцепционному кодированию без вызываемых скачками потерь качества. Данная проблема решается с помощью способов, раскрытых в пунктах 1 и 6 формулы изобретения. Устройства, которые используют эти способы, раскрыты в пунктах 2 и 7 формулы изобретения, соответственно.
В принципе, заявляемый способ формирования пригоден для формирования из представления HOA-сигналов в области коэффициентов смешанного представления упомянутых HOA-сигналов в пространственной области/области коэффициентов, причем количество упомянутых HOA-сигналов может быть переменным во времени в последовательных кадрах коэффициентов, отличающийся этапами, на которых:
- разделяют вектор HOA-сигналов в области коэффициентов на первый вектор сигналов в области коэффициентов, имеющий постоянное количество HOA-коэффициентов, и второй вектор сигналов в области коэффициентов, имеющий переменное во времени количество HOA-коэффициентов;
- преобразовывают упомянутый первый вектор сигналов в области коэффициентов в соответствующий вектор сигналов в пространственной области посредством умножения упомянутого вектора сигналов в области коэффициентов на обратную матрицу матрицы преобразования;
- подвергают PCM-кодированию упомянутый вектор сигналов в пространственной области для получения вектора подвергшихся PCM-кодированию сигналов в пространственной области;
- нормируют упомянутый второй вектор сигналов в области коэффициентов на нормировочный множитель, причем упомянутое нормирование является адаптивным нормированием по отношению к диапазону текущих значений HOA-коэффициентов упомянутого второго вектора сигналов в области коэффициентов, и при упомянутом нормировании диапазон доступных значений для HOA-коэффициентов вектора не превышается, и при этом при упомянутом нормировании к коэффициентам текущего второго вектора применяют равномерно непрерывную передаточную функцию с целью непрерывного изменения коэффициента усиления внутри этого вектора с коэффициента усиления в предыдущем втором векторе на коэффициент усиления в следующем втором векторе, и причем упомянутое нормирование предоставляет вспомогательную информацию для соответствующего денормирования на стороне декодера;
- подвергают PCM-кодированию упомянутый вектор нормированных сигналов в области коэффициентов для получения вектора подвергшихся PCM-кодированию и нормированных сигналов в области коэффициентов;
- мультиплексируют упомянутый вектор подвергшихся PCM-кодированию сигналов в пространственной области и упомянутый вектор подвергшихся PCM-кодированию и нормированных сигналов в области коэффициентов.
В принципе заявляемое устройство формирования пригодно для формирования из представления HOA-сигналов в области коэффициентов смешанного представления упомянутых HOA-сигналов в пространственной области/области коэффициентов, причем количество упомянутых HOA-сигналов может быть переменным во времени в последовательных кадрах коэффициентов, при этом упомянутое устройство включает в себя:
- средство, выполненное с возможностью разделения вектора HOA-сигналов в области коэффициентов на первый вектор сигналов в области коэффициентов, имеющий постоянное количество HOA-коэффициентов, и второй вектор сигналов в области коэффициентов, имеющий переменное во времени количество HOA-коэффициентов;
- средство, выполненное с возможностью преобразования упомянутого первого вектора сигналов в области коэффициентов в соответствующий вектор сигналов в пространственной области посредством умножения упомянутого вектора сигналов в области коэффициентов на обратную матрицу матрицы преобразования;
- средство, выполненное с возможностью PCM-кодирования упомянутого вектора сигналов в пространственной области для получения вектора подвергшихся PCM-кодированию сигналов в пространственной области;
- средство, выполненное с возможностью нормирования упомянутого второго вектора сигналов в области коэффициентов на нормировочный множитель, причем упомянутое нормирование является адаптивным нормированием по отношению к диапазону текущих значений HOA-коэффициентов упомянутого второго вектора сигналов в области коэффициентов, и при упомянутом нормировании диапазон доступных значений для HOA-коэффициентов вектора не превышается, и причем при упомянутом нормировании к коэффициентам текущего второго вектора применена равномерно непрерывная передаточная функция с целью непрерывного изменения коэффициента усиления внутри этого вектора с коэффициента усиления в предыдущем втором векторе на коэффициент усиления в следующем втором векторе, и при этом упомянутое нормирование предоставляет вспомогательную информацию для соответствующего денормирования на стороне декодера;
- средство, выполненное с возможностью PCM-кодирования упомянутого вектора нормированных сигналов в области коэффициентов для получения вектора подвергшихся PCM-кодированию и нормированных сигналов в области коэффициентов;
- средство, выполненное с возможностью мультиплексирования упомянутого вектора подвергшихся PCM-кодированию сигналов в пространственной области и упомянутого вектора подвергшихся PCM-кодированию и нормированных сигналов в области коэффициентов.
В принципе, заявляемый способ декодирования пригоден для декодирования смешанного представления кодированных HOA-сигналов в пространственной области/области коэффициентов, в котором количество упомянутых HOA-сигналов может быть переменным во времени в последовательных кадрах коэффициентов и в котором упомянутое смешанное представление кодированных HOA-сигналов в пространственной области/области коэффициентов сформировано согласно выше упомянутому заявляемому способу формирования, при этом упомянутое декодирование включает в себя этапы, на которых:
- демультиплексируют упомянутые мультиплексированные векторы подвергшихся PCM-кодированию сигналов в пространственной области и подвергшихся PCM-кодированию и нормированных сигналов в области коэффициентов;
- преобразовывают упомянутый вектор подвергшихся PCM-кодированию сигналов в пространственной области в соответствующий вектор сигналов в области коэффициентов посредством умножения упомянутого вектора подвергшихся PCM-кодированию сигналов в пространственной области на упомянутую матрицу преобразования;
- денормируют упомянутый вектор подвергшихся PCM-кодированию и нормированных сигналов в области коэффициентов, при этом упомянутый этап денормирования включает в себя этапы, на которых:
-- вычисляют, с использованием соответствующего показателя степени (exponent) en(j-1) из принятой вспомогательной информации и рекурсивно вычисленного значения gn(j-2) коэффициента усиления, вектор hn(j-1) передаточной функции, причем сохраняют значение gn(j-1) коэффициента усиления для соответствующей обработки следующего вектора подвергшихся PCM-кодированию и нормированных сигналов в области коэффициентов, подлежащих обработке, при этом j является переменным (running, пробегающим) индексом входной матрицы векторов HOA-сигналов;
-- применяют соответствующее значение обратного коэффициента усиления к текущему вектору подвергшегося PCM-кодированию и нормированного сигнала для получения соответствующего вектора подвергшегося PCM-кодированию и денормированного сигнала;
- объединяют упомянутый вектор сигналов в области коэффициентов и вектор денормированных сигналов в области коэффициентов для получения объединенного вектора HOA-сигналов в области коэффициентов, который может иметь переменное количество HOA-коэффициентов.
В принципе заявляемое устройство декодирования пригодно для декодирования смешанного представления кодированных HOA-сигналов в пространственной области/области коэффициентов, в котором количество упомянутых HOA-сигналов может быть переменным во времени в последовательных кадрах коэффициентов и в котором упомянутое смешанное представление кодированных HOA-сигналов в пространственной области/области коэффициентов сформировано согласно вышеупомянутому способу формирования, причем упомянутое устройство декодирования включает в себя:
- средство, выполненное с возможностью демультиплексирования упомянутых мультиплексированных векторов подвергшихся PCM-кодированию сигналов в пространственной области и подвергшихся PCM-кодированию и нормированных сигналов в области коэффициентов;
- средство, выполненное с возможностью преобразования упомянутого вектора подвергшихся PCM-кодированию сигналов в пространственной области в соответствующий вектор сигналов в области коэффициентов посредством умножения упомянутого вектора подвергшихся PCM-кодированию сигналов в пространственной области на упомянутую матрицу преобразования;
- средство, выполненное с возможностью денормирования упомянутого вектора подвергшихся PCM-кодированию и нормированных сигналов в области коэффициентов, причем упомянутое денормирование включает в себя:
-- вычисление, с использованием соответствующего показателя en(j-1) степени из принятой вспомогательной информации и рекурсивно вычисленного значения gn(j-2) коэффициента усиления, вектора hn(j-1) передаточной функции, причем выполнена возможность сохранения значения gn(j-1) коэффициента усиления для соответствующей обработки следующего вектора подвергшихся PCM-кодированию и нормированных сигналов в области коэффициентов, подлежащих обработке, при этом j является переменным индексом входной матрицы векторов HOA-сигналов;
-- применение соответствующего значения обратного коэффициента усиления к текущему вектору подвергшегося PCM-кодированию и нормированного сигнала для получения соответствующего вектора подвергшегося PCM-кодированию и денормированного сигнала;
- средство, выполненное с возможностью объединения упомянутого вектора сигналов в области коэффициентов и вектора денормированных сигналов в области коэффициентов для получения объединенного вектора HOA-сигналов в области коэффициентов, который может иметь переменное количество HOA-коэффициентов.
Преимущественные дополнительные варианты осуществления настоящего изобретения раскрыты в соответствующих зависимых пунктах формулы изобретения.
Краткое описание чертежей
Примерные варианты осуществления настоящего изобретения описаны со ссылкой на сопроводительные чертежи, на которых:
На Фиг.1 показана PCM-передача в пространственной области исходного HOA-представления в области коэффициентов;
На Фиг.2 показана объединенная передача HOA-представления в области коэффициентов и пространственной области;
На Фиг.3 показана объединенная передача HOA-представления в области коэффициентов и пространственной области с использованием поблочного адаптивного нормирования для сигналов в области коэффициентов;
На Фиг.4 показана обработка адаптивного нормирования для HOA-сигнала xn(j), представленного в области коэффициентов;
На Фиг.5 показана передаточная функция, используемая для плавного перехода между двумя различными значениями коэффициента усиления;
На Фиг.6 показана обработка адаптивного денормирования;
На Фиг.7 показан частотный FFT-спектр передаточных функций hn(l) с использованием различных показателей степени en, в котором максимальная амплитуда каждой функции нормирована до 0 дБ;
На Фиг.8 показаны примерные передаточные функции для трех последовательных векторов сигнала.
Описание вариантов осуществления
Относительно PCM-кодирования HOA-представления в пространственной области предполагается, что (в представлении с плавающей запятой) -1 ≤ wn < 1 выполняется так, чтобы PCM-передача HOA-представления могла быть выполнена согласно тому, как это показано на Фиг.1. На этапе или стадии 11 преобразователя на входе HOA-кодера сигнал d в области коэффициентов текущего входного кадра сигнала преобразовывается в сигнал w в пространственной области с использованием уравнения (1). На этапе или стадии 12 PCM-кодирования дискретные отсчеты w с плавающей запятой преобразовываются в подвергшиеся PCM-кодированию целочисленные дискретные отсчеты w’ в обозначении с фиксированной запятой с использованием уравнения (3). На этапе или стадии 13 мультиплексора дискретные отсчеты w’ мультиплексируются в формат HOA-передачи.
HOA-декодер демультиплексирует сигналы w’ из принятого формата HOA-передачи на этапе или стадии 14 демультиплексора, и повторно преобразовывает их на этапе или стадии 15 в сигналы d’ в области коэффициентов с использованием уравнения (2). Данное обратное преобразование увеличивает динамический диапазон d’ так, что такое преобразование из пространственной области в область коэффициентов всегда включает в себя преобразование формата из целочисленного (PCM) в формат с плавающей запятой.
Стандартная HOA-передача с Фиг.1 не будет успешно осуществлена, если матрица Ψ будет изменяющейся во времени, что имеет место, если количество или индекс HOA-сигналов является изменяющимся во времени для последовательных последовательностей HOA-коэффициентов, то есть последовательных входных кадров сигнала. Как упомянуто выше, один пример такого случая является обработкой HOA-сжатия, описанной в документе EP 13305558.2: постоянное количество HOA-сигналов передается непрерывно, а переменное количество HOA-сигналов с изменяющимся индексами n сигналов передается параллельно. Все сигналы передаются в области коэффициентов, которая является неоптимальной, как объяснено выше.
Согласно настоящему изобретению, обработка, описанная совместно с Фиг.1, расширяется так, как показано на Фиг.2.
На этапе или стадии 20 HOA-кодер разделяет HOA-вектор d на два вектора d1 и d2, при этом количество M HOA-коэффициентов для вектора d1 является постоянным, а вектор d2 содержит переменное количество K HOA-коэффициентов. Поскольку индексы n сигнала не изменяются во времени для вектора d1, PCM-кодирование выполняется в пространственной области на этапах или стадиях 21, 22, 23, 24 и 25 с сигналами, соответствующими w1 и w’1, изображенных в нижнем сигнальном тракте Фиг.2, соответствующем этапам/стадиям 11-15 с Фиг.1. Однако на этап/стадии 23 мультиплексора происходит получение дополнительного входного сигнала d”2, а на этапе/стадии 24 демультиплексора в HOA-декодере происходит предоставление другого выходного сигнала d”2.
Количество HOA-коэффициентов, или размер, K вектора d2 является изменяющимся во времени, и индексы переданных HOA-сигналов n могут изменяться во времени. Это предотвращает передачу в пространственной области, так как потребуется изменяющаяся во времени матрица преобразования, что в результате приведет к разрывам сигнала во всех перцепционно кодированных HOA-сигналах (этап или стадия перцепционного кодирования не показаны). Однако таких разрывов сигнала следует избегать, потому что они снижают качество перцепционного кодирования переданных сигналов. Таким образом, d2 должен быть передан в области коэффициентов. Вследствие большего диапазона значений сигналов в области коэффициентов сигналы должны быть отмасштабированы на этапе или стадии 26 на множитель 1/║Ψ║∞ прежде, чем PCM-кодирование сможет быть применено на этапе или стадии 27. Однако, недостаток такого масштабирования заключается в том, что максимальное абсолютное значение для ║Ψ║∞ является оценкой для наихудшего случая, максимальное абсолютное значение дискретного отсчета которого не будет возникать очень часто, потому что обычно диапазон ожидаемых значений более мал. В результате доступное разрешение для PCM-кодирования не используется эффективно, и соотношение сигнала к шуму квантования является низким.
Выходной сигнал d”2 этапа/стадии 24 демультиплексора обратно масштабируется на этапе или стадии 28 с использованием множителя ║Ψ║∞. Результирующий сигнал d’’’2 объединяется на этапе или стадии 29 с сигналом d’1, приводя в результате к декодированному HOA-сигналу d’ в области коэффициентов.
Согласно настоящему изобретению эффективность PCM-кодирования в области коэффициентов может быть повышена посредством использования адаптивного к сигналам нормирования сигналов. Однако такое нормирование должно быть обратимым и равномерно непрерывным от одного дискретного отсчета к другому дискретному отсчету. Необходимая поблочная адаптивная обработка изображена на Фиг.3. j-ая входная матрица D(j)=[d(jL+0) … d(jL+L - 1)] содержит L векторов d HOA-сигнала (индекс j не изображен на Фиг.3). Матрица D разделяется на две матрицы D1 и D2 подобно обработке на Фиг.2. Обработка для D1 на этапах или стадиях 31-35 соответствует обработке в пространственной области, описанной совместно с Фиг.2 и Фиг.1. Однако кодирование сигнала в области коэффициентов включает в себя этап или стадию 36 поблочного адаптивного нормирования, который автоматически адаптируется к диапазону текущих значений сигнала, за которым следует этап или стадия 37 PCM-кодирования. Требуемая вспомогательная информация для денормирования каждого подвергшегося PCM-кодированию сигнала в матрице D”2 хранится и передается в векторе e. Вектор e=[en1 … enK]T содержит одно значение на сигнал. На этапе или стадии 38 соответствующего адаптивного денормирования декодера на приемной стороне происходит обращение нормирования сигналов D”2 в D’’’2 с использованием информации из переданного вектора e. Результирующий сигнал D’’’2 объединяется на этапе или стадии 39 с сигналом D’1, приводя в результате к декодированному HOA-сигналу D' в области коэффициентов.
В адаптивном нормировании на этапе/стадии 36 равномерно непрерывная передаточная функция применяется к дискретным отсчетам текущего входного блока коэффициентов с целью постоянного изменения коэффициента усиления с последнего входного блока коэффициентов на коэффициент усиления следующего входного блока коэффициентов. Данный вид обработки требует задержки одного блока, потому что изменение коэффициента усиления нормирования (коэффициента нормирования) должно быть обнаружено на один входной блок коэффициентов вперед. Преимущество состоит в том, что вводимая амплитудная модуляция является малой, так что перцепционное кодирование модулированного сигнала почти не оказывает никакого влияния на денормированный сигнал.
Что касается варианта реализации адаптивного нормирования, то оно выполняется независимо для каждого HOA-сигнала D2(j). Сигналы представлены векторами-строками xnT матрицы
где n обозначает индексы переданных HOA-сигналов. xn является транспонированным, потому что первоначально он является вектором-столбцом, но здесь требуется вектор-строка.
На Фиг.4 показано данное адаптивное нормирование на этапе/стадии 36 более подробно. Входные значения обработки представляют собой следующее:
- сглаженное во времени максимальное значение xn,max,sm(j-2),
- значение gn(j-2) коэффициента усиления, то есть коэффициент усиления, который был применен к последнему коэффициенту соответствующего блока xn(j-2) вектора сигнала,
- вектор сигнала текущего блока xn(j),
- вектор сигнала предыдущего блока xn(j-1).
В начале обработки первого блока xn(0) рекурсивные входные значения инициализируется предварительно заданными значениями: коэффициенты вектора xn(-1) могут быть обнулены, значение gn(-2) коэффициента усиления должно быть установлено в '1', а xn,max,sm(-2) должно быть установлено в предварительно заданное среднее амплитудное значение.
После этого, значение gn(j-1) коэффициента усиления последнего блока, соответствующее значение en(j-1) вектора e(j-1) вспомогательной информации, сглаженное во времени максимальное значение xn,max,sm(j-1) и нормированный вектор x’n(j-1) сигнала представляют собой выходные результаты обработки.
Цель данной обработки состоит в непрерывном изменении значений коэффициента усиления, примененных к вектору xn(j-1) сигнала, с gn(j-2) на gn(j-1) так, чтобы значение gn(j-1) коэффициента усиления нормировало вектор xn(j) сигнала до диапазона подходящих значений.
На первом этапе или стадии 41 обработки каждый коэффициент вектора xn(j)=[xn,0(j)… xn,L-1(j)] сигнала умножается на значение gn(j-2) коэффициента усиления, при этом gn(j-2) было сохранено из обработки нормирования вектора xn(j-1) сигнала в качестве основы для нового коэффициента усиления нормирования. Из результирующего нормированного вектора xn(j) сигнала на этапе или стадии 42 с использованием уравнения (5) получается максимум xn,max абсолютных значений:
xn , max=max0≤l<L│gn(j-2)xn,l(j)│ (5)
На этапе или стадии 43 сглаживание во времени применяется к xn,max с использованием рекурсивного фильтра, принимающего предыдущее значение xn,max,sm(j-2) упомянутого сглаженного максимума и приводящего в результате к текущему сглаженному во времени максимуму xn,max,sm(j-1). Цель такого сглаживания заключается в ослаблении адаптации коэффициента усиления нормирования во времени, что уменьшает количество изменений коэффициента усиления и поэтому амплитудную модуляцию сигнала. Сглаживание во времени применяется только в том случае, если значение xn,max находится внутри диапазона предварительно заданных значений. Иначе, xn,max,sm(j-1) устанавливается в xn,max (т.е. значение xn,max сохраняется таким, какое оно есть), потому что последующая обработка должна ослаблять действующее значение xn,max до диапазона предварительно заданных значений. Поэтому, сглаживание во времени задействуется только тогда, когда коэффициент усиления нормирования является постоянным или когда сигнал xn(j) может быть усилен без покидания диапазона значений.
(xn,max,sm(j-1)) вычисляется на этапе/стадии 43 следующим образом:
(6)
где 0 < a ≤ 1 является постоянной ослабления.
С целью уменьшения битовой скорости для передачи вектора e коэффициент усиления нормирования вычисляется из текущего сглаженного во времени максимального значения xn,max,sm(j-1) и передается в качестве показателя степени по основанию '2'. Таким образом должно выполняться следующее условие:
(7)
и квантованный показатель степени en(j-1) получается из
(8)
на этапе или стадии 44.
В периоды, в которые сигнал повторно усиливается (то есть значение общего коэффициента усиления увеличивается во времени), с целью использования доступного разрешения для эффективного PCM-кодирования, показатель en(j) степени может быть ограничен (и таким образом разность коэффициента усиления между последовательными блоками) малым максимальным значением, например, '1'. Данное действие имеет два преимущественных технических результата. С одной стороны, малые разности коэффициента усиления между последовательными блоками приводят только к малым амплитудным модуляциям через передаточную функцию, приводя в результате к уменьшенной перекрестной помехе между смежными подполосами FFT-спектра (см. соответствующее описание воздействия передаточной функции на перцепционное кодирование совместно с Фиг.7). С другой стороны, битовая скорость для кодирования показателя степени уменьшается за счет ограничения диапазона его значений.
Значение полного максимального усиления
(9)
может быть ограничено, например, '1'. Причина состоит в том, что, если один из сигналов коэффициентов демонстрирует большое амплитудное изменение между двумя последовательными блоками, из которых первый имеет очень малые амплитуды, а второй имеет максимально возможную амплитуду (предполагается нормирование HOA-представления в пространственной области), то очень большие разности коэффициента усиления между этими двумя блоками приведут к большим амплитудным модуляциям через передаточную функцию, приводя в результате к серьезной перекрестной помехе между смежными подполосами FFT-спектра. Это может бы быть неоптимальным для последующего перцепционного кодирования, обсуждаемого ниже.
На этапе или стадии 45 значение показателя en(j-1) степени применяется к передаточной функции для получения текущего значения gn(j-1) коэффициента усиления. Для непрерывного перехода от значения gn(j-2) коэффициента усиления к значению gn(j-1) коэффициента усиления используется функция, изображенная на Фиг.5. Вычислительное правило для этой функции состоит в следующем:
(10)
где l=0, 1, 2, …, L-1. Фактический вектор hn(j-1)=[hn(0), …, hn(L-1)]T передаточной функции с
(11)
используется для непрерывного ослабления с gn(j-2) до gn(j-1). Для каждого значения en(j-1) значение hn(0) равно en(j-2) поскольку f(0)=1. Последнее значение f(L-1) равно 0,5, так что будет приводить в результате к требуемому усилению gn(j-1) для нормирования xn(j) из уравнения (9).
На этапе или стадии 46 дискретные отсчеты вектора xn(j-1) сигнала взвешиваются по значениям коэффициента усиления вектора hn(j-1) передаточной функции для получения
x’n(j-1)=xn(j-1)⊗hn(j-1), (12)
где оператор «⊗» представляет собой векторное поэлементное умножение двух векторов. Данное умножение может также быть рассмотрено в качестве представления амплитудной модуляции сигнала xn(j-1).
Более подробно, коэффициенты вектора hn(j-1)=[hn(0), …, hn(L-1)]T передаточной функции умножаются на соответствующие коэффициенты вектора xn(j-1) сигнала, где значение hn(0) представляет собой hn(0)=gn(j-2), а значение hn(L-1) представляет собой hn(L-1)=gn(j-1). Поэтому передаточная функция непрерывно ослабляется от значения gn(j-2) коэффициента усиления к значению gn(j-1) коэффициента усиления, как это изображено в примере Фиг.8, на которой показаны значения коэффициента усиления от передаточных функций hn(j), hn(j-1) и hn(j-2), которые применяются к соответствующим векторам xn(j), xn(j-1) и xn(j-2) сигнала для трех последовательных блоков. Преимущество по отношению к последующему перцепционному кодированию состоит в том, что на границах блоков применяемые коэффициенты усиления непрерывны: передаточная функция hn(j-1) непрерывно ослабляет коэффициенты усиления для коэффициентов xn(j-1) с gn(j-2) к gn(j-1).
Обработка адаптивного денормирования на стороне декодера или приемника показана на Фиг.6. Входными значениями являются подвергшиеся PCM-кодированию и нормированные сигналы x”n(j-1), подходящий показатель en(j-1) степени и значение gn(j-2) коэффициента усиления последнего блока. Значение gn(j-2) коэффициента усиления последнего блока вычисляется рекурсивно, причем gn(j-2) должно быть инициализировано предварительно заданным значением, которое также уже использовалось в кодере. Выходными результатами являются значение gn(j-1) коэффициента усиления с этапа/стадии 61 и денормированный сигнал x’’’n(j-1) с этапа/стадии 62.
На этапе или стадии 61 показатель степени применяется к передаточной функции. Для восстановления диапазона значений xn(j-1), в уравнении (11) вычисляется вектор hn(j-1) передаточной функции из принятого показателя en(j-1) степени и рекурсивно вычисленного коэффициента усиления gn(j-2). Коэффициент усиления gn(j-1) для обработки следующего блока устанавливается равным hn(L-1).
На этапе или стадии 62 применяется обратный коэффициент усиления. Примененная амплитудная модуляция обработки нормирования обращается посредством x’’’n(j-1)=x”n(j-1)⊗hn(j-1)-1, (13)
где , а «⊗» является векторным поэлементным умножением, которое было использовано на стороне кодера или передатчика. Дискретные отсчеты x’n(j-1) не могут быть представлены входным PCM-форматом x”n(j-1), так что денормированию требуется преобразование в формат диапазона больших значений, как например формат с плавающей запятой.
Что касается передачи вспомогательной информации, то для передачи показателей en(j-1) степени нельзя предположить, что их вероятность является равномерной, потому что применяемый коэффициент усиления нормирования будет постоянным для последовательных блоков одного и тот же диапазона значений. Таким образом энтропийное кодирование, как например Кодирование методом Хаффмана, может быть применено к значениям показателя степени для уменьшения требуемой скорости передачи данных.
Один недостаток описанной обработки может заключаться в рекурсивном вычислении значения gn(j-2) коэффициента усиления. Следовательно, обработка денормирования может начинаться только с начала HOA-потока.
Решение для данной проблемы состоит в добавлении блоков доступа в HOA-формат с целью предоставления информации для регулярного вычисления gn(j-2). В данном случае блок доступа должен обеспечивать показатели en,access=log2 gn(j-2) (14)
степени для каждого t-ого блока так, чтобы могло быть вычислено и денормирование могло начаться в каждом t-ом блоке.
Воздействие на перцепционное кодирование нормированного сигнала x’n(j-1) анализируется по абсолютному значению частотной характеристики (15)
функции hn(l). Частотная характеристика задается Быстрым Преобразованием Фурье (FFT) над hn(l), как показано в уравнении (15).
На Фиг.7 показан нормированный (до 0 дБ) амплитудный FFT-спектр Hn(u) для прояснения спектрального искажения, вводимого амплитудной модуляцией. Затухание │Hn(u)│ является относительно резким для малых показателей степени и становится плоским для более больших показателей степени.
Так как амплитудная модуляция xn(j-1) по hn(l) во временной области эквивалентна свертке по Hn(u) в частотной области, то резкое затухание частотной характеристики Hn(u) уменьшает перекрестную помеху между смежными подполосами FFT-спектра x’n(j-1). Это сильно связано с последующим перцепционным кодированием x’n(j-1), потому что подполосная перекрестная помеха влияет на оцениваемые перцепционные характеристики сигнала. Таким образом, для резкого затухания Hn(u), предположения перцепционного кодирования для x’n(j-1) также действительны для ненормированного сигнала xn(j-1).
Это показывает, что для малых показателей степени перцепционное кодирование x’n(j-1) почти эквивалентно перцепционному кодированию xn(j-1) и что перцепционное кодирование нормированного сигнала почти не имеет никакого воздействия на денормированный сигнал при малой амплитуде показателя степени.
Заявляемая обработка может быть выполнена одиночным процессором или электронной схемой на передающей стороне и на приемной стороне или несколькими процессорами или электронными схемами, функционирующими параллельно и/или функционирующими в различных частях заявляемой обработки.
Изобретение относится к области обработки данных. Технический результат заключается в обепечении возможности передавать в области коэффициентов часть желаемых HOA-сигналов (амбиофонических звуков более высокого порядка) в пространственной области с использованием нормирования без уменьшения динамического диапазона в области коэффициентов. Вектор сигналов в области коэффициентов разделяется на вектор сигналов в области коэффициентов, имеющий постоянное количество HOA-коэффициентов, и вектор сигналов в области коэффициентов, имеющий переменное количество HOA-коэффициентов. Имеющий постоянное количество HOA-коэффициентов вектор преобразовывается в соответствующий вектор сигналов в пространственной области. Вектор сигналов в области коэффициентов адаптивно нормируется и мультиплексируется с вектором сигналов в пространственной области. 2 н.п. ф-лы, 8 ил.
1. Способ декодирования математического представления звукового поля HOA (амбиофонические звуки высокого порядка), причем упомянутое декодирование содержит:
демультиплексирование мультиплексированного вектора PCM-кодированных сигналов в пространственной области и вектора PCM-кодированных и нормированных сигналов в области коэффициентов;
преобразование вектора PCM-кодированных сигналов в пространственной области в соответствующий вектор сигналов в области коэффициентов посредством умножения вектора PCM-кодированных сигналов в пространственной области на матрицу преобразования;
денормирование вектора PCM-кодированных и нормированных сигналов в области коэффициентов, при этом упомянутое денормирование содержит:
- определение вектора передаточной функции на основе соответствующего показателя степени вспомогательной информации и рекурсивно вычисленного значения коэффициента усиления, при этом соответствующий показатель степени и значение коэффициента усиления основаны на переменном индексе входной матрицы векторов HOA-сигналов;
- применение соответствующего обратного значения коэффициента усиления к вектору PCM-кодированных и нормированных сигналов в области коэффициентов для того, чтобы определить соответствующий вектор PCM-кодированного и денормированного сигнала;
объединение вектора сигналов в области коэффициентов и вектора денормированных сигналов в области коэффициентов для определения объединенного вектора HOA-сигналов в области коэффициентов, который может иметь переменное количество HOA-коэффициентов.
2. Устройство декодирования математического представления звукового поля HOA, причем упомянутое устройство декодирования содержит:
процессор для демультиплексирования мультиплексированного вектора PCM-кодированных сигналов в пространственной области и вектора PCM-кодированных и нормированных сигналов в области коэффициентов;
при этом процессор дополнительно выполнен с возможностью преобразования вектора PCM-кодированных сигналов в пространственной области в соответствующий вектор сигналов в области коэффициентов посредством умножения вектора PCM-кодированных сигналов в пространственной области на матрицу преобразования;
при этом процессор дополнительно выполнен с возможностью денормирования упомянутого вектора PCM-кодированных и нормированных сигналов в области коэффициентов, что включает в себя:
- процессор дополнительно выполнен с возможностью определения вектора передаточной функции на основе соответствующего показателя степени вспомогательной информации и рекурсивно вычисленного значения коэффициента усиления, при этом соответствующий показатель степени и значение коэффициента усиления основаны на переменном индексе входной матрицы векторов HOA-сигналов;
- процессор дополнительно выполнен с возможностью применения соответствующего обратного значения коэффициента усиления к вектору PCM-кодированных и нормированных сигналов в области коэффициентов для того, чтобы определить соответствующий вектор PCM-кодированного и денормированного сигнала; и
при этом процессор дополнительно выполнен с возможностью объединения вектора сигналов в области коэффициентов и вектора денормированных сигналов в области коэффициентов для определения объединенного вектора HOA-сигналов в области коэффициентов, который может иметь переменное количество HOA-коэффициентов.
СНИЖЕНИЕ УРОВНЕЙ/АКТИВНОСТИ АРГИНАЗЫ | 2007 |
|
RU2469742C2 |
Изложница с суживающимся книзу сечением и с вертикально перемещающимся днищем | 1924 |
|
SU2012A1 |
Приспособление для суммирования отрезков прямых линий | 1923 |
|
SU2010A1 |
CN 102982805 A, 20.03.2013 | |||
КАНАЛЬНОЕ КОДИРОВАНИЕ НА ОСНОВЕ КОМПЛЕКСНОГО ПРЕОБРАЗОВАНИЯ С ЧАСТОТНЫМ КОДИРОВАНИЕМ С РАСШИРЕННОЙ ПОЛОСОЙ | 2007 |
|
RU2422987C2 |
Авторы
Даты
2024-04-18—Публикация
2022-07-14—Подача