КОДИРОВАНИЕ И ДЕКОДИРОВАНИЕ ЗВУКА Российский патент 2012 года по МПК G10L19/00 

Описание патента на изобретение RU2461078C2

Данное изобретение относится к кодированию и/или декодированию звука с использованием структур иерархического кодирования и/или структур иерархического декодирования.

В области техники обработки звука хорошо известно преобразование множества звуковых каналов в другое, большее количество звуковых каналов. Такое преобразование может выполняться по различным причинам. Например, звуковой сигнал могут преобразовывать в другой формат для обеспечения улучшенного восприятия пользователями. Например, традиционная стереозапись содержит только два канала, тогда как современные передовые звуковые системы обычно используют пять или шесть каналов, как в популярной системе окружающего звука формата 5.1. Соответственно, два стереоканала можно преобразовывать в пять или шесть каналов для использования всех преимуществ передовой звуковой системы.

Другой причиной преобразования каналов является эффективность кодирования. Было обнаружено, что, например, звуковые стереосигналы можно кодировать как одноканальные звуковые сигналы, объединенные с битовым потоком параметров, описывающих пространственные свойства звукового сигнала. Декодер может воспроизводить звуковые стереосигналы с очень хорошей степенью точности. Таким образом может быть получена значительная экономия в расходе битов (битрейт).

Существует несколько параметров, которые могут использоваться для описания пространственных свойств звуковых сигналов. Одним из таких параметров является межканальная корреляция, например корреляция между левым каналом и правым каналом для стереосигналов. Другим параметром является отношение мощности каналов. В так называемых (параметрических) пространственных звуковых кодерах эти и другие параметры извлекают из исходного звукового сигнала для генерации звукового сигнала, имеющего меньшее количество каналов, например только один канал, плюс набор параметров, описывающих пространственные свойства исходного звукового сигнала. В так называемых (параметрических) пространственных звуковых декодерах восстанавливают исходный звуковой сигнал.

Пространственное кодирование звука - недавно введенная методика для эффективного кодирования многоканального звукового материала. При пространственном кодировании звука М-канальный звуковой сигнал описывают как N-канальный звуковой сигнал плюс набор соответствующих пространственных параметров, где N обычно меньше М. Следовательно, в пространственном звуковом кодере выполняют понижающее микширование M-канального сигнала в N-канальный сигнал и извлекают пространственные параметры. В декодере N-канальный сигнал и пространственные параметры используют для восстановления (на уровне чувственного восприятия) M-канального сигнала.

При таком пространственном кодировании звука предпочтительно используют каскадную или древовидную иерархическую структуру, содержащую стандартные блоки в кодере и декодере. В кодере эти стандартные блоки могут быть блоками понижающего микширования, объединяющими каналы в меньшее количество каналов, например блоками понижающего микширования 2 в 1, 3 в 1, 3 в 2 и т.д., в то время как в декодере соответствующие стандартные блоки могут быть блоками повышающего микширования, разделяющими каналы на большее количество каналов, например блоками повышающего микширования 1 в 2, 2 в 3.

Однако проблемой при таком подходе является то, что структура декодера должна соответствовать структуре кодера. Хотя этого можно достичь с помощью использования стандартизированной структуры кодера и декодера, такой подход является негибким и приведет к неоптимальной производительности.

Следовательно, улучшенная система была бы выгодной и, в частности, будет выгодной система, которая обеспечивает повышенную гибкость, уменьшенную сложность и/или улучшенную производительность.

Соответственно, данное изобретение стремится предпочтительно смягчить, облегчить или устранить один или большее количество из указанных выше недостатков отдельно или в любой комбинации.

Согласно первому аспекту изобретения обеспечивают устройство для генерации множества выходных звуковых каналов, содержащее средство для приема потока данных, содержащего множество входных звуковых каналов и параметрические звуковые данные, причем этот поток данных дополнительно содержит данные древовидной структуры декодера для структуры иерархического декодера, данные древовидной структуры декодера содержат по меньшей мере одно значение данных, указывающее характеристику разделения канала для звукового канала на иерархическом слое структуры иерархического декодера; средство для генерации структуры иерархического декодера в ответ на данные древовидной структуры декодера и средство для генерации из потока данных множества выходных звуковых каналов, используя структуру иерархического декодера.

Изобретение может предоставлять возможность гибкой генерации звуковых каналов и может, в частности, позволять адаптировать функциональные возможности декодера к структуре кодера, используемой для генерации потока данных. Изобретение может, например, предоставлять возможность кодеру выбирать соответствующий подход кодирования для многоканального сигнала, предоставляя возможность устройству автоматически адаптироваться к нему. Изобретение может обеспечивать поток данных, имеющий улучшенное отношение качества к битрейту. В частности, изобретение может предоставлять возможность автоматической адаптации и/или высокую степень гибкости, обеспечивая при этом улучшенное качество звука, достигаемое с помощью структур иерархического кодирования/декодирования. Изобретение может, кроме того, предоставлять возможность эффективной передачи информации структуры иерархического декодера. В частности, изобретение может предоставлять возможность использования небольшого объема служебной информации для данных древовидной структуры декодера. Изобретение может обеспечивать устройство, которое автоматически адаптируется к принимаемому битовому потоку и которое может использоваться с любой соответствующей структурой иерархического кодирования.

Каждый звуковой канал может содержать отдельный звуковой сигнал. Поток данных может быть одним битовым потоком или может быть, например, комбинацией множества битовых субпотоков, например, распределенных по различным каналам распространения. Поток данных может иметь ограниченную продолжительность, например фиксированную продолжительность, соответствующую файлу данных заданного размера. Характеристика разделения канала может быть характеристикой, указывающей, на какое количество каналов делят заданный звуковой канал на некотором иерархическом слое. Например, характеристика разделения канала может отражать, является или нет заданный звуковой канал разделенным или делится ли он на два звуковых канала.

Данные древовидной структуры декодера могут содержать данные для структуры иерархического декодера для множества звуковых каналов. Более конкретно, данные древовидной структуры декодера могут содержать набор данных для каждого из множества входных звуковых каналов. Например, данные древовидной структуры декодера могут содержать данные для древовидной структуры декодера для каждого входного сигнала.

К необязательным признакам изобретения относится то, что данные древовидной структуры декодера содержат множество значений данных, причем каждое значение данных указывает характеристику разделения канала для одного канала на одном иерархическом слое структуры иерархического декодера.

Это может обеспечивать эффективную передачу данных, предоставляя возможность устройству адаптироваться к кодированию, используемому для потока данных. Данные древовидной структуры декодера могут, в частности, содержать одно значение данных для каждой функции разделения канала в структуре иерархического декодера. Данные древовидной структуры декодера могут также содержать одно значение данных для каждого выходного канала, указывающего, что дальнейшего разделения канала не происходит для сигнала заданного иерархического слоя.

К необязательным признакам изобретения относится то, что предопределенное значение данных указывает на отсутствие разделения канала для канала на иерархическом слое.

Это может обеспечивать эффективную передачу данных, предоставляя возможность устройству эффективно и надежно адаптироваться к кодированию, используемому для потока данных.

К необязательным признакам изобретения относится то, что предопределенное значение данных указывает разделение канала «один в два» для канала на иерархическом слое.

Это может обеспечивать эффективную передачу данных, предоставляя возможность устройству эффективно и надежно адаптироваться к кодированию, используемому для потока данных. В частности, это может предоставлять возможность очень эффективного переноса информации для многих иерархических систем, используя несложные стандартные функции разделения канала.

К необязательным признакам изобретения относится то, что множество значений данных являются значениями двоичных данных.

Это может обеспечивать эффективную передачу данных, предоставляя возможность устройству эффективно и надежно адаптироваться к кодированию, используемому для потока данных. В частности, это может предоставлять возможность очень эффективного переноса информации для систем, главным образом используя специфические функциональные возможности разделения канала, например функциональные возможности разделения канала «один в два».

К необязательным признакам изобретения относится то, что одно предопределенное значение двоичных данных указывает разделение канала «один в два», а другое предопределенное значение двоичных данных указывает отсутствие разделения канала.

Это может обеспечивать эффективную передачу данных, предоставляя возможность устройству эффективно и надежно адаптироваться к кодированию, используемому для потока данных. В частности, это может предоставлять возможность очень эффективного переноса информации для систем, основываясь на функциональной возможности разделения канала «один в два» с низкой сложностью. Эффективное декодирование может быть достигнуто с помощью структуры иерархического декодера с низкой сложностью, которая может быть сгенерирована в ответ на данные низкой сложности. Данный признак может предоставлять возможность использования небольшого количества служебной информации для передачи данных древовидной структуры декодера и может, в частности, удовлетворять требованиям для потоков данных, кодированных с помощью простой функции кодирования.

К необязательным признакам изобретения относится то, что поток данных дополнительно содержит указание количества входных каналов.

Это может облегчать декодирование и генерацию структуры декодирования и/или может предоставлять возможность более эффективного кодирования информации структуры иерархического декодера в данных древовидной структуры декодера. В частности, средство для генерации структуры иерархического декодера может делать это в ответ на указание количества входных каналов. Например, во многих практических ситуациях количество входных каналов может быть получено из потока данных, однако в некоторых отдельных случаях звуковые данные и данные параметров могут быть отделены. В таких случаях может быть удобно, если количество входных каналов известно, поскольку на данные потока данных, возможно, воздействовали (например, выполнили понижающее кодирование из стереосигнала в монофонический сигнал).

К необязательным признакам изобретения относится то, что поток данных дополнительно содержит указание количества выходных каналов.

Это может облегчать декодирование и генерацию структуры декодирования и/или может предоставлять возможность более эффективного кодирования информации структуры иерархического декодера в данных древовидной структуры декодера. В частности, средство для генерации структуры иерархического декодера может делать это в ответ на указание количества выходных каналов. Также данное указание может использоваться в качестве проверки наличия ошибки в данных древовидной структуры декодера.

К необязательным признакам изобретения относится то, что поток данных содержит указание количества функций разделения канала «один в два» в структуре иерархического декодера.

Это может облегчать декодирование и генерацию структуры декодирования и/или может предоставлять возможность более эффективного кодирования информации структуры иерархического декодера в данных древовидной структуры декодера. В частности, средство для генерации структуры иерархического декодера может делать это в ответ на указание количества функций разделения канала «один в два» в структуре иерархического декодера.

К необязательным признакам изобретения относится то, что поток данных дополнительно содержит указание количества функций разделения канала «два в три» в структуре иерархического декодера.

Это может облегчать декодирование и генерацию структуры декодирования и/или может предоставлять возможность более эффективного кодирования информации структуры иерархического декодера в данных древовидной структуры декодера. В частности, средство для генерации структуры иерархического декодера может делать это в ответ на указание количества функций разделения канала «два в три» в структуре иерархического декодера.

К необязательным признакам изобретения относится то, что данные древовидной структуры декодера содержат данные для множества древовидных структур декодера, упорядоченных в ответ на присутствие функциональной возможности разделения канала «два в три».

Это может облегчать декодирование и генерацию структуры декодирования и/или может предоставлять возможность более эффективного кодирования информации структуры иерархического декодера в данных древовидной структуры декодера. В частности, данный признак может предоставлять возможность преимущественной производительности в системах, в которых разделение канала «два в три» может происходить только на корневом слое. Например, средство для генерации структуры иерархического декодера может сначала генерировать функциональную возможность разделения «два в три» для двух входных каналов, за которой следует генерация остальной структуры, используя только функциональные возможности разделения канала «один в два». Остальную структуру можно, в частности, генерировать в ответ на двоичные данные древовидной структуры декодера, таким образом уменьшая требующийся битрейт. Поток данных может дополнительно содержать информацию упорядочения множества древовидных структур декодера.

К необязательным признакам изобретения относится то, что данные древовидной структуры декодера по меньшей мере для одного входного канала содержат указание функции разделения канала «два в три», присутствующей на корневом слое, за которой следуют двоичные данные, где каждое значение двоичных данных указывает или на отсутствие функциональной возможности разделения или на функциональную возможность разделения канала «один в два» для зависимых слоев функциональной возможности разделения «два в три».

Это может облегчать декодирование и генерацию структуры декодирования и/или может предоставлять возможность более эффективного кодирования информации структуры иерархического декодера в данных древовидной структуры декодера. В частности, данный признак может предоставлять возможность преимущественной производительности в системах, где разделение канала «два в три» может происходить только на корневом слое. Например, средства для генерации структуры иерархического декодера могут сначала генерировать функциональную возможность разделения «два в три» для входного канала, за которой следует генерация остальной структуры, используя только функциональные возможности разделения канала «один в два». Остальную структуру можно, в частности, генерировать в ответ на двоичные данные древовидной структуры декодера, таким образом уменьшая требующийся битрейт.

К необязательным признакам изобретения относится то, что поток данных содержит указание расположения громкоговорителя по меньшей мере для одного из выходных каналов.

Это может предоставлять возможность облегченного декодирования и может предоставлять возможность улучшенной производительности и/или адаптирования устройства, таким образом обеспечивая улучшенную гибкость.

К необязательным признакам изобретения относится то, что средство для генерации структуры иерархического декодера предназначено для определения параметров умножения для функций разделения канала иерархических слоев в ответ на данные древовидной структуры декодера.

Это может предоставлять возможность улучшенной производительности и/или улучшенной адаптируемости/гибкости. В частности, данный признак может предоставлять возможность адаптировать к принимаемому потоку данных не только структуру иерархического декодера, но также и работу функций разделения канала. Параметры умножения могут быть параметрами матричного умножения.

К необязательным признакам изобретения относится то, что древовидная структура декодера содержит по меньшей мере одну функциональную возможность разделения канала по меньшей мере на одном иерархическом слое, причем данная по меньшей мере одна функциональная возможность разделения канала содержит средство декорреляции для генерации декоррелированного сигнала непосредственно из входного потока данных звукового канала; по меньшей мере один блок разделения канала для генерации множества выходных каналов иерархического слоя из звукового канала от более высокого иерархического слоя и декоррелированного сигнала; и средство для определения по меньшей мере одной характеристики фильтра декорреляции или блока разделения канала в ответ на данные древовидной структуры декодера.

Это может предоставлять возможность улучшенной производительности и/или улучшенной адаптируемости/гибкости. В частности, данный признак может обеспечивать структуру иерархического декодера, которая улучшает производительность декодирования и которая может генерировать выходные каналы, улучшая качество звука. В частности, можно получать структуру иерархического декодера, в которой никакие сигналы декорреляции не генерируются с помощью каскадированных фильтров декорреляции и ее можно динамически и автоматически адаптировать к принимаемому потоку данных.

Фильтр декорреляции принимает входной поток данных звукового канала без модификаций и, в частности, без какой-либо предшествующей фильтрации сигнала (например, с помощью другого фильтра декорреляции). Усиление фильтра декорреляции может, в частности, определяться в ответ на данные древовидной структуры декодера.

К необязательным признакам изобретения относится то, что средство декорреляции содержит средство компенсации уровня для выполнения компенсации уровня звука для входного звукового канала для генерации звукового сигнала с компенсированным уровнем; и фильтр декорреляции для фильтрации звукового сигнала с компенсированным уровнем для генерации декоррелированного сигнала.

Это может предоставлять возможность улучшенного качества и/или облегченного воплощения.

К необязательным признакам изобретения относится то, что средство компенсации уровня содержит матричное умножение на предварительную матрицу. Это может предоставлять возможность эффективного воплощения.

К необязательным признакам изобретения относится то, что коэффициенты предварительной матрицы имеют по меньшей мере одно единичное значение для структуры иерархического декодера, содержащей только функциональную возможность разделения канала «один в два».

Это может уменьшать сложность и предоставлять возможность эффективного воплощения. Структура иерархического декодера может содержать функциональную возможность, отличающуюся от функциональной возможности разделения канала «один в два», но в соответствии с данным признаком не будет содержать никакой другой функциональной возможности разделения канала.

К необязательным признакам изобретения относится то, что устройство дополнительно содержит средство для определения предварительной матрицы по меньшей мере для одной функциональной возможности разделения канала по меньшей мере на одном иерархическом слое в ответ на параметры функциональной возможности разделения канала на более высоком иерархическом слое.

Это может предоставлять возможность эффективного воплощения и/или улучшенной производительности. Функциональная возможность разделения канала на более высоком иерархическом слое может включать в себя функциональную возможность разделения канала «два в три», например, расположенную на корневом слое древовидной структуры декодера.

К необязательным признакам изобретения относится то, что устройство содержит средство для определения матрицы разделения канала по меньшей мере для одной функциональной возможности разделения канала в ответ на параметры по меньшей мере одной функциональной возможности разделения канала по меньшей мере на одном иерархическом слое.

Это может предоставлять возможность эффективного воплощения и/или улучшенной производительности. Это может быть особенно выгодным для иерархических древовидных структур декодера, содержащих только функциональные возможности разделения канала «один в два».

К необязательным признакам изобретения относится то, что устройство дополнительно содержит средство для определения предварительной матрицы по меньшей мере для одной функциональной возможности разделения канала по меньшей мере на одном иерархическом слое в ответ на параметры блока повышающего микширования «два в три» более высокого иерархического слоя.

Это может предоставлять возможность эффективного воплощения и/или улучшенной производительности. Это может быть особенно выгодным для иерархических древовидных структур декодера, содержащих функциональные возможности разделения канала «два в три» на корневом слое древовидной структуры декодера.

К необязательным признакам изобретения относится то, что средство для определения предварительной матрицы предназначено для определения предварительной матрицы по меньшей мере для одной функциональной возможности разделения канала в ответ на определение первой подматрицы предварительной матрицы; соответствующей первому входу блока повышающего микширования «два в три», и второй подматрицы предварительной матрицы, соответствующей второму входу блока повышающего микширования «два в три».

Это может предоставлять возможность эффективного воплощения и/или улучшенной производительности. Это может быть особенно выгодным для иерархических древовидных структур декодера, содержащих функциональные возможности разделения канала «два в три» на корневом слое древовидной структуры декодера.

Согласно другому аспекту изобретения обеспечивают устройство для генерации потока данных, содержащего множество выходных звуковых каналов, содержащее средство для приема множества входных звуковых каналов; средство иерархического кодирования для параметрического кодирования множества входных звуковых каналов для генерации потока данных, содержащего множество выходных звуковых каналов и параметрические звуковые данные; средство для определения структуры иерархического декодера, соответствующей средству иерархического кодирования; и средство для внедрения данных древовидной структуры декодера, содержащих по меньшей мере одно значение данных, указывающее характеристику разделения канала для звукового канала на иерархическом слое структуры иерархического декодера, в поток данных.

Согласно еще одному аспекту изобретения обеспечивают поток данных, содержащий множество кодированных звуковых каналов; параметрические звуковые данные и данные древовидной структуры декодера для структуры иерархического декодера, при этом данные древовидной структуры декодера содержат по меньшей мере одно значение данных, указывающее характеристики разделения канала для звуковых каналов на иерархических слоях структуры иерархического декодера.

Согласно еще одному аспекту изобретения обеспечивают носитель данных, хранящий на себе описанный выше сигнал.

Согласно еще одному аспекту изобретения обеспечивают способ генерации множества выходных звуковых каналов, содержащий прием потока данных, содержащего множество входных звуковых каналов и параметрические звуковые данные, причем поток данных дополнительно содержит данные древовидной структуры декодера для структуры иерархического декодера, данные древовидной структуры декодера содержат по меньшей мере одно значение данных, указывающее характеристики разделения канала для звукового канала на иерархическом слое структуры иерархического декодера; генерацию структуры иерархического декодера в ответ на данные древовидной структуры декодера и генерацию множества выходных звуковых каналов из потока данных, используя структуру иерархического декодера.

Согласно еще одному аспекту изобретения обеспечивают способ генерации потока данных, содержащего множество выходных звуковых каналов, содержащий прием множества входных звуковых каналов; параметрическое кодирование с помощью средства иерархического кодирования, множества входных звуковых каналов для генерации потока данных, содержащего множество выходных звуковых каналов и параметрические звуковые данные; определение структуры иерархического декодера, соответствующей средству иерархического кодирования; и внедрение в поток данных данных древовидной структуры декодера, содержащих по меньшей мере одно значение данных, указывающее характеристику разделения канала для звукового канала на иерархическом слое структуры иерархического декодера.

Согласно еще одному аспекту изобретения обеспечивают приемник для генерации множества выходных звуковых каналов, содержащий средство для приема потока данных, содержащего множество входных звуковых каналов и параметрические звуковые данные, причем поток данных дополнительно содержит данные древовидной структуры декодера для структуры иерархического декодера, данные древовидной структуры декодера содержат по меньшей мере одно значение данных, указывающее характеристику разделения канала для звукового канала на иерархическом слое структуры иерархического декодера; средство для генерации структуры иерархического декодера в ответ на данные древовидной структуры декодера и средство для генерации множества выходных звуковых каналов из потока данных, используя структуру иерархического декодера.

Согласно еще одному аспекту изобретения обеспечивают передатчик для генерации потока данных, содержащего множество выходных звуковых каналов, содержащий средство для приема множества входных звуковых каналов; средство иерархического кодирования для параметрического кодирования множества входных звуковых каналов для генерации потока данных, содержащего множество выходных звуковых каналов и параметрические звуковые данные; средство для определения структуры иерархического декодера, соответствующей средству иерархического кодирования; и средство для внедрения данных древовидной структуры декодера, содержащих по меньшей мере одно значение данных, указывающее характеристику разделения канала для звукового канала на иерархическом слое структуры иерархического декодера, в поток данных.

Согласно еще одному аспекту изобретения обеспечивают систему передачи, содержащую передатчик для генерации потока данных и приемник для генерации множества выходных звуковых каналов, причем содержащий средство для приема множества входных звуковых каналов, средство иерархического кодирования для параметрического кодирования множества входных звуковых каналов для генерации потока данных, содержащего множество звуковых каналов и параметрические звуковые данные, средство для определения структуры иерархического декодера, соответствующей средству иерархического кодирования, средство для внедрения данных древовидной структуры декодера, содержащих по меньшей мере одно значение данных, указывающее характеристику разделения канала для звукового канала на иерархическом слое структуры иерархического декодера, в поток данных, и средство для передачи потока данных на приемник; содержащий средство для приема потока данных, средство для генерации структуры иерархического декодера в ответ на данные древовидной структуры декодера и средство для генерации множества выходных звуковых каналов из потока данных, используя структуру иерархического декодера.

Согласно еще одному аспекту изобретения обеспечивают способ приема потока данных, содержащий прием потока данных, содержащего множество входных звуковых каналов и параметрические звуковые данные, причем поток данных дополнительно содержит данные древовидной структуры декодера для структуры иерархического декодера, данные древовидной структуры декодера содержат по меньшей мере одно значение данных, указывающее характеристику разделения канала для звукового канала на иерархическом слое структуры иерархического декодера; генерацию структуры иерархического декодера в ответ на данные древовидной структуры декодера; и генерацию множества выходных звуковых каналов из потока данных, используя структуру иерархического декодера.

Согласно еще одному аспекту изобретения обеспечивают способ передачи потока данных, содержащего множество выходных звуковых каналов, содержащий прием множества входных звуковых каналов; параметрическое кодирование, с помощью средства иерархического кодирования, множества входных звуковых каналов для генерации потока данных, содержащего множество выходных звуковых каналов и параметрические звуковые данные; определение структуры иерархического декодера, соответствующей средству иерархического кодирования; внедрение данных древовидной структуры декодера, содержащих по меньшей мере одно значение данных, указывающее характеристику разделения канала для звукового канала на иерархическом слое структуры иерархического декодера, в поток данных; и передачу потока данных.

Согласно еще одному аспекту изобретения обеспечивают способ передачи и приема потока данных, содержащий в передатчике: прием множества входных звуковых каналов, параметрическое кодирование, с помощью средства иерархического кодирования, множества входных звуковых каналов для генерации потока данных, содержащего множество звуковых каналов и параметрические звуковые данные, определение структуры иерархического декодера, соответствующей средству иерархического кодирования, внедрение данных древовидной структуры декодера, содержащих по меньшей мере одно значение данных, указывающее характеристику разделения канала для звукового канала на иерархическом слое структуры иерархического декодера, в поток данных, и передачу потока данных на приемник; и в приемнике: прием потока данных, генерацию структуры иерархического декодера в ответ на данные древовидной структуры декодера, и генерацию множества выходных звуковых каналов из потока данных, используя структуру иерархического декодера.

Согласно еще одному аспекту изобретения обеспечивают компьютерный программный продукт для выполнения любого из описанных выше способов.

Согласно еще одному аспекту изобретения обеспечивают устройство воспроизведения звука, содержащее устройство, которое описано выше.

Согласно еще одному аспекту изобретения обеспечивают устройство записи звука, содержащее устройство, которое описано выше.

Эти и другие аспекты, признаки и преимущества изобретения будут очевидны и объясняются в отношении варианта(ов) осуществления, описанного в дальнейшем.

Варианты осуществления изобретения будут описаны только для примера в отношении чертежей, на которых

фиг.1 - система передачи для передачи звукового сигнала в соответствии с некоторыми вариантами осуществления изобретения;

фиг.2 - пример структуры иерархического кодера, которую можно использовать в некоторых вариантах осуществления изобретения;

фиг.3 - пример кодера в соответствии с некоторыми вариантами осуществления изобретения;

фиг.4 - пример декодера в соответствии с некоторыми вариантами осуществления изобретения;

фиг.5 - пример некоторых структур иерархического декодера, которые можно использовать в некоторых вариантах осуществления изобретения;

фиг.6 - пример структуры иерархического декодера, имеющей блоки повышающего микширования «два в три» на корневом слое;

фиг.7 - пример структуры иерархического декодера, содержащей множество древовидных структур декодера;

фиг.8 - пример блока повышающего микширования «один в два»;

фиг.9 - пример некоторых структур иерархического декодера, которые можно использовать в некоторых вариантах осуществления изобретения;

фиг.10 - пример некоторых структур иерархического декодера, которые можно использовать в некоторых вариантах осуществления изобретения;

фиг.11 - примерная последовательность операций для способа декодирования в соответствии с некоторыми вариантами осуществления изобретения;

фиг.12 - пример структуры матричного декодера в соответствии с некоторыми вариантами осуществления изобретения;

фиг.13 - пример структуры иерархического декодера, которую можно использовать в некоторых вариантах осуществления изобретения;

фиг.14 - пример структуры иерархического декодера, которую можно использовать в некоторых вариантах осуществления изобретения; и

фиг.15 - способ передачи и приема звукового сигнала в соответствии с некоторыми вариантами осуществления изобретения.

Последующее описание сосредоточено на вариантах осуществления изобретения, применяемых к кодированию и декодированию многоканальных звуковых сигналов, используя множество несложных канальных блоков понижающего микширования и блоков повышающего микширования. Однако следует признать, что изобретение не ограничено этим применением. Специалистам будет понятно, что блок понижающего микширования предназначен для объединения множества звуковых каналов в меньшее количество звуковых каналов и дополнительные параметрические данные, и что блок повышающего микширования предназначен для генерации множества звуковых каналов из меньшего количества звуковых каналов и параметрических данных. Таким образом, блок повышающего микширования обеспечивает функциональную возможность разделения канала.

Фиг.1 показывает систему 100 передачи для передачи звукового сигнала в соответствии с некоторыми вариантами осуществления изобретения. Система 100 передачи содержит передатчик 101, который связан с приемником 103 через сеть 105, которая, в частности, может быть Интернет.

В конкретном примере передатчик 101 является устройством записи сигнала, а приемник 103 является устройством воспроизведения сигнала, но следует признать, что в других вариантах осуществления передатчик и приемник могут использоваться в других применениях и в других целях. Например, передатчик 101 и/или приемник 103 может быть частью функциональной возможности транскодирования и может, например, обеспечивать связь с другими источниками или адресатами сигнала.

В конкретном примере, где поддерживается функция записи сигнала, передатчик 101 содержит цифровой преобразователь 107, который принимает аналоговый сигнал, который будет преобразован в цифровой сигнал ИКМ (импульсно-кодовой модуляции), посредством дискретизации и аналого-цифрового преобразования.

Передатчик 101 связан с кодером 109 на фиг.1, который кодирует сигнал ИКМ в соответствии с алгоритмом кодирования. Кодер 100 связан с передатчиком 111 сети, который принимает кодированный сигнал и сопряжен с Интернет 105. Передатчик сети может передавать кодированный сигнал на приемник 103 через Интернет 105.

Приемник 103 содержит приемник 113 сети, который сопряжен с Интернет 105 и который предназначен для приема кодированного сигнала от передатчика 101.

Приемник 113 сети связан с декодером 115. Декодер 115 принимает кодированный сигнал и декодирует его в соответствии с алгоритмом декодирования.

В конкретном примере, где поддерживается функция воспроизведения сигнала, приемник 103 дополнительно содержит блок 117 воспроизведения сигнала, который принимает декодированный звуковой сигнал от декодера 115 и представляет его пользователю. Более конкретно, блок 117 воспроизведения сигнала может содержать цифроаналоговый преобразователь, усилители и динамики, как требуется для вывода декодированного звукового сигнала.

В примере на фиг.1 кодер 109 и декодер 115 используют каскадную структуру или древовидную структуру, состоящую из небольших стандартных блоков. Кодер 109 таким образом использует структуру иерархического кодирования, причем звуковые каналы последовательно обрабатываются на различных слоях данной иерархической структуры. Такая структура может привести к особенно преимущественному кодированию с высоким качеством звука, но все же с относительно низкой сложностью и легким воплощением кодера 109.

Фиг.2 показывает пример структуры иерархического кодера, которую можно использовать в некоторых вариантах осуществления изобретения.

В данном примере кодер 109 кодирует 5.1-канальный входной сигнал окружающего звука, состоящий из левого переднего (lf), левого окружающего (ls), правого переднего (rf), правого окружающего, центрального (с0) каналов и канала сабвуфера или канала расширения низких частот (lfe). Каналы сначала сегментируются и преобразовываются в частотную область в блоках сегментации 201. Результирующие сигналы в частотной области подаются попарно на блоки 203 понижающего микширования «два в один» (ТТО), которые выполняют понижающее микширование двух входных сигналов в один выходной канал и извлекают соответствующие параметры. Таким образом, три блока 203 понижающего микширования ТТО выполняют понижающее микширование шести входных каналов в три звуковых канала и параметры.

Как показано на фиг.2, выходные сигналы блоков 203 понижающего микширования ТТО используются в качестве входных сигналов для других блоков 205, 207 понижающего микширования ТТО. Более конкретно, два из блоков 203 понижающего микширования ТТО связаны с четвертым блоком 205 понижающего микширования ТТО, который объединяет соответствующие каналы в один канал. Третий из блоков 203 понижающего микширования ТТО вместе с четвертым блоком 205 понижающего микширования ТТО связан с пятым блоком 207 понижающего микширования ТТО, который объединяет остальные два канала в один канал (M). Этот сигнал, наконец, преобразовывают обратно во временную область, что приводит к кодированному битовому потоку m многоканального звука.

Можно считать, что блоки 203 понижающего микширования ТТО составляют первый слой структуры кодирования, причем четвертый блок 205 понижающего микширования ТТО составляет второй слой, а пятый блок 207 понижающего микширования ТТО составляет третий слой. Таким образом, объединение множества звуковых каналов в меньшее количество звуковых каналов происходит на каждом слое структуры иерархического кодера.

Структура иерархического кодирования для кодера 109 может привести к очень эффективному и высококачественному кодированию при низкой сложности. Кроме того, структуру иерархического кодирования можно варьировать в зависимости от характера сигнала, который кодируют. Например, если кодируют простой стереосигнал, это может быть достигнуто с помощью структуры иерархического кодирования, содержащей только один блок понижающего микширования ТТО и один слой.

Для того чтобы декодер 115 обрабатывал сигналы, кодированные с использованием различных структур иерархического кодирования, он должен быть в состоянии адаптироваться к структуре иерархического кодирования, используемой для конкретного сигнала. В частности, декодер 115 содержит функциональную возможность для конфигурирования себя таким образом, чтобы иметь структуру иерархического декодера, которая соответствует структуре иерархического кодирования для кодера 109. Однако для этого на декодер 115 нужно предоставлять информацию о структуре иерархического кодирования, используемой для кодирования принимаемого битового потока.

Фиг.3 показывает пример кодера 109 в соответствии с некоторыми вариантами осуществления изобретения.

Кодер 109 содержит принимающий процессор 301, который принимает множество входных звуковых каналов. Для конкретного примера на фиг.2 кодер 109 принимает шесть входных каналов. Принимающий процессор 301 связан с кодирующим процессором 303, который имеет структуру иерархического кодирования. В качестве примера, структура иерархического кодирования кодирующего процессора 303 может соответствовать структуре, которая показана на фиг.2.

Кодирующий процессор 303, кроме того, связан с процессором 305 структуры кодирования, который предназначен для определения структуры иерархического кодирования, используемой кодирующим процессором 303. Кодирующий процессор 303 может, в частности, подавать данные структуры на процессор 305 структуры кодирования. В ответ процессор 305 структуры кодирования генерирует данные древовидной структуры декодера, которые указывают структуру иерархического декодера, которая должна использоваться декодером для декодирования кодированного сигнала, сгенерированного кодирующим процессором 303.

Следует признать, что данные древовидной структуры декодера могут непосредственно быть определены как данные, описывающие структуру иерархического кодирования, или могут, например, быть данными, которые непосредственно описывают структуру иерархического декодера, которая должна использоваться (например, они могут описывать структуру, обратную структуре кодирующего процессора 303).

Данные древовидной структуры декодера, в частности, содержат по меньшей мере одно значение данных, указывающее характеристику разделения канала для звукового канала на иерархических слоях структуры иерархического декодера. Таким образом, данные древовидной структуры декодера могут содержать по меньшей мере одно указание декодеру относительно того, где звуковой канал должен быть разделен. Такое указание может, например, быть указанием слоя, на котором структура кодирования содержит блок понижающего микширования, или может эквивалентно быть указанием слоя древовидной структуры декодера, которая должна содержать блок повышающего микширования.

Кодирующий процессор 303 и процессор 305 структуры кодирования связаны с генератором 307 потока данных, который генерирует поток, содержащий кодированный звук от кодирующего процессора 303 и данные древовидной структуры декодера от процессора 305 структуры кодирования. Этот поток данных затем подают на передатчик 111 сети для передачи на приемник 103.

Фиг.4 показывает пример декодера 115 в соответствии с некоторыми вариантами осуществления изобретения.

Декодер 115 содержит приемник 401, который принимает поток данных, передаваемый от приемника 113 сети. Декодер 115, кроме того, содержит декодирующий процессор 403 и процессор 405 структуры декодера, связанные с приемником 401.

Приемник 401 извлекает данные древовидной структуры декодера и подает их на процессор 405 структуры декодера, тогда как данные кодирования звука, содержащие множество звуковых каналов и параметрические звуковые данные, подают на декодирующий процессор 403.

Процессор 405 структуры декодера выполнен с возможностью определения структуры иерархического декодера в ответ на принятые данные древовидной структуры декодера. В частности, процессор 405 структуры декодера может извлекать значения данных, определяющие разделение данных, и может генерировать информацию структуры иерархического декодера, которая является обратной к структуре иерархического кодирования кодирующего процессора 303. Эту информацию подают на декодирующий процессор 403, что приводит к его конфигурированию для указанной структуры иерархического декодера.

Затем процессор 405 структуры декодера переходит к генерации выходных каналов, соответствующих исходным вводимым на кодер 109 сигналам, используя структуру иерархического декодера.

Таким образом, система может предоставлять возможность эффективного и высококачественного кодирования, декодирования и распространения звуковых сигналов и, в частности, многоканальных звуковых сигналов. Обеспечивается очень гибкая система, в которой декодеры могут автоматически адаптироваться к кодерам, и одни и те же декодеры могут таким образом использоваться с множеством различных кодеров.

Данные древовидной структуры декодера эффективно передаются, используя значения данных, которые указывают характеристики разделения канала для звуковых каналов на различных иерархических слоях структуры иерархического декодера. Таким образом, данные древовидной структуры декодера оптимизированы для гибкого и высокоэффективного иерархического кодирования и декодирования.

Например, 5.1-канальные сигналы (т.е. сигналы шести каналов) можно кодировать как стереосигнал плюс набор пространственных параметров. Такое кодирование может быть получено с помощью множества различных структур иерархического кодирования, которые используют простые блоки понижающего микширования ТТО или «три в два» (ТТТ), и таким образом возможно множество различных структур иерархического декодера, используя блоки повышающего микширования «один в два» (ОТТ) или «два в три» (ТТТ). Таким образом, для декодирования соответствующего пространственного битового потока декодер должен знать о структуре иерархического кодирования, которая используется в кодере. Одним из прямых подходов в таком случае является передача дерева в битовом потоке посредством индекса для справочной таблицы. Примером соответствующей справочной таблицы может быть:

Кодовое слово дерева Дерево 0…000 Монофонический сигнал в сигнал формата 5.1 вариант А 0…001 Монофонический сигнал в сигнал формата 5.1 вариант В 0…010 Стереосигнал в сигнал формата 5.1 вариант А 1…111

Однако использование такой справочной таблицы имеет недостаток, заключающийся в том, что все структуры иерархического кодирования, которые могут использоваться, должны быть явно определены в справочной таблице. Однако для этого требуется, чтобы все декодеры/кодеры принимали обновленные справочные таблицы при вводе новой структуры иерархического кодирования для системы. Это очень нежелательно и приводит к сложной работе и негибкости системы.

Напротив, использование данных древовидной структуры декодера, где значения данных указывают разделения канала на различных слоях структуры иерархического декодера, предоставляет возможность простой обычной передачи данных древовидной структуры декодера, которые могут описывать любую структуру иерархического декодера. Таким образом, новые структуры кодирования можно легко использовать, не требуя никакого предварительного уведомления о соответствующих декодерах.

Таким образом, в отличие от подхода на основе справочной таблицы, система по фиг.1 может обрабатывать произвольное количество входных и выходных каналов, поддерживая полную гибкость. Этого достигают с помощью задания описания дерева кодера/декодера в битовом потоке. Из этого описания декодер может получать информацию касаемо того, где и как применять последующие параметры, кодированные в битовом потоке.

Данные древовидной структуры декодера могут, в частности, содержать множество значений данных, где каждое значение данных указывает характеристику разделения канала для одного канала на одном иерархическом слое структуры иерархического декодера. В частности, данные древовидной структуры декодера могут содержать одно значение данных для каждого блока повышающего микширования, который будет включать в себя структура иерархического декодера. Кроме того, она может включать в себя одно значение данных для каждого канала, который не должен быть разделен дополнительно. Таким образом, если значение данных древовидной структуры декодера имеет значение, соответствующее одному конкретному предопределенному значению данных, это может указывать, что соответствующий канал не должен быть разделен дополнительно, а фактически является выходным каналом декодера 115.

В некоторых вариантах осуществления система может содержать только кодеры, которые используют исключительно блоки понижающего микширования ТТО, и декодер может соответственно воплощаться, используя только блоки повышающего микширования ОТТ. В таком варианте осуществления значение данных может присутствовать для каждого канала декодера. Кроме того, значение данных может принимать одно из двух возможных значений, причем одно значение указывает, что канал не разделяют, и другое значение указывает, что канал разделяют на два канала с помощью блока повышающего микширования ОТТ. Кроме того, порядок значений данных в данных древовидной структуры декодера может указывать, какие каналы разделяют, и, таким образом, расположение блоков повышающего микширования ОТТ в структуре иерархического декодера. Таким образом могут быть получены данные древовидной структуры декодера, содержащие простые двоичные значения, полностью описывающие требуемую структуру иерархического декодера.

В качестве конкретного примера будет описано получение строки битов описания структуры иерархического декодера по фиг.5.

В данном примере предполагают, что кодеры могут использовать только блоки понижающего микширования ТТО, и таким образом дерево декодера может быть описано строкой битов. В примере на фиг.5 один входной звуковой канал расширяют до пятиканального выходного сигнала, используя блоки повышающего микширования ОТТ. В данном примере можно различать четыре слоя глубины: первый, обозначенный 0, находится на слое входного сигнала, последний, обозначенный 3, находится на слое выходных сигналов. Следует признать, что в данном описании слои характеризуются звуковыми каналами, притом что блоки повышающего микширования образуют границы слоев, слои можно эквивалентно рассматривать как содержащие блоки повышающего микширования или образованные этими блоками.

В примере на фиг.5 структура иерархического декодера может быть описана строкой битов «111001000», полученной с помощью следующих этапов:

1 - разделяют входной сигнал t0 на слое 0 (блок A повышающего микширования ОТТ), в результате весь сигнал, рассматриваемый на слое 0, переходит на слой 1.

1 - первый сигнал на слое 1 (выходящий из верхней части блока A повышающего микширования ОТТ) разделяют (блок B повышающего микширования ОТТ).

1 - второй сигнал на слое 1 (выходящий из нижней части блока A повышающего микширования ОТТ) разделяют (блок C повышающего микширования ОТТ), все сигналы на слое 1 описаны, переходят на слой 2.

0 - первый сигнал на слое 2 дальше не разделяют (верхняя часть блока B повышающего микширования ОТТ).

0 - второй сигнал на слое 2 дальше не разделяют (нижняя часть блока B повышающего микширования ОТТ).

1 - третий сигнал на слое 2 снова разделяют (верхняя часть блока C повышающего микширования ОТТ).

0 - четвертый сигнал на слое 2 дальше не разделяют (нижняя часть блока D повышающего микширования ОТТ), все сигналы на слое 2 описаны, переходят к слою 3.

0 - первый сигнал на слое 3 дальше не разделяют (верхняя часть блока D повышающего микширования ОТТ).

0 - второй сигнал на слое 3 дальше не разделяют (нижняя часть блока D повышающего микширования ОТТ), все сигналы описаны.

В некоторых вариантах осуществления кодирование может быть ограничено использованием только блоков понижающего микширования ТТО и ТТТ, и таким образом декодирование может быть ограничено использованием только блоков повышающего микширования ОТТ и ТТТ. Хотя блоки повышающего микширования ТТТ могут использоваться во многих различных конфигурациях, особенно выгодно использовать их в режиме, где предсказание (формы волны) используется для точной оценки трех выходных сигналов из двух входных сигналов. Из-за этого прогнозирующего характера блоков повышающего микширования ТТТ логическое расположение для этих блоков повышающего микширования - в корне дерева. Это является следствием того, что блоки повышающего микширования ОТТ разрушают исходную форму волны, таким образом делая предсказание неправильным. Таким образом, в некоторых вариантах осуществления единственными блоками повышающего микширования, которые используются в структуре декодера, являются блоки повышающего микширования ОТТ или блоки повышающего микширования ТТТ на корневом слое.

Следовательно, для таких систем можно различать три различные ситуации, которые вместе обеспечивают универсальное описание дерева:

1) деревья, которые имеют блок повышающего микширования ТТТ в качестве корня;

2) деревья, состоящие только из блоков повышающего микширования ОТТ;

3) «пустые деревья», т.е. прямое отображение входного канала(ов) на выходной канал(ы).

Фиг.6 показывает пример структуры иерархического декодера, имеющего блоки повышающего микширования ТТТ на корневом слое, и фиг.7 показывает пример структуры иерархического декодера, содержащего множество древовидных структур декодера. Структура иерархического декодера на фиг.7 содержит древовидные структуры декодера согласно всем трем примерам, представленным выше.

В некоторых вариантах осуществления данные древовидной структуры декодера упорядочиваются по порядку того, содержит ли входной канал блок повышающего микширования ТТТ или нет. Данные древовидной структуры декодера могут содержать указание того, что на корневом слое присутствует блок повышающего микширования ТТТ, за которым следуют двоичные данные, указывающие то, разделяются ли дополнительно каналы нижних слоев с помощью блоков повышающего микширования ОТТ или нет. Это может улучшать производительность в плане битрейта и низких затрат на обмен сигналами.

Например, данные древовидной структуры декодера могут указывать, сколько блоков повышающего микширования ТТТ включает в себя структура иерархического декодера. Поскольку каждая древовидная структура может содержать только один блок повышающего микширования ТТТ, который расположен на корневом слое, остальная часть дерева может быть описана строкой битов, как описано ранее (т.е. поскольку данное дерево является деревом блока повышающего микширования ОТТ только для нижних слоев, может быть применен тот же самый подход, который описан для структуры иерархического декодера только с блоками повышающего микширования ОТТ).

Кроме того, остальные древовидные структуры являются или деревьями только с блоками повышающего микширования ОТТ или пустыми деревьями, которые могут также быть описаны строками битов. Таким образом все деревья могут быть описаны с помощью двоичных значений данных, и интерпретация строки битов может зависеть от того, к какой категории принадлежит данное дерево. Эту информацию можно обеспечивать с помощью расположения дерева в данных древовидной структуры декодера. Например, все деревья, содержащие блок повышающего микширования ТТТ, могут быть расположены сначала в данных древовидной структуры декодера, за которыми следуют деревья только с блоками повышающего микширования ОТТ, за которыми следуют пустые деревья. Если данные древовидной структуры декодера включают в себя количество блоков повышающего микширования ТТТ и блоков повышающего микширования ОТТ в структуре иерархического декодера, то декодер можно конфигурировать, не требуя дополнительных данных. Таким образом, достигают очень эффективной передачи информации необходимой структуры декодера. Объем служебной информации передачи данных древовидной структуры декодера может оставаться очень небольшим, все равно обеспечивая очень гибкую систему, которая может описывать большое разнообразие структур иерархических декодеров.

В качестве конкретного примера структуры иерархического декодера на фиг.7 могут быть получены из данных древовидной структуры декодера с помощью следующего процесса:

- Количество входных сигналов получают из (возможно кодированного) понижающего микширования.

- Количество блоков повышающего микширования ОТТ и блоков повышающего микширования ТТТ всего дерева передают в данных древовидной структуры декодера и может быть извлечено оттуда. Количество выходных сигналов может быть получено как # выходных сигналов = # входных сигналов + # блоков повышающего микширования ТТТ + # блоков повышающего микширования ОТТ.

- Входные каналы могут переотображаться в данных древовидной структуры декодера так, что после переотображения сначала обнаруживаются деревья, соответствующие ситуации 1), затем деревья согласно ситуации 2) и затем 3). Для примера, на фиг.7 это привело бы к порядку 3, 0, 1, 2, 4, т.е. сигнал 0 является сигналом 3 после переотображения, сигнал 1 является сигналом 0 после переотображения, и т.д.

- Для каждого блока повышающего микширования ТТТ задаются три описания деревьев только ОТТ, используя способ, описанный выше, по одному дереву только ОТТ на каждый выходной канал ТТТ.

- Для всех остальных входных сигналов задаются описания только ОТТ.

В некоторых вариантах осуществления указания расположения громкоговорителей для выходных каналов включают в себя данные древовидной структуры декодера. Например, может использоваться справочная таблица предопределенного расположения громкоговорителей, например, такая:

Строка битов (Виртуальное) расположение громкоговорителя 0.. 000 Левый (передний) 0.. 001 Правый (передний) 0.. 010 Центральный 0.. 011 LFE 0.. 100 Левый окружающий 0.. 101 Правый окружающий 0.. 110 Центральный окружающий ... ...

Альтернативно, расположения громкоговорителей могут быть представлены, используя иерархический подход. Например, несколько первых битов определяют ось X, например L, R, C, затем другие несколько битов определяют ось Y, например передний, боковой, окружающий, а другие несколько битов определяют ось Z (высота).

В качестве конкретного примера далее представлена примерная синтаксическая структура битового потока для битового потока после описанных выше рекомендаций. В данном примере количество входных и выходных сигналов явно кодируется в битовом потоке. Такая информация может использоваться для проверки правильности части битового потока.

Синтаксическая структура:

В данном примере каждое OttTree обрабатывают в OttTreeDescription (), которое показано ниже.

Синтаксическая структура:

В приведенной выше синтаксической структуре полужирное форматирование используется для указания элементов, считываемых из битового потока.

Следует признать, что понятие иерархических слоев не является необходимым в таком описании. Например, можно также применять описание, основанное на принципе «пока существуют открытые входы, будут поступать дополнительные биты». Для декодирования данных это понятие может стать полезным в любом случае.

Кроме одиночных битов, обозначающих, присутствует ли блок повышающего микширования ОТТ, следующие данные присутствуют для блока повышающего микширования ОТТ:

- Различие уровней каналов по умолчанию.

- Является ли блок повышающего микширования ОТТ блоком повышающего микширования ОТТ LFE (расширения низких частот), т.е. ограничены ли параметры только диапазоном и не содержат ли каких-нибудь данных корреляции/когерентности.

Дополнительно, данные могут определять конкретные свойства блоков повышающего микширования, такие как в примере блока повышающего микширования ТТТ, какой режим использовать (основанное на форме волны предсказание, основанное на энергии описание и т.д.).

Как известно специалистам, блок повышающего микширования ОТТ использует декоррелированный сигнал для разделения одного канала на два канала. Кроме того, декоррелированный сигнал получают из одного сигнала входного канала. Фиг.8 показывает пример блока повышающего микширования ОТТ согласно этому подходу. Таким образом, примерный декодер по фиг.5 может быть представлен в соответствии со схемой по фиг.9, в которой блоки декорреляции, генерирующие декоррелированные сигналы, явно показаны.

Однако, как можно заметить, этот подход приводит к каскадированию блоков декорреляции так, что декоррелированный сигнал для блока повышающего микширования ОТТ нижнего слоя генерируют из входного сигнала, который был сгенерирован из другого декоррелированного сигнала. Таким образом, вместо того чтобы быть сгенерированными из исходного входного сигнала на корневом слое, декоррелированные сигналы нижних слоев будут обработаны несколькими блоками декорреляции. Поскольку каждый блок декорреляции содержит фильтр декорреляции, этот подход может привести к «смазыванию» декоррелированного сигнала (например, переходные процессы могут быть значительно искажены). Это приводит к ухудшению качества звука для выходного сигнала.

Таким образом, для улучшения качества звука блоки декорреляции, применяемые в блоке повышающего микширования декодера, можно в некоторых вариантах осуществления перемещать так, чтобы предотвратить каскадирование декоррелированных сигналов. Фиг.10 показывает пример структуры декодера, соответствующей структуре по фиг.9, но с блоками декорреляции, непосредственно связанными с входным каналом. Таким образом, вместо того чтобы использовать выход предшествующего блока повышающего микширования ОТТ в качестве входа на блок декорреляции, блоки повышающего микширования блока декорреляции непосредственно берут исходный входной сигнал t0, предварительно обработанный с помощью усиливающих блоков повышающего микширования GB, GC и GD. Это усиление гарантирует, что мощность на входе блока декорреляции идентична мощности, которая была бы получена на входе блока декорреляции в структуре по фиг.9. Полученная таким образом структура не содержит каскад блоков декорреляции, таким образом приводя к улучшенному качеству звука.

В последующем будет описан пример того, как определять параметры матричного умножения для блоков повышающего микширования иерархических слоев в ответ на данные древовидной структуры декодера. В частности, описание сосредоточено на вариантах осуществления, в которых фильтры декорреляции для генерации декоррелированных сигналов блоков повышающего микширования связаны непосредственно с входными звуковыми каналами структуры декодирования. Таким образом, описание сосредоточено на вариантах осуществления кодеров, таких, как показаны на фиг.10.

Фиг.11 показывает примерную последовательность операций способа декодирования в соответствии с некоторыми вариантами осуществления изобретения.

На этапе 1101 квантованные и кодированные параметры декодируют из принятого битового потока. Специалисты должны признать, что это может привести к множеству векторов обычных параметрических параметров кодирования звука, таких как:

CLD0 = [-10 15 10 12... 10]

CLD1 = [5 1 2 15 10... 2]

ICC0 = [1 0,6 0,9 0,3... -1]

ICC1 = [0 1 0,6 0,9... 0,3]

и т.д.

Каждый вектор представляет параметры по оси частоты.

За этапом 1101 следует этап 1103, на котором матрицы для отдельных блоков повышающего микширования определяют из декодированных параметрических данных.

(Независимые от частоты) обобщенные матрицы ОТТ и ТТТ можно соответственно задавать следующим образом:

Сигналы x i, d i и y i представляют входные сигналы, декоррелированные сигналы, полученные из сигналов x i, и выходные сигналы, соответственно. Элементами матрицы H ij и M ij являются функции параметров, полученных на этапе 1103.

Способ затем разделяют на две параллельные ветви, причем одна ветвь направлена на получение значений предварительной матрицы дерева (этап 1105), и одна ветвь направлена на получение значений матрицы микширования дерева (этап 1107).

Предварительные матрицы соответствуют матричным умножениям, применяемым к входному сигналу перед декорреляцией и применением матриц. В частности, предварительные матрицы соответствуют усиливающим блокам повышающего микширования, применяемым к входному сигналу до фильтров декорреляции.

Более конкретно, прямое воплощение декодера в общем случае приводит к каскаду фильтров декорреляции, как, например, применено на фиг.9. Как объясняется выше, предпочтительно предотвращать такое каскадирование. Для этого все фильтры декорреляции перемещают на один и тот же иерархический слой, как показано на фиг.10. Для обеспечения того, что декоррелированные сигналы имеют соответствующий уровень энергии, т.е. идентичный уровню декоррелированного сигнала в прямом случае по фиг.9, предварительные матрицы применяются до декорреляции.

В качестве примера усиление GB на фиг.10 получают следующим образом. Сначала важно отметить, что блок повышающего микширования 1 в 2 делит мощность входного сигнала к верхнему и нижнему выходам блока повышающего микширования 1 в 2. Это свойство отражается в параметрах межканальной разности интенсивности (IID) или межканальной разности уровней (ICLD). Следовательно, усиление GB вычисляют как отношение энергии верхнего выхода, деленное на сумму верхнего и нижнего выходов блока A повышающего микширования 1 в 2. Следует признать, что так как параметры IID или ICLD могут изменяться по времени и частоте, усиление может также изменяться и по времени и по частоте.

Матрицы микширования - матрицы, применяемые к входному сигналу блоками повышающего микширования для генерации дополнительных каналов.

Окончательные уравнения предварительной матрицы и матрицы микширования - результат каскада блоков повышающего микширования ОТТ и ТТТ. Поскольку структура декодера была исправлена для предотвращения каскада блоков декорреляции, это нужно учитывать при определении окончательных уравнений.

В вариантах осуществления, где используются только предопределенные конфигурации, зависимость между элементами матриц H ij и M ij и уравнениями окончательной матрицы является постоянной и можно применять стандартную модификацию.

Однако для ранее описанного более гибкого и динамического подхода определение значений предварительной матрицы и матрицы микширования может быть определено через более сложные подходы, как будет описано позже.

За этапом 1105 следует этап 1109, на котором предварительные матрицы, полученные на этапе 1005, отображаются на фактическую частотную сетку, которую применяют для преобразования сигнала временной области в частотную область (на этапе 1113).

За этапом 1109 следует этап 1111, на котором интерполяция параметров частотной матрицы может выполняться. В частности, в зависимости от того, соответствует ли обновление параметров во времени обновлению преобразования времени к частоте на этапе 1113, интерполяция может быть применена.

На этапе 1113 входные сигналы преобразовываются в частотную область для применения отображенных и, в необязательном порядке, интерполированных предварительных матриц.

Этап 1115 следует за этапом 1111 и этапом 1113 и содержит применение предварительных матриц к входным сигналам частотной области. Фактическим применением матрицы является набор матричных умножений.

За этапом 1115 следует этап 1117, на котором часть сигналов, являющихся результатом применения матрицы на этапе 1115, подают на фильтр декорреляции для генерации декоррелированных сигналов.

Тот же самый подход применяют для получения уравнения матрицы микширования.

Более конкретно, за этапом 1107 следует этап 1119, на котором уравнения, определенные на этапе 1107, отображаются на частотную сетку при преобразовании времени к частоте на этапе 1113.

За этапом 1119 следует этап 1121, на котором значения матрицы микширования, в необязательном порядке, интерполируют снова в зависимости от обновления параметров во времени и преобразовывают.

Значения, сгенерированные на этапах 1115, 1117 и 1121, таким образом формируют параметры, требуемые для матричного умножения повышающего микширования, и его выполняют на этапе 1123.

За этапом 1123 следует этап 1125, на котором результирующий выходной сигнал преобразовывают обратно во временную область.

Этапы, соответствующие этапам 1115, 1117 и 1123 по фиг.11, могут быть показаны дополнительно на фиг.12. Фиг.12 показывает пример структуры матричного декодера в соответствии с некоторыми вариантами осуществления изобретения.

Фиг.12 показывает, как входные каналы понижающего микширования могут использоваться для восстановления многоканального выходного сигнала. Как указано выше, процесс может быть описан с помощью двух матричных умножений с помощью промежуточного блока декорреляции.

Следовательно, обработка входных каналов для формирования выходных каналов может быть описана согласно:

где M1n,k является двумерной матрицей, которая отображает некоторое количество входных каналов на некоторое количество каналов, входящих в блоки декорреляции, и которая задана для каждого временного слота n и для каждого поддиапазона k; и

M2n,k является двумерной матрицей, которая отображает некоторое количество предварительно обработанных каналов на некоторое количество выходных каналов и которая задана для каждого временного слота n и для каждого гибридного поддиапазона k.

В последующем будет описан пример того, как уравнения предварительной матрицы и матрицы микширования по этапам 1105 и 1107 можно генерировать из данных древовидной структуры декодера.

Сначала древовидные структуры декодера, имеющие только блоки повышающего микширования ОТТ, будут рассматриваться в отношении примерного дерева по фиг.13.

Для этого типа деревьев удобно определять множество вспомогательных переменных:

описывает индексы блоков повышающего микширования ОТТ, которые встречаются для каждого блока повышающего микширования ОТТ (т.е. в данном примере сигнал, вводимый в 4-й блок повышающего микширования ОТТ, прошел через 0-й и 1-й блоки повышающего микширования ОТТ, как задано 5-м столбцом в матрице Tree 1. Точно так же сигнал, вводимый на 2-й блок повышающего микширования ОТТ, прошел через 0-й блок ОТТ, как задано 3-й колонкой в матрице Tree 1, и т.д.).

описывает, рассматривается ли верхний или нижний путь для каждого блока повышающего микширования ОТТ. Положительный знак указывает верхний путь, а отрицательный знак указывает нижний путь.

Матрица соответствует матрице Tree 1, и следовательно, когда некоторый столбец и строка в матрице Tree 1 указывают некоторый блок повышающего микширования ОТТ, те же самые столбец и строка в матрице Tree 1sign указывают, используется ли нижняя или верхняя часть этого конкретного блока повышающего микширования ОТТ для достижения блока повышающего микширования ОТТ, заданного в первой строке конкретного столбца (т.е. в данном примере сигнал, вводимый на 4-й блок повышающего микширования ОТТ, прошел через верхний путь 0-го блока повышающего микширования ОТТ (как обозначено 3-й строкой, 5-м столбцом в матрице Tree 1sign) и нижний путь 1-го блока повышающего микширования ОТТ (как обозначено 2-й строкой, 5-м столбцом в матрице Tree 1sign).

Tree 1depth = [1 2 2 3 3]

описывает глубину дерева для каждого блока повышающего микширования ОТТ (т.е. в данном примере блок 0 повышающего микширования находится на слое 1, блоки повышающего микширования 1 и 2 - на слое 2, и блоки повышающего микширования 3 и 4 - на слое 3); и

Tree elements = [5]

обозначает количество элементов в дереве (т.е. в данном примере дерево содержит пять блоков повышающего микширования).

Временную матрицу K1, описывающую предварительную матрицу только для декоррелированных сигналов, затем определяют согласно:

где

является значением усиления для блока повышающего микширования ОТТ, обозначенного Tree 1(i,p), в зависимости от того, используется ли верхний или нижний выход блока ОТТ, и где

Значения IID - значения межканальной разницы интенсивности, полученные из битового потока.

Окончательную предварительную матрицу микширования M1 в таком случае создают как:

Необходимо помнить, что целью предварительной матрицы микширования является обеспечение возможности перемещения блоков декорреляции, которые включает в себя блок повышающего микширования ОТТ по фиг.13, перед блоками ОТТ. Следовательно, предварительная матрица микширования должна доставлять «сухой» входной сигнал ко всем блокам декорреляции в блоках повышающего микширования ОТТ, где входные сигналы имеют слой, который они имели бы в определенной точке в дереве, где блок декорреляции был расположен до перемещения его перед деревом.

Также необходимо помнить, что предварительная матрица применяет только предварительное усиление к сигналам, входящим в блоки декорреляции, и смешивание сигналов блоков декорреляции и «сухого» сигнала понижающего микширования происходит в матрице микширования M2, которая будет получена ниже, первый элемент предварительной матрицы микширования дает выходной сигнал, который непосредственно связан с матрицей M2 (см. фиг.12, где это показано с помощью линии m/c).

Учитывая, что в настоящее время рассматривается дерево только с блоками повышающего микширования ОТТ, ясно, что также второй элемент предварительного вектора микширования M1, который будет равен единице, поскольку сигнал, входящий в блок декорреляции в блоке повышающего микширования ОТТ, равен нулю, является точно входным сигналом понижающего микширования, и что для этого блока повышающего микширования ОТТ нет никакого различия, если переместить блок декорреляции перед всем деревом, так как он является уже первым в данном дереве.

Кроме того, при условии, что входной вектор к блокам декорреляции задается с помощью vn,k = M1n,kxn,k и рассматривается на фиг.13 и фиг.12, и задан способ, с помощью которого элементы в матрице M1n,k получены, ясно, что первая строка М1 соответствует сигналу m на фиг.12, последующие строки соответствует входному сигналу блока декорреляции блоков 0, ..., 4 ОТТ. Следовательно, вектор wn,k будет следующим:

где en обозначает выходной сигнал блока декорреляции от n-го блока ОТТ по фиг.13.

Теперь рассматривая матрицу микширования M2, элементы этой матрицы можно вычислять подобным образом. Однако целью этой матрицы является настройка «сухого» сигнала по усилению и смешивание его с соответствующими выходными сигналами блока декорреляции. Следует запомнить, что каждый блок повышающего микширования ОТТ в дереве может быть описан следующим образом:

где Y1 - верхний выход блока ОТТ, и Y2 - нижний, и X - «сухой» входной сигнал, и Q - сигнал блока декорреляции.

Так как выходные каналы формируются с помощью матричного умножения yn,k=M2n,kwn,k и вектор wn,k формируют как комбинацию сигнала понижающего микширования и выходов блоков декорреляции, как обозначено на фиг.12, каждая строка матрицы M2 соответствует выходному каналу, и каждый элемент в конкретной строке указывает, какую часть сигналов понижающего микширования и различных блоков декорреляции необходимо смешивать для формирования конкретного выходного канала.

В качестве примера может быть рассмотрена первая строка матрицы микширования M2:

Первый элемент первой строки в M2 соответствует вкладу сигнала «m» и является вкладом в выходной сигнал, задаваемый с помощью верхних выходов блоков 0, 1 и 3 повышающего микширования ОТТ. Учитывая приведенную выше матрицу H, это соответствует H110, H111 и H113, так как количество «сухого» сигнала для верхнего выхода блока ОТТ задается с помощью элемента H11 блока повышающего микширования ОТТ.

Второй элемент соответствует вкладу блока декорреляции D1, который согласно указанному выше расположен в блоке 0 повышающего микширования ОТТ. Следовательно, его вклад - H110, H113 и H120. Это очевидно, поскольку элемент H120 задает выходной сигнал блока декорреляции от блока 0 повышающего микширования ОТТ, и через этот сигнал последовательно проходит через блок 1 и 3 повышающего микширования ОТТ как часть «сухого» сигнала, и таким образом усиление настраивают согласно элементам H110 и H113.

Точно так же третий элемент соответствует вкладу блока декорреляции D2, который согласно приведенной выше информации расположен в блоке 1 повышающего микширования ОТТ. Следовательно, вклад этого - H120 и H113.

Пятый элемент соответствует вкладу блока декорреляции D3, который согласно вышеупомянутому примечанию расположен в блоке 3 повышающего микширования ОТТ. Следовательно, его вклад - H123.

Четвертый и шестой элементы первой строки - нули, поскольку отсутствует вклад блоков декорреляции D4 или D6 в выходной канал, соответствующий первой строке в матрице.

Представленный выше пример делает очевидным то, что элементы матрицы можно вычислять как произведения элементов H матрицы блока повышающего микширования ОТТ.

Для получения матрицы микширования M2 для обобщенного дерева может быть получена подобная процедура, как для матрицы M1. Сначала получают следующие вспомогательные переменные:

Матрица Tree содержит столбец для каждого выходного канала, который описывает индексы блоков повышающего микширования ОТТ, которые сигнал должен проходить для достижения каждого выходного канала:

Матрица Tree sign содержит индикатор для каждого блока повышающего микширования в дереве для указания того, должен ли использоваться верхний (1) или нижний (-1) путь для достижения текущего выходного канала:

Вектор Tree depth содержит количество блоков повышающего микширования, которые нужно пройти, чтобы добраться до конкретного выходного канала:

Tree depth = [3 3 3 3 2 2].

Вектор Tree elements содержит количество блоков повышающего микширования в каждом субдереве целого дерева:

Tree elements = [5].

При условии, что приведенные выше обозначения достаточны для описания всех деревьев, которые могут быть переданы, может быть определена матрица M2. Матрицу для субдерева k, которая создает N выходных каналов из 1 входного канала, определяют согласно:

где

где элементы H определяются с помощью параметров, соответствующих блоку повышающего микширования ОТТ с индексом Tree(p,j).

В последующем предполагается более общее дерево, задействующее блоки повышающего микширования ТТТ на корневом слое, например, как структура декодера по фиг.14. Блоки повышающего микширования, содержащие две переменные M1i и M2i, обозначают деревья ОТТ, и таким образом не обязательно отдельные блоки повышающего микширования ОТТ. Кроме того, сначала предполагается, что блоки повышающего микширования ТТТ не используют декоррелированный сигнал, т.е. матрица ТТТ может быть описана как 3×2 матрица:

Согласно этим предположениям и для получения окончательных предварительной матрицы и матрицы микширования для первого блока повышающего микширования ТТТ, два набора предварительных матриц микширования получают для каждого дерева ОТТ, один описывает применение предварительной матрицы для первого входного сигнала блока повышающего микширования ТТТ и один описывает применение предварительной матрицы для второго входного сигнала блока повышающего микширования ТТТ. После применения обоих блоков предварительной матрицы и декорреляции сигналы можно суммировать.

Таким образом выходные сигналы могут быть получены следующим образом:

Наконец, в случае, если блок повышающего микширования ТТТ использует декорреляцию, то вклад декоррелированного сигнала можно добавить в форме постпроцесса. После того как декоррелированный сигнал блока повышающего микширования ТТТ получен, вклад каждого выходного сигнала просто является вкладом, заданным с помощью вектора [M13, M23, M33], растянутого с помощью разниц IID каждого следующего блока повышающего микширования ОТТ.

Фиг.15 показывает способ передачи и приема звукового сигнала в соответствии с некоторыми вариантами осуществления изобретения.

Способ инициируется на этапе 1501, на котором передатчик принимает множество входных звуковых каналов.

За этапом 1501 следует этап 1503, на котором передатчик выполняет параметрическое кодирование множества входных звуковых каналов для генерации потока данных, содержащего множество звуковых каналов и параметрические звуковые данные.

За этапом 1503 следует этап 1505, на котором определяют структуру иерархического декодера, соответствующую средству иерархического кодирования.

За этапом 1505 следует этап 1507, на котором передатчик внедряет данные древовидной структуры декодера, содержащие по меньшей мере одно значение данных, указывающее характеристику разделения канала для звукового канала на иерархическом слое структуры иерархического декодера, в поток данных.

За этапом 1507 следует этап 1509, на котором передатчик передает поток данных на приемник.

За этапом 1509 следует этап 1511, на котором приемник принимает поток данных.

За этапом 1511 следует этап 1513, на котором структуру иерархического декодера, которая используется приемником, определяют в ответ на данные древовидной структуры декодера.

За этапом 1513 следует этап 1515, на котором приемник генерирует из потока данных множество выходных звуковых каналов, используя структуру иерархического декодера.

В соответствии с вариантом осуществления настоящего изобретения, устройство для генерации множества выходных звуковых каналов содержит средство для приема потока данных, содержащего входные звуковые каналы в количестве, равном одному или больше одного, и параметрические звуковые данные, описывающие пространственные свойства, причем этот поток данных дополнительно содержит данные древовидной структуры декодера для структуры матричного декодера, данные древовидной структуры декодера содержат по меньшей мере одно значение данных, из которого можно получить коэффициенты матричного умножения структуры матричного декодера, при этом структура матричного декодера содержит матричные умножения (M1, M2) и промежуточные блоки декорреляции (D1, …, D5); средство для генерации структуры матричного декодера в ответ на данные древовидной структуры декодера; и средство для генерации множества выходных звуковых каналов из потока данных, используя структуру матричного декодера.

Помимо этого, данные древовидной структуры декодера могут содержать множество значений данных, причем каждое значение данных указывает характеристику разделения канала для одного канала на одном иерархическом слое структуры иерархического декодера.

Кроме того, предопределенное значение данных может указывать на отсутствие разделения канала для канала на иерархическом слое.

Затем предопределенное значение данных может указывать разделение канала «один в два» для канала на иерархическом слое.

Более того, упомянутое множество значений данных могут быть значениями двоичных данных.

Кроме того, одно предопределенное значение двоичных данных может указывать разделение канала «один в два», а другое предопределенное значение двоичных данных указывает отсутствие разделения канала.

Помимо этого, поток данных может дополнительно содержать указание количества входных каналов.

Затем поток данных может дополнительно содержать указание количества выходных каналов.

Более того, поток данных может дополнительно содержать указание количества функций разделения канала «один в два» в структуре иерархического декодера.

Помимо этого поток данных может дополнительно содержать указание количества функций разделения канала «два в три» в структуре иерархического декодера.

Кроме того, данные древовидной структуры декодера могут содержать данные для множества древовидных структур декодера, упорядоченных в ответ на присутствие функциональной возможности разделения канала «два в три».

Далее данные древовидной структуры декодера для по меньшей мере одного входного канала могут содержать указание функции разделения канала «два в три», присутствующей на корневом слое, за чем следуют двоичные данные, причем каждое значение двоичных данных указывает либо отсутствие функциональной возможности разделения канала либо функциональную возможность разделения канала «один в два» для зависимых слоев функциональной возможности разделения «два в три».

Также поток данных дополнительно содержит указание расположения громкоговорителя для по меньшей мере одного из выходных каналов.

Кроме того, средство для генерации структуры матричного декодера может быть выполнено с возможностью определять в качестве коэффициентов умножения структуры матричного декодера, параметры умножения для функций разделения каналов иерархических слоев в ответ на данные древовидной структуры декодера.

Помимо этого структура матричного декодера может содержать по меньшей мере одну функциональную возможность разделения канала на по меньшей мере одном иерархическом слое, при этом данная по меньшей мере одна функциональная возможность разделения канала содержит упомянутые промежуточные блоки декорреляции для генерации декоррелированного сигнала из входного сигнала, полученного обработкой входного звукового канала потока данных посредством предварительной матрицы (М1), используемой в первом матричном умножении, при этом матрица, используемая во втором матричном умножении, содержит матрицу микширования (М2), содержащую по меньшей мере один блок разделения канала для генерации множества выходных каналов иерархического слоя из звукового канала с более высокого иерархического слоя и декоррелированного сигнала.

Также матрица первого умножения (М1) может содержать средство компенсации уровня для выполнения компенсации уровня звука для входного звукового канала для генерации звукового сигнала с компенсированным уровнем, при этом промежуточные блоки декорреляции (D1, …, D5) приспособлены для фильтрации звукового сигнала с компенсированным уровнем для генерации декоррелированного сигнала.

Более того, средство компенсации уровня содержит матричное умножение на предварительную матрицу.

Затем матрица первого умножения представляет собой предварительную матрицу (М1) и коэффициенты предварительной матрицы (М1) имеют по меньшей мере одно единичное значение для структуры матричного декодера, содержащей только функциональные возможности разделения канала “один в два”.

Помимо этого матрица первого умножения представляет собой предварительную матрицу (М1), при этом устройство дополнительно содержит средство для определения предварительной матрицы (М1) для по меньшей мере одной функциональной возможности разделения канала на по меньшей мере одном иерархическом слое в ответ на параметры функциональной возможности разделения канала на более высоком иерархическом слое.

Далее устройство может дополнительно содержать средство для определения матрицы разделения канала (Tree) для по меньшей мере одной функциональной возможности разделения канала в ответ на параметры по меньшей мере одной функциональной возможности разделения канала на по меньшей мере одном иерархическом слое.

Кроме того матрица первого умножения представляет собой предварительную матрицу (М1), и устройство дополнительно содержит средство для определения предварительной матрицы (М1) для по меньшей мере одной функциональной возможности разделения канала на по меньшей мере одном иерархическом слое в ответ на параметры функциональной возможности разделения канала “два в три” более высокого иерархического слоя.

Наконец, средство для определения предварительной матрицы (М1) может быть выполнено с возможностью определения предварительной матрицы для по меньшей мере одной функциональной возможности разделения канала в ответ на определение первой подматрицы предварительной матрицы, соответствующей первому входу блока повышающего микширования “два в три”, и второй подматрицы предварительной матрицы, соответствующей второму входу блока повышающего микширования “два в три”.

Следует признать, что приведенное выше описание для ясности описывает варианты осуществления изобретения в отношении различных функциональных устройств и процессоров. Однако будет очевидно, что любое соответствующее распределение функциональных возможностей между различными функциональными устройствами или процессорами может использоваться, не выходя за рамки объема изобретения. Например, функциональные возможности, которые показаны как выполняемые отдельными процессорами или контроллерами, могут выполняться с помощью одного и того же процессора или контроллера. Следовательно, отсылки к определенным функциональным устройствам предназначены только для того, чтобы их рассматривали как отсылки на соответствующие средства для обеспечения описанных функциональных возможностей, а не как предписание строгой логической или физической структуры или организации.

Изобретение может быть реализовано в любой соответствующей форме, включая аппаратные средства, программное обеспечение, аппаратно-программное обеспечение или любую их комбинацию. Изобретение можно альтернативно воплощать, по меньшей мере частично, как программное обеспечение, работающее на одном или большем количестве процессоров и/или процессоров цифровой обработки сигналов. Элементы и компоненты варианта осуществления изобретения можно физически, функционально и логически воплощать с помощью любого соответствующего способа. Действительно, функциональные возможности можно воплощать в одном устройстве, в множестве устройств или как часть других функциональных устройств. Также изобретение можно воплощать в одном устройстве или оно может быть физически и функционально распределено между различными устройствами и процессорами.

Хотя настоящее изобретение описано в связи с некоторыми вариантами осуществления, оно не ограничено конкретной сформулированной формой. Скорее объем настоящего изобретения ограничен только в соответствии с сопроводительной формулой изобретения. Дополнительно, хотя признак, как может казаться, описан в связи с конкретными вариантами осуществления, специалисты должны признать, что различные признаки описанных вариантов осуществления можно объединять в соответствии с изобретением. В формуле изобретения термин «содержащий» не исключает присутствие других элементов или этапов.

Кроме того, хотя перечислены в единственном числе, множество средств, элементов или этапов способа можно воплощать, например, с помощью одного устройства или процессора. Дополнительно, хотя различные пункты формулы изобретения могут включать в себя отдельные признаки, их можно выгодно объединять, и то, что они находятся в различных пунктах формулы изобретения, не подразумевает, что комбинация признаков не выполнима и/или не выгодна. Также то, что признак находится в одной категории формулы изобретения, не подразумевает ограничение к этой категории, а вместо этого указывает, что данный признак в равной степени применим к другим категориям пунктов формулы изобретения при определенных обстоятельствах. Кроме того, порядок признаков в формуле изобретения не подразумевает какого-либо конкретного порядка, в котором должны работать эти признаки, и, в частности, порядок отдельных этапов в способе формулы изобретения не подразумевает, что этапы должны выполняться именно в данном порядке. Вместо этого этапы могут выполняться в любом подходящем порядке. Кроме того, ссылки к единственному числу не исключают множества. Таким образом упоминание в единственном числе "первого", "второго" и т.д. не препятствует множеству. Обозначения в формуле изобретения, которые обеспечивают просто в качестве разъясняющего примера, не должны рассматриваться как какое-либо ограничение объема формулы изобретения.

Согласно соответствующему настоящему случаю варианту осуществления, устройство для генерации множества выходных звуковых каналов принимает поток данных, содержащий входные звуковые каналы в количестве, равном одному или больше одного, и параметрические звуковые данные, описывающие пространственные свойства, причем этот поток данных дополнительно содержит данные древовидной структуры декодера для структуры матричного декодера, данные древовидной структуры декодера содержат по меньшей мере одно значение данных, из которого можно получить коэффициенты матричного умножения структуры матричного декодера, при этом структура матричного декодера содержит матричные умножения (M1, M2) и промежуточные блоки декорреляции (D1,…, D5); структура матричного декодера генерируется в ответ на данные древовидной структуры декодера; и множество выходных звуковых каналов генерируется из потока данных с использованием структуры матричного декодера.

Помимо этого, данные древовидной структуры декодера могут содержать множество значений данных, каждое из которых показывает характеристику разделения канала для одного канала на одном иерархическом слое структуры иерархического декодера.

Затем заранее определенное значение данных может показывать отсутствие разделения канала для упомянутого канала на упомянутом иерархическом слое.

Также заранее определенное значение данных может показывать разделение канала "один в два" для упомянутого канала на упомянутом иерархическом слое.

Кроме того, упомянутое множество значений данных могут представлять собой значения двоичных данных.

Далее, одно заранее определенное значение двоичных данных может показывать разделение канала "один в два", а другое заранее определенное значение двоичных данных может показывать отсутствие разделения канала.

Помимо этого, поток данных может дополнительно содержать указание количества входных каналов.

Помимо этого, поток данных может дополнительно содержать указание количества выходных каналов.

Затем поток данных может дополнительно содержать указание количества функций разделения канала "один в два" в структуре иерархического декодера.

Кроме того, поток данных может дополнительно содержать указание количества функций разделения каналов "два в три" в структуре иерархического декодера.

Помимо этого, данные древовидной структуры декодера могут содержать данные для множества древовидных структур декодера, упорядоченных в ответ на наличие функциональных возможностей разделения каналов "два в три".

Далее, данные древовидной структуры декодера для по меньшей мере одного входного канала могут содержать указание того, что функция разделения каналов "два в три" присутствует на корневом слое, за которым следуют двоичные данные, в которых каждое значение двоичных данных показывает либо отсутствие функциональных возможностей по разделению либо функциональные возможности разделения канала "один в два" для зависимых слоев функциональных возможностей разделения каналов "два в три".

Затем поток данных может содержать указание положения громкоговорителя для по меньшей мере одного из выходных каналов.

Кроме того, средство для формирования структуры матричного декодера может быть выполнено с возможностью определять в качестве коэффициентов умножения структуры матричного декодера, параметры умножения для функций разделения каналов иерархических слоев в ответ на данные древовидной структуры декодера.

Помимо этого, структура матричного декодера может содержать по меньшей мере одну функциональную возможность разделения канала на по меньшей мере одном иерархическом слое, при этом данная по меньшей мере одна функциональная возможность разделения канала содержит промежуточные блоки декорреляции для генерации декоррелированного сигнала из выходного сигнала, полученного обработкой входного звукового канала потока данных посредством предварительной матрицы (M1), используемой в первом матричном умножении, при этом матрица, используемая во втором матричном умножении, содержит матрицу микширования (М2), содержащую по меньшей мере один блок разделения канала для генерации множества выходных каналов иерархического слоя из звукового канала с более высокого иерархического слоя и декоррелированного сигнала.

Затем матрица первого умножения (M1) может содержать средство компенсации уровня для выполнения компенсации уровня звука в отношении входного звукового канала для генерации звукового сигнала с компенсированным уровнем, при этом блоки декорреляции (D1,…, D5) приспособлены для фильтрации звукового сигнала с компенсированным уровнем для генерации декоррелированного сигнала.

Далее средство компенсации уровня содержит матричное умножение на предварительную матрицу.

Кроме того, матрица первого умножения представляет собой предварительную матрицу (M1) и коэффициенты предварительной матрицы (M1) имеют по меньшей мере одно единичное значение для структуры матричного декодера, при этом структура матричного декодера может содержать только функциональные возможности разделения канала "один в два".

Затем матрица первого умножения представляет собой предварительную матрицу (M1), при этом в устройстве может быть дополнительно предусмотрено определение предварительной матрицы (M1) для по меньшей мере одной функциональной возможности разделения канала на по меньшей мере одном иерархическом слое в ответ на параметры функциональной возможности разделения канала на более высоком иерархическом слое.

Помимо этого, матрица разделения канала (Tree) может быть предусмотрена для по меньшей мере одной функциональной возможности разделения канала в ответ на параметры по меньшей мере одной функциональной возможности разделения канала на по меньшей мере одном иерархическом слое.

Кроме того, матрица первого умножения представляет собой предварительную матрицу (M1), при этом в устройстве может быть дополнительно предусмотрено определение предварительной матрицы (M1) для по меньшей мере одной функциональной возможности разделения канала на по меньшей мере одном иерархическом слое в ответ на параметры функциональной возможности разделения канала "два в три" более высокого иерархического слоя.

Наконец, для предварительной матрицы (M1) может быть предусмотрено выполнение определения предварительной матрицы для упомянутой по меньшей мере одной функциональной возможности разделения канала в ответ на определение первой подматрицы предварительной матрицы, соответствующей первому входу блока повышающего микширования "два в три", и второй подматрицы предварительной матрицы, соответствующей второму входу блока повышающего микширования "два в три".

Похожие патенты RU2461078C2

название год авторы номер документа
КОДИРОВАНИЕ И ДЕКОДИРОВАНИЕ ЗВУКА 2006
  • Схейерс Эрик Г.П.
  • Хото Герард Х.
  • Пурнхаген Хейко
  • Шильдбах Вольфганг А.
  • Хорих Хольгер
  • Кьерлинг Ханс М.К.
  • Реден Карл Дж.
RU2418385C2
КОДИРОВАНИЕ ЗВУКА С ИСПОЛЬЗОВАНИЕМ ДЕКОРРЕЛИРОВАННЫХ СИГНАЛОВ 2005
  • Пурнхаген Хейко
  • Энгдегард Йонас
  • Бребарт Ерун
  • Схейерс Эрик
RU2369982C2
АУДИОКОДИРОВАНИЕ С ИСПОЛЬЗОВАНИЕМ ПОНИЖАЮЩЕГО МИКШИРОВАНИЯ 2008
  • Хелльмут Оливер
  • Херре Юрген
  • Терентьев Леонид
  • Хёльцер Андреас
  • Фалч Корнелия
  • Хилперт Йоханнес
RU2452043C2
СТРУКТУРА ДЕКОРРЕЛЯТОРА ДЛЯ ПАРАМЕТРИЧЕСКОГО ВОССТАНОВЛЕНИЯ ЗВУКОВЫХ СИГНАЛОВ 2014
  • Виллемоес Ларс
  • Хирвонен Тони
  • Пурнхаген Хейко
RU2641463C2
УСТРОЙСТВО ДЛЯ КОДИРОВАНИЯ АУДИО СИГНАЛА, ИМЕЮЩЕГО МНОЖЕСТВО КАНАЛОВ 2011
  • Кунтц Ахим
  • Диш Саша
  • Херре Юрген
  • Кюх Фабиан
  • Хильперт Йоханнес
RU2640650C2
УСТРОЙСТВО И СПОСОБ ДЛЯ СИНТЕЗИРОВАНИЯ ВЫХОДНОГО СИГНАЛА 2008
  • Энгдегард Йонас
  • Пурнхаген Хейко
  • Реш Барбара
  • Виллемоес Ларс
  • Фалч Корнелия
  • Херре Юрген
  • Хилперт Йоханнес
  • Хёльцер Андреас
  • Терентьев Леонид
RU2439719C2
УСТРОЙСТВО ДЛЯ ДЕКОДИРОВАНИЯ СИГНАЛА, СОДЕРЖАЩЕГО ПЕРЕХОДНЫЕ ПРОЦЕССЫ, ИСПОЛЬЗУЯ БЛОК ОБЪЕДИНЕНИЯ И МИКШЕР 2011
  • Кунтц Ахим
  • Диш Саша
  • Херре Юрген
  • Кюх Фабиан
  • Хильперт Йоханнес
RU2573774C2
УСТРОЙСТВО ДЛЯ ГЕНЕРИРОВАНИЯ ДЕКОРРЕЛИРОВАННОГО СИГНАЛА, ИСПОЛЬЗУЯ ПЕРЕДАННУЮ ФАЗОВУЮ ИНФОРМАЦИЮ 2011
  • Кунтц Ахим
  • Диш Саша
  • Херре Юрген
  • Кюх Фабиан
  • Хильперт Йоханнес
RU2580084C2
БИНАУРАЛЬНАЯ ВИЗУАЛИЗАЦИЯ МУЛЬТИКАНАЛЬНОГО ЗВУКОВОГО СИГНАЛА 2009
  • Коппенс Жероен
  • Мундт Харалд
  • Терентьев Леонид
  • Фалх Корнелия
  • Хилперт Йоханнес
  • Хеллмут Оливер
  • Виллемоес Ларс
  • Плогштиес Ян
  • Бреебаарт Джероен
  • Энгдегард Йонас
RU2512124C2
АУДИОКОДИРОВАНИЕ С ИСПОЛЬЗОВАНИЕМ ПОВЫШАЮЩЕГО МИКШИРОВАНИЯ 2008
  • Хелльмут Оливер
  • Херре Юрген
  • Терентьев Леонид
  • Хёльцер Андреас
  • Фалч Корнелия
  • Хилперт Йоханнес
RU2474887C2

Иллюстрации к изобретению RU 2 461 078 C2

Реферат патента 2012 года КОДИРОВАНИЕ И ДЕКОДИРОВАНИЕ ЗВУКА

Изобретение относится к кодированию и/или декодированию звука с использованием структур иерархического кодирования и/или структур иерархического декодирования. Звуковой кодер (109) имеет структуру иерархического кодирования и генерирует поток данных, содержащий один или большее количество звуковых каналов, а также параметрические данные кодирования звука. Кодер (109) содержит процессор структуры кодирования (305), который вставляет данные древовидной структуры декодера в поток данных. Данные древовидной структуры декодера содержат, по меньшей мере, одно значение данных, указывающее характеристику разделения канала для звукового канала на иерархическом слое структуры иерархического декодера, и могут конкретно определять древовидные структуры декодера, которые будут применяться декодером. Декодер (115) содержит приемник (401), который принимает поток данных, и процессор структуры декодера (405) для генерации структуры матричного декодера в ответ на данные древовидной структуры декодера. Декодирующий процессор (403) затем генерирует из потока данных выходные звуковые каналы, используя структуру матричного декодера. Технический результат - улучшение качества звука, достигаемое с помощью структур иерархического кодирования/декодирования. 6 н. и 8 з.п. ф-лы, 15 ил.

Формула изобретения RU 2 461 078 C2

1. Устройство для генерации множества выходных звуковых каналов, содержащее
средство для приема (401) потока данных, содержащего входные звуковые каналы в количестве, равном одному или больше одного, и параметрические звуковые данные, описывающие пространственные свойства, причем этот поток данных дополнительно содержит данные древовидной структуры декодера для структуры матричного декодера, данные древовидной структуры декодера содержат, по меньшей мере, одно значение данных, из которого можно получить коэффициенты матричного умножения структуры матричного декодера, при этом структура матричного декодера содержит матричные умножения (M1, M2) и промежуточные блоки декорреляции (D1,…, D5);
средство для генерации (405) структуры матричного декодера в ответ на данные древовидной структуры декодера; и
средство для генерации (403) множества выходных звуковых каналов из потока данных, используя структуру матричного декодера.

2. Устройство по п.1, в котором средство для генерации (405) структуры матричного декодера выполнено с возможностью определять, в качестве коэффициентов умножения структуры матричного декодера, параметры умножения для функций разделения каналов иерархических слоев в ответ на данные древовидной структуры декодера.

3. Устройство по п.1, в котором структура матричного декодера содержит, по меньшей мере, одну функциональную возможность разделения канала на, по меньшей мере, одном иерархическом слое, при этом данная, по меньшей мере, одна функциональная возможность разделения канала содержит упомянутые промежуточные блоки декорреляции для генерации декоррелированного сигнала из выходного сигнала, полученного обработкой входного звукового канала потока данных посредством предварительной матрицы (M1), используемой в первом матричном умножении, при этом матрица, используемая во втором матричном умножении, содержит матрицу микширования (М2), содержащую, по меньшей мере, один блок разделения канала для генерации множества выходных каналов иерархического слоя из звукового канала с более высокого иерархического слоя и декоррелированного сигнала.

4. Устройство по п.1, в котором матрица первого умножения (M1) содержит средство компенсации уровня для выполнения компенсации уровня звука для входного звукового канала для генерации звукового сигнала с компенсированным уровнем, при этом промежуточные блоки декорреляции (D1,…, D5) приспособлены для фильтрации звукового сигнала с компенсированным уровнем для генерации декоррелированного сигнала.

5. Устройство по п.1, в котором матрица первого умножения представляет собой предварительную матрицу (M1) и коэффициенты предварительной матрицы (M1) имеют, по меньшей мере, одно единичное значение для структуры матричного декодера, содержащей только функциональные возможности разделения канала "один в два".

6. Устройство по п.1, в котором матрица первого умножения представляет собой предварительную матрицу (M1), при этом устройство дополнительно содержит средство для определения предварительной матрицы (M1) для, по меньшей мере, одной функциональной возможности разделения канала на, по меньшей мере, одном иерархическом слое в ответ на параметры функциональной возможности разделения канала на более высоком иерархическом слое.

7. Устройство по п.1, дополнительно содержащее средство для определения матрицы разделения канала (Tree) для, по меньшей мере, одной функциональной возможности разделения канала в ответ на параметры, по меньшей мере, одной функциональной возможности разделения канала на, по меньшей мере, одном иерархическом слое.

8. Устройство по п.7, в котором матрица первого умножения представляет собой предварительную матрицу (M1), при этом устройство дополнительно содержит средство для определения предварительной матрицы (M1) для, по меньшей мере, одной функциональной возможности разделения канала на, по меньшей мере, одном иерархическом слое в ответ на параметры функциональной возможности разделения канала "два в три" более высокого иерархического слоя.

9. Устройство по п.8, в котором средство для определения предварительной матрицы (M1) выполнено с возможностью определения предварительной матрицы для упомянутой, по меньшей мере, одной функциональной возможности разделения канала в ответ на определение первой подматрицы предварительной матрицы, соответствующей первому входу блока повышающего микширования "два в три", и второй подматрицы предварительной матрицы, соответствующей второму входу блока повышающего микширования "два в три".

10. Способ генерации множества выходных звуковых каналов, содержащий этапы, на которых
принимают поток данных (1511), содержащий входные звуковые каналы в количестве, равном одному или больше одного, и параметрические звуковые данные, описывающие пространственные V свойства, причем этот поток данных дополнительно содержит данные древовидной структуры декодера для структуры матричного декодера, данные древовидной структуры декодера содержат, по меньшей мере, одно значение данных, из которого можно получить коэффициенты матричного умножения структуры матричного декодера, при этом структура матричного декодера содержит матричные умножения (M1, M2) и промежуточные блоки декорреляции (D1,…, D5);
генерируют структуру матричного декодера (1513) в ответ на данные древовидной структуры декодера и
генерируют множество выходных звуковых каналов (1515) из потока данных, используя структуру матричного декодера.

11. Приемник (103) для генерации множества выходных звуковых каналов, содержащий устройство по п.1.

12. Способ приема потока данных, содержащий способ приема по п.10.

13. Считываемый компьютером носитель, на котором записана программа для выполнения способа по п.10.

14. Устройство воспроизведения звука, содержащее устройство по п.1.

Документы, цитированные в отчете о поиске Патент 2012 года RU2461078C2

RU 2008105556 А, 20.08.2009
US 6996523 В, 07.02.2006
СПОСОБ, УСТРОЙСТВО, КОДИРУЮЩЕЕ УСТРОЙСТВО, ДЕКОДИРУЮЩЕЕ УСТРОЙСТВО И АУДИОСИСТЕМА 2005
  • Ван Лон Махиль В.
  • Хото Герард Х.
  • Бребарт Дирк Й.
RU2396608C2
Способ приготовления мыла 1923
  • Петров Г.С.
  • Таланцев З.М.
SU2004A1
СОВМЕСТИМОЕ МНОГОКАНАЛЬНОЕ КОДИРОВАНИЕ/ДЕКОДИРОВАНИЕ 2004
  • Херре Юрген
  • Хильперт Йоханнес
  • Геиэрсбергер Штефан
  • Хельцер Андреас
  • Шпенгер Клаус
RU2327304C2

RU 2 461 078 C2

Авторы

Схейерс Эрик Г.П.

Хото Герард Х.

Пурнхаген Хейко

Шильдбах Вольфганг А.

Хорих Хольгер

Кьерлинг Ханс М.К.

Реден Карл Дж.

Даты

2012-09-10Публикация

2010-09-08Подача