СПОСОБ И УСТРОЙСТВО КОДИРОВАНИЯ И ДЕКОДИРОВАНИЯ ОБЪЕКТНО-ОРИЕНТИРОВАННОГО ЗВУКОВОГО СИГНАЛА Российский патент 2010 года по МПК G10L19/00 

Описание патента на изобретение RU2407070C2

Область техники, к которой относится изобретение

Настоящее изобретение относится к способам и устройствам, предназначенным для кодирования и декодирования звукового сигнала, и более конкретно, к способам и устройствам для кодирования и декодирования звукового сигнала, которые могут локализовать звуковой образ в требуемом положении в пространстве для каждого звукового сигнала объекта.

Уровень техники

В общем, согласно обычному способу кодирования объектно-ориентированного звукового сигнала устройство кодирования объектов генерирует сигнал сведения фонограммы посредством сведения фонограммы из множества звуковых сигналов объектов и генерирует информацию о параметрах, включающую в себя множество порций информации, выделяемой из звуковых сигналов объектов. Согласно обычному способу декодирования объектно-ориентированного звукового сигнала устройство декодирования объектов восстанавливает множество звуковых сигналов объектов посредством декодирования принимаемого сигнала сведения фонограммы с использованием информации о параметрах объектов, а устройство рендеринга (в контексте настоящей заявки под рендерингом подразумевается создание эффекта «трехмерности» звукового сигнала) синтезирует звуковые сигналы объектов в 2-канальный сигнал или многоканальный сигнал, используя управляющие данные, которые необходимы для обозначения положений восстанавливаемых звуковых сигналов объектов.

Однако управляющие данные представляют собой всего лишь межуровневую информацию, и существует четкое ограничение в создании 3D эффектов путем локализации звукового образа посредством простого использования информации об уровнях громкости.

Раскрытие изобретения

Настоящее изобретение обеспечивает способы и устройства, предназначенные для кодирования и декодирования звукового сигнала, которые могут локализировать звуковой образ в требуемом положении в пространстве для каждого звукового сигнала объекта.

В соответствии с аспектом настоящего изобретения, предусмотрен способ декодирования звукового сигнала. Способ включает в себя выделение сигнала сведения фонограммы и информации о параметрах объектов из входного звукового сигнала, генерирование звукового сигнала объектов с использованием сигнала сведения фонограммы и информации о параметрах объектов и генерирование звукового сигнала объектов с трехмерными (3D) эффектами посредством применения 3D информации к звуковому сигналу объектов.

В соответствии с другим аспектом настоящего изобретения, предусмотрено устройство для декодирования звукового сигнала. Устройство включает в себя демультиплексор, который выделяет сигнал сведения фонограммы и информацию о параметрах объектов из входного звукового сигнала, устройство декодирования объектов, которое генерирует звуковой сигнал объектов с использованием сигнала сведения фонограммы и информации о параметрах объектов, и устройство рендеринга, которое генерирует трехмерный звуковой сигнал объектов с 3D эффектами посредством применения 3D информации к звуковому сигналу объектов.

В соответствии с другим аспектом настоящего изобретения, предусмотрен способ декодирования звукового сигнала. Способ включает в себя выделение сигнала сведения фонограммы и информации о параметрах объектов из входного звукового сигнала, генерирование информации о параметрах каналов посредством преобразования информации о параметрах объектов, генерирование звукового сигнала с использованием сигнала сведения фонограммы и информации о параметрах объектов и генерирование звукового сигнала с 3D эффектами посредством применения 3D информации к звуковому сигналу.

В соответствии с другим аспектом настоящего изобретения, предусмотрено устройство для декодирования звукового сигнала. Устройство включает в себя демультиплексор, который выделяет сигнал сведения фонограммы и информацию о параметрах объектов из входного звукового сигнала, устройство рендеринга, которое извлекает 3D информацию с использованием индексных данных и выводит 3D информацию, транскодер, который генерирует информацию о параметрах каналов с использованием информации о параметрах объектов и 3D информации, и многоканальное устройство декодирования, которое генерирует звуковой сигнал с использованием сигнала сведения фонограммы и информации о параметрах каналов и генерирует звуковой сигнал с 3D эффектами посредством применения 3D информации к звуковому сигналу.

В соответствии с другим аспектом настоящего изобретения, предусмотрено устройство для декодирования звукового сигнала. Устройство включает в себя демультиплексор, который выделяет сигнал сведения фонограммы и информацию о параметрах объектов из входного звукового сигнала, устройство рендеринга, которое извлекает 3D информацию с использованием входных индексных данных и выводит 3D информацию, транскодер, который преобразовывает информацию о параметрах объектов в информацию о параметрах каналов, преобразовывает 3D информацию в 3D информацию о каналах и выводит информацию о параметрах каналов и 3D информацию о каналах, и многоканальное устройство декодирования, которое генерирует звуковой сигнал с использованием сигнала сведения фонограммы и информации о параметрах каналов и генерирует звуковой сигнал с 3D эффектами посредством применения к звуковому сигналу 3D информации о каналах.

В соответствии с другим аспектом настоящего изобретения, предусмотрен способ кодирования звукового сигнала. Способ включает в себя генерирование сигнала сведения фонограммы посредством сведения фонограммы звукового сигнала объектов, выделение информации относительно звукового сигнала объектов и генерирование информации о параметрах объектов, основанной на выделяемой информации, и введение индексных данных в информацию о параметрах объектов, причем индексные данные являются необходимыми для поиска 3D информации, которая используется для создания 3D эффектов для звукового сигнала объектов.

В соответствии с другим аспектом настоящего изобретения, предусмотрен машиночитаемый носитель, на котором записана программа для выполнения одного из вышеупомянутых способов.

Как описано выше, в соответствии с настоящим изобретением, можно обеспечить более отчетливый эффект присутствия, чем при обычных способах кодирования и декодирования объектно-ориентированного звукового сигнала во время воспроизведения звуковых сигналов объектов посредством локализирования звукового образа для каждого из звуковых сигналов объектов, в то же время максимально используя обычные способы кодирования и декодирования объектно-ориентированного звукового сигнала. Кроме того, можно создавать высококачественную виртуальную реальность путем применения настоящего изобретения в интерактивных играх, в которых часто изменяется информация о расположении игровых персонажей, управляемых игроками через сеть.

Краткое описание чертежей

Фиг. 1 представляет собой блок-схему обычного устройства кодирования объектно-ориентированного звукового сигнала;

фиг. 2 представляет собой блок-схему устройства для декодирования звукового сигнала в соответствии с вариантом выполнения настоящего изобретения;

фиг. 3 представляет собой блок-схему процесса, иллюстрирующую функционирование устройства, показанного на фиг. 2;

фиг. 4 представляет собой блок-схему устройства для декодирования звукового сигнала в соответствии с другим вариантом выполнения настоящего изобретения;

фиг. 5 представляет собой блок-схему процесса, иллюстрирующую функционирование устройства, показанного на фиг. 4;

фиг. 6 представляет собой блок-схему устройства для декодирования звукового сигнала в соответствии с другим вариантом выполнения настоящего изобретения;

фиг. 7 иллюстрирует применение трехмерной (3D) информации к кадрам с помощью устройства, иллюстрируемого на фиг. 6;

фиг. 8 представляет собой блок-схему устройства для декодирования звукового сигнала в соответствии с другим вариантом выполнения настоящего изобретения; и

фиг. 9 представляет собой блок-схему устройства для декодирования звукового сигнала в соответствии с другим вариантом выполнения настоящего изобретения.

Осуществление изобретения

Настоящее изобретение в дальнейшем будет описано более подробно со ссылкой на сопровождающие чертежи, на которых показаны примерные варианты выполнения изобретения.

Способы и устройства, предназначенные для кодирования и декодирования звукового сигнала в соответствии с настоящим изобретением, можно применять к процессам кодирования и декодирования объектно-ориентированного звукового сигнала, но не ограничиваясь этим. Другими словами, способы и устройства, предназначенные для кодирования и декодирования звукового сигнала в соответствии с настоящим изобретением, также можно применять к различным операциям обработки сигналов, отличающимся от тех, что были сформулированы в данном описании, до тех пор, пока операции обработки сигналов удовлетворяют нескольким условиям. Способы и устройства для кодирования и декодирования звукового сигнала в соответствии с настоящим изобретением могут локализировать звуковые образы звуковых сигналов объектов в требуемых положениях в пространстве посредством применения трехмерной (3D) информации, такой как функция моделирования восприятия звука (HRTF), к звуковым сигналам объектов.

Фиг. 1 иллюстрирует обычное устройство кодирования объектно-ориентированного звукового сигнала. Что касается фиг. 1, то на ней устройство кодирования объектно-ориентированного звукового сигнала включает в себя устройство 110 кодирования объектов и генератор 120 битового потока.

Устройство 110 кодирования объектов принимает N звуковых сигналов объектов и генерирует объектно-ориентированный сигнал сведения фонограммы и информацию о параметрах объектов, включающую в себя множество порций информации, выделяемых из N звуковых сигналов объектов. Множество порций информации могут быть значениями разности и корреляции энергии.

Генератор 120 битового потока генерирует битовый поток, объединяя объектно-ориентированный сигнал сведения фонограммы и информацию о параметрах объектов, генерируемую устройством 110 кодирования объектов. Битовый поток, генерируемый генератором 120 битового потока, может включать в себя стандартные значения параметров смешивания, необходимые для стандартной настройки для декодирующего устройства. Стандартные значения параметров смешивания могут включать в себя индексные данные, необходимые для поиска 3D информации, такой как HRTF, которая может использоваться для создания 3D эффектов.

Фиг. 2 иллюстрирует устройство, предназначенное для декодирования звукового сигнала в соответствии с вариантом выполнения настоящего изобретения. Устройство, иллюстрируемое на фиг. 2, может быть разработано посредством объединения концепции, основанной на HRTF стереофонической 3D локализации с обычным способом объектно-ориентированного кодирования. HRTF представляет собой функцию преобразования, которая описывает передачу звуковых волн между источником звука в произвольном положении и барабанной перепонкой, и возвращает значение, которое изменяется в соответствии с направлением и выстой источника звука. Если сигнал без направленности фильтруется с использованием HRTF, сигнал можно слышать, как будто он воспроизводится с некоторого направления.

Рассмотрим фиг. 2, на которой устройство включает в себя демультиплексор 130, устройство 140 декодирования объектов, устройство 150 визуализации и базу 160 данных 3D информации.

Демультиплексор 130 выделяет сигнал сведения фонограммы и информацию о параметрах объектов из входного битового потока. Устройство 140 декодирования объектов генерирует звуковой сигнал объектов на основании сигнала сведения фонограммы и информации о параметрах объектов. База 160 данных 3D информации представляет собой базу данных, которая хранит 3D информацию, такую как HRTF, и ищет и выводит 3D информацию, соответствующую входным индексным данным. Устройство 150 рендеринга генерирует 3D сигнал с использованием звукового сигнала объектов, генерируемого устройством 140 декодирования объектов, и 3D информации, выводимой базой 160 данных 3D информации.

Фиг. 3 иллюстрирует функционирование устройства, иллюстрируемого на фиг. 2. Рассмотрим фиг. 2 и 3, на которых, когда принимается (S170) битовый поток, передаваемый устройством для кодирования звукового сигнала, из этого битового потока демультиплексор 130 выделяет (S172) сигнал сведения фонограммы и информацию о параметрах объектов. Устройство 140 декодирования объектов генерирует (S174) звуковой сигнал объектов, используя сигнал сведения фонограммы и информацию о параметрах объектов.

Устройство 150 рендеринга извлекает (S176) 3D информацию из базы 160 данных 3D информации, используя индексные данные, включенные в управляющие данные, которые необходимы для обозначения расположений звуковых сигналов объектов. Устройство 150 рендеринга генерирует 3D сигнал с 3D эффектами, выполняя (S178) операцию 3D рендеринга с использованием звукового сигнала объектов, обеспечиваемого устройством 140 декодирования объектов, и 3D информации, обеспечиваемой базой 160 данных 3D информации.

3D сигнал, генерируемый устройством 150 рендеринга, может быть 2-канальным сигналом с тремя или более направленностями, и таким образом может быть воспроизведен как 3D стереофонический звук с помощью 2-канальных динамиков, таких как наушники. Другими словами, 3D сигнал, генерируемый устройством 150 рендеринга, может быть воспроизведен 2-канальными динамиками так, что пользователь может ощущать, что 3D сигнал сведения фонограммы будто бы воспроизводится из источника звука с тремя или более каналами. Направление источника звука может быть определено на основании по меньшей мере одного из: различия между интенсивностями двух звуковых сигналов, соответственно вводимых в оба уха, интервала времени между двумя звуковыми сигналами и различия между фазами двух звуковых сигналов. Поэтому 3D устройство 150 рендеринга может генерировать 3D сигнал на основании того, как люди могут определять положение источника звука в трехмерном пространстве с помощью слуха.

Устройство для кодирования звукового сигнала может включать в себя индексные данные, необходимые для извлечения 3D информации в информации о стандартных значениях параметров смешивания для стандартной настройки. В этом случае, устройство 150 рендеринга может извлекать 3D информацию из базы 160 данных 3D информации, используя индексные данные, включенные в информацию о стандартных значениях параметров смешивания.

Устройство для кодирования звукового сигнала может включать в управляющие данные индексные данные, которые необходимы для поиска 3D информации, такой как HRTF, которая может использоваться для создания 3D эффектов для сигнала объекта. Другими словами, информация о параметрах смешивания, включенная в управляющие данные, используемые устройством для кодирования звукового сигнала, может включать в себя не только информацию об уровнях громкости, но также и индексные данные, необходимые для поиска 3D информации. Информация о параметрах смешивания может быть информацией о времени, такой как информация о временной разнице между каналами, информацией о расположении, или сочетанием информации об уровнях громкости и информации о синхронизации.

Если имеется множество звуковых сигналов объектов, и 3D эффекты должны быть добавлены к одному или более из множества звуковых сигналов объектов, 3D информация, соответствующая заданным индексным данным, разыскивается и извлекается из базы 160 данных 3D информации, которая хранит 3D информацию, определяющую заданные положения звуковых сигналов объектов, к которым должны быть добавлены 3D эффекты. Затем 3D устройство 150 рендеринга выполняет операцию 3D рендеринга с использованием извлеченной 3D информации так, чтобы можно было создавать 3D эффекты. 3D информация относительно всех сигналов объектов может использоваться как информация о параметрах смешивания. Если 3D информация применяется только к нескольким сигналам объектов, информация об уровнях громкости и информация о времени относительно сигналов объектов, отличающихся от этих нескольких сигналов объектов, также может использоваться в качестве информации о параметрах смешивания.

Фиг. 4 иллюстрирует устройство для декодирования звукового сигнала в соответствии с другим вариантом выполнения настоящего изобретения. Что касается фиг. 4, то на ней устройство включает в себя вместо устройства декодирования объектов многоканальное устройство 270 декодирования.

Более конкретно, устройство включает в себя демультиплексор 230, транскодер 240, устройство 250 рендеринга, базу 260 данных 3D информации и многоканальное устройство 270 декодирования.

Демультиплексор 230 выделяет сигнал сведения фонограммы и информацию о параметрах объектов из входного битового потока. Устройство 250 рендеринга определяет положение каждого сигнала объектов в трехмерном пространстве с использованием 3D информации, соответствующей индексным данным, включенным в управляющие данные. Транскодер 230 генерирует информацию о параметрах каналов посредством синтезирования информации о параметрах объектов и 3D информации о положении каждого звукового сигнала объектов, обеспечиваемых устройством 250 рендеринга. Многоканальное устройство 270 декодирования генерирует 3D сигнал с использованием сигнала сведения фонограммы, обеспечиваемого демультиплексором 230, и информации о параметрах каналов, обеспечиваемой транскодером 230.

Фиг. 5 иллюстрирует функционирование устройства, иллюстрируемого на фиг. 4. Что касается фиг. 4 и 5, то на них устройство принимает (S280) битовый поток. Демультиплексор 230 выделяет (S282) объектно-ориентированный сигнал сведения фонограммы и информацию о параметрах объектов из принимаемого битового потока. Устройство 250 рендеринга выделяет индексные данные, включенные в управляющие данные, которые используются для определения положений звуковых сигналов объектов, и извлекает (S284) 3D информацию, соответствующую индексным данным, из базы 260 данных 3D информации. Положения звуковых сигналов объектов, исходно определенные информацией о стандартных параметрах смешивания, могут быть изменены посредством определения 3D информации, соответствующей требуемым положениям звуковых сигналов объектов, используя управляющие данные смешивания.

Транскодер 230 генерирует (S286) информацию о параметрах каналов относительно М каналов, синтезируя информацию о параметрах объектов относительно сигналов N объектов, которые передаются устройством для кодирования звукового сигнала, и 3D информацию о расположении каждого из сигналов объектов, который получен с использованием 3D информации, такой как HRTF, с помощью устройства 250 рендеринга.

Многоканальное устройство 270 декодирования генерирует звуковой сигнал с использованием объектно-ориентированного сигнала сведения фонограммы, обеспечиваемого демультиплексором 230, и информации о параметрах каналов, обеспечиваемой транскодером 230, и генерирует многоканальный сигнал посредством выполнения (S290) операции 3D рендеринга на звуковом сигнале с использованием 3D информации, включенной в информацию о параметрах каналов.

Фиг. 6 иллюстрирует устройство для декодирования звукового сигнала в соответствии с другим вариантом выполнения настоящего изобретения. Устройство, иллюстрируемое на фиг. 6, отличается от устройства, иллюстрируемого на фиг. 4, тем, что транскодер 440 каналов отдельно передает в многоканальный декодер 470 информацию о параметрах каналов и 3D информацию. Другими словами, транскодер 440, в отличие от транскодера 240, иллюстрируемого на фиг. 4, передает информацию о параметрах каналов относительно М каналов, которая получена с использованием информации о параметрах объектов относительно сигналов N объектов, и 3D информацию, которая применяется к каждому из сигналов N объектов, в многоканальный декодер 470, вместо передачи информации о параметрах каналов, включающей в себя 3D информацию.

Рассмотрим фиг. 7, на которой информация о параметрах каналов и 3D информация имеют свои собственные данные индексов кадров. Таким образом, многоканальное устройство 470 декодирования может применять 3D информацию к заданному кадру битового потока посредством синхронизирования информации о параметрах каналов и 3D информации с использованием индексов кадров информации о параметрах каналов и 3D информации. Например, что касается фиг. 7, то на ней 3D информация, соответствующая индексу 2, может применяться к началу кадра 2, имеющего индекс 2.

Даже если 3D информация обновляется с течением времени, возможно определить, где в информации о параметрах каналов следует применять 3D информацию, ссылаясь на индекс кадра 3D информации. Другими словами, транскодер 440 может вводить информацию об индексе кадра в информацию о параметрах каналов и 3D информацию, соответственно, для того, чтобы многоканальное устройство 470 декодирования синхронизировало во времени информацию о параметрах каналов и 3D информацию.

Фиг. 8 иллюстрирует устройство для декодирования звукового сигнала в соответствии с другим вариантом выполнения настоящего изобретения. Устройство, иллюстрируемое на фиг. 8, отличается от устройства, иллюстрируемого на фиг. 6, тем, что иллюстрируемое на фиг. 8 устройство дополнительно включает в себя устройство 543 предварительной обработки и устройство 580 обработки эффектов в дополнение к демультиплексору 530, транскодеру 547, устройству 550 рендеринга и базе 560 данных 3D информации, и тем, что база 560 данных 3D информации включена в устройство 550 рендеринга.

Более конкретно, структура и функции демультиплексора 530, транскодера 547, устройства 550 рендеринга, базы 560 данных 3D информации и многоканального устройства 570 декодирования являются такими же, как структура и функции их соответствующих аналогов, иллюстрируемых на фиг. 6. Что касается фиг. 8, то на ней устройство 580 обработки эффектов может добавлять заданный эффект к сигналу сведения фонограммы. Устройство 543 предварительной обработки может выполнять действие предварительной обработки, например, на стереофоническом сигнале сведения фонограммы, таким образом, чтобы положение стереофонического сигнала сведения фонограммы можно было регулировать. База 560 данных 3D информации может быть включена в устройство 550 рендеринга.

Фиг. 9 иллюстрирует устройство для декодирования звукового сигнала в соответствии с другим вариантом выполнения настоящего изобретения. Устройство, иллюстрируемое на фиг. 9, отличается от устройства, иллюстрируемого на фиг. 8, тем, что модуль 680 генерирования 3D сигнала разделен на многоканальное устройство 670 декодирования и запоминающее устройство 675. Что касается фиг. 9, то на ней многоканальное устройство 670 декодирования копирует 3D информацию, которая хранится в пассивном запоминающем устройстве многоканального декодера 670, в запоминающее устройство 675, и запоминающее устройство 675 осуществляет операцию 3D рендеринга с использованием этой 3D информации. 3D информация, скопированная в запоминающее устройство 675, может обновляться с помощью 3D информации, выводимой транскодером 647. Поэтому можно генерировать 3D сигнал с использованием требуемой 3D информации без каких-либо модификаций в структуре многоканального устройства 670 декодирования.

Настоящее изобретение может быть осуществлено в виде машиночитаемого кода, записанного на машиночитаемом носителе. Машиночитаемым носителем может быть запоминающее устройство любого типа, в котором данные хранятся в машиночитаемой форме. Примеры машиночитаемого носителя включают в себя ПЗУ (постоянное запоминающее устройство), ОЗУ (оперативное запоминающее устройство), CD-ROM (неперезаписываемый компакт-диск), магнитную ленту, гибкий диск, оптическое запоминающее устройство для данных и несущую волну (например, передачу данных через Интернет). Машиночитаемый носитель можно распределять через множество связанных с сетью компьютерных систем так, чтобы записывать в них машиночитаемый код и выполнять его на них в децентрализованном виде. Функциональные программы, код и сегменты кода, необходимые для осуществления настоящего изобретения, могут быть легко истолкованы специалистами в данной области техники.

Другие варианты осуществления находятся в пределах объема последующей формулы изобретения.

Промышленная применимость

Настоящее изобретение можно применять к различным процессам декодирования объектно-ориентированных звуковых сигналов, и оно может обеспечивать отчетливый эффект присутствия во время воспроизведения звуковых сигналов объектов посредством локализирования звукового образа для каждого из объектно-ориентированных звуковых сигналов.

Похожие патенты RU2407070C2

название год авторы номер документа
СПОСОБЫ И УСТРОЙСТВА КОДИРОВАНИЯ И ДЕКОДИРОВАНИЯ ОБЪЕКТНО-ОРИЕНТИРОВАННЫХ АУДИОСИГНАЛОВ 2007
  • Йоон Сунг Йонг
  • Панг Хее Сук
  • Ли Хиун Коок
  • Ким Донг Соо
  • Лим Дзае Хиун
RU2407072C1
СПОСОБЫ И УСТРОЙСТВА КОДИРОВАНИЯ И ДЕКОДИРОВАНИЯ ОБЪЕКТНО-ОРИЕНТИРОВАННЫХ АУДИОСИГНАЛОВ 2010
  • Йоон Сунг Йонг
  • Панг Хее Сук
  • Ли Хиун Коок
  • Ким Донг Соо
  • Лим Дзае Хиун
RU2455708C2
СПОСОБЫ И УСТРОЙСТВА КОДИРОВАНИЯ И ДЕКОДИРОВАНИЯ ОБЪЕКТНО-ОРИЕНТИРОВАННЫХ АУДИОСИГНАЛОВ 2007
  • Йоон Сунг Йонг
  • Панг Хее Сук
  • Ли Хиун Коок
  • Ким Донг Соо
  • Лим Дзае Хиун
RU2551797C2
СПОСОБЫ И УСТРОЙСТВА КОДИРОВАНИЯ И ДЕКОДИРОВАНИЯ ОСНОВЫВАЮЩИХСЯ НА ОБЪЕКТАХ ОРИЕНТИРОВАННЫХ АУДИОСИГНАЛОВ 2008
  • Ким Донг Соо
  • Панг Хее Сук
  • Лим Дзае Хиун
  • Йоон Сунг Йонг
  • Ли Хиун Коок
RU2406166C2
СПОСОБЫ И УСТРОЙСТВА ДЛЯ КОДИРОВАНИЯ И ДЕКОДИРОВАНИЯ ОБЪЕКТНО-БАЗИРОВАННЫХ АУДИОСИГНАЛОВ 2008
  • Ким Донг Соо
  • Панг Хее Сук
  • Лим Дзае Хиун
  • Йоон Сунг Йонг
  • Ли Хиун Коок
RU2394283C1
СПОСОБЫ И УСТРОЙСТВА ДЛЯ КОДИРОВАНИЯ И ДЕКОДИРОВАНИЯ АУДИОСИГНАЛОВ НА ОСНОВЕ ОБЪЕКТОВ 2007
  • Йоон Сунг Йонг
  • Панг Хее Сук
  • Ли Хиун Коок
  • Ким Донг Соо
  • Лим Дзае Хиун
RU2420026C2
СПОСОБЫ И УСТРОЙСТВА ДЛЯ КОДИРОВАНИЯ И ДЕКОДИРОВАНИЯ ОБЪЕКТНО-БАЗИРОВАННЫХ АУДИОСИГНАЛОВ 2008
  • Ким Донг Соо
  • Панг Хее Сук
  • Лим Дзае Хиун
  • Йоон Сунг Йонг
  • Ли Хиун Коок
RU2406165C2
ДЕКОДЕР АУДИОСИГНАЛА, СПОСОБ ДЕКОДИРОВАНИЯ АУДИОСИГНАЛА И КОМПЬЮТЕРНАЯ ПРОГРАММА С ИСПОЛЬЗОВАНИЕМ СТУПЕНЕЙ КАСКАДНОЙ ОБРАБОТКИ АУДИООБЪЕКТОВ 2010
  • Хеллмут Оливер
  • Фалк Корнелиа
  • Херре Юрген
  • Хилперт Йоханнес
  • Терентьев Леонид
  • Риддербуш Фалко
RU2558612C2
СПОСОБЫ И УСТРОЙСТВА ДЛЯ КОДИРОВАНИЯ И ДЕКОДИРОВАНИЯ ОБЪЕКТНО-БАЗИРОВАННЫХ АУДИОСИГНАЛОВ 2010
  • Ким Донг Соо
  • Панг Хее Сук
  • Лим Дзае Хиун
  • Йоон Сунг Йонг
  • Ли Хиун Коок
RU2449388C2
УСТРОЙСТВО И СПОСОБ ДЛЯ КОДИРОВАНИЯ/ДЕКОДИРОВАНИЯ СИГНАЛА 2007
  • Дзунг Йанг Вон
  • Панг Хее Сук
  • Ох Хиун О
  • Ким Донг Соо
  • Лим Дзае Хиун
RU2406164C2

Иллюстрации к изобретению RU 2 407 070 C2

Реферат патента 2010 года СПОСОБ И УСТРОЙСТВО КОДИРОВАНИЯ И ДЕКОДИРОВАНИЯ ОБЪЕКТНО-ОРИЕНТИРОВАННОГО ЗВУКОВОГО СИГНАЛА

Изобретение относится к способам и устройства, предназначенным для кодирования и декодирования звукового сигнала, и более конкретно, к способам и устройствам для кодирования и декодирования объектно-ориентированного звукового сигнала. Способ декодирования объектно-ориентированного звукового сигнала включает в себя выделение сигнала сведения фонограммы и информации о параметрах объектов из входного звукового сигнала, генерирование звукового сигнала объектов с использованием сигнала понижающего микширования и информации о параметрах объектов и генерирование звукового сигнала объектов с трехмерными (3D) эффектами посредством применения 3D информации к звуковому сигналу объектов. Соответственно, можно локализировать звуковой образ для каждого звукового сигнала объектов. Технический результат - возможность обеспечивать отчетливый эффект присутствия во время воспроизведения звуковых сигналов объектов посредством локализирования звукового образа для каждого из объектно-ориентированных звуковых сигналов. 7 н. и 19 з.п. ф-лы, 9 ил.

Формула изобретения RU 2 407 070 C2

1. Способ декодирования аудиосигнала, содержащий этапы, на которых:
выделяют сигнал понижающего микширования и информацию об объектно-ориентированных параметрах из входного аудиосигнала;
генерируют аудиосигнал объектов с использованием сигнала понижающего микширования и информации об объектно-ориентированных параметрах;
извлекают 3D-информацию, используя индексные данные, из базы данных 3D; и
генерируют аудиосигнал объектов с трехмерными (3D) эффектами посредством применения 3D-инфopмaции к аудиосигналу объектов.

2. Способ по п.1, в котором 3D-инфopмaция представляет собой информацию функции моделирования восприятия звука (HRTF).

3. Способ по п.1, в котором индексные данные включены в данные управления, используемые для воспроизведения аудиосигнала объектов.

4. Способ по п.3, в котором данные управления содержат, по меньшей мере, одно из информации о межканальных уровнях, информации о межканальной синхронизации, информации о расположении и комбинации информации о межканальных уровнях и информации о синхронизации.

5. Способ по п.3, дополнительно содержащий этап, на котором воспроизводят аудиосигнал объектов с использованием данных управления.

6. Способ по п.1, в котором индексные данные включены в информацию о заданных по умолчанию параметрах микширования, которая включена в информацию об объектно-ориентированных параметрах.

7. Устройство для декодирования аудиосигнала, содержащее:
демультиплексор, который выделяет сигнал понижающего микширования и информацию об объектно-ориентированных параметрах из входного аудиосигнала;
декодер объектов, который генерирует аудиосигнал объектов с использованием сигнала понижающего микширования и информации об объектно-ориентированных параметрах;
базу данных 3D, которая хранит 3D-информацию; и
устройство воспроизведения, которое извлекает 3D-информацию, используя индексные данные, из базы данных 3D и генерирует трехмерный аудиосигнал объектов с 3D-эффектами посредством применения 3D-информации к аудиосигналу объектов.

8. Устройство по п.7, в котором 3D-информация представляет собой информацию функции моделирования восприятия звука (HRTF).

9. Устройство по п.7, в котором индексные данные включены в данные управления, используемые для воспроизведения аудиосигнала объектов.

10. Устройство по п.9, в котором данные управления содержат, по меньшей мере, одно из информации о межканальных уровнях, информации о межканальной синхронизации, информации о расположении и комбинации информации о межканальных уровнях и информации о синхронизации.

11. Способ декодирования аудиосигнала, содержащий этапы, на которых:
выделяют сигнал понижающего микширования, сгенерированный посредством понижающего микширования, по меньшей мере, одного сигнала объектов, и информацию об объектно-ориентированных параметрах, определенную при генерации сигнала понижающего микширования, из входного аудиосигнала;
принимают данные управления для управления, по меньшей мере, одним сигналом объектов;
извлекают 3D-информацию, используя индексные данные, из базы данных 3D;
генерируют информацию об основанных на каналах параметрах с использованием информации об объектно-ориентированных параметрах и данных управления; и
генерируют аудиосигнал с 3D-эффектами с использованием сигнала понижающего микширования, информации об основанных на каналах параметрах и 3D-информации.

12. Способ по п.11, в котором 3D-информация представляет собой информацию HRTF.

13. Способ по п.11, в котором индексные данные включены в данные управления.

14. Способ по п.11, в котором данные управления содержат, по меньшей мере, одно из информации о межканальных уровнях, информации о межканальной синхронизации, информации о расположении и комбинации информации о межканальных уровнях и информации о синхронизации.

15. Способ по п.11, дополнительно содержащий этап, на котором добавляют предопределенный эффект к сигналу понижающего микширования.

16. Устройство для декодирования аудиосигнала, содержащее:
демультиплексор, выделяющий из входного аудиосигнала сигнал понижающего микширования, сгенерированный посредством понижающего микширования, по меньшей мере, одного сигнала объектов, и информацию об объектно-ориентированных параметрах, определенную при генерации сигнала понижающего микширования;
устройство воспроизведения, конфигурированное для
приема данных управления для управления уровнем или расположением,
по меньшей мере, одного сигнала объектов;
выделения индексных данных, включенных в данные управления;
извлечения 3D-информации, используя индексные данные, из базы данных 3D; и
вывода 3D-информации;
транскодер, генерирующий информацию об основанных на каналах параметрах посредством синтезирования информации об объектно-ориентированных параметрах и 3D-информации; и
многоканальный декодер, генерирующий аудиосигнал с 3D-эффектами посредством выполнения операции 3D-воспроизведения над сигналом понижающего микширования с использованием информации об основанных на каналах параметрах.

17. Устройство по п.16, в котором 3D-информация представляет собой информацию HRTF.

18. Устройство по п.16, дополнительно содержащее процессор эффектов, который добавляет предопределенный эффект к сигналу понижающего микширования.

19. Устройство по п.16, в котором данные управления содержат, по меньшей мере, одно из информации о межканальных уровнях, информации о межканальной синхронизации, информации о расположении и комбинации информации о межканальных уровнях и информации о синхронизации.

20. Устройство для декодирования аудиосигнала, содержащее:
демультиплексор, который выделяет сигнал понижающего микширования и информацию об объектно-ориентированных параметрах из входного аудиосигнала;
базу данных 3D, которая хранит 3D-информацию;
устройство воспроизведения, которое принимает данные управления для управления, по меньшей мере, одним сигналом объектов, извлекает 3D-информацию, используя входные индексные данные, из базы данных 3D и выводит 3D-информацию;
транскодер, который преобразует информацию об объектно-ориентированных параметрах в информацию об основанных на каналах параметрах, преобразует 3D-информацию в основанную на каналах 3D-информацию и выводит информацию об основанных на каналах параметрах и основанную на каналах 3D-информацию; и
многоканальный декодер, который генерирует аудиосигнал с 3D-эффектами посредством выполнения операции 3D-воспроизведения над сигналом понижающего микширования с использованием информации об основанных на каналах параметрах и основанной на каналах 3D-информации.

21. Устройство по п.20, в котором многоканальный декодер содержит запоминающее устройство, которое хранит 3D-информацию, обычно используемую для генерирования аудиосигнала с 3D-эффектами.

22. Устройство по п.21, в котором 3D-информация, хранящаяся в запоминающем устройстве, обновляется с помощью основанной на каналах 3D-информации.

23. Устройство по п.20, в котором индексные данные включены в данные управления микшированием, используемые для воспроизведения аудиосигнала объектов.

24. Устройство по п.20, в котором информация об основанных на каналах параметрах и основанная на каналах 3D-информация содержат индексную информацию для синхронизации информации об основанных на каналах параметрах с основанной на каналах 3D-информацией.

25. Машиночитаемый носитель, на котором сохранена программа для осуществления способа по п.1.

26. Машиночитаемый носитель, на котором сохранена программа для осуществления способа по п.11.

Документы, цитированные в отчете о поиске Патент 2010 года RU2407070C2

US 2006002572 A1, 05.01.2006
RU 2005104123 A, 10.07.2005
RU 2004133032 A, 20.04.2005
US 2003167173 A1, 04.09.2003
Раковина 1979
  • Немцов Николай Степанович
SU857375A1
JP 2001028800 A, 30.01.2001
Способ приготовления мыла 1923
  • Петров Г.С.
  • Таланцев З.М.
SU2004A1

RU 2 407 070 C2

Авторы

Йоон Сунг Йонг

Панг Хее Сук

Ли Хиун Коок

Ким Донг Соо

Лим Дзае Хиун

Даты

2010-12-20Публикация

2007-02-09Подача