Показать метаданные Скрыть метаданные

(19)

(11)

2 668 113

(13)

(51)

МПК

H04S5/02(2006-01-01)

G10L19/08(2013-01-01)

G10L21/34(2013-01-01)

(21) (22)

Заявка

2015149206, 2014-05-21

(24)

Дата начала отсчета патента

2014-05-21

(22)

дата подачи заявки

2014-05-21

(45)

опубликовано

2018-09-26

(72)

авторы

Си РуньюТинен ТоруЯмамото ЮкиХатанака Мицуюки

(73)

патентообладатели

Сони Корпорейшн

(56)

Документы, цитированные в отчете о поиске

JP 2008187213 A, 14.08.2008EP 1881740 A2, 23.01.2008JP 2006101248 A, 13.04.2006JP 2010041190 A, 18.02.2010

СПОСОБ И УСТРОЙСТВО ВЫВОДА АУДИОСИГНАЛА, СПОСОБ И УСТРОЙСТВО КОДИРОВАНИЯ, СПОСОБ И УСТРОЙСТВО ДЕКОДИРОВАНИЯ И ПРОГРАММА Российский патент 2018 года по МПК H04S5/02 G10L19/08 G10L21/34

Описание патента на изобретение RU2668113C2

Область техники, к которой относится изобретение

Настоящее изобретение относится к способу и устройству вывода аудиосигнала, способу и устройству кодирования, способу и устройству декодирования и программе и, более конкретно, к способу и устройству вывода аудиосигнала, способу и устройству кодирования, способу и устройству декодирования и программе, которые предназначены для получения более реалистичного звука при его воспроизведении.

Уровень техники

При многоканальном воспроизведении звука, позиции громкоговорителей на стороне воспроизведения, предпочтительно соответствуют позициям источников звука. В действительности, однако, позиции громкоговорителей на стороне воспроизведения нередко отличаются от позиций источников звука.

В случае, когда позиции громкоговорителей на воспроизводящей стороне отличаются от позиций источников звука, появляется источник звука, который не находится на позиции громкоговорителя, поэтому, важным моментом является вопрос, каким образом воспроизводится звук таких источников звука.

Технология под названием VBAP (векторное амплитудное панорамирование) была предложен в качестве способа воспроизведения звука источника звука, расположенного в нужной позиции, посредством громкоговорителя, расположенного в желаемой позиции (см. непатентный документ 1, например).

Согласно VBAP, целевая нормальная позиция изображения звука выражается линейной суммой векторов, проходящих в направлении двух или трех громкоговорителей, расположенных вокруг нормальной позиции. Коэффициенты, на которые соответствующие векторы умножаются в линейной сумме, используются в качестве коэффициентов усиления аудиосигналов для вывода из соответствующих громкоговорителей, и регулировка коэффициента усиления выполняется таким образом, что звуковой образ фиксируется на целевой позиции.

Перечень ссылок

Непатентный документ

Непатентный документ 1: Ville Pulkki, "Позиционирование виртуального источника звука посредством использования векторного амплитудного панорамирования", журнал AES, vol. 45, №6, стр. 456-466, 1997 г.

Раскрытие изобретения

Технические задачи, решаемые с помощью изобретения

При этом, был предложен способ воспроизведения звука для обычной ситуации, где количество каналов и расположение громкоговорителя на стороне источника звука и количество каналов громкоговорителей и расположение громкоговорителя на стороне воспроизведения определяются заранее, как 7.1 расположение канала и 5.1 расположение канала, 5.1 расположение канала и 2.1 расположение канала, или 22.2 расположение канала и 5.1 расположение канала, как это рекомендовано на нескольких международных конференциях по стандартизации. В таком случае, звуки выводятся из соответствующих громкоговорителей с соответствующими коэффициентами усиления благодаря процессу конвертирования 6-канального звука в стереофонический звук, и, таким образом, может быть реализовано воспроизведение реалистичного звука.

В других случаях, таких как случай, когда источники звука или громкоговорители расположены на позициях, которые отличаются от заданных позиций, однако, звук может не воспроизводиться посредством предложенного способа воспроизведения, или качество звука и определение звукового образа может быть серьезно ухудшено, хотя воспроизведение может быть выполнено с помощью предлагаемого способа воспроизведения.

В случае, когда источники звукового канала воспроизводятся с помощью вышеупомянутой технологии VBAP, большинство звуковых образов источников звукового канала различаются расположением от идеальных громкоговорителей, воспроизводящие звуки источников. В результате, определение звукового образа в значительной степени искажается.

Посредством упомянутой технологии, сложно осуществить воспроизведение реалистичного звука.

Настоящее изобретение было разработано с учетом этих обстоятельств, и направлено на реализацию воспроизведения реалистичного звука. Решения технической задачи

Устройство вывода аудиосигнала по первому аспекту настоящего изобретения включает в себя: блок вычисления расстояния, который вычисляет расстояние между позицией идеального громкоговорителя, который воспроизводит звуковой сигнал, и позицией реального громкоговорителя, который воспроизводит звуковой сигнал; блок вычисления коэффициента усиления, который вычисляет коэффициент усиления воспроизведения аудиосигнала на основании расстояния; и блок регулировки коэффициента усиления, который выполняет регулировку коэффициента усиления аудиосигнала на основании коэффициента усиления воспроизведения аудиосигнала.

Блок вычисления коэффициента усиления может вычислять коэффициент усиления воспроизведения на основании информации кривой для получения коэффициента усиления воспроизведения, соответствующего расстоянию.

Информация кривой может быть информацией, указывающая на ломаную кривую или кривую функции.

Когда идеальной громкоговоритель расположен не на единичной окружности, имеющей заданную опорную точку в качестве центральной точки, блок регулировки коэффициента усиления может дополнительно выполнять регулировку коэффициента усиления аудиосигнала с учетом коэффициента усиления, определенного на основании расстояния от опорной точки до идеального громкоговорителя и радиуса единичной окружности.

Блок регулировки коэффициента усиления может задерживать аудиосигнал на основании времени задержки, определенной на основании расстояния от опорной точки до идеального громкоговорителя и радиуса единичной окружности.

Когда реальный громкоговоритель расположен не на единичной окружности, имеющей заданную опорную точку в качестве центральной точки, блок регулировки коэффициента усиления может дополнительно выполнять регулировку коэффициента усиления аудиосигнала с учетом коэффициента усиления, определенного на основании расстояния от опорной точки до реального громкоговорителя и радиуса единичной окружности.

Блок регулировки коэффициента усиления может задерживать аудиосигнал на основании времени задержки, определенной на основании расстояния от опорной точки до реального громкоговорителя и радиуса единичной окружности.

Устройство вывода аудиосигнала может дополнительно включать в себя блок коррекции коэффициента усиления, который корректирует коэффициент усиления воспроизведения в зависимости от расстояния между позицией идеального центрального громкоговорителя и позицией реального громкоговорителя.

Устройство вывода аудиосигнала может дополнительно включать в себя блок коррекции нижнего предельного значения, который корректирует коэффициент усиления воспроизведения, когда коэффициент усиления воспроизведения меньше заданного нижнего предельного значения.

Устройство вывода аудиосигнала может дополнительно включать в себя блок коррекции общего коэффициента усиления, который вычисляет соотношение между полной мощностью выходного звука на основании звукового сигнала, подвергнутого регулировке усиления посредством коэффициента усиления воспроизведения, и полной мощностью входного звукового сигнала, и корректирует коэффициент усиления воспроизведения на основании соотношения, соотношение вычисляется на основании коэффициента усиления воспроизведения и ожидаемого значения звукового давления входного звукового сигнала на основании входного звукового сигнала.

Способ вывода аудиосигнала или программа согласно первому аспекту настоящего изобретения включает в себя этапы, на которых осуществляется: вычисление расстояния между позицией идеального громкоговорителя, который воспроизводит аудиосигнал, и позицией реального громкоговорителя, который воспроизводит аудиосигнал; вычисление коэффициента усиления воспроизведения аудиосигнала на основании расстояния; и выполнение регулировки коэффициента усиления аудиосигнала на основании коэффициента усиления воспроизведения.

В первом аспекте настоящего изобретения, вычисляется расстояние между позицией идеального громкоговорителя, который воспроизводит аудиосигнал, и позицией реального громкоговорителя, который воспроизводит аудиосигнал, коэффициент усиления воспроизведения аудиосигнала вычисляется на основании расстояния, и регулировка коэффициента усиления аудиосигнала выполняется на основании коэффициента усиления воспроизведения.

Устройство кодирования по второму аспекту настоящего изобретения включает в себя: блок генерирования корректирующей информации, который генерирует корректирующую информацию для корректировки коэффициента усиления аудиосигнала в соответствии с расстоянием между позицией идеального громкоговорителя, который воспроизводит звуковой сигнал, и позицией реального громкоговорителя, который воспроизводит звуковой сигнал; блок кодирования, который кодирует аудиосигнал; и блок вывода, который выводит битовый поток, включающий в себя корректирующую информацию и кодированный аудиосигнал.

Способ кодирования согласно второму аспекту настоящего изобретения включает в себя этапы: генерирования корректирующей информации для коррекции коэффициента усиления аудиосигнала в соответствии с расстоянием между позицией идеального громкоговорителя, который воспроизводит аудиосигнал, и позицией реального громкоговорителя, который воспроизводит аудиосигнал; кодирование аудиосигнала; и вывод битового потока, включающего в себя корректирующую информацию и кодированный аудиосигнал.

Во втором аспекте настоящего изобретения, генерируется корректирующая информация для коррекции коэффициента усиления аудиосигнала в соответствии с расстоянием между позицией идеального громкоговорителя, который воспроизводит аудиосигнал, и позицией реального громкоговорителя, который воспроизводит аудиосигнал, аудиосигнал генерируется и выводится битовый поток, включающий в себя корректирующую информацию и кодированный аудиосигнал.

Устройство декодирования по третьему аспекту настоящего изобретения включает в себя: блок извлечения, который извлекает из битового потока корректирующую информацию для коррекции коэффициента усиления аудиосигнала в соответствии с расстоянием между позицией идеального громкоговорителя, который воспроизводит аудиосигнал, и позицией реального громкоговорителя, который воспроизводит аудиосигнал, и кодированный аудиосигнал; блок декодирования, который декодирует кодированный аудиосигнал; и блок вывода, который выводит декодированный аудиосигнал и корректирующую информацию.

Корректирующая информация может представлять собой информацию о местоположении идеального громкоговорителя.

Корректирующая информация может представлять собой информацию кривой для получения коэффициента усиления, соответствующего расстоянию.

Информация кривой может быть информацией, указывающей на ломаную кривую или кривую функции.

Способ декодирования по третьему аспекту настоящего изобретения включает в себя этапы: извлечения из битового потока корректирующей информации для коррекции коэффициента усиления аудиосигнала в соответствии с расстоянием между позицией идеального громкоговорителя, который воспроизводит аудиосигнал, и позицией реального громкоговорителя, который воспроизводит аудиосигнал, и кодированного аудиосигнала; декодирования кодированного аудиосигнала; и вывода декодированного аудиосигнала и корректирующей информации.

В третьем аспекте настоящего изобретения, корректирующая информации для коррекции коэффициента усиления аудиосигнала в соответствии с расстоянием между позицией идеального громкоговорителя, который воспроизводит аудиосигнал, и позицией в реального громкоговорителя, который воспроизводит аудиосигнал, и кодированный аудиосигнал извлекаются из битового потока, кодированный аудиосигнал декодируется, и выводятся декодированный аудиосигнал и корректирующая информация. Результаты изобретения

Согласно аспектам с первого по третий настоящего изобретения может быть осуществлено воспроизведение более реалистичного звука. Краткое описание чертежей

Фиг. 1 показывает схему, предназначенную для пояснения общего принципа настоящей технологии.

Фиг. 2 показывает схему, предназначенную для пояснения ломаной кривой.

Фиг. 3 показывает схему, предназначенную для пояснения кривой функции.

Фиг. 4 показывает схему, предназначенную для пояснения коэффициентов усиления воспроизведения.

Фиг. 5 показывает схему, иллюстрирующую пример структуры устройства воспроизведения.

Фиг. 6 представляет собой блок-схему алгоритма, поясняющую процесс конвертирования 6-канального звука в стереофонический звук.

Фиг. 7 является схемой, показывающей пример конфигурации аудиосистемы.

Фиг. 8 показывает схему, предназначенную для пояснения метаданных.

Фиг. 9 представляет собой блок-схему алгоритма, поясняющую процесс кодирования.

Фиг. 10 является блок-схемой алгоритма для пояснения процесса декодирования.

Фиг. 11 является схемой, показывающей пример конфигурации компьютера.

Описание вариантов осуществления

Ниже приводится описание вариантов осуществления, к которым применяется настоящее изобретение, со ссылкой на чертежи.

Первый вариант осуществления

Общее описание настоящей технологии

Настоящая технология относится к способу воспроизведения источника звука канала с требуемым количеством громкоговорителей, и способу кодирования и декодирования необходимой информации (метаданные) для реализации способа воспроизведения.

Сначала будет приведено общее описание настоящей технологии.

Аудиосигналы каналов и метаданные этих аудиосигналов поставляются в устройство воспроизведения, и устройство воспроизведения управляет воспроизведением звука на основе метаданных и аудиосигналов, например.

Аудиосигналы соответствующих каналов являются сигналами, генерируемые для воспроизведения через громкоговорители, размещенные на идеальных позициях, указанных метаданными. В приведенном ниже описании, виртуальные громкоговорители, которые размещаются на позициях, указанных метаданными, и воспроизводящие аудиосигналы соответствующих каналов, будет называться идеальными громкоговорителями. Кроме того, реальные громкоговорители, которые выводят звуки на основании аудиосигналов, выведенных из устройства воспроизведения, будет упоминаться как громкоговорителя воспроизведения.

В настоящей технологии, аудиосигналы всех каналов подразделяются на аудиосигналы для LFE (канал низкочастотных эффектов) и аудиосигналы не для LFE. То есть, все идеальные громкоговорители подразделяются на громкоговорители для LFE и громкоговорители не для LFE. Аналогично, громкоговорители воспроизведения подразделяются на громкоговорители для LFE и громкоговорители не для LFE.

Во-первых, будет приведено описание воспроизведение аудиосигналов каналов не для LFE.

При воспроизведении аудиосигналов каналов не для LFE, регулировка коэффициента усиления аудиосигнала выполняется на основании расстояния между идеальным громкоговорителем и громкоговорителями воспроизведения, как показано на фиг. 1, например.

На фиг. 1, идеальный громкоговоритель VSP1 и громкоговорители с RSP11-I по RSP11-3 воспроизведения расположены на поверхности сферы РН 11, которая имеет радиус r_u и имеет свой центр на позиции пользователя U11, который является зрителем. Идеальный громкоговоритель VSP1 и громкоговорители с RSP11-1 по RSP11-3 воспроизведения являются громкоговорителями не для LFE.

Далее, громкоговорители с RSP11-1 по RSP11-3 воспроизведения будут также упоминается просто, как и громкоговорители RSP11 воспроизведения, если нет особой необходимости отличать их друг от друга. Хотя в данном примере показаны только один идеальный громкоговоритель и три громкоговорителя воспроизведения, в реальности могут использоваться другие идеальные громкоговорители и громкоговорители воспроизведения.

Например, звук, основанный на аудиосигнале канала, соответствующий идеальному громкоговорителю VSP1, идеально фиксирует звуковой образ на позиции идеального громкоговорителя VSP1.

Таким образом, в настоящем изобретении, коэффициенты усиления воспроизведения соответствующих громкоговорителей RSP11 воспроизведения определяются в соответствии с расстояниями между идеальным громкоговорителем VSP1 громкоговорителями RSP11 воспроизведения, и звук, основанный на аудиосигнале, вырабатывается из каждого громкоговорителя RSP11 воспроизведения с определенными коэффициентами усиления воспроизведения, так что звуковой образ фиксируется на позиции идеального громкоговорителя VSP1.

В частности, расстояние между идеальным громкоговорителем VSP1 и громкоговорителем RSP11 воспроизведения является углом между вектором в направлении от пользователя U11 по отношению к идеальному громкоговорителю VSP1 и вектором в направлении от пользователя U11 в направлении громкоговорителя RSP11 воспроизведения.

Другими словами, расстояние между идеальным громкоговорителем VSP1 и громкоговорителем RSP11 воспроизведения на поверхности сферы РН 11, или длина дуги, соединяющая два громкоговорителя, является расстоянием между идеальным громкоговорителем VSP1 и громкоговорителем RSP11 воспроизведения.

В примере, показанном на фиг. 1, угол между стрелкой АН и стрелкой А12 является расстоянием DistM1 между идеальным громкоговорителем VSP1 и громкоговорителем RSP11-1 воспроизведения. Аналогично, угол между стрелкой АН и стрелкой А13 является расстоянием DistM2 между идеальным громкоговорителем VSP1 и громкоговорителем RSP11-2 воспроизведения, и угол между стрелкой АН и стрелкой А14 является расстоянием DistM3 между идеальным громкоговорителем VSP1 и громкоговорителем RSP11-3 воспроизведения.

Аудиосигнал канала идеального громкоговорителя VSP1 подвергается регулировке коэффициента усиления в зависимости от расстояния DistM1, и воспроизводится громкоговорителем RSP11-1 воспроизведения. Аудиосигнал канала идеального громкоговорителя VSP1 также подвергается регулировке коэффициента усиления в зависимости от расстояния DistM2 и расстояния DistM3, и воспроизводится громкоговорителем RSP11-2 воспроизведения и громкоговорителем RSP11-3 воспроизведения.

Соответственно, даже в случае, когда существуют различия в положении между идеальным VSP1 громкоговорителем и громкоговорителями RSP11 воспроизведения, различия, вызванные в звуковом образе различиями в положении, могут быть уменьшены, и может быть осуществлено более реалистичное воспроизведение звука.

Далее будет приведено более подробное описание воспроизведения аудиосигналов каналов не для LFE.

В частности, в примере, описанном ниже, аудиосигналы М идеальных громкоговорителей не для LFE, или М каналов, которые микшируются с понижением, генерируют аудиосигналы N каналов, и аудиосигналы N каналов воспроизводятся посредством N громкоговорителей воспроизведения не для LFE.

В процессе понижающего микширования, шесть процессов с STE1 по STE6, показанные ниже, в основном, осуществляется в последовательном порядке.

Процесс STE1: Определяются расстояния между идеальными громкоговорителями и громкоговорителями воспроизведения.

Процесс STE2: Определяются коэффициенты усиления воспроизведения ответствующих громкоговорителей воспроизведения для каждого идеального громкоговорителя, на основании определенных расстояний и заданной кривой затухания.

Процесс STE3: Корректируются коэффициенты усиления воспроизведения в соответствии с позицией громкоговорителя воспроизведения.

Процесс STE4: Корректируются коэффициенты усиления воспроизведения в соответствии с нижним пределом.

Процесс STE5: Корректируются коэффициенты усиления воспроизведения так, чтобы полная выходная мощность звука аппроксимирует общую входную мощность сигнала.

Процесс STE6: Применяются коэффициенты усиления воспроизведения к аудиосигналам, и выполняется регулировка коэффициента усиления.

Далее дополнительно приводится подробное описание этих процессов с STE1 по STE6.

Процесс STE1

Во-первых, в процессе STE1, определяются расстояния между громкоговорителями. Позиция каждого громкоговорителя представлена горизонтальным углом θ(-180°≤8≤+180°), вертикальным углом γ(-90°≤γ≤+90°), и расстоянием от пользователя до громкоговорителя r(0≤r≤+∞).

Например, фиг. 1 показывает трехмерную систему координат, образованную х-осью, y-осью y и z-осью, где позиции пользователя U11 является исходной.

Где х-y плоскость является плоскостью, включающая в себя прямую линию, проходящую в направлении глубины чертежа, и прямую линию, проходящую в поперечном направлении чертежа, угол между прямой линией, проходящей в опорном направлении в х-y плоскости, или y-оси, и вектором в направлении от пользователя U11 в направлении громкоговорителя является горизонтальным углом θ, например. То есть, горизонтальный угол θ представляет собой угол в горизонтальном направлении на фиг. 1.

Кроме того, угол между вектором в направлении от пользователя U11 в направлении громкоговорителя и х-y плоскости является вертикальным углом γ, и длина прямой линии, соединяющей U11 пользователя и громкоговоритель является расстоянием г.

Горизонтальные углы θ, вертикальные углы γ и расстояния r, которые указывают на позиции соответствующих идеальных громкоговорителей, поставляются как метаданные аудиосигналов в устройство воспроизведения. Горизонтальные углы θ, вертикальные углы γ и расстояния r, которые указывают на позиции соответствующих громкоговорителей воспроизведения, также поставляются в устройство воспроизведения.

В приведенном ниже описании, горизонтальный угол θ, вертикальный угол γ и расстояние r m-ого идеального громкоговорителя среди М идеальных громкоговорителей будут представлены как θ_im, γ_im и r_im, соответственно. Точно так же, горизонтальный угол θ, вертикальный угол γ, расстояние г n-ого громкоговорителя воспроизведения среди N громкоговорителей воспроизведения будут представлены как θ_on, γ_on и r_on, соответственно.

Устройство воспроизведения вычисляет расстояния между каждым из М идеальных громкоговорителей и N громкоговорителей воспроизведения.

Например, расстояние Dist (m, n) между m-ым идеальным громкоговорителем и n-ым громкоговорителем воспроизведения вычисляется согласно уравнению (1), показанному ниже.

Устройство воспроизведения выполняет расчет по уравнению (1) для каждой из комбинаций М идеальных громкоговорителей и N громкоговорителей воспроизведения, и рассчитывает общую величину (М×N) расстояния Dist(m, n).

Если соответствующие идеальные громкоговорители и соответствующие громкоговорители воспроизведения расположены на единичной окружности, имеющей радиус r_u или на сфере РН 11, показанной на фиг. 1, звуки, выводимые из соответствующих громкоговорителей, достигают пользователя U11 одновременно. Если один из громкоговорителей не находится на сфере РН 11, однако, звук из этого громкоговорителя достигает пользователя U11 раньше или позже, чем звуки от других громкоговорителей, и, более того, изменение, вызванное в звуковом давлении звука, будет услышано пользователем.

Таким образом, устройство воспроизведения выполняет коррекцию звукового давления, используя значение коррекции SoundPressureCorrection_im аудиосигнала идеального громкоговорителя, имеющий расстояние r_im, не равное r_u, и выполняет процесс задержки с использованием времени задержки Delay_im.

Таким образом, можно считать, что идеальный громкоговоритель расположен на сфере РН 11.

В частности, расчет по уравнению (2), показанному ниже, выполняется на основании расстояния r_im и радиуса r_u, так что получается значение коррекции SoundPressureCorrection_im.

Значение коррекции SoundPressureCorrection_im, определенное в соответствии с уравнением (2), используется в коррекции, которое выполняется на аудиосигнале на стороне идеального громкоговорителя, или аудиосигнале канала т, который поступает на вход устройства воспроизведения. В приведенном ниже описании, аудиосигнал, который подается на вход устройства воспроизведения, будет также упоминаться как входной аудиосигнал, и аудиосигнал, выводимый из устройства воспроизведения, будет также упоминаться как выходной аудиосигнал.

Время задержки Delay_im для процесса задержки, который выполняется на входном аудиосигнале идеального рассчитывается согласно уравнению (3) как показано ниже, на основании расстояния r_im и радиуса r_u. Если r_im>r_u время задержки Delay_im имеет отрицательное значение и в процессе задержки, аудиосигнал задерживается в отрицательном направлении, или аудиосигнал сдвигается назад по времени.

Значение коррекции SoundPressureCorrection_im и время задержки Delay_im рассчитываются для каждого идеального громкоговорителя, имеющего расстояние r_im, не равное r_u. Аналогично, значение коррекции SoundPressureCorrection_im и время задержки Delay_im рассчитываются для каждого громкоговорителя воспроизведения, имеющего расстояние r_on, не равное r_u.

В частности, значение коррекции SoundPressureCorrection_on рассчитывается согласно уравнению (4), как показано ниже, и временя задержки Delay_on рассчитывается согласно уравнению (5), как показано ниже.

Значения коррекции SoundPressureCorrection_on и время задержки Delay_on, рассчитанные указанным выше образом, являются значением коррекции звукового давления и временем задержки для стороны громкоговорителя воспроизведения или выходного аудиосигнала. Таким образом, устройство воспроизведения выполняет коррекцию звукового давления, используя значение коррекции SoundPressureCorrection_on аудиосигнала, подаваемого в громкоговоритель воспроизведения, имеющий расстояние r_on, не равное r_u, и выполняет процесс задержки с использованием времени задержки Delay_on.

Процесс STE2

В процессе STE2 вычисляются коэффициенты усиления воспроизведения соответствующих громкоговорителей воспроизведения по отношению к каждому идеальному громкоговорителю.

Во-первых, для каждого из М идеальных громкоговорителей, осуществляет проверка для определения факта того, что громкоговоритель воспроизведения находится на расстоянии Dist(m, n) "0" от идеального громкоговорителя. Соответствующие идеальные громкоговорители, затем классифицируются на громкоговорители, расположенные на позициях громкоговорителей воспроизведения и громкоговорители, не расположенные в позициях громкоговорителя воспроизведения.

Для m-ого идеального громкоговорителя, определенного, как расположенного на позиции громкоговорителя воспроизведения, вычисляется коэффициент MixGain (m, n) усиления воспроизведения n-ого громкоговорителя воспроизведения по отношению к аудиосигналу канала m, соответствующего m-ого идеального громкоговорителя, с использованием уравнения (6), как показано ниже.

В соответствии с уравнением (6), коэффициент MixGain (m, n) усиления воспроизведения громкоговорителя воспроизведения на расстоянии Dist(m, n) "0" или громкоговоритель воспроизведения находится на той же позиции, что и m-ый идеальный громкоговоритель, равен 0 дБ. Кроме того, коэффициент MixGain (m, n) усиления воспроизведения громкоговорителя воспроизведения на расстоянии Dist(m, n), который не равен "0" или громкоговоритель воспроизведения находится на иной позиции, чем m-ый идеальный громкоговоритель, равен -∞ дБ.

Соответственно, аудиосигнал канала m, соответствующий m-ому идеальному громкоговорителю, воспроизводится посредством громкоговорителя воспроизведения, расположенный на той же позиции, что и идеальный громкоговоритель. То есть, любая составляющая звука канала m не выводится из других громкоговорителей воспроизведения.

Для m-ого идеального громкоговорителя, определенного, как находящегося на позиции громкоговорителя воспроизведения, с другой стороны, коэффициент MixGain (m, n) усиления воспроизведения каждого громкоговорителя воспроизведения по отношению к идеальному громкоговорителю рассчитывается с использованием кривой затухания, которая представляет собой ломанную кривую или кривую функции.

В частности, метаданные, поставляемые в устройство воспроизведения, включают в себя информацию кривой, указывающую, какая из ломаной кривой и кривой функции должна быть использована при вычислении коэффициента усиления, и устройство воспроизведения вычисляет коэффициент усиления воспроизведения, используя кривую типа, указанного информацией кривой, включенной в состав метаданных.

Метаданные также включают в себя индекс кривой, в частности, указывающий, когда одна из кривых, указанных в информации кривой, должна быть использована. Индекс кривой может быть информацией, указывающей на новую кривую, не записанную в устройстве воспроизведения.

В случае, когда индекс кривой является информацией, указывающей на предварительно заданную кривую, устройство воспроизведения вычисляет коэффициент усиления воспроизведения, используя информацию, которая записывается заранее, и предназначена для получения кривой, такой как коэффициенты. В случае, когда индекс кривой представляет собой информацию, указывающую на новую кривую, с другой стороны, устройство воспроизведения считывает информацию для получения новой кривой из метаданных, и вычисляет коэффициент усиления воспроизведения, используя кривую, полученную из этой информации.

Например, ломаная кривая, которая будет использоваться при вычислении коэффициента усиления воспроизведения, выражается в виде числовой последовательности, образованной значениями коэффициентов усиления воспроизведения, в соответствии с соответствующими расстояниями Dist (m, n).

В частности, числовая последовательность, образованная значениями коэффициентов усиления воспроизведения, [0, -1.5, -4.5, -6, -9, -10,5, -12, -13,5, -15, -15, -16,5, -16,5, -18, -18, -18, -19.5, -19.5, -21, -21, -21, -∞, -∞, -∞, -∞, -∞, -∞] (дБ) является информацией для получения коэффициента усиления воспроизведения.

В таком случае, значение в начале числовой последовательности является коэффициентом усиления воспроизведения в момент, когда расстояние Dist (m, n) равно 0 градусов, и значение в конце числовой последовательности является коэффициентом усиления воспроизведения в момент, когда расстояние Dist (m, n) равно 180 градусов. Кроме того, значение в точке kth в числовой последовательности является коэффициентом усиления воспроизведения в момент времени, когда расстояние Dist (m, n) равно значению, которое выражается уравнением (7), как показано ниже.

Между соседними точками в числовой последовательности, коэффициент усиления воспроизведения линейно изменяется в зависимости от расстояния Dist (m, n). Ломаная кривая, полученная посредством такой числовой последовательности, является кривой, представляющая отображение коэффициента MixGain (m, n) усиления воспроизведения и расстояния Dist (m, n).

Например, ломаная кривая, показанная на фиг. 2, получается из вышеописанной числовой последовательности.

На фиг. 2, ось ординат показывает значение коэффициента усиления воспроизведения, и ось абсцисс указывает расстояние между идеальным громкоговорителем и громкоговорителем воспроизведения. Кроме того, ломаная кривая CV11 представляет собой ломаную кривую, и каждый квадрат на ломаной кривой представляет собой числовое значение числовой последовательности, образованной значениями коэффициента усиления воспроизведения.

В этом примере, когда расстояние Dist (m, n) между n-ым громкоговорителем воспроизведения и m-ым идеальным громкоговорителем является DistM1, коэффициент MixGain (m, n) усиления воспроизведения n-ого громкоговорителя воспроизведения равен -3.5 дБ, которое является значением коэффициента DistM1 усиления на ломаной кривой.

Кроме того, коэффициент MixGain (m, n) усиления воспроизведения громкоговорителя воспроизведения на расстоянии Dist (m, n) DistM2 равен -8 дБ, которое является значением коэффициента усиления на DistM2 на ломаной кривой, и коэффициент MixGain (m, n) усиления воспроизведения громкоговорителя воспроизведения на расстоянии Dist (m, n) DistM3 равен -16,5 дБ, которое является значением коэффициента усиления на DistM3 на ломаной кривой.

Между тем, кривая функции, которые будут использоваться при вычислении коэффициента усиления воспроизведения, выражается тремя коэффициентами усиления coef1, coef2 и coef3, и коэффициентом MinGain усиления, значение которого является предварительно заданным нижним пределом.

В этом случае, устройство воспроизведения выполняет расчет по уравнению (9), как показано ниже, используя функцию F (Dist (m, n)), показанную в уравнении (8), выраженной коэффициентами с coef1 по coef3, коэффициентом MinGain усиления и расстоянием Dist (m, n). Таким образом, устройство воспроизведения вычисляет коэффициент MixGain (m, n) усиления воспроизведения каждого громкоговорителя воспроизведения по отношению к m-ому идеальному громкоговорителю.

В уравнении (9), Cut_thre представляет наименьшее значение, которое удовлетворяет уравнению (10), показанному ниже.

Кривая функции, выраженная такой функцией f (Dist (m, n)) и т.п. является кривой, показанной на фиг. 3, например. На фиг. 3, ось ординат показывает значение коэффициента усиления воспроизведения, и ось абсцисс указывает расстояние между идеальным громкоговорителем и громкоговорителем воспроизведения. Кривая CV 21 представляет кривую функции.

В соответствии с кривой функции, показанной на фиг. 3, после того, как значение коэффициента усиления воспроизведения, указанного функцией f (Dist (m, n)), становится меньше, чем значение коэффициента MinGain усиления, который является нижним пределом, то значение коэффициента усиления воспроизведения на каждом расстоянии Dist (m, n) является "-∞". Пунктирная линия на чертеже представляет значения исходной функции f (Dist (m, n)) на соответствующих расстояниях Dist (m, n).

В этом примере, когда расстояние Dist (m, n) между n-ым громкоговорителем воспроизведения и m-ым идеальным громкоговорителем является DistM1, коэффициент MixGain (m, n) усиления воспроизведения n-ого громкоговорителя воспроизведения равен -6 дБ, который является значением коэффициента усиления на DistM1 на кривой функции.

Кроме того, коэффициент MixGain (m, n) усиления воспроизведения громкоговорителя воспроизведения на расстоянии Dist (m, n) DistM2 равен -12 дБ, который является значением коэффициента усиления на DistM2 на кривой функции, и коэффициент MixGain (m, n) усиления воспроизведения громкоговорителя воспроизведения на расстоянии Dist (m, n) DistM3 равен -18 дБ, который является значением коэффициента усиления на DistM3 на кривой функции.

В случае, когда коэффициент MixGain (m, n) усиления воспроизведения рассчитывается по кривой функции, комбинация [coef1, coef2, coef3] коэффициентов с coef1 по coef3 может представлять собой [8, -12, 6], [1, -3, 3] или [2, -5.3, 4.2], например.

Посредством выполнения упомянутых процессов получают коэффициенты MixGain (m, n) усиления воспроизведения N громкоговорителей воспроизведения для каждого из М идеальных громкоговорителей. Значения коэффициентов усиления воспроизведения этих громкоговорителей воспроизведения больше, когда расстояние Dist (m, n) до идеального громкоговорителя меньше. То же самое относится и к объему звуков из этих громкоговорителей воспроизведения. Где М>N, коэффициенты MixGain (m, n) усиления воспроизведения являются микшированными коэффициентами усиления.

Процесс STE3

Дополнительно, в процессе STE3, (М×N) коэффициенты MixGain (m, n) усиления воспроизведения, полученные в процессе STE2, корректируются в соответствии с позицией n-ого громкоговорителя воспроизведения.

Например, если звук от источника звука, расположенного перед пользователем, поступает со спины пользователя, пользователь не сможет воспринимать естественный звук. Если звук от источника звука, расположенного за спиной пользователем, поступает по фронту расположения пользователя, то пользователь не будет воспринимать этот звук как неестественный.

Таким образом, коэффициенты усиления воспроизведения соответствующих громкоговорителей воспроизведения корректируются в соответствии с позициями N громкоговорителей воспроизведения, расположенных спереди или сзади пользователя, так что выходные звуки не будут вызывать неестественного звучания в зависимости от позиций громкоговорителей воспроизведения. То есть, в случае, когда аудиосигнал идеального громкоговорителя воспроизводится двумя громкоговорителями воспроизведения, которые находятся на одинаковом расстоянии Dist (m, n) от идеального громкоговорителя, и расположены перед пользователем и за его спиной, выполняется коррекция так, чтобы коэффициент усиления воспроизведения громкоговорителя воспроизведения, который находится за спиной пользователя, становится меньше, чем коэффициент усиления воспроизведения громкоговорителя воспроизведения, находящегося перед пользователем.

В частности, устройство воспроизведения сначала получает информацию, указывающую, следует ли скорректировать коэффициенты воспроизведения в соответствии с позициями громкоговорителей воспроизведения, из метаданных. Если полученная информация указывает, что нет необходимости в корректировке коэффициентов воспроизведения, процесс STE3 не осуществляется. То есть, после процесса STE2 процесс STE3 пропускается и выполняется процесс STE4.

Если информация, полученная из метаданных, указывает на необходимость корректировки коэффициентов воспроизведения, с другой стороны, устройство воспроизведения выполняет те же самые вычисления, что и уравнение (1), и определяет расстояние Dist (n, С) между пространственной исходной точкой С и N громкоговорителями воспроизведения.

Здесь, пространственная исходная точка С является опорной позицией в пространстве, в котором размещены громкоговорителя воспроизведения, и позиция пространственной исходной точки С выражается горизонтальным углом θ 0, вертикальным углом γ 0 и расстоянием г, равным r_u, например. В этом случае, пространственная исходная точка С находится на единичной окружности или на сфере РН 11, показанной на фиг. 1, и находится впереди пользователя U11. Позиция такой пространственной исходной точки С является позицией идеального центрального громкоговорителя.

После определения, расстояний Dist (n, С) от пространственной исходной точки С до N громкоговорителей воспроизведения, определяется поправочный коэффициент spkr_pos_correction_coeffcient (n) каждого из N громкоговорителей воспроизведения расчетным путем в соответствии с уравнением (11), показанного ниже.

В уравнении (11), Max_spkr_pos_correction_coeffcient представляет поправочный коэффициент на момент, когда расстояние Dist (n, С) является максимальным (180 градусов).

Дополнительно, коэффициент MixGain (m, n) усиления воспроизведения n-ого громкоговорителя воспроизведения по отношению к m-ому идеальному громкоговорителю умножается на полученный поправочный коэффициент spkr_pos_correction_coeffcient (n), так что получается поправочный коэффициент MixGain_pos_corr (m, n) усиления воспроизведения. То есть, выполняется вычисление в соответствии с уравнением (12), показанном ниже.

В уравнении (12), MaxMixGain (n) представляет наибольшее значение M коэффициентов усиления воспроизведения n-ого громкоговорителя воспроизведения или коэффициенты MixGain (m, n) усиления воспроизведения, имеющие то же значение, что и n. В уравнении (12), условие, включающее в себя MaxMixGain (n), является условием обратной коррекции для предотвращения избыточной коррекции, осуществляемой посредством spkr_pos_correction_coeffcient (n).

При выполнении вышеописанного процесса, получают (М×N) коэффициенты MixGain_pos_corr (m, n) усиления воспроизведения, которые были надлежащим образом откорректированы в соответствии с позициями громкоговорителей воспроизведения.

В случае, когда коррекция коэффициента усиления воспроизведения в соответствии с позициями громкоговорителей воспроизведения не выполняется, коэффициенты MixGain (m, n) усиления воспроизведения, используются в качестве коэффициентов MixGain_pos_corr (m, n) усиления воспроизведения.

Процесс STE4

В процессе STE4, который выполняется после процесса STE3, коэффициенты усиления воспроизведения корректируются так, чтобы аудиосигналы воспроизводились, по меньшей мере, одним громкоговорителем воспроизведения с заданным нижним пределом коэффициента усиления воспроизведения. Здесь, аудиосигналы являются идеальным громкоговорителем, с которым все громкоговорителя воспроизведения имеют небольшие значения коэффициента усиления воспроизведения.

В частности, определяется наибольшее значение MaxMixGain_i (m) коэффициентов усиления воспроизведения каждого идеального громкоговорителя, полученное в процессе STE3, или N коэффициентов усиления воспроизведения MixGain_pos_corr (m, n), имеющие то же значение, что и т, и наибольшее значение MaxMixGain_i (m) сравнивается с нижним пределом MixGain_MinThre.

Если наибольшее значение MaxMixGain_i (m) по отношению к заранее заданному m-ому идеальному громкоговорителю, меньше, чем нижний предел MixGain_MinThre, значение MinGain_correctioni (m) коррекции добавляется к N коэффициентам усиления воспроизведения MixGain_pos_corr (m, n) по отношению к m-ому идеальному громкоговорителю. Здесь, значение MinGain_correctioni (m) коррекции представляет собой разницу между максимальным значением MaxMixGain_i (m) и нижним пределом MixGain_MinThre, как показано в уравнении (13), показанном ниже.

Благодаря этому коррекции, аудиосигнал канала m воспроизводится, по меньшей мере, одним громкоговорителем воспроизведения с заданным наименьшим коэффициентом усиления воспроизведения, и воспроизведение звука из конкретного канала может быть обеспечено.

Процесс STE5

В процессе STE5, коэффициенты MixGain_pos_corr (m, n) усиления корректируются так, что общая выходная мощность звука аппроксимирует общую входную мощность звука.

Во-первых, устройство воспроизведения считывает ожидаемые значения SPR_i (m) относительно звуковых давлений между соответствующими каналами идеальных громкоговорителей из метаданных, и допускает абсолютное звуковое давление идеального громкоговорителя, имеющий наивысшее значение звукового давления, быть равным 0 DBFs. Устройство воспроизведения вычисляет значения звукового давления звуков аудиосигналов соответствующих каналов из ожидаемого значения SPR_i (m) соответствующих идеальных громкоговорителей, и определяет значение pow_i мощности общего звука входных аудиосигналов.

Здесь, значение pow_i мощности представляет собой мощность общего звука, выводимого из идеальных громкоговорителей, в результате воспроизведения аудиосигналов М каналов (общий звук, выводимый из идеальных громкоговорителей, будет в дальнейшем также упоминается, как входной звук). Кроме того, звук, который выводится через громкоговорители воспроизведения в результате воспроизведения аудиосигналов N каналов, будут далее также упоминается, как выходной звук.

Затем устройство воспроизведения умножает коэффициенты MixGain_pos_corr (m, n) усиления воспроизведения, полученный в процессе STE4, на ожидаемые значения SPR_i (m), чтобы определить ожидаемые значения SPR_o (n) звуковых давлений выходных звуков из соответствующих громкоговорителей воспроизведения. Устройство воспроизведения затем определяет значение pow_o мощности общего выходного звука из ожидаемых значений SPR_o (n)

Устройство воспроизведения затем умножает все коэффициенты MixGain_pos_corr (m, n) усиления воспроизведения, полученные в процессе STE4, на отношение значения мощности между входным звуком и выходным звуком (pow_o/pow_i), чтобы скорректировать звуковое давление общего выходного звука. Коэффициенты усиления воспроизведения, полученные таким образом, являются конечными коэффициентами воспроизведения громкоговорителей воспроизведения по отношению к каждому идеальному громкоговорителю.

В этом примере, абсолютное давление звука идеального громкоговорителя, имеющего наивысшее значение звукового давления, считается равным 0 дБ, и определяется отношение значения мощности между значением входного звука и выходного звука (pow_o/pow_i). Определенное отношение значения мощности является таким же, как отношение значения мощности между входным звуком и выводным звуком (pow_o/pow_i), определенное с использованием фактического абсолютного звукового давления. Даже в случае, когда абсолютное звуковое давление фактического входного звука неизвестно, если абсолютное давление звука входного звука рассматривается, как описанное вышеописанным способом, отношение значения мощности между входным звуком и выводным звуком (pow_o/pow_i) может быть определено. Допустимое значение звукового давления может быть не равно 0 дБ, но может быть другим значением, чтобы получить такое же отношение значения мощности, как описано выше.

Громкоговорителя для LFE

Далее будет приведено описание процесса воспроизведения аудиосигналов каналов для LFE.

Например, число идеальных громкоговорителей для LFE равно нулю, одному или двум. Точно так же, количество громкоговорителей воспроизведения для LFE равно нулю, одному или двум.

В случае, когда количество идеальных громкоговорителей для LFE или количество громкоговорителей воспроизведения для LFE равен нулю, аудиосигнал любого канала для LFE не может быть воспроизведен, и коэффициент усиления аудиосигнала равен -∞.

В случае, когда количество идеальных громкоговорителей для LFE и количество громкоговорителей воспроизведения для LFE равно одному или двум, а с другой стороны, устройство воспроизведения генерирует аудиосигнал каждого канала для LFE с использованием коэффициентов усиления воспроизведения, показанных на фиг. 4, например.

То есть в случае, когда как число идеальных громкоговорителей для LFE и количество громкоговорителей воспроизведения для LFE равно одному или двум, аудиосигнал (ы) идеального громкоговорителя (ей) для LFE воспроизводятся как аудиосигнал (ы) громкоговорителя (ей) воспроизведения для LFE.

В случае, когда есть один идеальный громкоговоритель для LFE и два громкоговорителя воспроизведения для LFE, или где, есть два идеальных громкоговорителя для LFE и один громкоговоритель воспроизведения для LFE, аудиосигналы соответствующих каналов равномерно распределены.

То есть в случае, когда используются два громкоговорителя воспроизведения для LFE для одного идеального громкоговорителя для LFE, аудиосигнал идеального громкоговорителя подвергается регулировке коэффициента усиления с учетом того же коэффициента усиления воспроизведения, и воспроизводится с помощью двух громкоговорителей воспроизведения. В случае, когда используется один громкоговоритель воспроизведения для LFE для двух идеальных громкоговорителей для LFE, аудиосигналы идеальных громкоговорителей объединены в один аудиосигнал с тем же коэффициентом усиления воспроизведения, и аудиосигнал воспроизводится посредством громкоговорителя воспроизведения.

Пример структура устройство воспроизведения

Далее будет описан конкретный вариант осуществления устройства воспроизведения.

Устройство воспроизведения имеет структуру, как показано на фиг. 5, например.

Устройство 11 воспроизведения, показанное на фиг. 5, принимает метаданные и аудиосигнал с декодера или тому подобное (не показано), выполняет регулировку коэффициента усиления аудиосигнала на основе метаданных, и поставляет результирующий аудиосигнал в громкоговорители с 12-1 по 12-N.

Фиг. 5 показывает только функциональные блоки устройства 11 воспроизведения для воспроизведения аудиосигналов каналов не для LFE, и не показывает функциональные блоки для воспроизведения аудиосигналов каналов для LFE.

На фиг. 5, аудиосигналы М каналов поставляются на соответствующие М идеальные громкоговорители не для LFE. Аудиосигналы каналов М преобразуются в аудиосигналы N каналов, и затем выводятся. Кроме того, громкоговорители с 12-1 по 12-N соответствуют вышеописанным громкоговорителям воспроизведения не для LFE.

Далее, когда нет особой необходимости различать громкоговорители с 12-1 по 12-N друг от друга, громкоговорители с 12-1 по 12-N также будет называться просто громкоговорители 12. Соответствующие громкоговорители 12 также являются громкоговорителями, соответствующие вышеописанным громкоговорителям RSP11 воспроизведения, и поэтому громкоговорители 12 будут также именоваться, как громкоговорители 12 воспроизведения.

Устройство 11 воспроизведения, показанное на фиг. 5, включает в себя блок 21 вычисления расстояния, блок 22 вычисления коэффициента усиления воспроизведения, корректирующий блок 23, корректирующий блок 24 нижнего предела, корректирующий блок 25 общего коэффициента усиления и блок 26 регулировки коэффициента усиления. Блок 26 регулировки коэффициента усиления включает в себя усилитель 31, усилитель 32 и усилитель 33.

Информация о местоположении соответствующих идеальных громкоговорителей не для LFE и информация о местоположении соответствующих громкоговорителей 12 воспроизведения, которая включена в состав метаданных, поставляется в блок 21 вычисления расстояния. Блок 21 вычисления расстояния вычисляет расстояние Dist (m, n) на основании информации о местоположении идеального громкоговорителя и информации о местоположении громкоговорителей 12 воспроизведения, и поставляет расстояние Dist (m, n) в блок 22 вычисления коэффициента усиления воспроизведения.

Здесь, информация о местоположении каждого громкоговорителя является информацией, сформированной горизонтальным углом θ, вертикальным углом γ и расстоянием г.

Блок 21 вычисления расстояния вычисляет значения SoundPressureCorrectioni_mкоррекции и периоды времени Delay_im задержки на стороне идеального громкоговорителя, и поставляет значения коррекции и периоды времени задержки в усилитель 31, по мере необходимости. Блок 21 вычисления расстояния также вычисляет значения SoundPressureCorrection_on коррекции и времени Delay_on задержки на стороне громкоговорителей 12 воспроизведения, и поставляет значения коррекции и времени задержки в усилитель 33. То есть, процесс STE1 осуществляется в блоке 21 вычисления расстояния.

Информация кривой и индекс кривой, включенные в состав метаданных, поставляются в блок 22 вычисления коэффициента усиления воспроизведения. Блок 22 вычисления коэффициента усиления воспроизведения вычисляет коэффициенты MixGain (m, n) усиления воспроизведения, используя информацию кривой и индекс кривой, а также расстояние, поставляемое из блока 21 вычисления расстояния, и поставляет коэффициенты MixGain (m, n) усиления воспроизведения в корректирующий блок 23. То есть, процесс STE2 осуществляется в блоке 22 вычисления коэффициента усиления воспроизведения.

Информация о местоположении громкоговорителей 12 воспроизведения, которая включена в состав метаданных, и указывает, есть ли необходимость в коррекции коэффициентов усиления воспроизведения в соответствии с позициями громкоговорителей 12 воспроизведения, коэффициент Max_spkr_pos_correction_coeffcient коррекции поставляются в корректирующий блок 23.

На основании предоставленной информации, корректирующий блок 23 корректирует коэффициенты усиления воспроизведения, поставляемые из блока 22 вычисления коэффициента усиления воспроизведения в соответствии с позициями громкоговорителей 12 воспроизведения, и подает результирующие коэффициенты MixGain_pos_corr (m, n) усиления воспроизведения в корректирующий блок 24 нижнего предела. То есть процесс STE3 выполняется в корректирующем блоке 23.

Нижний предел MixGain_MinThre коэффициента усиления воспроизведения, включенный в состав метаданных, подается в корректирующий блок 24 нижнего предела. На основании нижнего предела MixGain_MinThre корректирующий блок 24 нижнего предела корректирует коэффициенты усиления воспроизведения, подаваемые из корректирующего блока 23, и поставляет откорректированные коэффициенты усиления воспроизведения в корректирующий блок 25 общего коэффициента усиления, т.е. процесс STE4 выполняется в корректирующем блоке 24 нижнего предела.

Ожидаемые значения SPR_i (m), которые включены в состав метаданных, и являются значениями относительных звуковых давлений между соответствующими каналами идеальных громкоговорителей, поставляются в корректирующий блок 25 общего коэффициента усиления. На основании ожидаемых значений SPR_i (m), корректирующий блок 25 общего коэффициента усиления корректирует коэффициенты усиления воспроизведения, подаваемые из корректирующего блока 24 нижнего предела, и поставляет результирующие конечные коэффициенты усиления воспроизведения в усилитель 32. Процесс STE5 выполняется в корректирующем блоке 25 общего коэффициента усиления.

Блок 26 регулировки коэффициента усиления генерирует аудиосигналы N каналов, выполняя регулировку коэффициентов усиления аудиосигналов М идеальных громкоговорителей, поставляемые из декодера (не показано), и поставляет аудиосигналы соответствующих каналов на громкоговорители 12 воспроизведения для воспроизведения. Процесс STE6 выполняется в блоке 26 регулировки коэффициента усиления.

То есть на основании значений коррекции и времени задержки, поступающих из блока 21 вычисления расстояния, усилитель 31 выполняет коррекцию коэффициента усиления и процесс задержки на поставленных аудиосигналах М каналов при необходимости, и поставляет результирующие аудиосигналы в усилитель 32.

Усилитель 32 умножает аудиосигналы М каналов, поставленные из усилителя 31, на коэффициенты усиления воспроизведения, поставленные из корректирующего блока 25 общего коэффициента усиления. Усилитель 32 также генерирует аудиосигналы N каналов, добавлением аудиосигналов соответствующих идеальных громкоговорителей, умноженных на коэффициенты усиления воспроизведения, и поставляет сгенерированные аудиосигналы в усилитель 33.

На основании значений коррекции и времени задержки, поставленных из блока 21 вычисления расстояния, усилитель 33 выполняет коррекцию коэффициента усиления и процесс задержки аудиосигналов каналов N, поступающих из усилителя 32, при необходимости, и поставляет результирующие аудиосигналы в громкоговорители 12 воспроизведения.

Пояснение процесса микширования с понижением

Далее будет приведено описание процесса функционирования устройства 11 воспроизведения.

Когда аудиосигналы и метаданные соответствующих идеальных громкоговорителей поставляются в устройство 11 воспроизведения, устройство 11 воспроизведения генерирует аудиосигналы, которые поставляются в громкоговорители воспроизведения, по отношению к аудиосигналам для LFE и аудиосигналам не для LFE, и затем выводит сгенерированные аудиосигналы.

Ссылаясь на блок-схему алгоритма на фиг. 6, приводится описание процесса понижающего микширования, который выполняться устройством 11 воспроизведения, аудиосигналов не для LFE.

На этапе S11, блок 21 вычисления расстояния определяет расстояния Dist (m, n) между идеальными громкоговорителями и громкоговорителями 12 воспроизведения на основании информации о местоположении идеальных громкоговорителей не для LFE и информации о местоположении громкоговорителей 12 воспроизведения не для LFE, которая включена в состав метаданных, и поставляет информацию о расстоянии Dist (m, n) в блок 22 вычисления коэффициента усиления воспроизведения. В частности, выполняется вычисление по уравнению (1) для каждой из комбинаций идеальных громкоговорителей и громкоговорителей 12 воспроизведения, чтобы определить (М×N) расстояния Dist (m, n).

На этапе S12, блок 21 вычисления расстояния определяет значения коррекции и времени задержки на стороне идеального громкоговорителя и стороне громкоговорителей 12 воспроизведения, по мере необходимости.

В частности, для идеальных громкоговорителей, каждый из которых имеет расстояние r_im не равное r_u, блок 21 вычисления расстояния вычисляет корректирующие значения SoundPressureCorrection_im и время задержки Delay_im путем выполнения вычисления в соответствии с уравнением (2) и уравнением (3) на основании расстояния r_im, выступающей в качестве информации о местоположении идеальных громкоговорителей, и поставляет значения коррекции и время задержки в усилитель 31.

В случае, когда громкоговорители воспроизведения, каждый из которых имеет расстояние r_on не равное r_u, блок 21 вычисления расстояния также вычисляет значения SoundPressureCorrection_on коррекции и время задержки Delay_on путем выполнения вычисления в соответствии с уравнением (4) и уравнения (5) на основании расстояния r_on, выступающее в качестве информации местоположения громкоговорителей 12 воспроизведения, и поставляет значения коррекции и время задержки в усилитель 33.

На этапе S13, блок 22 вычисления коэффициента усиления воспроизведения определяет коэффициенты усиления воспроизведения соответствующих громкоговорителей 12 воспроизведения для каждого идеального громкоговорителя на основании расстояния Dist (m, n), поставляемого из блока 21 вычисления расстояния.

Например, для идеального громкоговорителя, имеющего громкоговоритель 12 воспроизведения на расстоянии Dist (m, n) равным "0" между идеальным громкоговорителей и громкоговорителем 12 воспроизведения, блок 22 вычисления коэффициента усиления воспроизведения выполняет вычисление по уравнению (6), чтобы рассчитать коэффициенты MixGain (m, n) усиления воспроизведения соответствующих громкоговорителей 12 воспроизведения по отношению к идеальному громкоговорителю.

Для идеального громкоговорителя, не имеющего громкоговорителя 12 воспроизведения на расстоянии Dist (m, n) равным "0", блок 22 вычисления коэффициента усиления воспроизведения получает кривую, указанную информацией кривой, включенной в состав метаданных, которая является ломанной кривой или кривой функции. При этом, блок 22 вычисления коэффициента усиления воспроизведения ссылается к индексу кривой, и считывает ломаную кривую или кривую функции из метаданных, по мере необходимости.

Получив ломаную кривую или кривую функции, блок 22 вычисления коэффициента усиления воспроизведения определяет значения коэффициентов усиления, соответствующие расстоянию Dist (m, n) на основании полученной кривой, и устанавливает определенные значения коэффициентов усиления как коэффициенты MixGain (m, n) усиления воспроизведения громкоговорителя 12 воспроизведения по отношению к идеальному громкоговорителю. В этот момент, выполняется расчет по уравнению (7) и уравнению (9), по мере необходимости.

Получив коэффициенты MixGain (m, n) усиления воспроизведения соответствующих громкоговорителей 12 воспроизведения для каждого идеального громкоговорителя, блок 22 вычисления коэффициента усиления воспроизведения поставляет коэффициенты MixGain (m, n) усиления воспроизведения в корректирующий блок 23.

На этапе S14, на основании информации, которая включена в состав метаданных, и указывает, необходимо ли скорректировать коэффициенты усиления воспроизведения, корректирующий блок 23 корректирует коэффициенты усиления воспроизведения, поставленные из блока 22 вычисления коэффициента усиления воспроизведения в соответствии с позициями громкоговорителей 12 воспроизведения, в случае необходимости, и поставляет скорректированные коэффициенты усиления воспроизведения в корректирующий блок 24 нижнего предела.

В частности, корректирующий блок 23 вычисляет коэффициенты MixGain_pos_corr (m, n) усиления воспроизведения путем выполнения вычисления в соответствии с уравнением (11) и уравнением (12), используя информацию о местоположении относительно соответствующих громкоговорителей 12 воспроизведения и поправочного коэффициента Max_spkr_pos_correction_coeffcient, включенного в состав метаданных.

На этапе S15, на основании нижнего предела MixGainMinThre, включенного в состав метаданных, корректирующий блок 24 нижнего предела корректирует коэффициенты усиления воспроизведения, подаваемые из корректирующего блока 23, при необходимости, и поставляет откорректированные коэффициенты усиления воспроизведения в корректирующий блок 25 общего коэффициента усиления. В частности, выполняется вычисление по уравнению (13), по мере необходимости, и значение MinGain_correctioni (m) коррекции добавляется к коэффициентам MixGain_pos_corr (m, n) усиления воспроизведения.

На этапе S16, корректирующий блок 25 общего коэффициента усиления выполняет коррекцию звукового давления общего выходного звука.

То есть, корректирующий блок 25 общего коэффициента усиления вычисляет отношение значения мощности между входным звуком и выходным звуком (pow_o/pow_i) на основании ожидаемых значений SPR_i (m), включенных в состав метаданных, и коэффициентов MixGain_pos_corr (m, n) усиления воспроизведения, поставленных из корректирующего блока 24 нижнего предела. Корректирующий блок 25 общего коэффициента усиления затем умножает коэффициенты MixGain_pos_corr (m, n) усиления воспроизведения на отношение значения мощности (значение pow_o/pow_i), чтобы получить конечные коэффициенты усиления воспроизведения, и поставляет конечные коэффициенты усиления воспроизведения в усилитель 32.

На этапе S17, усилитель 31 выполняет регулировку коэффициента усиления аудиосигнала на основании значений коррекции и значений задержки стороны идеального громкоговорителя, поставляемые из блока 21 вычисления расстояния.

В частности, как для аудиосигнала канала т, для которого были поставлены значение коррекции и значение задержки, усилитель 31 умножает аудиосигнал на значение SoundPressure_Correctionim коррекции, задерживает результирующий аудиосигнал посредством времени задержки Delays во временном направлении, и поставляет задержанный аудиосигнал в усилитель 32.

На этапе S18, усилитель 32 генерирует аудиосигналы соответствующих громкоговорителей 12 воспроизведения на основании коэффициентов усиления воспроизведения, поставленных из корректирующего блока 25 общего коэффициента усиления, и аудиосигналы, поставленные из усилителя 31, и подает сгенерированные аудиосигналы в усилитель 33.

В частности, один из N каналов, соответствующий громкоговорителям 12 воспроизведения, будучи каналом nc адресата, усилитель 32 умножает коэффициенты усиления воспроизведения соответствующих идеальных громкоговорителей по отношению к каналу nc адресата на аудиосигналы соответствующих идеальных громкоговорителей. Усилитель 32 затем устанавливает один аудиосигнал, полученный путем объединения аудиосигналов соответствующих идеальных громкоговорителей, умноженных на коэффициенты усиления воспроизведения или М аудиосигналы, как аудиосигнал каналом nc адресата. Выполняется тот же самый процесс, как описано выше, на каждом из каналов N, так что аудиосигналы М соответствующих идеальных громкоговорителей преобразовываются в аудиосигналы N громкоговорителей 12 воспроизведения.

На этапе S19, усилитель 33 выполняет регулировку коэффициента усиления аудиосигналов, поступающих от усилителя 32, на основании значений коррекции и значений задержки на стороне громкоговорителей 12 воспроизведения, поставляемые из блока 21 вычисления расстояния.

В частности, как для аудиосигнала канала n, для которого были поставлены значение коррекции и значение задержки, усилитель 33 умножает аудиосигнал на значение SoundPressure_correctionon коррекции, задерживает результирующий аудиосигнал на время Delay_on задержки во временном направлении, и поставляет задержанный аудиосигнал в громкоговорители 12 воспроизведения.

После того, как аудиосигналы соответствующих каналов выводятся на громкоговорители 12 воспроизведения, процесс понижающего микширования заканчивается. Кроме того, громкоговорители 12 воспроизведения воспроизводят звуки на основании аудиосигналов, поставленные из устройства 11 воспроизведения.

В приведенном выше способе, устройство 11 воспроизведения выполняет регулировку коэффициента усиления (коррекцию коэффициента усиления) аудиосигналов в соответствии с расстояниями между позициями идеальных громкоговорителей и позициями реальных громкоговорителей 12 воспроизведения. Соответственно, даже в случае, когда есть различия в позициях между идеальным громкоговорителем и громкоговорителями 12 воспроизведения, уровень снижения качества выходных звуков и ухудшение условий для определения звукового образа может быть уменьшен, и может быть осуществлено более естественное воспроизведение звука.

С помощью приведенного выше процесса, входной аудиосигнал (ы) одного или более каналов может быть воспроизведен одним или несколькими громкоговорителями воспроизведения, расположенные на одной или более желательной позиции. Даже в случае, когда входные аудиосигналы соответствующих каналов являются аудиосигналами соответствующих объектов, служащие в качестве источников звука, может быть выполнено воспроизведение звука в правильной позиции звукового образа посредством применения того же процесса понижающего, микширования, как описано выше.

Кодер и декодер

Далее будет приведено описание кодера, который кодирует метаданные, поставляемые в устройство 11 воспроизведения, и декодер, который декодирует кодированные метаданные.

Как показано на фиг. 7, например, в аудиосистеме, к которой применяется настоящее изобретение, метаданные поставляются из кодера 61 в декодер 62, и метаданные дополнительно поставляются из декодера 62 в устройство 11 воспроизведения.

Кодер 61 получает информацию, необходимую для получения метаданных извне и аудиосигналов М идеальных громкоговорителей, и генерирует поток битов, сформированный метаданными и аудиосигналами, которые были закодированы.

Кодер 61 включает в себя блок 71 генерации метаданных, блок 72 кодирования аудиосигнала и выходной блок 73.

Блок 71 генерирования метаданных получает необходимую информацию от внешней стороны, и генерирует кодированные метаданные путем кодирования полученной информации, по мере необходимости.

Метаданные включают в себя информацию о местоположении соответствующих идеальных громкоговорителей, количество идеальных громкоговорителей для LFE (количество каналов) среди идеальных громкоговорителей, информацию кривой и индекс кривой, например. Метаданные также включают в себя информацию, указывающую на необходимость коррекции коэффициентов воспроизведения в соответствии с позициями громкоговорителей 12 воспроизведения, поправочный коэффициент Max_spkr_pos_correction_coeffcient в зависимости от позиций громкоговорителей 12 воспроизведения, нижний предел MixGain_MinThre коэффициента усиления и ожидаемые значения SPR_i (m) относительных звуковых давлений между каналами.

Блок 72 кодирования аудиосигнала кодирует аудиосигналы, поставленные извне. Выходной блок 73 генерирует поток битов, содержащий кодированные метаданные и закодированные аудиосигналы, и выводит поток битов на декодер 62.

Декодер 62 включает в себя блок 81 извлечения, блок 82 декодирования аудиосигнала и выходной блок 83. Декодер 62 принимает битовый поток, передаваемый из кодера 61, и блок 81 извлечения извлекает метаданные и аудиосигналы из принятого битового потока. В этот момент, блок 81 извлечения декодирует метаданные, по мере необходимости.

Блок 82 декодирования аудиосигнала декодирует аудиосигналы, извлеченные в блоке 81 извлечения. Выходной блок 83 поставляет извлеченные метаданные посредством блока 81 извлечения, и аудиосигналы, декодированные блоком 82 декодирования аудиосигнала, в устройство 11 воспроизведения.

Часть метаданных, написанная в битовом потоке, выводиться из кодера 61 в декодер 62, как показано на фиг. 8, например. То есть, на фиг. 8 показан синтаксис части метаданных.

В примере, показанном на фиг. 8, в начале заголовка, "down mix coef exist flag" помещен в качестве информации, указывающей на включение в состав метаданных необходимой информации для понижающего микширования.

Кроме того, в метаданных, "down mix coef mode" помещен в качестве информации кривой и, в соответствии с информацией кривой, "polyline curve idx" или "function curve idx" помещены как индекс кривой.

"polyline curve idx" указывает на ломаную кривую и, если значение является двоичным числом "111", то ломаная кривая является новой ломаной кривой. В этом случае, "polyline curve coeffcient [J]" записывается как информация для получения новой ломанной кривой.

Информация для получения новой ломаной кривой является информацией для идентификации соответствующих квадратов на ломаной CV11, показанной на фиг. 2 (эти квадраты будут далее называться как точки описания), например, или для идентификации соответствующих значений, составляющих числовую последовательность.

В частности, ось коэффициента усиления воспроизведения (ось ординат) делится на шестнадцать, так что образуются шестнадцать разделенных линий. Соответствующие точки описания последовательно размещены на соответствующих линях разделения вдоль оси ординат.

В метаданных, точки описания представлены "0"s, и информация, указывающая на которых линиях разделения размещены соответствующие точки описания, представлена посредством "1".

На фиг. 2, точки описания последовательно записываются слева. Во-первых, информация, указывающая на линию разделения, подсчитывается снизу первая точка описания слева, обозначена номером "1", и затем, записываются "0"s, представляющие точки описания. Здесь, первая точка описания слева находится на самой верхней линии разделения, записывается только "0", представляющий точку описания

После этого информация, указывающая, что точка описания расположена на Q линиях разделения ниже линии разделения, на которой находится последняя линия описания, написана как Q "1"s, и затем "О", представляющей собой точку описания.

Например, третья точка описания слева расположена на двух линиях разделения ниже второй точки описания. Таким образом, две "1"s записаны, и затем один "0". Кроме того, десятая точка описания слева находится на той же линии разделения, что и девятая линия описания, или находится ноль, разделенный линиями ниже девятой линии описания. Таким образом, никаких "1"s не записаны, и только один "0" написан.

Описание проводится посредством описанного выше способа. Если все точки описания были написаны, один "1" записаны для индикации, что информация о ломаной кривой была записана. Если число точек описание велико и точки описания не могут быть записаны даже с помощью 64 "1"s и "0"s в общей сложности, описание проводится до тех пор, пока количество "1"s с и "0"s достигает 64 и описание затем завершается.

Таким образом, в случае, когда информация для получения ломаной кривой считывается из метаданных, информация для последовательного получения соответствующих точек описания считывается до тех пор, пока 16 "1"s или 64 "1"s и "0"s в общей сложности (сумма количества "1" и количества "0" равна 64) не будут считаны. Таким образом, генерируется ломаная кривая.

К "function curve idx" указывает на кривую функции и, если ее значение является двоичным числом "111", кривая функции является новой кривой функции. В этом случае, "function_curve_coeffcient [i]" записывается как коэффициент новой кривой функции.

Между тем, "minimun_gain_threshold_idx", записанный в метаданных, является индексом, указывающий на нижний предел MixGain_MinThre коэффициента усиления. Кроме того, "gain_correction_coeffcient", записанный в метаданных, является поправочным коэффициентом Max_spkr_pos_correction_coeffcient, который требуется для коррекции коэффициентов усиления воспроизведения в соответствии с позициями громкоговорителей 12 воспроизведения. Если значение Max_spkr_pos_correction_coeffcient равно "1", то нет необходимости в корректировке коэффициентов усиления воспроизведения в соответствии с позициями громкоговорителей 12 воспроизведения.

Дополнительно, в метаданных "sound_level_exist_flag" записывается как информация, указывающая на факт того, что ожидаемые значения SPR_i (m) относительных звуковых давлений между каналами, записываются в метаданных, и "channel sound level [i]" записан в соответствии со значением "sound level exist flag". Здесь, "channel sound level [i]" представляет собой ожидаемое значение SPR_i (m).

Пояснение процесса кодирования

Далее будет приведено дополнительное описание процесса функционирования кодера 61 и декодера 62.

Обратимся сначала к блок-схеме алгоритма на фиг. 9, где описан процесс кодирования, выполняемый кодером 61.

На этапе S41, блок 71 генерирования метаданных получает необходимую информацию извне, и генерирует кодированные метаданные путем кодирования полученной информации. Например, блок 71 генерирования метаданных генерирует метаданные, соответствующие синтаксису, показанному на фиг. 8.

На этапе S42, блок 72 кодирования аудиосигнала кодирует аудиосигналы, поставленные извне.

На этапе S43 выходной блок 73 генерирует поток битов, содержащий кодированные метаданные и закодированные аудиосигналы, и выводит поток битов в декодер 62. Затем битовый поток выводится, и процесс кодирования заканчивается.

В приведенном выше способе, кодер 61 генерирует и выводит метаданные, включающие в себя информацию о местоположении идеальных громкоговорителей, информацию кривой и тому подобное. Так как информация, образованная информацией о местоположении идеальных громкоговорителей, информацией кривой и т.п., генерируется как метаданные, устройство 11 воспроизведения может выполнять соответствующую коррекцию коэффициента усиления, например, коррекцию коэффициента усиления в соответствии с расстояниями между позициями идеальных громкоговорителей и позициями реальных громкоговорителей 12 воспроизведения. В результате, может быть осуществлено более реалистичное воспроизведение звука.

Описание процесса декодирования

Обратимся теперь к блок-схеме алгоритма на фиг. 10, где описан процесс декодирования, выполняемый декодером 62.

На этапе S71, декодер 62 принимает поток битов, переданный из кодера 61, и блок 81 извлечения извлекает метаданные и аудиосигналы из принятого битового потока. Блок 81 извлечения также декодирует метаданные.

На этапе S72, блок 82 декодирования аудиосигнала декодирует аудиосигналы, извлеченные блоком 81 извлечения.

На этапе S73, выходной блок 83 выводит декодированные метаданные и декодированные аудиосигналы в устройство 11 воспроизведения, и затем процесс декодирования завершается.

Посредством выполнения приведенного выше способа, декодер 62 декодирует метаданные и аудиосигналы, и выводит метаданные, включающие в себя информацию о местоположении идеальных громкоговорителей, информацию кривой и тому подобное и аудиосигналы, в устройство 11 воспроизведения. Так как информация сформирована информацией о местоположении идеальных громкоговорителей, информацией кривой и т.п. и выводится как метаданные, устройство 11 воспроизведения может выполнять соответствующую коррекцию коэффициента усиления, например, коррекцию коэффициента усиления в соответствии с расстояниями между позициями идеальных громкоговорителей и позициями реальных громкоговорителей 12 воспроизведения. В результате, может быть осуществлено более реалистичное воспроизведение звука.

Описанная выше последовательность операций процессов может быть выполнена с помощью аппаратных средств или может быть выполнена с помощью программного обеспечения. Когда последовательность операций процессов должна быть выполнена с помощью программного обеспечения, программа, которая формирует программное обеспечение, устанавливается в компьютер. Здесь, компьютер может быть компьютером специального назначения, или может быть компьютером общего назначения, который может выполнять как различные виды функций, так и различные виды программ, которые установлены на нем.

Фиг. 11 представляет собой блок-схему алгоритма, показывающую пример структуры аппаратных средств компьютера, который выполняет вышеописанную последовательность операций процессов в соответствии с программой.

В компьютере, CPU 501, ROM 502 и RAM 503 соединены друг с другом с помощью шины 504.

Интерфейс 505 ввода/вывода дополнительно соединен с шиной 504. Блок 506 ввода, блок 507 вывода, блок 508 записи, блок 509 связи и привод 510 подключены к интерфейсу 505 ввода/вывода.

Блок 506 ввода формируется посредством клавиатуры, мыши, микрофона, устройства формирования изображения и тому подобное. Блок 507 вывода образован дисплеем, динамиком и тому подобное. Блок 508 записи сформирован жестким диском, энергонезависимой памятью или тому подобное. Блок 509 связи сформирован сетевым интерфейсом или тому подобное. Привод 510 предназначен для функционирования сменного носителя 511, такого как магнитный диск, оптический диск, магнитооптический диск или полупроводниковое запоминающее устройство.

В компьютере, имеющем вышеописанную структуру, CPU 501 загружает программу, записанную в блоке 508 записи, на RAM 503 через интерфейс 505 ввода/вывода и шину 504, например, и выполняет программу, так что выполняется вышеописанная последовательность операций процессов.

Программа, выполняемая компьютером (CPU 501), может быть записана на съемном носителе 511, который может быть комплектно поставленным носителем информации, например. В качестве альтернативы, программа может быть предоставлена с помощью проводной или беспроводной среды передачи, такой как локальная сеть, интернет или цифровое спутниковое вещание.

В компьютере, программа может быть установлена на блок 508 записи через интерфейс 505 ввода/вывода, когда съемный носитель 511 установлен на приводе 510. Программа также может быть получена с помощью блока 509 связи посредством проводной или беспроводной передачи данных и установка на блок 508 записи. Альтернативно, программа может быть установлена заранее на ROM 502 или в блоке 508 записи.

Программа, выполняемая компьютером, может быть программой для выполнения процессов в хронологическом порядке в соответствии с последовательностью, описанной в данной спецификации, или может представлять собой программу для выполнения процессов параллельно или выполнения процесса, когда это необходимо, например, по запросу.

Следует отметить, что варианты осуществления настоящего изобретения не ограничены вышеописанными вариантами осуществления, и различные модификации могут быть сделаны в упомянутых вариантах осуществления, не отступая от объема настоящего изобретения.

Например, настоящее изобретение может быть реализовано посредством облачной структуры, в которой одна функция распределяется среди устройств через сеть, и обработка осуществляется устройствами, взаимодействующими друг с другом.

Соответствующие этапы, описанные со ссылкой на описанные ранее блок-схемы алгоритма, могут быть выполнены одним устройством или могут быть разделены между устройствами.

В случае, когда более чем один процесс выполняется на одном этапе, процессы, включенные в состав этого этапа, могут быть выполнены одним устройством или могут быть разделены между устройствами.

Дополнительно, настоящее изобретение может осуществляться следующим образом.

1. Устройство вывода аудиосигнала включает в себя:

блок вычисления расстояния, который вычисляет расстояние между позицией идеального громкоговорителя, который воспроизводит аудиосигнал, и позицией реального громкоговорителя, который воспроизводит аудиосигнал;

блок вычисления коэффициента усиления, который вычисляет коэффициент усиления воспроизведения аудиосигнала на основании расстояния; и

блок регулировки коэффициента усиления, который выполняет регулировку коэффициента усиления аудиосигнала на основании коэффициента усиления воспроизведения.

2. Устройство вывода аудиосигнала по п. 1, в котором блок вычисления коэффициента усиления вычисляет коэффициент усиления воспроизведения на

основании информации кривой для получения коэффициента усиления воспроизведения, соответствующего расстоянию.

3. Устройство вывода аудиосигнала по п. 2, в котором информация кривой является информацией, указывающей на ломаную кривую или кривую функции.

4. Устройство вывода аудиосигнала по п. 1 или п. 2, в котором, когда идеальным громкоговоритель не расположен на единичной окружности, имеющей заданную

опорную точку, как ее центральную точку, блок регулировки коэффициента усиления дополнительно выполняет регулировку коэффициента усиления аудиосигнала посредством коэффициента усиления, определенного на основании расстояния от опорной точки до идеального громкоговорителя и радиуса единичной окружности.

5. Устройство вывода аудиосигнала по п. 4, в котором блок регулировки коэффициента усиления задерживает аудиосигнал на основании времени задержки,

определенного на основании расстояния от опорной точки до идеального громкоговорителя и радиуса единичной окружности.

6. Устройство вывода аудиосигнала по п. 1 или п. 2, в котором, когда реальный громкоговоритель не расположен на единичной окружности, имеющей заданную опорную точку, как ее центральную точку, блок регулировки коэффициента усиления дополнительно выполняет регулировку коэффициента усиления аудиосигнала посредством коэффициента усиления, определенного на основании расстояния от опорной точки до реального громкоговорителя и радиуса единичной окружности.

7. Устройство вывода аудиосигнала по п. 6, в котором блок регулировки

коэффициента усиления задерживает аудиосигнал на основании времени задержки, определенной на основании расстояния от опорной точки до реального громкоговорителя и радиуса единичной окружности.

8. Устройство вывода аудиосигнала по любому одному из пунктов с 1 по 7, дополнительно включает в себя

корректирующий блок коэффициента усиления, который корректирует коэффициент усиления воспроизведения в зависимости от расстояния между позицией идеального центрального громкоговорителя и позицией реального громкоговорителя.

9. Устройство вывода аудиосигнала по любому одному из пунктов с 1 по 8, дополнительно включает в себя

корректирующий блок нижнего предела, который корректирует коэффициент усиления воспроизведения, когда коэффициент усиления воспроизведения меньше заданного нижнего предела.

10. Устройство вывода аудиосигнала по любому одному из пунктов с 1 по 9, дополнительно включает в себя

корректирующий блок общего коэффициента усиления, который вычисляет отношение между полной мощностью выходного звука на основании аудиосигнала, подвергнутого регулировке коэффициента усиления посредством коэффициента усиления воспроизведения, и полной мощностью входного звука, и корректирует коэффициент усиления воспроизведения на основании отношения, отношение вычисляется на основании коэффициента усиления воспроизведения и ожидаемого значения звукового давления входного сигнала, на основании входного аудиосигнала.

11. Способ вывода аудиосигнала включает в себя этапы:

вычисление расстояния между позицией идеального громкоговорителя, который воспроизводит аудиосигнал, и позицией реального громкоговорителя, который воспроизводит аудиосигнал;

вычисление коэффициента усиления воспроизведения аудиосигнала на основании расстояния; и

выполнение регулировки коэффициента усиления аудиосигнала на основании коэффициента усиления воспроизведения.

12. Программа для вызова компьютера выполнить процесс, включающий в себя этапы:

вычисление коэффициента усиления воспроизведения аудиосигнала на основании расстояния; и

13. Устройство кодирования включает в себя:

блок генерирования информации коррекции, который генерирует корректирующую информацию для корректировки коэффициента усиления аудиосигнала в соответствии с расстоянием между позицией идеального громкоговорителя, который воспроизводит аудиосигнал, и позицией реального громкоговорителя, который воспроизводит аудиосигнал;

блок кодирования, который кодирует аудиосигнал; и

блок вывода, который выводит поток битов, включающий в себя информацию коррекции и кодированный аудиосигнал.

14. Способ кодирования включает в себя этапы:

генерирование информации коррекции для коррекции коэффициента усиления аудиосигнала в соответствии с расстоянием между позицией идеального громкоговорителя, который воспроизводит аудиосигнал, и позицией реального громкоговорителя, который воспроизводит аудиосигнал;

кодирования аудиосигнала; и

вывод потока битов, включающий в себя информацию коррекции и кодированный аудиосигнал.

15. Устройство декодирования включает в себя:

блок извлечения, который извлекает из битового потока информацию коррекции для коррекции коэффициента усиления аудиосигнала в соответствии с расстоянием между позицией идеального громкоговорителя, который воспроизводит аудиосигнал, и позицией реального громкоговорителя, который воспроизводит аудиосигнал, и кодированный аудиосигнал;

блок декодирования, который декодирует кодированный аудиосигнал; и блок вывода, который выводит декодированный аудиосигнал и информацию коррекции.

16. Устройство декодирования по п. 15, в котором информация коррекции представляет собой информацию о местоположении идеального громкоговорителя.

17. Устройство декодирования по п. 15 или п. 16, в котором информация коррекции является информацией кривой для получения коэффициента усиления, соответствующего расстоянию.

18. Устройство декодирования по п. 17, в котором информация кривой является информацией, указывающей на ломаную кривую или кривую функции.

19. Способ декодирования включает в себя этапы:

извлечение из потока битов информации коррекции для коррекции коэффициента усиления аудиосигнала в соответствии с расстоянием между позицией идеального громкоговорителя, который воспроизводит аудиосигнал, и позицией реального громкоговорителя, который воспроизводит аудиосигнал, и кодированного аудиосигнала;

декодирования кодированного аудиосигнала; и

вывод декодированного аудиосигнала и информации коррекции.

Перечень ссылочных позиций

11 устройство воспроизведения 21 блок вычисления расстояния 22 блок вычисления коэффициента усиления 23 корректирующий блок 24 корректирующий блок нижнего предела 25 корректирующий блок общего коэффициента усиления 26 блок регулировки коэффициента усиления 61 кодер 62 декодер 71 блок генерирования метаданных 72 блок кодирования аудиосигнала 73 блока вывода 81 блок извлечения 82 блок декодирования аудиосигналы 83 блок вывода

Иллюстрации к изобретению RU 2 668 113 C2

Реферат патента 2018 года СПОСОБ И УСТРОЙСТВО ВЫВОДА АУДИОСИГНАЛА, СПОСОБ И УСТРОЙСТВО КОДИРОВАНИЯ, СПОСОБ И УСТРОЙСТВО ДЕКОДИРОВАНИЯ И ПРОГРАММА

Изобретение относится к средствам для кодирования, декодирования и вывода аудиосигнала. Технический результат заключается в повышении качества аудиосигнала. Вычисляют расстояние между позицией идеального громкоговорителя, воспроизводящего аудиосигнал, и позицией реального громкоговорителя, воспроизводящего аудиосигнал. Вычисляют коэффициент усиления воспроизведения аудиосигнала на основании указанного расстояния. Выполняют регулировку коэффициента усиления аудиосигнала на основании коэффициента усиления воспроизведения. Корректируют коэффициент усиления воспроизведения на основании отношения между полной мощностью выходного звука и полной мощностью входного звука. Причем полная мощность выходного звука основана на аудиосигнале, подвергнутом регулировке коэффициента усиления посредством коэффициента усиления воспроизведения. 7 н. и 12 з.п. ф-лы, 11 ил.

Формула изобретения RU 2 668 113 C2

1. Устройство вывода аудиосигнала, содержащее:

блок вычисления расстояния, выполненный с возможностью вычисления расстояния между позицией идеального громкоговорителя, воспроизводящего аудиосигнал, и позицией реального громкоговорителя, воспроизводящего аудиосигнал;

блок вычисления коэффициента усиления, выполненный с возможностью вычисления коэффициента усиления воспроизведения аудиосигнала на основании указанного расстояния;

блок регулировки коэффициента усиления, выполненный с возможностью регулировки коэффициента усиления аудиосигнала на основании коэффициента усиления воспроизведения; и

корректирующий блок общего коэффициента усиления, выполненный с возможностью коррекции коэффициента усиления воспроизведения на основании отношения между полной мощностью выходного звука и полной мощностью входного звука,

причем полная мощность выходного звука основана на аудиосигнале, подвергнутом регулировке коэффициента усиления посредством коэффициента усиления воспроизведения.

2. Устройство вывода аудиосигнала по п. 1, в котором блок вычисления коэффициента усиления выполнен с возможностью вычисления коэффициента усиления воспроизведения на основании информации кривой для получения коэффициента усиления воспроизведения, соответствующего расстоянию.

3. Устройство вывода аудиосигнала по п. 2, в котором информация кривой является информацией, указывающей ломаную кривую или кривую функции.

4. Устройство вывода аудиосигнала по п. 1, в котором, когда идеальный громкоговоритель не расположен на единичной окружности, имеющей заданную опорную точку в качестве ее центральной точки, блок регулировки коэффициента усиления дополнительно выполнен с возможностью регулировки коэффициента усиления аудиосигнала посредством коэффициента усиления, определенного на основании расстояния от опорной точки до идеального громкоговорителя и радиуса единичной окружности.

5. Устройство вывода аудиосигнала по п. 4, в котором блок регулировки коэффициента усиления выполнен с возможностью задержки аудиосигнала на основании времени задержки, определенного на основании расстояния от опорной точки до идеального громкоговорителя и радиуса единичной окружности.

6. Устройство вывода аудиосигнала по п. 1, в котором, когда реальный громкоговоритель не расположен на единичной окружности, имеющей заданную опорную точку в качестве ее центральной точки, блок регулировки коэффициента усиления дополнительно выполнен с возможностью регулировки коэффициента усиления аудиосигнала посредством коэффициента усиления, определенного на основании расстояния от опорной точки до реального громкоговорителя и радиуса единичной окружности.

7. Устройство вывода аудиосигнала по п. 6, в котором блок регулировки коэффициента усиления выполнен с возможностью задержки аудиосигнала на основании времени задержки, определенного на основании расстояния от опорной точки до реального громкоговорителя и радиуса единичной окружности.

8. Устройство вывода аудиосигнала по п. 1, дополнительно содержащее корректирующий блок коэффициента усиления, выполненный с возможностью коррекции коэффициента усиления воспроизведения на основании расстояния между позицией идеального центрального громкоговорителя и позицией реального громкоговорителя.

9. Устройство вывода аудиосигнала по п. 1, дополнительно содержащее корректирующий блок нижнего предела, выполненный с возможностью коррекции коэффициента усиления воспроизведения, когда коэффициент усиления воспроизведения меньше заданного нижнего предела.

10. Устройство вывода аудиосигнала по п. 1, в котором указанное отношение вычисляется на основании коэффициента усиления воспроизведения и ожидаемого значения звукового давления входного звука, получаемого на основании входного аудиосигнала.

11. Способ вывода аудиосигнала, содержащий этапы, на которых:

вычисляют расстояние между позицией идеального громкоговорителя, воспроизводящего аудиосигнал, и позицией реального громкоговорителя, воспроизводящего аудиосигнал;

вычисляют коэффициент усиления воспроизведения аудиосигнала на основании указанного расстояния;

выполняют регулировку коэффициента усиления аудиосигнала на основании коэффициента усиления воспроизведения; и

корректируют коэффициент усиления воспроизведения на основании отношения между полной мощностью выходного звука и полной мощностью входного звука,

12. Носитель записи, содержащий записанную на нем программу, вызывающую выполнение компьютером процесса, включающего в себя этапы, на которых:

вычисляют коэффициент усиления воспроизведения аудиосигнала на основании указанного расстояния;

13. Устройство кодирования, содержащее:

блок генерирования информации коррекции, выполненный с возможностью генерирования информации коррекции для коррекции коэффициента усиления аудиосигнала на основе расстояния между позицией идеального громкоговорителя, воспроизводящего указанный аудиосигнал, и позицией реального громкоговорителя, воспроизводящего указанный аудиосигнал;

блок кодирования, выполненный с возможностью кодирования аудиосигнала; и

блок вывода, выполненный с возможностью:

вычисления коэффициента усиления воспроизведения аудиосигнала на основании указанного расстояния;

коррекции коэффициента усиления воспроизведения на основании отношения между полной мощностью выходного звука и полной мощностью входного звука; и

вывода потока битов, включающего в себя информацию коррекции и кодированный аудиосигнал,

14. Способ кодирования, содержащий этапы, на которых:

генерируют информацию коррекции для коррекции коэффициента усиления аудиосигнала на основании расстояния между позицией идеального громкоговорителя, воспроизводящего указанный аудиосигнал, и позицией реального громкоговорителя, воспроизводящего указанный аудиосигнал;

кодируют аудиосигнал;

вычисляют коэффициент усиления воспроизведения аудиосигнала на основании указанного расстояния;

причем полная мощность выходного звука основана на аудиосигнале, подвергнутом регулировке коэффициента усиления посредством коэффициента усиления воспроизведения; и

выводят поток битов, включающий в себя информацию коррекции и кодированный аудиосигнал.

15. Устройство декодирования, содержащее:

блок извлечения, выполненный с возможностью извлечения из потока битов информации коррекции для коррекции коэффициента усиления аудиосигнала на основании расстояния между позицией идеального громкоговорителя, воспроизводящего указанный аудиосигнал, и позицией реального громкоговорителя, воспроизводящего указанный аудиосигнал, и кодированного аудиосигнала;

блок декодирования, выполненный с возможностью декодирования кодированного аудиосигнала; и

блок вывода, выполненный с возможностью:

вычисления коэффициента усиления воспроизведения аудиосигнала на основании указанного расстояния;

вывода декодированного аудиосигнала и информации коррекции,

17. Устройство декодирования по п. 15, в котором информация коррекции является информацией кривой для получения коэффициента усиления, соответствующего расстоянию.

18. Устройство декодирования по п. 17, в котором информация кривой является информацией, указывающей ломаную кривую или кривую функции.

19. Способ декодирования, содержащий этапы, на которых:

извлекают из потока битов информацию коррекции для коррекции коэффициента усиления аудиосигнала на основании расстояния между позицией идеального громкоговорителя, воспроизводящего указанный аудиосигнал, и позицией реального громкоговорителя, воспроизводящего указанный аудиосигнал, и кодированный аудиосигнал;

декодируют кодированный аудиосигнал;

вычисляют коэффициент усиления воспроизведения аудиосигнала на основании указанного расстояния;

выводят декодированный аудиосигнал и информацию коррекции.

Документы, цитированные в отчете о поиске Патент 2018 года RU2668113C2

JP 2008187213 A, 14.08.2008
Способ обработки целлюлозных материалов, с целью тонкого измельчения или переведения в коллоидальный раствор	1923	Петров Г.С.	SU2005A1
Изложница с суживающимся книзу сечением и с вертикально перемещающимся днищем	1924	Волынский С.В.	SU2012A1
Пресс для выдавливания из деревянных дисков заготовок для ниточных катушек	1923	Григорьев П.Н.	SU2007A1
EP 1881740 A2, 23.01.2008
JP 2006101248 A, 13.04.2006
JP 2010041190 A, 18.02.2010
Устройство для высева семян	1980	Оноприенко Николай Александрович	SU865169A1
Пресс для выдавливания из деревянных дисков заготовок для ниточных катушек	1923	Григорьев П.Н.	SU2007A1
СПОСОБ И УСТРОЙСТВО ДЛЯ УЛУЧШЕНИЯ ВОСПРОИЗВЕДЕНИЯ ЗВУКА	2008	Пулкки Вилле	RU2416172C1

RU 2 668 113 C2

Авторы

Си Рунью

Тинен Тору

Ямамото Юки

Хатанака Мицуюки

Даты

2018-09-26—Публикация

2014-05-21—Подача

название	год	авторы	номер документа
СПОСОБ И УСТРОЙСТВО КОДИРОВАНИЯ, СПОСОБ И УСТРОЙСТВО ДЕКОДИРОВАНИЯ И ПРОГРАММА	2014	Си Руню Тинен Тору Хонма Хироюки Хатанака Мицуюки	RU2677597C2
УСТРОЙСТВО, СПОСОБ И ПРОГРАММА АУДИООБРАБОТКИ	2016	Ямамото Юки Тинен Тору Цудзи Минору	RU2708441C2
СПОСОБ И УСТРОЙСТВО ОБРАБОТКИ СИГНАЛА	2018	Ямамото Юки Тинен Тору Цудзи, Минору	RU2763785C2
УСТРОЙСТВО И СПОСОБ ДЛЯ ПРЕОБРАЗОВАНИЯ ПЕРВОГО И ВТОРОГО ВХОДНЫХ КАНАЛОВ ПО МЕНЬШЕЙ МЕРЕ В ОДИН ВЫХОДНОЙ КАНАЛ	2014	Херре Юрген Кюх Фабиан Крачмер Михаэль Кунтц Ахим Фаллер Кристоф	RU2672386C1
УСТРОЙСТВО И СПОСОБ ПРЕОБРАЗОВАНИЯ ПЕРВОГО И ВТОРОГО ВХОДНЫХ КАНАЛОВ, ПО МЕНЬШЕЙ МЕРЕ, В ОДИН ВЫХОДНОЙ КАНАЛ	2014	Херре Юрген Кюх Фабиан Крачмер Михаэль Кунтц Ахим Фаллер Кристоф	RU2640647C2
СПОСОБЫ И УСТРОЙСТВА ДЛЯ УПРАВЛЕНИЯ НИЗКИМИ ЗВУКОВЫМИ ЧАСТОТАМИ	2019	Робинсон, Чарльз К. Томас, Марк Р. П. Смитерс, Майкл Дж.	RU2771954C2
СПОСОБ ОБРАБОТКИ АУДИОСИГНАЛА, БЛОК ОБРАБОТКИ СИГНАЛОВ, СТЕРЕОФОНИЧЕСКИЙ РЕНДЕРЕР, АУДИОКОДЕР И АУДИОДЕКОДЕР	2014	Фюг Зимоне Плогстис Ян	RU2642376C2
УСТРОЙСТВО И СПОСОБ ДЛЯ КОДИРОВАНИЯ ПРОСТРАНСТВЕННОГО ЗВУКОВОГО ПРЕДСТАВЛЕНИЯ ИЛИ УСТРОЙСТВО И СПОСОБ ДЛЯ ДЕКОДИРОВАНИЯ ЗАКОДИРОВАННОГО АУДИОСИГНАЛА С ИСПОЛЬЗОВАНИЕМ ТРАНСПОРТНЫХ МЕТАДАННЫХ И СООТВЕТСТВУЮЩИЕ КОМПЬЮТЕРНЫЕ ПРОГРАММЫ	2020	Кюх, Фабиан Тиргарт, Оливер Фукс, Гийом Дёла, Штефан Бутеон, Александр Херре, Юрген Байер, Штефан	RU2792050C2
ПРИНЦИП ФОРМИРОВАНИЯ УЛУЧШЕННОГО ОПИСАНИЯ ЗВУКОВОГО ПОЛЯ ИЛИ МОДИФИЦИРОВАННОГО ОПИСАНИЯ ЗВУКОВОГО ПОЛЯ С ИСПОЛЬЗОВАНИЕМ DIRAC-ТЕХНОЛОГИИ С РАСШИРЕНИЕМ ГЛУБИНЫ ИЛИ ДРУГИХ ТЕХНОЛОГИЙ	2018	Херре, Юрген Хабетс, Эмануэль Плинге, Аксель Тиргарт, Оливер Кюх, Фабиан	RU2736274C1
СПОСОБ И УСТРОЙСТВО ДЛЯ ОБРАБОТКИ ВИДЕО- И АУДИОСИГНАЛОВ И ПРОГРАММА	2017	Хонма Хироюки Ямамото Юки	RU2743732C2

Описание патента на изобретение RU2668113C2

Похожие патенты RU2668113C2

Иллюстрации к изобретению RU 2 668 113 C2

Реферат патента 2018 года СПОСОБ И УСТРОЙСТВО ВЫВОДА АУДИОСИГНАЛА, СПОСОБ И УСТРОЙСТВО КОДИРОВАНИЯ, СПОСОБ И УСТРОЙСТВО ДЕКОДИРОВАНИЯ И ПРОГРАММА

Формула изобретения RU 2 668 113 C2

Документы, цитированные в отчете о поиске Патент 2018 года RU2668113C2

RU 2 668 113 C2