Настоящее изобретение относится к обработке звуковых сигналов и, в частности, к устройству и способу для генерирования выходного сигнала с применением блока разложения сигнала.
Человеческая слуховая система распознает звук со всех направлений. Воспринимаемая слуховая (прилагательное слуховое обозначает, что это воспринимается, в то время как слово звук используется для описания физических явлений) среда формирует впечатление об акустических характеристиках окружающего пространства и происходящих звуковых событиях. Слуховое впечатление, воспринимаемое в конкретном звуковом поле, может быть (по меньшей мере, частично) смоделировано с учетом трех различных типов сигналов: прямой звук, ранние отражения и рассеянные отражения. Эти сигналы вносят вклад в формирование воспринимаемого слухового пространственного образа.
Прямой звук обозначает волны каждого звукового события, которые первыми достигают слушателя напрямую от источника звука без помех. Это характерно для источника звука и предоставляет информацию с наименьшими отклонениями о направлении происхождения звукового события. Первичной ключевой информацией для оценки направления источника звука в горизонтальной плоскости являются различия между входными сигналами левого и правого уха, то есть интерауральные разности по времени (ITD) и интерауральные разности уровней (ILD). Впоследствии, множество отражений прямого звука поступает в уши с разных направлений и с разными относительными временными задержками и уровнями. С увеличением временной задержки, относительно прямого звука, плотность отражений повышается, пока они не образуют статистический шум.
Отраженный звук вносит вклад в восприятие расстояния и в слуховое пространственное впечатление, которое складывается, по меньшей мере, из двух составляющих: кажущийся размер источника (ASW) и охватывание слушателя (LEV). ASW задается как расширение кажущегося размера источника звука и определяется, главным образом, ранними боковыми отражениями. LEV относится к ощущению слушателя того, что он охвачен звуком, и определяется, главным образом, поздно поступающими отражениями. Цель электроакустического стереофонического воспроизведения звука состоит в том, чтобы вызвать восприятие приятного слухового пространственного образа. Он может иметь естественные или архитектурные исходные условия (например, запись концерта в зале), или это может быть звуковое поле, которое в реальности не существует (например, электроакустическая музыка).
Из области акустики концертного зала хорошо известно, что чтобы получить субъективно приятное звуковое поле, важно сильное ощущение слухового пространственного образа, с LEV, которое является неотъемлемой частью. Представляет интерес способность громкоговорящих установок воспроизводить охватывающее звуковое поле посредством воспроизведения рассеянного звукового поля. В искусственном звуковом поле невозможно воспроизвести все естественные отражения, используя специальные преобразователи. Это особенно верно для рассеянных более поздних отражений. Расчет по времени и постоянные характеристики рассеянных отражений могут быть смоделированы с помощью "реверберированных" сигналов в качестве подаваемых на громкоговорители. Если они являются достаточно некоррелированными, количество и размещение громкоговорителей, используемых для проигрывания, определяет, будет ли звуковое поле восприниматься как рассеянное. Цель состоит в том, чтобы вызвать восприятие непрерывного, рассеянного звукового поля, используя только дискретное число преобразователей. Иными словами, создавая звуковые поля, когда не может быть оценено направление поступления звука, а особенно, когда не может быть локализован отдельный преобразователь.
Стереофонические воспроизведения звука стремятся вызвать восприятие непрерывного звукового поля, используя только дискретное число преобразователей. Наиболее желательными свойствами являются устойчивость при перемещении локализованных источников и реалистичная передача окружающей слуховой среды. Большинство форматов, используемых сегодня для хранения или транспортировки стереофонических записей, являются канальными. Каждый канал переносит сигнал, который предназначен для проигрывания через соотнесенный громкоговоритель в конкретном месте. Конкретный слуховой образ конструируется во время записи или технологического процесса микширования. Этот образ в точности воссоздается, если громкоговорящая установка, используемая для воспроизведения, похожа на целевую установку, на которую была рассчитана запись.
Системы объемного звучания содержат множество громкоговорителей. Простые системы объемного звучания могут, например, содержать пять громкоговорителей. Если количество передаваемых каналов меньше количества громкоговорителей, то возникает вопрос, какие сигналы на какие громкоговорители должны быть предоставлены. Например, система объемного звучания может содержать пять громкоговорителей, в то время как стереофонический сигнал передается при наличии двух передаваемых каналов. С другой стороны, даже если доступен сигнал объемного звука, этот доступный сигнал объемного звука может иметь меньше каналов, чем количество динамиков в пользовательской системе объемного звучания. Например, может быть доступен сигнал объемного звука, имеющий 5 каналов объемного звука, в то время как система объемного звучания, на которой намереваются проигрывать этот сигнал объемного звука, может иметь, например, 9 громкоговорителей.
В частности, в автомобильных системах объемного звучания, система объемного звучания может содержать множество громкоговорителей, например, 9 громкоговорителей. Некоторые из этих динамиков могут быть расположены горизонтально относительно сиденья слушателя, в то время как другие динамики могут быть приподняты относительно сиденья слушателя. Вероятно, придется применять алгоритмы повышающего микширования, чтобы генерировать дополнительные каналы из доступных каналов входного сигнала. Применительно к системе объемного звучания, имеющей множество горизонтальных и множество приподнятых динамиков, возникает конкретная проблема, какие звуковые фрагменты должны проигрываться приподнятыми динамиками, а какие звуковые фрагменты должны проигрываться горизонтальными динамиками.
Задачей настоящего изобретения является обеспечить усовершенствованную концепцию предоставления устройства для генерирования выходного сигнала, имеющего, по меньшей мере, два канала. Задача настоящего изобретения решается посредством устройства согласно п. 1 формулы изобретения, посредством способа согласно п. 4 формулы изобретения, посредством компьютерно-читаемого носителя по п. 7 формулы изобретения.
Настоящее изобретение основывается на сведениях о том, что разложение звуковых сигналов на отдельные, с точки зрения восприятия, составляющие необходимо для высококачественного изменения, усиления, адаптивного проигрывания, и перцепционного кодирования сигнала. Отдельные, с точки зрения восприятия, сигнальные составляющие из входных сигналов, имеющих два или более входных каналов, должны быть обработаны и/или выделены.
В соответствии с настоящим изобретением, предоставляется устройство для генерирования выходного сигнала, имеющего, по меньшей мере, два выходных канала, из входного сигнала, имеющего, по меньшей мере, два входных канала. Устройство содержит блок разложения на фоновые/прямые сигналы, выполненный с возможностью разложения первого входного канала на первый фоновый сигнал из группы фоновых сигналов и на первый прямой сигнал из группы прямых сигналов. Устройство, кроме того, выполнено с возможностью разложения второго входного канала на второй фоновый сигнал из группы фоновых сигналов и на второй прямой сигнал из группы прямых сигналов. Кроме того, устройство содержит модуль изменения фона, выполненный с возможностью изменения фонового сигнала из группы фоновых сигналов или сигнала, извлеченного из фонового сигнала из группы фоновых сигналов, чтобы получить измененный фоновый сигнал в качестве первого выходного канала для первого громкоговорителя. Помимо этого, устройство содержит модуль комбинирования для комбинирования фонового сигнала из группы фоновых сигналов или сигнала, извлеченного из фонового сигнала из группы фоновых сигналов, и прямого сигнала из группы прямых сигналов или сигнала, извлеченного из прямого сигнала из группы прямых сигналов, чтобы получить комбинированный сигнал в качестве второго выходного канала для второго громкоговорителя.
Настоящее изобретение основывается на дополнительных сведениях о том, что блок разложения на фоновые/прямые сигналы, модуль изменения фона и модуль комбинирования могут применяться для генерирования разложенных, измененных или комбинированных выходных каналов, по меньшей мере, из двух входных каналов входного сигнала. Каждый канал входного сигнала разлагается блоком разложения на фоновые/прямые сигналы на фоновый сигнал из группы фоновых сигналов и на прямой сигнал из группы прямых сигналов. Таким образом, группа фоновых сигналов и группа прямых сигналов в совокупности представляют звуковые характеристики каналов входного сигнала. Благодаря этому, некоторое количество фоновых сигнальных фрагментов канала может выводиться на некоторый громкоговоритель, в то время как, например, другой громкоговоритель может принимать оставшееся количество фоновых сигнальных фрагментов канала вместе с прямым сигнальным фрагментом. Следовательно, может иметься возможность управлять количеством фоновых сигнальных фрагментов входного сигнала, который подается на первый громкоговоритель, и количеством фоновых сигнальных фрагментов входного сигнала, который подается вместе с прямыми сигнальными фрагментами входного сигнала во второй громкоговоритель.
В соответствии с одним из вариантов осуществления, блок разложения на фоновые/прямые сигналы разлагает каналы входного сигнала, чтобы формировать группу фоновых сигналов, содержащую фоновые сигнальные фрагменты каналов входного сигнала, и группу прямых сигналов, содержащую прямые сигнальные фрагменты каналов входного сигнала. В таком варианте осуществления, фоновые сигналы из группы фоновых сигналов и прямые сигналы из группы прямых сигналов представляют различные сигнальные составляющие каналов входного сигнала.
В одном из вариантов осуществления, сигнал извлекается из фонового сигнала из группы фоновых сигналов путем фильтрации, изменения усиления или декорреляции фонового сигнала из группы фоновых сигналов. Кроме того, сигнал может быть извлечен из прямого сигнала из группы прямых сигналов путем фильтрации, изменения усиления или декорреляции прямого сигнала из группы прямых сигналов.
В дополнительном варианте осуществления, предоставляется первый блок изменения усиления фона, причем блок изменения усиления фона выполнен с возможностью изменения усиления фонового сигнала из группы фоновых сигналов или сигнала, извлеченного из фонового сигнала из группы фоновых сигналов, чтобы получить фоновый сигнал с измененным усилением. Модуль комбинирования согласно этому варианту осуществления выполнен с возможностью комбинирования фонового сигнала с измененным усилением и прямого сигнала из группы прямых сигналов или сигнала, извлеченного из прямого сигнала из группы прямых сигналов, чтобы получить комбинированный сигнал в качестве второго выходного сигнала. Оба сигнала, которые комбинируются при помощи модуля комбинирования, могут быть сгенерированы из одного и того же канала входного сигнала. Таким образом, в этом варианте осуществления можно сгенерировать выходной канал со всеми сигнальными составляющими, которые уже содержались во входном канале, но в котором для некоторых сигнальных составляющих, например фоновых сигнальных составляющих, было изменено усиление посредством блока изменения усиления фона, тем самым предоставляя выходной канал с некоторой, с измененным усилением, характеристикой сигнальной составляющей.
В другом варианте осуществления, модуль изменения фона содержит блок декорреляции, второй блок изменения усиления и/или фильтрующий модуль. Фильтрующий модуль может быть фильтром нижних частот. Соответственно, модуль изменения может предоставить выходной канал путем декорреляции, изменения усиления и/или фильтрации, например низкочастотной фильтрации, сигнала из группы фоновых сигналов. В одном из вариантов осуществления, группа фоновых сигналов может содержать фоновые сигнальные фрагменты каналов входного сигнала. Таким образом, может иметься возможность изменять фоновые сигнальные фрагменты канала входного сигнала.
В дополнительном варианте осуществления, модуль изменения фона изменяет множество входных каналов входного сигнала в соответствии с вышеописанной концепцией, чтобы получить множество измененных сигналов.
В другом варианте осуществления, предоставляется устройство для генерирования выходного сигнала, имеющего, по меньшей мере, четыре выходных канала, из входного сигнала, имеющего, по меньшей мере, два входных канала. Это устройство содержит блок выделения фона, выполненный с возможностью выделения, по меньшей мере, двух фоновых сигналов с фоновыми сигнальными фрагментами из этих, по меньшей мере, двух входных каналов. Помимо этого, устройство содержит модуль изменения фона, выполненный с возможностью изменения этих, по меньшей мере, двух фоновых сигналов, чтобы получить, по меньшей мере, первый измененный фоновый сигнал и второй измененный фоновый сигнал. Кроме того, устройство содержит, по меньшей мере, четыре динамика. Два динамика из этих, по меньшей мере, четырех динамиков расположены на первых высотах в слуховой среде по отношению к слушателю. Два дополнительных динамика из этих, по меньшей мере, четырех динамиков расположены на вторых высотах в слуховой среде по отношению к слушателю, при этом вторые высоты отличаются от первых высот. Модуль изменения фона выполнен с возможностью подачи первого измененного фонового сигнала в качестве третьего выходного канала в первый динамик из двух дополнительных динамиков. Кроме того, модуль изменения фона выполнен с возможностью подачи второго измененного фонового сигнала в качестве четвертого выходного канала во второй динамик из двух дополнительных динамиков. Помимо этого, устройство для генерирования выходного сигнала выполнено с возможностью подачи первого входного канала с прямыми и фоновыми сигнальными фрагментами в качестве первого выходного канала в первый динамик, расположенный на первых высотах. Кроме того, блок выделения фона выполнен с возможностью подачи второго входного канала с прямыми и фоновыми сигнальными фрагментами в качестве второго выходного канала во второй динамик, расположенный на вторых высотах.
Предпочтительные варианты осуществления настоящего изобретения в дальнейшем будут описаны со ссылкой на прилагаемые чертежи, на которых:
Фиг. 1 демонстрирует структурную схему устройства в соответствии с одним из вариантов осуществления;
Фиг. 2 изображает структурную схему устройства в соответствии с дополнительным вариантом осуществления;
Фиг. 3 показывает структурную схему устройства в соответствии с другим вариантом осуществления;
Фиг. 4 демонстрирует структурную схему устройства в соответствии с дополнительным вариантом осуществления;
Фиг. 5 демонстрирует структурную схему устройства в соответствии с другим вариантом осуществления;
Фиг. 6 показывает структурную схему устройства в соответствии с другим вариантом осуществления;
Фиг. 7 изображает структурную схему устройства в соответствии с дополнительным вариантом осуществления.
Фиг. 8 демонстрирует расстановку громкоговорителей в одном из вариантов осуществления.
Фиг. 9 представляет собой структурную схему для демонстрации блока разложения на фоновые/прямые сигналы с применением блока понижающего микширования в соответствии с одним из вариантов осуществления;
Фиг. 10 представляет собой структурную схему, демонстрирующую реализацию блока разложения на фоновые/прямые сигналы, имеющего некоторое количество из, по меньшей мере, трех входных каналов, с использованием анализатора с предварительно вычисленной зависящей от частоты корреляционной кривой в соответствии с одним из вариантов осуществления;
Фиг. 11 демонстрирует дополнительную предпочтительную реализацию блока разложения на фоновые/прямые сигналы с обработкой в частотной области для понижающего микширования, анализа и обработки сигнала в соответствии с одним из вариантов осуществления;
Фиг. 12 демонстрирует иллюстративную предварительно вычисленную зависящую от частоты корреляционную кривую для опорной кривой для анализа, показанного на Фиг. 9 или Фиг. 10, для блока разложения на фоновые/прямые сигналы в соответствии с одним из вариантов осуществления;
Фиг. 13 демонстрирует структурную схему, демонстрирующую дополнительную обработку с целью выделения независимых составляющих для блока разложения на фоновые/прямые сигналы в соответствии с одним из вариантов осуществления;
Фиг. 14 демонстрирует структурную схему, реализующую блок понижающего микширования в виде генератора анализируемого сигнала для блока разложения на фоновые/прямые сигналы в соответствии с одним из вариантов осуществления;
Фиг. 15 демонстрирует блок-схему последовательности операций для указания способа обработки в анализаторе сигналов, изображенном на Фиг. 9 или Фиг. 10, для блока разложения на фоновые/прямые сигналы в соответствии с одним из вариантов осуществления;
Фиг. 16a-16e демонстрирует разные предварительно вычисленные зависящие от частоты корреляционные кривые, которые могут использоваться в качестве опорных кривых для нескольких различных установок с разным количеством и положением источников звука (таких, как громкоговорители), для блока разложения на фоновые/прямые сигналы в соответствии с одним из вариантов осуществления;
Фиг. 1 демонстрирует устройство в соответствии с одним из вариантов осуществления. Это устройство содержит блок 110 разложения на фоновые/прямые сигналы. Блок 110 разложения на фоновые/прямые сигналы выполнен с возможностью разложения двух входных каналов 142, 144 входного сигнала таким образом, что каждый из этих, по меньшей мере, двух входных каналов 142, 144 разлагается на фоновые сигналы 152, 154 из группы фоновых сигналов и на прямые сигналы 162, 164 из группы прямых сигналов. В других вариантах осуществления, блок 110 разложения на фоновые/прямые сигналы выполнен с возможностью разложения более двух входных каналов.
Помимо этого, устройство согласно варианту осуществления, продемонстрированному на Фиг. 1, содержит модуль 120 изменения фона. Модуль 120 изменения фона выполнен с возможностью изменения фонового сигнала 152 из группы фоновых сигналов, чтобы получить измененный фоновый сигнал 172 в качестве первого выходного канала для первого громкоговорителя. В других вариантах осуществления, модуль 120 изменения фона выполнен с возможностью изменения сигнала, извлеченного из сигнала из группы фоновых сигналов. Например, сигнал из группы фоновых сигналов может подвергаться фильтрации, изменению усиления или декорреляции, а затем переправляться на модуль 120 изменения фона в качестве сигнала, извлеченного из сигнала из группы фоновых сигналов. В дополнительных вариантах осуществления, модуль 120 изменения фона может комбинировать два или более фоновых сигнала, чтобы получить один или более измененных фоновых сигналов.
Кроме того, устройство согласно варианту осуществления, продемонстрированному на Фиг. 1, содержит модуль 130 комбинирования. Модуль 130 комбинирования выполнен с возможностью комбинирования фонового сигнала 152 из группы фоновых сигналов и прямого сигнала 162 из группы прямых сигналов в качестве второго выходного канала для второго громкоговорителя. В других вариантах осуществления, модуль 130 комбинирования выполнен с возможностью комбинирования сигнала, извлеченного из фонового сигнала из группы фоновых сигналов, и/или сигнала, извлеченного из прямого сигнала из группы прямых сигналов. Например, фоновый сигнал и/или прямой сигнал может подвергаться фильтрации, изменению усиления или декорреляции, и затем может быть переправлен на модуль 130 комбинирования. В одном из вариантов осуществления, модуль комбинирования может быть выполнен с возможностью комбинирования фонового сигнала 152 и прямого сигнала 162 путем сложения обоих сигналов. В другом варианте осуществления, фоновый сигнал 152 и прямой сигнал 162 могут комбинироваться путем формирования линейной комбинации этих двух сигналов 152, 162.
В варианте осуществления, продемонстрированном на Фиг. 1, фоновый сигнал 154 и прямой сигнал 164, являющиеся результатом разложения второго входного канала, выводятся без изменения в качестве дополнительных выходных каналов выходного сигнала. Однако, в других вариантах осуществления, сигналы 154, 164 тоже могут обрабатываться модулем 120 изменения и/или модулем 130 комбинирования.
В вариантах осуществления, модуль 120 изменения и модуль 130 комбинирования могут быть выполнены с возможностью осуществления связи друг с другом, что продемонстрировано пунктирной линией 135. Основываясь на этом обмене информацией, модуль 120 изменения может изменять свои принятые фоновые сигналы, например фоновый сигнал 152, в зависимости от комбинаций, проводимых модулем 130 комбинирования, и/или модуль 130 комбинирования может комбинировать свои принятые сигналы, например сигнал 152 и сигнал 162, в зависимости от изменений, проводимых модулем 120 изменения.
Вариант осуществления, изображенный на Фиг. 1, основывается на той идее, что входной сигнал разлагается на прямые и фоновые сигнальные фрагменты, что, по возможности, измененные сигнальные фрагменты изменяются и выводятся на первый набор громкоговорителей, и что комбинация прямых сигнальных фрагментов и фоновых сигнальных фрагментов входного сигнала выводится на второй набор громкоговорителей.
Благодаря этому, в одном из вариантов осуществления, например, некоторое количество фоновых сигнальных фрагментов канала может выводиться на некоторый громкоговоритель, в то время как, например, другой громкоговоритель принимает оставшееся количество фоновых сигнальных фрагментов канала в дополнение к прямому сигнальному фрагменту. Например, модуль изменения фона может изменять усиление фонового сигнала 152, умножая его амплитуды на 0,7, чтобы сгенерировать первый выходной канал. Помимо этого, модуль комбинирования может комбинировать прямой сигнал 162 и фоновый сигнальный фрагмент, чтобы сгенерировать второй выходной канал, причем фоновые сигнальные фрагменты умножаются на коэффициент 0,3. Благодаря этому, измененный фоновый сигнал 172 и комбинированный сигнал 182 дадут в результате:
сигнал 172=0,7⋅фоновый сигнальный фрагмент сигнала 142
сигнал 182=0,3⋅фоновый сигнальный фрагмент сигнала 142+прямой сигнальный фрагмент сигнала 142
Следовательно, Фиг. 1, помимо прочего, основывается на той идее, что все сигнальные фрагменты входного сигнала могут быть выведены для слушателя, что, по меньшей мере, один канал может содержать только некоторое количество фоновых сигнальных фрагментов входного канала, и что дополнительный канал может содержать комбинацию оставшейся части фоновых сигнальных фрагментов входного канала и прямых сигнальных фрагментов входного канала.
Фиг. 2 демонстрирует устройство в соответствии с дополнительным вариантом осуществления, продемонстрированное более подробно. Это устройство содержит блок 210 разложения на фоновые/прямые сигналы, модуль 220 изменения фона и модуль 230 комбинирования, с функциональными возможностями, аналогичными соответствующим модулям устройства, продемонстрированного в варианте осуществления, изображенном на Фиг. 1. Блок 210 разложения на фоновые/прямые сигналы содержит первый модуль 212 разложения и второй модуль 214 разложения. Первый модуль разложения разлагает первый входной канал 242 входного сигнала устройства. Первый входной канал 242 разлагается на первый фоновый сигнал 252 из группы фоновых сигналов и на первый прямой сигнал 262 из группы прямых сигналов. Кроме того, второй модуль 214 разложения разлагает второй входной канал 244 входного сигнала на второй фоновый сигнал 254 из группы фоновых сигналов и на второй прямой сигнал 264 из группы прямых сигналов. Разложенные фоновые и прямые сигналы обрабатываются так же, как и в устройстве согласно варианту осуществления, продемонстрированному на Фиг. 1. В вариантах осуществления, модуль 220 изменения и модуль 230 комбинирования могут быть выполнены с возможностью осуществления связи друг с другом, что продемонстрировано пунктирной линией 235.
Фиг. 3 демонстрирует устройство для генерирования выходного сигнала в соответствии с дополнительным вариантом осуществления. Входной сигнал, содержащий три входных канала 342, 344, 346 подается на блок 310 разложения на фоновые/прямые сигналы. Это блок 310 разложения на фоновые/прямые сигналы разлагает первый входной канал 342, чтобы извлечь первый фоновый сигнал 352 из группы фоновых сигналов и первый прямой сигнал 362 из группы прямых сигналов. Помимо этого, блок разложения разлагает второй входной канал 344 на второй фоновый сигнал 354 из группы фоновых сигналов и на второй прямой сигнал 364 из группы прямых сигналов. Помимо этого, блок 310 разложения разлагает третий входной канал 346 на третий фоновый сигнал 356 из группы фоновых сигналов и на третий прямой сигнал 366 из группы прямых сигналов. В дополнительных вариантах осуществления, количество входных каналов входного сигнала для устройства не ограничивается тремя каналами, а может иметь место любое количество входных каналов, например, четыре входных канала, пять входных каналов или девять входных каналов. В вариантах осуществления, модуль 320 изменения и модуль 330 комбинирования могут быть выполнены с возможностью осуществления связи друг с другом, что продемонстрировано пунктирной линией 335.
В варианте осуществления, изображенном на Фиг. 3, модуль 320 изменения фона изменяет первый фоновый сигнал 352 из группы фоновых сигналов, чтобы получить первый измененный фоновый сигнал 372. Кроме того, модуль 320 изменения фона изменяет второй фоновый сигнал 354 из группы фоновых сигналов, чтобы получить второй измененный фоновый сигнал 374. В дополнительных вариантах осуществления, модуль 320 изменения фона может комбинировать первый фоновый сигнал 352 и второй фоновый сигнал 354, чтобы получить один или более измененных фоновых сигналов.
Помимо этого, в варианте осуществления, изображенном на Фиг. 3, первый прямой сигнал 362 из группы прямых сигналов подается на модуль 330 комбинирования вместе с первым фоновым сигналом 352 из группы фоновых сигналов. Прямой и фоновый сигналы 362, 352 комбинируются модулем 330 комбинирования, чтобы получить комбинированный сигнал 382. В варианте осуществления, изображенном на Фиг. 3, модуль комбинирования комбинирует первый прямой сигнал 362 из группы прямых сигналов и первый фоновый сигнал 352 из группы фоновых сигналов. В других вариантах осуществления, модуль 330 комбинирования может комбинировать любой другой прямой сигнал из группы прямых сигналов с любым другим фоновым сигналом из группы фоновых сигналов. Например, второй прямой сигнал 364 из группы прямых сигналов может комбинироваться со вторым фоновым сигналом 354 из группы фоновых сигналов. В другом варианте осуществления, второй прямой сигнал 364 из группы прямых сигналов может комбинироваться с третьим фоновым сигналом 356 из группы фоновых сигналов. В дополнительных вариантах осуществления, модуль 330 комбинирования может комбинировать более одного прямого сигнала из группы прямых сигналов и более одного фонового сигнала из группы фоновых сигналов, чтобы получить один или более комбинированных сигналов.
В варианте осуществления, изображенном на Фиг. 3, первый измененный фоновый сигнал 372 выводится в качестве первого выходного канала выходного сигнала. Комбинированный сигнал 382 выводится в качестве второго выходного канала выходного сигнала. Второй измененный фоновый сигнал 374 выводится в качестве третьего выходного канала выходного сигнала. Кроме того, третий фоновый сигнал 356 из группы фоновых сигналов и второй и третий прямые сигналы 364, 366 из группы прямых сигналов выводятся в качестве четвертого, пятого и шестого выходного канала выходного сигнала. В других вариантах осуществления, один или все из сигналов 356, 364, 366 могут вообще не выводиться, а могут отбрасываться.
Фиг. 4 демонстрирует устройство в соответствии с дополнительным вариантом осуществления. Это устройство отличается от устройства, продемонстрированного на Фиг. 1, тем, что дополнительно содержит блок 490 изменения усиления фона. Блок 490 изменения усиления фона изменяет усиление фонового сигнала 452 из группы фоновых сигналов, чтобы получить фоновый сигнал 492 с измененным усилением, подаваемый на модуль 430 комбинирования. Модуль 430 комбинирования комбинирует сигнал 492 с измененным усилением с прямым сигналом 462 из группы прямых сигналов, чтобы получить комбинированный сигнал 482 в качестве выходного сигнала устройства. Изменение усиления может быть переменным во времени. Например в первый момент времени сигнал подвергается изменению усиления с первым коэффициентом изменения усиления, тогда как в отличающийся второй момент времени сигнал подвергается изменению усиления с отличающимся вторым коэффициентом изменения усиления.
Изменение усиления в блоке 490 изменения усиления может проводиться путем умножения амплитуд фонового сигнала 452 на коэффициент <1, чтобы уменьшить вес фонового сигнала 452 в комбинированном сигнале 482. Это позволяет добавить некоторое количество фоновых сигнальных фрагментов входного сигнала в комбинированный сигнал 482, а оставшиеся фоновые фрагменты входного сигнала могут выводиться в качестве измененного фонового сигнала 472.
В альтернативных вариантах осуществления, коэффициент умножения может быть >1, чтобы увеличить вес фонового сигнала 452 в комбинированном сигнале 482, который генерируется модулем 430 комбинирования. Это позволяет улучшить фоновые сигнальные фрагменты и создать иное звуковое впечатление для слушателя.
Несмотря на то, что в варианте осуществления, продемонстрированном на Фиг. 4, только один фоновый сигнал подается в блок 490 изменения усиления фона, в других вариантах осуществления более одного фонового сигнала может подвергаться изменению усиления блоком 490 изменения усиления фона. В таком случае блок изменения усиления изменяет усиление принятых фоновых сигналов и подает фоновые сигналы с измененным усилением в модуль 430 комбинирования.
В других вариантах осуществления, входной сигнал содержит более двух каналов, которые поступают на блок 410 разложения на фоновые/прямые сигналы. Как следствие, в этом случае группа фоновых сигналов содержит более двух фоновых сигналов, а также и группа прямых сигналов содержит более двух прямых сигналов. Соответственно, более двух каналов тоже могут подаваться на блок 490 изменения усиления для изменения усиления. Например, три, четыре, пять или девять входных каналов могут подаваться на блок 490 изменения усиления фона. В вариантах осуществления, модуль 420 изменения и модуль 430 комбинирования могут быть выполнены с возможностью осуществления связи друг с другом, что продемонстрировано пунктирной линией 435.
Фиг. 5 демонстрирует модуль изменения фона в соответствии с одним из вариантов осуществления. Модуль изменения фона содержит блок 522 декорреляции, блок 524 изменения усиления и фильтр 526 нижних частот.
В варианте осуществления, изображенном на Фиг. 5, первый 552, второй 554 и третий 556 фоновые сигналы подаются на блок 522 декорреляции. В других вариантах осуществления, иное количество сигналов может подаваться на блок 522 декорреляции, например, один фоновый сигнал, или два, четыре, пять или девять фоновых сигналов. Блок 522 декорреляции декоррелирует каждый из вводимых фоновых сигналов 552, 554, 556, чтобы получить декоррелированные сигналы 562, 564, 566, соответственно. Блок 522 декорреляции согласно варианту осуществления, изображенному на Фиг. 5, может быть блоком декорреляции любого типа, например, решетчатым всечастотным фильтром или всечастотным фильтром с бесконечной импульсной характеристикой (БИХ).
Затем декоррелированные сигналы 562, 564, 566 подаются в блок 524 изменения усиления. Блок изменения усиления изменяет усиление каждого из введенных сигналов 562, 564, 566, чтобы получить сигналы 572, 574, 576 с измененным усилением, соответственно. Блок 524 изменения усиления может быть выполнено с возможностью умножения амплитуд введенных сигналов 562, 564, 566 на коэффициент, чтобы получить сигналы с измененным усилением. Изменение усиления в блоке 524 изменения усиления может быть переменным во времени. Например в первый момент времени сигнал подвергается изменению усиления с первым коэффициентом изменения усиления, тогда как в отличающийся второй момент времени сигнал подвергается изменению усиления с отличающимся вторым коэффициентом изменения усиления.
После этого, сигналы 572, 574, 576 с измененным усилением подаются в модуль 526 низкочастотной фильтрации. Модуль 526 низкочастотной фильтрации осуществляет низкочастотную фильтрацию каждого из сигналов 572, 574, 576 с измененным усилением, чтобы получить измененные сигналы 582, 584, 586, соответственно. Несмотря на то, что вариант осуществления, изображенный на Фиг. 5, применяет модуль 526 низкочастотной фильтрации, другие варианты осуществления могут применять другие модули, например, частотно-избирательные фильтры или корректирующие фильтры.
Фиг. 6 демонстрирует устройство в соответствии с дополнительным вариантом осуществления. Устройство генерирует выходной сигнал, имеющий девять каналов, например, пять каналов Lh, Rh, Ch, LSh, RSh для горизонтально расположенных громкоговорителей и четыре канала Le, Re, LSe, RSe для приподнятых громкоговорителей, из входного сигнала, имеющего пять входных каналов. Входные каналы входного сигнала содержат левый канал L, правый канал R, центральный канал C, левый канал LS окружающего объемного звука, и правый канал RS окружающего объемного звука.
Пять входных каналов L, R, C, LS, RS подаются в блок 610 разложения на фоновые/прямые сигналы. Блок 610 разложения на фоновые/прямые сигналы разлагает левый сигнал L на фоновый сигнал LA из группы фоновых сигналов и на прямой сигнал LD из группы прямых сигналов. Кроме того, блок 610 разложения на фоновые/прямые сигналы разлагает входной сигнал R на фоновый сигнал RA из группы фоновых сигналов и на прямой сигнал RD из группы прямых сигналов. Помимо этого блок 610 разложения на фоновые/прямые сигналы разлагает левый сигнал LS окружающего объемного звука на фоновый сигнал LSA из группы фоновых сигналов и на прямой сигнал LSD из группы прямых сигналов. Кроме того, блок 610 разложения на фоновые/прямые сигналы разлагает правый сигнал RS окружающего объемного звука на фоновый сигнал RSA из группы фоновых сигналов и на прямой сигнал RSD из группы прямых сигналов.
Блок 610 разложения на фоновые/прямые сигналы не изменяет центральный сигнал C. Вместо этого сигнал C выводится в качестве выходного канала Ch без изменения.
Блок 610 разложения на фоновые/прямые сигналы подает фоновый сигнал LA в первый модуль 621 декорреляции, который декоррелирует сигнал LA. Блок 610 разложения на фоновые/прямые сигналы к тому же переправляет фоновый сигнал на первый модуль 691 изменения усиления в первом блоке изменения усиления. Первый модуль 691 изменения усиления изменяет усиление сигнала LA и подает сигнал с измененным усилением в первый модуль 631 комбинирования. Кроме того, сигнал LD подается блоком 610 разложения на фоновые/прямые сигналы в первый модуль 631 комбинирования. Первый модуль 631 комбинирования комбинирует сигнал LA с измененным усилением и прямой сигнал LD, чтобы получить выходной канал Lh.
Кроме того, блок 610 разложения на фоновые/прямые сигналы подает сигналы RA, LSA и RSA во второй 692, третий 693 и четвертый 694 модули изменения усиления в первом блоке изменения усиления. Второй 692, третий 693 и четвертый 694 модули изменения усиления осуществляют изменение усиления принятых сигналов RA, LSA и RSA, соответственно. Затем второй 692, третий 693 и четвертый 694 модули изменения усиления переправляют сигналы с измененным усилением на второй 632, третий 633 и четвертый 634 модуль комбинирования, соответственно. Помимо этого, блок 610 разложения на фоновые/прямые сигналы подает сигнал RD в модуль 632 комбинирования, подает сигнал LSD в модуль 633 комбинирования и подает сигнал RSD в модуль 634 комбинирования, соответственно. Затем модули 632, 633, 634 комбинирования комбинируют сигналы RD, LSD и RSD с сигналами RA, LSA и RSA с измененным усилением, соответственно, чтобы получить соответственные выходные каналы Rh, LSh и RSh.
Помимо этого, блок 610 разложения на фоновые/прямые сигналы подает сигнал LA в первый модуль 621 декорреляции, где фоновый сигнал LA декоррелируется. Затем первый модуль 621 декорреляции переправляет декоррелированный сигнал LA в пятый модуль 625 изменения усиления во втором блоке изменения усиления, где декоррелированный фоновый сигнал LA подвергается изменению усиления. После этого, пятый модуль 625 изменения усиления переправляет фоновый сигнал LA с измененным усилением в первый модуль 635 низкочастотной фильтрации, где фоновый сигнал с измененным усилением подвергается низкочастотной фильтрации, чтобы получить фоновый сигнал Le с отфильтрованными нижними частотами в качестве выходного канала выходного сигнала устройства.
Таким же образом, блок 610 разложения на фоновые/прямые сигналы переправляет сигналы RA, LSA и RSA на второй 622, третий 623 и четвертый 624 модули декорреляции, которые декоррелируют принятые фоновые сигналы, соответственно. Второй, третий и четвертый модули 622, 623, 624 декорреляции, соответственно, переправляют декоррелированные фоновые сигналы на шестой 626, седьмой 627 и восьмой 628 модуль изменения усиления во втором блоке изменения усиления, соответственно. Шестой, седьмой и восьмой модули 626, 627, 628 изменения усиления изменяют усиление декоррелированных сигналов и переправляют сигналы с измененным усилением на второй 636, третий 637 и четвертый 638 модуль низкочастотной фильтрации, соответственно. Второй, третий и четвертый модули 636, 637, 638 низкочастотной фильтрации осуществляют низкочастотную фильтрацию сигналов с измененным усилением, соответственно, чтобы получить выходные сигналы Re, LSe и RSe с отфильтрованными нижними частотами в качестве выходных каналов выходного сигнала устройства.
В одном из вариантов осуществления, модуль изменения может содержать первый, второй, третий и четвертый модули 621, 622, 623, 624 декорреляции, пятый, шестой, седьмой и восьмой модули 625, 626, 627, 628 изменения усиления и первый, второй, третий и четвертый модули 635, 636, 637, 638 низкочастотной фильтрации. Совместный модуль комбинирования может содержать первый, второй, третий и четвертый модуль 631, 632, 633, 634 комбинирования.
В варианте осуществления, изображенном на Фиг. 6, блок 610 разложения разлагает входные каналы на фоновые сигналы LA, RA, LSA и RSA, которые составляют группу фоновых сигналов, и на прямые сигналы LD, RD, LSD и RSD, которые составляют группу прямых сигналов.
Фиг. 7 демонстрирует структурную схему устройства в соответствии с одним из вариантов осуществления. Это устройство содержит блок 710 выделения фона. Входной сигнал, содержащий пять каналов L, R, C, LS, RS, вводится в блок 710 выделения фона. Блок 710 выделения фона выделяет фоновый фрагмент канала L в качестве фонового канала LA и подает фоновый канал LA в первый модуль 721 декорреляции. Кроме того, блок 710 выделения фона выделяет фоновые фрагменты каналов R, LS, RS в качестве фоновых каналов RA, LSA, RSA и подает фоновые каналы RA, LSA, RSA во второй, третий и четвертый модуль 722, 723, 724 декорреляции, соответственно. Обработка фоновых сигналов продолжается в первом, втором, третьем и четвертом модулях 721, 722, 723, 724 декорреляции, где фоновые сигналы LA, RA, LSA, RSA декоррелируются. Затем декоррелированные фоновые сигналы подвергаются изменению усиления в первом, втором, третьем и четвертом модулях 725, 726, 727, 728 изменения усиления, соответственно. После этого, фоновые сигналы с измененным усилением переправляются на первый, второй, третий и четвертый модули 729, 730, 731, 732 низкочастотной фильтрации, где фоновые сигналы с измененным усилением подвергаются низкочастотной фильтрации, соответственно. После этого, фоновые сигналы выводятся в качестве первого, второго, третьего и четвертого выходного канала Le, Re, LSe, RSe выходного сигнала, соответственно.
Фиг. 8 демонстрирует расстановку громкоговорителей, при котором пять громкоговорителей 810, 820, 830, 840, 850 располагаются на первых высотах в слуховой среде по отношению к слушателю, и при котором громкоговорители 860, 870, 880, 890 располагаются на вторых высотах в слуховой среде по отношению к слушателю, причем вторые высоты отличаются от первых высот.
Пять громкоговорителей 810, 820, 830, 840, 850 расположены горизонтально, т.е. располагаются горизонтально по отношению к позиции слушателя. Четыре других громкоговорителя 860, 870, 880, 890 приподняты, т.е. размещены так, чтобы располагаться выше по отношению к позиции слушателя. В других вариантах осуществления, громкоговорители 810, 820, 830, 840, 850 располагаются горизонтально, тогда как четыре других громкоговорителя 860, 870, 880, 890 опущены, т.е. размещены так, чтобы располагаться ниже по отношению к позиции слушателя. В дополнительных вариантах осуществления, один или более громкоговорителей располагаются горизонтально, один или более громкоговорителей приподняты, а один или более громкоговорителей опущены по отношению к позиции слушателя.
В одном из вариантов осуществления, устройство согласно варианту осуществления, продемонстрированному на Фиг. 6, генерирует выходной сигнал, содержащий девять выходных каналов, подает пять выходных каналов Lh, Rh, Ch, LSh, RSh согласно варианту осуществления, изображенному на Фиг. 6, в горизонтально расположенные громкоговорители 810, 820, 830, 840, 850, соответственно, и подает четыре выходных канала Le, Re, LSe, RSe согласно варианту осуществления, изображенному на Фиг. 6, в приподнятые громкоговорители 860, 870, 880, 890, соответственно.
В дополнительном варианте осуществления, устройство согласно варианту осуществления, продемонстрированному на Фиг. 7, генерирует выходной сигнал, содержащий девять выходных каналов, подает пять выходных каналов L, R, C, LS, RS согласно варианту осуществления, изображенному на Фиг. 7, в горизонтально расположенные громкоговорители 810, 820, 830, 840, 850, соответственно, и подает четыре выходных канала Le, Re, LSe, RSe согласно варианту осуществления, изображенному на Фиг. 6, в приподнятые громкоговорители 860, 870, 880, 890, соответственно.
В одном из вариантов осуществления, предоставляется устройство для генерирования выходного сигнала. Выходной сигнал имеет, по меньшей мере, четыре выходных канала. Помимо этого, выходной сигнал генерируется из входного сигнала, имеющего, по меньшей мере, два входных канала. Это устройство содержит блок выделения фона, который выполнен с возможностью выделения, по меньшей мере, двух фоновых сигналов с фоновыми сигнальными фрагментами из этих, по меньшей мере, двух входных каналов. Блок выделения фона выполнен с возможностью подачи первого входного канала с прямыми и фоновыми сигнальными фрагментами в качестве первого выходного канала в первый горизонтально расположенный громкоговоритель. Помимо этого, блок выделения фона выполнен с возможностью подачи второго входного канала с прямыми и фоновыми сигнальными фрагментами в качестве второго выходного канала во второй горизонтально расположенный громкоговоритель. Кроме того, устройство содержит модуль изменения фона. Модуль изменения фона выполнен с возможностью изменения, по меньшей мере, двух фоновых сигналов, чтобы получить, по меньшей мере, первый измененный фоновый сигнал и второй измененный фоновый сигнал. Кроме того, модуль изменения фона выполнен с возможностью подачи первого измененного фонового сигнала в качестве третьего выходного канала в первый приподнятый громкоговоритель. Помимо этого, модуль изменения фона выполнен с возможностью подачи второго измененного фонового сигнала в качестве четвертого выходного канала во второй приподнятый громкоговоритель. В дополнительных вариантах осуществления, модуль изменения фона может комбинировать первый фоновый сигнал и второй фоновый сигнал, чтобы получить один или более измененных фоновых сигналов.
В одном из вариантов осуществления, множество громкоговорителей располагаются в автотранспортном средстве, например, в легковом автомобиле. Множество громкоговорителей располагаются как горизонтально расположенные громкоговорители и как приподнятые громкоговорители. Устройство в соответствии с одним из вышеописанных вариантов осуществления применяется для генерирования выходных каналов. Выходные каналы, которые содержат только фоновый сигнал, подаются в приподнятые громкоговорители. Выходные каналы, которые являются комбинированными сигналами, содержащими фоновые и прямые сигнальные фрагменты, подаются в горизонтально расположенные громкоговорители.
В вариантах осуществления, один, некоторые или все из приподнятых и/или горизонтально расположенных громкоговорителей могут быть наклонены.
В дальнейшем обсуждаются возможные конфигурации блока разложения на фоновые/прямые сигналы в соответствии с вариантами осуществления.
В данной области техники хорошо известны разнообразные блоки разложения и способы разложения, которые приспособлены для разложения входного сигнала, имеющего два канала, на два фоновых и два прямых сигнала. См., например:
C. Avendano and J.-M. Jot, "A frequency-domain approach to multichannel upmix," Journal of the Audio Engineering Society, vol. 52, no. 7/8, pp. 740-749, 2004 (К. Авендано и Дж.-М. Джот, "Метод многоканального повышающего микширования в частотной области", Журнал Общества инженеров по звуковой технике, том 52, номер 7/8, стр. 740-749, 2004).
C. Faller, "Multiple-loudspeaker playback of stereo signals," Journal of the Audio Engineering Society, vol. 54, no. 11, pp. 1051-1064, November 2006 (К. Фаллер, "Воспроизведение стереофонических сигналов с помощью множества громкоговорителей" Журнал Общества инженеров по звуковой технике, том 54, номер 11, стр. 1051-1064, 2006).
J. Usher and J. Benesty, "Enhancement of spatial sound quality: A new reverberation-extraction audio upmixer," IEEE Transactions on Audio, Speech, and Language Processing, vol. 15, no. 7, pp. 2141-2150, September 2007 (Дж. Ашер и Дж. Бенести, "Повышение качества пространственного звучания: Новое устройство повышающего микширования звукового сигнала с реверберацией и выделением", IEEE, Транзакции при обработке звуковой, речевой и лингвистической информации, том 15, номер 7, стр. 2141-2150, сентябрь 2007).
Далее, со ссылкой на Фиг. 9-16e, представляется блок разложения на фоновые/прямые сигналы, которое разлагает сигнал, имеющий некоторое количество входных каналов, на фоновые и прямые сигнальные составляющие.
Фиг. 9 демонстрирует блок разложения на фоновые/прямые сигналы для разложения входного сигнала 10, имеющего некоторое количество из, по меньшей мере, трех входных каналов или, в общем случае, n входных каналов. Эти входные каналы вводятся в блок 12 понижающего микширования для понижающего микширования входного сигнала, чтобы получить микшированный с понижением сигнал 14, причем блок 12 понижающего микширования выполнен с возможностью понижающего микширования таким образом, чтобы количество каналов понижающего микширования микшированного с понижением сигнала 14, которое обозначено "m", было равно, по меньшей мере, двум и было меньше, чем количество входных каналов входного сигнала 10. Эти m каналов понижающего микширования вводятся в анализатор 16 для анализа микшированного с понижением сигнала, чтобы извлечь результат 18 анализа. Результат 18 анализа вводится в процессор 20 сигналов, при этом процессор сигналов выполнен с возможностью обработки входного сигнала 10 или сигнала, извлеченного из входного сигнала при помощи блока 22 извлечения сигнала, с использованием результата анализа, причем процессор 20 сигналов выполнен с возможностью применения результатов анализа к входным каналам или к каналам сигнала 24, извлеченного из входного сигнала, чтобы получить разложенный сигнал 26.
На Фиг. 9, количество входных каналов равно n, количество каналов понижающего микширования равно m, количество извлеченных каналов равно L, и количество выходных каналов равно L, если извлеченный сигнал, а не входной сигнал обрабатывается процессором сигналов. В ином случае, если блок 22 извлечения сигнала отсутствует, то входной сигнал напрямую обрабатывается процессором сигналов, и тогда количество каналов разложенного сигнала 26, обозначенное "L" на Фиг. 9, будет равно n. Таким образом, Фиг. 9 демонстрирует два разных примера. Один пример не имеет блока 22 извлечения сигнала, и входной сигнал напрямую проводится на процессор 20 сигналов. Другим примером является случай, когда реализован блок 22 извлечения сигнала, и тогда извлеченный сигнал 24, а не входной сигнал 10 обрабатывается процессором 20 сигналов. Блок извлечения сигнала может быть, например, устройством микширования звуковых каналов, таким как устройство повышающего микширования, для генерирования большего числа выходных каналов. В таком случае L было бы больше, чем n. В другом варианте осуществления, блоком извлечения сигнала мог бы быть другой процессор звуковых сигналов, который выполняет взвешивание, задержку или что-либо еще по отношению к входным каналам, и в этом случае количество выходных каналов L для блока 22 извлечения сигнала было бы равно количеству n входных каналов. В дополнительной реализации, блок извлечения сигнала может быть блоком понижающего микширования, который уменьшает количество каналов из входного сигнала для извлеченного сигнала. В этой реализации предпочтительно, чтобы число L по-прежнему было больше, чем количество m микшированных с понижением каналов.
Анализатор используется, чтобы анализировать микшированный с понижением сигнал в отношении воспринимаемых по отдельности составляющих. Эти воспринимаемые по отдельности составляющие могут быть независимыми составляющими в индивидуальных каналах, с одной стороны, и зависимыми составляющими, с другой стороны. Альтернативными сигнальными составляющими для анализа являются прямые составляющие, с одной стороны, и фоновые составляющие, с другой стороны. Есть много других составляющих, которые могут быть отделены, например, речевые составляющие от музыкальных составляющих, шумовые составляющие от речевых составляющих, шумовые составляющие от музыкальных составляющих, высокочастотные шумовые составляющие относительно низкочастотных шумовых составляющих, в сигналах с несколькими основными тонами составляющие, обеспечиваемые разными инструментами, и т.д.
Фиг. 10 демонстрирует другой аспект блока разложения на фоновые/прямые сигналы, когда анализатор реализуется для использования предварительно вычисленной зависящей от частоты корреляционной кривой 16. Таким образом, блок 28 разложения на фоновые/прямые сигналы содержит анализатор 16 для анализа корреляции между двумя каналами анализируемого сигнала, идентичного входному сигналу или связанного с входным сигналом, например, посредством операции понижающего микширования, как продемонстрировано применительно к Фиг. 9. Анализируемый сигнал, который анализируется анализатором 16, имеет, по меньшей мере, два канала для анализа, и анализатор 16 сконфигурирован с возможностью использования предварительно вычисленной зависящей от частоты корреляционной кривой в качестве опорной кривой, для определения результата 18 анализа. Процессор 20 сигналов может работать таким же образом, как обсуждалось применительно к Фиг. 9, и сконфигурирован с возможностью обработки анализируемого сигнала или сигнала, извлеченного из анализируемого сигнала блоком 22 извлечения сигнала, при этом блок 22 извлечения сигнала может быть реализован аналогично тому, как обсуждалось применительно к блоку 22 извлечения сигнала, изображенному на Фиг. 9. В качестве варианта, процессор может обрабатывать сигнал, из которого извлечен анализируемый сигнал, и обработка сигнала использует результат анализа, чтобы извлечь разложенный сигнал. Поэтому в варианте осуществления, изображенном на Фиг. 10, входной сигнал может быть идентичен анализируемому сигналу и, в этом случае анализируемый сигнал также может быть стереофоническим сигналом, имеющим только два канала, как продемонстрировано на Фиг. 10. В качестве альтернативы, анализируемый сигнал может быть извлечен из входного сигнала посредством обработки любого типа, такой, как понижающее микширование, как описано применительно к Фиг. 9, или посредством любой другой обработки, такой, как повышающее микширование или что-нибудь вроде этого. В дополнение к этому, процессор 20 сигналов может быть пригоден для применения обработки сигналов к тому же сигналу, который был введен в анализатор, либо процессор сигналов может применять обработку сигналов к сигналу, из которого был извлечен анализируемый сигнал, например, указанному применительно к Фиг. 9, либо процессор сигналов может применять обработку сигналов к сигналу, который был извлечен из анализируемого сигнала, например, посредством повышающего микширования или чего-нибудь вроде этого.
Таким образом, для процессора сигналов существуют разные возможности, и все эти возможности являются благоприятными вследствие однозначной работы анализатора, использующего предварительно вычисленную зависящую от частоты кривую в качестве опорной кривой, чтобы определить результат анализа.
В дальнейшем обсуждаются дополнительные варианты осуществления. Следует отметить, как обсуждалось применительно к Фиг. 10, что рассматривается даже использование двухканального анализируемого сигнала (без понижающего микширования). Как обсуждалось в различных аспектах применительно к Фиг. 9 и Фиг. 10, которые могут использоваться вместе или как отдельные аспекты, микшированный с понижением сигнал может обрабатываться анализатором, либо двухканальный сигнал, который, возможно, не был сгенерирован посредством понижающего микширования, может обрабатываться анализатором сигналов с использованием предварительно вычисленной опорной кривой. В этой связи, следует отметить, что последующее описание аспектов реализации может применяться к обоим аспектам, схематически продемонстрированным на Фиг. 9 и Фиг. 10, даже если некоторые особенности описываются только для одного аспекта, а не для обоих. К примеру, если рассматривается Фиг. 11, становится ясно, что особенности для частотной области на Фиг. 11 описываются применительно к аспекту, продемонстрированному на Фиг. 9, но понятно, что время/частотное преобразование, которое описано ниже со ссылкой на Фиг. 11, и обратное преобразование, также может применяться и к реализации на Фиг. 10, которая не имеет блок понижающего микширования, но которая имеет предусмотренный анализатор, который использует предварительно вычисленную зависящую от частоты корреляционную кривую.
В частности, предполагается установка блока время/частотного преобразования для преобразования анализируемого сигнала перед вводом анализируемого сигнала в анализатор, и предполагается установка блока частотно/временного преобразования на выходе процессора сигналов для преобразования обработанного сигнала обратно во временную область. Если имеется блок извлечения сигнала, блок время/частотного преобразования может помещаться на входе блока извлечения сигнала, так что блок извлечения сигнала, анализатор и процессор сигналов, все работают в частотной/поддиапазонной области. В данном случае, частота и поддиапазон, по сути, означают фрагмент частоты в частотном представлении.
Кроме того, понятно, что анализатор на Фиг. 9 может быть реализован многими различными способами, но этот анализатор также, в одном варианте осуществления, реализуется и в виде анализатора, обсуждаемого на Фиг. 10, т.е. как анализатор, который использует предварительно вычисленную зависящую от частоты корреляционную кривую, в качестве альтернативы винеровской фильтрации или любому другому методу анализа.
На Фиг. 11, процедура понижающего микширования применяется к произвольному входному сигналу, чтобы извлечь двухканальное представление. Выполняется анализ в частотно-временной области, и вычисляются весовые маски, которые перемножаются с частотно-временным представлением входного сигнала, что продемонстрировано на Фиг. 11.
На рисунке, T/F обозначает время-частотное преобразование; обычно это кратковременное преобразование Фурье (STFT). iT/F обозначает соответственное обратное преобразование.
[x1(n), …, xN(n)] являются входными сигналами во временной области, где n является временным индексом. [X1(m, i), …, XN(m, i)] обозначают коэффициенты частотного разложения, где m является временным индексом разложения, а i является частотным индексом разложения.
[D1(m, i), D2(m, i)] представляют собой два канала микшированного с понижением сигнала.
(1)
W(m, i) является расчетной весомостью. [Y1(m, i), …, YN(m, i)] являются взвешенными частотными разложениями каждого канала. H1j(i) являются коэффициентами понижающего микширования, которые могут быть вещественными или комплексными, и эти коэффициенты могут быть постоянными во времени или переменными во времени. Следовательно, коэффициенты понижающего микширования могут быть только постоянными значениями или фильтрами, такими, как фильтры HRTF, реверберационные фильтры или подобные фильтры.
Yj(m, i)=Wj(m, i)⋅Xj(m, i), где j=(1, 2, …, N) (2)
На Фиг. 11 изображен случай применения одного и того же взвешивания ко всем каналам.
Yj(m, i)=W(m, i)⋅Xj(m, i), где j=(1, 2, …, N) (3)
[y1(n), …, yN(n)] являются выходными сигналами во временной области, содержащими выделенные сигнальные составляющие. (Входной сигнал может иметь произвольное количество каналов (N), произведенных для произвольной целевой громкоговорящей проигрывающей установки. Понижающее микширование может включать в себя HRTF, чтобы получить входные сигналы для уха, моделирование слуховых фильтров, и т.д. Понижающее микширование также может проводиться во временной области).
В одном из вариантов осуществления, разность между опорными корреляциями. (Всюду по этому тексту, термин корреляция используется как синоним межканального подобия, а значит, также может включать в себя оценки временных сдвигов, для которых обычно используется термин когерентность).
Термин подобие включает в себя корреляцию и когерентность, при этом, в строгом математическом смысле, корреляция вычисляется между двумя сигналами без дополнительного временного сдвига, а когерентность вычисляется путем сдвига этих двух сигналов по времени/фазе таким образом, чтобы сигналы имели максимальную корреляцию, и затем вычисляется фактическая корреляция по частоте с примененным сдвигом по времени/фазе. В данном тексте считается, что подобие, корреляция и когерентность означают одно и то же, т.е., количественную степень подобия между двумя сигналами, например, при этом более высокое абсолютное значение подобия означает, что два сигнала более подобны, а более низкое абсолютное значение подобия означает, что два сигнала менее подобны.
Даже если оцениваются временные сдвиги, результирующее значение может иметь знак (обычно, когерентность задается как имеющая только положительные значения), как функция частоты (cref(ω)), и вычисляется фактическая корреляция микшированного с понижением входного сигнала (csig(ω)). В зависимости от отклонения фактической кривой от опорной кривой, вычисляется весовой коэффициент для каждой ячейки время-частота, указывающий, содержит ли она зависимые или независимые составляющие. Полученная частотно-временная весомость указывает независимые составляющие и может применяться уже к каждому каналу входного сигнала, чтобы дать многоканальный сигнал (количество каналов равно количеству входных каналов), включающий в себя независимые части, которые могут восприниматься или как отдельные, или как рассеянные.
Опорная кривая может задаваться по-разному. Примеры:
Идеальная теоретическая опорная кривая для идеализированного двумерного или трехмерного рассеянного звукового поля, состоящего из независимых составляющих.
Идеальная кривая, достижимая эталонной громкоговорящей установкой для данного входного сигнала (например, Стандартной стереофонической установкой с азимутальными углами (±30°), или стандартной пятиканальной установкой в соответствии с ITU-R BS.775, с азимутальными углами (0, ±30°, ±110°)).
Идеальная кривая для фактически имеющейся громкоговорящей установки (фактические позиции могут быть измерены или известны за счет пользовательского ввода. Опорная кривая может быть вычислена, предполагая проигрывание независимых сигналов через заданные громкоговорители).
Фактическая зависящая от частоты кратковременная мощность каждого входного канала может учитываться при вычислении опорного уровня.
Если имеется зависящая от частоты опорная кривая (cref(ω)), могут быть установлены верхний порог (chi(ω)) и нижний порог (clo(ω)) (см. Фиг. 12). Пороговые кривые могут совпадать с опорной кривой (cref(ω)=chi(ω)=(clo(ω)), или могут устанавливаться при предположении о возможности выявления порогов, или они могут быть выведены эвристически.
Если отклонение фактической кривой от опорной кривой находится в заданных порогами границах, текущий элемент дискретизации получает весомость, указывающую независимые составляющие. Выше верхнего порога или ниже нижнего порога, элемент дискретизации указывается как зависимый. Этот показатель может быть двоичным, или плавным (т.е. результатом функции мягких решений). В частности, если верхний и нижний порог совпадает с опорной кривой, применяемая весомость напрямую связана с отклонением от опорной кривой.
На Фиг. 11, позиционное обозначение 32 показывает блок время/частотного преобразования, который может быть реализован как кратковременное преобразование Фурье или как блок фильтров любого типа, генерирующий сигналы поддиапазона, такой, как блок фильтров КЗФ (квадратурный зеркальный фильтр) или что-нибудь вроде этого. Независимо от конкретной реализации блока 32 время/частотного преобразования, на выходе блока время/частотного преобразования имеем, для каждого входного канала xi, спектр для каждого временного периода входного сигнала. А значит, может быть реализован блок 32 время/частотного преобразования, чтобы всегда брать блок входных отсчетов сигнала отдельного канала и вычислять частотное представление, такое как спектр на основе БПФ, со спектральными линиями, проходящими от более низкой частоты к более высокой частоте. Затем, для следующего блока времени, выполняется такая же процедура, так что, в конечном итоге, вычисляется последовательность кратковременных спектров для каждого сигнала входного канала. Некоторый частотный диапазон некоторого спектра, относящийся к некоторому блоку входных отсчетов входного канала, называется "время/частотная ячейка", и предпочтительно, чтобы анализ в анализаторе 16 выполнялся на основе этих время/частотных ячеек. Таким образом, анализатор принимает, в качестве входных данных для одной время/частотной ячейки, спектральное значение на первой частоте для некоторого блока входных отсчетов первого канала D1 понижающего микширования, и принимает значение для той же частоты и того же блока (во времени) второго канала D2 понижающего микширования.
Далее, как для примера продемонстрировано на Фиг. 15, анализатор 16 сконфигурирован с возможностью определения (80) значения корреляции между двумя входными каналами в каждом поддиапазоне и блоке времени, т.е. значения корреляции для время/частотной ячейки. Затем, анализатор 16 находит, в варианте осуществления, продемонстрированном со ссылкой на Фиг. 10 или Фиг. 12, значение корреляции (82) для соответствующего поддиапазона из опорной корреляционной кривой. Если, например, поддиапазон является поддиапазоном, обозначенным 40 на Фиг. 12, то этап 82 дает в результате значение 41, указывающее корреляцию между -1 и +1, и в этом случае значение 41 представляет собой найденное значение корреляции. Далее, на этапе 83, извлечение результата для поддиапазона с использованием определенного значения корреляции из этапа 80 и найденного значения 41 корреляции, полученного на этапе 82, выполняется путем выполнения сравнения и последующего принятия решения, или совершается путем вычисления фактической разности. Результатом может быть, как обсуждалось ранее, двоичный результат, говорящий о том, что в текущей время/частотной ячейке, рассматриваемой в микшированном с понижением/анализируемом сигнале, есть независимые составляющие. Это решение будет принято, если фактически определенное значение корреляции (на этапе 80) равно опорному значению корреляции или достаточно близко к опорному значению корреляции.
Однако, если определяется, что определенное значение корреляции указывает более высокую абсолютную корреляцию, чем опорное значение корреляции, то определяют, что рассматриваемая время/частотная ячейка содержит зависимые составляющие. Следовательно, если корреляция время/частотной ячейки микшированного с понижением или анализируемого сигнала указывает более высокое абсолютное значение корреляции, чем опорная кривая, то можно сказать, что составляющие в этой время/частотной ячейке зависят друг от друга. Однако, если указывается, что корреляция очень близка к опорной кривой, то можно сказать, что составляющие являются независимыми. Зависимые составляющие могут принимать первое весовое значение, например 1, а независимые составляющие могут принимать второе весовое значение, например 0. Предпочтительно, как продемонстрировано на Фиг. 12, если верхний и нижний пороги, которые отнесены от опорной линии, используются для того, чтобы обеспечить лучший результат, более подходящий, чем с использованием одной лишь опорной кривой.
Кроме того, в отношении Фиг. 12, следует отметить, что корреляция может изменяться в интервале от -1 до +1. Корреляция с отрицательным знаком дополнительно указывает фазовый сдвиг на 180° между сигналами. Следовательно, другие корреляции, только в интервале между 0 и 1, тоже могли бы применяться, при этом отрицательная часть корреляции просто становится положительной.
Альтернативный способ вычисления результата состоит в том, чтобы в данный момент вычислить расстояние между значением корреляции, определенным в блоке 80, и найденным значением корреляции, полученным в блоке 82, а затем определить показатель между 0 и 1 в качестве весового коэффициента, основываясь на этом расстоянии. В то время как первый альтернативный вариант (1) на Фиг. 15 дает в результате только значения 0 или 1, вариант (2) дает в результате значения между 0 и 1 и является, в некоторых реализациях, предпочтительным.
Процессор 20 сигналов на Фиг. 11 показан в виде умножителей, а результаты анализа определяют лишь весовой коэффициент, который пересылается от анализатора на процессор сигналов, что показано в 84 на Фиг. 15, а затем применяется к соответствующей время/частотной ячейке входного сигнала 10. Если, например, рассматриваемый в данный момент спектр является 20-ым спектром в последовательности спектров, и если рассматриваемый в данный момент частотный элемент дискретизации является 5-ым частотным элементом дискретизации этого 20-го спектра, то время/частотная ячейка может быть обозначена как (20, 5), где первое число указывает номер блока во времени, а второе число указывает частотный элемент дискретизации в этом спектре. Затем результат анализа для время/частотной ячейки (20, 5) применяется к соответствующей время/частотной ячейке (20, 5) каждого канала входного сигнала на Фиг. 11 или, если реализован блок извлечения сигнала, который продемонстрирован на Фиг. 9, к соответствующей время/частотной ячейке каждого канала извлеченного сигнала.
В дальнейшем более подробно обсуждается вычисление опорной кривой. Однако, для настоящего изобретения, по сути, не важно, как была извлечена опорная кривая. Это может быть произвольная кривая или, например, значения в таблице соответствия, указывающие идеальное или желательное соотношение входных сигналов xj в микшированном с понижением сигнале D или, и применительно к Фиг. 10, в анализируемом сигнале. Последующее извлечение является иллюстративным.
Физическая диффузия звукового поля может быть оценена с помощью способа, предложенного Куком с соавторами (Richard K. Cook, R. V. Waterhouse, R. D. Berendt, Seymour Edelman, and Jr. M.C. Thompson, "Measurement of correlation coefficients in reverberant sound fields," Journal Of The Acoustical Society Of America, vol. 27, no. 6, pp. 1072-1077, November 1955 (Ричард К. Кук, Р. В. Ватерхаус, Р. Д. Берендт, Сеймур Эдельман и М.К. Томпсон мл., "Измерение коэффициентов корреляции в реверберирующих звуковых полях", Журнал Американского Акустического Общества, том 27, Номер 6, стр. 1072-1077, ноябрь 1955)), задействуя коэффициент корреляции (r) устойчивого звукового давления плоских волн в двух пространственно разнесенных точках, как продемонстрировано в следующем уравнении (4)
(4)
где p1(n) и p2(n) являются измерениями звукового давления в двух точках, n является временным индексом, и <⋅> обозначает усреднение по времени. В устойчивом звуковом поле, могут быть получены следующие соотношения:
(для трехмерных звуковых полей), и (5)
(для двумерных звуковых полей), (6)
где d является расстоянием между двумя точками измерения, а является волновым числом, причем λ является длиной волны. (Физическая опорная кривая r(k, d), возможно, уже использовалась как cref для дополнительной обработки.)
Мерой для перцепционной размытости звукового поля является интерауральный коэффициент взаимной корреляции (ρ), измеренный в звуковом поле. Измерение ρ подразумевает фиксированное расстояние между датчиками давления (соответственно, ушами). Учитывая это ограничение, r становится функцией частоты с угловой частотой ω=kc, где c является скоростью звука в воздухе. Кроме того, сигналы давления отличаются от ранее рассмотренных сигналов свободного поля вследствие отражения, дифракции и искривляющих эффектов, вызванных ушными раковинами, головой и туловищем слушателя. Эти эффекты, существенные для пространственной слышимости, описываются передаточными функциями слухового аппарата человека (HRTF). Принимая во внимание эти воздействия, результирующие сигналы давления на ушных входных отверстиях представляют собой pL(n, ω) и pR(n, ω). Для вычисления могут быть использованы измеренные данные HRTF, или могут быть получены приближения с использованием аналитической модели (например, Richard O. Duda and William L. Martens, "Range dependence of the response of a spherical head model," Journal Of The Acoustical Society Of America, vol. 104, no. 5, pp. 3048-3058, November 1998 (Ричард О. Дуда и Уильям Л. Мартенс, "Зависимость от диапазона отклика сферической модели головы", Журнал Американского Акустического Общества, том 104, Номер 5, стр. 3048-3058, ноябрь 1998)).
Поскольку слуховая система человека действует как частотный анализатор с ограниченной избирательностью по частоте, помимо всего прочего может быть введена эта избирательность по частоте. Предполагается, что слуховые фильтры ведут себя подобно фильтрам перекрывающихся полос пропускания. В пояснении следующего примера используется метод критической полосы для приблизительного соответствия этим перекрывающимся полосам пропускания посредством фильтров с прямоугольной характеристикой. Эквивалентная прямоугольная ширина полосы пропускания (ERB) может быть вычислена как функция средней частоты (Brian R. Glasberg and Brian C. J. Moore, "Derivation of auditory filter shapes from notched-noise data," Hearing Research, vol. 47, pp. 103-138, 1990 (Брайан Р. Гласберг и Брайан К. Дж. Мур, "Извлечение форм слуховых фильтров по данным шума с узкополосным провалом в спектре", Исследование Слуха, том 47, стр. 103-138, 1990)). Учитывая, что за слуховой фильтрацией следует бинауральная обработка, ρ должна вычисляться для отдельных частотных каналов, выдавая следующие зависящие от частоты сигналы давления
(7)
(8)
где пределы интегрирования задаются границами критической полосы в соответствии с фактической средней частотой ω. Коэффициенты 1/b(w) могут использоваться или не использоваться в уравнениях (7) и (8).
Если одно из измерений звукового давления опережает или запаздывает с независящей от частоты разницей во времени, может быть оценена когерентность сигналов. Слуховая система человека может использовать такую способность синхронизации по времени. Как правило, интерауральная когерентность вычисляется в пределах ±°1 мс. В зависимости от имеющихся возможностей по обработке данных, вычисления могут быть реализованы с использованием только нулевого значения временного сдвига (для низкого уровня сложности) или когерентности с опережением и запаздыванием по времени (если возможна высокая степень сложности). В данном документе не делается никаких различий между обоими случаями.
Идеальное поведение достигается при рассмотрении идеального рассеянного звукового поля, которое может быть идеализировано как волновое поле, которое состоит из одинаково сильных, некоррелированных плоских волн, распространяющихся во всех направлениях (т.е. наложения бесконечного числа распространяющихся плоских волн со случайными фазовыми соотношениями и равномерно распределенными направлениями распространения). Сигнал, излучаемый громкоговорителем, можно считать плоской волной для слушателя, находящегося достаточно далеко. Это допущение о плоской волне является обычным при стереофоническом проигрывании через громкоговорители. Таким образом, искусственные звуковые поля, воспроизводимые громкоговорителями, состоят из плоских волн с ограниченного числа направлений.
Пусть имеется входной сигнал с N каналами, произведенный для проигрывания через установку с громкоговорителями в позициях [l1, l2, l3, …, lN]. (В случае исключительно горизонтальной проигрывающей установки, li указывает азимутальный угол. В общем случае, li= (азимут, угол подъема) указывает положение громкоговорителя относительно головы слушателя. Если установка, присутствующая в комнате для прослушивания, отличается от эталонной установки, li может, в качестве варианта, отражать позиции громкоговорителей реальной проигрывающей установки). Принимая во внимание эту информацию, для данной установки может быть вычислена интерауральная когерентность опорной кривой ρref для модели рассеянного поля в предположении, что на каждый громкоговоритель подаются независимые сигналы. Мощность сигнала, вносимая каждым входным каналом в каждой частотно-временной ячейке, может учитываться при вычислении опорной кривой. В иллюстративной реализации, ρref используется в качестве cref.
Различные опорные кривые продемонстрированы на Фиг. 16a-16e в качестве примеров зависящих от частоты опорных кривых или корреляционных кривых для разного количества источников звука при разных положениях источников звука и разных ориентаций головы, которые указаны на чертежах (IC= интерауральная когерентность).
В дальнейшем более подробно обсуждается вычисление результатов анализа, что обсуждалось применительно к Фиг. 15, основываясь на опорных кривых.
Цель состоит в том, чтобы вывести весомость, равную 1, если корреляция микшированных с понижением каналов равна вычисленной опорной корреляции в предположении о независимых сигналах, проигрываемых из всех громкоговорителей. Если корреляция понижающего микширования равна +1 или -1, выведенная весомость должна быть равна 0, указывая на то, что независимые составляющие отсутствуют. Между этими предельными случаями, весомость должна корректно отражать переход от обозначения независимого (W=1) до полностью зависимого (W=0).
Если имеется опорная корреляционная кривая cref(ω) и оценка корреляции/когерентности фактического входного сигнала, проигрываемого через фактическую воспроизводящую установку (csig(ω)) (csig является корреляция соответствующей когерентностью понижающего микширования), может быть вычислено отклонение csig(ω) от cref(ω). Это отклонение (в том числе, возможно, верхний и нижний порог) сопоставляется с диапазоном [0; 1] для получения весомости (W(m, i)), которая применяется ко всем входным каналам, чтобы разделить независимые составляющие.
Следующий пример демонстрирует возможное сопоставление, когда пороги соответствуют опорной кривой:
Величина отклонения (обозначенная как Δ) фактической кривой csig от опорной cref имеет вид
Δ(ω)=|csig(ω)−cref(ω)| (9)
Принимая во внимание, что корреляция/когерентность заключена между [-1; +1], максимально возможное отклонение относительно +1 или -1 для каждой частоты имеет вид
(10)
(11)
Весомость для каждой частоты, таким образом, получается из следующего
(12)
Учитывая временную зависимость и ограниченное разрешение по частоте частотного разложения, весовые значения выводятся следующим образом (Здесь дается общий случай опорной кривой, которая может меняться с течением времени. Независящая от времени опорная кривая (т.е. cref(i)) тоже возможна):
(13)
Такая обработка может быть проведена в частотном разложении с частотными коэффициентами, сгруппированными в обусловленные восприятием поддиапазоны, ввиду сложности вычислений и чтобы получить фильтры с более короткими импульсными характеристиками. Кроме того, могли бы применяться сглаживающие фильтры, а могут применяться функции сжатия (т.е. желательным образом искажающие весомость, дополнительно вводящие минимальные и/или максимальные весовые значения).
Фиг. 13 демонстрирует дополнительную реализацию, в которой блок понижающего микширования реализован с использованием HRTF и слуховых фильтров, как продемонстрировано. Кроме того, Фиг. 13 дополнительно демонстрирует, что результаты анализа, выводимые анализатором 16, являются весовыми коэффициентами для каждого время/частотного элемента дискретизации, а процессор 20 сигналов продемонстрирован в виде устройства выделения для выделения независимых составляющих. Тогда выходными данными процессора 20 являются, опять же, N каналов, но каждый канал теперь включает в себя только независимые составляющие и больше не включает в себя зависимые составляющие. В этой реализации, анализатор будет вычислять весомость так, чтобы в первой реализации, изображенной на Фиг. 15, независимая составляющая принимала весовое значение 1, а зависимая составляющая принимала весовое значение 0. Тогда, время/частотной ячейки в исходных N каналах, обработанных процессором 20, которые имеют зависимые составляющие, будут установлены на 0.
В другом альтернативном варианте, в котором есть весовые значения между 0 и 1, на Фиг. 15, анализатор будет вычислять весомость так, чтобы время/частотная ячейка с небольшим расстоянием до опорной кривой принимала высокое значение (более близкое к 1), а время/частотная ячейка с большим расстоянием до опорной кривой принимала небольшой весовой коэффициент (находящийся ближе к 0). В последующем взвешивании, продемонстрированном, например, на Фиг. 11 в устройстве 20, независимые составляющие будут, в таком случае, усилены, тогда как зависимые составляющие будут ослаблены.
Однако, если процессор 20 сигналов был бы реализован не для выделения независимых составляющих, а для выделения зависимых составляющих, то назначались бы весомости с обратным знаком, так что при выполнении взвешивания в умножителях 20, продемонстрированных на Фиг. 11, независимые составляющие будут ослаблены, а зависимые составляющие будут усилены. Следовательно, каждый процессор сигналов может применяться для выделения сигнальных составляющих, так как определение фактически выделенных сигнальных составляющих определяется фактическим назначением весовых значений.
Фиг. 14 изображает вариант общей концепции. N-канальный входной сигнал подается на генератор анализируемого сигнала (ASG). Генерирование M-канального анализируемого сигнала может включать в себя, например, модель распространения от каналов/громкоговорителей к ушам или другие способы, именуемые как понижающее микширование в этом документе. Указание отдельных составляющих основывается на анализируемом сигнале. Маски, указывающие различные составляющие, применяются к входным сигналам (A-выделение/D-выделение (20a, 20b)). Взвешенные входные сигналы могут быть дополнительно обработаны (A-постобработка/D-постобработка (70a, 70b)), чтобы дать выходные сигналы с характерным признаком, причем в этом примере были выбраны обозначения "A" и "D", чтобы указать, что составляющие, которые будут выделены, могут представлять собой "Ambience" - окружающий фон, и "Direct Sound" - прямой звук.
Согласно одному варианту осуществления, предоставлено устройство для генерирования выходного сигнала, имеющего по меньшей мере четыре выходных канала, из входного сигнала, имеющего по меньшей мере два входных канала. Упомянутое устройство содержит:
блок (710) выделения фона, выполненный с возможностью выделения, по меньшей мере, двух фоновых сигналов с фоновыми сигнальными фрагментами из упомянутых, по меньшей мере, двух входных каналов,
модуль (120; 220; 320; 420) изменения фона, выполненный с возможностью изменения упомянутых, по меньшей мере, двух фоновых сигналов, чтобы получить, по меньшей мере, первый измененный фоновый сигнал и второй измененный фоновый сигнал,
по меньшей мере четыре динамика, при этом два динамика из упомянутых по меньшей мере четырех динамиков расположены на первых высотах в слуховой среде по отношению к слушателю, при этом два дополнительных динамика из упомянутых по меньшей мере четырех динамиков расположены на вторых высотах в слуховой среде по отношению к слушателю, причем вторые высоты отличаются от первых высот,
при этом модуль изменения фона выполнен с возможностью подачи первого измененного фонового сигнала в качестве третьего выходного канала в первый динамик из двух дополнительных динамиков, и при этом модуль изменения фона выполнен с возможностью подачи второго измененного фонового сигнала в качестве четвертого выходного канала во второй динамик из двух дополнительных динамиков, и при этом устройство для генерирования выходного сигнала выполнено с возможностью подачи первого входного канала с прямыми и фоновыми сигнальными фрагментами в качестве первого выходного канала в первый горизонтально расположенный динамик, и при этом блок выделения фона выполнен с возможностью подачи второго входного канала с прямыми и фоновыми сигнальными фрагментами в качестве второго выходного канала во второй горизонтально расположенный динамик.
Согласно конкретному варианту осуществления, упомянутый модуль изменения фона может, например, быть выполнен с возможностью не подавать прямые сигнальные фрагменты в упомянутые два вторых динамика, или, в дополнение к прямым сигнальным фрагментам, подавать только прямые сигнальные фрагменты в упомянутые два дополнительных динамика, которые ослаблены относительно прямой сигнальной составляющей, подаваемой в упомянутые два динамика.
Согласно другому варианту осуществления, предоставлен способ генерирования выходного сигнала, имеющего по меньшей мере четыре выходных канала для по меньшей мере четырех динамиков из входного сигнала, имеющего по меньшей мере два входных канала. При два динамика из упомянутых по меньшей мере четырех динамиков расположены на первых высотах в слуховой среде по отношению к слушателю, при этом два дополнительных динамика из упомянутых по меньшей мере четырех динамиков расположены на вторых высотах в слуховой среде по отношению к слушателю, причем вторые высоты выше двух первых высот. При этом упомянутый способ содержит этапы, на которых:
- Выделяют по меньшей мере два фоновых сигнала с фоновыми сигнальными фрагментами из упомянутых по меньшей мере двух входных каналов.
- Изменяют упомянутые по меньшей мере два фоновых сигнала, чтобы получить по меньшей мере первый измененный фоновый сигнал и второй измененный фоновый сигнал для упомянутых по меньшей мере четырех динамиков.
- Подают первый измененный фоновый сигнал в качестве третьего выходного канала в первый динамик из упомянутых двух дополнительных динамиков.
- Подают второй измененный фоновый сигнал в качестве четвертого выходного канала во второй динамик из упомянутых двух дополнительных динамиков.
- Подают первый входной канал с прямыми и фоновыми сигнальными фрагментами в качестве первого выходного канала в первый горизонтально расположенный динамик, и
- Подают второй входной канал с прямыми и фоновыми сигнальными фрагментами в качестве второго выходного канала во второй горизонтально расположенный динамик
Согласно дополнительному варианту осуществления, предоставлена компьютерная программа для выполнения вышеупомянутого способа, при исполнении этой компьютерной программы компьютером или процессором.
Хотя некоторые аспекты были описаны применительно к устройству, понятно, что эти аспекты также представляют описание соответствующего способа, в котором блок или устройство соответствуют этапу способа или функции этапа способа. Аналогично, аспекты, описанные применительно к этапу способа, также представляют описание соответствующего блока или элемента или функции соответствующего устройства.
Разложенный сигнал согласно изобретению может быть сохранен на цифровом запоминающем носителе или может быть передан по передающей среде, такой, как беспроводная передающая среда или проводная передающая среда, например, сеть Интернет.
В зависимости от определенных требований к реализации, варианты осуществления настоящего изобретения могут быть реализованы в аппаратном обеспечении или в программном обеспечении. Реализация может быть выполнена с использованием цифрового запоминающего носителя, например, гибкого диска, DVD, CD, ROM, PROM, EPROM, EEPROM или флэш-памяти, с сохраненными на нем считываемыми с помощью электроники управляющими сигналами, которые взаимодействуют (или способны взаимодействовать) с программируемой вычислительной системой так, чтобы выполнялся соответствующий способ.
Некоторые варианты осуществления в соответствии с настоящим изобретением содержат долговременный носитель данных с электронно-считываемыми управляющими сигналами, которые способны взаимодействовать с программируемой вычислительной системой, так чтобы выполнялся один из способов, описанных в данном документе.
В большинстве случаев, варианты осуществления настоящего изобретения могут быть реализованы в виде компьютерного программного продукта с программным кодом, при этом программный код управляет выполнением одного из способов, когда компьютерный программный продукт работает на компьютере. Программный код, например, может храниться на машиночитаемом носителе.
Другие варианты осуществления содержат компьютерную программу для выполнения одного из способов, описанных в данном документе, хранящуюся на машиночитаемом носителе.
Другими словами, одним из вариантов осуществления способа согласно изобретению, следовательно, является компьютерная программа с программным кодом для выполнения одного из способов, описанных в данном документе, при работе этой компьютерной программы на компьютере.
Дополнительным вариантом осуществления способов согласно изобретению, следовательно, является носитель данных (или цифровой запоминающий носитель, или компьютерно-читаемый носитель), содержащий записанную на нем компьютерную программу для выполнения одного из способов, описанных в данном документе.
Дополнительным вариантом осуществления способа согласно изобретению, следовательно, является поток данных или последовательность сигналов, представляющих компьютерную программу для выполнения одного из способов, описанных в данном документе. Поток данных или последовательность сигналов могут быть, например, скомпонованы с возможностью переноса через соединение передачи данных, например, через сеть Интернет.
Дополнительный вариант осуществления содержит средство обработки, например компьютер, или программируемое логическое устройство, сконфигурированное с возможностью или выполненное с возможностью выполнения одного из способов, описанных в данном документе.
Дополнительный вариант осуществления содержит компьютер с установленной на нем компьютерной программой для выполнения одного из способов, описанных в данном документе.
В некоторых вариантах осуществления, программируемое логическое устройство (например, программируемая вентильная матрица) может использоваться для выполнения некоторых или всех функциональных возможностей способов, описанных в данном документе. В некоторых вариантах осуществления, программируемая вентильная матрица может взаимодействовать с микропроцессором для того, чтобы выполнять один из способов, описанных в данном документе. Как правило, предпочтительно, чтобы способы выполнялись какими-нибудь аппаратными инструментальными средствами.
Описанные выше варианты осуществления представляют собой лишь иллюстрацию принципов настоящего изобретения. Понятно, что модификации и изменения конструкций и деталей, описанных в данном документе, будут очевидны для специалистов в данной области техники. Следовательно, изобретение предназначено быть ограниченным только объемом приведенной далее формулы изобретения, а не конкретными деталями, представленными посредством описания и разъяснения вариантов осуществления в данном документе.
Изобретение относится к обработке звуковых сигналов и предназначено для генерирования выходного сигнала с применением блока разложения сигнала. Технический результат - повышение точности распознавания звуковых сигналов. Устройство содержит два выходных канала и один входной канал, блок выделения фона, выполненный с возможностью выделения одного фонового сигнала с фоновыми сигнальными фрагментами из упомянутого одного входного канала, модуль изменения фона, выполненный с возможностью изменения упомянутого одного фонового сигнала, чтобы получить первый измененный фоновый сигнал и два динамика. При этом первый динамик расположен на первых высотах в слуховой среде по отношению к слушателю, а второй динамик расположен на вторых высотах в слуховой среде по отношению к слушателю, причем вторые высоты отличаются от первых высот. При этом устройство выполнено с возможностью подачи первого измененного фонового сигнала во второй динамик, а также выполнено с возможностью подачи первого входного канала с прямыми и фоновыми сигнальными фрагментами в первый динамик, являющийся первым горизонтально расположенным динамиком. 3 н. и 4 з.п. ф-лы, 20 ил.
1. Устройство для генерирования выходного сигнала, имеющего по меньшей мере два выходных канала, из входного сигнала, имеющего по меньшей мере один входной канал, причем упомянутое устройство содержит:
блок (710) выделения фона, выполненный с возможностью выделения по меньшей мере одного фонового сигнала с фоновыми сигнальными фрагментами из упомянутого по меньшей мере одного входного канала,
модуль (120; 220; 320; 420) изменения фона, выполненный с возможностью изменения упомянутого по меньшей мере одного фонового сигнала, чтобы получить по меньшей мере первый измененный фоновый сигнал,
по меньшей мере два динамика, при этом первый динамик из упомянутых по меньшей мере двух динамиков расположен на первых высотах в слуховой среде по отношению к слушателю, при этом второй динамик из упомянутых по меньшей мере двух динамиков расположен на вторых высотах в слуховой среде по отношению к слушателю, причем вторые высоты отличаются от первых высот,
при этом упомянутое устройство для генерирования выходного сигнала выполнено с возможностью подачи первого измененного фонового сигнала во второй динамик, и при этом упомянутое устройство для генерирования выходного сигнала выполнено с возможностью подачи первого входного канала с прямыми и фоновыми сигнальными фрагментами в первый динамик, являющийся первым горизонтально расположенным динамиком.
2. Устройство по п. 1, в котором выходной сигнал имеет по меньшей мере четыре выходных канала, являющихся по меньшей мере двумя выходными каналами,
в котором входной сигнал имеет по меньшей мере два входных канала в качестве по меньшей мере одного входного звукового канала,
при этом упомянутое устройство выполнено с возможностью генерирования выходного сигнала, имеющего по меньшей мере четыре выходных канала, из входного сигнала, имеющего по меньшей мере два входных канала,
причем по меньшей мере один фоновый сигнал представляет собой по меньшей мере два фоновых сигнала,
при этом блок (710) выделения фона выполнен с возможностью выделения по меньшей мере двух фоновых сигналов с фоновыми сигнальными фрагментами из упомянутых по меньшей мере двух входных каналов,
причем модуль (120; 220; 320; 420) изменения фона выполнен с возможностью изменения упомянутых по меньшей мере двух фоновых сигналов, чтобы получить по меньшей мере первый измененный фоновый сигнал и второй измененный фоновый сигнал,
при этом по меньшей мере два динамика представляют собой по меньшей мере четыре динамика, и при этом упомянутое устройство содержит по меньшей мере четыре динамика, причем первый динамик является одним из двух первых динамиков из упомянутых по меньшей мере четырех динамиков, и причем второй динамик является одним из двух вторых динамиков из упомянутых по меньшей мере четырех динамиков, при этом два первых динамика расположены на первых высотах в слуховой среде по отношению к слушателю, при этом два вторых динамика расположены на вторых высотах в слуховой среде по отношению к слушателю,
при этом упомянутое устройство для генерирования выходного сигнала выполнено с возможностью подачи первого измененного фонового сигнала в качестве третьего выходного канала в один из двух вторых динамиков, и при этом упомянутое устройство для генерирования выходного сигнала выполнено с возможностью подачи второго измененного фонового сигнала в качестве четвертого выходного канала в другой из двух вторых динамиков, и
при этом устройство для генерирования выходного сигнала выполнено с возможностью подачи одного из по меньшей мере двух входных каналов с прямыми и фоновыми сигнальными фрагментами в качестве первого выходного канала в один из двух первых динамиков, являющийся первым горизонтально расположенным динамиком, и при этом устройство для генерирования выходного сигнала выполнено с возможностью подачи другого из по меньшей мере двух входных каналов с прямыми и фоновыми сигнальными фрагментами в качестве второго выходного канала в другой из двух первых динамиков, являющийся вторым горизонтально расположенным динамиком.
3. Устройство по п. 2, в котором устройство для генерирования выходного сигнала выполнено с возможностью не подавать прямые сигнальные фрагменты в упомянутые два вторых динамика или подавать прямые сигнальные фрагменты в упомянутые два вторых динамика, которые ослаблены относительно прямой сигнальной составляющей, подаваемой в упомянутые два первых динамика.
4. Способ генерирования выходного сигнала, имеющего по меньшей мере два выходных канала, из входного сигнала, имеющего по меньшей мере один входной канал, при этом первый динамик из упомянутых по меньшей мере двух динамиков расположен на первых высотах в слуховой среде по отношению к слушателю, при этом второй динамик из упомянутых по меньшей мере двух динамиков расположен на вторых высотах в слуховой среде по отношению к слушателю, причем вторые высоты отличаются от первых высот, при этом упомянутый способ содержит этапы, на которых:
выделяют по меньшей мере один фоновый сигнал с фоновыми сигнальными фрагментами из упомянутого по меньшей мере одного входного канала,
изменяют упомянутый по меньшей мере один фоновый сигнал, чтобы получить по меньшей мере первый измененный фоновый сигнал, и
подают первый измененный фоновый сигнал во второй динамик, и
подают первый входной канал с прямыми и фоновыми сигнальными фрагментами в первый динамик, являющийся первым горизонтально расположенным динамиком.
5. Способ по п. 4,
в котором выходной сигнал имеет по меньшей мере четыре выходных канала, являющихся по меньшей мере двумя выходными каналами,
в котором входной сигнал имеет по меньшей мере два входных канала в качестве по меньшей мере одного входного звукового канала,
при этом упомянутый способ содержит этап генерирования выходного сигнала, имеющего по меньшей мере четыре выходных канала, из входного сигнала, имеющего по меньшей мере два входных канала,
причем по меньшей мере один фоновый сигнал представляет собой по меньшей мере два фоновых сигнала,
при этом упомянутый способ содержит этап изменения упомянутых по меньшей мере двух фоновых сигналов, чтобы получить по меньшей мере первый измененный фоновый сигнал и второй измененный фоновый сигнал,
при этом по меньшей мере два динамика представляют собой по меньшей мере четыре динамика, причем первый динамик является одним из двух первых динамиков из упомянутых по меньшей мере четырех динамиков, и причем второй динамик является одним из двух вторых динамиков из упомянутых по меньшей мере четырех динамиков,
при этом два первых динамика расположены на первых высотах в слуховой среде по отношению к слушателю, при этом два вторых динамика расположены на вторых высотах в слуховой среде по отношению к слушателю,
при этом упомянутый способ содержит этап подачи первого измененного фонового сигнала в качестве третьего выходного канала в один из двух вторых динамиков, и при этом упомянутый способ содержит этап подачи второго измененного фонового сигнала в качестве четвертого выходного канала в другой из двух вторых динамиков, и при этом один из по меньшей мере двух входных каналов с прямыми и фоновыми сигнальными фрагментами подается в качестве первого выходного канала в один из двух первых динамиков, являющийся первым горизонтально расположенным динамиком, и при этом другой из по меньшей мере двух входных каналов с прямыми и фоновыми сигнальными фрагментами подается в качестве второго выходного канала в другой из двух первых динамиков, являющийся вторым горизонтально расположенным динамиком.
6. Способ по п. 5, в котором прямые сигнальные фрагменты не подаются в упомянутые два вторых динамика или в котором прямые сигнальные фрагменты подаются в упомянутые два вторых динамика, которые ослаблены относительно прямой сигнальной составляющей, подаваемой в упомянутые два первых динамика.
7. Компьютерно-читаемый носитель, содержащий компьютерную программу для выполнения способа по одному из пп. 4-6 при исполнении этой компьютерной программы компьютером или процессором.
Станок для изготовления деревянных ниточных катушек из цилиндрических, снабженных осевым отверстием, заготовок | 1923 |
|
SU2008A1 |
Способ обработки целлюлозных материалов, с целью тонкого измельчения или переведения в коллоидальный раствор | 1923 |
|
SU2005A1 |
УСТРОЙСТВО КОДИРОВАНИЯ СИГНАЛА, УСТРОЙСТВО ДЕКОДИРОВАНИЯ СИГНАЛА, НОСИТЕЛЬ ЗАПИСИ И СПОСОБ КОДИРОВАНИЯ И ДЕКОДИРОВАНИЯ | 1994 |
|
RU2131169C1 |
Приспособление для суммирования отрезков прямых линий | 1923 |
|
SU2010A1 |
Пресс для выдавливания из деревянных дисков заготовок для ниточных катушек | 1923 |
|
SU2007A1 |
US 7636443 B2, 22.12.2009. |
Авторы
Даты
2019-07-02—Публикация
2012-05-08—Подача