Область технического применения
[0001] Настоящее изобретение относится к обработке звукового сигнала и, в частности, к устройству и соответствующему способу улучшения звукового сигнала FM-стереофонического радиоприемника.
Предпосылки
[0002] В аналоговой FM-стереофонической радиосистеме (стереофонической радиосистеме с частотной модуляцией) левый канал (L) и правый канал (R) звукового сигнала передаются в среднем-побочном (M/S) представлении, т.е. как средний канал (М) и побочный канал (S). Средний канал М соответствует суммарному сигналу L и R, например, M=(L+R)/2, а побочный канал S соответствует разностному сигналу L и R, например, S=(L-R)/2. Для передачи побочный сигнал S модулируется на подавленной несущей 38 КГц и добавляется к немодулированному среднему сигналу М, образуя обратно совместимый уплотненный стереофонический сигнал. Этот уплотненный сигнал затем используется для модуляции ВЧ (высокочастотной) несущей FM-передатчика, который, как правило, функционирует в диапазоне 87,5-108 МГц.
[0003] Когда качество приема уменьшается (т.е. уменьшается соотношение сигнал-шум в радиоканале), канал S, как правило, страдает сильнее канала М. Во многих реализациях FM-приемника канал S заглушается тогда, когда условия приема становятся слишком зашумленными. Это означает, что в случае слабого ВЧ-радиосигнала приемник переходит на пониженный уровень от стереофонического сигнала к монофоническому.
[0004] Параметрическое стереофоническое (PS) кодирование представляет собой технологию из области кодирования звукового сигнала с очень низкой битовой скоростью передачи данных. PS позволяет кодировать 2-канальный стереофонический звуковой сигнал как монофонический низведенный сигнал в сочетании с дополнительной информацией PS, т.е. с параметрами PS. Монофонический низведенный сигнал получается как комбинация обоих каналов стереофонического сигнала. Параметры PS позволяют PS-декодеру реконструировать стереофонический сигнал из монофонического низведенного сигнала и дополнительной информации PS. Как правило, параметры PS являются зависящими от времени и от частоты, и обработка в PS-декодере, как правило, выполняется в области гибридного блока фильтров, включающего блок QMF. Документ «Low Complexity Parametric Stereo Coding in MPEG-4», Heiko Pumhagen, Proc. Digital Audio Effects Workshop (DAFx), pp.163-168, Naples, IT, Oct. 2004, описывает иллюстративную систему PS-кодирования для MPEG-4. Обсуждение из этого документа, относящееся к параметрическому стереофоническому кодированию, ссылкой включается в настоящее описание. Параметрическое стереофоническое кодирование поддерживается, например, MPEG-4 Audio. Параметрическое стереофоническое кодирование обсуждается в разделе 8.6.4 и приложениях 8.А и 8.С документа стандартизации MPEG-4 ISO/IEC 14496-3:2005 (MPEG-4 Audio, 3rd edition). Эти части документа стандартизации ссылкой включаются в настоящее описание во всех отношениях. Параметрическое стереофоническое кодирование также используется в стандарте MPEG Surround (см. документ ISO/IEC 23003-1:2007, MPEG Surround). Этот документ также включается ссылкой в настоящее описание во всех отношениях. Дальнейшие примеры систем параметрического стереофонического кодирования обсуждены в документе «Binaural Cue Coding - Part I: Psychoacoustic Fundamentals and Design Principles», Frank Baumgarte and Christof Faller, IEEE Transactions on Speech and Audio Processing, vol.11, no 6, pages 509-519, November 2003, и в документе «Binaural Cue Coding - Part II: Schemes and Applications», Christof Faller and Frank Baumgarte, IEEE Transactions on Speech and Audio Processing, vol.11, no 6, pages 520-531, November 2003. В последних двух документах используется термин «бинауральное кодирование сигнала», который является примером параметрического стереофонического кодирования.
[0005] Даже в том случае, когда средний сигнал М имеет приемлемое качество, побочный сигнал S может быть зашумленным и, таким образом, может сильно уменьшать общее качество звукового сигнала при микшировании в левый и правый каналы выходного сигнала (которые выводятся, например, в соответствии с соотношениями L=M+S и R=M-S). Если побочный сигнал S имеет лишь плохое или среднее качество, существует две возможности: приемник либо выбирает прием шума, связанного с побочным сигналом S, и выводит реальный стереофонический сигнал, либо сбрасывает побочный сигнал S и переходит на пониженный уровень монофонического сигнала.
[0005а] В документе WO 2008/032255 описан декодер, который располагается для модификации зоны наилучшего восприятия пространственного М-канального звукового сигнала путем модификации пространственных параметров. А именно: приемник принимает N-канальный звуковой сигнал, где N<M. М-канальный сигнал может представлять собой звуковой сигнал MPEG Surround, а N-канальный звуковой сигнал может представлять собой стереофонический сигнал. Блок параметров определяет пространственные параметры, связывающие N-канальный звуковой сигнал с М-канальным звуковым сигналом, и блок модификации модифицирует зону наилучшего восприятия пространственного М-канального звукового сигнала путем модификации, по меньшей мере, одного из пространственных параметров. Затем блок генерирования генерирует пространственный М-канальный звуковой сигнал путем повышающего микширования N-канального звукового сигнала с использованием, по меньшей мере, одного модифицированного пространственного параметра.
Краткое описание изобретения
[0006] Первая особенность изобретения относится к устройству для улучшения звукового сигнала FM-стереофонического радиоприемника. Устройство генерирует стереофонический звуковой сигнал. Звуковой сигнал, который необходимо улучшить, может представлять собой звуковой сигнал в представлении L/R, т.е. звуковой сигнал L/R, или, в альтернативном варианте осуществления изобретения, - звуковой сигнал в представлении M/S, т.е. звуковой сигнал M/S. Как правило, звуковой сигнал, подвергаемый улучшению представляет собой звуковой сигнал в представлении L/R, поскольку традиционные FM-радиоприемники используют выходной сигнал L/R.
[0007] В качестве одного из иллюстративных вариантов осуществления настоящего изобретения, устройство предназначено для FM-стереофонического радиоприемника, сконфигурированного для приема FM-радиосигнала, включающего средний сигнал и побочный сигнал.
[0008] Устройство включает этап оценки параметров параметрического стереофонического кодирования (PS). Этап оценки параметров сконфигурирован для определения одного или нескольких параметров PS на основе звукового сигнала L/R, или M/S, зависящим от частоты, или не зависящим от частоты, образом. Один или несколько параметров могут включать параметр, указывающий различия в интенсивности между каналами (IID, которые также называются CLD - различия в уровне каналов), и/или параметр, указывающий взаимную корреляцию между каналами (ICC). Эти параметры PS предпочтительно являются зависящими от времени и от частоты.
[0009] Кроме того, устройство включает этап повышающего микширования. Этап повышающего микширования сконфигурирован для генерирования стереофонического сигнала на основе первого звукового сигнала и одного или нескольких параметров PS.
[0010] Первый звуковой сигнал получается из звукового сигнала L/R, или M/S, например, посредством операции понижающего микширования на этапе понижающего микширования. В случае L/R-представления первый звуковой сигнал может быть получен из звукового сигнала посредством операции понижающего микширования в соответствии со следующей формулой: DM=(L+R)/а, где DM соответствует первому звуковому сигналу. Параметр а выбирается равным, например, 2. В случае DM=(L+R)/a первый звуковой сигнал в значительной мере соответствует принимаемому среднему сигналу М. В более совершенных схемах адаптивного понижающего микширования параметры а 1 и a 2, предназначенные для комбинирования двух каналов в соответствии с формулой DM=L/a 1+R/a 2, могут быть различными и/или могут зависеть от параметров PS и/или других свойств сигнала.
[0011] В случае M/S-представления на выходе FM-стереофонического радиоприемника первый звуковой сигнал может просто соответствовать сигналу М звукового сигнала M/S на выходе.
[0012] Этап оценки параметров PS может составлять часть PS-кодера. Этап повышающего микширования может составлять часть PS-декодера.
[0013] Устройство основывается на идее, что, по причине шума, побочный сигнал может быть недостаточно хорош для реконструкции стереофонического сигнала путем простого комбинирования принимаемых побочного и среднего сигналов; тем не менее, в этом случае побочный сигнал, или составляющая побочного сигнала в сигнале L/R, может быть достаточно хорош для анализа стереофонических параметров на этапе оценки параметров PS. Указанные параметры PS могут затем использоваться для реконструкции стереофонического сигнала.
[0014] Таким образом, устройство позволяет осуществлять улучшенный прием стереофонического сигнала в условиях среднего, или даже высокого, шума в побочном сигнале. Следует отметить, что термин «шум» обычно используется в данном описании в отношении шума, вносимого ограничениями радиопередающего канала (в отличие от шумоподобной составляющей сигнала, возникающей в фактическом звуковом сигнале, передаваемом посредством радиовещания).
[0015] Для создания стереофонического звукового сигнала вместо принимаемого зашумленного побочного сигнала может использоваться улучшенный побочный сигнал, генерируемый в приемнике. Улучшенный побочный сигнал может генерироваться при помощи технологий PS-кодирования. Они включают, например, генерирование составляющих улучшенного побочного сигнала при помощи декоррелятора, действующего на первый звуковой сигнал как на входной сигнал. Данные об условиях приема и/или об анализе принимаемого стереофонического сигнала могут быть использованы для адаптивного управления генерированием улучшенного побочного сигнала, а также для генерирования выходных звуковых сигналов.
[0016] Согласно другому варианту осуществления изобретения, устройство также включает декоррелятор, сконфигурированный для генерирования декоррелированного сигнала на основе первого звукового сигнала. Этап повышающего микширования может генерировать стереофонический сигнал на основе первого звукового сигнала, одного или нескольких параметров PS и декоррелированного сигнала, или, по меньшей мере, одной из частотных полос декоррелированного сигнала.
[0017] Вместо использования декоррелированного сигнала этап повышающего микширования может, например, в случае хороших условий приема, когда уровень шума в принимаемом сигнале является низким, использовать для повышающего микширования принимаемый побочный сигнал. Поэтому, согласно одному из вариантов осуществления изобретения для повышающего микширования, селективно используется принимаемый побочный сигнал или декоррелированный сигнал. Более предпочтителен выбор, зависящий от частоты. Например, этап повышающего микширования может использовать принимаемый побочный сигнал для низких частот и декоррелированный сигнал - в качестве псевдо-побочного сигнала для более высоких частот, поскольку чем выше частота, тем больше интенсивность шума. Это свойство является типичным свойством FM-демодуляции в случае аддитивного (белого) шума в радиоканале. Оно будет подробно разъяснено в описании позднее.
[0018] Принимаемый побочный сигнал, или, по меньшей мере, одна или несколько его частотных составляющих, могут использоваться для повышающего микширования, если первый сигнал соответствует среднему сигналу. В случае отличающейся схемы понижающего микширования (которая отличается от (L+R)/a при генерировании первого звукового сигнала), вместо принимаемого побочного сигнала может использоваться остаточный сигнал. Остаточный сигнал указывает на ошибку, связанную с представлением оригинальных каналов их низведенным сигналом и параметрами PS и часто используется в схемах PS-кодирования. Приведенные выше замечания об использовании принимаемого побочного сигнала также применимы и к остаточному сигналу.
[0019] Выбор между принимаемым побочным сигналом и декоррелированным сигналом для повышающего микширования может зависеть от сигнала или, иными словами, быть адаптивным к сигналу.
[0020] Согласно еще одному варианту осуществления изобретения, выбор зависит от условий приема, указываемых индикатором приема радиосигнала, таким как индикатор уровня сигнала, и/или индикатором, указывающим качество принимаемого побочного сигнала. В случае хороших условий приема (например, высокого уровня) для повышающего микширования предпочтительно может использоваться принимаемый побочный сигнал (в некоторых случаях, не для самых высоких частот), в то время как в случае средних условий приема (например, при менее высоком уровне) для повышающего микширования может использоваться декоррелированный сигнал.
[0021] При очень плохих условиях приема с высокими уровнями шума в побочном сигнале FM-приемник может переключаться в режим монофонического выходного сигнала с целью уменьшения уровня шума в звуковом сигнале. В случае стереофонического звукового сигнала L/R на выходе FM-приемника оба канала в выходном сигнале содержат один и тот же сигнал в монофоническом воспроизведении. В случае стереофонического сигнала M/S на выходе FM-приемника звук канал S на выходе заглушается. В режиме монофонического выходного сигнала стереофоническая информация звукового сигнала FM-приемника теряется. Поэтому этап определения параметров PS не может определить параметры PS, пригодные для создания реального стереофонического сигнала на этапе повышающего микширования. Даже если FM-приемник при очень плохих условиях приема не переключается в режим монофонического выходного сигнала, звуковой сигнал на выходе FM-приемника может иметь слишком плохое качество для того, чтобы можно было оценить поддающиеся интерпретации параметры PS.
[0022] Устройство может быть сконфигурировано для обнаружения того, выбран ли FM-приемником для стереофонического радиосигнала режим монофонического выходного сигнала, и/или для уведомления об указанных плохих условиях приема (которые слишком плохи для оценки поддающихся интерпретации параметров PS). В случае обнаружения монофонического выходного сигнала, или в случае обнаружения указанных плохих условий приема, этап повышающего микширования может генерировать псевдостереофонический сигнал. Вместо обсужденных выше оцениваемых параметров этап повышающего микширования использует один или несколько параметров повышающего микширования для повышающего микширования вслепую. Этот режим называется псевдо-стереофоническим режимом работы или режимом повышающего микширования вслепую.
[0023] Режим повышающего микширования вслепую, в данном случае, означает, что после обнаружения плохих условий приема, или обнаружения монофонического выходного сигнала, и, таким образом, инициации режима повышающего микширования вслепую пространственная акустическая информация - если она вообще присутствует - в выходном сигнале FM-приемника для определения параметров повышающего микширования не используется, и, таким образом, она не учитывается при повышающем микшировании (если на выходе FM-приемника уже имеется монофонический выходной сигнал, пространственная акустическая информация отсутствует и вообще не может быть учтена). В отличие от обсужденного выше режима работы PS, где параметры PS определяются для реконструкции побочного сигнала в выходном сигнале на этапе повышающего микширования, в режиме повышающего микширования вслепую устройство не преследует цель реконструировать побочный сигнал в выходном сигнале этапа повышающего микширования.
[0024] Однако повышающее микширование вслепую не подразумевает того, что устройство является «слепым» в том смысле, что параметры повышающего микширования обязательно независимы от выходного сигнала FM-приемника. Например, выходной сигнал FM-приемника может оцениваться как музыкальный или речевой, и, в зависимости от этого, могут выбираться надлежащие параметры повышающего микширования.
[0025] Один из вариантов осуществления повышающего микширования вслепую заключается в использовании предварительно задаваемых параметров повышающего микширования. Предварительно задаваемые параметры повышающего микширования могут представлять собой параметры повышающего микширования по умолчанию или константы в памяти.
[0026] Тем не менее, используемые параметры повышающего микширования могут зависеть от сигнала, например, они могут быть параметрами повышающего микширования для речи и параметрами повышающего микширования для музыки. В этом случае, устройство также содержит детектор речи (например, дискриминатор речи/музыки), который обнаруживает, является звуковой сигнал предпочтительно речевым или музыкальным. Например, в случае чистой музыки параметры повышающего микширования могут выбираться так, чтобы низведенный сигнал и его декоррелированная версия микшировались, в то время как в случае чистой речи параметры повышающего микширования могут выбираться так, чтобы декоррелированная версия низведенного сигнала не использовалась, и для повышающего микширования в «монофонический» левый/правый сигнал использовался только низведенный сигнал. В случае звукового сигнала, представляющего собой смесь речи и музыки, могут использоваться параметры повышающего микширования, являющиеся промежуточными между параметрами повышающего микширования для чистой речи и параметрами повышающего микширования для чистой музыки. Для всех промежуточных состояний также возможно использование интерполированных параметров повышающего микширования.
[0027] Можно предположить более совершенные схемы повышающего микширования вслепую, в которых выполняется еще более усовершенствованный анализ монофонического сигнала, и он используется как основа для вывода «искусственно генерированных», или «синтетических», параметров PS.
[0028] Как обсуждалось выше, для побочного сигнала, представляющего практически только шум, устройство переключается в псевдо-стереофонический режим. Как отмечено выше, термин «шум» в данном описании относится к шуму, вносимому плохим приемом радиосигнала (т.е. низким соотношением сигнал-шум в радиоканале), и не относится к шуму, содержащемуся в оригинальном сигнале, отправляемом в передатчик сети FM-радиовещания.
[0029] Однако для побочного сигнала, почти не содержащего шума, т.е. почти не содержащего шума, возникающего при передаче FM-радиосигнала, устройство предпочтительно переключается в нормальный стереофонический режим вместо параметрического стереофонического режима. В нормальном стереофоническом режиме функция улучшения сигнала устройства, в значительной мере, деактивируется. Для деактивации левый/правый звуковой сигнал на входе устройства может, в значительной мере, проходить к выходу устройства.
[0030] В альтернативном варианте, для деактивации на этапе повышающего микширования с первым звуковым сигналом микшируется только принимаемый побочный сигнал (и не декоррелированный сигнал). При надлежащем выборе параметров повышающего микширования на этапе повышающего микширования выходной сигнал этапа повышающего микширования соответствует выходному сигналу FM-передатчика: например, при микшировании первого звукового сигнала DM и принимаемого побочного сигнала S0 в соответствии с уравнениями
L'=DM+S0 и R'=DM-S0, в случае DM=(L+R)/2 и S0=(L-R)/2.
В некоторых случаях более предпочтительным является выбор нормального стереофонического режима или параметрического стереофонического режима зависящим от частоты образом, т.е. выбор может отличаться для различных частотных полос. Этот подход полезен, поскольку соотношение сигнал-шум для принимаемого побочного сигнала характерно ухудшается для более высоких частот. Как обсуждалось выше, это свойство является типичным свойством FM-демодуляции.
[0031] Дальнейшие варианты осуществления изобретения обсуждаются в зависимых пунктах формулы изобретения.
[0032] Вторая особенность изобретения относится к устройству, предназначенному для генерирования стереофонического сигнала на основе левого/правого, или среднего/побочного, звукового сигнала FM-стереофонического радиоприемника. Устройство сконфигурировано для уведомления о том, что FM-стереофоническим приемником для стереофонического радиосигнала выбран режим монофонического выходного сигнала, или устройство сконфигурировано для уведомления о плохом приеме радиосигнала. Устройство включает этап стереофонического повышающего микширования. Этап повышающего микширования сконфигурирован для генерирования стереофонического сигнала на основе первого звукового сигнала и одного или нескольких параметров повышающего микширования, предназначенных для повышающего микширования вслепую в случае, когда устройство извещает о том, что FM-стереофоническим радиоприемником для стереофонического радиосигнала выбран режим монофонического выходного сигнала, или когда устройство извещает о плохом приеме. Первый звуковой сигнал получается из левого/правого, или среднего/побочного, звукового сигнала.
[0033] Параметры повышающего микширования для повышающего микширования вслепую могут представлять собой предварительно задаваемые параметры, такие как, например, параметры по умолчанию или константы в памяти.
[0034] Устройство позволяет генерировать псевдо-стереофонический сигнал, имеющий низкий уровень шума, в случае очень плохих условий приема с высокими уровнями шума в побочном сигнале. В таких условиях приема или когда звуковой сигнал L/R, или M/S, оказывается слишком плохим для оценки поддающихся интерпретации параметров PS, FM-приемник может переключаться в монофонический режим с целью снижения шума в звуковом сигнале. Это обнаруживается, и тогда для генерирования псевдо-стереофонического сигнала используется повышающее микширование вслепую с параметрами повышающего микширования. Это уже обсуждалось в связи с первой особенностью изобретения.
[0035] Как также обсуждалось в связи с первой особенностью изобретения, устройство может включать этап обнаружения, предназначенный для обнаружения того, выбран ли FM-стереофоническим приемником для стереофонического радиосигнала режим монофонического выходного сигнала.
[0036] Согласно одному из иллюстративных вариантов осуществления изобретения, устройство также включает детектор типа звукового сигнала, такой как детектор речи, указывающий, является звуковой сигнал на выходе FM-передатчика преимущественно речевым или нет. В этом случае параметры повышающего микширования зависят от указания детектора речи. Например, устройство использует одни параметры повышающего микширования в случае речи и другие параметры повышающего микширования - в случае музыки, как подробно обсуждалось в связи с первой особенностью изобретения.
[0037] Устройство согласно второй особенности изобретения также может включать характерные признаки устройства согласно первой особенности изобретения и наоборот.
[0038] Третья особенность изобретения относится к FM-стереофоническому радиоприемнику, сконфигурированному для приема FM-радиосигнала, включающего средний сигнал и побочный сигнал. FM-стереофонический радиоприемник включает устройство для улучшения звукового сигнала в соответствии с первой и второй особенностями изобретения.
[0039] Четвертая особенность изобретения относится к устройству мобильной связи, такому как сотовый телефон. Устройство мобильной связи включает FM-стереофонический приемник, сконфигурированный для приема FM-радиосигнала. Кроме того, устройство мобильной связи включает устройство для улучшения звукового сигнала в соответствии с первой и второй особенностями изобретения.
[0040] Пятая особенность изобретения относится к способу улучшения левого/правого, или среднего/побочного, звукового сигнала FM-стереофонического радиоприемника. Характерные признаки способа согласно пятой особенности соответствуют характерным признакам устройства согласно первой особенности. Один или несколько параметров PS определяются на основе левого/правого, или среднего/побочного, звукового сигнала зависящим от частоты или не зависящим от частоты образом. Стереофонический сигнал генерируется на основе указанного первого звукового сигнала и одного или нескольких параметров PS при помощи операции повышающего микширования.
[0041] Комментарии, относящиеся к первой особенности изобретения, также применимы и к пятой особенности изобретения.
[0042] Шестая особенность изобретения относится к способу генерирования стереофонического сигнала левого/правого, или среднего/побочного, звукового сигнала FM-стереофонического радиоприемника. Характерные признаки способа согласно шестой особенности соответствуют характерным признакам устройства согласно второй особенности. Указывается, что FM-стереофоническим приемником для стереофонического радиосигнала выбран монофонический выходной сигнал, или, в альтернативном варианте осуществления изобретения, указывается плохой прием радиосигнала. В случае выбора FM-стереофоническим приемником для стереофонического радиосигнала режима монофонического выходного сигнала, или в случае плохого приема радиосигнала, стереофонический сигнал генерируется на основе первого звукового сигнала и одного или нескольких параметров повышающего микширования, предназначенных для повышающего микширования вслепую, таких как предварительно задаваемые параметры повышающего микширования.
[0043] Комментарии, относящиеся ко второй особенности изобретения, также применимы и к шестой особенности изобретения.
Описание графических материалов
[0044] Ниже изобретение разъясняется посредством иллюстративных примеров с отсылкой к сопроводительным графическим материалам, где
[0045] фиг.1 иллюстрирует схематический вариант осуществления улучшения стереофонического выходного сигнала FM-стереофонического радиоприемника;
[0046] фиг.2 иллюстрирует вариант осуществления устройства обработки звукового сигнала на основе концепции параметрического стереофонического кодирования;
[0047] фиг.3 иллюстрирует другой вариант осуществления устройства обработки звукового сигнала на основе PS, содержащее PS-кодер и PS-декодер;
[0048] фиг.4 иллюстрирует расширенную версию устройства обработки звукового сигнала по фиг.3;
[0049] фиг.5 иллюстрирует вариант осуществления PS-кодера и PS-декодера по фиг.4;
[0050] фиг.6 иллюстрирует пример структуры сигнала S, используемого для повышающего микширования;
[0051] фиг.7 иллюстрирует расширенную версию устройства обработки звукового сигнала по фиг.3 с добавленным к нему алгоритмом шумоподавления;
[0052] фиг.8 иллюстрирует еще один вариант осуществления устройства обработки звукового сигнала с шумоподавлением, предназначенного для оценки параметров PS;
[0053] фиг.9 иллюстрирует другой вариант осуществления устройства обработки звукового сигнала, предназначенного для генерирования псевдостереофонического сигнала в случае только монофонического выходного сигнала FM-приемника;
[0054] фиг.10 иллюстрирует возникновение коротких выпадений сигнала при стереофоническом воспроизведении на выходе FM-приемника;
[0055] фиг.11 иллюстрирует усовершенствованный этап определения параметров PS с компенсацией ошибок; и
[0056] фиг.12 иллюстрирует еще один вариант осуществления устройства обработки звукового сигнала на основе кодера HE-AAC v2.
Подробное описание
[0057] На фиг.1 показан упрощенный схематический вариант осуществления улучшения стереофонического выходного сигнала FM-стереофонического радиоприемника 1. Как обсуждалось в разделе Предпосылки, в FM-радиовещании стереофонический сигнал намеренно передается как средний сигнал и побочный сигнал. В FM-приемнике 1 побочный сигнал используется для создания стереофонической разности между левым каналом L и правым каналом R на выходе FM-приемника 1 (по меньшей мере, тогда, когда прием достаточно хорош и информация побочного канала не заглушается). Левый и правый каналы L, R могут представлять цифровые или аналоговые сигналы. Для улучшения звуковых сигналов L, R FM-приемника используется устройство 2 обработки звукового сигнала, которое на выходе генерирует стереофонический звуковой сигнал L' и R'. Устройство 2 обработки звукового сигнала соответствует системе, которая способна выполнять шумоподавление в принимаемом FM-радиосигнале с использованием параметрического стереофонического кодирования. Обработка звукового сигнала в устройстве 2 предпочтительно выполняется в цифровой области; поэтому в случае аналогового интерфейса между FM-приемником 1 и устройством 2 обработки звукового сигнала перед цифровой обработкой звукового сигнала в устройстве 2 используется аналого-цифровой преобразователь. FM-приемник 1 и устройство 2 обработки звукового сигнала могут быть интегрированы на одной полупроводниковой микросхеме или могут составлять части двух полупроводниковых микросхем. FM-приемник 1 и устройство 2 обработки звукового сигнала могут составлять часть устройства беспроводной связи, такого как сотовый телефон, персонального цифрового помощника (PDA) или смартфона. В этом случае FM-приемник может составлять часть микросхемы прямой передачи данных, содержащей дополнительную функцию FM-радиоприемника.
[0058] Вместо использования левого/правого представления на выходе FM-приемника 1 и на входе устройства 2 для интерфейса между FM-приемником 1 и устройством 2 может использоваться среднее/побочное представление (см. М, S на фиг.1 - для среднего/побочного представления, и L, R - для левого/правого представления). Указанное среднее/побочное представление для интерфейса между FM-приемником 1 и устройством 2 может приводить к меньшему объему работы, поскольку FM-приемник 1 принимает уже средний/побочный сигнал, и устройство 2 обработки звукового сигнала может непосредственно обрабатывать средний/побочный сигнал без понижающего микширования. Среднее/побочное представление может быть предпочтительным, если FM-приемник 1 тесно интегрирован с устройством 2 обработки звукового сигнала, в частности, если FM-приемник 1 и устройство 2 обработки звукового сигнала интегрированы на одной полупроводниковой микросхеме.
[0059] Для адаптации обработки звукового сигнала в устройстве 2 обработки звукового сигнала, необязательно, может использоваться сигнал 6 уровня сигнала. Это будет разъяснено в данном описании позднее.
[0060] Сочетание FM-радиоприемника 1 и устройства 2 обработки звукового сигнала соответствует FM-радиоприемнику, содержащему интегрированную систему шумоподавления.
[0061] На фиг.2 показан вариант осуществления устройства 2 обработки звукового сигнала на основе концепции параметрического стереофонического кодирования. Устройство 2 включает этап 3 оценки параметров PS. Этап 3 оценки параметров сконфигурирован для определения параметров PS 5 на основе входного звукового сигнала, который необходимо улучшить (что может выполняться как в левом/правом, так и в среднем/побочном представлении). Параметры PS 5 могут включать, помимо прочих, параметр, указывающий разности интенсивностей между каналами (IID, также называемый CLD - параметр разности уровней каналов) и/или параметр, указывающий взаимную корреляцию между каналами (ICC). Предпочтительно, параметры PS 5 являются зависящими от времени и от частоты. В случае M/S-представления на входе этапа 3 оценки параметров, этап 3 оценки параметров, тем не менее, может определять параметры PS 5, которые относятся к каналам L/R.
[0062] Звуковой сигнал DM получается из входного сигнала. В случае, когда входной звуковой сигнал уже использует среднее/побочное представление, звуковой сигнал DM может непосредственно соответствовать среднему сигналу. В случае, когда входной звуковой сигнал имеет левое/правое представление, звуковой сигнал генерируется путем понижающего микширования звукового сигнала. Результирующий сигнал DM после понижающего микширования предпочтительно соответствует среднему сигналу М и может генерироваться в соответствии со следующим уравнением:
DM=(L+R)/a, где, например, а=2,
т.е. низведенный сигнал DM может соответствовать среднему сигналов L и R. Для различных значений а среднее сигналов L и R усиливается или ослабляется.
[0063] Устройство также включает этап 4 повышающего микширования, также называемый модулем стереофонического микширования или стереофоническим повышающим микшером. Этап 4 повышающего микширования сконфигурирован для генерирования стереофонического сигнала L', R' на основе звукового сигнала DM и параметров PS 5. Этап 4 повышающего микширования предпочтительно использует не только сигнал DM, но также использует побочный сигнал или какой-либо псевдо-побочный сигнал (не показан). Это будет разъяснено в данном описании позднее в связи с более расширенными вариантами осуществления изобретения по фиг.4 и 5.
[0064] Устройство 2 базируется на идее о том, что принимаемый побочный сигнал из-за шума может оказаться слишком зашумленным для реконструкции стереофонического сигнала путем простого комбинирования принимаемых среднего и побочного сигналов; тем не менее, в этом случае побочный сигнал, или составляющая побочного сигнала, в сигнале L/R может по-прежнему быть достаточно хорошей для анализа стереофонических параметров на этапе 3 оценки параметров PS. Результирующие параметры PS 5 могут затем использоваться для генерирования стереофонического сигнала L', R', имеющего пониженный уровень шума по сравнению со звуковым сигналом непосредственно на выходе FM-приемника 1.
[0065] Таким образом, путем использования концепции параметрического стереофонического кодирования может быть плохой FM-радиосигнал «очищен». Главная составляющая искажений и шума в FM-радиосигнале располагается в побочном канале, который может не использоваться в понижающем микшировании PS. Тем не менее, побочный канал даже в случае плохого приема часто имеет качество, достаточное для извлечения параметров PS.
[0066] Во всех последующих иллюстрациях входной сигнал устройства 2 обработки звукового сигнала является левым/правым стереофоническим сигналом. С минимальными модификациями некоторых модулей в устройстве 2 обработки звукового сигнала устройство 2 обработки звукового сигнала также может обрабатывать входной сигнал в среднем/побочном представлении. Поэтому описываемые в данном описании концепции могут быть использованы в связи с входным сигналом в среднем/побочном представлении.
[0067] На фиг.3 показан вариант осуществления устройства 2 обработки звукового сигнала на основе PS, которое использует PS-кодер 7 и PS-декодер 8. Этап 3 оценки параметров в данном примере составляет часть PS-кодера 7, а этап 4 повышающего микширования составляет часть PS-декодера 8. Термины «PS-кодер» и «PS-декодер» используются как названия для описания режимов работы блоков обработки звукового сигнала в устройстве 2. Следует отметить, что обработкой звукового сигнала является все происходящее в одном и том же устройстве FM-приемника. Указанные процессы PS-кодирования и PS-декодирования могут быть тесно связаны, и термины «PS-кодирование» и «PS-декодирование» используются лишь для описания последовательности функций обработки звукового сигнала.
[0068] PS-кодер 7 генерирует звуковой сигнал DM и параметры PS 5 на основе входного стереофонического звукового сигнала L, R. Необязательно, PS-кодер 7 также использует сигнал 6 уровня сигнала. Звуковой сигнал DM представляет собой монофонический низведенный сигнал и, предпочтительно, соответствует принимаемому среднему сигналу. При суммировании каналов L/R для формирования сигнала DM информация принимаемого побочного канала может быть полностью исключена из сигнала DM. Таким образом, в данном случае в монофоническом низведенном сигнале DM содержится только информация среднего канала. Поэтому любой шум из побочного канала может быть исключен из сигнала DM. Однако побочный канал составляет часть анализа стереофонических параметров в кодере 7, поскольку кодер 7, как правило, принимает в качестве входного сигнала L=M+S и R=M-S (соответственно, DM=(L+R)/2=М).
[0069] Экспериментальные результаты показывают, что принимаемый побочный сигнал, который содержит средние уровни шума, может оказаться недостаточно хорошим для реконструкции самого стереофонического сигнала, но может оказаться достаточно хорошим для анализа стереофонических параметров в PS-кодере 7.
[0070] Монофонический сигнал DM и параметры PS 5 затем используются в PS-декодере 8 для реконструкции стереофонического сигнала L', R'.
[0071] На фиг.4 показана расширенная версия устройства 2 обработки звукового сигнала по фиг.3. Здесь, в дополнение к монофоническому низведенному сигналу DM и параметрам PS, в PS-декодер 8 проходит оригинальный принимаемый побочный сигнал S0. Этот подход сходен с технологией «остаточного кодирования» в PS-кодировании и позволяет использовать, по меньшей мере, части (например, определенные полосы частот) принимаемого побочного сигнала S0 в случае хороших, но несовершенных условий приема. Принимаемый побочный сигнал S0 предпочтительно используется тогда, когда монофонический низведенный сигнал соответствует среднему сигналу. Однако в случае, когда монофонический низведенный сигнал не соответствует среднему сигналу, вместо принимаемого побочного сигнала S0 можно использовать более общий остаточный сигнал. Этот остаточный сигнал указывает ошибку, связанную с представлением оригинальных каналов посредством их низведенного сигнала и параметров PS, и часто используется в схемах PS-кодирования. Ниже комментарии относительно использования принимаемого побочного сигнала S0 также применимы и к остаточному сигналу.
[0072] Использование остаточного сигнала в PS-кодере/декодере описано, например, в стандарте MPEG Surround (см. документ ISO/IEC 23003-1:2007, MPEG Surround) и в статье «MPEG Surround - The ISO/MPEG Standard for Efficient and Compatible Multi-Channel Audio Coding», J.Herre et al., Audio Engineering Convention Paper 7084, 122nd Convention, May 5-8, 2007.
[0073] На фиг.5 показан один из вариантов осуществления PS-кодера 7 и PS-декодера 8 по фиг.4. Модуль PS-кодера 7 включает генератор 9 низведенного сигнала и этап 3 оценки параметров PS. Например, генератор 9 низведенного сигнала может создавать монофонический низведенный сигнал DM, который предпочтительно соответствует среднему сигналу М (например, DM=M=(L+R/a) и, необязательно, может также генерировать второй сигнал, который соответствует принимаемому побочному сигналу S0=(L-R)/a.
[0074] Этап 3 оценки параметров PS может оценивать в качестве параметров PS 5 корреляцию и разность уровней между входными сигналами L и R. Необязательно, этап оценки параметров принимает уровень сигнала 6, который может представлять собой мощность сигнала в FM-приемнике. Эта информация может использоваться для принятия решения о надежности параметров PS 5, например, в случае низкого уровня сигнала 6. В случае низкой надежности параметры PS 5 могут быть заданы так, чтобы выходной сигнал L', R' представлял собой монофонический выходной сигнал или псевдостереофонический выходной сигнал. В случае монофонического выходного сигнала выходной сигнал L' равен выходному сигналу R'. В случае псевдостереофонического выходного сигнала для генерирования псевдо-стереофонического сигнала или стереофонического сигнала L', R' могут использоваться параметры PS по умолчанию.
[0075] Модуль 8 PS-декодера включает матрицу 4а стереофонического микширования и де коррелятор 10. Декоррелятор 10 принимает монофонический низведенный сигнал DM и генерирует декоррелированный сигнал S', который используется в качестве псевдо-побочного сигнала. Декоррелятор 10 может быть реализован посредством соответствующего фазового фильтра, как это обсуждается в разделе 4 процитированного документа «Low Complexity Parametric Stereo Coding in MPEG-4». Матрица 4а стереофонического микширования в данном варианте осуществления изобретения представляет собой (2×2)-матрицу повышающего микширования.
[0076] В зависимости от оцененных параметров 5 матрица 4а микширует сигнал DM с принимаемым побочным сигналом S0 или с декоррелированным сигналом S' с целью создания стереофонических выходных сигналов L' и R'. Выбор между сигналом S0 и сигналом S' может зависеть от индикатора приема радиосигнала, указывающего условия приема, такие как уровень 6 сигнала. Вместо, или в дополнение, можно использовать индикатор качества, указывающий качество принимаемого побочного сигнала. Один из примеров такого индикатора качества может представлять собой оценку (мощности) шума в принимаемом побочном сигнале. В случае побочного сигнала, включающего высокий уровень шума, для создания стереофонического выходного сигнала L' и R' может использоваться декоррелированный сигнал S', в то время как в ситуациях с низким уровнем шума может использоваться побочный сигнал S0. Различные варианты осуществления оценки уровня шума в принимаемом побочном сигнале обсуждаются в данном описании позднее.
[0077] Например, в случае хороших условий приема (т.е. при высоком уровне сигнала) для повышающего микширования используется сигнал S0, в то время как в случае плохих условий повышающее микширование основывается на декоррелированном сигнале S'. Решение об использовании модулем 4 стереофонического микширования принимаемого побочного сигнала S0, или S', является зависящим от частоты: например, для более низких частот используется принимаемый побочный сигнал S0, а для более высоких частот используется декоррелированный сигнал S'. Это будет более подробно обсуждаться в связи с фиг.6.
[0078] Зависящий от частоты, или не зависящий от частоты, выбор между сигналом S0 и сигналом S' может делаться на этапе 4 повышающего микширования (например, селекторными средствами этапа 6 повышающего микширования, которые управляются, например, в зависимости от уровня 6 сигнала). В альтернативном варианте, зависящий от частоты, или не зависящий от частоты, выбор между сигналом S0 и сигналом S' может выполняться на этапе 3 оценки параметров (например, в зависимости от уровня 6 сигнала), и этап 3 оценки параметров затем отправляет параметры повышающего микширования на этап 6 повышающего микширования, что приводит к тому, что для повышающего микширования используется соответствующим образом выбранный сигнал (или S0, или S'), например, в случае выбора S' параметрам повышающего микширования, относящимся к сигналу S0, присваиваются нулевые значения, а параметрам, относящимся к S', не присваиваются нулевые значения. В альтернативном варианте, на этап 6 повышающего микширования может быть отправлен сигнал выбора (не показан).
[0079] Операция повышающего микширования предпочтительно осуществляется в соответствии со следующим матричным уравнением:
.
[0080] Здесь весовые коэффициенты α, β, γ, δ определяют взвешивание сигналов DM и S. Монофонический низведенный сигнал DM предпочтительно соответствует принимаемому среднему сигналу. Сигнал S в формуле соответствует или декоррелированному сигналу S', или принимаемому побочному сигналу S0. Элементы матрицы повышающего микширования, т.е. весовые коэффициенты α, β, γ, δ, могут быть выведены, например, так, как показано в процитированной статье «Low Complexity Parametric Stereo Coding in MPEG-4» (см. раздел 2.2), как показано в цитируемом документе стандартизации MPEG-4 - ISO/IEC 14496-3:2005 (см. раздел 8.6.4.6.2), или как показано в документе спецификации MPEG Surround - ISO/IEC 23003-1 (см. раздел 6.5.3.2). Указанные разделы документов (а также разделы, относящиеся к этим разделам) ссылкой включаются в настоящее описание во всех отношениях.
[0081] Выбор между S' and S0 предпочтительно зависит от частоты. Это показано на фиг.6, показывающей иллюстративную структуру сигнала S, используемого для повышающего микширования. Как показано на фиг.6, для более низких частот в повышающем микшировании используется принимаемый побочный сигнал S0, а для более высоких частот в повышающем микшировании используется декоррелированный сигнал S'.
[0082] Если принимаемый побочный сигнал S0 соответствует S0=(L-R)/2, и L'=M+S0 и R'=M-S0, монофонический низведенный сигнал DM предпочтительно должен соответствовать (L+R)/2, что позволяет осуществить совершенную реконструкцию, т.е. L'=L и R'=R.
[0083] Вместо использования PS-повышающего микшера, использующего принимаемый побочный сигнал S0, можно использовать обобщенный PS-повышающий микшер, использующий остаточный сигнал. Результирующие сигналы L', R' зависят от параметров PS, остаточного сигнала и монофонического низведенного сигнала.
[0084] На фиг.7 показан иллюстративный вариант осуществления изобретения с использованием шумоподавления. Как и на фиг.5, на фиг.7 сигнал S0 необязателен. В случае наличия сигнала S0 может использоваться общеизвестный алгоритм шумоподавления, который выполняет шумоподавление сигналов DM и S0. В альтернативном варианте могут использоваться два модуля шумоподавления: один - для шумоподавления сигнала DM, и один - для шумоподавления сигнала S0. Также возможно, чтобы шумоподавлению подвергался только один сигнал (например, сигнал DM или сигнал S0). На фиг.7 этап 11 шумоподавления выполняет шумоподавление сигнала DM, и сигнал DM' с подавленным шумом после шумоподавления подается в PS-декодер 8 и на его внутренний этап 4 повышающего микширования. Этап 11 шумоподавления выполняет шумоподавление сигнала S0, и сигнал S0' с подавленным шумом после шумоподавления подается в PS-декодер 8.
[0085] На фиг.8 показан еще один вариант осуществления устройства 2. Здесь способ 12 шумоподавления применяется к стереофоническому входному сигналу, и результирующий сигнал R', L' с подавленным шумом затем подается на этап 3 оценки параметров PS-кодера 8. Шумоподавление может быть чрезвычайно агрессивным и оптимизированным для извлечения параметров PS, поскольку низведенный сигнал DM передается по другому пути, не включающему этап 12 шумоподавления.
[0086] Монофонический низведенный сигнал DM может генерироваться путем сложения каналов L, R с одинаковыми весовыми коэффициентами (например, с использованием весовых коэффициентов, равных 1, или с использованием весовых коэффициентов, равных 1/2). Тогда сигнал DM соответствует принимаемому среднему сигналу. При использовании весовых коэффициентов, равных 1/2, амплитуда сигнала составляет половину амплитуды сигнала DM в случае использования весовых коэффициентов, равных 1.
[0087] Необязательно, какая-либо из форм шумоподавления также может применяться и к сигналу L/R или сигналу DM (и/или к сигналу S0, если он используется). Например, какое-либо шумоподавление может применяться к сигналу DM (см. необязательный этап 11 шумоподавления на фиг.8). Этап 11 шумоподавления предпочтительно является более мягким, чем этап 12 агрессивного шумоподавления. В альтернативном варианте, этап 11 шумоподавления может располагаться в восходящем направлении относительно этапа 9 повышающего микширования (например, на входе устройства 2 или непосредственно перед этапом 9 повышающего микширования).
[0088] В некоторых условиях приема FM-приемник 1 создает только монофонический сигнал, а передаваемый побочный сигнал заглушается. Это, как правило, случается тогда, когда условия приема являются очень плохими, и побочный сигнал сильно зашумлен. В случае, когда FM-стереофонический приемник 1 переключается в режим монофонического воспроизведения стереофонического радиосигнала, этап повышающего микширования предпочтительно использует для повышающего микширования вслепую параметры повышающего микширования, такие как предварительно задаваемые параметры повышающего микширования, и генерирует псевдостереофонический сигнал, т.е. этап повышающего микширования генерирует стереофонический сигнал с использованием параметров повышающего микширования для повышающего микширования вслепую.
[0089] Также возможны варианты осуществления FM-стереофонического приемника 1, который при слишком плохих условиях приема переключается в режим монофонического воспроизведения. Если условия приема слишком плохи для оценки надежных параметров PS 5, этап повышающего микширования предпочтительно использует параметры повышающего микширования для повышающего микширования вслепую и генерирует на их основе псевдо-стереофонический сигнал.
[0090] На фиг.9 показан один из вариантов осуществления генерирования псевдо-стереофонического сигнала в случае только монофонического выходного сигнала FM-приемника 1. Здесь для обнаружения того, является ли входной сигнал в устройство 2 монофоническим, т.е. являются ли сигналы каналов L и R одинаковыми, используется детектор 13 монофонического/стереофонического сигнала. В случае монофонического режима воспроизведения FM-приемника 1 детектор 13 монофонического/стереофонического сигнала указывает на повышающее микширование в стереофонический сигнал с использованием, например, PS-декодера с фиксированными параметрами повышающего микширования. Иными словами, в данном случае этап 4 повышающего микширования не использует параметры PS из этапа 3 оценки параметров (не показан на фиг.9), но использует фиксированные параметры повышающего микширования (не показаны на фиг.9).
[0091] Необязательно, для указания того, является принимаемый сигнал преимущественно речевым или музыкальным, может быть добавлен детектор 14 речи. Указанный детектор 14 речи позволяет выполнять зависящее от сигнала повышающее микширование вслепую. Например, указанный детектор 14 речи может позволять использовать зависящие от сигнала параметры повышающего микширования. Предпочтительно, для речи может использоваться один или несколько параметров повышающего микширования, и один или несколько отличающихся параметров повышающего микширования могут использоваться для музыки. Указанный детектор 14 речи может быть реализован посредством детектора речевой активности (VAD). Строго говоря, этап 4 повышающего микширования по фиг.9 включает декоррелятор 10, (2×2)-матрицу 4а повышающего микширования и средства для преобразования выходного сигнала детектора 13 монофонического/стереофонического сигнала и детектора 14 речи в какую-либо форму параметров PS, используемых в качестве входного сигнала фактического стереофонического повышающего микширования.
[0092] Фиг.10 иллюстрирует общеизвестную проблему, когда звуковой сигнал, создаваемый FM-приемником 1, переключается между стереофоническим и монофоническим режимами из-за зависящих от времени плохих условий приема (например, «замирание»). Для поддержания стереофонического звукового образа в ходе переключения между монофоническим и стереофоническим режимами могут использоваться способы маскирования ошибок. Временные промежутки, в которых должно применяться маскирование, указаны на фиг.10 символом «С». Подход к маскированию в PS-кодировании заключается в использовании параметров повышающего микширования, основанных на ранее оцененных параметрах PS в случае, когда новые параметры PS не могут быть вычислены, поскольку уровень выходного сигнала FM-приемника 1 падает до монофонического сигнала. Например, в случае, когда новые параметры PS не могут быть вычислены, поскольку уровень выходного сигнала FM-приемника 1 падает до монофонического сигнала, этап 4 повышающего микширования может продолжать использовать ранее оцененные параметры PS. Таким образом, когда FM-стереофонический приемник 1 переключается в режим монофонического выходного звукового сигнала, этап 4 стереофонического повышающего микширования продолжает использовать ранее оцененные параметры PS из этапа 3 оценки параметров PS. Если периоды падения уровня в стереофоническом выходном сигнале достаточно коротки для того, чтобы стереофонический звуковой образ FM-радиосигнала оставался похожим в ходе периода падения уровня, в выходном звуковом сигнале устройства 2 падение уровня не слышимо или почти не слышимо. Другой подход может заключаться в интерполяции и/или экстраполяции параметров повышающего микширования на основе ранее оцененных параметров. В отношении определения параметров повышающего микширования на основе ранее оцененных параметров PS можно, в свете идей настоящего изобретения, также использовать другие способы, известные, например, из механизмов маскирования ошибок, которые могут использоваться в аудиодекодерах для ослабления влияния ошибок передачи (например, поврежденных или потерянных данных).
[0093] Подход, аналогичный использованию параметров повышающего микширования, основанных на ранее оцененных параметрах PS, также может использоваться, если FM-приемник 1 создает зашумленный стереофонический сигнал в ходе короткого промежутка времени, где зашумленный стереофонический сигнал слишком плох для оценки надежных параметров PS на его основе.
[0094] Ниже с отсылкой к фиг.11 обсуждается усовершенствованный этап 3' оценки параметров, обеспечивающий компенсацию ошибок. В случае оценки параметров PS на основе стереофонического сигнала, содержащего шумовую побочную составляющую, если использовать традиционные формулы для определения параметров PS, таких как параметр CLD (разность уровней каналов) и параметр ICC (взаимная корреляция между каналами), в вычислении параметров PS будет присутствовать ошибка.
[0095] Если предположить, что шум в побочном сигнале независим от среднего сигнала:
- значения ICC становятся ближе к 0 по сравнению со значениями ICC, оцененными на основе сигнала с пониженным уровнем шума, и
- значения CLD в децибелах становятся ближе к 0 дБ по сравнению со значениями CLD, оцененными на основе сигнала с пониженным уровнем шума.
[0096] Для компенсации ошибки в параметрах PS устройство 2 предпочтительно содержит этап оценки шума, который сконфигурирован для определения характеристики параметра шума для мощности шума, вызванного (плохой) передачей радиосигнала, в принимаемом побочном сигнале. Параметр шума учитывается при оценке параметров PS. Это может быть реализовано, как показано на фиг.11.
[0097] Согласно фиг.11, для, по меньшей мере, частичной компенсации ошибки могут использоваться данные 6 об уровне сигнала. Уровень 6 сигнала 6 часто доступен в FM-радиоприемниках. Уровень 6 сигнала является входным сигналом в этап 3 оценки параметров в PS-кодере 7. На этапе 15 оценки мощности шума в побочном сигнале значение 6 уровня сигнала может преобразовываться в оценку N2 мощности шума в побочном сигнале, где N2=E(n2), где "E()" - оператор математического ожидания. В качестве альтернативы уровню 6 сигнала, или в дополнение к уровню 6 сигнала, для оценки мощности шума в побочном сигнале может быть использован звуковой сигнал L, R, что будет обсуждаться позднее.
[0098] Фактические значения зашумленного входного стереофонического сигнала Iw/noise и rw/noise, которые являются входными сигналами внутреннего этапа 3' оценки параметров PS, показанного на фиг.11, могут быть выражены в зависимости от относительных значений Iw/o noise и rw/o noise в отсутствие шума и значений шума n в принимаемых значениях побочного сигнала:
Iw/noise=m+(s+n)=Iw/o noise+n
rw/noise=m-(s+n)=rw/o noise-n
[0099] Следует отметить, что здесь принимаемый побочный сигнал моделируется как s+n, где "s" - оригинальный (неискаженный) побочный сигнал, и "n" - шум (сигнал искажения), вызванный каналом передачи радиосигнала. Кроме того, здесь предполагается, что сигнал m не искажается посредством шума из канала передачи радиосигнала.
[0100] Таким образом, соответствующие входные мощности Lw/noise 2, Rw/noise 2 и взаимная корреляция Lw/noiseRw/noise имеют вид:
Lw/noise 2=E(Iw/noise 2)=E((m+s)2)+E(n2)=Lw/o noise 2+N2
Rw/noise 2=E(rw/noise 2)=E((m-s)2)+E(n2)=Rw/o noise 2+N2
Lw/noiseRw/noise=E(Iw/noise·rw/noise)=E((Iw/onoise+n)·(rw/o noise-n))=
Lw/o noiseRw/o noise-N2
где оценка N2 мощности шума в побочном сигнале, а N=Е(n2), где "Е()" - оператор математического ожидания.
[0101] Путем перестановок членов приведенных выше уравнений, можно определить соответствующие компенсированные мощности и взаимную корреляцию, не содержащие шума:
Lw/o noise 2=Lw/noise 2-N2
Rw/o noise 2=Rw/noise 2-N2
Lw/o noiseRw/o noise=Lw/noiseRw/noise+N2
[0102] Извлечение параметров PS со скомпенсированными ошибками на основе компенсированных мощностей и взаимной корреляции может осуществляться по приведенным ниже формулам, которые имеют вид:
CLD=10·log10(Lw/o noise 2/Rw/o noise 2)
ICC=(Lw/o noise/Rw/o noise)/(Lw/o noise 2+Rw/o noise 2)
[0103] Указанное извлечение параметров компенсирует член N2 при вычислении параметров PS.
[0104] На фиг.11 этап 15 оценки мощности шума в побочном сигнале сконфигурирован для вывода оценки N2 мощности шума на основе уровня 6 сигнала и/или входных звуковых сигналов (L и R). Оценка N2 мощности шума может быть зависящей от частоты и зависящей от времени.
[0105] Для определения мощности шума в побочном сигнале N2 может быть использован ряд способов, например:
- При обнаружении минимумов мощности среднего сигнала (например, пауз в речи) можно предположить, что мощность побочного сигнала представляет собой только шум (т.е. в этих ситуациях мощность побочного сигнала соответствует N2).
- Оценка N2 может определяться функцией данных 6 уровня сигнала. Эта функция (или таблица поиска) может быть сконструирована посредством экспериментальных (физических) измерений.
- Оценка N2 может определяться функцией данных 6 уровня сигнала и/или входных звуковых сигналов (L и R). Эта функция может конструироваться при помощи эвристических правил.
- Оценка N2 может основываться на изучении когерентности типа сигнала для среднего и побочного сигналов. Оригинальные средний и побочный сигналы могут, например, предполагаться как имеющие близкое соотношение тональность-шум, пик-фактор или другие характеристики огибающей мощности. Отклонения этих свойств могут быть использованы для указания высокого уровня N2.
[0106] Ниже обсуждаются другие предпочтительные варианты осуществления устройства 2 обработки звукового сигнала.
[0107] Устройство 2 предпочтительно конфигурируется так, чтобы для принимаемых побочных сигналов, практически представляющих собой только шум, устройство 2 гладко переключалось в псевдо-стереофонический режим работы (режим повышающего микширования вслепую), как показано на фиг.9 и 10. Это позволяет выводить псевдо-стереофонический сигнал на выходе устройства 2 в случае, когда FM-приемник 1 переключается в монофонический режим работы (из-за высокого уровня шума, вызванного плохими условиями приема), или в случае, когда часть побочного сигнала в стереофоническом сигнале на входе устройства 2 зашумлена настолько, что параметры PS определить нельзя.
[0108] Для побочных сигналов, почти не содержащих шума, устройство 2, предпочтительно, гладко переключается в нормальный стереофонический режим работы вместо параметрического стереофонического режима работы. В нормальном стереофоническом режиме работы функция улучшения сигнала устройства 2, в значительной мере, деактивируется. Для деактивации звуковой сигнал на входе устройства может, в значительной мере, проходить к выходу устройства 2.
[0109] В альтернативном варианте нормальный стереофонический режим работы может достигаться путем использования принимаемого побочного сигнала S0, как показано на фиг.4 и фиг.6: с целью достижения нормального стереофонического режима работы для микширования на этапе 4 повышающего микширования используется принимаемый побочный сигнал S0. При надлежащем выборе параметров повышающего микширования на этапе 4 повышающего микширования выходной сигнал L', R' этапа 4 повышающего микширования соответствует выходному сигналу L, R FM-передатчика 1: например, при микшировании монофонического низведенного сигнала DM и принимаемого сигнала S0 в соответствии с уравнением:
L'=DM+S0, R'=DM-S0,
в случае DM=М=(L+R)/2 и S0=(L-R)/2.
[0110] В более предпочтительном варианте, нормальный стереофонический режим, или параметрический стереофонический режим, может быть выбран зависящим от частоты образом, т.е. выбор может отличаться для различных частотных полос. Это применимо, поскольку соотношение сигнал-шум для принимаемого побочного сигнала становится хуже для более высоких частот.
[0111] Гладкое переключение между различными режимами работы может быть динамически адаптировано к текущим условиям приема для того, чтобы всегда обеспечивать наилучший возможный стереофонический сигнал на выходе устройства 2. В случае высокого соотношения сигнал-шум предпочтителен нормальный FM-стереофонический режим работы (без шумоподавления на основе PS-обработки), в то время как в случае низкого соотношения сигнал-шум PS-обработка значительно улучшает стереофонический сигнал.
[0112] Генерирование монофонического низведенного сигнала DM в PS-кодере 7 предпочтительно должно осуществляться так, чтобы в монофонический низведенный сигнал DM просачивалось как можно меньше шума из побочного сигнала. Это может потребовать использования иных технологий понижающего микширования чем те, которые обычно используются в PS-кодере (таком как PS-кодер MPEG-4 для MPEG-4), как правило, используемых в контексте систем кодирования с очень низкими битовыми скоростями передачи данных. Понижающее микширование может быть таким простым, как фиксированное (неадаптивное) понижающее микширование DM=M=(L+R)/2, где низведенный сигнал просто соответствует среднему сигналу. Кроме того, повышающее микширование в PS-декодере 8, как правило, адаптируется к фактическому способу понижающего микширования в PS-кодере 7.
[0113] Следует отметить, что, несмотря на то, что на некоторых иллюстрациях PS-кодер 7 и PS-декодер 8 показаны в виде отдельных модулей, преимущественным в контексте эффективной реализации, разумеется, является максимально возможное объединение PS-кодера 7 и PS-декодера 8.
[0114] Обсуждаемые в данном описании концепции могут быть реализованы в связи с любым кодером, использующим технологии PS, например, с кодером НЕ-ААС v2 (высокоэффективное усовершенствованное аудиокодирование версия 2), определенным в стандарте ISO/IEC 14496-3 (MPEG-4 Audio), с кодером на основе MPEG Surround или с кодером на основе MPEG USAC (унифицированный кодер речи и звукового сигнала), а также с кодерами, которые не охватываются стандартами MPEG.
[0115] Например, ниже предполагается использование кодера ПЕ-АЛС v2; тем не менее, указанные концепции могут использоваться в связи с любым аудиокодером, использующим технологии PS.
[0116] НЕ-ААС представляет собой схему сжатия звукового сигнала с потерями. НЕ-ААС v1 (НЕ-ААС версия 1) использует для увеличения эффективности сжатия репликацию спектральных полос (SBR). НЕ-ААС v2 также включает параметрическое стереофоническое кодирование для эффективного сжатия стереофонических сигналов с очень низкими битовыми скоростями передачи данных. Кодер НЕ-АЛС v2 в своей основе включает PS-кодер, позволяющий ему работать с очень низкими битовыми скоростями передачи данных. PS-кодер, такой как кодер НЕ-ААС v2, может использоваться в качестве PS-кодера 7 устройства 2 обработки звукового сигнала. В частности, этап оценки параметров PS в PS-кодере кодера НЕ-ААС v2 может использоваться в качестве этапа 3 оценки параметров PS устройства 2 обработки звукового сигнала. Кроме того, этап понижающего микширования в PS-кодере кодера НЕ-ЛЛС v2 может использоваться в качестве этапа 9 понижающего микширования устройства 2.
[0117] Таким образом, концепция, обсуждаемая в данном описании для реализации усовершенствованного FM-стереофонического приемника, может быть эффективно скомбинирована с кодером НЕ-ААС v2. Такой усовершенствованный FM-стереофонический приемник может содержать функциональную возможность записи НЕ-ААС v2, поскольку кодер НЕ-ААС v2 выводит битовый поток НЕ-ААС v2, который может храниться в памяти с целью записи. Это показано на фиг.12. В данном варианте осуществления изобретения устройство 2 включает кодер НЕ-ААС v2 16 и PS-декодер 8. Кодер НЕ-ААС v2 предусматривает PS-кодер 7, используемый для генерирования монофонического низведенного сигнала DM и параметров PS 5, как обсуждалось в связи с предыдущими графическими материалами.
[0118] PS-кодер может быть, необязательно, модифицирован для шумоподавления в FM-радиосигнале с целью поддержки им схемы фиксированного понижающего микширования, такой как, например, схема понижающего микширования в соответствии с уравнением DM~(L+R)/a.
[0119] Монофонический низведенный сигнал DM и параметры PS 8 могут подаваться в PS-декодер 8 для генерирования стереофонического сигнала L', R' так, как описывалось выше. Монофонический низведенный сигнал DM подается в кодер НЕ-ААС v1 для перцептивного кодирования монофонического низведенного сигнала DM. Результирующий перцептивно кодированный звуковой сигнал и информация PS мультиплицируется в битовый поток НЕ-ААС v2 18. С целью записи битовый поток НЕ-ААС v2 18 может храниться в памяти, такой как флеш-память или жесткий диск.
[0120] Кодер НЕ-ААС v1 17 включает кодер SBR и кодер ААС (не показаны). Кодер SBR, как правило, выполняет обработку сигнала в области QMF (блока квадратурных зеркальных фильтров), и поэтому он требует дискретных значений в области QMF. Наоборот, кодер ААС, как правило, требует дискретных значений во временной области (как правило, субдискретизированных в 2 раза)
[0121] PS-кодер 7 в кодере НЕ-ААС v2 16, как правило, предусматривает низведенный сигнал DM уже в области QMF.
[0122] Поскольку PS-кодер 7 может посылать сигнал DM в кодер НЕ-ААС v1 уже в области QMF, необходимость в анализирующем QMF-преобразовании для анализа SBR в кодере НЕ-ААС v1 может пропадать. Поэтому анализа QMF, который обычно составляет часть кодера НЕ-ААС v1, можно избежать путем предоставления низведенного сигнала DM в виде дискретных значений QMF. Это снижает объем вычислений и позволяет уменьшить их сложность.
[0123] Дискретные значения во временной области для кодера ЛЛС могут быть выведены из входного сигнала устройства 2, например, путем выполнения простой операции DM=(L+R)/2 во временной области и субдискретизации сигнала DM во временной области. Этот подход, вероятно, является наиболее дешевым. В альтернативном варианте устройство 2 может выполнять QMF-синтез на частоте дискретизации, составляющей половину частоты дискретизации дискретных значений DM в области QMF.
[0124] Следует отметить, что PS-кодер и PS-декодер могут быть частично объединены, если они реализованы в одном и том же модуле.
Изобретение относится к устройству для улучшения стереофонического звукового сигнала FM-стереофонического радиоприемника. Устройство включает этап оценки параметров параметрического стереофонического кодирования (PS). Этап оценки параметров сконфигурирован для определения одного или нескольких параметров параметрического стереофонического кодирования на основе стереофонического звукового сигнала зависящим от частоты или не зависящим от частоты образом. Указанные параметры PS предпочтительно являются зависящими от времени и от частоты. Кроме того, устройство включает этап повышающего микширования. Этап повышающего микширования сконфигурирован для генерирования улучшенного стереофонического сигнала на основе первого звукового сигнала и одного или нескольких параметров параметрического стереофонического кодирования. Первый звуковой сигнал получается из стереофонического звукового сигнала, например, посредством операции понижающего микширования на этапе понижающего микширования. Этап оценки параметров PS может составлять часть PS-кодера. Этап повышающего микширования может составлять часть PS-декодера. Технический результат - улучшение звукового сигнала FM-стереофонического радиоприемника. 4 н. и 28 з.п. ф-лы, 12 ил.
1. Устройство для обработки левого/правого, или среднего/побочного, звукового сигнала FM-стереофонического радиоприемника, где устройство включает
этап ввода, сконфигурированный для приема левого/правого, или среднего/побочного, звукового сигнала из FM-стереофонического радиоприемника;
этап понижающего микширования, где этап понижающего микширования сконфигурирован для генерирования первого звукового сигнала на основе левого/правого или среднего/побочного звукового сигнала посредством операции понижающего микширования;
этап оценки параметров параметрического стереофонического кодирования, где этап оценки параметров сконфигурирован для определения одного или нескольких параметров параметрического стереофонического кодирования на основе левого/правого, или среднего/побочного, звукового сигнала зависящим от частоты, или не зависящим от частоты, образом; и
модуль стереофонического микширования, где модуль стереофонического микширования сконфигурирован для генерирования стереофонического сигнала на основе первого звукового сигнала и одного или нескольких параметров параметрического стереофонического кодирования; где этап понижающего микширования, этап оценки параметров параметрического стереофонического кодирования и модуль стереофонического микширования реализованы в одном и том же модуле.
2. Устройство по п.1, отличающееся тем, что
устройство также включает декоррелятор, сконфигурированный для генерирования декоррелированного сигнала на основе первого звукового сигнала, и
модуль стереофонического микширования сконфигурирован для генерирования стереофонического сигнала на основе первого звукового сигнала, одного или нескольких параметров параметрического стереофонического кодирования, и декоррелированного сигнала или, по меньшей мере, одной из его частотных полос.
3. Устройство по п.1, отличающееся тем, что этап понижающего микширования сконфигурирован для генерирования первого звукового сигнала в соответствии с формулой
(L+R)/a,
где L и R обозначают левый и правый каналы левого/правого звукового сигнала, и а - действительное число.
4. Устройство по п.1, отличающееся тем, что первый сигнал соответствует принимаемому среднему сигналу.
5. Устройство по п.1, отличающееся тем, что модуль стереофонического микширования сконфигурирован для генерирования стереофонического сигнала на основе первого звукового сигнала, одного или нескольких параметров параметрического стереофонического кодирования, и второго звукового сигнала или, по меньшей мере, одной из его частотных полос, где второй звуковой сигнал представляет собой принимаемый побочный сигнал или остаточный сигнал, где остаточный сигнал указывает ошибку, связанную с представлением левого/правого или среднего/побочного звукового сигнала посредством первого звукового сигнала и одного или нескольких параметров параметрического стереофонического кодирования.
6. Устройство по п.5, отличающееся тем, что этап понижающего микширования также сконфигурирован для генерирования второго звукового сигнала на основе левого/правого звукового сигнала.
7. Устройство по п.5, отличающееся тем, что
устройство также включает декоррелятор, принимающий первый звуковой сигнал и выводящий декоррелированный сигнал, и
модуль стереофонического микширования селективно генерирует стереофонический сигнал на основе второго звукового сигнала или декоррелированного сигнала, где выбор является зависящим от частоты или независящим от частоты.
8. Устройство по п.7, отличающееся тем, что выбор является зависящим от частоты.
9. Устройство по п.8, отличающееся тем, что модуль стереофонического микширования использует второй звуковой сигнал для первого диапазона частот и декоррелированный сигнал для второго диапазона частот, где частоты первого диапазона частот ниже, чем частоты второго диапазона частот.
10. Устройство по п.7, отличающееся тем, что выбор зависит от индикатора приема радиосигнала, указывающего условия приема радиосигнала, и/или индикатора качества, указывающего качество принимаемого побочного сигнала.
11. Устройство по п.1, отличающееся тем, что один или несколько параметров параметрического стереофонического кодирования включают параметр, указывающий разность уровней каналов, и/или параметр, указывающий взаимную корреляцию между каналами.
12. Устройство по п.1, отличающееся тем, что устройство также включает этап шумоподавления, где этап шумоподавления предназначен для шумоподавления в первом звуковом сигнале, и первый звуковой сигнал с подавленным шумом после шумоподавления подают в модуль стереофонического микширования для генерирования стереофонического сигнала на основе первого звукового сигнала с подавленным шумом и одного или нескольких параметров параметрического стереофонического кодирования.
13. Устройство по п.1, отличающееся тем, что устройство также включает этап шумоподавления, предназначенный для шумоподавления в левом/правом или среднем/побочном звуковом сигнале, и левый/правый или средний/побочный звуковой сигнал с подавленным шумом после шумоподавления подают на этап оценки параметров параметрического стереофонического кодирования для генерирования одного или нескольких параметров параметрического стереофонического кодирования.
14. Устройство по п.13, отличающееся тем, что первый звуковой сигнал получен из левого/правого, или среднего/побочного, звукового сигнала в восходящем направлении относительно этапа шумоподавления.
15. Устройство по п.1, отличающееся тем, что
устройство также включает этап оценки шума, где этап оценки шума сконфигурирован для определения характеристики параметра шума для мощности шума в принимаемом побочном сигнале; и
этап оценки параметров параметрического стереофонического кодирования сконфигурирован для определения одного или нескольких параметров параметрического стереофонического кодирования на основе левого/правого или среднего/побочного звукового сигнала и параметра шума, зависящим от частоты или независящим от частоты образом.
16. Устройство по п.1, отличающееся тем, что
устройство сконфигурировано для уведомления о том, что FM-стереофоническим приемником для стереофонического радиосигнала выбран режим монофонического выходного сигнала или устройство сконфигурировано для уведомления о плохом приеме радиосигнала; и
модуль стереофонического микширования использует один или несколько параметров повышающего микширования для повышающего микширования вслепую в случае, когда устройство сообщает о том, что FM-стереофоническим приемником для стереофонического радиосигнала выбран режим монофонического выходного сигнала, или устройство сообщает о плохом приеме радиосигнала.
17. Устройство по п.16, отличающееся тем, что один или несколько параметров повышающего микширования для повышающего микширования вслепую являются одним или несколькими предварительно задаваемыми параметрами повышающего микширования.
18. Устройство по п.16, отличающееся тем, что
устройство также включает детектор речи, где детектор речи указывает, является ли левый/правый или средний/побочный звуковой сигнал преимущественно речевым сигналом, и
один или несколько параметров повышающего микширования для повышающего микширования вслепую зависят от указания детектора речи.
19. Устройство по п.1, отличающееся тем, что
устройство сконфигурировано для уведомления о том, что FM-стереофоническим приемником для стереофонического радиосигнала выбран режим монофонического выходного сигнала, или устройство сконфигурировано для уведомления о плохом приеме радиосигнала; и
когда FM-стереофонический приемник переключается в режим монофонического выходного сигнала, или возникает плохой прием радиосигнала, модуль стереофонического микширования использует один или несколько параметров повышающего микширования, которые основываются на одном или нескольких ранее оцененных параметрах параметрического стереофонического кодирования из этапа оценки параметров параметрического стереофонического кодирования.
20. Устройство по п.19, отличающееся тем, что модуль стереофонического микширования продолжает использовать один или несколько ранее оцененных параметров параметрического стереофонического кодирования из этапа оценки параметров параметрического стереофонического кодирования в качестве параметров повышающего микширования тогда, когда FM-стереофонический приемник переключается в режим монофонического выходного сигнала или возникает плохой прием радиосигнала.
21. Устройство по п.1, отличающееся тем, что
устройство сконфигурировано для уведомления о плохом приеме радиосигнала FM-стереофоническим радиоприемником;
этап ввода сконфигурирован для приема левого/правого звукового сигнала из FM-стереофонического радиоприемника;
когда устройство уведомляет о хорошем приеме радиосигнала, устройство выбирает нормальный стереофонический режим; и
в нормальном стереофоническом режиме стереофонический сигнал соответствует левому/правому звуковому сигналу.
22. Устройство по п.21, отличающееся тем, что устройство пригодно для осуществления выбора нормального стереофонического режима зависящим от частоты образом.
23. Устройство по п.22, отличающееся тем, что устройство включает:
- параметрический стереофонический кодер, содержащий этап оценки параметров параметрического стереофонического кодирования; и
- параметрический стереофонический декодер, содержащий модуль стереофонического микширования.
24. Устройство по п.22, отличающееся тем, что устройство включает аудиокодер, поддерживающий параметрическое стереофоническое кодирование, где аудиокодер включает параметрический стереофонический кодер, где этап оценки параметров параметрического стереофонического кодирования составляет часть параметрического стереофонического кодера.
25. Устройство по п.24, отличающееся тем, что аудиокодер представляет собой аудиокодер НЕ-ААС v2.
26. Устройство по п.24, отличающееся тем, что аудиокодер выводит битовый аудиопоток.
27. Устройство по п.25, отличающееся тем, что кодер НЕ-ААС v2 выводит битовый поток НЕ-ААС v2.
28. Устройство по п.26, отличающееся тем, что
кодер НЕ-ААС v2 включает в нисходящем направлении относительно параметрического стереофонического кодера кодер НЕ-ААС v1,
первый звуковой сигнал представляет собой сигнал в области QMF, и первый звуковой сигнал передается в кодер НЕ-ААС v1, и
кодер НЕ-ААС v1 не выполняет QMF-анализ первого звукового сигнала.
29. FM-стереофонический радиоприемник, который сконфигурирован для приема FM-радиосигнала, включающего средний сигнал и побочный сигнал, и содержит устройство по одному из пп.1-28.
30. Устройство мобильной связи, которое включает
FM-стереофонический радиоприемник, который сконфигурирован для приема FM-радиосигнала, включающего средний сигнал и побочный сигнал; и
устройство по одному из пп.1-28.
31. Способ улучшения левого/правого или среднего/побочного звукового сигнала FM-стереофонического радиоприемника, где FM-стереофонический радиоприемник сконфигурирован для приема FM-радиосигнала, где способ включает этапы, на которых
осуществляют прием левого/правого или среднего/побочного звукового сигнала из FM-стереофонического радиоприемника;
генерируют первый звуковой сигнал на основе левого/правого или среднего/побочного звукового сигнала посредством операции понижающего микширования;
определяют один или несколько параметров параметрического стереофонического кодирования на основе левого/правого или среднего/побочного звукового сигнала зависящим от частоты или независящим от частоты, образом; и
генерируют стереофонический сигнал на основе первого звукового сигнала и одного или нескольких параметров параметрического стереофонического кодирования посредством операции повышающего микширования, где генерирование первого звукового сигнала, определение и генерирование стереофонического сигнала выполнены в одном и том же модуле.
32. Способ по п.31, отличающийся тем, что способ также включает этапы, на которых
генерируют декоррелированный сигнал на основе первого звукового сигнала, и
генерируют стереофонический сигнал посредством операции повышающего микширования на основе первого звукового сигнала, декоррелированного сигнала и одного или нескольких параметров параметрического стереофонического кодирования.
Трансляция системы Бодо | 1934 |
|
SU42145A1 |
JP 2007274061 А, 18.10.2007 | |||
JP 2007129511 А, 24.05.2007 | |||
WO 2004075601 А1, 02.09.2004. |
Авторы
Даты
2013-08-27—Публикация
2010-09-07—Подача