Настоящее изобретение относится к многоканальным синтезаторам, и в частности к устройствам, создающим три или более выходных каналов с использованием двух входных стереоканалов.
Многоканальный аудиоматериал становится все более популярным также в домашней среде потребителя. Это происходит, главным образом, из-за того, что кинофильмы на DVD предлагают многоканальный звук 5.1 и поэтому даже домашние пользователи часто устанавливают звуковые воспроизводящие системы, способные обрабатывать многоканальный аудиосигнал. Такая установка состоит, например, из 3 громкоговорителей L, C, R во фронтальной части, 2 громкоговорителей Ls, Rs в задней части и канала LFE улучшения воспроизведения низких частот и обеспечивает несколько хорошо известных преимуществ по сравнению с 2-канальным стереовоспроизведением, например:
- улучшенная стабильность фронтального изображения даже вне оптимального центрального положения слушателя благодаря центральному каналу (большая "зона наилучшего восприятия" = оптимальное положение слушателя);
- повышенное ощущение "вовлечения" слушателя, создаваемое задними громкоговорителями.
Тем не менее существует огромное количество остающегося от прежних времен звукового материала, который состоит только из двух ("стерео") аудиоканалов, например на компакт-дисках (CD).
Для воспроизведения оставшегося от прежних времен двухканального аудиоматериала через многоканальную установку типа 5.1 имеются два основных варианта.
1. Воспроизводить стереосигналы левого и правого каналов через громкоговорители L и R соответственно, то есть воспроизводить их прежним способом. Это решение не позволяет воспользоваться преимуществами увеличения числа громкоговорителей в установке (центральные и задние громкоговорители).
2. Можно использовать способ преобразования двухканального аудиоматериала в многоканальный сигнал (это может происходить "по ходу дела" или с помощью предварительной обработки), который использует все громкоговорители системы 5.1 и, таким образом, извлекать выгоду из ранее обсужденных преимуществ многоканальной установки.
Решение № 2 очевидно обладает преимуществами перед решением № 1, но обладает также и некоторыми проблемами, особенно в отношении преобразования двух фронтальных каналов (левый и правый = LR) в три фронтальных канала (многоканальный левый, центральный и правый = L'C'R').
Хорошее решение преобразования LR в L'C'R' должно отвечать следующим требованиям.
1. Чтобы восстанавливать в случае L'C'R подобное, но более стабильное фронтальное изображение, чем в случае LR, центральный канал должен воспроизводить всю звуковую информацию, которая обычно воспринимается как приходящая из середины между левым и правым громкоговорителями, если слушатель находится в "зоне наилучшего восприятия". Кроме того, сигналы в левых фронтальных местах должны воспроизводиться L'C', а сигналы в правых фронтальных местах должны воспроизводиться R'C' соответственно (см. J.M. Jot и C. Avendano "Spatial Enhancement of Audio Recordings", 23-я конференция AES, Копенгаген, 2003).
2. Сумма акустической энергии, излучаемой каналами L'C'R', должна равняться сумме акустической энергии каналов-источников LR, чтобы достигнуть одинаково громкого звукового впечатления как для L'C'R, так и для LR. Полагая характеристики во всех каналах воспроизведения одинаковыми, она переводится в "сумму электрической энергии каналов L'C'R', которая должна быть равна сумме электрической энергии каналов-источников LR."
Благодаря требованию № 1, сигналы левого и правого каналов могут смешиваться в один (единый) центральный канал. Это, в частности, справедливо, когда сигналы левого и правого каналов примерно одинаковы, то есть они представляют фантомный источник звука в середине фронтального звукового каскада. Это фантомное изображение теперь заменяется "реальным" изображением, создаваемым центральным громкоговорителем. Благодаря требованию № 2, этот центральный сигнал будет нести сумму энергий левого и правого каналов. Если уровень сигнала левого или правого каналов близок к максимальной амплитуде, которая может быть передана по каналу (= 0 dBFS; dBFS = дБ в натуральном масштабе), сумма уровней обоих каналов превысит максимальный уровень, который может быть представлен каналом/системой. Это обычно приводит к нежелательному эффекту "амплитудного ограничения".
Ситуация амплитудного ограничения показана на фиг.6. На фиг.6 представлена форма сигнала 60 во времени, обработанного процессором, имеющим максимальный положительный порог 61a и максимальный отрицательный порог 61b. В зависимости от возможностей цифрового процессора, обрабатывающего цифровой сигнал, максимальный положительный порог и максимальный отрицательный порог могут быть равны +1 и -1. Альтернативно, когда цифровой процессор используется для представления чисел в целочисленном виде, максимальный положительный порог будет равен 32768, что соответствует 215, и максимальный отрицательный порог будет равен -32768, что соответствует -215.
Поскольку форма сигнала во времени представлена последовательностью отсчетов и каждый отсчет является числом в цифровой форме между -32768 и +32768, совершенно ясно, что более высокие числа могут быть получены, когда в некоторый момент времени первый канал имеет самое высокое значение, второй канал также имеет самое высокое значение, и эти самые высокие значения складываются вместе. Теоретически максимальное число, получаемое путем такого сложения вместе двух каналов, может равняться 65536. Однако процессор цифровых сигналов не способен представить такое большое число. Вместо этого цифровой процессор будет представлять только числа, равные максимальному положительному порогу или максимальному отрицательному порогу. Поэтому процессор цифрового сигнала выполняет амплитудное ограничение чисел таким образом, что число выше или равное максимальному положительному порогу или максимальному отрицательному порогу заменяется числом, равным максимальному положительному порогу и максимальному отрицательному порогу, так что возникает ситуация, показанная на фиг.6. В пределах отрезка 62 времени амплитудного ограничения форма сигнала 60 не имеет своей естественной формы (синусоиды), а уплощается или ограничивается. Когда этот ограниченный сигнал оценивается со спектральной точки зрения, становится ясно, что амплитудное ограничение во временной области приводит в результате к сильному росту гармонических составляющих, вызванному высокой величиной градиента в начале и в конец отрезка 62 времени амплитудного ограничения.
Это "цифровое амплитудное ограничение" не связано с установкой воспроизведения, то есть набором усилителей и громкоговорителей, используемых для воспроизведения аудиосигнала. Однако каждая комбинация усилителя/громкоговорителя также имеет только ограниченный линейный диапазон, и когда обрабатываемый сигнал превышает этот линейный диапазон, также имеет место своего рода амплитудное ограничение, которого можно избежать, используя концепцию изобретения.
В любом случае возникновение амплитудного ограничения создает сильные искажения в аудиосигнале, которые очень сильно ухудшают качество воспринимаемого звука. Таким образом, возникновения амплитудного ограничения следует избегать. Это происходит даже больше за счет того факта, что улучшение звука за счет обеспечения стереосигнала многоканальной установкой, такой как система громкоговорителей типа 5.1, мало по сравнению с наиболее раздражающими искажениями за счет амплитудного ограничения. Поэтому, когда нельзя гарантировать, что амплитудное ограничение не произойдет, для воспроизведения стереосигнала можно предпочесть использовать только левый и правый громкоговорители многоканальной установки. На предшествующем уровне развития техники существуют решения по преодолению этой проблемы амплитудного ограничения.
Простое решение по преодолению этой проблемы состоит в том, чтобы уменьшить масштаб всех каналов в равной степени до уровня, при котором ни один из сигналов в каналах (особенно сигнал в центральном канале) не превышает предельного значения 0 dBFS. Это может быть сделано статически с помощью заранее определенного фиксированного значения. В этом случае фиксированное значение должно также быть действительно для случаев самых плохих ситуаций, когда левый и правый каналы имеют максимальные уровни. Для преобразования усредненных LR в L'C'R' это ведет к значительно более качественной версии L'C'R', чем первоначальная стереоверсия LR, которая нежелательна, особенно, когда пользователи переключаются между стерео- и многоканальным воспроизведением. Это поведение может наблюдаться в коммерчески доступных матричных декодерах (Dolby ProLogicII и Logic7 Decoder), которые могут использоваться как преобразователи LR в L'C'R'. Смотрите публикацию Dolby: "Dolby Surround Pro Logic II Decoder - Principles of Operation", http://www.dolby.com/assets/ pdf/tech_library/209_Dolby_Surround_Pro_Logic_II_Decoder_Principles_of_Operation.pdf или Griesinger, D.: "Multichannel Matrix Surround Decoders for Two-Eared Listeners", 101st AES Convention, Los Angeles, USA, 1996, Preprint 4402.
Другое простое решение заключается в использовании сжатия динамического диапазона, чтобы динамически (в зависимости от сигнала) ограничивать максимальный сигнал, что иногда также называют "ограничителем". Недостаток этого подхода состоит в том, что истинный динамический диапазон аудиопрограммы не воспроизводится, а подвергается сжатию (смотрите Digital Audio Effects DAFX; Udo Zolzer, Editor; 2002; Wiley & Sons; p. 99ff: "Limiter").
Решение с уменьшением масштаба нежелательно, так как оно понижает уровень или громкость звукового сигнала по сравнению с уровнем исходного сигнала. Чтобы полностью избежать любого, даже теоретического возникновения амплитудного ограничения, можно было бы уменьшить масштаб всех каналов с коэффициентом масштабирования, равным 0,5. Это приводит в результате к сильно уменьшенному выходному уровню многоканального сигнала по сравнению с исходным сигналом. Когда такой многоканальный сигнал с пониженным масштабированием слушает только один человек, он может сделать компенсацию такого снижения уровня, увеличивая усиление усилителя звуковой частоты. Однако когда он переключается между несколькими источниками, стереосигнал (по старым технологиям) будет представляться слушателю очень громким, когда он воспроизводится, используя тот же самый коэффициент усиления усилителя комплекта, предназначенного для многоканального воспроизведения.
Таким образом, перед переключением с многоканального представления стереосигнала на истинное стереопредставление стереосигнала пользователь должен подумать об уменьшении коэффициента усиления своего усилителя, чтобы не повредить свои уши или оборудование.
Другой способ, соответствующий предшествующему уровню развития техники, использующий сжатие динамического диапазона, позволяет эффективно избегать амплитудного ограничения. Однако сам аудиосигнал изменяется. Таким образом, динамическое сжатие ведет к неподлинному аудиосигналу, который даже, когда введенные искажения не слишком раздражают, является сомнительным с точки зрения подлинности.
Задача настоящего изобретения состоит в том, чтобы обеспечить улучшенную концепцию многоканального синтеза, используя два входных канала.
Эта задача решается устройством синтезирования в соответствии с пунктом 1 формулы изобретения, способом синтезирования в соответствии с пунктом 14 формулы изобретения, компьютерной программой в соответствии с пунктом 15 формулы изобретения или с помощью трехканального представления в соответствии с пунктом 16 формулы изобретения.
Настоящее изобретение основано на том факте, что для преодоления проблемы амплитудного ограничения и достижения тем не менее преимуществ, даваемых воспроизведением стереосигнала, используя три или более каналов многоканальной установки, центральный канал создается как обычно, то есть принимает звуковые события, расположенные в середине между левым и правым громкоговорителями, которая также называется представлением "реального центра". Однако когда реальный центр может войти в диапазон амплитудного ограничения, только часть энергии, представляющая события в середине аудиоустановки, подается в центральный канал. Остаток энергии этих звуковых событий отводится назад в первый и третий (или левый и правый) каналы или попадает туда с самого начала.
Таким образом, в течение отрезка времени, когда может происходить амплитудное ограничение, когда процедура преобразования с двух каналов на три выполняется без изменений, центральный канал масштабируется вниз до уровня, ниже или равного максимальному уровню, возможному без амплитудного ограничения. Однако отсутствующая часть/энергия сигнала, которая не может быть представлена центральным каналом, воспроизводится левым каналом и правым каналом как "виртуальный центр " или "фантомный центр".
Сигналы реального центра и виртуального центра затем акустически объединяются во время воспроизведения, восстанавливая предполагаемый центр без амплитудного ограничения. Это "смешивание" сигналов реального центра и виртуального центра приводит в результате к улучшенному, более стабильному фронтальному изображению стереоаудиосигнала, то есть к увеличенной зоне наилучшего восприятия, хотя зона наилучшего восприятия не так велика, как когда фантомный центр не существовал бы вообще. Однако представленный в изобретении процесс не имеет никаких искажений какого-либо амплитудного ограничения, так как остаток энергии, не подлежащий обработке в пределах второго канала, благодаря проблеме амплитудного ограничения, не теряется, а представляется первоначальными левым и правым каналами.
Здесь отмечается, что для любых ситуаций энергия левого и правого каналов в многоканальной установке ниже, чем энергия в первоначальных левом и правом каналах, так как энергия центрального канала отбирается от левого и правого каналов. Поэтому даже когда в соответствии с настоящим изобретением остающаяся часть энергии отводится обратно в левый и правый выходные каналы, проблема амплитудного ограничения внутри этих каналов никогда не будет существовать.
Дополнительное преимущество настоящего изобретения состоит в том, что предусмотренное изобретением создание сигнала выполняется способом, при котором согласно предпочтительному варианту осуществления полная электрическая или акустическая энергия созданных трех выходных каналов (и, желательно, созданных дополнительных выходных каналов типа Ls, Rs, Cs, LFE, …) сохраняется по отношению к энергии первоначального стереосигнала. Можно гарантировать одну и ту же полную громкость, независимо от пути прохождения сигнала, то есть независимо от того, представляется ли сигнал, используя стереоустановку, имеющую только два громкоговорителя, или сигнал представляется, используя многоканальную установку, имеющую больше двух громкоговорителей.
Кроме того, создание сигнала в соответствии с изобретением и распространение звуковой энергии к центральному каналу и левому и правому каналам динамически применяется, только если амплитудное ограничение может быть неизбежным, то есть второй центральный канал полностью неизменен в ситуациях, которые не затрагиваются амплитудным ограничением, то есть когда значения выборок второго канала остаются ниже или только равны максимальному порогу.
Кроме того, результирующая акустическая комбинация "реального центра" и "фантомного центра" создает сигнал, который гораздо ближе к оптимальной трехканальной конфигурации, то есть с тремя каналами без амплитудного ограничения или тремя каналами, в которых значения выборки допустимы без какого-либо минимального/максимального порога. Звуковое изображение, соответствующее изобретению, поэтому в предпочтительных вариантах осуществления не различается ни по уровню по сравнению со входным стереосигналом, ни по подлинности, как могло бы быть в случае использования ограничителя или простого амплитудного ограничителя.
Предпочтительные варианты осуществления настоящего изобретения в дальнейшем объясняются со ссылкой на сопроводительные чертежи, на которых:
фиг.1 - устройство синтезирования верхних каналов в соответствии с предпочтительным вариантом осуществления настоящего изобретения;
фиг.2a - предпочтительный вариант осуществления генератора сигнала, показанного на фиг.1, имеющего постпроцессор;
фиг.2b - предпочтительная реализация постпроцессора, показанного на фиг.2a;
фиг.3 - дополнительный вариант осуществления генератора сигнала, соответствующего настоящему изобретению, имеющего итеративное управление преобразователем числа каналов;
фиг.4 - дополнительный вариант осуществления генератора сигнала, соответствующего настоящему изобретению, полностью работающего в области параметров;
фиг.5 - пример звуковой системы 5.1, не обязательно имеющей также центральный канал окружающего звука Cs;
фиг.6 - форма сигнала с амплитудным ограничением;
фиг.7 - схематическое представление энергетической ситуации первоначального двухканального входного сигнала и трехканального выходного сигнала до и после амплитудного ограничения; и
фиг.8 - предпочтительный анализатор входных каналов.
На фиг.1 показан предпочтительный вариант осуществления устройства, соответствующего изобретению, для синтезирования трех выходных каналов, используя два входных канала, в котором второй канал из этих трех выходных каналов предназначен для громкоговорителя в установке аудиовоспроизведения, который располагается между двумя громкоговорителями, предназначенными для приема первого выходного канала и третьего выходного канала. Входные каналы обозначены 10a, который может быть, например, левым каналом L, и 10b для второго канала, который может быть правым каналом R. Выходные каналы обозначены как 12a для правого канала, 12b для центрального центра и 12c для левого канала. Могут быть созданы дополнительные выходные каналы, такие как левый выходной канал 14a окружения, правый выходной канал 14b окружения и канал 14c улучшенного воспроизведения нижних частот. Размещение соответствующих громкоговорителей для этих каналов показано на фиг.5. В середине этих громкоговорителей 12a, 12b, 12c, 14a, 14b находится зона 50 наилучшего восприятия. Когда слушатель находится внутри зоны наилучшего восприятия, он получает оптимальное ощущение звука.
Дополнительно можно добавить центральный канал 51 окружения Cs, который располагается между левым каналом 14a окружения и правым каналом 14b окружения. Сигнал для центрального канала 51 окружения может вычисляться, используя тот же самый процесс, который используется при вычислении сигнала для центрального канала 12b. Дополнительно способы, соответствующие изобретению, могут поэтому также применяться к вычислению центрального канала окружения, чтобы избежать амплитудного ограничения в центральном канале окружения.
Следует отметить, что процесс, соответствующий изобретению, полезен для каждой группы аудиоканалов, в которой используются два входных канала, предназначенных для двух различных пространственных положений в установке воспроизведения, и в которой три выходных канала создаются, используя эти два входных канала, и где второй канал из трех каналов расположен между двумя дополнительными громкоговорителями в установке воспроизведения, на которые подаются сигналы первого и третьего входных каналов.
Устройство синтезатора, соответствующее изобретению, показанное на фиг.1, содержит анализатор 15 входных каналов для анализа двух входных каналов, чтобы определить компоненты сигнала, которые появляются в обоих входных каналах. Эти компоненты сигнала, которые появляются в обоих входных каналах, могут использоваться для построения канала реального центра, то есть могут предоставляться через центральный канал C, показанный на фиг.5. Как правило, стереосигнал содержит много монофонических сигнальных компонент, таких как оратор, или, когда рассматриваются музыкальные сигналы, певец или солирующий инструмент, расположенный перед оркестром и поэтому находящийся перед аудиторией.
Устройство синтезатора, соответствующее изобретению, дополнительно содержит избирательный по времени и частотно избирательный и зависимый от сигнала генератор 16 сигнала для создания трех выходных каналов 12a, 12b, 12c, используя два входных канала 10a, 10b и информацию об обнаруженных компонентах сигнала, появляющихся в обоих входных каналах, как предусмотрено линией 13. В частности, генератор сигнала, соответствующий изобретению, действует так, чтобы подавать обнаруженные компоненты сигнала, по меньшей мере, частично во второй канал. Кроме того, генератор работает так, чтобы подавать только часть обнаруженных компонент сигнала во второй канал, когда существует ситуация, в которой полная подача обнаруженных компонент сигнала должна привести в результате к превышению максимального порога.
Таким образом, второй выходной канал имеет отрезок времени, в течение которого содержит только часть обнаруженных компонент сигнала, чтобы избежать амплитудного ограничения, в то время, как в другой части второго выходного канала обнаруженные компоненты сигнала полностью подаются во второй выходной канал. Остаток обнаруженных компонент сигнала вводится в первый и третий выходные каналы и, следовательно, формируют "фантомный центр", когда эти каналы передаются через установку громкоговорителей, например, показанную на фиг.5.
В зависимости от реализации концепции изобретения "часть" обнаруженных компонент сигнала, размещенных во втором канале, и остаток от обнаруженных компонент сигнала, размещенный в первом и третьем каналах, может быть частью энергии или частью частот, или любой другой частью так, чтобы второй канал содержал только часть обнаруженных компонент сигнала, и следовательно, не вызывал никаких искажений, связанных с амплитудным ограничением.
На фиг.2a показан предпочтительный вариант осуществления анализатора 16 сигналов, соответствующего изобретению и показанного на фиг.1. В частности, в варианте осуществления, показанном на фиг.2a, анализатор сигналов содержит преобразователь 16 числа каналов с 2 каналов в 3 канала, выполняющий процесс преобразования с увеличением числа каналов, управляемый анализатором 15 входных каналов, показанным на фиг.1. Выходы L, R, C-каналов преобразователя числа каналов с увеличением с 2 каналов до 3 являются выходными каналами преобразователя числа каналов. Однако канал C может подвергаться амплитудному ограничению, поскольку канал C создается, используя процесс сложения, в котором компоненты сигнала от левого канала и от правого канала складываются вместе.
Центральный канал C является входным для устройства 16d обнаружения амплитудного ограничения, которое подает сигнал на постпроцессор 16c, который также принимает информацию по обнаруженным компонентам сигнала. В частности, устройство 16b обнаружения амплитудного ограничения действует так, чтобы исследовать форму сигнала во времени для центрального канала 12c.
В зависимости от реализации устройство обнаружения амплитудного ограничения может быть выполнено различными способами. Когда предполагается, что генератор сигнала, показанный на фиг.2а, может обрабатывать числа, имеющие величину выше заранее определенного максимального порога, то тогда устройство 16b обнаружения амплитудного ограничения просто исследует форму сигнала во времени, чтобы увидеть, имеются ли числа выше максимального порога каскада последующей обработки. Когда такая ситуация обнаруживается, постпроцессор 16c активируется через линию 16d запуска, чтобы запустить постобработку так, чтобы энергия центрального канала снижалась, а энергия левого и правого каналов увеличивалась так, чтобы три сигнала 12a, 12b, 12c выходных каналов, в конечном итоге, были выходом постпроцессора 16c. Таким образом, в соответствии с вариантом осуществления, показанным на фиг.2а, процесс преобразования LR в LCR делается как обычно. Внутренний сигнал 20b первого каскада центрального канала анализируется, чтобы проверить, может ли произойти амплитудное ограничение, если он должен будет быть выведен как внешний сигнал, такой как в формате AES/EBU или в формате SPDIF. Когда это случается, часть сигнала 20b удаляется в постпроцессоре 16c, приводя в результате к видоизмененному сигналу 12b в центральном канале и распределению его по промежуточным левому и правому каналам 20a, 20c в качестве вклада в "фантомный центр". После постобработки сигнал 12b центрального канала снова будет ниже 0 dBFS.
Предпочтительный вариант осуществления постпроцессора 16c показан на фиг. 2b. Центральный канал 20b после преобразователя 16a числа каналов поступает в устройство 25 извлечения части сигнала. Устройство извлечения части сигнала принимает информацию 13 об обнаруженных компонентах сигнала и управляющий сигнал через линию 16d от устройства обнаружения амплитудного ограничения, которое может также содержать индикацию объема извлечения. Альтернативно объем извлечения на каждый шаг итерации может быть установлен независимым от любого возникающего амплитудного ограничения, и итеративный процесс испытания/обработки ошибок может применяться для извлечения увеличивающихся объемов обнаруженных компонент сигнала пошаговым способом, пока устройство 16b обнаружения амплитудного ограничения не обнаружит отсутствие какого-либо амплитудного ограничения. Затем модифицированный центральный канал 12b выводится устройством извлечения части сигнала и остаток обнаруженных компонент сигнала, соответствующий извлеченной части, должен повторно распределяться по левому и правому каналам 20c, 20a, выводимый преобразователем числа каналов после умножения на 0,5. С этой целью постпроцессор содержит два множителя 26 в каждой ветви или одиночный умножитель перед разветвлением и левый сумматор 27a, и правый сумматор 27b.
Когда выполнено обнаружение компонент сигнала, возникающих в обоих входных каналах, то тогда левый и правый каналы 20a, 20c не содержат никакого "фантомного центра". Однако путем прибавления извлеченных компонент (после умножения на 0,5) к этим каналам, фантомный центр прибавляется к левому и правому каналам.
Далее дополнительный вариант осуществления настоящего изобретения и, в частности, генератора 16 сигнала, показанного на фиг.1, обсуждается со ссылкой на фиг.3. Сигналы входных каналов поступают на управляемый преобразователь числа каналов с увеличением с 2 каналов до 3, принимающий информацию об обнаруженных компонентах сигнала для создания трех выходных каналов в первом шаге итерации, управляемом контроллером 30 итерации. Первый шаг будет равносилен операции преобразователя числа каналов, показанного на фиг.2a, то есть центральный канал 20b может иметь проблемы амплитудного ограничения. Такая ситуация амплитудного ограничения будет обнаруживаться устройством 16b обнаружения амплитудного ограничения. В отличие от варианта осуществления, показанного на фиг.2a, устройство 16b обнаружения амплитудного ограничения управляет преобразователем 16a с увеличением числа каналов с помощью обратной связи через линию 31 управления преобразователем 16a числа каналов, чтобы некоторым способом изменить правило преобразования числа каналов так, чтобы созданный центральный канал 20b принял, после одного или более шагов итерации, управляемых контроллером 30 итераций, только разрешенную часть обнаруженных компонент сигнала, чтобы никакое амплитудное ограничение более не происходило.
Таким образом, вариант осуществления, показанный на фиг.3, поясняет итеративный процесс. При первом проходе итеративного процесса операция преобразователя с увеличением числа каналов выполняется как обычно. На выходе устройство 16b обнаружения проверяет, происходит ли амплитудное ограничение. Когда амплитудное ограничение обнаружено, этот временной участок обрабатывается снова, теперь используя процесс повторного отображения и перенаправление части энергии центрального канала в левый и правый каналы как вклад в фантомный центр.
Вариант осуществления, показанный на фиг.4, работает полностью в области параметров. С этой целью обеспечивается устройство 40 вычисления параметров преобразователя с увеличением числа каналов, которое соединено с устройством 41 изменения параметров. Дополнительно обеспечивается устройство 42 обнаружения амплитудного ограничения, которое действует для изучения первоначальных левого и правого каналов или вычисленных параметров преобразователя с увеличением числа каналов, чтобы выяснить, возникнет или нет амплитудное ограничение после прямого процесса преобразования с увеличением числа каналов. Когда устройство 42 обнаружения амплитудного ограничения обнаруживает опасность амплитудного ограничения, оно управляет изменением 41 параметров через линию 44 управления, чтобы обеспечить измененные параметры преобразования с увеличением числа каналов, которые затем непосредственно поступают на преобразователь 16a числа каналов, который затем создает первый, второй и третий выходные каналы, так что никакое амплитудное ограничение не происходит во втором канале, и для временного интервала, в котором устройство 16а обнаружения амплитудного ограничения первоначально обнаруживало проблему амплитудного ограничения, левый и правый каналы 12c, 12a дают вклад в фантомный центр.
В отличие от вариантов осуществления, показанных на фиг.2 и фиг.3, процесс, соответствующий изобретению, выполняется, основываясь на параметрах обработки, которые используются для получения выходных сигналов 20a, 20b, 20c или 12a, 12b, 12c из входных стереосигналов. Таким образом, чтобы обеспечить реализации при все еще невысокой вычислительной сложности, обнаружение амплитудного ограничения и манипуляция сигнальных уровней или части этого основывается на параметрах обработки. В этом состоит отличие от вариантов осуществления, показанных на фиг.2 и 3, в которых процесс, соответствующий изобретению, выполняется на реальных сигналах аудиоканалов, которые уже были созданы для центрального центра после того, как возможное амплитудное ограничение могло быть обнаружено.
Обнаружение/управление амплитудным ограничением в соответствии с изобретением может быть выполнено путем последующей обработки. Таким образом, намеченные параметры преобразования анализируются и изменяются согласно концепции изобретения, чтобы обеспечить амплитудное ограничение после синтеза реальных выходных аудиосигналов. Альтернативным способом управления изменением 41 параметров является итеративный путь. Намеченные параметры преобразования анализируются. Если после синтеза реального аудиосигнала может возникнуть амплитудное ограничение, параметры преобразования изменяются. Затем процесс запускается снова и окончательно сигналы выходных каналов синтезируются без какого-либо амплитудного ограничения и с вкладами, даваемыми реальным центром и фантомным центром в соответствующие каналы.
Далее будет обсуждена предпочтительная реализация анализатора входных каналов. С этой целью делается ссылка на фиг.8, на которой показан такой предпочтительный анализатор 15 входных каналов. Прежде всего, последовательные или перекрывающиеся кадры, следующие друг за другом, создаются, используя блок 80 кадрирования, так, чтобы на выходе блока 80 на линии 81a присутствовал набор значений для левого канала и на линии 81b присутствовал набор значений для правого канала. Затем для каждого набора индивидуально выполняется частотный анализ. С этой целью для каждого канала предусмотрен частотный анализатор 82.
Частотный анализатор может быть любым устройством для создания частотной области, представляющей сигнал во временной области. Такой частотный анализатор может содержать устройство кратковременного преобразования Фурье, на основе алгоритма быстрого преобразования Фурье (FFT) или быть устройством преобразования MDCT, или любым другим устройством преобразования. Альтернативно блок 82 частотного анализатора может также содержать набор фильтров поддиапазонов для создания, например, 32 каналов поддиапазонов или большего, или меньшего числа каналов поддиапазонов из набора значений входного сигнала. В зависимости от реализации набора фильтров поддиапазонов функциональные возможности кадрирующего устройства 80 и блока 82 частотного анализа могут быть реализованы в едином, реализуемом в цифровой форме наборе фильтров поддиапазонов.
Затем выполняется взаимная корреляция по всему диапазону, как показано устройством 84. Таким образом, устройство взаимной корреляции определяет меру взаимной корреляции между соответствующими диапазонами, то есть диапазонами, имеющими один и тот же частотный индекс. Мера взаимной корреляции, определенная блоком 84, может иметь значение между 0 и 1, где 0 указывает, что корреляция отсутствует, а 1 указывает полную корреляцию. Когда на выходе устройства 84 присутствует низкое значение взаимной корреляции, это означает, что компоненты левого и правого сигналов в соответствующем диапазоне отличаются друг от друга так, что этот диапазон не содержит компонент сигнала, возникающих в обоих диапазонах, которые должны вводиться в центральный канал. Когда, однако, значение взаимной корреляции высокое, указывая, что сигналы в обоих диапазонах очень схожи друг с другом, тогда этот диапазон имеет компонент сигнала, встречающийся в левом и правом каналах, так что этот диапазон должен вводиться в центральный канал.
Дальнейшим критерием для принятия решения, схожи ли друг другу сигналы в диапазонах, является энергия сигнала. Поэтому предпочтительный вариант осуществления анализатора входных каналов, соответствующего изобретению, содержит устройство 85 вычисления энергии во всем диапазоне, который вычисляет энергию в каждом диапазоне и выводит меру схожести энергий, указывающую, являются ли энергии в соответствующих диапазонах подобными друг другу или различающимися друг от друга.
Выходной сигнал меры схожести энергий, обеспечиваемый устройством 85, и выходной сигнал меры взаимной корреляции, обеспечиваемый устройством 84, поступают на вход каскада 86 принятия окончательного решения, который делает заключение, что в определенном кадре определенный диапазон i появляется или не появляется в обоих каналах. Когда каскад 86 принятия решения определяет, что сигнал появляется в обоих каналах, то тогда эта часть сигнала вводится в центральный канал, чтобы создать "реальный центр".
На фиг.8 показан вариант осуществления для реализации анализатора входных каналов. Дополнительные варианты осуществления известны на предшествующем уровне развития техники и представлены, например, в "Spatial enhancement of audio recordings", Jot and Avendano, 23rd International AES Conference, Copenhagen, Denmark, May 23-25, 2003. В частности, другие способы анализа двух каналов для нахождения компонент сигнала в этих каналах содержат статистические или аналитические способы анализа, такие как анализ основных компонент или анализ независимого подпространства, или другие способы, известные в области анализа звуковых сигналов. Все эти способы имеют одно общее, состоящее в том, что они обнаруживают компоненты сигнала, появляющиеся в обоих каналах, которые должны вводиться в центральный канал, чтобы создать реальный центр.
Далее делается ссылка на фиг.7, чтобы показать энергетическую ситуацию до и после процесса преобразования двух каналов в три, осуществленного преобразователем 16a двух каналов в три, показанным на чертежах. Левый входной канал L, показанный в позиции 70 на фиг.7, имеет определенную энергию. В этом примере правый входной канал из двух входных стереоканалов имеет другую (более низкую) энергию, как показано в позиции 71. Предполагается, что анализатор каналов выявил, что существуют компоненты сигнала, возникающие в обоих каналах. Эти компоненты сигнала, возникающие в обоих каналах, имеют энергию, показанную в позиции 72 на фиг.7. Когда вся энергия 72 вводится в центральный канал, как показано в позиции 73, энергия центрального канала может быть выше предельного значения энергии, как показано на фиг.7, где предельное значение энергии, по меньшей мере, грубо показывает, что сигнал с такой высокой энергией имеет амплитудное значение, превышающее порог максимума амплитуды. Поэтому только часть энергии 72 вводится в реальный центр, тогда как превышающая часть одинаково распределяется (перераспределяется) по синтезированным левому и правому каналам L' и R', как показано стрелками 76.
В этом контексте следует отметить, что существуют различные пути перераспределения энергии от центрального канала назад к левому и правому каналам или для введения корректирующего объема энергии от первоначального левого канала и первоначального правого канала в центральный канал. Можно, например, уменьшить масштаб всех обнаруженных компонент сигнала с определенным масштабным коэффициентом и ввести сигнал в уменьшенном масштабе в центральный канал. Это должно иметь равные последствия для компонент сигнала в каждом диапазоне, когда применяется частотно-избирательный анализ. Альтернативно может также выполняться управление энергией по всему диапазону. Это означает, что когда было обнаружено, например, 10 диапазонов с обнаруженными компонентами сигнала, в центральный канал можно ввести только 5 диапазонов, оставив остальные 5 диапазонов в левом и правом каналах для уменьшения энергии в центральном канале.
В зависимости от определенных требований к осуществлению способов изобретения, способ изобретения может осуществляться с помощью аппаратурного оборудования или программного обеспечения. Осуществление может производиться, используя цифровой носитель, в частности диск или компакт-диск с хранящимися на нем электронно считываемыми управляющими сигналами, которые могут использоваться вместе с программируемой компьютерной системой, чтобы реализовать способ изобретения. В целом настоящее изобретение поэтому является компьютерным программным продуктом с управляющей программой, записанной на читаемом машиной носителе, управляющей программой, выполненной с возможностью реализации способа изобретения, когда компьютерный программный продукт выполняется на компьютере. Другими словами, изобретение является также компьютерной программой, имеющей управляющую программу для выполнения способа изобретения, когда компьютерная программа выполняется на компьютере.
Изобретение относится к многоканальным синтезаторам. Для синтезирования, по меньшей мере, трех выходных каналов, используя два входных стереоканала, входные стереоканалы анализируются (15) для обнаружения компонент сигнала, появляющихся в обоих входных каналах. Генератор (16) сигнала работает так, чтобы ввести, по меньшей мере, часть обнаруженных компонент сигнала во второй канал (12b), ассоциативно связанный со вторым громкоговорителем в назначенной схеме громкоговорителей, который располагается между первым и третьим громкоговорителем в схеме громкоговорителей. Когда, однако, подача всех обнаруженных компонент сигнала может привести к ситуации амплитудного ограничения, то тогда только часть обнаруженных компонент сигнала вводится во второй канал в качестве реального центрального канала, а остаток располагают в первом и третьем каналах в качестве фантомного центрального канала. Технический результат - обеспечить улучшение компенсации многоканального синтеза, используя два входных канала. 5 н. и 9 з.п. ф-лы, 9 ил.
1. Устройство для синтезирования трех выходных каналов (12a, 12b, 12c), используя два входных канала (10a, 10b), в котором второй канал из трех выходных каналов подается на громкоговоритель в определенной схеме обеспечения аудиосигнала, который располагается между двумя громкоговорителями, на которые подаются первый выходной канал и третий выходной канал, содержащее:
анализатор (15) для анализа двух входных каналов с целью обнаружения компонент сигнала, появляющихся в обоих входных каналах, чтобы получить обнаруженные компоненты сигнала; и
генератор (16) сигнала для создания трех выходных каналов (12a, 12b, 12c), используя два входных канала (10a, 10b), в котором генератор сигнала содержит:
преобразователь (16а) с увеличением с двух каналов до трех для создания, по меньшей мере, второго промежуточного канала (12b), содержащего, по меньшей мере, часть обнаруженных компонент сигнала;
устройство (16b) обнаружения амплитудного ограничения для обнаружения части сигнала второго канала, имеющей амплитуду, превышающую максимальный порог; и
контроллер (30, 31) преобразователя с увеличением числа каналов с двух до трех для управления преобразователем (16а) с увеличением с двух каналов до трех так, чтобы только часть обнаруженных компонент сигнала подавалась во второй канал, а остаток компонент сигнала оставался в первом и третьем выходных каналах, когда подача полных обнаруженных компонент сигнала может привести в результате к превышению максимального порога (61a, 61b) для второго канала.
2. Устройство по п.1, в котором генератор (16) сигнала работает, чтобы создавать три выходных канала так, чтобы в некоторый период времени полная энергия трех выходных каналов и потенциально возможно создаваемых дополнительных выходных каналов равнялась электрической или акустической энергии двух входных каналов.
3. Устройство по п.1, в котором генератор (16) сигнала работает, чтобы создавать второй выходной канал таким образом, чтобы часть обнаруженных компонент сигнала, поданных во второй канал, была как можно большей, так чтобы энергия второго выходного канала, который содержит только часть обнаруженных компонент сигнала, всегда имела максимальную амплитуду ниже или равную максимальному порогу (61a, 61b).
4. Устройство по п.1, в котором генератор (16) сигнала выполнен с возможностью включения в первый и третий каналы оставшихся (73) обнаруженных компонент сигнала, которые не попали во второй канал.
5. Устройство по п.3, в котором максимальный порог (61a, 61b) является полномасштабной амплитудой, определенной упомянутым устройством для синтезирования или цифровым или аналоговым обрабатывающим устройством, соединенным с упомянутым устройством для синтезирования.
6. Устройство по п.5, в котором максимальный порог (61a, 61b) является равным максимально допустимому положительному или отрицательному значению выборки сигнала во временной области.
7. Устройство по п.1, в котором анализатор (15) работает для определения (84) меры взаимной корреляции, по меньшей мере, между частью первого входного канала и вторым входным каналом и обнаружения (86) части, имеющей меру взаимной корреляции выше порога схожести.
8. Устройство по п.1, в котором анализатор (15) работает для обнаружения (85) энергии части первого канала и части второго канала и обнаружения (86) частей каналов, имеющих энергии, равные или отличающиеся меньше, чем на порог равенства.
9. Устройство по п.1, в котором анализатор (15) и генератор (16) сигнала работают, чтобы выполнять избирательный по частоте или избирательный по времени анализ и синтез.
10. Устройство по п.1, в котором первый и второй каналы являются левым каналом (L) и правым каналом (R) стереопредставления аудиосигнала, и
в котором три выходных канала являются фронтальным-левым каналом (L'), центральным каналом (С'), и фронтальным-правым каналом (R'), или задним-левым каналом (Ls), задним центральным каналом (Cs) и задним-правым каналом (Rs).
11. Способ синтезирования трех выходных каналов (12а, 12b, 12c), используя два входных канала (10а, 10b), в котором второй канал (12b) из трех выходных каналов подается на громкоговоритель в определенной схеме обеспечения аудиосигнала, который располагается между двумя громкоговорителями, на которые подаются первый выходной канал и третий выходной канал, содержащий этапы, на которых:
анализируют (15) два входных канала для обнаружения компонент сигнала, встречающихся в обоих входных каналах; и
создают (16) три выходных канала, используя два входных канала, причем этап создания содержит этапы, на которых:
создают (16а), по меньшей мере, второй промежуточный канал (12b), содержащий, по меньшей мере, часть обнаруженных компонент сигнала;
обнаруживают (16b) часть второго канала, имеющую амплитуду выше максимального порога; и
управляют (30, 31) этапом создания так, чтобы только часть обнаруженных компонент сигнала подавались во второй канал, а оставшиеся компоненты сигнала оставались в первом и третьем выходных каналах, когда подача полных обнаруженных компонент сигнала может привести к превышению максимального порога для второго канала.
12. Устройство синтезирования трех выходных каналов (12a, 12b, 12c), используя два входных канала (10a, 10b), в котором второй канал из этих трех выходных каналов подается на громкоговоритель в определенной схеме обеспечения аудиосигнала, который располагается между двумя громкоговорителями, на которые подаются первый выходной канал и третий выходной канал, содержащее:
анализатор (15) для анализа двух входных каналов с целью обнаружения компонент сигнала, появляющихся в обоих входных каналах, чтобы получить обнаруженные компоненты сигнала; и
генератор (16) сигнала для создания трех выходных каналов (12a, 12b, 12c), используя два входных канала (10а, 10b), в котором генератор сигнала содержит:
устройство (42) обнаружения амплитудного ограничения для определения части входных каналов, для которой существует вероятность амплитудного ограничения;
преобразователь (16а) с двух каналов до трех для создания трех промежуточных каналов, причем второй промежуточный канал содержит, по меньшей мере, часть обнаруженных компонент сигнала; и
контроллер (41) для управления преобразователем (16а) с двух каналов до трех так, чтобы параметр создания для повышающего преобразования упомянутой части, определенной устройством обнаружения амплитудного ограничения, управлялся таким образом, чтобы второй канал всегда имел амплитуду ниже или равную максимальному порогу.
13. Способ синтезирования трех выходных каналов (12a, 12b, 12c), используя два входных канала (10a, 10b), в котором второй канал (12b) из трех выходных каналов подается на громкоговоритель в определенной схеме обеспечения аудиосигнала, который располагается между двумя громкоговорителями, на которые подаются первый выходной канал и третий выходной канал, содержащий этапы, на которых:
анализируют (15) два входных канала для обнаружения компонент сигнала, встречающихся в обоих входных каналах; и
создают (16) три выходных канала, используя два входных канала, причем этап создания содержит этапы, на которых:
определяют (42) часть входных каналов, в которой имеется вероятность амплитудного ограничения;
создают (16а) три промежуточных канала, среди которых второй промежуточный канал содержит, по меньшей мере, часть обнаруженных компонент сигнала; и
управляют (41) этапом создания (16а) таким образом, чтобы параметр создания для повышающего преобразования упомянутой части, определенной устройством обнаружения амплитудного ограничения управлялся таким образом, чтобы второй канал всегда имел амплитуду ниже или равную максимальному порогу.
14. Машиночитаемый носитель, содержащий компьютерную программу для выполнения, когда она запущена на компьютере, способа синтезирования по п.11 или 13.
US 2004037440 A1, 26.02.2004 | |||
WO 00/04744 A1, 27.01.2000 | |||
СПОСОБ ПЕРЕДАЧИ И/ИЛИ ЗАПОМИНАНИЯ ЦИФРОВЫХ СИГНАЛОВ НЕСКОЛЬКИХ КАНАЛОВ | 1993 |
|
RU2129336C1 |
EP 1881486 B1, 22.04.2003 | |||
JP 2000059896 A, 25.02.2000. |
Авторы
Даты
2010-03-20—Публикация
2005-12-20—Подача