Скорость воспроизведения звуковых сигналов может быть изменена при сохранении высоты тона, например, с помощью фазового вокодера (см., например, J.L.Flanagan, R.М.Golden, "The Bell System Technical Journal", November 1966, pp.1394-1509; United States Patent No. 6,549,884 Laroche, J. & Dolson, M.: "Phase-vocoder pitch-shifting"; Jean Laroche, Mark Dolson, "New Phase-Vocoder Techniques for Pitch- Shifting, Harmonizing And Other Exotic Effects", Proc. 1999 IEEE Workshop on Applications of Signal Processing to Audio and Acoustics,<">New Paltz, New York, Oct. 17-20, 1999). Таким же образом, при использовании способов переноса, может быть сохранена исходная продолжительность сигнала. Исходная продолжительность сигнала получается путем воспроизведения растянутого во времени сигнала, ускоренного с помощью коэффициента растяжения во времени. Дискретное представление сигнала во времени соответствует уменьшению выборок сигнала на коэффициент растяжения при сохранении частоты дискретизации. Традиционно, это растяжение происходит во временной области. Кроме того, то же самое может происходить и в банке фильтров, таких как псевдоквадратурных зеркальных фильтрах (pQMF). Псевдоквадратурные зеркальные фильтры (pQMF) иногда также называют QMF банком фильтров.
Серьезными проблемами при растяжении являются переходные процессы, которые "размываются" во времени при обработке на этапе растяжения во времени. Это происходит потому, что способы, такие как, например, с помощью фазового вокодера, влияют на так называемые свойства вертикальной когерентности сигнала (при получении спектрограммы по частоте и времени).
Некоторые современные способы растяжения во времени отказываются от использования переходных процессов, для того, чтобы не выполнять любое или даже небольшое растяжение во времени в течение переходного процесса. Это было описано, например, в:
- Laroche L., Dolson М.: Improved phase vocoder timescale modification of audio", IEEE Trans. Speech and Audio Processing, vol.7, no.3, pp.323-332
- Emmanuel Ravelli, Mark Sandler and Juan P. Bello: Fast implementation for nonlinear time-scaling of stereo audio; Proc. of the 8th Int. Conference on Digital Audio Effects (DAFx'05), Madrid, Spain, September 20-22, 2005 - Duxbury, С. M. Davies, and M. Sandler (2001, December). Separation of transient information in musical audio using multi resolution analysis techniques.In Proceedings of the COST G-6 Conference on Digital Audio Effects (DAFX-01), Limerick, Ireland.
Другая статья по этой теме написана Robel, A.: A NEW APPROACH ТО TRANSIENT PROCESSING IN THE PHASE VOCODER; Proc. of the 6th Int. Conference on Digital Audio Effects (DAFx-03), London, UK, September 8-1 1, 2003.
При растяжении во времени аудио сигналов с помощью фазового вокодера переходные участки сигнала "размываются" в связи с дисперсией, поскольку так называемая вертикальная когерентность в спектрограмме влияет на сигнал. Способы работы с помощью так называемого перекрытия и суммирования могут генерировать ложные сигналы эха перед и после переходных звуковых процессов. Эти проблемы могут быть урегулированы путем изменения растяжения во времени в условиях переходных процессов с отсутствием растяжения во время фактических переходных процессов и более сильного растяжения при отсутствии переходных процессов (в окружении переходных процессов). Если, однако, происходит перенос, коэффициент переноса уже не будет постоянным в условиях переходных процессов, т.е. высота тона, наложенная на участки (возможно, тональные) сигнала, искажает звук. Подобные проблемы возникают, если растяжение во времени происходит в банке фильтров, таких как pQMF.
Область этой заявки относится к способу восприятия, связанному с обработкой звуковых переходных процессов. В частности, звуковые переходные процессы могут быть удалены во время обработки сигнала с растяжением во времени. Далее при рассмотрении растяжения во времени именно применение сложения будет использовано при изменении (растяжении) сигнала для обрабатываемого участка переходного сигнала.
В соответствии с вариантами изобретения, описанными в этом документе, аппаратная часть для обработки аудио сигнала включает в себя манипулятор времени для индивидуальной обработки во времени множества поддиапазонов звукового сигнала. Манипулятор времени состоит из этапа перекрытия и суммирования для перекрытия и суммирования блоков, по крайней мере, одного из множества сигналов поддиапазонов с использованием значения перекрытия и суммирования, которое отличается от улучшенного значения в модуле извлечения, детектора переходных процессов для обнаружения переходного процесса в звуковом сигнале или поддиапазонах сигнала, и множества сумматоров переходных процессов для сложения обнаруженных переходных процессов с множеством сигналов, генерируемых на этапе перекрытия и суммирования. Этап перекрытия и суммирования настроен на снижение влияния обнаруженных переходных процессов или для исключения обнаруженных переходных процессов при сложении.
Согласно другому варианту изобретения аппаратная часть для обработки аудио сигнала включает в себя банк фильтров анализа для генерации сигналов поддиапазонов; манипулятор времени для индивидуальной обработки во времени множества сигналов поддиапазонов, манипулятор времени включает: этап перекрытия и суммирования для перекрытия и суммирования блоков поддиапазонов сигнала с использованием значения улучшенного перекрытия и суммирования, которое отличается от улучшенного значения в блоке извлечения; детектора переходных процессов для обнаружения переходного процесса в звуковом сигнале или поддиапазонах сигнала, в которых этап перекрытия и суммирования настроен на снижение влияния обнаруженных переходных процессов или для отказа от использования обнаруженных переходных процессов при сложении; и сумматор переходных процессов для добавления обнаруженных переходных процессов к сигналу, генерируемому на этапе перекрытия/сложения.
Согласно другому варианту способ обработки аудио сигнала включает в себя:
индивидуальную обработку во времени множества сигналов поддиапазонов звукового сигнала, обработку во времени, включающую:
перекрытие и суммирование блоков, соответствующих одному из множества сигналов поддиапазонов, с использованием перекрытия и суммирования улучшенного значения, отличающегося от улучшенного значения в модуле извлечения;
определение переходного процесса в звуковом сигнале или сигнале поддиапазоне;
снижение влияния либо исключение обнаруженных переходных процессов при перекрытии и сложении;
суммирование обнаруженных переходных процессов с множеством сигналов, генерируемых при выполнении перекрытия и сложения.
Другой вариант связан с компьютерной программой для осуществления способа, когда компьютерная программа выполняется на компьютере, вариант включает в себя:
Индивидуальную обработку во времени множества поддиапазонов звукового сигнала, обработку во времени, включающую:
Перекрытие и суммирование блоков, соответствующих одному из множества сигналов поддиапазонов, с использованием перекрытия и суммирования улучшенного значения, отличается от улучшенного значения в модуле извлечения;
определение переходного процесса в звуковом сигнале или поддиапазоне сигнала; либо снижение влияния обнаруженных переходных процессов или для отказа от использования обнаруженных переходных процессов при перекрытии и сложении;
суммирование обнаруженных переходных процессов с множеством сигналов, генерируемых при выполнении перекрытия и сложения.
В соответствии с другими вариантами аппаратная часть может дополнительно содержать модуль прореживания для прореживания звукового сигнала или нескольких звуковых сигналов. Манипулятор времени может быть сконфигурирован для выполнения растяжения во времени множества сигналов поддиапазонов.
Согласно еще одному варианту детектор переходных процессов может быть настроен на выделение блоков, в которых обнаружены переходные процессы и в которых множество этапов перекрытия и суммирования настроено на игнорирование отмеченных блоков.
Согласно еще одному варианту множество этапов перекрытия и суммирования может быть сконфигурировано для применения значений перекрытия и суммирования, превышающих соответствующее значение в модуле извлечения для выполнения растяжения во времени множества сигналов поддиапазонов.
Согласно еще одному варианту манипулятор времени может дополнительно содержать модуль извлечения, модуль обработки окна/регулятор фазы, и модуль вычисления фазы для расчета фазы, на основе которой модуль обработки окна/регулировщик фазы выполняет настройку извлеченного блока.
Согласно еще одному варианту сумматор переходных процессов может быть дополнительно настроен на включение участка в поддиапазон сигнала, имеющий переходной процесс, причем длина участка выбрана достаточно большой, чтобы на выходе процедуры перекрытия и суммирования был возможен кроссфейд выходного сигнала для участка, имеющего переходной процесс.
В соответствии с аналогичным вариантом изобретения сумматор переходных процессов может быть сконфигурирован для выполнения операции кроссфейда.
Согласно еще одному варианту детектор переходных процессов может быть сконфигурирован для детектирования блоков, извлеченных модулем извлечения из поддиапазонов сигнала, имеющего переходные процессы. Этап перекрытия и суммирования может быть дополнительно сконфигурирован для снижения влияния извлеченных блоков или отказа от использования извлеченных блоков при суммировании. Согласно еще одному варианту детектор переходных процессов может быть настроен на определение «центра тяжести» при выполнении расчета энергии с помощью предварительно заданного периода времени входного сигнала, поступающего для анализа в банк фильтров, или заданного периода времени для сигналов поддиапазонов.
Точное определение положения переходного процесса с целью выбора соответствующего участка может, например, быть выполнено с помощью определения движущегося «центра тяжести» энергии за соответствующий период времени. В частности, определение переходного процесса может быть выполнено частотно-избирательным образом в банке фильтров. Кроме того, период времени для участка может быть выбран в виде постоянной или переменной величины на основе информации при определении переходного процесса.
Согласно еще одному варианту аппаратная часть может дополнительно содержать банк фильтров анализа для генерации сигналов поддиапазонов.
Согласно еще одному варианту аппаратная часть может дополнительно содержать модуль прореживания, расположенный на входе или выходе банка фильтров анализа. Манипулятор времени может быть сконфигурирован для выполнения растяжения во времени множества сигналов поддиапазонов.
Согласно еще одному варианту аппаратная часть может дополнительно содержать первый банк фильтров анализа, второй банк фильтров анализа, этап повторной дискретизации перед вторым банком фильтров анализа и множество фазовых вокодеров для второго множества выходных сигналов поддиапазонов второго банка фильтров анализа, множество фазовых вокодеров, имеющих коэффициент расширения основного диапазона больше чем единица, причем на выходе фазового вокодера выполняется множество этапов перекрытия и суммирования.
Согласно еще одному варианту аппаратная часть может содержать дополнительный этап подключения между первым банком анализа и множеством фазовых вокодеров на входе этапа подключения и множество этапов перекрытия и суммирования в выходе этапа подключения, причем этап подключения выполнен с возможностью контроля положения блоков, соответствующих одному из множества сигналов поддиапазонов и обработанного в фазовом вокодере сигнала на этапе перекрытия и суммирования. Согласно еще одному варианту аппаратная часть может дополнительно содержать коррекцию амплитуды, настроенную на компенсацию амплитуды, оказывающей влияние на различные значения перекрытия.
Предложенный вариант изобретения, таким образом, выполняет различные функции с помощью аппаратной части, способов и компьютерных программ для обработки аудио сигналов в контексте расширения диапазона и в контексте других аудио приложений, которые не связаны с расширением пропускной способности. Особенности, описанные и заявленные в отдельных положениях формулы изобретения, могут быть полностью или частично объединены, но также могут использоваться отдельно друг от друга, так как отдельные аспекты уже обеспечивают преимущества в отношении восприятия качества, сложности вычислений и ресурсов процессора/памяти при реализации в компьютере или микропроцессоре.
Согласно представленному здесь описанию, и в отличие от существующих способов, обрабатываемые в окне участки, содержащие переходные процессы, могут быть отделены от обрабатываемого сигнала. Это может быть достигнуто путем суммирования только тех участков во времени, которые не включают переходные процессы, блок за блоком, во время процесса перекрытия и суммирования (OLA). В результате сигнал растягивается во времени и не содержит переходные процессы. После завершения растяжения во времени снова добавляются нерастянутые переходные процессы, которые были удалены из исходного сигнала.
Дисперсии и эффекты эха, следовательно, не влияют на субъективное качество звука при переходном процессе.
Путем вставки участка исходного сигнала, изменение тембра или высоты тона приведет к изменению частоты дискретизации. В целом, это является психоакустической маской переходного процесса. Если, в частности, происходит растяжение в целое число раз, тембр будет меняться незначительно, поскольку вне окружения переходного процесса отображается только каждая n-я гармоника (n=коэффициент растяжения).
Прилагаемые чертежи включены для облегчения дальнейшего понимания вариантов, включены в состав и составляют часть этого изобретения. Чертежи иллюстрируют варианты и вместе с описанием служат для объяснения принципов работы вариантов изобретения. Другие варианты и многие предполагаемые преимущества вариантов изобретения будет легко понять, так как они ссылаются на последующее подробное описание. Номера ссылок обозначают соответствующие или аналогичные части.
На фиг.1 показаны формы сигнала исходного сигнала, состоящего из типичной смеси звуков трубы и кастаньет.
На фиг.2 показаны дискретные преобразования Фурье (DFT) для спектрограммы с формой сигнала, показанной на фиг.1.
На фиг.3 показана QMF на основе спектрограммы на базе 64 диапазонного pQMF банка фильтров анализа, похожего на DFT спектрограмму на фиг.2.
На фиг.4 показаны матрицы обнаружения переходных процессов.
На фиг.5 показаны формы сигнала из сигнала в результате растяжения времени без использования представленного здесь описания.
На фиг.6 показаны формы сигнала для сигнала, полученного в результате растяжения во времени с использованием представленного здесь описания.
На фиг.7 показано DFT на основе спектрограммы растянутого во времени сигнала без обработки переходных процессов в соответствии с представленным здесь описанием.
На фиг.8 показано DFT на основе спектрограммы растянутого во времени сигнала с обработкой переходных процессов в соответствии с представленным здесь описанием.
На фиг.9 показана блок-схема системы аудио обработки, содержащая аппаратную часть в соответствии с представленным здесь описанием.
На фиг.10 показана блок-схема другой системы аудио обработки, содержащей аппаратную часть в соответствии с представленным здесь описанием.
Фиг.11А иллюстрирует реализацию блок-схемы обработки для обработки одного сигнала поддиапазона.
На фиг.11В иллюстрирует другую реализацию блок-схемы обработки для обработки одного сигнала поддиапазона.
На фиг. с 12A до 12E показан модуль обработки сигнала в соответствии с представленным здесь описанием.
На фиг.13 показана блок-схема устройства в соответствии с одним из вариантов представленного здесь описания.
На фиг.14 показана блок-схема устройства в соответствии с другим вариантом представленного здесь описания.
На фиг.15 показана блок-схема способа обработки аудио сигнала в соответствии с представленным здесь описанием.
Фиг.1 показывает временные участки формы аудио сигнала, состоящего из типичной смеси звуков трубы и кастаньет. Изображенные звуковые сигналы будут использованы в качестве исходного сигнала, для которого различные действия растяжения во времени выполняются без или с применением представленного здесь описания. Звук трубы соответствует периодическому сигналу с амплитудой примерно 0,08 единиц на фиг.1. Четыре удара кастаньет видны на фиг.1, четыре коротких импульса с амплитудой около 0,45 единиц. Звук трубы производит практически гармонический сигнал. Кастаньеты, однако, производят сигнал со значительным переходным процессом. В акустике и аудио, переходные процессы обычно определяются как кратковременный сигнал, который представляет собой негармоническую фазовую атаку на музыкальный звук или произнесенное слово.
Сигнал может содержать высокую степень непериодических компонентов и высокую магнитуду на более высоких частотах, чем гармоническое содержимое этого сигнала. Переходные процессы, как правило, напрямую не зависят от частоты тона, вызванного ими. На фиг.2 показано дискретное преобразование Фурье (DFT) для спектрограммы с формой сигнала по фиг.1. Фиг.3 аналогична фиг.2 и показывает 64 диапазона псевдоквадратичного зеркального банка фильтров (pQMF) для спектрограммы с формой сигнала по фиг.1. Как можно видеть из двух спектрограмм, показанных на фиг.2 и 3, исходный аудио сигнал включает в себя плотную гармоническую структуру составляющих звука (горизонтальная структура) и удары кастаньет (вертикальная структура).
На фиг.4 показана полученная из сигнала двоичная матрица обнаружения переходных процессов, частотно-избирательным образом отмечающая переходные участки сигнала. Обнаруженные переходные участки сигнала показаны белым цветом. Их можно удалить с помощью вокодера на этапе переноса, с последующим суммированием с использованием исходного сигнала. Кроме того, обнаруженные переходные процессы участков сигнала могут быть исключены из растяжения во времени и позже заменены на соответствующие участки из исходного сигнала.
Цифры от 5 до 8 показывают результат растяжения во времени без обработки новых переходных процессов в виде двух сигналов во времени и связанных с ними спектрограмм. Сравнивая сигналы во времени и спектрограммы для случаев с обработкой и без обработки переходных процессов, видно, что нежелательного размытия во времени переходного участка сигнала можно эффективно избежать с использованием представленного здесь описания. Например, вид сигнала во времени показан на фиг.5, а соответствующая спектрограмма показана на фиг.7. Из фиг.5 и 7 видно, что удары кастаньет были расширены, то есть их продолжительность стала больше, чем в исходном сигнале. Время, показанное на фиг.1, отличается от времени сигнала, показанного на фиг.6, и соответствующей спектрограммы на фиг.8, которые были получены путем использования обработки переходных процессов в соответствии с представленным здесь описанием, показывают, что удары кастаньет не претерпели существенного расширения по продолжительности, и, по существу, вид сигнала сохранился в результате обработки.
С помощью аппаратной части, способов и компьютерных программ, в соответствии с представленным здесь описанием, в результате обработки переходных процессов путем растяжения во времени и переноса удается эффективно избегать артефактов (дисперсии, эха до и после сигнала). Кроме того, независимым частотно-избирательным образом в поддиапазонах определяется, какие участки преобладают: стационарные или переходные, и соответственно правильно выбирается способ обработки переходных процессов. Также различным образом могут рассматриваться параметры определения переходных процессов при формировании периода времени вставляемого участка сигнала для оптимальной адаптации периода времени участка сигнала с переходным процессом. Способ пригоден для всех аудио приложений, в которых скорость воспроизведения звуковых сигналов или их высота тона должны быть изменены. Особенно подходящими являются приложения для расширения диапазона или относящиеся к области звуковых эффектов.
На фиг.9 показана система обработки звука, которая относится к области расширения основного диапазона пропускания звука. Тем не менее, изобретение может применяться в других областях, которые не выполняют расширение пропускной способности. Битовый поток поступает на вход в основной декодер 100. Выходной сигнал от основного декодера, т.е. звуковой сигнал с узкой полосой пропускания, поступает на вход в соответствующий модуль прореживания 102a, 102b, 102c. Уничтожаются сигналы, которые имеют уменьшенную продолжительность во времени по сравнению с выходным сигналом от основного декодера 100, являющимся входным сигналом для соответствующих этапов анализа pQMF 104a, 104b, 104c. Этапы 104a, 104b, 104c могут быть реализованы с помощью любых других банков фильтров анализа, которые не являются pQMF банками фильтров анализа. Существует много различных реализаций банка фильтров анализа, которые могут быть использованы для этой цели.
Каждый этап pQMF анализа 104a, 104b, 104c формирует на выходах множество различных сигналов поддиапазонов в различных каналах поддиапазонов, где каждый сигнал поддиапазона имеет пониженный частотный диапазон и, как правило, пониженную частоту дискретизации. В этом случае банк фильтров имеет увеличенное в 2 раза число выборок, что предпочтительно для настоящего изобретения. Тем не менее, и другой критически выбранный банк фильтров может быть использован.
Соответствующий узкополосный сигнал или выходной сигнал поддиапазона в pQMF канале анализа поступает на вход в фазовый вокодер. Хотя фиг.9 только иллюстрирует три фазовых вокодера 106a, 106b, 106c, важно видеть, что каждый индивидуальный pQMF канал анализа может иметь собственный фазовый вокодер. Алгоритм фазового вокодера также может быть реализован путем интерполяции основного диапазона или первого тонового сигнала. Фазовый вокодер для различных сигналов поддиапазонов от того же банка фильтров анализа имеет аналогичную конструкцию и отличается от фазового вокодера для сигналов поддиапазонов от других банков фильтров на коэффициент расширения диапазона, показанный на фиг.9. Коэффициент расширения диапазона равен двум в фазовом вокодере 106a. В фазовом вокодере 106b коэффициент расширения диапазона равен трем, а в фазовом вокодере 106c коэффициент расширения диапазона равен четырем.
Обратим внимание, что обычно нет необходимости в обучающей информации, представленной здесь, при выполнении любого расширения диапазона или даже нескольких различных расширений диапазона. Так, может быть исключен модуль прореживания 102a, 102b, 102c. Выходы различных фазовых вокодеров поступают на вход pQMF банка фильтров синтеза 108. При анализе с помощью банка фильтров в блоках 104a-104c реализованы различные технологии, а так как технология анализа в банке фильтров и технологии синтеза в банке фильтров согласованы друг с другом, то и синтез в банке фильтров 108 будет также осуществляться по различным технологиям.
Устройство, соответствующее представленному здесь описанию, может быть реализовано распределенным образом на одном или более этапов QMF анализа 104a, 104b, 104c и в банке QMF фильтров синтеза 108. Таким же или подобным образом, манипулятор времени, который, в соответствии с изложенным, является частью устройства, может быть распределен в нескольких QMF этапах анализа 104a, 104b, 104c и QMF банке фильтров синтеза 108. Соответственно, в одном или нескольких QMF этапах анализа 104a, 104b, 104c можно исключить блоки, содержащие обработку во времени переходных процессов, и направить исходные блоки в банк фильтров синтеза 108. Банк фильтров синтеза 108 может выполнять функции сумматора переходных процессов, путем добавления извлеченных и, как правило, неизмененных переходных процессов к сигналу, генерируемому на этапе перекрытия и суммирования в банке фильтров синтеза 108. Блок-схема на фиг.9 не показывает в явном виде детектор переходных процессов. Детектор переходных процессов может быть частью этапа QMF анализа 104a, 104b, 104c. В качестве альтернативы, детектор переходных процессов может быть выполнен в виде отдельного модуля.
Фиг.10 иллюстрирует другую реализацию, где сигнал основного диапазона по линии 110 вводится в банк фильтров анализа 112. Таким образом, низкочастотный сигнал преобразуется в множество сигналов поддиапазонов. Кроме того, предусмотрен этап переключения или подключения 114, в котором различные сигналы поддиапазонов с выхода фазового вокодера 106a, 106b или c выхода pQMF анализа основного диапазона 112 могут быть введены в любой произвольно выбранный диапазон синтеза.
Отдельные фазовые вокодеры связаны с отдельным диапазоном pQMF. На фиг.10, первый и последний pQMF диапазоны высоты тона первой гармоники, использующие коэффициент расширения диапазона, равный двум, показаны цифрой 106a. Для других гармоник высоты тона используется коэффициент расширения диапазона, равный трем, первый и последний pQMF диапазоны этой высоты тона показаны цифрой 106b.
Синтезированный сигнал может быть создан с помощью произвольно выбранного суммирования выходов фазового вокодера и выходов 112 основного диапазона pQMF анализа. Следует отметить, что этап переключения 114 может быть контролируемым этапом переключения, который управляется аудио сигналом, имеющим определенную дополнительную информацию, или который управляется определенными характеристиками сигнала. Кроме того, стадия 114 может быть простым этапом подключения без какого-либо переключения. Например, в случае, когда определенное распределение выходных сигналов от элементов 112 и 106а-106b однозначно установлено и запрограммировано. В этом случае этап 114 не будет содержать какие-либо переключатели, но будет задавать определенные сквозные соединения.
Фиг.11A иллюстрирует вариант осуществления обработки для обработки одного сигнала поддиапазона. Единый сигнал поддиапазона, возможно, подвергается какому-либо прореживанию либо до, либо после фильтрации в банке фильтров анализа, не показанному на фиг.11A. В случае если выполнено прореживание, продолжительность по времени одного сигнала поддиапазона, как правило, короче, чем продолжительность по времени до прореживания. Единственный сигнал поддиапазона является входным для модуля извлечения 1800. Модуль извлечения 1800 на фиг.11A работает с использованием улучшенного значения выборки/блока, обозначенного знаком е. Улучшенное значение выборки/блока может быть переменным или может быть иметь фиксированное значение, как показано на фиг.11A стрелкой в модуле извлечения 1800. На выходе модуля извлечения 1800 имеется множество выбранных блоков.
Эти блоки имеют большие перекрытия, так как улучшенное значение е выборки блока значительно меньше, чем длина блока в модуле извлечения. В приведенном примере модуль извлечения извлекает блок из 12 выборок. Первый блок включает в себя выборки от 0 до 11, второй блок включает в себя выборки с 1 по 12, третий блок включает в себя выборки 2 до 13 и так далее. В этом варианте улучшенное значение е выборки/блока равно 1 и представляет собой 11-кратное перекрытие. В приведенном выше примере конкретные значения представлены в качестве примера и могут меняться от приложения к приложению.
Отдельные блоки вводятся в модуль обработки окна 1802 для проведения оконных операций с блоками при использовании функции окна для каждого блока. Кроме того, вычислитель фазы 1804 определяет фазу для каждого блока. Вычислитель фазы 1804 перед оконной операцией может использовать либо отдельный блок, либо последовательность окон. Тогда, значения для регулировки фазы p x k рассчитываются и вводятся в регулировщик фазы 1806. Регулировщик фазы использует значение настройки для каждой выборки в блоке. Кроме того, коэффициент к равен коэффициенту расширения основного диапазона. Когда, например, должно быть получено расширение основного диапазона в 2 раза, то фаза p, рассчитанная для блока, извлеченного модулем извлечения 1800, умножается на коэффициент 2, и скорректированное значение p, применяемое к каждой выборке блока в регулировщике фазы 1806, умножается на 2.
Это значение/правило показано в качестве примера. Кроме того, скорректированное значение фазы для синтеза равно k*p, p+(k-l)*p. Таким образом, в этом примере поправочный коэффициент равен либо 2 при умножении, либо 1*p при сложении. Другие значения/правила могут быть применены для расчета значения корректировки фазы. В варианте воплощения единственный сигнал поддиапазона является комплексным сигналом поддиапазона, и фаза блока может быть рассчитана с помощью множества различных способов. Одним из способов является взятие выборки в середине или близко к середине блока при расчете фазы этой сложной выборки.
Хотя на фиг.11A показано, что регулировщик фазы работает последовательно с модулем обработки окна, эти два блока также могут быть взаимозаменяемыми, так что регулировка фазы выполняется для блоков, извлеченных модулем извлечения, с последующим выполнением обработки окна. Так как обе операции, т.е. оконная и регулировка фазы, выполняют вещественные или комплексные умножения, эти две операции могут быть сведены в одну операцию с использованием комплексного коэффициента умножения, который сам по себе является результатом фазовой подстройки коэффициента умножения и оконного коэффициента.
Блоки с фазовой подстройкой поступают на вход перекрытия/суммирования и блок коррекции амплитуды 1808, где оконные блоки и блоки с корректировкой фазы перекрываются и суммируются. Важно, однако, что улучшенное значение выборка/блок в блоке 1808 отличается от значения, используемого в блоке извлечения 1800. В частности, улучшенное значение выборка/блок в блоке 1808 больше, чем значение е, используемое в блоке 1800, так что получается растяжение во времени выходного сигнала в блоке 1808. Таким образом, обработанный выходной сигнал поддиапазона в блоке 1808 имеет длину, которая больше, чем у входного сигнала поддиапазона в блоке 1800. Когда должно быть получено расширение диапазона в два раза, то используется улучшенное значение выборки блока, которое в два раза превышает соответствующее значение в блоках 1800. В результате происходит растяжение во времени в два раза. Когда, однако, необходимо использовать другие коэффициенты растяжения во времени, то могут быть использованы другие улучшенные значения выборка/блок так, что выходной блок 1808 имеет необходимую продолжительность во времени.
Для решения проблем при перекрытии, предпочтительно провести коррекцию амплитуды для решения вопроса о различных перекрытиях в блоках 1800 и 1808. Эта коррекция амплитуды, однако, может быть также проведена в коэффициенте умножения в модуле обработки окна/регулировщике фазы, но коррекция амплитуды также может быть выполнена после этапа перекрытия/обработки.
В приведенном выше примере с блоком длиной 12 и улучшенным значением выборка/блок в модуль извлечения улучшенное значение выборка/блок для перекрытия/сложения в блоке 808 будет равна двум, когда выполняется расширение диапазона в два раза. В результате это приведет к перекрытию шести блоков. Если должно быть выполнено расширение диапазона в три раза, то улучшенное значение выборка/блок, используемое в блоке 1808, будет равно трем, а перекрытие уменьшится до перекрытия четырех блоков. Когда должно быть выполнено расширение диапазона в четыре раза, то блоку 1808 перекрытия/суммирования придется использовать улучшенное значение выборка/блок, равное четырем, для чего по-прежнему будет необходимо использовать перекрытие более двух блоков.
Предпочтительно, чтобы показанный на фиг.11A фазовый вокодер для отдельного сигнала поддиапазона содержал детектор переходных процессов 200 для обнаружения переходного процесса в сигнале поддиапазона, что показано соединением 201a, или для обнаружения переходного процесса в сигнале перед обработкой в банке фильтров анализа, что показано соединением 20lb. Как только детектор переходных процессов 200 обнаруживает переходные процессы, на этапе перекрытия/суммирования выполняется контроль, чтобы в процедуре перекрытия/сложения не использовать блоки, имеющие переходные процессы, как показано управляющим соединением 203. В варианте изобретения, сигнал на линии 203 управляет этапом перекрытия/суммирования, чтобы удалить все блоки, имеющие переходные процессы. Это приведет на выходе этапа к появлению сигнала, который растягивается по отношению к сигналу до этого этапа, но который не содержит никаких переходных процессов.
Растянутый сигнал без переходных процессов вводится в сумматор переходных процессов, который сконфигурирован для суммирования переходных процессов в растянутом сигнале таким образом, что на выходе формируется растянутый сигнал, имеющий вставленные переходные процессы, но эти вставленные переходные процессы не были использованы при обработке перекрытия/сложения.
В одном из вариантов участок переходных процессов вставляется в сам сигнал поддиапазона, как показано соединениями 206 и 201a. Кроме того, сигнал может быть выделен из любого другого сигнала поддиапазона или из сигнала до проведения анализа поддиапазонов, так как характеристики переходных процессов совершенно аналогичны в отдельных поддиапазонах. С другой стороны, однако, в некоторых случаях предпочтительнее использовать переходные явления, происходящие в поддиапазонах, так как частота дискретизации и другие характеристики недоступны в растянутом сигнале.
Фиг.11B показывает другой возможный вариант осуществления обработки единого сигнала поддиапазона. Поток битов из модуля извлечения 1800, с подавлением переходных процессов, вставляется в модуль обработки окна 1798, который действует на единый сигнал поддиапазона. Подавление переходных процессов в модуле обработки окна 1798 удаляет выборки или блоки, содержащие переходные процессы. Оценка, содержит ли выборка переходные процессы, осуществляется детектором переходных процессов 200. Единый сигнал поддиапазона поступает на вход для подавления переходных процессов в модуле обработки окна 1798, так что детектор переходных процессов 200 принимает единый сигнал поддиапазона в качестве входного. При обнаружении переходного процесса детектор переходных процессов 200 выдает соответствующий сигнал для подавления переходных процессов в модуле обработки окна 1798 и подавление переходных процессов заключается в подавлении выборки (выборок), которые имели/имеют переходные процессы, указанные детектором переходных процессов 200.
Поэтому выборки, отмеченные детектором переходных процессов 200, не входят в модуль извлечения 1800. Другие выборки, не содержащие переходные процессы, хранятся в блоках, которые обрабатываются модулем извлечения 1800, модулем обработки окна 1802, модулем вычисления фазы 1804, регулировщиком фазы 1806 и блоком перекрытия и суммирования 1808. Блок перекрытия и суммирования 1808 выдает растянутый сигнал без переходных процессов.
Содержащие переходные процессы выборки затем повторно суммируются с растянутым сигналом без переходных процессов в сумматоре переходных процессов 204. Сумматор переходных процессов 204 принимает управляющий сигнал от детектора переходных процессов 200 и исходный единый сигнал поддиапазона в качестве входных. Обладая этой информацией, сумматор переходных процессов может определить выборки, в которых были подавлены переходные процессы в модуле обработки окна 1798, и повторно вставляет эти выборки в растянутый сигнал без переходных процессов. На выходе из сумматора переходных процессов 204 получается обработанный сигнал поддиапазона (с большим интервалом по времени), имеющий вставленные переходные процессы.
Фиг. с 12A по 12Е иллюстрируют, как звуковой сигнал или один из множества сигналов поддиапазонов могут быть обработаны в соответствии с ранее реализованными способами и в соответствии с представленным здесь описанием. На фиг.12A показана последовательность выборок 1202. Последовательность 1202 может принадлежать к одному из множества сигналов поддиапазонов. Буква «T» обозначает выборку, в которой детектором переходных процессов были обнаружены переходные процессы.
В виде последовательности 1202 на фиг.12A показано множество извлеченных блоков 1206. Множество извлеченных блоков 1206, имеющих длину 12 выборок, включает выборки с переходными процессами T. Над и под множеством извлеченных блоков 1206 показан один предшествующий блок 1204 и один последующий блок 1208, не содержащие переходные процессы T. Как можно видеть на фиг.12A, всего несколько извлеченных блоков 1204 распространяются более чем на 23 блока.
Фиг.12B иллюстрирует, как с помощью стандартных способов обработки во времени предыдущего блока 1204 блоки из множества извлеченных блоков 1206 и последующих блоков 1208 смещаются каждый на один блок перед этапом перекрытия и суммирования отдельных блоков при выполнении растяжения во времени звукового сигнала. Сдвинутые версии блоков или множество блоков помечены символами 1204', 1206' и 1208'. Улучшенное значение перекрытия и суммирования на фиг.12B равно двум, в то время как улучшенное значение в модуле извлечения, показанное на фиг.12A, равно единице. В результате смещения блоков выборки, содержащие переходные процессы T в блоках из множества извлеченных блоков 1206, на этом этапе не выровнены, но расположены в промежутке времени из двенадцати выборок.
Фиг.12C иллюстрирует удаление блоков, которые содержат переходные процессы T в одной или более своих выборок, в соответствии с представленным здесь описанием. Удаленные блоки принадлежат к множеству извлеченных блоков 1206' и показаны пунктиром. Удаление блоков 1206' оставляет пробел, который имеет длительность в 14 выборок. Кроме того, в промежуток времени из 10 выборок до пробела и из 10 выборок после пробела, рассматривается уменьшенное количество блоков вместо обычных шести блоков в процессе перекрытия и суммирования или на этапе перекрытия и суммирования в аппаратной части при обработке аудио сигнала.
Обратим внимание, что фиг.12B и 12C являются только иллюстративными и что блоки из множества извлеченных блоков 1206 на фиг.12A могут быть удалены сразу же после обнаружения переходного процесса, т.е. без выполнения сдвига во времени для этих блоков из множества извлеченных блоков 1206. В одной возможной реализации представленного здесь описания, блоки из множества извлеченных блоков 1206 перенаправляются с исключением этапа перекрытия и суммирования и должны быть вставлены в выходной поток битов на этапе перекрытия и суммирования.
На фиг.12D показана вставка участка исходного переходного процесса, т.е. множество извлеченных блоков 1206, при обработке во времени звукового сигнала. Участок исходного переходного процесса вставляется в пробел, который был оставлен после удаления блоков, содержащих переходные процессы T. Участок исходного переходного процесса может быть добавлен во время обработки оставшегося звукового сигнала. Вначале или в области левого края пробела множество извлеченных блоков 1206 накладывается на шесть регулярных блоков (три из которых показаны на фиг.12D линией из точек). В примере, изображенном на фиг.12D, регулярные блоки обрабатываются с улучшенным значением перекрытия и суммирования, равным двум. Как можно видеть на фиг.12D, сохраняется остаточный пробел между концом участка исходного переходного процесса и последующим блоком 1208'. Возможен вариант с переносом множества извлеченных блоков 1206 на несколько выборок вправо, то есть к более позднему моменту времени, так что участок исходного переходного процесса более равномерно распределен и/или расположен в пробеле между сдвинутым предшествующим блоком 1204' и сдвинутым последующим блоком 1208'.
В нижней части фиг.12D показано, сколько блоков накладываются в каждой выборке. В результате равномерной обработки во времени с длиной блока из двенадцати выборок, значение блока извлечения равно единице и улучшенное значение перекрытия и суммирования равно двум, как правило, для конкретной выборки во времени обрабатываемого звукового сигнала в течение процесса перекрытия и суммирования рассматривается шесть блоков. Иными словами, в одной выборке во времени обрабатываемый сигнал получает данные из шести различных блоков, извлеченных из исходного звукового сигнала. Кривая на фиг.12D показывает, что при обработке участка исходного переходного процесса первоначально рассматриваются шесть блоков.
Так как блоки, извлеченные из множества блоков 1206, расположены в шахматном порядке с разницей в одну выборку, количество накладываемых блоков увеличивается до значения двенадцать для выборок, в которых были обнаружены переходные процессы Т. Впоследствии количество блоков уменьшается на единицу с каждой новой выборкой для достижения значения «единица» в конце участка исходного переходного процесса. Количество блоков, которое может быть использовано для коррекции амплитуды сигнала во времени участка обрабатываемого сигнала, отличается от регулярного значения числа наложенных блоков, равного шести. Необходимое количество блоков, которое может быть определено на основе обнаруженных переходных процессов, подается на корректор амплитуды. Корректор амплитуды может действовать либо на блоки перед перекрытием и суммированием и/или наложением или на результирующий обработанный во времени сигнал.
Как упоминалось выше, сохраняется остаточный пробел из двух выборок. Когда снова появляются регулярные блоки, обработка начинается с последующего блока 1208',
Фиг.12E показывает дополнительную реализацию, в которой пробел был сокращен на две выборки, так что не сохраняется остаточного пробела между окончанием участка исходного переходного процесса и сдвинутым последующим блоком 1208'. Хотя эта мера может привести к небольшому искажению результирующего обработанного во времени сигнала (в частности, к сокращению), такой эффект незначителен. Как уже упоминалось выше, участок исходного переходного процесса может быть вставлен в середину пробела между предыдущим блоком 1204' и последующим блоком 1208'.
Альтернативный вариант удалению целых блоков, которые содержат один или несколько переходных процессов, содержащих выборки, показан на фиг. 12A-12E, отдельная содержащая переходной процесс выборка (выборки) может быть удалена в пределах блока, а остальные выборки в блоке сохраняются. Удаление содержащих переходной процесс выборок может быть реализовано с помощью установки близкого к нулю значения выборки. Таким образом, содержащая переходной процесс выборка не будет вносить свой вклад на выходе блока перекрытия и суммирования 1808. Коррекция амплитуды может быть использована в целях увеличения вклада других выборок, которые получены перекрытием и суммированием с обнулением выборки.
Действие обнуления содержащей переходной процесс выборки может сопровождаться постепенным ослаблением на выходе и постепенным усилением сигнала поддиапазона до и после выборки соответственно. Например, несколько выборок до содержащей переходной процесс выборки и несколько выборок после содержащей переходной процесс выборки сигнала поддиапазона могут быть умножены на коэффициент ослабления сигнала для реализации, например, окна треугольной формы с ослаблением вокруг содержащей переходной процесс выборки (выборок).
На фиг.13 показана блок-схема манипулятора времени, который может быть модулем в аппаратной части для обработки аудио сигнала в соответствии с представленным здесь описанием. Манипулятор времени принимает множество сигналов поддиапазонов, которые вместе образуют звуковой сигнал. В манипуляторе времени может временно храниться множество сигналов поддиапазонов в модуле извлечения и буфере 1810. Модуль извлечения и буфер 1810 извлекают блоки от каждого из множества сигналов поддиапазонов. Блоки имеют определенную длину L блока и извлекаются с конкретным улучшенным значением е модуля извлечения. Например, длина блока L может быть равна двенадцати, а улучшенное значение е модуля извлечения может быть равно единице. Модуль извлечения и буфер 1810 получают длину блока L и улучшенное значение е модуля извлечения в качестве входных параметров. В качестве альтернативы, длина блока L и улучшенное значение е модуля извлечения можно хранить в виде фиксированного значения в модуле извлечения и буфере 1810.
На выходах модуля извлечения и буфера 1810 извлекаются блоки и для них выполняется этап перекрытия и суммирования 1808, в котором извлеченные блоки при перекрытии и суммировании накладываются друг на друга с улучшенным значением k*e, отличающимся от улучшенного значения е модуля извлечения, и суммируются для получения обработанного во времени звукового сигнала. Этап перекрытия и суммирования 1808 может включать в себя множество блоков перекрытия и суммирования, например, один блок перекрытия и суммирования для соответствующего каждого из множества сигналов поддиапазонов. Другим вариантом было бы использование единого этапа перекрытия и суммирования или нескольких блоков перекрытия и суммирования в режиме с разделением во времени или мультиплексированных таким образом, что сигналы поддиапазонов перекрываются и суммируются по отдельности и последовательно.
Манипулятор времени дополнительно содержит детектор переходных процессов 200, который получает множество сигналов поддиапазонов. Детектор переходных процессов 200 может анализировать сигналы поддиапазонов или аудио сигналы по отношению, например, к негармоническим атакам фазы музыкального звука или произнесенному слову или высокой степени непериодических компонент и/или более высокую магнитуду высоких частот, чем гармоники этого звука. Выход детектора переходных процессов 200 указывает, является ли или нет переходным процессом найденный текущий участок звукового сигнала, и с выхода детектора участок звукового сигнала подается на этап перекрытия и суммирования 1808 и сумматор переходных процессов 1812.
В случае если на выходе из детектора переходных процессов 200 были обнаружены переходные процессы, то выполняется контроль и на этапе перекрытия и суммирования 1808 игнорируются блоки, которые содержат переходные процессы Т. Сумматор переходных процессов 1812, со своей стороны, вставляет участок исходного переходного процесса в обрабатываемый во времени звуковой сигнал в соответствии с указанием детектора 200 об обнаружении переходного процесса. Обрабатываемый во времени звуковой сигнал с включенным в него переходным процессом формирует выходной сигнал манипулятора времени.
На фиг.14 показана блок-схема манипулятора времени согласно другому исполнению изобретения в соответствии с представленным здесь описанием. В дополнение к элементам манипулятора времени, показанным на фиг.13, манипулятор времени на фиг.14 содержит корректор амплитуды 1814. Корректор амплитуды 1814 получает указание об обнаружении переходного процесса детектором переходных процессов 200. На основе этой информации корректор амплитуды 1814 может изменять амплитуду блоков сигнала с учетом различного количества блоков, которые используются в процессе перекрытия и суммирования. Изменение числа указанных блоков связано с удалением множества извлеченных блоков 1204 и может быть связано с включением исходных переходных процессов.
Как правило, известно, как с течением времени изменяется число блоков, это может быть определено по обнаруженному в данный момент времени переходному процессу. Следовательно, этого может быть достаточно для формирования пускового сигнала корректора амплитуды, который затем регулирует амплитуду последовательных во времени блоков. Отсчет времени может быть основан на сигнале, показывающем изменение числа блоков, которые рассматриваются в процессе перекрытия и суммирования, как показано на фиг.12D и 12E. Значение коррекции амплитуды может быть, например, обратно количеству блоков.
На фиг.15 показана блок-схема способа обработки аудио сигнала в соответствии с представленным здесь описанием. После начала работы выполняется действие 1502, при котором множество сигналов поддиапазонов звукового сигнала индивидуально обрабатываются во времени. Действие 1502 включает в себя подэтапы с 1504 по 1510.
В 1504 блоки, соответствующие множеству сигналов поддиапазонов, накладываются друг на друга и складываются. Используется перекрытие и суммирование улучшенных значений, отличающихся от улучшенных значений извлеченных блоков. Действие 1504 выполняется непрерывно и показывает нормальное течение процесса при отсутствии переходных процессов.
Действие 1506 по обнаружению переходного процесса выполняется в звуковом сигнале или в сигналах поддиапазонов. Действия 1506 может быть выполнено одновременно с действием 1504 и другими действиями, показанными на схеме фиг.15.
Влияние обнаруженного переходного процесса либо уменьшается, либо обнаруженный переходной процесс отбрасывается при выполнении действия 1504 с перекрытием и суммированием.
При выполнении действия 1510 обнаруженный переходной процесс затем добавляется к множеству сигналов, генерируемых действием 1504 с перекрытием и суммированием.
Хотя в соответствии с представленным здесь описанием участок переходного процесса аудио сигнала обычно подвергается обработке во времени как остальная часть звукового сигнала, обрабатываемый во времени результирующий сигнал обычно представляет участок переходного процесса реалистичным образом. Это может быть, по крайней мере частично, связано с тем, что переходные процессы очень чувствительны к многим способам обработки сигнала, таким как сдвиг частоты.
В соответствии с другим аспектом представленного здесь описания аппаратная часть для обработки аудио сигнала может включать в себя:
банк фильтров анализа для генерации сигналов поддиапазона;
манипулятор времени для индивидуальной обработки во времени множества сигналов поддиапазонов, манипулятор времени, включающий:
этап перекрытия и суммирования для перекрытия и суммирования блоков сигналов поддиапазонов с помощью улучшенного значения перекрытия, отличающегося от улучшенного значения извлеченного блока;
детектор переходных процессов для обнаружения переходного процесса в звуковом сигнале или сигнале поддиапазона, причем этап перекрытия и суммирования настроен на снижение влияния обнаруженных переходных процессов или исключения обнаруженных переходных процессов при суммировании и
сумматор переходных процессов для добавления обнаруженных переходных процессов в сигнал, генерируемый на этапе перекрытия/сложения. В соответствии с другим аспектом представленного здесь описания описанная выше аппаратная часть может дополнительно содержать модуль прореживания, расположенный на входе или выходе банка фильтров анализа, причем манипулятор времени может быть сконфигурирован для выполнения растяжения во времени сигналов поддиапазонов.
В соответствии с другим аспектом представленного ранее описания аппаратной части детектор переходных процессов может быть настроен на выделение блоков, содержащих переходные процессы, и этап перекрытия и суммирования может быть настроен на игнорирование отмеченных блоков.
В соответствии с другим аспектом представленного ранее описания аппаратной части этап перекрытия и сложения может быть настроен на применение значения улучшенного перекрытия и суммирования, большего, чем улучшенное значение извлеченного блока для выполнения растяжения во времени сигналов поддиапазонов.
По другому аспекту представленного ранее описания аппаратной части в соответствии с одним из предыдущих пунктов манипулятор времени может включать в себя: модуль извлечения; модуль обработки окна/регулировщик фазы и вычислитель фазы для расчета фазы, на основе которой модулем обработки окна/регулировщиком фазы выполняется регулировка фазы извлеченного блока.
В соответствии с другим аспектом представленного ранее описания аппаратной части детектор переходных процессов может быть настроен на определение длины участка сигнала поддиапазона, содержащего переходной процесс с длиной, соответствующей длине сигнала, который будет включен сумматором переходных процессов.
В соответствии с другим аспектом представленного ранее описания аппаратной части сумматор переходных процессов может быть настроен на выполнение вставки участка сигнала поддиапазона, содержащего переходной процесс, причем длина участка может быть выбрана достаточно большой, такой, чтобы был возможен кроссфейд выходного сигнала после процесса перекрытия и суммирования на участке, имеющем переходной процесс, или чтобы был возможен кроссфейд от участка, имеющего переходной процесс, на выходе процесса перекрытия и суммирования. В соответствии с другим аспектом представленного ранее описания аппаратной части сумматор переходных процессов может быть сконфигурирован для выполнения операции кроссфейда.
В соответствии с другим аспектом представленного ранее описания аппаратной части детектор переходных процессов может быть сконфигурирован для обнаружения блоков, извлеченных модулем извлечения из сигналов поддиапазонов, имеющих признаки переходных процессов, а этап перекрытия и суммирования может быть сконфигурирован для снижения влияния извлеченных блоков или для исключения извлеченных блоков при суммировании.
В соответствии с другим аспектом представленного ранее описания аппаратной части детектор переходных процессов может быть настроен на выполнение перемещения «центра тяжести» при расчете энергии к заданному промежутку времени сигнала на входе в банк фильтров анализа или к сигналу поддиапазона.
Хотя некоторые аспекты были описаны в контексте аппаратной части, ясно, что эти аспекты могут представлять собой описание соответствующего способа, где блок или устройство соответствуют части способа или элементу части способа. Аналогично, аспекты, описанные в контексте части способа, также представляют собой описание соответствующего блока, элемента или компонента соответствующей аппаратной части.
Закодированный в соответствии с изобретением аудио сигнал может быть сохранен на цифровых носителях или может быть передан по передающей среде, такой как беспроводная передающая среда, или по проводной передающей среде, такой как Интернет.
В зависимости от определенных требований к реализации, воплощения изобретения могут быть реализованы в оборудовании или в программном обеспечении. Реализация может быть выполнена с помощью цифровых носителей, например дискет, DVD, CD, ROM, PROM, EPROM, EEPROM и флэш-памяти, имеющих считываемые электронным способом управляющие сигналы, сохраненные на нем, которые совместимы (или могут быть совместимы) с программируемой компьютерной системой так, что выполняется соответствующий способ. Некоторые варианты в соответствии с изобретением содержат носители данных, имеющие электронно-считываемые управляющие сигналы, которые совместимы с программируемой компьютерной системой так, что выполняется соответствующий способ.
Как правило, варианты осуществления настоящего изобретения могут быть реализованы в виде компьютерного программного продукта с программным кодом, для оперативного выполнения одного из способов, когда компьютерный программный продукт выполняется на компьютере. Программный код может храниться, например, на машиночитаемом носителе.
Другие варианты включают компьютерную программу для выполнения одного из описанных здесь способов, хранящуюся на машиночитаемом носителе.
Другими словами, вариант предлагаемого способа является компьютерной программой, имеющей программный код для выполнения одного из описанных здесь способов, когда компьютерная программа запускается на компьютере.
Другой вариант осуществления способа изобретения, следовательно, является носителем данных (либо цифровым носителем, либо машиночитаемым носителем), содержащим записанную на нем компьютерную программу для выполнения одного из описанных в настоящем документе способов.
Еще один вариант предлагаемого способа является, таким образом, потоком данных или последовательностью сигналов, представляющих компьютерную программу для выполнения одного из способов, описанных в настоящем документе. Поток данных или последовательность сигналов, например, могут быть сконфигурированы для передачи через линию передачи данных, например через Интернет.
Еще один вариант включает в себя средства обработки, например компьютер или программируемое логическое устройство, настроенное или адаптированное для выполнения одного из способов, описанных в настоящем документе. Еще один вариант представляет собой компьютер с установленной на ней компьютерной программой для выполнения одного из способов, описанных в настоящем документе.
В некоторых вариантах для выполнения некоторых или всех функций из способов, описанных в настоящем документе, может быть использовано программируемое логическое устройство (например, программируемая пользователем вентильная матрица). В некоторых вариантах, программируемая пользователем вентильная матрица может взаимодействовать с микропроцессором для того, чтобы выполнить один из описанных здесь способов. Как правило, способы предпочтительно реализовывать с помощью некоторого аппаратного устройства.
Описанные выше варианты являются лишь иллюстрацией принципов настоящего изобретения. Понятно, что дополнения и изменения механизмов и деталей, описанных здесь, будут очевидны для других специалистов в данной области. Это изобретение, следовательно, должно быть ограничено только формулой изобретения, а не конкретными деталями, представленными в виде описания и объяснений изложенных здесь вариантов.
Изобретение относится к средствам для обработки аудио сигнала. Технический результат заключается в уменьшении влияния переходных процессов на качество звука. Устройство включает манипулятор времени для индивидуальной обработки во времени множества поддиапазонов звукового сигнала. Манипулятор времени состоит из этапа перекрытия и суммирования для перекрытия и суммирования блоков, по крайней мере, одного из множества сигналов поддиапазонов с использованием значения перекрытия и суммирования, которое отличается от улучшенного значения в модуле извлечения, детектора переходных процессов для обнаружения переходного процесса в звуковом сигнале или поддиапазонах сигнала, и множества сумматоров переходных процессов для сложения обнаруженных переходных процессов с множеством сигналов, генерируемых на этапе перекрытия и суммирования. Этап перекрытия и суммирования настроен на снижение влияния обнаруженных переходных процессов или для исключения обнаруженных переходных процессов при сложении. 3 н. и 14 з.п. ф-лы, 19 ил.
1. Устройство для обработки аудио сигнала, включающее банк фильтров анализа для генерации сигналов поддиапазонов звукового сигнала; манипулятор времени для индивидуальной обработки во времени множества сигналов поддиапазонов, представляющих звуковой сигнал, манипулятор времени, выполняющий этап перекрытия и суммирования для перекрытия и суммирования блоков, по крайней мере, одного из множества сигналов поддиапазонов с использованием значения улучшенного перекрытия и суммирования, отличного от улучшенного значения блока извлечения, используемого для извлечения блоков из сигнала поддиапазона из множества сигналов поддиапазона; детектор переходных процессов для обнаружения переходного процесса в звуковом сигнале или по меньшей мере в одном сигнале поддиапазона из множества сигналов поддиапазонов, причем этап перекрытия и суммирования настроен на снижение влияния обнаруженных переходных процессов или исключения обнаруженных переходных процессов путем индивидуального определения переходных процессов в поддиапазонах на этапе перекрытия и суммирования; и сумматор переходных процессов для добавления обнаруженных переходных процессов по крайней мере к одному сигналу поддиапазона, генерируемому на этапе перекрытия/суммирования, путем индивидуальной обработки поддиапазонов.
2. Устройство по п. 1, дополнительно включающее модуль прореживания для прореживания звукового сигнала или множества сигналов поддиапазонов, причем манипулятор времени настроен на выполнение растяжения во времени множества сигналов поддиапазонов.
3. Устройство по п. 1, в котором детектор переходных процессов настроен на выделение блоков, путем индивидуальной обработки поддиапазонов, содержащих переходные процессы, и в котором этап перекрытия/суммирования настроен на исключение отмеченных блоков.
4. Устройство по п. 1, в котором этап перекрытия и суммирования настроен на использование значения улучшенного перекрытия и суммирования, являющегося большим, чем улучшенное значение блока извлечения для выполнения растяжения во времени множества сигналов поддиапазонов.
5. Устройство по п. 1, в котором манипулятор времени дополнительно включает блок извлечения; модуль обработки окна/регулятор фазы и вычислитель фазы для расчета фазы, на основе которой в модуле обработки окна/регуляторе фазы выполняется регулировка фазы извлеченного блока.
6. Устройство по п. 1, в котором детектор переходных процессов настроен на определение длины участка сигнала поддиапазона, содержащего переходной процесс с длиной, соответствующей длине сигнала, который будет включен сумматором переходных процессов.
7. Устройство по п. 1, в котором сумматор переходных процессов настроен на включение участка в поддиапазон сигнала, имеющий переходной процесс, причем длина участка выбирается достаточно большой, чтобы был возможен кроссфейд выходного сигнала после процесса перекрытия и суммирования на участке, имеющем переходной процесс, или чтобы был возможен кроссфейд от участка, имеющего переходной процесс, на выходе процесса перекрытия и суммирования.
8. Устройство по п. 7, в котором сумматор переходных процессов настроен на выполнение операции кроссфейда.
9. Устройство по п. 1, в котором детектор переходных процессов настроен на выявление блоков, извлекаемых блоком извлечения из сигнала поддиапазона, имеющих переходные характеристики.
10. Устройство по п. 1, которое дополнительно содержит банк фильтров анализа для генерирования множества сигналов поддиапазонов.
11. Устройство по п. 10, которое дополнительно включает модуль прореживания, расположенный на входе или выходе банка фильтров анализа, в котором манипулятор времени настроен на выполнение растяжения во времени множества сигналов поддиапазонов.
12. Устройство по п. 1, которое дополнительно включает первый банк фильтров анализа, второй банк фильтров анализа; этап повторной дискретизации перед вторым банком фильтров анализа и множество фазовых вокодеров для второго множества выходных сигналов поддиапазонов второго банка фильтров анализа, множество фазовых вокодеров, имеющих коэффициент расширения основного диапазона больше чем единица, причем на выходе фазового вокодера выполняется множество этапов перекрытия и суммирования.
13. Устройство по п. 12, которое дополнительно включает этап подключения между первым банком анализа и множеством фазовых вокодеров на входе этапа подключения и множество этапов перекрытия и суммирования в выходе этапа подключения, причем этап подключения выполнен с возможностью контроля положения блоков, соответствующих одному из множества сигналов поддиапазонов и обработанных блоков на выходе фазового вокодера на этапе перекрытия и суммирования.
14. Устройство по п. 1, которое дополнительно содержит корректор амплитуды, настроенный на компенсацию влияющих на амплитуду эффектов при расчетах различных блоков в контексте этапа перекрытия и суммирования.
15. Устройство по п. 1, которое дополнительно включает манипулятор времени для индивидуальной обработки во времени множества сигналов поддиапазонов звукового сигнала, причем манипулятор времени состоит из этапа перекрытия и суммирования, детектора переходных процессов и сумматора переходных процессов.
16. Способ для обработки аудио сигнала, включающий генерацию множества сигналов поддиапазонов звукового сигнала; блоки перекрытия и суммирования, соответствующие одному из множества сигналов поддиапазонов, представляющих аудио сигнал с помощью значения улучшенного перекрытия и суммирования, отличающегося от улучшенного значения блока извлечения, используемого для извлечения блоков из сигнала поддиапазона из множества сигналов поддиапазонов; обнаружение переходных процессов по меньшей мере в одном поддиапазоне сигнала из множества сигналов поддиапазонов; уменьшение влияния либо исключение обнаруженных переходных процессов при перекрытии и суммировании путем индивидуальной обработки поддиапазонов; включение обнаруженных переходных процессов в сигнал поддиапазона, генерируемый при выполнении перекрытия и суммирования путем индивидуальной обработки поддиапазонов.
17. Машиночитаемый носитель данных, содержащий компьютерную программу, предназначенную для выполнения способа обработки аудио сигнала, когда компьютерная программа запускается на компьютере, способа, включающего в себя генерацию множества сигналов поддиапазонов звукового сигнала; блоки перекрытия и суммирования, соответствующие одному из множества сигналов поддиапазонов, представляющих аудио сигнал с помощью значения улучшенного перекрытия и суммирования, отличающегося от улучшенного значения блока извлечения, используемого для извлечения блоков из сигнала поддиапазона из множества сигналов поддиапазонов; обнаружение переходного процесса, по крайней мере, в сигнале поддиапазона из множества поддиапазонов; уменьшение влияния или исключение обнаруженных переходных процессов при перекрытии и суммировании путем индивидуальной обработки поддиапазонов; включение обнаруженных переходных процессов в сигнал поддиапазона, генерируемый при выполнении перекрытия и суммирования, путем индивидуальной обработки поддиапазонов.
US 6549884 B1, 15.04.2003 | |||
WO 2009112141 A1, 17.09.2009 | |||
US 2007078650 A1, 05.04.2007 | |||
УСОВЕРШЕНСТВОВАННОЕ ПРЕОБРАЗОВАНИЕ СПЕКТРА/СВЕРТКА В ОБЛАСТИ ПОДДИАПАЗОНОВ | 2001 |
|
RU2251795C2 |
СПОСОБ И УСТРОЙСТВО ДЛЯ УЛУЧШЕНИЯ РЕЧЕВОГО СИГНАЛА В ПРИСУТСТВИИ ФОНОВОГО ШУМА | 2004 |
|
RU2329550C2 |
ИДЕНТИФИЦИРУЮЩИЙ ОТПЕЧАТОК ПАЛЬЦА ДАТЧИК С ИНТЕГРИРОВАННЫМ НАЖИМНЫМ ВЫКЛЮЧАТЕЛЕМ | 1999 |
|
RU2214165C2 |
Авторы
Даты
2016-07-10—Публикация
2011-03-04—Подача