Изобретение касается, в общем случае, обработки информационных сигналов, типа аудиосигналов, видеосигналов или других мультимедийных сигналов, более конкретно обработки информационных сигналов в спектральном/модуляционном спектральном диапазоне.
В области обработки сигналов, типа обработки сигналов цифровой аудиозаписи, часто имеются сигналы, состоящие из компонента сигнала несущей и компонента модуляции. В случае модулированных сигналов часто требуется представление, в котором сигналы разложены на компоненты несущей модуляции, например, чтобы иметь возможность фильтровать, кодировать или иным способом изменять их.
Для целей аудиокодирования известна, например, возможность подвергать аудиосигнал так называемому модуляционному преобразованию. При этом аудиосигнал разлагается на частотные полосы с помощью преобразования. Затем выполняется декомпозиция на амплитуду и фазу. В то время как фаза далее не обрабатывается, амплитуды, приходящиеся на диапазоны, вновь преобразуются посредством нескольких блоков преобразования в рамках второго преобразования. Результатом является частотная декомпозиция временной огибающей соответствующего поддиапазона на коэффициенты модуляции. Аудиокодирование, состоящее из такого модуляционного преобразования, описано, например, в работе M. Vinton and L. Atlas, "A Scalable and Progressive Audio Codec", Proceeding of the 2001 IEEE 35 ICASSP, 7-11 May 2001, Salt Lake City, заявке США US 2002/0176353A1 на имя Atlas et al., "Scalable And Perceptually Ranked Signal Coding And Decoding", от 11.28.2002, и в работе J. Thompson and L. Atlas, "A Non-uniform Modulation Transform for Audio Coding with Increased Time Resolution", Proceedings of the 2003 IEEE ICASSP, 6-10 April, Hong Kong, 2003.
Краткий обзор других различных методов демодуляции по полной ширине полосы демодулируемого сигнала, включая асинхронные и синхронные методы демодуляции и т.д., приведен, например, в статье L. Atlas, "Joint Acoustic And Modulation Frequency", Journal 10 on Applied Signal Processing 7 EURASIP, pp. 66S-675, 2003.
Недостатком вышеупомянутых схем аудиокодирования, использующих модуляционное преобразование, является следующее. Если никакие дальнейшие шаги обработки не выполняются на модуляционных коэффициентах вместе с фазами, то коэффициенты модуляции формируют спектральное/модуляционное спектральное представление аудиосигнала, которое является обратимым и полностью восстанавливаемым, то есть он преобразуется без изменений обратно в первоначальный аудиосигнал во временной области. Однако в их способах коэффициенты модуляции фильтруются для уменьшения и/или квантования коэффициентов модуляции до значений, как можно меньших, согласно психоакустическим критериям, так, чтобы был реализован максимальный коэффициент сжатия. Однако это, в общем случае, не достигает желаемой цели удаления соответствующих компонентов модуляции из результирующего сигнала или преднамеренного введения шума квантования в этот компонент. Это обусловлено тем, что после обратного преобразования измененных коэффициентов модуляции фазы поддиапазонов больше не совместимы с измененными амплитудами этих поддиапазонов и продолжают содержать мощные составляющие компонента модуляции исходного сигнала. Если фазы поддиапазонов теперь повторно объединить с измененными амплитудами, эти компоненты модуляции повторно вводятся в фильтрованный или квантованный сигнал за счет фазы. Другими словами, модуляционное преобразование, с последующей модификацией коэффициентов модуляции вышеупомянутым способом, то есть фильтрацией коэффициентов модуляции, вместе с последующим синтезом фазовых и амплитудных компонентов, обеспечивает сигнал, который, при другом анализе и/или модуляционном преобразовании, все еще содержит существенные компоненты модуляции в тех позициях представления спектрального/модуляционного спектрального диапазона, которые должны были быть отфильтрованы. Эффективная фильтрация, таким образом, не возможна на основе схем обработки сигнала, основанных на вышеуказанном модуляционном преобразовании.
Поэтому существует потребность в схеме обработки информационных сигналов, позволяющей обрабатывать модулированные сигналы с компонентом несущей и компонентом модуляции, разделяемой, согласно компонентам модуляции и несущей, более управляемым способом.
Таким образом, целью данного изобретения является обеспечение схемы обработки для информационных сигналов, позволяющей осуществлять обработку информационных сигналов, которая разделена, согласно компонентам модуляции и несущей, более управляемым способом.
Эта цель достигается устройством согласно п.1 и способу согласно п.17 формулы изобретения.
Устройство, соответствующее изобретению, предназначенное для обработки информационного сигнала, включает в себя средство для преобразования информационного сигнала во временное/спектральное представление с помощью блочного преобразования информационного сигнала и средство для преобразования информационного сигнала из временного/спектрального представления в спектральное/модуляционное спектральное представление, при этом средство для преобразования выполнено таким образом, что спектральное/модуляционное спектральное представление зависит как от амплитудного компонента, так и от фазового компонента временного/спектрального представления информационного сигнала. Имеется средство, которое выполняет манипуляцию и/или модификацию информационного сигнала в спектральном/модуляционном спектральном представлении для того, чтобы получить измененное спектральное/модуляционное спектральное представление. Дополнительное средство окончательно формирует обработанный информационный сигнал, представляющий собой обработанную версию информационного сигнала, основанного на измененном спектральном/модуляционном спектральном представлении.
Основной идеей данного изобретения является то, что обработка информационных сигналов, которая более строго разделяется, согласно компонентам модуляции и несущей, может быть достигнута, если преобразование информационного сигнала из временного/спектрального представления и/или временного/частотного представления в спектральное/модуляционное спектральное представление и/или частотное/модуляционное частотное представление выполняется в зависимости как от амплитудного компонента, так и от фазового компонента временного/спектрального представления информационного сигнала. Это устраняет рекомбинацию между фазой и амплитудой и, таким образом, повторное ведение нежелательных модуляционных компонентов во временное представление обработанного информационного сигнала на стороне синтеза.
Преобразование информационного сигнала из временного/спектрального представления в спектральное/модуляционное спектральное представление, с учетом как амплитуды, так и фазы, затрагивает проблему, заключающуюся в том, что временное/спектральное представление информационного сигнала фактически зависит не только от информационного сигнала, но также и от смещения фазы временных блоков относительно спектрального компонента несущей информационного сигнала. Другими словами, блочное преобразование информационного сигнала из временного представления во временное/спектральное представление обуславливает то, что последовательности спектральных значений, полученных во временном/спектральном представлении информационного сигнала на каждый спектральный компонент, включают в себя модулированную с повышением комплексную несущую, зависящую только от асинхронизма частоты повторения блоков относительно компонента несущей частоты информационного сигнала. Согласно вариантам воплощения данного изобретения демодуляция последовательности спектральных значений во временном/спектральном представлении информационного сигнала выполняется, таким образом, на каждый спектральный компонент для получения демодулированной последовательности спектральных значений на спектральный компонент. Последующее преобразование полученных, таким образом, демодулированных последовательностей спектральных значений выполняется блочным преобразованием из временного/спектрального представления в спектральное/модуляционное спектральное представление и/или их блочной спектральной декомпозицией, получая, таким образом, блоки модуляционных значений. Ими манипулируют и/или изменяют, например взвешивают соответствующей взвешивающей функцией для полосовой фильтрации для удаления компонента модуляции из исходного информационного сигнала. Результатом является измененная демодулированная последовательность спектральных значений и/или измененное демодулированное временное/спектральное представление.
Комплексная несущая вновь модулируется полученной, таким образом, измененной демодулированной последовательностью спектральных значений, для получения измененной последовательности спектральных значений, представляющих часть временного/спектрального представления обработанного информационного сигнала. Обратное преобразование этого представления во временное представление приводит к обработанному информационному сигналу во временном представлении и/или временной области, который может быть изменен очень точным способом по отношению к исходному информационному сигналу относительно компонентов несущей и модуляции.
Предпочтительные варианты воплощения данного изобретения поясняются ниже более подробно со ссылками на чертежи, на которых:
Фиг.1 показывает блок-схему устройства для обработки информационного сигнала согласно варианту воплощения данного изобретения; и
Фиг.2 показывает схематичное представление, иллюстрирующее работу устройства по Фиг.1.
Фиг.1 показывает устройство для обработки информационного сигнала согласно варианту воплощения данного изобретения. Устройство 10, показанное на Фиг.1 содержит вход 12, на котором оно получает информационный сигнал 14, который должен обрабатываться. Устройство по Фиг.1 иллюстрирует пример обработки информационного сигнала 14 таким образом, чтобы удалять модуляционный компонент из информационного сигнала 14, и, таким образом, получить обработанный информационный сигнал только с компонентом несущей. Кроме того, устройство 10 содержит выход 16 для выдачи компонента несущей в качестве результата обработки и/или обработанного информационного сигнала 18.
Устройство 10 внутренне разделено, по существу, на секцию 20 для преобразования информационного сигнал 14 из временного представления во временное/частотное представление, средство 22 для преобразования информационного сигнала из временного/частотного представления в частотное/модуляционное частотное представление, секцию 24 для выполнения фактической обработки, то есть модификации информационного сигнала, и секции 26 для обратного преобразования информационного сигнала, обработанного в частотном/модуляционном частотном представлении, из этого представления во временное представление. Упомянутые четыре секции связаны в этом порядке последовательно между входом 12 и выходом 16, причем их более подробная структура и их более подробное функционирование описаны ниже.
Секция 20 устройства 10 содержит средство 28 весовой обработки и средство 30 преобразования, которые следуют от входа 12 в этом порядке. В частности, вход средства 28 весовой обработки связан с входом 12 для приема информационного сигнала 14 в виде последовательности информационных значений. Если информационный сигнал все еще присутствует как аналоговый сигнал, он может, например, быть преобразован в последовательность информационных значений и/или значений выборок аналого-цифровым преобразователем и/или дискретным квантованием. Средство 28 весовой обработки формирует блоки с одинаковым числом информационных значений из последовательности информационных значений и дополнительно выполняет взвешивание с использованием функции взвешивания по каждому блоку информационных значений, которая, однако, не может, например, исключительно соответствовать синусному окну или KBD окну. Блоки могут перекрываться, например, на 50%, или не перекрываться. Только для примера ниже принято 50%-е перекрытие. Предпочтительные функции взвешивания имеют свойство, заключающееся в том, что они обеспечивают хорошее разделение поддиапазонов во временном/спектральном представлении, что квадраты их значений весов, которые соответствуют друг другу при их применении к одному и тому же самому информационному значению, суммируются до единицы в области перекрытия.
Выход средства 28 весовой обработки связан с входом средства 30 преобразования. Блоки информационных значений, выводимые средством 28 весовой обработки, принимаются средством 30 преобразования. Средство 30 преобразования после этого подвергает их по-блочно преобразованию спектральной декомпозиции, такому как дискретное преобразование Фурье или другое комплексное преобразование. Средство 30 преобразования реализует, таким образом, по-блочную декомпозицию информационного сигнала 14 на спектральные компоненты и, таким образом, генерирует блок спектральных значений, включающих одно спектральное значение на спектральный компонент на временной блок, когда он принимается от средства 28 весовой обработки. Несколько спектральных значений могут быть объединены в поддиапазоны. В последующем описании, однако, термин «поддиапазон» и «спектральный компонент» используются как синонимы. Для каждого спектрального компонента и/или для каждого поддиапазона результатом является, таким образом, одно спектральное значение или несколько спектральных значений, если имеется комбинация поддиапазонов, что, однако, не предполагается в последующем описании, на каждый временной блок. Соответственно, средство 30 преобразования выводит последовательность спектральных значений на спектральный компонент и/или поддиапазон, которые представляют изменение во времени этого спектрального компонента и/или этого поддиапазона. Спектральные значения, выводимые средством 30 преобразования, представляют собой временное/частотное представление информационного сигнала 14.
Секция 22 включает в себя средство 32 определения несущей частоты, смеситель 34, работающий как средство демодуляции, средство 36 весовой обработки и второе средство 38 преобразования.
Средство 32 весовой обработки включает в себя вход, связанный с выходом средства 30 преобразования. Оно получает на нем последовательности спектральных значений для индивидуальных поддиапазонов и делит последовательности спектральных значений на поддиапазон, подобно средству 28 весовой обработки по отношению к информационному сигналу 14, на блоки и взвешивает спектральные значения каждого блока с соответствующей весовой функцией. Весовая функция может быть одной из весовых функций, упомянутых выше для примера относительно средства 28. Последовательные блоки в поддиапазоне могут перекрываться или не перекрываться, где вновь, в качестве примера, принимается взаимное перекрытие 50%. Ниже предполагается, что блоки различных поддиапазонов выровнены относительно друг друга, как это будет пояснено более подробно ниже для Фиг.1. Однако также может использоваться другая процедура с последовательностями блоков, смещенными для разных поддиапазонов. На выходе средство весовой обработки выводит последовательности взвешенных блоков спектральных значений на каждый поддиапазон.
Средство 32 определения несущей частоты также содержит вход, связанный с выходом средства 30 преобразования, для получения спектральных значений поддиапазонов и/или спектральных компонентов в виде последовательностей спектральных значений в поддиапазоне. Это обеспечено для того, чтобы найти в каждом поддиапазоне компонент несущей, обусловленный индивидуальными временными блоками, из которых были получены индивидуальные спектральные значения поддиапазонов, содержащий смещение фазы, изменяющееся во времени по отношению к компоненту 14 несущей частоты информационного сигнала. Средство 32 определения несущей частоты выводит компонент несущей, определенный в поддиапазоне на вход смесителя 34, другой вход которого связан со средством 36 весовой обработки.
Смеситель 34 умножает для каждого поддиапазона блоки взвешенных спектральных значений, выведенных средством преобразования, на комплексно сопряженное значение соответствующего компонента несущей, как он был определен средством 30 определения несущей частоты для соответствующего поддиапазона, демодулируя, таким образом, поддиапазоны и/или блоки взвешенных спектральных значений.
На выходе смесителя 34 результатом являются, таким образом, демодулированные поддиапазоны и/или результатом является последовательность демодулированных блоков взвешенных спектральных значений на поддиапазон. Выход смесителя 34 соединен с входом средства 38 преобразования, так что последний получает блоки взвешенных демодулированных спектральных значений, перекрывающихся друг с другом, например, на 50%, на каждый поддиапазон и преобразовывает и/или спектрально разлагает их по-блочно в спектральное/модуляционное спектральное представление для формирования частотного/модуляционного частотного представления 14 информационного сигнала, до сих пор измененного только в отношении демодуляции последовательностей спектральных значений поддиапазонов путем обработки всех поддиапазонов и/или спектральных компонент. Преобразование, на котором основано средство 38 преобразования, для каждого поддиапазона, может быть, например, дискретным преобразованием Фурье (ДПФ), модифицированным дискретным косинусным преобразованием (МДКП), модифицированным дискретным синусным преобразованием (МДСП), в частности тем же преобразованием, что и для средства 30 преобразования. На Фиг.1 предполагается, в качестве примера, что преобразование обоих средств 30, 38 преобразования является дискретным преобразованием Фурье (ДПФ).
Соответственно, средство 38 преобразования последовательно выводит блоки значений, упоминаемые далее как значения модуляции и представляющие спектральную декомпозицию блоков взвешенных демодулированных спектральных значений, на свой выход для каждого поддиапазона и/или каждого спектрального компонента. Блоки спектральных значений на каждый поддиапазон, относительно которых средство 38 преобразования выполняет преобразование, выровнены по времени друг с другом, так что результат за период времени всегда непосредственно представляет матрицу значений модуляции, состоящую из блока значений модуляции в поддиапазоне. Средство 38 преобразования пропускает значения модуляции в секцию 24, которая содержит средство 40 обработки сигналов.
Средство 40 обработки сигналов соединено с выходом средства 38 преобразования и, таким образом, получает блоки значений модуляции. В данном примерном случае, поскольку устройство 10 служит для подавления компонента модуляции, средство 40 обработки сигналов выполняет эффективную низкочастотную фильтрацию в частотной области для входных блоков значений модуляции, то есть взвешивание значений модуляции и функцией, спадающей к более высоким и/или более низким частотам модуляции, начиная от частоты модуляции ноль. Таким образом, измененные блоки значений модуляции передаются средством 40 обработки сигналов к секции 26 обратного преобразования. Измененные блоки значений модуляции, выведенные средством 40 обработки сигналов, представляют измененное частотное/модуляционное частотное представление информационного сигнала 14, или, другими словами, частотное/модуляционное частотное представление, все еще отличающееся от частотного/модуляционного частотного представления измененного информационного сигнала 18 демодуляцией с помощью смесителя 34.
Секция 26 обратного преобразования, в свою очередь, разделена на две секции, то есть секцию преобразования обработанного информационного сигнала 18 из частотного/модуляционного частотного представления, выведенного средством 40 обработки сигналов, во временное/частотное представление, и секцию для обратного преобразования обработанного информационного сигнала из временного/частотного представления во временное представление. Первая из двух секций включает в себя средство 42 преобразования для выполнения блочного преобразования, обратного преобразованию, выполненному средством 38 преобразования, смеситель 46 и средство 44 объединения. Последняя часть секции 26 обратного преобразования включает в себя средство 48 преобразования для выполнения блочного преобразования, обратного преобразованию, выполненному средством 30 преобразования, и средство 50 объединения.
Своим входом средство 42 обратного преобразования связано с выходом средства 40 обработки сигналов и преобразует измененные блоки значений модуляции для каждого поддиапазона из спектрального представления назад во временное/частотное представление и, таким образом, обратно изменяет спектральную декомпозицию для получения последовательности измененных блоков спектральных значений в поддиапазоне. Эти измененные блоки спектральных значений, выводимые средством 42 обратного преобразования, отличаются от блоков спектральных значений, выводимых средством 36 весовой обработки не только обработкой средством 40 обработки сигналов, но и демодуляцией, выполненной смесителем 34. Поэтому смеситель 46 получает последовательность измененных блоков спектральных значений, выводимых средством 42 обратного преобразования в поддиапазоне и смешивает их с комплексной несущей, которая является комплексно сопряженной относительно той, которая используется в соответствующем месте и/или для соответствующего блока для демодуляции информационного сигнала в смесителе 34, чтобы модулировать блоки спектральных значений с несущей, с учетом смещений фазы временных блоков. Результат, получаемый на выходе смесителя 46, представляет собой последовательность измененных, недемодулированных блоков спектральных значений в поддиапазоне.
Выход смесителя 46 связан со входом средства 44 объединения. Оно объединяет в каждом поддиапазоне последовательность измененных блоков спектральных значений, вновь модулированных с использованием комплексной несущей для формирования однородного потока и/или однородной последовательности спектральных значений путем соответствующего взаимного связывания спектральных значений смежных и/или последовательных блоков спектральных значений для поддиапазона, когда они принимаются от смесителя 46. В случае использования функций взвешивания, упомянутых для примера выше, с положительным свойством, что квадраты взаимно соответствующих значений весов суммируются в единицу в случае перекрытия, комбинация состоит в простом суммировании спектральных значений, связанных друг с другом. Результат, выводимый на выходе средства 44 объединения (OLA = суммирование с перекрытием, состоит из измененной последовательности спектральных значений в поддиапазоне. Результат, выводимый, таким образом, на выходе OLA 44 представляет измененные поддиапазоны и/или измененные последовательности спектральных значений для всех спектральных компонентов, и представляет измененное временное/частотное представление информационного сигнала 14 и/или временное/частотное представление измененного информационного сигнала 18.
Средство 48 преобразования получает последовательности спектральных значений, в частности одно за другим всегда одно спектральное значение для всех поддиапазонов и/или спектральных компонентов и/или одну за другой спектральную декомпозицию части измененного информационного сигнала 18. Путем обратного изменения спектральной декомпозиции оно формирует последовательность измененных временных блоков из последовательности спектральных декомпозиций. Эти измененные временные блоки, в свою очередь, принимаются средством 50 объединения. Средство 50 объединения работает подобно средству 44 объединения. Оно объединяет измененные временные блоки, перекрывающиеся, например, на 50% путем суммирования взаимно соответствующих информационных значений из смежных и/или последовательных измененных временных блоков. Результат на выходе средства 50 объединения представляет собой, таким образом, последовательность информационных значений, представляющих обработанный информационный сигнал 18.
Структура устройства 10 и функционирование индивидуальных описанных компонентов ниже обсуждаются более подробно со ссылками на Фиг.1 и 2.
Обработка информационного сигнала устройством 10 начинается с приема аудиосигнала 14 на входе 12. Информационный сигнал 14 представлен в дискретизированной форме. Дискретизация обеспечена, например, посредством аналогового цифрового преобразователя с некоторой частотой ωs дискретизации. Информационный сигнал 14 последовательно поступает на вход 12 как последовательность выборок и/или информационных значений Si=S(2π/ωsi), где s - аналоговый информационный сигнал, Si - информационные значения и индекс i является индексом для информационных значений. Для входных выборок Si средство 28 весовой обработки всегда объединяет 2N последовательных выборок для формирования временных блоков, в данном примере с 50%-ым перекрытием. Например, оно объединяет выборки от S0 до S2N-1 для формирования временного блока с индексом n=0, выборки от SN до S3N-1 для сформирования второго временного блока с индексом n=1, выборки от S2N до S4N-1 для формирования третьего временного блока информационных значений с индексом n=2, и т.д. Средство 28 весовой обработки взвешивает каждый из этих блоков окном и/или функцией взвешивания, как описано выше. Положим, что выборки от Sn 0 до sn 2N-I являются, например, 2N информационными значениями временного блока n, тогда блок, выводимый средством 28, формируется как выборки от Sn 0->Sn 0go до sn 2N-1->sn 2N-1g2N-1, где gi с i = от 0 до 2N-1 является функцией взвешивания.
Фиг.2 показывает функции весовой обработки, применяемые к информационным значениям Si для четырех последовательных временных блоков n=0, 1, 2, 3 в диаграмме 70, в которой время t отложено по оси X в произвольных единицах, и амплитуда функций весовой обработки отложена по оси Y в произвольных единицах. Этим способом, средство 28 весовой обработки пропускает новый, взвешенный временной блок из 2N информационных значений каждый на средство 30 преобразования всегда после N информационных значений. Частота повторения временных блоков равна, таким образом, ωs/N.
Средство 30 преобразования преобразует взвешенные временные блоки в спектральное представление. Средство 30 преобразования выполняет спектральную декомпозицию временных блоков взвешенных информационных значений в множество предопределенных поддиапазонов и/или спектральных компонентов. В данном случае для примера предполагается, что преобразование является дискретным преобразованием Фурье. Для каждого временного блока из 2N информационных значений средство 30 преобразования генерируют N комплексных спектральных значений для N спектральных компонентов, если информационный сигнал является реальным, в этом примерном случае. Комплексные спектральные значения, выводимые средством 30 преобразования, представляют собой временное/частотное представление 74 информационного сигнала. Комплексные спектральные значения проиллюстрированы блоками 76 на Фиг.2. Поскольку средство 30 преобразования генерирует, по меньшей мере, одно спектральное значение на последовательный временной блок информационных значений на поддиапазон и/или спектральный компонент, средство 30 преобразования, таким образом, выводит последовательность спектральных значений 76 на поддиапазон и/или спектральный компонент с частотой ωs/N. Спектральные значения, выведенные для временного блока, проиллюстрированы как горизонтально расположенные по оси 78 частоты, обозначенные ссылочной позицией 74 на Фиг.2. Спектральные значения, выведенные для последующего временного блока, следуют непосредственно ниже в вертикальном направлении по оси 80. Оси 78 и 80, таким образом, представляют собой ось частоты и/или времени временного/частотного представления информационного сигнала 14. Для примера на Фиг.2 показаны только четыре поддиапазона. Последовательность спектральных значений в поддиапазоне следует по столбцам в примерном представлении на Фиг.2 и проиллюстрирована с помощью 82a, 82b, 82c и 82d.
Ниже вновь приводятся ссылки на Фиг.1, где информационный сигнал 14 проиллюстрирован для примера как функция, представленная выражением sin(bt)(l+μ Sin(at)), в которой α является, например, частотой модуляции огибающей информационного сигнала 14, обозначенного пунктирной линией 84, в то время как β представляет собой несущую частоту информационного сигнала 14, t - время, и μ - глубина модуляции. При достаточно высокой частоте ωs дискретизации для этого примерного информационного сигнала результатом преобразования 72 во временной блок является блок спектральных значений 76, то есть строка 74, в котором, главным образом, спектральный компонент и/или подходящее спектральное значение имеет различимый максимум на несущей частоте β. Однако спектральные значения для этого спектрального компонента f=β изменяются во времени для последовательных временных блоков из-за изменения огибающей 84. Соответственно, амплитуда спектральных значений спектрального компонента β изменяется с частотой α модуляции.
До сих пор обсуждение не принимало во внимание, что каждый из различных временных блоков может иметь различный сдвиг фазы относительно несущей частоты β из-за рассогласования по частоте между частотой ωs/N повторения временных блоков и несущей частотой информационного сигнала 14. В зависимости от сдвига фазы спектральные значения спектральных блоков, полученных из временных блоков в преобразовании 72, модулируются с несущей ejΔϕf, где j представляет собой мнимую единицу, f представляет собой частоту и Δϕ представляет собой сдвиг фазы соответствующего временного блока. Для существенно равной несущей частоты, как имеет место в данном примерном случае, сдвиг Δϕ фазы увеличивается линейно. Поэтому спектральные значения поддиапазона из-за частотного рассогласования между частотой повторения временного блока и несущей частотой испытывают модуляцию с компонентом несущей, зависящим от рассогласования этих двух частот.
Принимая это во внимание, средство 32 определения несущей частоты теперь выводит компонент несущей в поддиапазонах, обусловленный сдвигом фазы временных блоков и/или вызванный сдвигом фазы временного блока, из спектральных значений (ωb, n), где ωb является угловой частотой ω и/или частотой f (ω=2πf) соответствующего поддиапазона 0<b<N среди всех N поддиапазонов, и n является индексом временного блока и/или спектрального блока, связанным с временем t согласно n=ωSt. Таким образом, определенная несущая частота модуляции ω(m,f) определяется средством 32 определения несущей частоты для каждого поддиапазона ωb и/или каждой частоты f для каждого блока, где m указывает индекс блока, как описано более подробно ниже. Для этой цели средство 32 определения несущей частоты всегда объединяет М последовательных спектральных значений 76 поддиапазона ωb, таких как спектральные значения от (ωb, 0) до (ωb, M-1). Из этих М спектральных значений оно определяет поведение фазы и/или изменение фазы. Затем оно определяет линейное уравнение, которое наиболее близко к поведению фазы, например, посредством алгоритма наименьшего квадрата ошибки. Из крутизны и значения на оси и/или фазы или начального сдвига, определяемого линейным уравнением, средство 32 определения несущей частоты получает желаемую несущую частоту модуляции ωb для поддиапазона b относительно временного блока m, и/или сдвига ϕ фазы блока спектральных значений для поддиапазона b относительно временного блока m. Это определение выполняется средством определения несущей частоты для всех поддиапазонов посредством спектральных значений, одинаковых по времени, то есть для всех блоков спектральных значений от a(ωb, о) до (ωb,M-1) с ωb для всех поддиапазонов 0<b<N. Этим способом средство 32 определения несущей частоты определяет несущую частоту ωb модуляции и сдвиг ϕ фазы блока спектральных значений для каждого поддиапазона ωb, блок за блоком. Деление на блоки, на которых основано определение комплексных несущих для всех поддиапазонов средством 32, также используется средством весовой обработки. Средство 32 определения несущей частоты выводит определенные значения для комплексных несущих на средства демодуляции и/или смеситель 34.
Смеситель 34 теперь смешивает взвешенные блоки спектральных значений индивидуальных поддиапазонов, когда они выводятся средством 36 весовой обработки с комплексно сопряженными значениями соответствующих несущих частот модуляции ωd, с учетом сдвига ϕ фазы блока спектральных значений, путем умножения этих блоков спектральных значений поддиапазонов на e-j(ωdn+ϕ), причем как упомянуто выше, различные пары ωd и ϕ всегда используются для каждого поддиапазона и в пределах каждого поддиапазона для последовательных блоков. Этим способом смеситель 34 выводит демодулированные блоки спектральных значений поддиапазонов, выровненные друг с другом, то есть двумерные блоки N блоков спектральных значений по М демодулированных спектральных значений каждый.
Поскольку модуляции в поддиапазонах, вызванные сдвигами временных блоков, удалены демодуляцией посредством смесителя 34, изменение фазы спектральных значений в поддиапазонах в пределах блоков является более равномерным на среднем и изменяется по существу в окрестности фазы 0. В результате обеспечивается то, что последующим преобразованием с помощью средства 38 преобразования демодулированные и взвешенные блоки спектральных значений приводят к спектральной декомпозиции, в которой частота 0 и/или постоянный компонент очень хорошо центрированы.
Преобразование 86 с помощью средства 38, следующее после демодуляции 84 смесителем 34, выполняется по-блочно над каждым поддиапазоном и/или каждой последовательностью демодулированных блоков спектральных значений. Преобразование 86, в частности, подвергает демодулированные блоки спектральных значений N поддиапазонов по-блочно спектральной декомпозиции. Результат спектральной декомпозиции блоков спектральных значений может также упоминаться как представление частоты модуляции. Для N блоков взвешенных и демодулированных спектральных значений, выровненных друг с другом, преобразование 86, таким образом, приводит к матрице MxN модуляционных значений, представляющих частотное/модуляционное частотное представление информационного сигнала 14 по периоду времени М временных блоков, которые внесли вклад в эту матрицу. Матрица модуляции в качестве примера показана как 88 на Фиг.2 для случая N=M=4. Как можно видеть, частотное/модуляционное частотное представление частоты 88 имеет два измерения, а именно частоту 90 и частоту 92 модуляции. Индивидуальные значения модуляции проиллюстрированы блоками 93 в 88.
Средство 38 преобразования передает матрицу модуляции в средство 40 обработки. Согласно данному варианту воплощения средство 40 обработки предназначено для фильтрации компонента модуляции из информационного сигнала 14. В данном примерном случае средство 40 обработки поэтому выполняет фильтрацию нижних частот на компонентах частоты модуляции в матрице частоты/частоты модуляции. Для целей иллюстрации, Фиг.1 показывает диаграмму 94, в которой частота модуляции отложена по оси X, и амплитуда значений модуляции отложена по оси Y. Диаграмма 94 представляет собой часть матрицы модуляции 88 для примерного случая информационного сигнала 14 Фиг.1, то есть модулированного синусоидой синусоидального сигнала. В частности, диаграмма 94 иллюстрирует изменение амплитуд значений модуляции по частоте модуляции для поддиапазона с частотой β, то есть несущей частотой. За счет демодуляции 84 посредством смесителя 34 спектр частоты модуляции по существу центрирован - по меньшей мере, в случае БПФ для преобразования 86 - и/или выровнен корректным образом. В частности, спектр частоты модуляции на несущей частоте β имеет две боковые полосы 96 и 98, расположенные на частоте модуляции α, то есть частоте модуляции огибающей 84 информационного сигнала 14. Кроме того, значения модуляции матрицы 88 модуляции имеют постоянный компонент 100 в частоте β. Средство 40 обработки сигналов теперь предназначено в качестве фильтра нижних частот с характеристикой 102 фильтра, показанной пунктирной линией для удаления двух боковых 96 и 95 из частотного/модуляционного частотного представления 88. Этим способом информационный сигнал 14 освобождается от его компонента модуляции, после чего остается только компонент несущей. Измененная таким образом матрица модуляции передается в средство 42 обратного преобразования средством 40 обработки. Средство 42 обратного преобразования обрабатывает измененную матрицу модуляции для каждого поддиапазона так, что блок модулированных значений для соответствующего поддиапазона, то есть столбец в матрице 88 модуляции, подвергается преобразованию, обратному преобразованию, выполненному средством 38 преобразования, так что эти блоки значений модуляции преобразуются из частотного/модуляционного представления частоты обратно во временное частотное представление. Этим способом средство 42 обратного преобразования генерирует из каждого такого блока значений модуляции для каждого поддиапазона блок спектральных значений для этого поддиапазона.
Из вывода спектральных значений с помощью средства 30 преобразования в приведенном выше описании, главным образом, упоминается обработка первых М спектральных значений и/или М последовательных спектральных значений для каждого поддиапазона. Эти процедуры обработки средствами 32, 34, 36, 38, 40 и 42, однако, также повторяются для следующих блоков из M спектральных значений каждый для каждого из N поддиапазонов, а именно с перекрытием блоков из М спектральных значений каждый, например, на 50% в данном случае, то есть с перекрытием на каждый поддиапазон на М/2 спектральных значений. На Фиг.2 блоки показаны для примера при m=0, m=1 и m=2 во временном/частотном представлении 74 с функциями взвешивания в форме дуги для M=4 спектральных значений в каждом поддиапазоне. Для каждого из этих блоков m средство 38 преобразования окончательно генерирует матрицу модуляции из MxN значений модуляции каждая, которые отфильтрованы и/или взвешены средством 40 обработки сигналов способом, описанным выше. Средство 42 обратного преобразования, в свою очередь, генерирует блок спектральных значений для каждого поддиапазона из этих измененных матриц 88 модуляции, то есть матрицу измененных, но все еще демодулированных блоков спектральных значений.
Однако блоки спектральных значений в поддиапазоне, выводимые средством 42 обратного преобразования, отличаются от полученных из информационного сигнала 14 на выходе средства 36 весовой обработки не только обработкой средством 40 обработки, но также и изменением, осуществленным посредством демодуляции. Поэтому блоки спектральных значений снова модулируются в средстве 46 модуляции с использованием компонента несущей модуляции, с использованием которого они ранее демодулировались. В частности, соответствующие блоки спектральных значений, ранее умноженных на e-j(ω_d·n+ϕ), таким образом теперь умножаются на e+j(ω_d·n+ϕ), где n указывает индекс последовательности спектральных значений соответствующего поддиапазона и ω_d и/или ωd является угловой частотой комплексной несущей модуляции, определенной средством 32 для соответствующего блока спектральных значений.
Последовательности блоков спектральных значений в поддиапазонах, полученные после каскада 46 модуляции, теперь объединяются для каждого поддиапазона средством 44 объединения для формирования однородного потока, 82a-82d спектральных значений в поддиапазоне путем перекрытия блоков спектральных значений соответственно друг с другом, в данном примере на 50%, и объединения взаимно соответствующих спектральных значений в зависимости от функции взвешивания, используемой в средстве 36, весовой обработки путем суммирования в случае синусной или KBD-функции взвешивания, как описано выше.
Потоки спектральных значений в поддиапазоне, получаемые на выходе средства 44 объединения, представляют собой временное/частотное представление обработанного информационного сигнала 18. Потоки принимаются средством 48 обратного преобразования. На каждом временном шаге n оно использует спектральные значения для всех диапазонов ωS, то есть все спектральные значения а(ωS, n) при 0<b<N, для выполнения преобразования из частотного представления во временное представление для получения временного блока для каждого n, то есть с длительностью времени повторения, равной 2πN/ωS. Эти временные блоки объединяются средством 50 объединения путем перекрытия на 50% в данном примере и объединения взаимно соответствующих информационных значений в этих временных блоках для формирования однородного потока информационных значений для окончательного представления обработанного информационного сигнала во временной области 18, выводимого на выходе 16.
Обработанный информационный сигнал проиллюстрирован как 18 на диаграмме на Фиг.1, где ось X является временем, и ось Y является амплитудой информационного сигнала 18. Можно видеть, что остается только компонент несущей информационного сигнала 14 на стороне входа. Компоненты модуляции и/или компонент 84 огибающей удалены.
Другими словами, вариант воплощения, показанный на Фиг.1 и 2, представляет собой устройство обработки, которое использует адаптивный к сигналу фильтров для выполнения декомпозиции сигналов на компонент несущей и модуляции и использует результирующее представление модулированных сигналов для их фильтрации. Аналогично, однако, было бы возможно выполнить кодирование, кодирование или сжатие вместо обработки фильтром в средстве обработки сигналов или иным образом изменить матрицы модуляции. По сравнению со способами преобразования модуляции, используемыми для аудиокодирования, описанного в начальной части описания, которые выполняют формирование амплитуды, этот вариант воплощения выполняет демодуляцию относительно компонента несущей в поддиапазоне. После оценки этого компонента несущей поддиапазона в средстве 32 определения несущей частоты демодуляция в поддиапазоне реализуется умножением на комплексно сопряженную величину этого компонента. Демодулированные таким образом сигналы поддиапазонов затем преобразуются в область модуляции путем дополнительной декомпозиции частот с помощью средства 36 весовой обработки и средства 38 преобразования.
В варианте воплощения по Фиг.1 дискретное преобразование Фурье с 50%-ым перекрытием и весовой обработкой было использовано для примера в качестве первого преобразования 72, в котором, однако, возможны отклонения и изменения. Различные блоки первого преобразования 72 могут быть объединены средством 36 весовой обработки, например с 50%-м перекрытием, и демодулироваться по поддиапазонам с помощью комплексного модулятора, определяться средством 32 определения несущей частоты посредством смесителя 34 и затем преобразоваться посредством ДПФ. В предыдущем варианте воплощения, частота этого модулятора была получена из фаз соответствующих блоков поддиапазона, который демодулируется в средстве определения несущей частоты, то есть аппроксимацией прямой линии через изменение фаз спектральных значений соответствующих блоков. Однако это может также быть выполнено иным образом. Средство 32 определения несущей частоты может, например, на каждую часть спектрального блока от n до n+M-1 аппроксимировать плоскость для фазового компонента всех поддиапазонов в этой части. Кроме того, было бы возможно, чтобы средство 32 определения несущей частоты выполняло бы определения комплексного модулятора не по-блочно, а непрерывно по потоку спектральных значений в поддиапазоне. Для этой цели средство 32 определения несущей частоты может, например, сначала развернуть фазы последовательности спектральных значений соответствующего поддиапазона, например, выполнить фильтрацию нижних частот для них и затем использовать локальное увеличение изменения отфильтрованной фазы для адаптации комплексного модулятора. Соответственно, часть модуляции в смесителе 46 также должна быть изменена. В общем случае, средство определения несущей частоты пытается влиять на поведение фазы увеличением или уменьшением фазы комплексных спектральных значений поддиапазона с увеличением или уменьшением амплитуды для последовательности так, что средняя крутизна фазы последовательности спектральных значений уменьшается, и/или изменения фазы происходят по существу вокруг постоянного значения фазы, предпочтительно фазы 0.
Вновь следует обратить внимание на то, что иные типы преобразования, отличные от ДПФ и ОДПФ, также возможны для используемых преобразований 72, 86 и средств 42 и 48 обратного преобразования по отношению к ним. Например, комплексный демодулированый сигнал поддиапазона может также быть преобразован и/или спектрально разложен на частотное/модуляционное частотное представление с вещественным преобразованием, отделенным согласно вещественной и мнимой части, соответственно. Вещественная часть тогда представляла бы амплитудную модуляцию сигнала поддиапазона относительно несущей, используемой для демодуляции после каскада демодуляции. Мнимая часть тогда представляла бы частотную модуляцию этой несущей. В случае ДПФ и/или ОДПФ для средства 38 и/или 42 компонент амплитудной модуляции сигнала поддиапазона отражается в симметричном компоненте спектра ДПФ на оси частоты модуляции, в то время как компонент частотной модуляции несущей соответствует асимметричному компоненту спектра ДПФ на оси частоты модуляции.
Вариант воплощения, описанный выше, является примером, иллюстрирующим относительно простой модулированный синусоидой синусоидальный сигнал. Вариант воплощения на Фиг.1 и 2, однако, является также подходящим для фильтрации огибающей из смеси амплитудно-модулированных сигналов любой частоты, таких как амплитудно-модулированные тональные сигналы. Индивидуальные частотные компоненты огибающей непосредственно представлены для соответствующей обработки в матрице 88 модуляции, в отличие от уже известного амплитудно-фазового представления согласно способам анализа модуляционного преобразования для аудиокодирования, описанного во вводной части описания. Фильтрация частотно-модулированных сигналов небольшой глубины модуляции, то есть с размахом частоты значительно меньшим, чем ширина поддиапазона первого ДПФ, является также возможной в варианте воплощения по Фиг. 1 и 2.
Рассмотренный вариант воплощения по Фиг.1 и 2, касающийся конфигурации для фильтрации модуляций, основан на адаптивном к сигналу преобразовании сигнала, фильтрации в области модуляции и соответствующем обратном преобразовании. Без манипуляции сигналом в области модуляции, вариант воплощения по Фиг. 1 обеспечивает хорошее восстановление. Вводя фильтр подходящего спектрального диапазона, такого как фильтр 102, то есть ослабления значения модуляции с увеличением расстояния от центральной частоты модуляции, равной нулю, компоненты модуляции, которые должны быть удалены, могут ослабляться в требуемой степени. Однако другие типы обработки информационных сигналов в частотном/модуляционном частотном представлении также возможны. Таким образом, может также быть желательно удалить только несущую. В этом случае фильтрация состояла бы в фильтрации верхних частот, то есть в весовой обработке с функцией взвешивания с краевым значением частоты модуляции на некоторой частоте модуляции, которая ослабляет значения модуляции на более низких частотах модуляции больше, чем на частотах модуляции выше ее. Во всех же других областях приложения и/или приложений обработка сигналов в средстве 40 обработки сигналов может состоять в полосовой фильтрации, то есть в весовой обработке с функцией взвешивания, пропускающей от некоторой центральной частоты модуляции до определенных компонентов информационного сигнала, происходящих из различных источников, то есть для реализации разделения источников. Дальнейшие приложения, в которых может использоваться вышеупомянутый вариант воплощения, могут касаться аудикодирования для кодирования аудиосигналов, реконструкции искаженных сигналов и маскирования ошибок. Вообще, однако, устройство 10 может также использоваться как эффективный музыкальный прибор для реализации специальных акустических эффектов во входящем аудиосигнале. Процедуры обработки в средстве 40 обработки сигналов могут, соответственно, предусматривать самые различные формы, такие как квантование значений модуляции, установку некоторых значений модуляции в нуль, взвешивание отдельных частей или всех значений модуляции и т.п. Дополнительной областью применения было бы использование устройства 10 по Фиг.1 как средства встраивания водяных знаков. Средство встраивания водяных знаков должно принимать аудиосигнал 14, причем средство 40 обработки может вводить полученный водяной знак в аудиосигнал, изменяя индивидуальные сегменты и/или значения модуляции согласно водяному знаку. Выбор сегментов и/или значений модуляции может быть сделан по-другому и/или изменяться во времени для последовательных матриц модуляции и должен делаться так, чтобы модификации за счет введения водяных знаков были непрослушиваемыми для человеческого уха в получаемом маркированном водяными знаками аудиосигнале 18 с помощью эффектов психоакустического маскирования.
Относительно средств преобразования, необходимо отметить, что они могут, конечно, также разрабатываться как банки фильтров, генерирующие спектральное представление посредством множества индивидуальных полосовых фильтраций. Кроме того, необходимо отметить, что результирующий информационный сигнал 18 после обработки не должен выводится в виде представления во временной области. Далее, было бы возможно вывести информационный сигнал, например, в временном/спектральном представлении или даже в спектральном/модуляционном спектральном представлении. В последнем случае, тогда, конечно, было бы необходимо гарантировать, что на стороне получателя необходимая модуляция 46 может быть вновь выполнена с подходящей несущей, например, путем обеспечения комплексных несущих, изменяющихся в поддиапазоне блока спектральных значений, которые использовались для демодуляции 84. Этим способом, вышеупомянутый вариант воплощения может использоваться для реализации способа сжатия.
В частности, должно быть отмечено, что, в зависимости от обстоятельств, схема, соответствующая изобретению, может также быть реализована в программном обеспечении. Такая реализация может быть осуществлена на цифровом носителе данных, особенно гибком диске или компакт-диске с сигналами управления, которые могут считываться электронными средствами, который может взаимодействовать с программируемой компьютерной системой для выполнения соответствующего способа. Таким образом, изобретение также состоит в компьютерной программе с кодом программы, сохраненным на машиночитаемом носителе для выполнения способа, соответствующего изобретению, когда компьютерный программный продукт выполняется на компьютере. Другими словами, изобретение может, таким образом, быть реализовано как компьютерная программа с кодом программы для выполнения способа, когда компьютерная программа выполняется на компьютере.
Изобретение относится к обработке информационных сигналов и может использоваться для обработки аудиосигналов, видеосигналов или других мультимедийных сигналов. Достигаемый технический результат - осуществление обработки информационных сигналов, которая разделена, согласно компонентам модуляции и несущей, более управляемым способом. Устройство для обработки информационного сигнала содержит средство для преобразования информационного сигнала из временной области, посредством поблочного спектрального разложения, во временное/спектральное представление, средство для преобразования информационного сигнала из временного/спектрального представления посредством поблочного спектрального разложения в спектральное/модуляционное спектральное представление, содержащее спектральное и модуляционное спектральное измерение, при этом средство для преобразования выполнено таким образом, что спектральное/модуляционное спектральное представление зависит как от компонента амплитуды, так и от компонента фазы временного/спектрального представления информационного сигнала, средство для изменения информационного сигнала для получения измененного спектрального/модуляционного спектрального представления, средство для формирования обработанного информационного сигнала, представляющего собой обработанную версию информационного сигнала, основанную на измененном спектральном/модуляционном спектральном представлении. В способе обработки информационного сигнала имеют место этапы в соответствии с функциями вышеупомянутых функциональных блоков. С помощью машиночитаемого носителя, содержащего сохраненную на нем компьютерную программу, осуществляется упомянутый способ. 3 н. и 16 з.п. ф-лы. 2 ил.
ЦИФРОВОЙ ФИЛЬТР | 1997 |
|
RU2123758C1 |
ЦИФРОВОЙ АНАЛИЗАТОР СПЕКТРА | 1994 |
|
RU2099720C1 |
Способ и приспособление для нагревания хлебопекарных камер | 1923 |
|
SU2003A1 |
US 4962510, 09.10.1990 | |||
ГОНОРОВСКИЙ Г.С | |||
Радиотехнические цепи и сигналы | |||
М.: Радио и связь, 1986, с.358-360. |
Авторы
Даты
2009-03-27—Публикация
2005-03-22—Подача