Настоящее изобретение относится к кодированию, декодированию и обработке звукового сигнала, и в частности - к эффективному синтезу синусоид и свип-синусоид (синусоид с качающейся частотой) с помощью использования спектральных шаблонов.
Обработка звукового сигнала становится все более важной. Возникают сложные проблемы, поскольку современные перцепционные звуковые кодеки должны обеспечивать удовлетворительное качество звука при все более низких скоростях передачи данных. Дополнительно, часто допустимое время ожидания также является очень низким, например, для применений двусторонней связи или распространения игр и т.д.
Современные звуковые кодеры с преобразованием с сохранением формы сигнала часто обладают улучшениями параметрического кодирования, такими как замещение шума или расширение полосы пропускания. В дополнение к этим известным параметрическим средствам может также быть желательно синтезировать синусоидальные тоны в таком декодере из параметрической дополнительной информации. Сложность вычислений всегда является важным критерием при разработке кодека, так как низкая сложность является основной для широкого одобрения и использования кодека. Поэтому, необходимы эффективные способы для генерации этих тонов.
Например, звуковые кодеки MPEG-D USAC (MPEG-D = стандарт D экспертной группы по вопросам движущихся изображений; USAC= унифицированное кодирование речи и звука) часто переключаются между прогнозирующим кодированием во временной области и кодированием в области преобразования, однако музыкальный контент все еще преобладающе кодируется в области преобразования. При низких скоростях передачи данных, например, <14 кбит/сек, тональные компоненты в музыкальных объектах часто звучат плохо, когда кодируются через кодеры с преобразованием, что делает задачу кодирования звука с достаточным качеством еще более сложной.
Дополнительно, ограничения низкой задержки в общем случае приводят к неоптимальной частотной характеристике набора фильтров кодера с преобразованием (из-за оптимизированной по отношению к низкой задержке формы окна и/или длины преобразования), и поэтому дополнительно негативно влияют на качество восприятия у таких кодеков.
Согласно классической психоакустической модели определяются предпосылки для прозрачности по отношению к искажениям квантования. При высоких скоростях передачи данных это относится к настраиваемому по восприятию оптимальному распределению времени/частоты искажений квантования, которое удовлетворяет условиям уровней маскировки человеческой аудитории. При низких скоростях передачи данных, однако, прозрачность не может быть достигнута. Поэтому при низких скоростях передачи данных может использоваться стратегия уменьшения требований к уровню маскировки.
Высококлассные кодеки уже обеспечены для музыкального контента, в частности кодеры с преобразованием, основанные на модифицированном дискретном косинусном преобразовании (MDCT), которые квантуют и передают спектральные коэффициенты в частотной области. Однако, при очень низких скоростях передачи данных только очень небольшое количество спектральных линий каждого временного кадра может кодироваться с помощью доступных битов для этого кадра. Как следствие, искажения временной модуляции и так называемые искажения «подвывания» неизбежно вводятся в кодированный сигнал.
Наиболее заметно искажения этих типов воспринимаются в квазипостоянных тональных компонентах. Это главным образом происходит, если из-за ограничений по задержке необходимо выбирать форму окна преобразования, которая создает существенные перекрестные помехи между смежными спектральными коэффициентами (расширение спектра) из-за известного эффекта утечки. Однако, тем не менее обычно только один или несколько из этих смежных спектральных коэффициентов остаются ненулевыми после «грубого» квантования с помощью кодера с низкой скоростью передачи данных.
Как указано выше, в уровне техники согласно одному подходу используются кодеры с преобразованием. Современные звуковые кодеки высокой степени сжатия, которые хорошо подходят для кодирования музыкального контента, все основываются на кодировании с преобразованием. Наиболее известными примерами являются усовершенствованное кодирование звука (AAC) MPEG2/4 и унифицированное кодирование речи и звука (USAC) MPEG-D. USAC имеет переключающееся ядро, совместимое с модулем линейного предсказания с возбуждением по алгебраической кодой книге (ACELP) плюс модуль преобразования кодированного возбуждения (TCX) (см. [5]), предназначенный главным образом для кодирования речи и, альтернативно, AAC, предназначенный главным образом для кодирования музыки. Также как AAC, TCX является способом кодирования, основанным на преобразовании. При настройках с низкой скоростью передачи данных эти схемы кодирования предрасположены к демонстрации искажений «подвывания», особенно если основные схемы кодирования основаны на модифицированном дискретном косинусном преобразовании (MDCT) (см. [1]).
Для воспроизведения музыки кодеры с преобразованием являются предпочтительной методикой сжатия звуковых данных. Однако, при низких скоростях передачи данных традиционные кодеры с преобразованием показывают сильные искажения «подвывания» и нечеткость. Большинство искажений происходит из слишком редко кодированных тональных спектральных компонент. Это случается, в частности, если они спектрально размываются с помощью неоптимальной спектральной функции преобразования (эффект утечки), которая главным образом разработана для соответствия строгим ограничениям задержки.
Согласно другому подходу в уровне техники схемы кодирования являются полностью параметрическими для переходных процессов, синусоид и шума. В частности для средних и низких скоростей передачи данных были стандартизированы полностью параметрические звуковые кодеки, самыми заметными из которых является стандарт сжатия видеосигнала MPEG 4 часть 3, подраздел 7, гармонические и отдельные линии плюс шум (HILN) (см. [2]), и стандарт сжатия видеосигнала MPEG 4 часть 3, подраздел 8, синусоидальное кодирование (SSC) (см. [3]). Параметрические кодеры, однако, страдают от неприятно искусственного звука и при увеличении скорости передачи данных не масштабируются хорошо для прозрачности для восприятия.
Дополнительный подход обеспечивает гибридное кодирование формы сигнала и параметрическое кодирование. В [4] предложен гибрид кодирования формы сигнала, основанного на преобразовании, и кодирования MPEG-4 SSC (только синусоидальная часть). В итеративном процессе синусоиды извлекаются и вычитаются из сигнала для формирования разностного сигнала, который будет кодироваться с помощью методики кодирования с преобразованием. Извлеченные синусоиды кодируются с помощью набора параметров и передаются вместе с разностным значением. В [6] обеспечивается подход гибридного кодирования, в котором синусоиды и разностные значения кодируются отдельно. В [7], в так называемом кодеке ограниченной энергии преобразования с перекрытием (CELT)/несуществующая Интернет-страница, представлена идея использовать набор осцилляторов для гибридного кодирования. Однако, генерация искусственных тонов с помощью набора осцилляторов, который работает параллельно с декодером и выход которого смешивается с выходом набора фильтров синтеза декодера во временной области, означает большую вычислительную нагрузку, так как множество осцилляторов должны вычисляться параллельно с высокой частотой дискретизации. Сложность вычислений всегда является важным критерием при разработке и использовании кодека, поэтому необходимы более эффективные способы генерации этих тонов.
При средних или более высоких скоростях передачи данных кодеры с преобразованием хорошо подходят для кодирования музыки из-за их естественного звука. Там полностью или почти полностью выполняются требованиям прозрачности основной психоакустической модели. Однако, при низких скоростях передачи данных кодеры должны серьезно нарушить требования психоакустической модели, и в таких ситуациях кодеры с преобразованием склонны к «подвыванию», нечеткости и шумовым искажениям музыки.
Хотя полностью параметрические звуковые кодеки больше всего подходят для более низких скоростей передачи данных, однако они, как известно, звучат неприятно искусственно. Кроме того, эти кодеки бесшовно не масштабируются для прозрачности для восприятия, так как постепенное усовершенствование довольно «грубой» параметрической модели невыполнимо.
Гибридное кодирование формы и параметрическое кодирование могут потенциально преодолевать ограничения отдельных подходов и могут потенциально использовать преимущество взаимно ортогональных свойств обеих методик. Однако, в существующем уровне техники этому препятствует нехватка взаимосвязи между кодированной с преобразованием частью и параметрической частью гибридного кодека. Проблемы относятся к разделению сигнала между параметрической частью и частью кодека с преобразованием, к управлению запасом битов между частью с преобразованием и параметрической частью, к методикам сигнализации параметров и к бесшовному объединению выходов параметрического кодека и кодека с преобразованием.
Дополнительно предыдущие публикации в области техники относятся к синтезу синусоидальных тонов непосредственно в области времени, или кусочных постоянных тонах в области частоты DFT [13], и к оптимизации ОСШ сокращенных шаблонов в области DFT [12]. Внедрение кусочных тонов постоянной частоты, основанное на спектрах MDCT в среде перцепционного кодека [10] или сценарий расширения полосы пропускания [11], уже описаны. Однако, эффективная генерация свип-синусоид и их бесшовная связь с дорожками в области MDCT еще, как представляется, не решена, а также не решено определение обоснованных ограничений на доступные степени свободы в области параметра.
Задачей настоящего изобретения является обеспечение улучшенных концепций для гибридного декодирования звука. Задача настоящего изобретения решается с помощью устройства согласно п. 1, устройства согласно п. 14, способа согласно п. 20, способа согласно п. 21 и компьютерной программы согласно п. 22.
Обеспечено устройство для генерации выходного звукового сигнала, основываясь на спектре кодированного звукового сигнала.
Устройство содержит блок обработки для обработки спектра кодированного звукового сигнала для получения спектра декодированного звукового сигнала, содержащего множество спектральных коэффициентов, причем каждый из спектральных коэффициентов имеет спектральное расположение в спектре кодированного звукового сигнала и спектральное значение, причем спектральные коэффициенты последовательно упорядочиваются согласно их спектральному расположению в спектре кодированного звукового сигнала так, чтобы спектральные коэффициенты сформировали последовательность спектральных коэффициентов.
Кроме того, устройство содержит средство определения псевдокоэффициентов для определения одного или большего количества псевдокоэффициентов спектра декодированного звукового сигнала, каждый из псевдокоэффициентов имеет спектральное расположение и спектральное значение.
Кроме того, устройство содержит блок замены для замены по меньшей мере одного или большего количества псевдокоэффициентов определенным спектральным шаблоном для получения измененного спектра звукового сигнала, причем определенный спектральный шаблон содержит по меньшей мере два коэффициента шаблона, причем каждый по меньшей мере из двух коэффициентов шаблона имеет спектральное значение.
Кроме того, устройство содержит блок преобразования «спектр-время» для преобразования измененного спектра звукового сигнала во временную область для обеспечения выходного звукового сигнала.
В варианте осуществления устройство кроме того может содержать блок хранения, содержащий базу данных или память, который хранит в базе данных или в памяти множество сохраненных спектральных шаблонов, причем каждый из сохраненных спектральных шаблонов имеет некоторое спектральное свойство (например, постоянную частоту, качающуюся частоту - каждое в версии расположения на элементе разрешения или между элементами разрешения - и т.д.). Блок замены может конфигурироваться для запроса из блока хранения одного из сохраненных спектральных шаблонов в качестве запрашиваемого спектрального шаблона. Блок хранения может конфигурироваться для обеспечения указанного запрашиваемого спектрального шаблона, и блок замены может конфигурироваться для замены по меньшей мере одного или большего количества псевдокоэффициентов определенным спектральным шаблоном, основываясь на запрашиваемом спектральном шаблоне.
Согласно варианту осуществления блок замены может конфигурироваться для запроса из блока хранения указанного одного из сохраненных спектральных шаблонов в зависимости от первого выведенного спектрального расположения, выведенного по меньшей мере из одного из одного или большего количества псевдокоэффициентов, определенных с помощью средства определения псевдокоэффициентов.
В одном варианте осуществления первое выведенное спектральное расположение, выведенное по меньшей мере из одного из одного или большего количества псевдокоэффициентов, может быть спектральным расположением одного из псевдокоэффициентов.
В другом варианте осуществления один или большее количество псевдокоэффициентов являются значениями со знаком, каждый содержит компоненту знака, и блок замены конфигурируется для определения первого выведенного спектрального расположения, основываясь на спектральном расположении одного псевдокоэффициента из одного или большего количества псевдокоэффициентов и основываясь на компоненте знака указанного псевдокоэффициента, так, чтобы первое выведенное спектральное расположение было равно спектральному расположению указанного псевдокоэффициента, когда компонента знака имеет первое значение знака, и так, чтобы первое выведенное спектральное расположение было равно измененному расположению, измененное расположение является результатом смещения спектрального расположения указанного псевдокоэффициента на предопределенное значение, когда компонента знака имеет отличающееся второе значение.
Например, разрешающую способность по частоте в половину элемента разрешения псевдолиний может сообщать знак указанного псевдокоэффициента. Предопределенное значение, на которое сдвигается спектральное расположение указанного псевдокоэффициента, может в таком случае соответствовать половине разницы частот, например, двух последующих элементов, например, когда рассматривают частотно-временную область, когда компонента знака псевдокоэффициента имеет второе значение знака.
Компонента знака псевдокоэффициента может содержаться в спектральном значении псевдокоэффициента.
В варианте осуществления множество сохраненных спектральных шаблонов, хранящихся в базе данных или в памяти из блока хранения, может быть или шаблонами постоянного тона, или шаблонами качающейся частоты. Средство определения псевдокоэффициентов может конфигурироваться для определения двух или большего количества последовательных по времени псевдокоэффициентов спектра декодированного звукового сигнала. Блок замены может конфигурироваться для назначения первого псевдокоэффициента и второго псевдокоэффициента из двух или большего количества последовательных по времени псевдокоэффициентов дорожке в зависимости от того, меньше или нет абсолютная разница между первым выведенным спектральным расположением, выведенным из первого псевдокоэффициента, и вторым выведенным спектральным расположением, выведенным из второго псевдокоэффициента, чем пороговое значение. И блок замены может конфигурироваться для запроса из блока хранения одного из шаблонов постоянного тона, когда первое выведенное спектральное расположение, выведенное из первого псевдокоэффициента дорожки, равно второму выведенному спектральному расположению, выведенному из второго псевдокоэффициента дорожки. Кроме того, блок замены может конфигурироваться для запроса из блока хранения одного из шаблонов качающейся частоты, когда первое выведенное спектральное расположение, выведенное из первого псевдокоэффициента дорожки, отличается от второго выведенного спектрального расположения, выведенного из второго псевдокоэффициента дорожки.
Согласно варианту осуществления блок замены может конфигурироваться для запроса из блока хранения первого шаблона качающейся частоты из шаблонов качающейся частоты, когда разница частот между вторым выведенным спектральным расположением, выведенным из второго псевдокоэффициента дорожки, и первым выведенным спектральным расположением, выведенным из первого псевдокоэффициента дорожки, равна половине предопределенного значения. Кроме того, блок замены может конфигурироваться для запроса из блока хранения второго шаблона качающейся частоты, который отличается от первого шаблона качающейся частоты, из шаблонов качающейся частоты, когда разница частот между вторым выведенным спектральным расположением, выведенным из второго псевдокоэффициента дорожки, и первым выведенным спектральным расположением, выведенным из первого псевдокоэффициента дорожки, равна предопределенному значению. Кроме того, блок замены может конфигурироваться для запроса из блока хранения третьего шаблона качающейся частоты, который отличается от первого качающегося шаблона и второго шаблона качающейся частоты из шаблонов качающейся частоты, когда разница частот между вторым выведенным спектральным расположением, выведенным из второго псевдокоэффициента дорожки, и первым выведенным спектральным расположением, выведенным из первого псевдокоэффициента дорожки, равна полутора предопределенным значениям.
Согласно варианту осуществления блок замены содержит блок адаптации шаблона, конфигурируемый для изменения запрашиваемого спектрального шаблона, обеспеченного с помощью блока хранения, для получения определенного спектрального шаблона.
В варианте осуществления блок адаптации шаблона может конфигурироваться для изменения запрашиваемого спектрального шаблона, обеспеченного с помощью блока хранения, с помощью повторного масштабирования спектральных значений коэффициентов шаблона запрашиваемого спектрального шаблона в зависимости от спектрального значения одного из одного или большего количества псевдокоэффициентов для получения определенного спектрального шаблона.
Согласно варианту осуществления блок адаптации шаблона может конфигурироваться для изменения запрашиваемого спектрального шаблона, обеспеченного с помощью блока хранения, в зависимости от начальной фазы так, чтобы спектральное значение каждого из коэффициентов шаблона запрашиваемого спектрального шаблона изменялось первым способом, когда начальная фаза имеет первое значение начальной фазы, и так, чтобы спектральное значение каждого из коэффициентов шаблона запрашиваемого спектрального шаблона изменялось отличающимся вторым способом, когда начальная фаза имеет отличающееся второе значение начальной фазы.
Согласно варианту осуществления спектральное значение каждого из коэффициентов шаблона запрашиваемого спектрального шаблона может быть комплексным коэффициентом, содержащим действительную часть и мнимую часть. В таком варианте осуществления блок адаптации шаблона может конфигурироваться для изменения запрашиваемого спектрального шаблона с помощью изменения действительной части и мнимой части каждого из коэффициентов шаблона запрашиваемого спектрального шаблона, обеспеченного с помощью блока хранения, с помощью применения множителя ej⋅ϕ комплексного поворота, причем ϕ является углом (например, угловым значением). С помощью этого для каждого из комплексных коэффициентов вектор, представляющий указанный комплексный коэффициент в комплексной плоскости, поворачивается на тот же самый угол для каждого из комплексных коэффициентов.
В варианте осуществления спектральное значение каждого из коэффициентов шаблона запрашиваемого спектрального шаблона содержит действительную часть и мнимую часть. Блок адаптации шаблона может конфигурироваться для изменения запрашиваемого спектрального шаблона, обеспеченного с помощью блока хранения, с помощью инвертирования действительной и мнимой частей спектрального значения каждого из коэффициентов шаблона запрашиваемого спектрального шаблона, или с помощью перестановки действительной части или инвертированной действительной части и мнимой части или инвертированной мнимой части спектрального значения каждого из коэффициентов шаблона запрашиваемого спектрального шаблона.
В варианте осуществления блок адаптации шаблона может конфигурироваться для изменения запрашиваемого спектрального шаблона, обеспеченного с помощью блока хранения, с помощью реализации временного зеркального отображения шаблона. Как правило, оно может получаться в частотной области с помощью вычисления комплексного сопряжения (умножения мнимой части на -1) шаблона и применения комплексной фазовой составляющей (вращения).
Согласно варианту осуществления спектр декодированного звукового сигнала представлен в области MDCT. Блок адаптации шаблона может конфигурироваться для изменения запрашиваемого спектрального шаблона, обеспеченного с помощью блока хранения, с помощью изменения спектральных значений коэффициентов шаблона запрашиваемого спектрального шаблона для получения измененного спектрального шаблона, причем спектральные значения представлены в области нечетного дискретного преобразования Фурье. Кроме того, блок адаптации шаблона может конфигурироваться для преобразования спектральных значений коэффициентов шаблона измененного спектрального шаблона из области нечетного дискретного преобразования Фурье в область MDCT для получения определенного спектрального шаблона. Кроме того, блок замены может конфигурироваться для замены по меньшей мере одного или большего количества псевдокоэффициентов определенным спектральным шаблоном, представленным в области MDCT, для получения измененного спектра звукового сигнала, представленного в области MDCT.
Альтернативно, в вариантах осуществления спектральные значения могут быть представлены в области комплексного модифицированного дискретного косинусного преобразования (CMDCT). Кроме того, в этих вариантах осуществления блок адаптации шаблона может конфигурироваться для преобразования спектральных значений коэффициентов шаблона измененного спектрального шаблона из области CMDCT в область MDCT для получения определенного спектрального шаблона с помощью простого извлечения действительной части комплексного измененного шаблона.
Кроме того, обеспечено устройство для генерации множества спектральных шаблонов. Устройство содержит генератор сигнала для генерации множества сигналов в первой области. Кроме того, устройство содержит блок преобразования сигнала для преобразования каждого сигнала из множества сигналов из первой области во вторую область для получения множества спектральных шаблонов, каждый шаблон из множества преобразованных спектральных шаблонов содержит множество коэффициентов. Кроме того, устройство содержит блок последующей обработки для сокращения преобразованных спектральных шаблонов с помощью удаления одного или большего количества коэффициентов преобразованных спектральных шаблонов для получения множества обработанных шаблонов. Кроме того, устройство содержит блок хранения, содержащий базу данных или память, причем блок хранения конфигурируется для хранения каждого обработанного шаблона из множества обработанных шаблонов в базе данных или памяти. Генератор сигнала конфигурируется для генерации каждого сигнала из множества сигналов, основываясь на формулах
причем t и τ указывают время, причем ϕ(t) является мгновенной фазой в t, и причем f(τ) является мгновенной частотой в τ, причем каждый сигнал из множества сигналов имеет начальную частоту (f0), которая является мгновенной частотой указанного сигнала в первый момент времени, и целевую частоту (f1), которая является мгновенной частотой указанного сигнала в отличающийся второй момент времени. Генератор сигнала конфигурируется для генерации первого сигнала из множества сигналов так, чтобы целевая частота первого сигнала была равна начальной частоте. Кроме того, генератор сигнала конфигурируется для генерации отличающегося второго сигнала из множества сигналов так, чтобы целевая частота первого сигнала отличалась от начальной частоты.
Согласно варианту осуществления блок преобразования сигнала может конфигурироваться для преобразования каждого сигнала из множества сигналов из первой области, которая является временной областью, во вторую область, которая является спектральной областью. Блок преобразования сигнала может конфигурироваться для генерации первого из множества блоков времени для преобразования указанного сигнала, причем каждый блок времени из множества блоков времени содержит множество взвешенных выборок, причем каждая из указанных взвешенных выборок является выборкой указанного сигнала, взвешенной с помощью веса из множества весов, причем множество весов назначается указанному блоку времени, и причем каждый вес из множества весов назначается моменту времени. Начальная частота (f0) каждого сигнала из множества сигналов может быть мгновенной частотой указанного сигнала в первый момент времени, причем первый из весов первого из блоков времени назначается первому моменту времени, причем второй из весов отличающегося второго из блоков времени назначается первому моменту времени, причем первый из блоков времени и второй из блоков времени перекрываются, и причем первый из весов равен второму из весов. Целевая частота (f1) каждого сигнала из множества сигналов может быть мгновенной частотой указанного сигнала во второй момент времени, причем третий из весов первого из блоков времени назначается второму моменту времени, причем четвертый из весов отличающегося третьего из блоков времени назначается второму моменту времени, причем первый из блоков времени и третий из блоков времени перекрываются, и причем третий из весов равен четвертому из весов.
Нужно отметить, что, например, может быть достаточно генерировать только один блок времени (например, первый из блоков времени) для генерации шаблона.
Согласно варианту осуществления каждый сигнал из множества сигналов имеет начальную фазу (ϕ0), которая является фазой указанного сигнала в первый момент времени, и целевую фазу ((ϕ1), которая является фазой указанного сигнала в отличающийся второй момент времени, причем генератор сигнала конфигурируется для генерации множество сигналов таким образом, чтобы начальная фаза (ϕ0) первого из множества сигналов была равна начальной фазе (ϕ0) отличающегося второго из множества сигналов.
Начальная фаза (и неявно с помощью выбора начальной и целевой частоты - конечная фаза) каждого сигнала из множества сигналов может корректироваться в указанные начальный и конечный моменты времени.
С помощью этого специального выбора начального и конечного моментов времени уменьшаются искажения добавления перекрытия, которые могут возникнуть, если соединяют шаблоны с различными спектральными свойствами.
В варианте осуществления блок дополнительной обработки может кроме того конфигурироваться для выполнения поворота на π/4 спектральных коэффициентов каждого из преобразованных спектральных шаблонов для получения множества повернутых спектральных шаблонов.
В другом варианте осуществления блок последующей обработки может кроме того конфигурироваться для выполнения поворота на произвольный фазовый угол спектральных коэффициентов каждого из преобразованных спектральных шаблонов для получения множества произвольно повернутых спектральных шаблонов.
Согласно дополнительному варианту осуществления генератор сигнала может конфигурироваться для генерации первого сигнала, второго сигнала и одного или большего количества дополнительных сигналов, как множества сигналов, так, чтобы каждая разница целевой частоты и начальной частоты каждого из дополнительных сигналов была целым кратным разницы целевой частоты и начальной частоты второго сигнала.
Кроме того, обеспечен способ генерации выходного звукового сигнала, основываясь на спектре кодированного звукового сигнала. Способ содержит этапы, на которых:
- Обрабатывают спектр кодированного звукового сигнала для получения спектра декодированного звукового сигнала, содержащего множество спектральных коэффициентов, причем каждый из спектральных коэффициентов имеет спектральное расположение в спектре кодированного звукового сигнала и спектральное значение, причем спектральные коэффициенты последовательно упорядочиваются согласно их спектральному расположению в спектре кодированного звукового сигнала так, чтобы спектральные коэффициенты сформировали последовательность спектральных коэффициентов.
- Определяют один или большее количество псевдокоэффициентов спектра декодированного звукового сигнала, причем каждый из псевдокоэффициентов является одним из спектральных коэффициентов.
- Заменяют по меньшей мере один или большее количество псевдокоэффициентов определенным спектральным шаблоном для получения измененного спектра звукового сигнала, причем определенный спектральный шаблон содержит по меньшей мере два коэффициента шаблона, причем каждый по меньшей мере из двух коэффициентов шаблона имеет спектральное значение. И:
- Преобразовывают измененный спектр звукового сигнала во временную область для обеспечения выходного звукового сигнала.
Кроме того, обеспечен способ генерации множества спектральных шаблонов. Данный способ содержит этапы, на которых:
- Генерируют множество сигналов в первой области.
- Преобразовывают каждый сигнал из множества сигналов из первой области во вторую область для получения множества спектральных шаблонов, каждый шаблон из множества преобразованных спектральных шаблонов содержит множество коэффициентов.
- Сокращают преобразованные спектральные шаблоны с помощью удаления одного или большего количества коэффициентов преобразованных спектральных шаблонов для получения множества обработанных шаблонов. И:
- Сохраняют каждый обработанный шаблон из множества обработанных шаблонов в базе данных или памяти.
Генерация каждого сигнала из множества сигналов осуществляется, основываясь на формулах
причем t и τ указывают время, причем ϕ(t) является мгновенной фазой в t, и причем f(τ) является мгновенной частотой в τ, и причем каждый сигнал из множества сигналов имеет начальную частоту (f0), которая является мгновенной частотой указанного сигнала в первый момент времени, и целевую частоту (f1), которая является мгновенной частотой указанного сигнала в отличающийся второй момент времени.
Генерация множества сигналов осуществляется с помощью генерации первого сигнала из множества сигналов так, чтобы целевая частота (f1) первого сигнала была равна начальной частоте (f0). Кроме того, генерация множества сигналов осуществляется с помощью генерации отличающегося второго сигнала из множества сигналов так, чтобы целевая частота (f1) первого сигнала отличалась от начальной частоты (f0).
Кроме того, обеспечена компьютерная программа для воплощения вышеописанных способов при выполнении на компьютере или процессоре обработки сигналов.
Так как современные кодеки, такие как AAC или USAC, основаны на представлении звука в области MDCT, варианты осуществления обеспечивают концепции для генерации синтетических тонов с помощью исправления шаблонов тона в спектре MDCT в декодере. Продемонстрировано, как соответствующие спектральные шаблоны могут получаться и настраиваться к их целевому расположению в (и между) сетке время/частота (в/ч) MDCT для бесшовного синтеза высококачественных синусоидальных тонов, включающих в себя свип-синусоиды.
Современные кодеки, такие как перспективное звуковое кодирование (AAC) или унифицированное кодирование речи и звука (USAC), основаны на представлении звука в области модифицированного дискретного косинусного преобразования (MDCT). Варианты осуществления генерируют синтетические тоны с помощью непосредственного исправления шаблонов тона в спектре MDCT в декодере. Только с помощью этого может быть реализовано воплощение сверхнизкой сложности.
В вариантах осуществления соответствующие шаблоны получаются и настраиваются к их целевому расположению в (и между) сетке в/ч MDCT для синтеза высококачественных синусоидальных тонов, включающих в себя свип-синусоиды.
Согласно вариантам осуществления обеспечено кодирование звука с низкой задержкой и с низкой скоростью передачи данных. Некоторые варианты осуществления основаны на новой и изобретенной концепции, названной ToneFilling (TF). Термин ToneFilling обозначает методику кодирования, при которой в ином случае плохо кодируемые естественные тоны заменяются аналогичными по восприятию, но все же чистыми синусоидальными тонами. Таким образом избегают искажений амплитудной модуляции на некоторой скорости, зависящие от спектрального положения синусоиды относительно спектрального расположения самого близкого элемента MDCT (известно как «подвывание»).
В вариантах осуществления взвешивается степень раздражения из-за всех возможных искажений. Это относится к аспектам восприятия, таким как, например, высота звука, гармоничность, модуляция, и к стационарности искажений. Все аспекты оцениваются в звуковой модели раздражения восприятия (SPAM).
Управляемый такой моделью, ToncFilling обеспечивает существенные преимущества. Ошибка в высоте звука и модуляции, которая представляется с помощью замены естественного тона чистым синусоидальным тоном, взвешивается по отношению к воздействию аддитивного шума и плохой стационарности («подвывание»), вызванными редко квантованным естественным тоном.
ToneFilling обеспечивает существенное отличие от кодеков «синусоида плюс шум». Например, TF замещает тоны синусоидами и линейными свип-синусоидами с предопределенными наклонами, вместо вычитания синусоид. Аналогичные по восприятию тоны имеют те же самые локальные центры тяжести (COG), как исходная замещаемая компонента звука. Согласно вариантам осуществления исходные тоны стираются в диапазоне звуковых частот (слева направо по функции COG). Как правило, разрешающая способность по частоте синусоиды, используемой для замещения, является настолько «грубой», насколько это возможно, для минимизации дополнительной информации, вместе с тем, в то же самое время, учитывает требования восприятия, чтобы избежать ощущения ненастроенности.
В некоторых вариантах осуществления ToneFilling может выполняться выше нижней критической частоты, из-за указанных требований восприятия, но не ниже нижней критической частоты. Выполняя ToneFilling, тоны представляются через спектральные псевдолинии в кодере с преобразованием. Однако, в кодере, оборудованном ToneFilling, псевдолинии подвергаются регулярной обработке, которой управляет классическая психоакустическая модель. Поэтому, выполняя ToneFilling, нет никакой необходимости в априорных ограничениях параметрической части (при скорости передачи данных x, y тональных компонентов заменяются). Таким образом достигается плотное интегрирование в кодек с преобразованием.
Функциональные возможности ToneFilling могут использоваться в кодере с помощью обнаружения локальных COG (сглаженных оценок; измерений качества пика) с помощью удаления тональных компонент, с помощью генерации замещенных псевдолиний (например, псевдокоэффициентов), которые несут информацию уровня через амплитуду псевдолиний, частотную информацию через спектральное положение псевдолиний и точную частотную информацию (половину смещения элемента разрешения) через знак псевдолиний. Псевдокоэффициенты (псевдолинии) обрабатываются с помощью расположенного далее средства квантования кодека точно так же, как любой обычный спектральный коэффициент (спектральная линия).
ToncFilling может кроме того использоваться в декодере с помощью обнаружения изолированных спектральных линий, причем правильные псевдокоэффициенты (псевдолинии) могут отмечаться массивом флажков (например, битовым полем). Декодер может связывать информацию псевдолинии с созданием синусоидальных дорожек. Схема «возникновение/существование/гибель» может использоваться для синтеза непрерывных дорожек.
Для декодирования псевдокоэффициенты (псевдолинии) могут отмечаться также матрицей флажка, передаваемой в дополнительной информации. О разрешающей способности по частоте, равной половине элемента псевдолиний, может сообщать знак псевдокоэффициентов (псевдолиний). В декодере псевдолинии могут стираться из спектра перед блоком обратного преобразования и синтезироваться отдельно с помощью набора осцилляторов. Через некоторое время пары осцилляторов могут связываться, и параметрическая интерполяция может использоваться для обеспечения беспрепятственного вывода выходного сигнала осциллятора.
Возникновение и завершение управляемых с помощью параметра осцилляторов могут иметь такую форму, что они близко соответствуют временным характеристикам операции вырезания кодека с преобразованием, таким образом обеспечивая бесшовный переход между частями выходного сигнала, сгенерированными с помощью кодека с преобразованием, и частями, сгенерированными с помощью генератора.
Обеспеченные концепции безупречно и легко интегрируются в существующие схемы кодирования с преобразованием, такие как AAC, TCX или подобные конфигурации. Регулирование точности квантования параметра может неявно выполняться с помощью существующего управления скоростью кодека.
В некоторых вариантах осуществления псевдолинии (псевдокоэффициенты) могут обрабатываться с помощью существующих средств квантования кодеков точно так же, как любая обычная спектральная линия; в противоположность отдельному сообщению синусоидальных параметров.
В некоторых вариантах осуществления может использоваться дополнительно измеренная начальная фаза синусоидальной дорожки, полученная из экстраполяции предыдущих спектров.
Согласно некоторым вариантам осуществления может использоваться дополнительная методика нейтрализации ступенчатости во временной области (TDAC) с помощью моделирования ступенчатости при возникновении/завершении синусоидальной дорожки.
В последующем варианты осуществления настоящего изобретения описаны более подробно со ссылкой на фигуры, на которых:
фиг. 1a показывает устройство для генерации выходного звукового сигнала, основываясь на спектре кодированного звукового сигнала согласно варианту осуществления.
фиг. 1b показывает устройство для генерации выходного звукового сигнала, основываясь на спектре кодированного звукового сигнала согласно другому варианту осуществления,
фиг. 1c показывает устройство для генерации выходного звукового сигнала, основываясь на спектре кодированного звукового сигнала согласно дополнительному варианту осуществления,
фиг. 1d показывает устройство для генерации множества спектральных шаблонов согласно варианту осуществления,
фиг. 2 изображает выравнивание параметра качающегося шаблона относительно блока времени MDCT,
фиг. 3 показывает процесс исправления шаблона тона, причем (a-b) показывают генерацию шаблона-прототипа, причем (c) показывает сокращение шаблона, причем (d) показывает настройку шаблона для целевого расположения и фазы, и причем (e-f) показывают исправление шаблона,
фиг. 4 показывает нормализованные спектральные шаблоны тона: синусоида на элементе разрешения, синусоида между элементами разрешения, свип-синусоида на элементе разрешения, свип-синусоида между элементами разрешения (с верхней к нижней панели),
фиг. 5 изображает отношение сигнал/шум (ОСШ) сокращенного шаблона тона в качестве функции от длины шаблона для синусоидального окна,
фиг. 6a показывает мгновенную частоту свип-синусоиды в моменты времени для накладывающихся блоков согласно вариантам осуществления,
фиг. 6b изображает движение вперед фазы для основных функций DCT и DCT IV согласно вариантам осуществления,
фиг. 6c показывает энергетический спектр, замещенный спектр MDCT, квантованный спектр MDCT и спектр MDCT с шаблонами согласно варианту осуществления,
фиг. 7 показывает устройство для кодирования спектра входного звукового сигнала согласно варианту осуществления,
фиг. 8 изображает спектр входного звукового сигнала, соответствующий энергетический спектр и измененный (замещенный) спектр звукового сигнала,
фиг. 9 показывает другой энергетический спектр, другой измененный (замещенный) спектр звукового сигнала и квантованный спектр звукового сигнала, причем квантованный спектр звукового сигнала, сгенерированный на стороне кодера, в некоторых вариантах осуществления может соответствовать спектру декодированного звукового сигнала, декодированному на стороне декодирования,
фиг. 10 показывает устройство для генерации выходного звукового сигнала, основываясь на спектре кодированного звукового сигнала согласно варианту осуществления,
фиг. 11 изображает устройство для генерации выходного звукового сигнала, основываясь на спектре кодированного звукового сигнала согласно другому варианту осуществления, и
фиг. 12 показывает две диаграммы, сравнивающие исходные синусоиды и синусоиды после обработки с помощью соединения MDCT/обратного MDCT.
Фиг. 7 показывает устройство для кодирования спектра входного звукового сигнала согласно варианту осуществления. Устройство для кодирования содержит средство 410 определения экстремумов, блок 420 изменения спектра, блок 430 обработки и генератор 440 дополнительной информации.
Перед более подробным рассмотрением устройства на фиг. 7, более подробно рассматривается спектр входного звукового сигнала, который кодируется с помощью устройства на фиг. 7.
В принципе любой вид спектра звукового сигнала может кодироваться с помощью устройства на фиг. 7. Спектр входного звукового сигнала может, например, быть спектром MDCT (измененного дискретного косинусного преобразования), спектром амплитуды DFT (дискретного преобразования Фурье) или спектром MDST (измененного дискретного синусного преобразования).
Фиг. 8 показывает пример спектра 510 входного звукового сигнала. На фиг. 8 спектр 510 входного звукового сигнала является спектром MDCT.
Спектр входного звукового сигнала содержит множество спектральных коэффициентов. Каждый из спектральных коэффициентов имеет спектральное расположение в спектре входного звукового сигнала и спектральное значение.
Рассматривая пример на фиг. 8, где спектр входного звукового сигнала является результатом преобразования MDCT звукового сигнала, например, набор фильтров, который преобразовывает звуковой сигнал для получения спектра входного звукового сигнала, может, например, использовать 1024 канала. В этом случае каждый из спектральных коэффициентов сопоставляется с одним из этих 1024 каналов, и номер канала (например, число между 0 и 1023) может рассматриваться в качестве спектрального расположения указанных спектральных коэффициентов. На фиг. 8 абсцисса 511 относится к спектральному расположению спектральных коэффициентов. Для лучшей иллюстрации на фиг. 8 показываются только коэффициенты со спектральными расположениями между 52 и 148.
На фиг. 8 ордината 512 помогает определить спектральное значение спектральных коэффициентов. В примере на фиг. 8, которая изображает спектр MDCT, в данном случае - спектральные значения спектральных коэффициентов спектра входного звукового сигнала, абсцисса 512 относится к спектральным значениям спектральных коэффициентов. Нужно отметить, что спектральные коэффициенты спектра входного звукового сигнала MDCT могут иметь в качестве спектральных значений положительные, а так же отрицательные действительные числа.
Другие спектры входного звукового сигнала, однако, могут иметь только спектральные коэффициенты со спектральными значениями, которые являются положительными или нулевыми. Например, спектр входного звукового сигнала может быть спектром величины DFT, со спектральными коэффициентами, имеющими спектральные значения, которые представляют величины коэффициентов, которые являются результатом дискретного преобразования Фурье. Эти спектральные значения могут быть только положительными или нулевыми.
В дополнительных вариантах осуществления спектр входного звукового сигнала содержит спектральные коэффициенты со спектральными значениями, которые являются комплексными числами. Например, спектр DFT, указывающий величину и информацию фазы, может содержать спектральные коэффициенты, имеющие спектральные значения, которые являются комплексными числами.
Как примерно показано на фиг. 8, спектральные коэффициенты последовательно упорядочиваются согласно их спектральному расположению в спектре входного звукового сигнала так, чтобы спектральные коэффициенты сформировали последовательность спектральных коэффициентов. Каждый из спектральных коэффициентов имеет по меньшей мере один из одного или большего количества предыдущих элементов и из одного или большего количества последующих элементов, причем каждый предыдущий элемент указанного спектрального коэффициента является одним из спектральных коэффициентов, которые предшествуют указанному спектральному коэффициенту в последовательности. Каждый последующий элемент указанного спектрального коэффициента является одним из спектральных коэффициентов, которые следуют за указанным спектральным коэффициентом в последовательности. Например, на фиг. 8 спектральные коэффициенты, имеющие спектральное расположение 81, 82 или 83 (и так далее), являются последующими элементами для спектрального коэффициента со спектральным расположением 80. Спектральные коэффициенты, имеющие спектральное расположение 79, 78 или 77 (и так далее), являются предыдущими элементами для спектрального коэффициента со спектральным расположением 80. Для примера спектра MDCT спектральное расположение спектрального коэффициента может быть каналом преобразования MDCT, к которому относится спектральный коэффициент (например, номером канала между, например, 0 и 1023). Снова нужно отметить, что в иллюстративных целях спектр 510 MDCT на фиг. 8 показывает только спектральные коэффициенты со спектральными расположениями между 52 и 148.
Возвращаясь к фиг. 7, средство 410 определения экстремумов теперь описывается более подробно. Средство 410 определения экстремумов конфигурируется для определения одного или большего количества коэффициентов экстремума.
В общем случае средство 410 определения экстремумов исследует спектры входного звукового сигнала или спектр, который относится к спектру входного звукового сигнала, для определения коэффициентов экстремума. Целью определения коэффициентов экстремума является то, что в дальнейшем одна или большее количество локальных тональных областей должны заменяться в спектре звукового сигнала псевдокоэффициентами, например, одним псевдокоэффициентом для каждой тональной области.
В общем случае пиковые области в энергетическом спектре звукового сигнала, с которыми соотносится спектр входного звукового сигнала, указывают тональные области. Поэтому можно предпочтительно идентифицировать пиковые области в энергетическом спектре звукового сигнала, с которыми соотносится спектр входного звукового сигнала. Средство 410 определения экстремумов может, например, исследовать энергетический спектр, содержащий коэффициенты, которые могут упоминаться как сравнительные коэффициенты (поскольку их спектральные значения попарно сравниваются с помощью средства определения экстремума), так, чтобы у каждого из спектральных коэффициентов спектра входного звукового сигнала было сравнительное значение, связанное с ним.
На фиг. 8 показывается энергетический спектр 520. Энергетический спектр 520 и спектр 510 MDCT входного звукового сигнала относится к тому же самому звуковому сигналу. Энергетический спектр 520 содержит коэффициенты, называемые сравнительными коэффициентами. Каждый спектральный коэффициент содержит спектральное расположение, которое относится к абсциссе 521, и сравнительное значение. Каждый спектральный коэффициент спектра входного звукового сигнала имеет сравнительный коэффициент, сопоставленный с ним, и таким образом, кроме того, он имеет сравнительное значение его сравнительного коэффициента, сопоставленное с ним. Например, сравнительное значение, сопоставленное со спектральным значением спектра входного звукового сигнала, может быть сравнительным значением сравнительного коэффициента с тем же самым спектральным положением, как рассматриваемый спектральный коэффициент спектра входного звукового сигнала. Зависимость между тремя спектральными коэффициентами спектра 510 входного звукового сигнала и тремя сравнительными коэффициентами (и таким образом зависимость со сравнительными значениями этих сравнительных коэффициентов) энергетического спектра 520 обозначена пунктирными линиями 513, 514, 515, указывающими зависимости соответствующих сравнительных коэффициентов (или их сравнительных значений) и соответствующих спектральных коэффициентов спектра 510 входного звукового сигнала.
Средство 410 определения экстремумов может конфигурироваться для определения одного или большего количества коэффициентов экстремума так, чтобы каждый из коэффициентов экстремума был одним из спектральных коэффициентов, сравнительное значение которых больше, чем сравнительное значение одного из предыдущих по отношению к нему элементов, и сравнительное значение которого больше, чем сравнительное значение одного из последующих по отношению к нему элементов.
Например, средство 410 определения экстремумов может определять значения локальных максимумов энергетического спектра. Другими словами, средство 410 определения экстремумов может конфигурироваться для определения одного или большего количества коэффициентов экстремума так, чтобы каждый из коэффициентов экстремума был одним из спектральных коэффициентов, сравнительное значение которых больше, чем сравнительное значение непосредственно предыдущего по отношению к нему элемента, и сравнительное значение которого больше, чем сравнительное значение непосредственно последующего по отношению к нему элемента. В данном случае непосредственно предыдущим элементом спектрального коэффициента является тот из спектральных коэффициентов, который непосредственно предшествует указанному спектральному коэффициенту в энергетическом спектре. Непосредственно последующим элементом указанного спектрального коэффициента является тот из спектральных коэффициентов, который непосредственно следует за указанным спектральным коэффициентом в энергетическом спектре.
Однако, другие варианты осуществления не требуют, чтобы средство 410 определения экстремумов определяло все локальные максимумы. Например, в некоторых вариантах осуществления средство определения экстремума может исследовать только некоторые части энергетического спектра, например, относящиеся только к некоторому частотному диапазону.
В других вариантах осуществления средство 410 определения экстремумов конфигурируется только для тех коэффициентов, как коэффициенты экстремума, где разница между сравнительным значением рассматриваемого локального максимума и сравнительным значением последующего локального минимума и/или предшествующего локального минимума больше, чем пороговое значение.
Средство 410 определения экстремумов может определять экстремум или экстремумы в сравнительном спектре, причем сравнительное значение коэффициента сравнительного спектра назначается каждому из коэффициентов MDCT спектра MDCT. Однако, сравнительный спектр может иметь более высокую спектральную разрешающую способность, чем спектр входного звукового сигнала. Например, сравнительный спектр может быть спектром DFT, имеющим в два раза большую спектральную разрешающую способность, чем спектр входного звукового сигнала MDCT. С помощью этого только каждое второе спектральное значение спектра DFT в таком случае назначается спектральному значению спектра MDCT. Однако могут учитываться другие коэффициенты сравнительного спектра, когда определяется экстремум или экстремумы сравнительного спектра. С помощью этого коэффициент сравнительного спектра может определяться как экстремум, который не назначен спектральному коэффициенту спектра входного звукового сигнала, но который имеет непосредственно предыдущий элемент и непосредственно последующий элемент, которые назначены спектральному коэффициенту спектра входного звукового сигнала и непосредственно последующему элементу для этого спектрального коэффициента спектра входного звукового сигнала, соответственно. Таким образом, можно полагать, что указанный экстремум сравнительного спектра (например, спектра DFT с высокой разрешающей способностью) назначается спектральному расположению в (MDCT) спектра входного звукового сигнала, который расположен между указанным спектральным коэффициентом (MDCT) спектра входного звукового сигнала и указанным непосредственно последующим элементом для указанного спектрального коэффициента (MDCT) спектра входного звукового сигнала. Такая ситуация может кодироваться с помощью выбора соответствующего значения знака псевдокоэффициента, как объяснено позже. С помощью этого достигается разрешающая способность ниже элемента разрешения.
Нужно отметить, что в некоторых вариантах осуществления коэффициент экстремума не должен соответствовать требованию, чтобы его сравнительное значение было больше, чем сравнительное значение непосредственно предыдущего по отношению к нему элемента и сравнительное значение непосредственно последующего по отношению к нему элемента. Вместо этого в этих вариантах осуществления может быть достаточно, чтобы сравнительное значение коэффициента экстремума было больше, чем один из предыдущих по отношению к нему элементов и один из последующих по отношению к нему элементов. Рассматривают, например, ситуацию, в которой:
В ситуации, описанной в таблице 1, средство 410 определения экстремумов может обоснованно рассматривать спектральный коэффициент в спектральном расположении 214 как коэффициент экстремума. Сравнительное значение спектрального коэффициента 214 не больше, чем значение непосредственно предыдущего по отношению к нему элемента 213 (0,83<0,84), и не больше, чем значение непосредственно последующего по отношению к нему элемента 215 (0,83<0,85), но оно значительно больше, чем сравнительное значение другого из предыдущего по отношению к нему элемента, предыдущего элемента 212 (0,83>0,02), и оно значительно больше, чем сравнительное значение другого из последующих по отношению к нему элементов, последующего элемента 216 (0,83>0,01). Кажется кроме того обоснованным рассматривать спектральный коэффициент 214 как экстремум этой «пиковой области», поскольку спектральный коэффициент расположен в середине этих трех коэффициентов 213, 214, 215, которые имеют относительно большие сравнительные значения по сравнению со сравнительными значениями коэффициентов 212 и 216.
Например, средство 410 определения экстремумов может конфигурироваться для определения формы некоторых или всех сравнительных коэффициентов с помощью сравнения, больше или нет сравнительное значение указанного сравнительного коэффициента, чем по меньшей мере одно из сравнительных значений этих трех предыдущих элементов, являющихся самыми близкими к спектральному расположению указанного сравнительного коэффициента. И/или средство 410 определения экстремумов может конфигурироваться для определения формы некоторых или всех коэффициентов с помощью сравнения, больше или нет сравнительное значение указанного сравнительного коэффициента, чем по меньшей мере одно из сравнительных значений этих трех последующих элементов, являющихся самыми близкими к спектральному расположению указанного сравнительного коэффициента. Средство 410 определения экстремумов может затем принимать решение, выбрать или нет указанный сравнительный коэффициент, в зависимости от результата указанных определений.
В некоторых вариантах осуществления сравнительным значением каждого спектрального коэффициента является значением квадрата дополнительного коэффициента дополнительного спектра (сравнительного спектра), являющегося результатом сохраняющего энергию преобразования звукового сигнала.
В дополнительных вариантах осуществления сравнительное значение каждого спектрального коэффициента является значением амплитуды дополнительного коэффициента дополнительного спектра, являющимся результатом сохраняющего энергию преобразования звукового сигнала.
Согласно варианту осуществления дополнительным спектром является спектр дискретного преобразования Фурье, и причем сохраняющим энергию преобразованием является дискретное преобразование Фурье.
Согласно дополнительному варианту осуществления дополнительным спектром является спектр комплексного модифицированного дискретного косинусного преобразования (CMDCT), и причем сохраняющим энергию преобразованием является CMDCT.
В другом варианте осуществления средство 410 определения экстремумов может не исследовать сравнительный спектр, но вместо этого может исследовать сам спектр входного звукового сигнала. Это может, например, быть обосновано, когда сам спектр входного звукового сигнала является результатом сохраняющего энергию преобразования, например, когда спектр входного звукового сигнала является спектром абсолютной величины дискретного преобразования Фурье.
Например, средство 410 определения экстремумов может конфигурироваться для определения одного или большего количества коэффициентов экстремума так, чтобы каждый из коэффициентов экстремума был одним из спектральных коэффициентов, спектральное значение которых больше, чем спектральное значение одного из предыдущих по отношению к нему элементов, и спектральное значение которого больше, чем спектральное значение одного из последующих по отношению к нему элементов.
В варианте осуществления средство 410 определения экстремумов может конфигурироваться для определения одного или большего количества коэффициентов экстремума так, чтобы каждый из коэффициентов экстремума был одним из спектральных коэффициентов, спектральное значение которых больше, чем спектральное значение непосредственно предыдущего по отношению к нему элемента, и спектральное значение которого больше, чем спектральное значение непосредственно последующего по отношению к нему элемента.
Кроме того, устройство содержит средство 420 изменения спектра для изменения спектра входного звукового сигнала для получения измененного спектра звукового сигнала с помощью установки спектрального значения предыдущего элемента или последующего элемента по меньшей мере для одного из коэффициентов экстремума в предопределенное значение. Средство 420 изменения спектра конфигурируется не для установки спектральных значений одного или большего количества коэффициентов экстремума в предопределенное значение, или конфигурируется для замены по меньшей мере одного из одного или большего количества коэффициентов экстремума псевдокоэффициентом, причем спектральное значение псевдокоэффициента отличается от предопределенного значения.
Предпочтительно, предопределенное значение может быть нулем. Например, в измененном (замещенном) спектре 530 звукового сигнала на фиг. 8 спектральные значения большого количества спектральных коэффициентов были установлены в нуль с помощью средства 420 изменения спектра.
Другими словами, для получения измененного спектра звукового сигнала средство 420 изменения спектра устанавливает по меньшей мере спектральное значение предыдущего элемента или последующего элемента для одного из коэффициентов экстремума в предопределенное значение. Предопределенное значение может, например, быть нулем. Сравнительное значение такого предыдущего элемента или последующего элемента меньше, чем сравнительное значение указанного значения экстремума.
Кроме того, по отношению к самим коэффициентам экстремума средство 420 изменения спектра продолжает выполнение следующим образом:
- средство 420 изменения спектра не будет устанавливать коэффициенты экстремума в предопределенное значение, или:
- средство 420 изменения спектра заменит по меньшей мере один из коэффициентов экстремума псевдокоэффициентом, причем спектральное значение псевдокоэффициента отличается от предопределенного значения. Это подразумевает, что спектральное значение по меньшей мере одного из коэффициентов экстремума устанавливается в предопределенное значение, и спектральное значение другого из спектральных коэффициентов устанавливается в значение, которое отличается от предопределенного значения. Такое значение может, например, получаться из спектрального значения указанного коэффициента экстремума, из одного из предыдущих элементов для указанного коэффициента экстремума или одного из последующих элементов для указанного коэффициента экстремума. Или такое значение может, например, получаться из сравнительного значения указанного коэффициента экстремума, одного из предыдущих элементов для указанного коэффициента экстремума или одного из последующих элементов для указанного коэффициента экстремума.
Средство 420 изменения спектра может, например, конфигурироваться для замены одного из коэффициентов экстремума псевдокоэффициентом с помощью получения спектрального значения из спектрального значения или сравнительного значения указанного коэффициента экстремума, из спектрального значения или сравнительного значения одного из предыдущих элементов для указанного коэффициента экстремума или из спектрального значения или сравнительного значения одного из последующих элементов для указанного коэффициента экстремума.
Кроме того, устройство содержит блок 430 обработки для обработки измененного спектра звукового сигнала для получения спектра кодированного звукового сигнала.
Например, блок 430 обработки может быть звуковым кодером любого вида, например, звуковым кодером MP3 (уровня III сжатия звука MPEG-1 или уровня III сжатия звука MPEG-2; MPEG= экспертная группа по вопросам движущихся изображений), звуковым кодером для WMA (звукового файла для Windows), звуковым кодером для файлов «wave» или звуковым кодером MPEG-2/4 AAC (перспективного звукового кодирования) или кодером MPEG-D USAC (унифицированного кодирования речи и звука).
Блок 430 обработки может, например, быть звуковым кодером, который описан в [8] (ISO/IEC 14496-3:2005-Information technology-Coding of audio-visual objects-Part 3:Audio, Subpart 4) или который описан в [9] (ISO/IEC 14496-32005-Information technology-Coding of audio-visual objects-Part 3: Audio, Subpart 4). Например, блок 430 обработки может содержать средство квантования и/или средство формирования временного шума, которое, например, описано в [8], и/или блок 430 обработки может содержать средство замещения воспринимаемого шума, которое, например, описано в [8].
Кроме того, устройство содержит генератор 440 дополнительной информации для генерации и передачи дополнительной информации. Генератор 440 дополнительной информации конфигурируется для нахождения одного или большего количества псевдокоэффициентов-кандидатов в измененном спектре входного звукового сигнала, сгенерированного с помощью средства 420 изменения спектра. Кроме того, генератор 440 дополнительной информации конфигурируется для выбора по меньшей мере одного из псевдокоэффициентов-кандидатов в качестве выбранных кандидатов. Кроме того, генератор 440 дополнительной информации конфигурируется для генерации дополнительной информации так, чтобы дополнительная информация указывала выбранные кандидаты, как псевдокоэффициенты.
В варианте осуществления, показанном на фиг. 7, генератор 440 дополнительной информации конфигурируется для приема положений псевдокоэффициентов (например, положений каждого из псевдокоэффициентов) с помощью средства 420 изменения спектра. Кроме того, в варианте осуществления на фиг. 7 генератор 440 дополнительной информации конфигурируется для приема положений псевдокоэффициентов-кандидатов (например, положений каждого из псевдокоэффициентов-кандидатов).
Например, в некоторых вариантах осуществления блок 430 обработки может конфигурироваться для определения псевдокоэффициентов-кандидатов, основываясь на квантованном спектре звукового сигнала. В варианте осуществления блок 430 обработки, возможно, сгенерировал квантованный спектр звукового сигнала с помощью квантования измененного спектра звукового сигнала. Например, блок 430 обработки может определять по меньшей мере один спектральный коэффициент квантованного спектра звукового сигнала как псевдокоэффициент-кандидат, который имеет непосредственно предыдущий элемент, спектральное значение которого равно предопределенному значению (например, равному 0), и который имеет непосредственно последующий элемент, спектральное значение которого равно предопределенному значению.
Альтернативно, в других вариантах осуществления блок 430 обработки может передавать квантованный спектр звукового сигнала к генератору 440 дополнительной информации, и генератор 440 дополнительной информации может самостоятельно определять псевдокоэффициенты-кандидаты, основываясь на квантованном спектре звукового сигнала. Согласно другим вариантам осуществления псевдокоэффициенты-кандидаты определяются альтернативным способом, основываясь на измененном спектре звукового сигнала.
Дополнительная информация, сгенерированная с помощью генератора дополнительной информации, может иметь фиксированный предопределенный размер, или ее размер может итерационно оцениваться зависящим от сигнала способом. В этом случае фактический размер дополнительной информации также передается к декодеру. Так, согласно варианту осуществления генератор 440 дополнительной информации конфигурируется для передачи размера дополнительной информации.
Согласно варианту осуществления средство 410 определения экстремумов конфигурируется для исследования сравнительных коэффициентов, например, коэффициентов энергетического спектра 520 на фиг. 8, и конфигурируется для определения одного или большего количества минимальных коэффициентов так, чтобы каждый из минимальных коэффициентов был одним из спектральных коэффициентов, сравнительное значение которых меньше, чем сравнительное значение одного из предыдущих по отношению к нему элементов, и сравнительное значение которого меньше, чем сравнительное значение одного из последующих по отношению к нему элементов. В таком варианте осуществления средство 420 изменения спектра может конфигурироваться для определения значения представления, основываясь на сравнительных значениях одного или большего количества коэффициентов экстремума и одного или большего количества минимальных коэффициентов, так, чтобы значение представления отличалось от предопределенного значения. Кроме того, средство 420 изменения спектра может конфигурироваться для изменения спектрального значения одного из коэффициентов спектра входного звукового сигнала с помощью установки указанного спектрального значения в значение представления.
В конкретном варианте осуществления средство определения экстремума конфигурируется для исследования сравнительных коэффициентов, например, коэффициентов энергетического спектра 520 на фиг. 8, и конфигурируется для определения одного или большего количества минимальных коэффициентов так, чтобы каждый из минимальных коэффициентов был одним из спектральных коэффициентов, сравнительное значение которых меньше, чем сравнительное значение непосредственно предыдущего по отношению к нему элемента, и сравнительное значение которого меньше, чем сравнительное значение непосредственно последующего по отношению к нему элемента.
Альтернативно, средство 410 определения экстремумов конфигурируется для исследования самого спектра 510 входного звукового сигнала и конфигурируется для определения одного или большего количества минимальных коэффициентов так, чтобы каждый из одного или большего количества минимальных коэффициентов был одним из спектральных коэффициентов, спектральное значение которых меньше, чем спектральное значение одного из предыдущих по отношению к нему элементов, и спектральное значение которого меньше, чем спектральное значение одного из последующих по отношению к нему элементов. В таком варианте осуществления средство 420 изменения спектра может конфигурироваться для определения значения представления, основываясь на спектральных значениях одного или большего количества коэффициентов экстремума и одного или большего количества минимальных коэффициентов, так, чтобы значение представления отличалось от предопределенного значения. Кроме того, средство 420 изменения спектра может конфигурироваться для изменения спектрального значения одного из коэффициентов спектра входного звукового сигнала с помощью установки указанного спектрального значения в значение представления.
В конкретном варианте осуществления средство 410 определения экстремумов конфигурируется для исследования самого спектра 510 входного звукового сигнала и конфигурируется для определения одного или большего количества минимальных коэффициентов так, чтобы каждый из одного или большего количества минимальных коэффициентов был одним из спектральных коэффициентов, спектральное значение которых меньше, чем спектральное значение непосредственно предыдущего по отношению к нему элемента, и спектральное значение которого меньше, чем спектральное значение непосредственно последующего по отношению к нему элемента.
В обоих вариантах осуществления средство 420 изменения спектра учитывает коэффициент экстремума и один или большее количество минимальных коэффициентов, в частности, сопоставленные с ними сравнительные значения или их спектральные значения, для определения значения представления. Затем спектральное значение одного из спектральных коэффициентов спектра входного звукового сигнала устанавливается в значение представления. В результате спектральный коэффициент, спектральное значение которого установлено в значение представления, может, например, быть самим коэффициентом экстремума, или спектральный коэффициент, спектральное значение которого установлено в значение представления, может быть псевдокоэффициентом, который заменяет коэффициент экстремума.
В варианте осуществления средство 410 определения экстремумов может конфигурироваться для определения одной или большего количества субпоследовательностей последовательности спектральных значений так, чтобы каждая из субпоследовательностей содержала множество последующих спектральных коэффициентов спектра входного звукового сигнала. Последующие спектральные коэффициенты последовательно упорядочиваются в пределах субпоследовательности согласно их спектральному положению. Каждая из субпоследовательностей имеет первый элемент, находящийся первым в указанной последовательно упорядоченной субпоследовательности, и последний элемент, являющий последним в указанной последовательно упорядоченной субпоследовательности.
В конкретном варианте осуществления каждая из субпоследовательностей может, например, содержать точно два минимальных коэффициента и точно один коэффициент экстремума, один из минимальных коэффициентов является первым элементом субпоследовательности, другой из минимальных коэффициентов является последним элементом субпоследовательности.
В варианте осуществления средство 420 изменения спектра может конфигурироваться для определения значения представления, основываясь на спектральных значениях или сравнительных значениях коэффициентов одной из субпоследовательностей. Например, если средство 410 определения экстремумов исследует сравнительные коэффициенты сравнительного спектра, например, энергетического спектра 520, то средство 420 изменения спектра может конфигурироваться для определения значения представления, основываясь на сравнительных значениях коэффициентов одной из субпоследовательностей. Если, однако, средство 410 определения экстремумов исследует спектральные коэффициенты спектра 510 входного звукового сигнала, то средство 420 изменения спектра может конфигурироваться для определения значения представления, основываясь на спектральных значениях коэффициентов одной из субпоследовательностей.
Средство 420 изменения спектра конфигурируется для изменения спектрального значения одного из коэффициентов указанной субпоследовательности с помощью установки указанного спектрального значения в значение представления.
Таблица 2 обеспечивает пример с пятью спектральными коэффициентами в спектральных расположениях 252-258.
значение
Средство 410 определения экстремумов может определять, что спектральный коэффициент 255 (спектральный коэффициент со спектральным расположением 255) является коэффициентом экстремума, поскольку его сравнительное значение (0,73) больше, чем сравнительное значение (0,48) (в данном случае: непосредственно) предыдущего по отношению к нему элемента 254, и поскольку его сравнительное значение (0,73) больше, чем сравнительное значение (0,45) (в данном случае: непосредственно) последующего по отношению к нему элемента 256.
Кроме того, средство 410 определения экстремумов может определять, что спектральный коэффициент 253 является минимальным коэффициентом, поскольку его сравнительное значение (0,05) меньше, чем сравнительное значение (0,12) (в данном случае: непосредственно) предыдущего по отношению к нему элемента 252, и поскольку его сравнительное значение (0,05) меньше, чем сравнительное значение (0,48) (в данном случае: непосредственно) последующего по отношению к нему элемента 254.
Кроме того, средство 410 определения экстремумов может определять, что спектральный коэффициент 257 является минимальным коэффициентом, поскольку его сравнительное значение (0,03) меньше, чем сравнительное значение (0,45) (в данном случае: непосредственно) предыдущего по отношению к нему элемента 256 и поскольку его сравнительное значение (0,03) меньше, чем сравнительное значение (0,18) (в данном случае: непосредственно) последующего по отношению к нему элемента 258.
Средство 410 определения экстремумов может таким образом определять субпоследовательность, содержащую спектральные коэффициенты 253-257 с помощью определения, что спектральный коэффициент 255 является коэффициентом экстремума, с помощью определения спектрального коэффициента 253 в качестве минимального коэффициента, являющегося самым близким предыдущим минимальным коэффициентом к коэффициенту 255 экстремума, и с помощью определения спектрального коэффициента 257 в качестве минимального коэффициента, являющегося самым близким последующим минимальным коэффициентом к коэффициенту 255 экстремума.
Средство 420 изменения спектра может теперь определять значение представления для субпоследовательности 253-257, основываясь на сравнительных значениях всех спектральных коэффициентов 253-257.
Например, средство 420 изменения спектра может конфигурироваться для суммирования сравнительных значений всех спектральных коэффициентов субпоследовательности. (Например, для таблицы 2 значение представления для субпоследовательности 253-257 в таком случае суммируется как: 0,05+0,48+0,73+0,45+0,03=1,74).
Или, например, средство 420 изменения спектра может конфигурироваться для суммирования квадратов сравнительных значений всех спектральных коэффициентов субпоследовательности. (Например, для таблицы 2, значение представления для субпоследовательности 253-257 в таком случае суммируется как: (0,05)2+(0,48)2+(0,73)2+(0,45)2+(0,03)2=0,9692).
Или, например, средство 420 изменения спектра может конфигурироваться для вычисления квадратного корня от суммы квадратов сравнительных значений всех спектральных коэффициентов 253-257 субпоследовательности. (Например, для таблицы 2 значение представления в таком случае равно 0,98448).
Согласно некоторым вариантам осуществления средство 420 изменения спектра устанавливает спектральное значение коэффициента экстремума (в таблице 2 спектральное значение спектрального коэффициента 253) в предопределенное значение.
Другие варианты осуществления, однако, используют подход центра тяжести. Таблица 3 показывает субпоследовательность, содержащую спектральные коэффициенты 282-288:
расположения
Хотя коэффициент экстремума расположен в спектральном расположении 285, согласно подходу центра тяжести центр тяжести расположен в отличающемся спектральном расположении.
Для определения спектрального расположения центра тяжести средство 410 определения экстремумов суммирует взвешенные спектральные расположения всех спектральных коэффициентов субпоследовательности и делит результат на сумму сравнительных значений спектральных коэффициентов субпоследовательности. Стандартное округление результата деления может затем использоваться для определения центра тяжести. Взвешенное спектральное расположение спектрального коэффициента является произведением его спектрального расположения и его сравнительного значения.
Вкратце: средство определения экстремума может получать центр тяжести с помощью:
1) Определения произведения сравнительного значения и спектрального расположения для каждого спектрального коэффициента субпоследовательности.
2) Суммирования данных произведений, определенных в 1), для получения первой суммы.
3) Суммирования сравнительных значений всех спектральных коэффициентов субпоследовательности для получения второй суммы.
4) Деления первой суммы на вторую сумму для генерации промежуточного результата; и
5) Применения округления до ближайшего значения промежуточного результата для получения центра тяжести (округление до ближайшего значения: 8,49 округляется до 8; 8,5 округляется до 9).
Таким образом, для примера таблицы 3, центр тяжести получается с помощью:
Таким образом, в примере таблицы 3 средство 410 определения экстремумов конфигурируется для определения спектрального расположения 286 в качестве центра тяжести.
В некоторых вариантах осуществления средство 410 определения экстремумов не исследует полный сравнительный спектр (например, энергетический спектр 520) или не исследует полный спектр входного звукового сигнала. Вместо этого средство 410 определения экстремумов может только частично исследовать сравнительный спектр или спектр входного звукового сигнала.
Фиг. 9 показывает такой пример. Там энергетический спектр 620 (как сравнительный спектр) был исследован с помощью средства 410 определения экстремумов, начиная с коэффициента 55. Коэффициенты в спектральных расположениях, меньших чем 55, не были исследованы. Поэтому, спектральные коэффициенты в спектральных расположениях, меньших, чем 55, остаются неизмененными в замещенном спектре 630 MDCT. В отличие от этого фиг. 8 показывает замещенный спектр 530 MDCT, где все спектральные линии MDCT были изменены с помощью средства 420 изменения спектра.
Таким образом, средство 420 изменения спектра может конфигурироваться для изменения спектра входного звукового сигнала так, чтобы спектральные значения по меньшей мере некоторых из спектральных коэффициентов спектра входного звукового сигнала оставались неизмененными.
В некоторых вариантах осуществления средство 420 изменения спектра конфигурируется для определения, меньше или нет разница значений между одним из сравнительных значений или спектральным значением одного из коэффициентов экстремума, чем пороговое значение. В таких вариантах осуществления средство 420 изменения спектра конфигурируется для изменения спектра входного звукового сигнала так, чтобы спектральные значения по меньшей мере некоторых из спектральных коэффициентов спектра входного звукового сигнала оставались неизмененными в измененном спектре звукового сигнала в зависимости от того, меньше или нет разница значений, чем пороговое значение.
Например, в варианте осуществления средство 420 изменения спектра может конфигурироваться для изменения или замены не всех, но вместо этого для изменения или замены только некоторых из коэффициентов экстремума. Например, когда разница между сравнительным значением коэффициента экстремума (например, локальным максимумом) и сравнительным значением последующего и/или предыдущего минимального значения меньше, чем пороговое значения, средство изменения спектра может настраиваться не изменять эти спектральные значения (и, например, спектральные значения спектральных коэффициентов между ними), но вместо этого оставлять эти спектральные значения неизмененными в измененном (замещенном) спектре 630 MDCT. В измененном спектре 630 MDCT на фиг. 9 спектральные значения спектральных коэффициентов 100-112 и спектральные значения спектральных коэффициентов 124-136 оставлены неизмененными с помощью средства изменения спектра в неизмененном (замещенном) спектре 630.
Блок обработки может кроме того конфигурироваться для квантования коэффициентов измененного (замещенного) спектра 630 MDCT для получения квантованного спектра 635 MDCT.
Согласно варианту осуществления средство 420 изменения спектра может конфигурироваться для приема информации точной настройки. Спектральные значения спектральных коэффициентов спектра входного звукового сигнала могут быть значениями со знаком, каждый содержит компоненту знака. Средство изменения спектра может конфигурироваться для установки компоненты знака одного из одного или большего количества коэффициентов экстремума или псевдокоэффициента в первое значение знака, когда информация точной настройки находится в первом состоянии точной настройки. И средство изменения спектра может конфигурироваться для установки компонента знака спектрального значения одного из одного или большего количества коэффициентов экстремума или псевдокоэффициента в отличающееся второе значение знака, когда информация точной настройки находится в отличающемся втором состоянии точной настройки.
точной настройки
Например, в таблице 4 спектральные значения спектральных коэффициентов указывают, что спектральный коэффициент 291 находится в первом состоянии точной настройки, спектральный коэффициент 301 находится во втором состоянии точной настройки, спектральный коэффициент 321 находится в первом состоянии точной настройки, и т.д.
Например, возвращаясь к определению центра тяжести, объясненному выше, если центр тяжести находится (например, приблизительно в середине) между двумя спектральными расположениями, то средство изменения спектра может устанавливать знак так, чтобы указывалось второе состояние точной настройки.
Согласно варианту осуществления блок 430 обработки может конфигурироваться для квантования измененного спектра звукового сигнала для получения квантованного спектра звукового сигнала. Блок 430 обработки может кроме того конфигурироваться для обработки квантованного спектра звукового сигнала для получения спектра кодированного звукового сигнала.
Кроме того, блок 430 обработки может кроме того конфигурироваться для генерации дополнительной информации, указывающей только для тех спектральных коэффициентов квантованного спектра звукового сигнала, которые имеют непосредственно предыдущий элемент, спектральное значение которого равно предопределенному значению, и непосредственно последующий элемент, спектральное значение которого равно предопределенному значению, является или нет указанный коэффициент одним из коэффициентов экстремума.
Такая информация может быть предоставлена с помощью средства 410 определения экстремумов в блок 430 обработки.
Например, такая информация может сохраняться с помощью блока 430 обработки в битовом поле, указывая для каждого из спектральных коэффициентов квантованного спектра звукового сигнала, которые имеют непосредственно предыдущий элемент, спектральное значение которого равно предопределенному значению, и непосредственно последующий элемент, спектральное значение которого равно предопределенному значению, что указанный коэффициент является одним из коэффициентов экстремума (например, битовое значение 1) или что указанный коэффициент не является одним из коэффициентов экстремума (например, битовое значение 0). В варианте осуществления декодер может позже использовать эту информацию для восстановления спектра входного звукового сигнала. Битовое поле может иметь фиксированную длину или выбранную в зависимости от сигнала длину. В последнем случае длина битового поля может дополнительно передаваться к декодеру.
Например, битовое поле [000111111], сгенерированное с помощью блока 430 обработки, может указывать, что первые три «обособленных» коэффициента (их спектральные значения не равны предопределенному значению, но спектральные значения предыдущего по отношению к ним элемента и последующего по отношению к ним элемента равны предопределенному значению), которые появляются в (последовательно упорядоченном) (квантованном) спектре звукового сигнала, не являются коэффициентами экстремума, но последующие шесть «обособленных» коэффициентов являются коэффициентами экстремума. Это битовое поле описывает ситуацию, которую можно заметить в квантованном спектре 635 MDCT на фиг. 9, где первые три «обособленных» коэффициента 5, 8, 25 не являются коэффициентами экстремума, но где последующие шесть «обособленных» коэффициентов 59, 71, 83, 94, 116, 141 являются коэффициентами экстремума.
Снова, непосредственно предыдущим элементом для указанного спектрального коэффициента является другой спектральный коэффициент, который непосредственно предшествует указанному спектральному коэффициенту в пределах квантованного спектра звукового сигнала, и непосредственно последующим элементом для указанного спектрального коэффициента является другой спектральный коэффициент, который непосредственно следует за указанным спектральным коэффициентом в пределах квантованного спектра звукового сигнала.
Предложенные концепции увеличивают воспринимаемое качество кодеков с преобразованием на основе обычного блока при низких скоростях передачи данных. Предложено замещать локальные тональные области в спектрах звукового сигнала, которые простираются на соседние локальные минимумы, охватывают локальный максимум, псевдолиниями (также называл псевдокоэффициентами), которые имеют в некоторых вариантах осуществления аналогичную энергию или уровень, как указанные области, которые будут замещаться.
При низких скоростях передачи данных варианты осуществления обеспечивают концепции, как плотно интегрировать в одной методике волновое кодирование и параметрическое кодирование для получения улучшенного воспринимаемого качества и улучшенного масштабирования воспринимаемого качества по отношению к скорости передачи данных.
В некоторых вариантах осуществления каждая из пиковых областей (распространяющихся на соседние локальные минимумы, охватывающих локальный максимум) спектров может полностью заменяться одной синусоидой; в противоположность синусоидальным кодерам, которые итерационно вычитают синтезируемые синусоиды из разностного значения. Подходящие пиковые области извлекаются на основе сглаженного и немного приближенного к белому шуму спектрального представления и выбираются относительно некоторых особенностей (высота пика, форма пика).
Согласно некоторым вариантам осуществления эти синусоиды замещения могут быть представлены в качестве псевдолиний (псевдокоэффициентов) в спектре, который будет кодироваться, и отражать полную амплитуду или энергию синусоиды (в отличие, например, когда обычные линии MDCT соответствуют действительной проекции истинного значения).
Согласно некоторым вариантам осуществления псевдолинии (псевдокоэффициенты) могут отмечаться также с помощью дополнительной информации в массиве флажков.
В некоторых вариантах осуществления выбор знака псевдолиний может указывать половину разрешающей способности по частоте субдиапазона.
Согласно некоторым вариантам осуществления более низкая критическая частота для синусоидального замещения может быть необходима из-за ограниченной разрешающей способности по частоте (например, половина субдиапазона).
В последующем обеспечены концепции для генерации выходного звукового сигнала, основываясь на кодированном звуковом сигнале. Эти концепции воплощают эффективный синтез синусоид и свип-синусоид в области MDCT.
Фиг. 1a показывает устройство для генерации выходного звукового сигнала, основываясь на спектре кодированного звукового сигнала согласно варианту осуществления.
Устройство содержит блок 115 обработки для обработки спектра кодированного звукового сигнала для получения спектра декодированного звукового сигнала, содержащего множество спектральных коэффициентов, причем каждый из спектральных коэффициентов имеет спектральное расположение в спектре кодированного звукового сигнала и спектральное значение, причем спектральные коэффициенты последовательно упорядочиваются согласно их спектральному расположению в спектре кодированного звукового сигнала так, чтобы спектральные коэффициенты сформировали последовательность спектральных коэффициентов.
Кроме того, устройство содержит средство 125 определения псевдокоэффициентов для определения одного или большего количества псевдокоэффициентов спектра декодированного звукового сигнала, причем каждый из псевдокоэффициентов является одним из спектральных коэффициентов (поскольку каждый из псевдокоэффициентов является одним из спектральных коэффициентов, каждый из псевдокоэффициентов имеет спектральное расположение и спектральное значение).
Кроме того, устройство содержит блок 135 замены для замены по меньшей мере одного или большего количества псевдокоэффициентов определенным спектральным шаблоном для получения измененного спектра звукового сигнала, причем определенный спектральный шаблон содержит по меньшей мере два коэффициента шаблона, причем каждый по меньшей мере из двух коэффициентов шаблона имеет спектральное значение.
Например, в некоторых вариантах осуществления блок 135 замены может получать из блока хранения спектральный шаблон в качестве полученного спектрального шаблона, причем блок хранения содержится в устройстве, и причем блок хранения содержит базу данных или память. В других вариантах осуществления блок 135 замены может получать спектральный шаблон из удаленного блока, например, из удаленной базы данных, например, расположенной далеко от устройства. В дополнительных вариантах осуществления шаблон будет генерироваться аналитически «на лету» (во время работы, когда необходимо). Полученный спектральный шаблон может затем использоваться в качестве определенного спектрального шаблона. Или определенный спектральный шаблон может выводиться из полученного спектрального шаблона, например, с помощью изменения полученного спектрального шаблона.
Кроме того, устройство содержит блок (145) преобразования «спектр-время» для преобразования измененного спектра звукового сигнала во временную область для обеспечения выходного звукового сигнала.
Фиг. 1b показывает устройство для генерации выходного звукового сигнала, основываясь на спектре кодированного звукового сигнала согласно другому варианту осуществления. Устройство на фиг. 1b отличается от устройства варианта осуществления на фиг. 1a тем, что оно дополнительно содержит блок 155 хранения, который непосредственно содержит базу данных или память.
В частности, устройство варианта осуществления на фиг. 1b дополнительно содержит блок 155 хранения, содержащий базу данных или память, который хранит в базе данных или в памяти множество сохраненных спектральных шаблонов. Каждый из сохраненных спектральных шаблонов имеет спектральное свойство (например, постоянную частоту, качающуюся частоту - каждую в версии расположения на элементе разрешения или между элементами - и т.д.). Блок 135 замены конфигурируется для запроса из блока 155 хранения одного из сохраненных спектральных шаблонов в качестве запрашиваемого спектрального шаблона. Блок 155 хранения конфигурируется для обеспечения указанного запрашиваемого спектрального шаблона. Кроме того, блок 135 замены конфигурируется для замены по меньшей мере одного или большего количества псевдокоэффициентов определенным спектральным шаблоном, основываясь на запрашиваемом спектральном шаблоне.
В предпочтительных вариантах осуществления сохраненные спектральные шаблоны не сохранены для конкретных частот. Это потребовало бы большого объема памяти. Таким образом каждый шаблон (например, постоянный шаблон на элементе разрешения, постоянный шаблон между элементами разрешения, и несколько шаблонов для различных свип-синусоид) сохраняется только один раз. Этот общий шаблон затем запрашивается, например, из базы данных, настроенной для целевой частоты, например, для целевой частоты 8200 Гц, настроенной для необходимой фазы (например, 0 радиан), и затем исправляется в целевом спектральном расположении.
В варианте осуществления блок 135 замены конфигурируется для запроса из блока 155 хранения одного из сохраненных спектральных шаблонов в зависимости от первого выведенного спектрального расположения, выведенного по меньшей мере из одного из одного или большего количества псевдокоэффициентов, определенных с помощью средства 125 определения псевдокоэффициентов. Например, запрос зависит от характера шаблона (постоянный, качающийся и т.д.), и настройка шаблона зависит от спектрального расположения и предшествующего элемента в синусоидальной дорожке или определенной с помощью сигнала начальной фазы синусоидальной дорожки.
В одном варианте осуществления первое выведенное спектральное расположение, выведенное по меньшей мере из одного из одного или большего количества псевдокоэффициентов, может быть спектральным расположением одного из псевдокоэффициентов.
В другом варианте осуществления один или большее количество псевдокоэффициентов являются значениями со знаком, каждый содержит компоненту знака, и блок 135 замены конфигурируется для определения первого выведенного спектрального расположения, основываясь на спектральном расположении одного псевдокоэффициента из одного или большего количества псевдокоэффициентов и основываясь на компоненте знака указанного псевдокоэффициента, так, чтобы первое выведенное спектральное расположение было равно спектральному расположению указанного псевдокоэффициента, когда компонента знака имеет первое значение знака, и так, чтобы первое выведенное спектральное расположение было равно измененному расположению, причем измененное расположение является результатом смещения спектрального расположения указанного псевдокоэффициента на предопределенное значение, когда компонента знака имеет отличающееся второе значение.
Например, разрешающую способность по частоте половины элемента разрешения псевдолиний может сообщать знак указанного псевдокоэффициента. Предопределенное значение, на которое сдвигается спектральное расположение указанного псевдокоэффициента, может в таком случае соответствовать половине разницы частот, например, двух последующих элементов, например, когда рассматривают частотно-временную область, когда компонента знака псевдокоэффициента имеет второе значение знака.
В конкретном варианте осуществления средство 125 определения псевдокоэффициентов конфигурируется для определения двух или большего количества последовательных по времени псевдокоэффициентов спектра декодированного звукового сигнала. Блок 135 замены конфигурируется для назначения первого псевдокоэффициента и второго псевдокоэффициента из двух или большего количества последовательных во времени псевдокоэффициентов дорожке в зависимости от того, выполняется или нет условие, что абсолютная разница между первым выведенным спектральным расположением, выведенным из первого псевдокоэффициента, и вторым выведенным спектральным расположением, выведенным из второго псевдокоэффициента, меньше, чем пороговое значение. Множество сохраненных спектральных шаблонов, хранящихся в базе данных или памяти из блока хранения, может быть или шаблонами постоянного тона или шаблонами качающейся частоты. Блок 135 замены может в таком случае конфигурироваться для запроса из блока 155 хранения одного из шаблонов постоянного тона, когда первое выведенное спектральное расположение, выведенное из первого псевдокоэффициента дорожки, равно второму выведенному спектральному расположению, выведенному из второго псевдокоэффициента дорожки. Кроме того, блок 135 замены может конфигурироваться для запроса из блока 155 хранения одного из шаблонов качающейся частоты, когда первое выведенное спектральное расположение, выведенное из первого псевдокоэффициента дорожки, отличается от второго выведенного спектрального расположения, выведенного из второго псевдокоэффициента дорожки.
Например, первое выведенное спектральное расположение, выведенное из первого псевдокоэффициента дорожки, может быть спектральным расположением первого псевдокоэффициента. Например, второе выведенное спектральное расположение, выведенное из второго псевдокоэффициента дорожки, может быть спектральным расположением второго псевдокоэффициента.
Например, псевдокоэффициент может назначаться одному из множества частотно-временных элементов разрешения или промежуточному расположению частоты между двумя частотно-временными элементами разрешения, например, частотно-временному элементу разрешения (n, k), причем n обозначает время, и причем k обозначает частоту. Частота частотно-временного элемента разрешения псевдокоэффициента или расположения частоты между двумя частотно-временными элементами разрешения может в таком случае указывать спектральное расположение псевдокоэффициента. Принимая частотно-временной элемент разрешения (n, k) блок 135 замены проверит, принял он или еще нет псевдокоэффициент, назначаемый частотно-временному элементу разрешения, который непосредственно предшествует частотно-временному элементу разрешения текущего псевдокоэффициента в момент времени (n-1) и который равен или расположен близко к частоте частотно-временного элемента разрешения текущего псевдокоэффициента (равен или близок к k). Блок 135 замены затем назначает оба псевдокоэффициента дорожке.
Например, псевдокоэффициент, имеющий частотно-временной элемент разрешения, который непосредственно предшествует текущему частотно-временному элементу разрешения по времени, можно рассматривать близким к частоте текущего частотно-временного элемента разрешения, если абсолютная разница частот обеих частот меньше, чем пороговое значение. (Например, если частотные индексы рассматривают как частоты, если абсолютная разница меньше чем 2).
Если оба псевдокоэффициента дорожки имеют то же самое спектральное расположение, то блок 135 замены рассматривает это как указание, что присутствует постоянный тон, и запрашивает шаблон постоянного тона, имеющий соответствующую частоту.
Однако, если спектральные расположения спектральных коэффициентов дорожки отличаются, то блок 135 замены рассматривает это как указание, что присутствует изменение частоты, и запрашивает из блока 155 хранения шаблон качающейся частоты. Частота, указанная с помощью расположения частоты предыдущего псевдокоэффициента в пределах дорожки, может в таком случае указывать начальную частоту качающегося шаблона, и частота, указанная с помощью расположения частоты текущего псевдокоэффициента в пределах дорожки, может в таком случае указывать целевую частоту качающегося шаблона.
Согласно варианту осуществления блок 135 замены может конфигурироваться для запроса из блока хранения первого шаблона качающейся частоты из шаблонов качающейся частоты, когда разница частот между вторым псевдокоэффициентом дорожки и первым псевдокоэффициентом дорожки равна половине предопределенного значения.
Кроме того, блок 135 замены может конфигурироваться для запроса из блока хранения второго шаблона, который отличается от первого шаблона качающейся частоты, из шаблонов качающейся частоты, когда разница частот между вторым псевдокоэффициентом дорожки и первым псевдокоэффициентом дорожки равна предопределенному значению.
Кроме того, блок 135 замены может конфигурироваться для запроса из блока хранения третьего шаблона качающейся частоты, который отличается от первого шаблона качающейся частоты и второго шаблона качающейся частоты, из шаблонов качающейся частоты, когда разница частот между вторым псевдокоэффициентом дорожки и первым псевдокоэффициентом дорожки равна полутора предопределенным значениям.
Например, предопределенное значение может быть разницей частот между двумя последовательными во времени частотно-временными элементами разрешения. Таким образом в таком варианте осуществления обеспечиваются шаблоны для свип-синусоид, причем разница частот между начальной частотой и целевой частотой отличается на 1/2 элемента разрешения по частоте, 1,0 разрешения по частоте и 3/2 разрешения по частоте.
Фиг. 1c показывает устройство согласно варианту осуществления, где блок 135 замены содержит блок 138 адаптации шаблона, конфигурируемый для изменения запрашиваемого спектрального шаблона, обеспеченного с помощью блока 155 хранения, для получения определенного спектрального шаблона.
В варианте осуществления блок 138 адаптации шаблона может конфигурироваться для изменения запрашиваемого спектрального шаблона, обеспеченного с помощью блока 155 хранения, с помощью повторного масштабирования спектральных значений коэффициентов шаблона запрашиваемого спектрального шаблона в зависимости от спектрального значения одного из одного или большего количества псевдокоэффициентов для получения определенного спектрального шаблона. Блок 135 замены спектра в таком случае конфигурируется для замены по меньшей мере одного или большего количества псевдокоэффициентов определенным спектральным шаблоном для получения измененного спектра звукового сигнала. Таким образом, согласно этому варианту осуществления размер спектральных значений коэффициентов шаблона запрашиваемого спектрального шаблона может корректироваться в зависимости от спектрального значения псевдокоэффициента.
Согласно варианту осуществления блок 138 адаптации шаблона может конфигурироваться для изменения запрашиваемого спектрального шаблона, обеспеченного с помощью блока хранения, в зависимости от начальной фазы так, чтобы спектральное значение каждого из коэффициентов шаблона запрашиваемого спектрального шаблона изменялось первым способом, когда начальная фаза имеет первое значение начальной фазы, и так, чтобы спектральное значение каждого из коэффициентов шаблона запрашиваемого спектрального шаблона изменялось отличающимся вторым способом, когда начальная фаза имеет отличающееся второе значение начальной фазы. С помощью регулировки фазы шаблонов дорожки может быть достигнут бесшовный переход от одного шаблона дорожки к последующему шаблону.
Согласно варианту осуществления спектральное значение каждого из коэффициентов шаблона запрашиваемого спектрального шаблона является комплексным коэффициентом, содержащим действительную часть и мнимую часть. Блок 138 адаптации шаблона может конфигурироваться для изменения запрашиваемого спектрального шаблона с помощью изменения действительной части и мнимой части каждого из коэффициентов шаблона запрашиваемого спектрального шаблона, обеспеченного с помощью блока 155 хранения, так, чтобы для каждого из комплексных коэффициентов вектор, представляющий указанный комплексный коэффициент в комплексной плоскости, поворачивался на тот же самый угол для каждого из комплексных коэффициентов. Альтернативно, фаза сохраненного шаблона может поворачиваться с помощью применения множителя ej⋅ϕ комплексного поворота, причем ϕ является произвольным фазовым углом.
В конкретном варианте осуществления спектральное значение каждого из коэффициентов шаблона запрашиваемого спектрального шаблона содержит действительную часть и мнимую часть. В таком варианте осуществления блок 138 адаптации шаблона может конфигурироваться для изменения запрашиваемого спектрального шаблона, обеспеченного с помощью блока 155 хранения, с помощью инвертирования действительной и мнимой части спектрального значения каждого из коэффициентов шаблона запрашиваемого спектрального шаблона, или с помощью перестановки действительной части или инвертированной действительной части и мнимой части или инвертированной мнимой части спектрального значения каждого из коэффициентов шаблона запрашиваемого спектрального шаблона.
В варианте осуществления блок 138 адаптации шаблона может конфигурироваться для изменения запрашиваемого спектрального шаблона, обеспеченного с помощью блока 155 хранения, с помощью реализации временного зеркального отображения шаблона. Как правило, оно может быть получено в частотной области с помощью вычисления комплексного сопряжения (умножения мнимой части на -1) шаблона и применения комплексной фазовой составляющей (вращение).
Согласно варианту осуществления спектр декодированного звукового сигнала представлен в области MDCT. В таком варианте осуществления блок 138 адаптации шаблона в таком случае конфигурируется для изменения запрашиваемого спектрального шаблона, обеспеченного с помощью блока 155 хранения с помощью изменения спектральных значений коэффициентов шаблона запрашиваемого спектрального шаблона, для получения измененного спектрального шаблона, причем спектральные значения представлены в области нечетного дискретного преобразования Фурье. Кроме того, блок 138 адаптации шаблона в таком варианте осуществления конфигурируется для преобразования спектральных значений коэффициентов шаблона измененного спектрального шаблона из области нечетного дискретного преобразования Фурье в область MDCT для получения определенного спектрального шаблона. Кроме того, блок 135 замены в таком варианте осуществления конфигурируется для замены по меньшей мере одного или большего количества псевдокоэффициентов определенным спектральным шаблоном, представленным в области MDCT, для получения измененного спектра звукового сигнала, представленного в области MDCT.
Альтернативно, в вариантах осуществления спектральные значения могут быть представлены в области комплексного модифицированного дискретного косинусного преобразования (CMDCT). Кроме того, в этих вариантах осуществления блок 138 адаптации шаблона может конфигурироваться для преобразования спектральных значений коэффициентов шаблона измененного спектрального шаблона из области CMDCT в область MDCT для получения определенного спектрального шаблона с помощью простого извлечения действительной части комплексного измененного шаблона.
Фиг. 1d показывает устройство для генерации множества спектральных шаблонов согласно варианту осуществления.
Устройство содержит генератор 165 сигнала для генерации множества сигналов в первой области.
Кроме того, устройство содержит блок 175 преобразования сигнала для преобразования каждого сигнала из множества сигналов из первой области во вторую область для получения множества спектральных шаблонов, каждый шаблон из множества преобразованных спектральных шаблонов содержит множество коэффициентов.
Кроме того, устройство содержит блок 185 последующей обработки для сокращения преобразованных спектральных шаблонов с помощью удаления одного или большего количества коэффициентов преобразованных спектральных шаблонов для получения множества обработанных шаблонов.
Кроме того, устройство содержит блок 195 хранения, содержащий базу данных или память, причем блок 195 хранения конфигурируется для хранения каждого обработанного шаблона из множества обработанных шаблонов в базе данных или памяти.
Генератор 165 сигнала конфигурируется для генерации каждого сигнала из множества сигналов, основываясь на формулах
причем t и τ указывают время, причем ϕ(t) - мгновенная фаза в t, и причем f(τ) мгновенная частота в τ, причем каждый сигнал из множества сигналов имеет начальную частоту (f0), которая является мгновенной частотой указанного сигнала в первый момент времени, и целевую частоту (f1), которая является мгновенной частотой указанного сигнала в отличающийся второй момент времени.
Генератор 165 сигнала конфигурируется для генерации первого сигнала из множества сигналов так, чтобы целевая частота (f1) первого сигнала была равна начальной частоте (f0). Кроме того, генератор 165 сигнала конфигурируется для генерации отличающегося второго сигнала из множества сигналов так, чтобы целевая частота (f1) первого сигнала отличалась от начальной частоты (f0).
Согласно варианту осуществления блок 175 преобразования сигнала конфигурируется для преобразования каждого сигнала из множества сигналов из первой области, которая является областью времени, во вторую область, которая является спектральной областью. Блок 175 преобразования сигнала конфигурируется для генерации первого из множества блоков времени для преобразования указанного сигнала, причем каждый блок времени из множества блоков времени содержит множество взвешенных выборок, причем каждая из указанных взвешенных выборок является выборкой указанного сигнала, взвешенной с помощью веса из множества весов, причем множество весов назначается указанному блоку времени, и причем каждый вес из множества весов назначается моменту времени. Начальная частота (f0) каждого сигнала из множества сигналов является мгновенной частотой указанного сигнала в первый момент времени, причем первый из весов первого из блоков времени назначается первому моменту времени, причем второй из весов отличающегося второго из блоков времени назначается первому моменту времени, причем первый из блоков времени и второй из блоков времени перекрываются, и причем первый из весов равен второму из весов. Целевая частота (f1) каждого сигнала из множества сигналов является мгновенной частотой указанного сигнала во второй момент времени, причем третий из весов первого из блоков времени назначается второму моменту времени, причем четвертый из весов отличающегося третьего из блоков времени назначается второму моменту времени, причем первый из блоков времени и третий из блоков времени перекрываются, и причем третий из весов равен четвертому из весов.
Например, фиг. 6a показывает пример, в котором первый момент времени обозначен n0, и второй момент времени обозначен n1. Накладывающиеся блоки показываются блоками L и L+1. Веса изображены с помощью кривой в блоке L и с помощью кривой в блоке L+1, соответственно.
Нужно отметить, что, например, достаточно генерировать только один блок времени (например, первый из блоков времени) для генерации шаблона.
Согласно варианту осуществления каждый сигнал из множества сигналов имеет начальную фазу (ϕ0), которая является фазой указанного сигнала в первый момент времени, и целевую фазу (ϕ1), которая является фазой указанного сигнала в отличающийся второй момент времени, причем генератор (165) сигнала конфигурируется для генерации множества сигналов таким образом, что начальная фаза (ϕ0) первого из множества сигналов равна начальной фазе (ϕ0) отличающегося второго из множества сигналов.
Начальная фаза (и неявно с помощью выбора начальной и конечной частоты - целевая (конечная) фаза) каждого сигнала из множества сигналов корректируется в указанные начальный и конечный моменты времени.
С помощью этого специального выбора первого (начального) и второго (конечного) моментов времени уменьшаются добавляемые с помощью перекрытия искажения, которые могут произойти, если соединяются шаблоны с различными спектральными свойствами.
В варианте осуществления блок 185 последующей обработки может кроме того конфигурироваться для выполнения поворота на π/4 спектральных коэффициентов каждого из преобразованных спектральных шаблонов для получения множества повернутых спектральных шаблонов.
Согласно дополнительному варианту осуществления генератор 165 сигнала может конфигурироваться для генерации первого сигнала, второго сигнала и одного или большего количества дополнительных сигналов как множества сигналов, так, чтобы каждая разница целевой частоты и начальной частоты каждого из дополнительных сигналов была целым кратным разницы целевой частоты и начальной частоты второго сигнала.
Например, разница частот целевой частоты и начальной частоты второго сигнала может соответствовать разнице частот половины элемента разрешения, например, разнице частот, равной половине разницы частот двух последовательных элементов разрешения, когда рассматривают частотно-временные элементы разрешения. Разница частот целевой частоты и начальной частоты дополнительного третьего сигнала может соответствовать разнице частот одного элемента разрешения, например, разнице частот, соответствующей разнице частот двух последовательных элементов разрешения, когда рассматривают частотно-временные элементы. Разница частот целевой частоты и начальной частоты дополнительного четвертого сигнала может соответствовать разнице частот полутора элементов разрешения, например, разнице частот, соответствующей полуторам разницам частот двух последовательных элементов разрешения, когда рассматривают частотно-временные элементы разрешения.
Таким образом, отношение разницы целевой частоты и начальной частоты третьего сигнала к разнице целевой частоты и начальной частоты второго сигнала равно 2,0 (целочисленное значение). Отношение разницы целевой частоты и начальной частоты четвертого сигнала к разнице целевой частоты и начальной частоты второго сигнала равно 3,0 (целочисленное значение).
Перед обеспечением более подробного описания конкретных вариантов осуществления для лучшего объяснения описаны основы MDCT.
MDCT действительного сигнала x(n) определяется для сегментов сигнала, вырезанных с помощью w(n) в момент времени l, который равен wa (l, n)×(l, n)∈R, длины N следующим образом:
+1/2 в (m+1/2) представляет частотный сдвиг. (n+1/2+М/2) представляет сдвиг по времени.
MDCT можно рассматривать как действительную часть комплексного модифицированного дискретного косинусного преобразования (CMDCT), которое определяется как
Кроме того, CMDCT может быть выражено как нечетное дискретное преобразование Фурье (ODFT) или дискретное преобразование Фурье (DFT) и экспоненциальные фазовые составляющие предварительного и последующего вращения
В последующем описаны извлечение и исправление шаблонов тона в области MDCT. Теперь некоторые объяснения обеспечены относительно конкретных особенностей MDCT. В частности сначала рассматривают условия для MDCT.
Как можно заметить по уравнениям 4, которые содержат экспоненциальную составляющую так называемого последующего вращения, CMDCT имеет сдвинутые по времени основные функции по сравнению с DFT или ODFT. Таким образом, если желательно разъединить абсолютный сдвиг ϕ0 по фазе исправленных синусоид от фактического спектрального положения применения исправления, это вращение должно учитываться.
Варианты осуществления проводят извлечение и исправление шаблона в области ODFT и последующую обработку наложения всех шаблонов с помощью применения указанного вращения перед смешиванием с коэффициентами MDCT.
Каждое исправление получается с помощью извлечения сокращенных комплексных спектров ODFT, формирующих прототип синусоид или свип-синусоид, сгенерированных согласно следующим уравнениям. Синусоида с изменяющейся мгновенной частотой (IF) f(t) может синтезироваться как
с мгновенной фазой
Для упрощения зависимости между выборкой во времени MDCT и описание непрерывной во времени синусоиды нормализованная частота дискретизации fs=1 принимается в последующем. Мгновенная частота (IF) f(τ) качающихся шаблонов выбирается таким образом, что начальная и целевая IF точно достигается в точках симметрии нейтрализации ступенчатости в области времени (TDAC) t0=N/4+0,5 и t1=3N/4+0,5 каждого блока времени MDCT с длиной N, соответственно. Линейное изменение частоты от частоты f0 до f1, охватывающее частотный диапазон Δf=f1-f0 в интервале времени длины M=N/2, имеет мгновенную частоту (IF)
что приводит к мгновенной фазе
Синусоиды с начальной и конечной частотами удвоенной разрешающей способности (по сравнению с MDCT, которое будет использоваться для синтеза шаблона) могут генерироваться с помощью выбора и , с частотным смещением m, измеренным в индексах элемента разрешения преобразования. Нечетные индексы соответствуют частотам «на элементе разрешения», и четные индексы дают частоты «между элементами разрешения». Движение вперед фазы между последующими кадрами может вычисляться как
Это означает, что для бесшовного временного соединения шаблонов фаза каждого исправления должна корректироваться с помощью целого кратного
Кроме того, может осуществляться компенсация спектрального сдвига на целый элемент. Спектральное положение этих являющихся прототипом синусоид или свип-синусоид преимущественно выбирается так, чтобы они были расположены в середине спектра для минимизации циклических ошибок сворачивания. В зависимости от спектрального расстояния d синусоиды-прототипа и расположения целевого исправления, исправление настраивается с помощью последующей обработки поворота на dπ/2, чтобы всегда получать предопределенную фиксированную фазу, независимо от расположения целевого исправления. Другими словами, последующая обработка поворота компенсирует нежелательный поворот фазы, который неотъемлемо вызывается спектральным сдвигом.
Далее обеспечены рассмотрения эффективности и точности. Сначала рассматривают эффективность вычислений:
Таблица I обеспечивает операции для реализации различных последующих вращений. Для поддержания количества шаблонов, которые будут сохраняться, обоснованно небольшим и, самое важное, чтобы иметь возможность использовать тот факт, что повороты на некоторые простые части π могут достигаться с помощью операций, перечисленных в таблице I, возможные частоты и качение частоты должны ограничиваться.
(ОПЕРАЦИИ ДЛЯ ПРОСТЫХ ПОВОРОТОВ)
В последующем рассматривают разрешающую способность по частоте. Эти ограничения, в то же самое время, требуются для учета удовлетворительного для восприятия воспроизведения параметрических частей кодированного сигнала. Так как такая часть сигнала может содержать произвольную последовательность во времени шаблонов тона, каждая дополнительная степень свободы увеличивает количество шаблонов, которые будут сохраняться, или, альтернативно, затраты на вычисления для адаптации шаблонов. Таким образом, целесообразно выбирать спектральную разрешающую способность таким образом, чтобы никакой эффект рассогласования не воспринимался средним слушателем в намеченном целевом спектре частот.
Тренированные слушатели и музыканты в состоянии чувствовать рассогласование до 5 сотых частей, средний слушатель может воспринимать отклонения приблизительно в 10 сотых частей (одна десятая полутона). Поэтому спектральная замена синусоидальных тонов должна выполняться только выше некоторой критической частоты, которая соответствует наихудшему варианту допустимого рассогласования. Например, в 512-диапазоном MDCT на частоте дискретизации 12,8 кГц спектральная разрешающая способность для диапазона составляет 12,5 Гц. Выбирая разрешающую способность в половину диапазона для шаблонов тона, максимальное отклонение частоты составляет 3,125 Гц, что равно или ниже 10 сотых частей выше критической частоты, приблизительно равной 540 Гц.
Теперь рассматривают размер шаблона. Согласно вариантам осуществления сокращаются шаблоны, которые будут сохраняться. Фактическая величина шаблонов зависит от типа окна, который обычно уже определяется кодером с преобразованием (например, синусное окно или окно Кайзера-Бесселя (KBD) для AAC) и допустимое отношение сигнал-шум (ОСШ). Хотя комплексно оцененные шаблоны сохраняются, фактическое исправление выполняется, используя только действительную часть соответствующим образом повернутого шаблона.
В последующем рассматривают шаблоны тона. Сначала описываются шаблоны постоянного тона.
По вышеупомянутым причинам спектральная разрешающая способность должна выбираться равной двукратной номинальной разрешающей способности MDCT. Как следствие, должны сохраняться две версии всего шаблона, одна для синусоид с частотами, которые совпадают с положением элемента разрешения (шаблон на элементе разрешения), и одна для частот, которые расположены между положениями элемента разрешения (шаблон между элементами разрешения). Для наименьших возможных требований к памяти может использоваться симметрия шаблонов с помощью сохранения только половины коэффициентов фактического шаблона.
Согласно уравнению 9 (устанавливая m=0) в любой последовательности времени этих шаблонов постоянного тона движение вперед на оборот фазы составляет Δϕ=π/2 или Δϕ=-π/2 для шаблонов на элементе разрешения, и Δϕ=0 или Δϕ=π для шаблонов между элементами разрешения. Это происходит из-за накопления нечетных частот MDCT.
Фаза полного оборота может вычисляться с помощью ϕ0+nπ/2, причем n как целое число ∈ {1, 3} для шаблонов на элементе разрешения и ∈ {2, 4} для шаблонов между элементами разрешения. Выбор фактического целого числа зависит от четности номера элемента разрешения (четный/нечетный), ϕ обозначает произвольное значение смещения фазы. Следовательно, для шаблона совершенно постоянного тона последующая обработка с помощью четырех альтернативных поворотов необходима для подгонки шаблонов к их намеченному положению в сетке в/ч последовательности спектров MDCT. Выбор ϕ0+nπ/2, n ∈ N, просто обрабатывает эти повороты.
Далее рассматривают шаблоны качающейся частоты.
Из-за того, что спектральная разрешающая способность является дважды номинальной разрешающей способностью MDCT, также две версии каждого качающегося шаблона должны сохраняться, одна - для свип-синусоид с начальными частотами, которые совпадают с положением элемента разрешения, и одна - для начальных частот, которые расположены между положениями элемента разрешения. Кроме того, допустимые свип-синусоиды определяются так, чтобы они были линейными и охватывали половину, целый и полтора элемента разрешения MDCT на блок времени, каждая в версии направлений в сторону увеличения и в сторону уменьшения, что приводит к 12 шаблонам, которые будут сохраняться дополнительно. Для наименьших возможных требований к памяти качающиеся шаблоны могут сохраняться только в одном направлении; противоположное направление может получаться с помощью временного зеркального отражения шаблона. Согласно уравнению 9 (установка m ∈ {1, 3, 5…}) шаблон, который относится к качению частоты, равному половине элемента разрешения, требует последующей обработки поворота на ϕ0+nπ/4.
В последующем рассматриваются соединение шаблонов. С этой целью ссылка сделана на фиг. 2. Фиг. 2 показывает выравнивание параметра синусоидального шаблона относительно блока времени MDCT. Если шаблоны соединяются во временной последовательности, то начальная фаза для фактического шаблона в точке n0 на фиг. 2 не должна выбираться (используя вышеупомянутые повороты) и целевая фаза (конечная фаза) в точке n1 должна сохраняться для бесшовного удлинения с помощью последующего шаблона.
Для свип-синусоид, которые охватывают интервал качения частоты в половину элемента разрешения, последующая обработка выполняется с помощью последующей обработки поворота на ϕ0+nπ/4, и для качающихся шаблонов, и для постоянных шаблонов, так как качающиеся части и постоянные части могут произвольно соединяться в последовательности времени. Выбор ϕ0+nπ/4, n ∈ N, приводит к повороту, который также довольно «просто вычислять» с помощью суммирования/вычисления разницы действительной и мнимой части шаблона и последующего масштабирования с помощью √2/2. Альтернативно, все шаблоны могут дополнительно сохраняться в версии с предварительным поворотом на π/4 и могут применяться вместе с простым поворотом постобработки на nπ/2, n=1, 2, 3 (см. таблицу 1).
Фиг. 3 показывает примерный процесс исправления шаблонов тона, причем (a-b) показывают генерацию прототипа шаблона, причем (c) показывает сокращение шаблона, причем (d) показывает настройку шаблона для целевого расположения и фазы, и причем (e-f) показывают исправление шаблона.
В частности, на фиг. 3 на панелях (a)-(f) изображен весь процесс, который описан выше по отношению к особенностям MDCT, от измерения шаблона до адаптации и исправления шаблона. Сначала шаблон создается с помощью генерации синусоиды или свип-синусоиды согласно уравнениям 5 и 6. Затем сгенерированный сигнал преобразовывается в частотную область (a) ODFT для получения комплексного спектра (b). Затем комплексный шаблон сокращается до его намеченной длины (c) и сохраняется в таблице.
Всякий раз, когда шаблон необходим для синтеза тональной части сигнала, он настраивается для ее целевой фазы, как описано выше, по отношению к соединению шаблонов, и дополнительно для него компенсируют поворот фазы, вызванный спектральным сдвигом, как описано выше по отношении к компенсации спектрального сдвига на целый элемент разрешения (d). Дополнительно, сдвиг по времени, который присутствует в CMDCT по отношению к ODFT, осуществляется с помощью применения последующего вращения, как описано выше. Применение последующего вращения может выполняться эффективно после суммирования коэффициентов всех шаблонов, которые будут исправляться в спектре. Наконец, фактическое исправление происходит в области MDCT, используя только действительную часть настроенного шаблона. IMDCT приводит к необходимому сигналу в области времени, спектр которого изображен на панели (f).
Фиг. 4 показывает нормализованные шаблоны спектрального тона согласно варианту осуществления, в частности - синусоида на элементе разрешения, синусоида между элементами разрешения, свип-синусоида на элементе разрешения, свип-синусоида между элементами разрешения (от верхней до нижней панели). Более конкретно, фиг. 4 примерно изображает выбор различных шаблонов тона для типичного сценария кодека с преобразованием с низкой скоростью передачи данных, используя MDCT с 512 диапазонами, с окном синуса, с частотой дискретизации 12,8 кГц, и разрешающей способностью в половину элемента разрешения для шаблонов тона. С верхней к нижней панели изображены несколько нормализованных спектральных шаблонов тона ODFT: синусоида на элементе разрешения, синусоида между элементами разрешения, свип-синусоида на элементе разрешения и свип-синусоида между элементами разрешения. Несколько шаблонов, как эти, должны сохраняться в таблице.
Все типы шаблона сохраняются в 4 вариантах:
на элементе разрешения и между элементами разрешения,
начальная фаза 0 и начальная фаза π/4 (предварительно повернутый, как описано выше относительно соединения шаблонов).
Качающиеся шаблоны имеют дополнительно 6 вариантов:
свип-синусоида половины, целого и полутора элементов разрешения,
вверх и вниз по направлению свип-синусоид.
Общее количество шаблонов, которые будут сохраняться, равно 4 умножить на (1 постоянный + 6 качающийся) и составляет 28 комплексных шаблонов.
Для наименьших возможных требований к памяти качающиеся шаблоны могут альтернативно сохраняться только в одном направлении: противоположное направление может выводиться с помощью обработки спектра, который является двойным, для временного зеркального отображения шаблона. Как правило, оно может получаться в частотной области с помощью вычисления комплексного сопряжения (умножения мнимой части на -1) шаблона и применения комплексной фазовой составляющей (вращения), которая зависит от фактической области (ODFT, CMDCT и т.д.).
Качество сигнала, которое может быть получено с помощью синтеза сокращенных спектральных шаблонов, зависит от типа окна, которое обычно уже определяется кодеком с преобразованием, и от фактического выбора длины шаблона, которая может настраиваться для полного воспринимаемого качества кодека, и от доступных ресурсов (памяти, сложности вычислений).
Фиг. 5 показывает отношение сигнал/шум (ОСШ) сокращенного шаблона тона в качестве функции от длины шаблона для окна синуса. В частности, фиг. 5 показывает среднее ОСШ в качестве функции от длины шаблона для окна синуса. В сценарии, описанном относительно фиг. 3, сокращение шаблонов, например, на 19 элементов, приводит к среднему ОСШ приблизительно 65 дБ. Если более низкое ОСШ является приемлемым, например, в кодеке с очень низкой скоростью передачи данных, то длина шаблона, равная 5 элементов разрешения, может быть уже достаточной.
Фиг. 6a изображает разновидность иллюстрации на фиг. 2, причем фиг. 6a показывает мгновенную частоту в моменты времени для накладывающихся блоков согласно вариантам осуществления.
Фиг. 6b показывает движение вперед фазы для основных функций DCT и DCT IV согласно вариантам осуществления по отношению к диаграмме, обеспеченной на фиг. 6a.
Фиг. 6c показывает энергетический спектр 670, заменяемый спектр 675 MDCT, квантованный спектр 680 MDCT и спектр 685 MDCT с шаблонами согласно варианту осуществления.
Квантованный спектр 680 MDCT сгенерирован на стороне кодера с помощью квантования замещенного спектра 675 MDCT. Замещенный спектр 675 MDCT сгенерирован, основываясь на спектре входного звукового сигнала (не показан), как описано выше для кодера, и основываясь на энергетическом спектре 670.
Квантованный спектр 680 MDCT будет получен на стороне декодера с помощью обработки спектра кодированного звукового сигнала (не показан) для получения квантованного спектра 680 MDCT в качестве спектра декодированного звукового сигнала.
Как можно заметить на фиг. 6c, псевдокоэффициенты 691, 692, 693, 694, 695 и 696 в спектре 680 декодированного звукового сигнала заменяются спектральными шаблонами 651, 652, 653, 654, 655 и 656, соответственно.
Для того же самого сценария кодека с низкой скоростью передачи данных, как приведено выше, вычислительная сложность вновь предложенного синтеза шаблона тона сравнивается с вычислительной сложностью простого набора осцилляторов в области времени. Предполагалось, что максимум 20 синусоидальных дорожек активны при кодировании монофонического объекта при установке полностью перцепционного кодека при довольно низкой скорости передачи данных, равной 13,2 кбит/с. Вычислительная рабочая нагрузка измерялась при реализации кодека C. Каждый из объектов, используемых для измерений, содержал по меньшей мере один инструмент с доминирующим тоном с богатым содержанием обертонов (например, камертон-дудку, скрипку, клавесин, саксофон, ансамбль медных духовых инструментов). В среднем, вычислительная сложность синтеза на основе шаблона тона составляет только 10% от прямой реализации с использованием набора осцилляторов в области времени.
Вышеописанные варианты осуществления обеспечивают концепции для улучшения звуковых кодеров с низкой скоростью передачи данных на основе MDCT с помощью генерации параметрических синусоид и свип-синусоид. Применяя обеспеченные концепции, такие сигналы могут очень эффективно генерироваться в декодере, используя шаблоны тона, которые настраиваются с помощью последующей обработки сдвига по фазе. Для фактического синтеза этих шаблонов тона может совместно использоваться набор фильтров IMDCT кодера. Как описано выше, начальный выбор спектральной разрешающей способности определяет нижнюю критическую частоту для соответствующей восприятию генерации тона, требований к памяти и вычислительной сложности необходимой последующей обработки шаблона. В примерном сценарии звукового кодека с низкой скоростью передачи данных снижение вычислительной сложности на 90% при ОСШ 65 дБ было достигнуто по сравнению с воплощением набора осцилляторов в области времени.
Когда одно решение будет использовать набор осцилляторов в области времени на полной частоте дискретизации, такое решение будет обеспечивать гладкую интерполяцию между последовательными параметрами. Однако, это решение является очень напряженным в вычислительном отношении.
Для низкой в вычислительном отношении сложности выгодно использовать спектральные шаблоны MDCT ToneFilling (TF). Там спектры могут исправляться с помощью шаблонов TF со скоростью блока выборок. Сокращенные спектральные шаблоны могут сохраняться, например, в таблице, например, в таблице базы данных или в запоминающем устройстве.
В вариантах осуществления обеспечена «интерполяция» синусоидальных дорожек амплитуды с помощью 50% накладывающегося окна синтеза и частоты с помощью выбора качающихся шаблонов с соответствующим наклоном, что в вычислительном отношении очень эффективно.
Варианты осуществления обеспечивают разработку шаблона в области времени для минимальной ступенчатости. Фаза и мгновенная частота (IF) точно соответствуют в моменты времени, когда накладывающиеся блоки имеют равные веса.
Как можно заметить на фиг. 6a, точки симметрии расположены в
n0: ¼*b_length+0,5; и
n1: ¾*b_length+0,5.
Для бесшовной подгонки синусоидальной дорожки согласно варианту осуществления шаблоны выбираются из шаблона целого элемента разрешения («положение на элементе разрешения»), шаблона дробного элемента разрешения («положение между элементами разрешения») и линейных свип-синусоид: свип-синусоид половины, целого и полутора элементов разрешения.
Выбранные шаблоны настраиваются к намеченному расположению в сетке в/ч MDCT с помощью проведения масштабирование амплитуды, и по отношению к фазе с помощью проведения комплексного поворота (вращения) в качестве функции от исходного расположения шаблона, целевого расположения, временной фазы предыдущего элемента.
Из-за ограниченной разрешающей способности по частоте необходимо только дискретное множество предопределенных поворотов, в частности:
- повороты на Ν*π/2 через перестановку действительной и мнимой части и знака; и
- повороты на N*π/4, воплощаемые с помощью предварительно повернутых на π/4 шаблонов.
Воплощение сдвига по времени MDCT требует шаблонов/исправлений в области ODFT. Разрешающая способность половины элемента разрешения реализуется с помощью степени детализации фазы π/2 и двух шаблонов различного типа.
Частотный сдвиг ODFT/DCT-IV реализуется с помощью движения вперед фазы на +π/2 или -π/2 шаблонов целого элемента разрешения, с помощью движения вперед фазы на 0 или π дробного элемента разрешения, и зависит от четности (четный/нечетный) номера элемента разрешения. Это показывается на фиг. 6b.
В вариантах осуществления все шаблоны сохраняются в 4 вариантах, охватывающих комбинации альтернативных вариантов:
целочисленный элемент разрешения или дробный элемент разрешения:
- ϕ=0 или ϕ=π/4 (предварительно повернутый, необходимый для обработки свип-синусоид половины элемента разрешения).
В вариантах осуществления качающиеся шаблоны имеют дополнительно 6 вариантов, охватывающих комбинации альтернативных вариантов:
свип-синусоиды половины, целого или полутора элементов разрешения; и
вверх или вниз.
Это приводит к общему количеству: 4* (1 постоянный + 6 качающихся)=28 комплексных шаблонов. Фактическим исправлением является действительная часть окончательного (повернутого) шаблона.
Обеспеченные концепции могут, например, использоваться для USAC, в частности - в кодированном с преобразованием тракте передачи сигналов.
Суммируя приведенное выше, MDCT важно для кодирования тональных сигналов при низких скоростях передачи данных из-за возникновения искажения «подвывания». Классическая психоакустическая модель, однако, не объясняет это. Таким образом, необходима модель наименьшего раздражения. Средства параметрического кодирования могут помочь при низких скоростях передачи данных. Искажения ToneFilling могут быть менее раздражающими, чем «подвывание».
Эффективная реализация осцилляторов ToneFilling может достигаться с помощью исправления настроенных в/ч шаблонов MDCT. Используя ToneFilling, получается достаточное качество при кодировании тональной музыки с низкой скоростью передачи данных и с низкой задержкой.
В последующем обеспечено описание, относящееся к некоторым дополнительным вариантам осуществления.
Фиг. 10 показывает устройство для генерации выходного звукового сигнала, основываясь на спектре кодированного звукового сигнала.
Устройство содержит блок 110 обработки для обработки спектра кодированного звукового сигнала для получения спектра декодированного звукового сигнала. Спектр декодированного звукового сигнала содержит множество спектральных коэффициентов, причем каждый из спектральных коэффициентов имеет спектральное расположение в спектре кодированного звукового сигнала и спектральное значение, причем спектральные коэффициенты последовательно упорядочиваются согласно их спектральному расположению в спектре кодированного звукового сигнала так, чтобы спектральные коэффициенты сформировали последовательность спектральных коэффициентов.
Кроме того, устройство содержит средство 120 определения псевдокоэффициентов для определения одного или большего количества псевдокоэффициентов спектра декодированного звукового сигнала, используя дополнительную информацию (дополнительную информацию), каждый из псевдокоэффициентов имеет спектральное расположение и спектральное значение.
Кроме того, устройство содержит блок 130 изменения спектра для установки одного или большего количества псевдокоэффициентов в предопределенное значение для получения измененного спектра звукового сигнала.
Кроме того, устройство содержит блок 140 преобразования «спектр-время» для преобразования измененного спектра звукового сигнала во временную область для обеспечения преобразованного сигнала во временной области.
Кроме того, устройство содержит управляемый осциллятор 150 для генерации во временной области сигнала осциллятора, данный управляемый осциллятор управляется с помощью спектрального расположения и спектрального значения по меньшей мере одного из одного или большего количества псевдокоэффициентов.
Кроме того, устройство содержит средство 160 смешивания для смешивания преобразованного сигнала во временной области и сигнала осциллятора во временной области для обеспечения выходного звукового сигнала.
В варианте осуществления средство смешивания может конфигурироваться для смешивания преобразованного сигнала во временной области и сигнала осциллятора во временной области с помощью добавления преобразованного сигнала во временной области к сигналу осциллятора во временной области.
Блок 110 обработки может, например, быть звуковым декодером любого вида, например, звуковым декодером MP3, звуковым декодером для WMA, звуковым декодером для файлов «wave», звуковым декодером AAC или звуковым декодером USAC.
Блок 110 обработки может, например, быть звуковым декодером, который описан в [8] (ISO/IEC 14496-3:2005-Information technology - Coding of audio-visual objects-Part 3: Audio, Subpart 4) или который описан в [9] (ISO/IEC 14496-3:2005 - Information technology - Coding of audio-visual objects - Part 3: Audio, Subpart 4). Например, блок 430 обработки может содержать повторное масштабирование квантованных значений («деквантование»), и/или средство формирования временного шума, которое, например, описано в [8], и/или блок 430 обработки может содержать средство подстановки воспринимаемого шума, которое, например, описано в [8].
Согласно варианту осуществления каждый из спектральных коэффициентов может иметь по меньшей мере один из непосредственно предыдущего элемента и непосредственно последующего элемента, причем непосредственно предыдущий элемент для указанного спектрального коэффициента может быть одним из спектральных коэффициентов, который непосредственно предшествует указанному спектральному коэффициенту в последовательности, причем непосредственно последующий элемент для указанного спектрального коэффициента может быть одним из спектральных коэффициентов, который непосредственно следует за указанным спектральным коэффициентом в последовательности.
Средство 120 определения псевдокоэффициентов может конфигурироваться для определения одного или большего количества псевдокоэффициентов спектра декодированного звукового сигнала с помощью определения по меньшей мере одного спектрального коэффициента последовательности, который имеет спектральное значение, которое отличается от предопределенного значения, который имеет непосредственно предыдущий элемент, спектральное значение которого равно предопределенному значению, и который имеет непосредственно последующий элемент, спектральное значение которого равно предопределенному значению. В варианте осуществления предопределенное значение может быть нулем, и предопределенное значение может быть нулем.
Другими словами: средство 120 определения псевдокоэффициентов определяет для некоторых или всех коэффициентов спектра декодированного звукового сигнала, отличается или нет соответственно рассматриваемый коэффициент от предопределенного значения (предпочтительно: отличающегося от 0), равно или нет спектральное значение предыдущего коэффициента предопределенному значению (предпочтительно: равному 0), и равно или нет спектральное значение последующего коэффициента предопределенному значению (предпочтительно:равному 0).
В некоторых вариантах осуществления такой определенный коэффициент всегда является псевдокоэффициентом.
В других вариантах осуществления, однако, такой определенный коэффициент является (только) псевдокоэффициентом-кандидатом, и может быть или может не быть псевдокоэффициентом. В этих вариантах осуществления средство 120 определения псевдокоэффициентов конфигурируется для определения по меньшей мере одного псевдокоэффициента-кандидата, который имеет спектральное значение, которое отличается от предопределенного значения, который имеет непосредственно предыдущий элемент, спектральное значение которого равно предопределенному значению, и который может иметь непосредственно последующий элемент, спектральное значение которого равно предопределенному значению.
Средство 120 определения псевдокоэффициентов затем конфигурируется для определения, является или нет псевдокоэффициент-кандидат псевдокоэффициентом, определяя, указывает или нет дополнительная информация, что указанный псевдокоэффициент-кандидат является псевдокоэффициентом.
Например, такая дополнительная информация может приниматься с помощью средства 120 определения псевдокоэффициентов в битовом поле, которое указывает для каждого из спектральных коэффициентов квантованного спектра звукового сигнала, который имеет непосредственно предыдущее значение, спектральное значение которого равно предопределенному значению, и непосредственно последующий элемент, спектральное значение которого равно предопределенному значению, что указанный коэффициент является одним из коэффициентов экстремума (например, битовое значение 1) или что указанный коэффициент не является одним из коэффициентов экстремума (например, битовое значение 0).
Например, битовое поле [000111111] может указывать, что первые три «обособленных» коэффициента (их спектральное значение не равно предопределенному значению, но спектральные значения предыдущего по отношению к ним элемента и последующего по отношению к ним элемента равны предопределенному значению), которые появляются в (последовательно упорядоченном) (квантованном) спектре звукового сигнала, не являются коэффициентами экстремума, но последующие шесть «обособленных» коэффициентов являются коэффициентами экстремума. Это битовое поле описывает ситуацию, которую можно заметить в квантованном спектре 635 MDCT на фиг. 9, где первые три «обособленных» коэффициента 5, 8, 25 не являются коэффициентами экстремума, но где последующие шесть «обособленных» коэффициентов 59, 71, 83, 94, 116, 141 являются коэффициентами экстремума.
Блок 130 изменения спектра может конфигурироваться для «удаления» псевдокоэффициентов из спектра декодированного звукового сигнала. Фактически, блок изменения спектра устанавливает спектральное значение псевдокоэффициентов спектра декодированного звукового сигнала в предопределенное значение (предпочтительно в 0). Это обоснованно, поскольку только (по меньшей мере один) псевдокоэффициент будет необходим для управления (по меньшей мере одним) управляемым осциллятором 150. Таким образом, рассматривают, например, квантованный спектр 635 MDCT на фиг. 9. Если спектр 635 рассматривают как спектр декодированного звукового сигнала, то блок 130 изменения спектра устанавливает спектральные значения коэффициентов 59, 71, 83, 94, 116 и 141 экстремума для получения измененного спектра звукового сигнала и оставляет другие коэффициенты спектра неизмененными.
Блок 140 преобразования «спектр-время» преобразовывает измененный спектр звукового сигнала из спектральной области во временную область. Например, измененный спектр звукового сигнала может быть спектром MDCT, и блок 140 преобразования «спектр-время» может быть набором фильтров обратного модифицированного дискретного косинусного преобразования (IMDCT). В других вариантах осуществления спектр может быть спектром MDST, и блок 140 преобразования «спектр-время» может быть набором фильтров обратного измененного дискретного синусного преобразования (IMDST). Или в дополнительных вариантах осуществления спектр может быть спектром DFT, и блок 140 преобразования «спектр-время» может быть набором фильтров обратного дискретного преобразования Фурье (IDFT).
Управляемый осциллятор 150 может конфигурироваться для генерации сигнала осциллятора во временной области, имеющего частоту сигнала осциллятора, так, чтобы частота сигнала осциллятора могла зависеть от спектрального расположения одного из одного или большего количества псевдокоэффициентов. Сигнал осциллятора, сгенерированный с помощью осциллятора, может быть синусоидальным сигналом во временной области. Управляемый осциллятор 150 может конфигурироваться для управления амплитудой синусоидального сигнала во временной области в зависимости от спектрального значения одного из одного или большего количества псевдокоэффициентов.
Согласно варианту осуществления псевдокоэффициенты являются значениями со знаком, каждый содержит компоненту знака. Управляемый осциллятор 150 может конфигурироваться для генерации во временной области сигнала генератора так, что частота сигнала осциллятора кроме того может зависеть от компоненты знака одного из одного или большего количества псевдокоэффициентов, так, чтобы частота сигнала осциллятора могла иметь первое значение частоты, когда компонента знака имеет первое значение знака, и так, чтобы частота сигнала осциллятора могла иметь отличающееся второе значение частоты, когда компонента знака имеет отличающееся второе значение.
Например, рассматривают псевдокоэффициент в спектральном расположении 59 в спектре 635 MDCT на фиг. 9. Если частота 8200 Гц назначена спектральному расположению 59 и если частота 8400 Гц назначена спектральному расположению 60, то управляемый осциллятор может, например, конфигурироваться, устанавливая частоту осциллятора в 8200 Гц, если знак спектрального значения псевдокоэффициента является положительным, и может, например, конфигурироваться, устанавливая частоту осциллятора в 8300 Гц, если знак спектрального значения псевдокоэффициента является отрицательным.
Таким образом, знак спектрального значения псевдокоэффициента может использоваться для управления, устанавливает или нет управляемый осциллятор частоту осциллятора в значение частоты (например, 8200 Гц), назначенной спектральному расположению, выведенному из псевдокоэффициента (например, спектральному расположению 59), или в значение частоты (например, 8300 Гц) между частотой (например, 8200 Гц), назначенной спектральному расположению, выведенному из псевдокоэффициента (например, спектральному расположению 59), и частотой (например, 8400 Гц), назначенной спектральному расположению, которое непосредственно следует за спектральным расположением, выведенным из псевдокоэффициента (например, спектральному расположению 60).
Фиг. 11 показывает вариант осуществления, в котором устройство дополнительно содержит управляемые осцилляторы 252, 254, 256 для генерации дополнительно сигналов осциллятора во временной области, которыми управляют спектральные значения дополнительных псевдокоэффициентов одного или большего количества псевдокоэффициентов. Дополнительно, каждый из управляемых осцилляторов 252, 254, 256 генерирует один из дополнительных сигналов осциллятора во временной области. Каждый из управляемых осцилляторов 252, 254, 256 конфигурируется для регулировки частоты сигнала генератора, основываясь на спектральном расположении, выведенном из одного из псевдокоэффициентов. И/или каждый из управляемых осцилляторов 252, 254, 256 конфигурируется для регулировки амплитуды сигнала осцилляторов, основываясь на спектральном значении одного из псевдокоэффициентов.
Дополнительно, каждый из управляемых осцилляторов 252, 254, 256 генерирует один из дополнительных сигналов осциллятора во временной области. Каждый из управляемых осцилляторов 252, 254, 256 конфигурируется для регулировки частоты сигнала генератора, основываясь на спектральном расположении одного из псевдокоэффициентов. И/или каждый из управляемых осцилляторов 252, 254, 256 конфигурируется для регулировки амплитуды сигнала осциллятора, основываясь на спектральном значении одного из псевдокоэффициентов.
Средство 160 смешивания на фиг. 10 и фиг. 11 конфигурируется для смешивания сигнала преобразования во временной области, сгенерированного с помощью блока 140 преобразования «спектр-время», и одного или большего количества сигналов осциллятора во временной области, сгенерированных с помощью одного или большего количества управляемых осцилляторов 150, 252, 254, 256, для обеспечения выходного звукового сигнала. Средство 160 смешивания может генерировать выходной звуковой сигнал с помощью наложения сигнала преобразования во временной области и одного или большего количества сигналов осциллятора во временной области.
Фиг. 12 показывает две диаграммы, сравнивающие исходные (слева) синусоиды и синусоиды после того, как они обработаны с помощью соединения MDCT/IMDCT (справа). После обработки с помощью соединения MDCT/IMDCT синусоида содержит искажения «подвывания». Концепции, обеспеченные выше, избегают того, чтобы синусоиды обрабатывались с помощью соединения MDCT/IMDCT, но вместо этого синусоидальная информация кодируется с помощью псевдокоэффициента и/или синусоида воспроизводится с помощью управляемого осциллятора.
Хотя некоторые аспекты описаны в контексте устройства, ясно, что эти аспекты также представляют описание соответствующего способа, где блок или устройство соответствуют этапу способа или особенности этапа способа. Аналогично, аспекты, описанные в контексте этапа способа, также представляют описание соответствующего блока или элемента или особенности соответствующего устройства.
Изобретенный разделенный на части сигнал может сохраняться на цифровом носителе данных или может передаваться по среде передачи, такой как беспроводная среда передачи или проводная среда передачи, такой как Интернет.
В зависимости от конкретных требований реализации варианты осуществления изобретения могут воплощаться в аппаратных средствах или в программном обеспечении. Данное воплощение может выполняться, используя цифровой носитель данных, например, гибкий диск, DVD (цифровой универсальный диск), CD (компакт-диск), ПЗУ (постоянное запоминающее устройство), ППЗУ (программируемое ПЗУ), СППЗУ (стираемое программируемое ПЗУ), ЭСППЗУ (электрически стираемое программируемое ПЗУ) или флэш-память, на котором хранятся считываемые с помощью электроники управляющие сигналы, которые взаимодействуют (или способны к взаимодействию) с программируемой компьютерной системой таким образом, что выполняется соответствующий способ.
Некоторые варианты осуществления согласно изобретению содержат не являющийся временным носитель информации, имеющий считываемые с помощью электроники управляющие сигналы, которые способны к взаимодействию с программируемой компьютерной системой, таким образом, что выполняется один из способов, описанных в данной работе.
В общем случае варианты осуществления настоящего изобретения могут воплощаться как компьютерный программный продукт с кодом программы, код программы работает для выполнения одного из способов, когда компьютерный программный продукт выполняется на компьютере. Код программы может, например, сохраняться на машиночитаемом носителе.
Другие варианты осуществления содержат компьютерную программу для выполнения одного из способов, описанных в данной работе, сохраненную на машиночитаемом носителе.
Другими словами, вариантом осуществления изобретенного способа поэтому является компьютерная программа, имеющая код программы для выполнения одного из способов, описанных в данной работе, когда компьютерная программа выполняется на компьютере.
Дополнительным вариантом осуществления изобретенных способов поэтому является носитель информации (или цифровой носитель данных, или считываемый компьютером носитель данных), содержащий записанную на нем компьютерную программу для выполнения одного из способов, описанных в данной работе.
Дополнительным вариантом осуществления изобретенного способа поэтому является поток данных или последовательность сигналов, представляющих компьютерную программу для выполнения одного из способов, описанных в данной работе. Поток данных или последовательность сигналов могут, например, конфигурироваться для перемещения через соединение передачи данных, например, через Интернет.
Дополнительный вариант осуществления содержит средство обработки, например, компьютер или программируемое логическое устройство, конфигурируемое или настраиваемое для выполнения одного из способов, описанных в данной работе.
Дополнительный вариант осуществления содержит компьютер, на котором установлена компьютерная программа для выполнения одного из способов, описанных в данной работе.
В некоторых вариантах осуществления программируемое логическое устройство (например, программируемая пользователем вентильная матрица) может использоваться для выполнения некоторых или всех функциональных возможностей способов, описанных в данной работе. В некоторых вариантах осуществления программируемая пользователем вентильная матрица может взаимодействовать с микропроцессором для выполнения одного из способов, описанных в данной работе. В общем случае способы предпочтительно выполняются с помощью какого-либо аппаратного устройства.
Вышеописанные варианты осуществления являются просто иллюстративными для принципов настоящего изобретения. Подразумевается, что изменения и разновидности структур и деталей, описанных в данной работе, будут очевидны специалистам. Поэтому намерением является ограничение изобретения только формой последующих пунктов формулы изобретения, а не конкретными деталями, представленными посредством описания и объяснения вариантов осуществления в данной работе.
Ссылки
[1] Daudet, L.; Sandler, M.; , «MDCT analysis of sinusoids: exact results and applications to coding artifacts reduction,» Speech and Audio Processing, IEEE Transactions on, vol. 12, no. 3, pp. 302-312, May 2004.
[2] Purnhagen. H.; Meine, N.;, «HILN-the MPEG-4 parametric audio coding tools,» Circuits and Systems, 2000. Proceedings. ISCAS 2000 Geneva. The 2000 IEEE International Symposium an, vol. 3, no., pp. 201-204 vol. 3, 2000.
[3] Oomen, Werner; Schuijers, Erik; den Brinker, Bert; Breebaart, Jeroen:,» Advances in Parametrie Coding for High-Quality Audio,» Audio Engineering Society Convention 114, preprint, Amsterdam/NL, March 2003.
[4] van Schijndel, N.H.; van de Par, S.; «Rate-distortion optimized hybrid sound coding,» Applications of Signal Processing to Audio and Acoustics, 2005. IEEE Workshop on, vol., no., pp. 235-238, 16-19 Oct. 2005.
[5] Bessette, 8.; Lefebvre, R.; Salami, R.; «Universal speech/audio coding using hybrid ACELP/TCX techniques,» Acoustics, Speech, and Signal Processing, 2005. Proceedings. (ICASSP Ό5). IEEE International Conference on, vol. 3, no., pp. iii/301-iii/304 Val. 3, 18-23 March 2005.
[6] Ferreira, A.J.S. «Combined spectral envelope normalization and subtraction of sinusoidal components in the ODFT and MDCT frequency domains,» Applications of Signal Processing to Audio and Acoustics. 2001 IEEE Workshop on the vol., no., pp.51-54. 2001.
[7] http://people.xiph.org/~xiphmont/demo/ghost/demo.html
Соответствующий archive.org-website хранится в:
http://web.archive.org/web/20110121141149/http://people.xiph.org/~xiphmont/ demo/ghost/demo.html.
[8] ISO/IEC 14496-3:2005(E) - Information technology - Coding of audio-visual objects - Part 3:Audio, Subpart 4.
[9] ISO/IEC 14496-3:2009(E) - Information technology - Coding of audio-visual objects - Part 3:Audio, Subpart 4.
[10] Anibal J. S. Ferreira. Perceptual coding using sinusoidal modeling in the mdct domain. In Audio Engineering Society Convention 112, 4 2002.
[11] Deepen Ferreira, Anibal J. S.; Sinha. Accurate spectral replacement. In Audio Engineering Society Convention JJ 8, 5 2005.
[12] Rade Kutil. Optimized sinusoid synthesis via inverse truncated fourier transform. Trans. Audio. Speech and Lang. Proc, 17(2):221-230, February 2009.
[13] Nikolaus Meine and Heiko Pumhagen. Fast sinusoid synthesis for mpeg-4 hiln parametric audio decoding. Proc. of the 5 th Int. Conference on Digital Audio Effects (DAFx-02), Hamburg, Germany, September 26-28, 2002, 0(0), 2002.
название | год | авторы | номер документа |
---|---|---|---|
УСТРОЙСТВО И СПОСОБ ДЛЯ КОДИРОВАНИЯ И ДЕКОДИРОВАНИЯ АУДИО, ПРИМЕНЯЮЩИЕ СИНУСОИДАЛЬНУЮ ЗАМЕНУ | 2012 |
|
RU2562383C2 |
УСТРОЙСТВО И СПОСОБ УЛУЧШЕННОГО ПЛАВНОГО ИЗМЕНЕНИЯ СИГНАЛА В РАЗЛИЧНЫХ ОБЛАСТЯХ ВО ВРЕМЯ МАСКИРОВАНИЯ ОШИБОК | 2014 |
|
RU2675777C2 |
УСТРОЙСТВО И СПОСОБ, РЕАЛИЗУЮЩИЕ УЛУЧШЕННЫЕ КОНЦЕПЦИИ ДЛЯ TCX LTP | 2014 |
|
RU2665279C2 |
УСТРОЙСТВО И СПОСОБ ДЛЯ УЛУЧШЕННОГО ПЛАВНОГО ИЗМЕНЕНИЯ СИГНАЛА ДЛЯ ПЕРЕКЛЮЧАЕМЫХ СИСТЕМ КОДИРОВАНИЯ ЗВУКА ВО ВРЕМЯ МАСКИРОВАНИЯ ОШИБОК | 2014 |
|
RU2666250C2 |
УСТРОЙСТВО И СПОСОБ ДЛЯ ГЕНЕРАЦИИ АДАПТИВНОЙ ФОРМЫ СПЕКТРА КОМФОТНОГО ШУМА | 2014 |
|
RU2658128C2 |
УСТРОЙСТВО И СПОСОБ, РЕАЛИЗУЮЩИЕ ПЛАВНОЕ ИЗМЕНЕНИЕ СПЕКТРА MDCT К БЕЛОМУ ШУМУ ПЕРЕД ПРИМЕНЕНИЕМ FDNS | 2014 |
|
RU2676453C2 |
СИСТЕМА ОБРАБОТКИ АУДИО | 2014 |
|
RU2625444C2 |
ОСНОВАННАЯ НА ЛИНЕЙНОМ ПРЕДСКАЗАНИИ СХЕМА КОДИРОВАНИЯ, ИСПОЛЬЗУЮЩАЯ ФОРМИРОВАНИЕ ШУМА В СПЕКТРАЛЬНОЙ ОБЛАСТИ | 2012 |
|
RU2575993C2 |
ПРЕОБРАЗУЮЩЕЕ КОДИРОВАНИЕ/ДЕКОДИРОВАНИЕ ГАРМОНИЧЕСКИХ ЗВУКОВЫХ СИГНАЛОВ | 2012 |
|
RU2611017C2 |
ПРЕОБРАЗУЮЩЕЕ КОДИРОВАНИЕ/ДЕКОДИРОВАНИЕ ГАРМОНИЧЕСКИХ ЗВУКОВЫХ СИГНАЛОВ | 2017 |
|
RU2744477C2 |
Изобретение относится к средствам для кодирования, декодирования и обработки звукового сигнала. Технический результат заключается в повышении эффективности кодирования звука с низкой задержкой и низкой скоростью передачи данных. Устройство для генерации выходного звукового сигнала содержит блок обработки для обработки спектра кодированного звукового сигнала для получения спектра декодированного звукового сигнала, содержащего множество спектральных коэффициентов, причем каждый из спектральных коэффициентов имеет спектральное расположение в спектре кодированного звукового сигнала и спектральное значение, причем спектральные коэффициенты последовательно упорядочиваются согласно их спектральному расположению в спектре кодированного звукового сигнала так, чтобы спектральные коэффициенты сформировали последовательность спектральных коэффициентов. Кроме того, устройство содержит блок замены для замены по меньшей мере одного или большего количества псевдокоэффициентов определенным спектральным шаблоном для получения измененного спектра звукового сигнала, причем определенный спектральный шаблон содержит по меньшей мере два коэффициента шаблона, причем каждый по меньшей мере из двух коэффициентов шаблона имеет спектральное значение. 6 н. и 17 з.п. ф-лы, 17 ил., 4 табл.
1. Устройство для генерации выходного звукового сигнала, основываясь на спектре кодированного звукового сигнала, содержащее:
блок (115) обработки для обработки спектра кодированного звукового сигнала для получения спектра декодированного звукового сигнала, содержащего множество спектральных коэффициентов, причем каждый из спектральных коэффициентов имеет спектральное расположение в спектре кодированного звукового сигнала и спектральное значение, причем спектральные коэффициенты последовательно упорядочиваются согласно их спектральному расположению в спектре кодированного звукового сигнала так, чтобы спектральные коэффициенты сформировали последовательность спектральных коэффициентов,
средство (125) определения псевдокоэффициентов для определения одного или большего количества псевдокоэффициентов спектра декодированного звукового сигнала, причем каждый из псевдокоэффициентов является одним из спектральных коэффициентов,
блок (135) замены для замены по меньшей мере одного или большего количества псевдокоэффициентов определенным спектральным шаблоном для получения измененного спектра звукового сигнала, причем определенный спектральный шаблон содержит по меньшей мере два коэффициента шаблона, причем каждый по меньшей мере из двух коэффициентов шаблона имеет спектральное значение, и
блок (145) преобразования «спектр-время» для преобразования измененного спектра звукового сигнала во временную область для обеспечения выходного звукового сигнала.
2. Устройство по п. 1,
в котором устройство дополнительно содержит блок (155) хранения, содержащий базы данных или память, хранящий в базе данных или в памяти множество сохраненных спектральных шаблонов,
в котором блок (135) замены конфигурируется для запроса из блока (155) хранения одного из сохраненных спектральных шаблонов в качестве запрашиваемого спектрального шаблона,
в котором блок (155) хранения конфигурируется для обеспечения запрашиваемого спектрального шаблона, и
в котором блок (135) замены конфигурируется для замены по меньшей мере одного или большего количества псевдокоэффициентов определенным спектральным шаблоном, основываясь на запрашиваемом спектральном шаблоне.
3. Устройство по п. 2, в котором блок (135) замены конфигурируется для запроса из блока (155) хранения указанного одного из сохраненных спектральных шаблонов в зависимости от первого выведенного спектрального расположения, выведенного по меньшей мере из одного из одного или большего количества псевдокоэффициентов, определенных с помощью средства (125) определения псевдокоэффициентов.
4. Устройство по п. 3,
в котором каждый псевдокоэффициент из одного или большего количества псевдокоэффициентов содержит компоненту знака, которая имеет либо первое значение знака, либо второе значение знака, отличающееся от первого значения знака, и
в котором блок (135) замены конфигурируется для определения первого выведенного спектрального расположения, основываясь на спектральном расположении одного псевдокоэффициента из одного или большего количества псевдокоэффициентов и основываясь на компоненте знака указанного псевдокоэффициента так, чтобы первое выведенное спектральное расположение было равно спектральному расположению указанного псевдокоэффициента, когда компонента знака имеет первое значение знака, и так, чтобы первое выведенное спектральное расположение было равно измененному расположению, причем измененное расположение получают в результате смещения спектрального расположения указанного псевдокоэффициента на предопределенное значение, когда компонента знака имеет отличающееся второе значение.
5. Устройство по п. 3,
в котором множество сохраненных спектральных шаблонов, хранящихся в базе данных или памяти из блока (155) хранения, являются или шаблонами постоянного тона, или шаблонами частоты,
в котором средство (125) определения псевдокоэффициентов конфигурируется для определения двух или большего количества последовательных во времени псевдокоэффициентов спектра декодированного звукового сигнала,
в котором блок (135) замены конфигурируется для назначения дорожке первого псевдокоэффициента и второго псевдокоэффициента из двух или большего количества последовательных во времени псевдокоэффициентов в зависимости от того, меньше или нет абсолютная разница между первым выведенным спектральным расположением, выведенным из первого псевдокоэффициента, и вторым выведенным спектральным расположением, выведенным из второго псевдокоэффициента, чем пороговое значение, и
в котором блок (135) замены конфигурируется для запроса из блока (155) хранения одного из шаблонов постоянного тона, когда первое выведенное спектральное расположение, выведенное из первого псевдокоэффициента дорожки, равно второму выведенному спектральному расположению, выведенному из второго псевдокоэффициента дорожки, и причем блок (135) замены конфигурируется для запроса из блока (155) хранения одного из шаблонов частоты, когда первое выведенное спектральное расположение, выведенное из первого псевдокоэффициента дорожки, отличается от второго выведенного спектрального расположения, выведенного из второго псевдокоэффициента дорожки.
6. Устройство по п. 5,
в котором блок (135) замены конфигурируется для запроса из блока (155) хранения первого шаблона частоты из шаблонов частоты, когда разница частот между вторым выведенным спектральным расположением, выведенным из второго псевдокоэффициента дорожки, и первым выведенным спектральным расположением, выведенным из первого псевдокоэффициента дорожки, равна половине предопределенного значения,
в котором блок (135) замены конфигурируется для запроса из блока (155) хранения второго шаблона частоты, который отличается от первого шаблона частоты, из шаблонов частоты, когда разница частот между вторым выведенным спектральным расположением, выведенным из второго псевдокоэффициента дорожки, и первым выведенным спектральным расположением, выведенным из первого псевдокоэффициента дорожки, равна предопределенному значению, и
в котором блок (135) замены конфигурируется для запроса из блока (155) хранения третьего шаблона частоты, который отличается от первого шаблона и второго шаблона частоты, из шаблонов частоты, когда разница частот между вторым выведенным спектральным расположением, выведенным из второго псевдокоэффициента дорожки, и первым выведенным спектральным расположением, выведенным из первого псевдокоэффициента дорожки, равна полутора предопределенным значениям.
7. Устройство по п. 2, в котором блок (135) замены содержит блок (138) адаптации шаблона, конфигурируемый для изменения запрашиваемого спектрального шаблона, обеспеченного с помощью блока (155) хранения, для получения определенного спектрального шаблона.
8. Устройство по п. 7, в котором блок (138) адаптации шаблона конфигурируется для изменения запрашиваемого спектрального шаблона, обеспеченного с помощью блока (155) хранения с помощью повторного масштабирования спектральных значений коэффициентов шаблона запрашиваемого спектрального шаблона в зависимости от спектрального значения одного из одного или большего количества псевдокоэффициентов
9. Устройство по п. 7, в котором блок (138) адаптации шаблона конфигурируется для изменения запрашиваемого спектрального шаблона, обеспеченного с помощью блока (155) хранения, в зависимости от начальной фазы так, чтобы спектральное значение каждого из коэффициентов шаблона запрашиваемого спектрального шаблона изменялось первым способом, когда начальная фаза имеет первое значение начальной фазы, и так, чтобы спектральное значение каждого из коэффициентов шаблона запрашиваемого спектрального шаблона изменялось отличающимся вторым способом, когда начальная фаза имеет отличающееся второе значение начальной фазы.
10. Устройство по п. 7,
в котором спектральное значение каждого из коэффициентов шаблона запрашиваемого спектрального шаблона является комплексным коэффициентом, содержащим действительную часть и мнимую часть, и
в котором блок (138) адаптации шаблона конфигурируется для изменения запрашиваемого спектрального шаблона с помощью изменения действительной части и мнимой части каждого из коэффициентов шаблона запрашиваемого спектрального шаблона, обеспеченного с помощью блока (155) хранения, с помощью применения множителя.
11. Устройство по п. 7,
в котором спектральное значение каждого из коэффициентов шаблона запрашиваемого спектрального шаблона является комплексным коэффициентом, содержащим действительную часть и мнимую часть, и
в котором блок (138) адаптации шаблона конфигурируется для изменения запрашиваемого спектрального шаблона, обеспеченного с помощью блока (155) хранения, с помощью инвертирования действительной и мнимой части спектрального значения каждого из коэффициентов шаблона запрашиваемого спектрального шаблона, или с помощью перестановки действительной части или инвертированной действительной части и мнимой части или инвертированной мнимой части спектрального значения каждого из коэффициентов шаблона запрашиваемого спектрального шаблона.
12. Устройство по п. 7, в котором блок (138) адаптации шаблона конфигурируется для изменения запрашиваемого спектрального шаблона, обеспеченного с помощью блока (155) хранения, с помощью реализации временного зеркального отображения шаблона с помощью вычисления комплексного сопряжения шаблона и применения комплексной фазовой составляющей.
13. Устройство по п. 7,
в котором спектр декодированного звукового сигнала представлен в области MDCT,
в котором блок (138) адаптации шаблона конфигурируется для изменения запрашиваемого спектрального шаблона, обеспеченного с помощью блока (155) хранения, с помощью изменения спектральных значений коэффициентов шаблона запрашиваемого спектрального шаблона для получения измененного спектрального шаблона, причем спектральные значения представлены в области нечетного дискретного преобразования Фурье,
в котором блок (135) адаптации шаблона конфигурируется для преобразования значений спектральных коэффициентов шаблона измененного спектрального шаблона из области нечетного дискретного преобразования Фурье в область MDCT для получения определенного спектрального шаблона и
в котором блок (135) замены конфигурируется для замены по меньшей мере одного или большего количества псевдокоэффициентов определенным спектральным шаблоном, представленным в области MDCT, для получения измененного спектра звукового сигнала, представленного в области MDCT.
14. Устройство для генерации множества спектральных шаблонов, содержащее:
генератор (165) сигнала для генерации множества сигналов в первой области,
блок (175) преобразования сигнала для преобразования каждого сигнала из множества сигналов из первой области во вторую область для получения множества спектральных шаблонов, каждый шаблон из множества преобразованных спектральных шаблонов содержит множество коэффициентов,
блок (18 5) последующей обработки для сокращения преобразованных спектральных шаблонов с помощью удаления одного или большего количества коэффициентов преобразованных спектральных шаблонов для получения множества обработанных шаблонов и
блок (15) хранения, содержащий базы данных или память, причем блок (195) хранения конфигурируется для хранения каждого обработанного шаблона из множества обработанных шаблонов в базе данных или в памяти,
в котором генератор (165) сигнала конфигурируется для генерации каждого сигнала из множества сигналов, основываясь на формулах
x(t)=cos(2πϕ(t))
и
,
причем t и τ указывают время,
причем ϕ(t) является мгновенной фазой в t и
причем f(τ) является мгновенной частотой в τ,
причем каждый сигнал из множества сигналов имеет начальную частоту (f0), которая является мгновенной частотой указанного сигнала в первый момент времени, и целевую частоту (f1), которая является мгновенной частотой указанного сигнала в отличающийся второй момент времени,
причем генератор (165) сигнала конфигурируется для генерации первого сигнала из множества сигналов так, чтобы целевая частота первого сигнала была равна начальной частоте, и
причем генератор (165) сигнала конфигурируется для генерации отличающегося второго сигнала из множества сигналов так, чтобы целевая частота первого сигнала отличалась от начальной частоты.
15. Устройство по п. 14.
в котором блок (175) преобразования сигнала конфигурируется для преобразования каждого сигнала из множества сигналов из первой области, которая является областью времени, во вторую область, которая является спектральной областью,
в котором блок (175) преобразования сигнала конфигурируется для генерации первого из множества блоков времени для преобразования указанного сигнала,
причем каждый блок времени из множества блоков времени содержит множество взвешенных выборок, причем каждая из указанных взвешенных выборок является выборкой указанного сигнала, взвешенной с помощью веса из множества весов, причем множество весов назначается указанному блоку времени, и причем каждый вес из множества весов назначается моменту времени,
причем начальная частота (f0) каждого сигнала из множества сигналов является мгновенной частотой указанного сигнала в первый момент времени, причем первый из весов первого из блоков времени назначается первому моменту времени, причем второй из весов отличающегося второго из блоков времени назначается первому моменту времени, причем первый из блоков времени и второй из блоков времени перекрываются, и причем первый из весов равен второму из весов, и
причем целевая частота (i) каждого сигнала из множества сигналов является мгновенной частотой указанного сигнала во второй момент времени, причем третий из весов первого из блоков времени назначается второму моменту времени, причем четвертый из весов отличающегося третьего из блоков времени назначается второму моменту времени, причем первый из блоков времени и третий из блоков времени перекрываются, и причем третий из весов равен четвертому из весов.
16. Устройство по п. 14,
в котором каждый сигнал из множества сигналов имеет начальную фазу (ϕ0), которая является фазой указанного сигнала в первый момент времени,
в котором генератор (165) сигнала конфигурируется для генерации множества сигналов таким образом, что начальная фаза (ϕ0) первого из множества сигналов равна начальной фазе (ϕ0) отличающегося второго из множества сигналов.
17. Устройство по п. 14, в котором блок (185) последующей обработки дополнительно конфигурируется для выполнения поворота на произвольный фазовый угол спектральных коэффициентов каждого из преобразованных спектральных шаблонов для получения множества произвольно повернутых спектральных шаблонов.
18. Устройство по п. 14, в котором блок (185) последующей обработки дополнительно конфигурируется для выполнения поворота на п/4 спектральных коэффициентов каждого из преобразованных спектральных шаблонов для получения множества повернутых спектральных шаблонов.
19. Устройство по п. 14, в котором генератор (165) сигнала конфигурируется для генерации первого сигнала, второго сигнала и одного или большего количества дополнительных сигналов, как множества сигналов так, чтобы каждая разница целевой частоты и начальной частоты каждого из дополнительных сигналов была целым кратным разницы целевой частоты и начальной частоты второго сигнала.
20. Способ генерации выходного звукового сигнала, основываясь на спектре кодированного звукового сигнала, содержащий этапы, на которых:
обрабатывают спектр кодированного звукового сигнала для получения спектра декодированного звукового сигнала, содержащего множество спектральных коэффициентов, причем каждый из спектральных коэффициентов имеет спектральное расположение в спектре кодированного звукового сигнала и спектральное значение, причем спектральные коэффициенты последовательно упорядочиваются согласно их спектральному расположению в спектре кодированного звукового сигнала так, чтобы спектральные коэффициенты сформировали последовательность спектральных коэффициентов,
определяют один или большее количество псевдокоэффициентов спектра декодированного звукового сигнала, причем каждый из псевдокоэффициентов является одним из спектральных коэффициентов,
заменяют по меньшей мере один или большее количество псевдокоэффициентов определенным спектральным шаблоном для получения измененного спектра звукового сигнала, причем определенный спектральный шаблон содержит по меньшей мере два коэффициента шаблона, причем каждый по меньшей мере из двух коэффициентов шаблона имеет спектральное значение, и
преобразовывают измененный спектр звукового сигнала во временную область для обеспечения выходного звукового сигнала.
21. Способ генерации множества спектральных шаблонов, содержащий этапы, на которых:
генерируют множество сигналов в первой области,
преобразовывают каждый сигнал из множества сигналов из первой области во вторую область для получения множества спектральных шаблонов, каждый шаблон из множества преобразованных спектральных шаблонов содержит множество коэффициентов,
сокращают преобразованные спектральные шаблоны с помощью удаления одного или большего количества коэффициентов преобразованных спектральных шаблонов для получения множества обработанных шаблонов и
сохраняют каждый обработанный шаблон из множества обработанных шаблонов в базе данных или в памяти,
причем генерация каждого сигнала из множества сигналов выполняется, основываясь на формулах
x(t)=cos(2πϕ(t))
и
,
причем t и τ указывают время,
причем ϕ(t) является мгновенной фазой в t и
причем f(τ) является мгновенной частотой в τ,
причем каждый сигнал из множества сигналов имеет начальную частоту (f0), которая является мгновенной частотой указанного сигнала в первый момент времени, и целевую частоту (f1), которая является мгновенной частотой указанного сигнала в отличающийся второй момент времени.
причем генерация множества сигналов осуществляется с помощью генерации первого сигнала из множества сигналов так, чтобы целевая частота (f1) первого сигнала была равна начальной частоте (f0)и
причем генерация множества сигналов осуществляется с помощью генерации отличающегося второго сигнала из множества сигналов так, чтобы целевая частота (f1) первого сигнала отличалась от начальной частоты (f0).
22. Машиночитаемый носитель, содержащий компьютерную программу для осуществления способа по п. 20 при выполнении на компьютере или процессоре обработки сигналов.
23. Машиночитаемый носитель, содержащий компьютерную программу для осуществления способа по п. 21 при выполнении на компьютере или процессоре обработки сигналов.
EP 0713295 A1, 22.05.1996 | |||
Способ приготовления мыла | 1923 |
|
SU2004A1 |
Способ приготовления лака | 1924 |
|
SU2011A1 |
Приспособление для суммирования отрезков прямых линий | 1923 |
|
SU2010A1 |
Изложница с суживающимся книзу сечением и с вертикально перемещающимся днищем | 1924 |
|
SU2012A1 |
МАСШТАБИРУЕМОЕ КОДИРОВАНИЕ РЕЧИ И АУДИО С ИСПОЛЬЗОВАНИЕМ КОМБИНАТОРНОГО КОДИРОВАНИЯ MDCT-СПЕКТРА | 2008 |
|
RU2459282C2 |
Авторы
Даты
2017-10-11—Публикация
2013-09-20—Подача