АУДИОКОДИРОВАНИЕ Российский патент 2009 года по МПК G10L19/08 

Описание патента на изобретение RU2353980C2

ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ

Настоящее изобретение относится к кодированию и декодированию аудиосигналов.

УРОВЕНЬ ТЕХНИКИ

Как показано на Фиг.1, схема параметрического кодирования, в частности синусоидальный кодер, описана в международной заявке на патент № WO 01/69593. В этом кодере входной видеосигнал x(t) расщепляют на несколько (перекрывающихся) сегментов или кадров, обычно имеющих длительность 20 мс. Каждый сегмент подвергают разложению на переходные, синусоидальные и шумовые компоненты, (также возможно выделение других компонентов входного аудиосигнала, таких как комплексы гармоник, хотя это не является существенным для целей настоящего изобретения).

В синусоидальном анализаторе 130 сигнал х2 для каждого сегмента моделируют, используя некоторое количество синусоид, представленных такими параметрами, как амплитуда, частота и фаза. Эту информацию обычно извлекают для анализируемого интервала, используя преобразование Фурье (ПФ, FT), которое дает спектральное представление интервала, включающее в себя: частоты; амплитуды для каждой частоты; и фазы для каждой частоты, причем каждая фаза лежит в диапазоне {-π, π}. После установления для сегмента синусоидальной информации запускается алгоритм трекинга. Этот алгоритм использует функцию стоимости для стыковки синусоид друг с другом от сегмента к сегменту для получения так называемых треков. Алгоритм трекинга дает в результате синусоидальные коды CS, содержащие синусоидальные треки, которые начинаются в определенный момент времени, продолжаются в течение некоторого времени через множество временных сегментов и затем прекращаются.

В таком синусоидальном кодировании обычно передается частотная информация для треков, формируемых в кодере. Это может быть выполнено с малыми затратами, поскольку треки определены, как имеющие медленно меняющуюся частоту и, следовательно, частота может эффективно передаваться при помощи времяразностного кодирования. (В общем случае, амплитуда также может кодироваться времяразностным способом).

В противоположность частоте передача фазы рассматривается как затратная. В принципе, если частота является (практически) постоянной, фаза, как функция индекса сегмента трека, должна вести себя (практически) линейно. Однако при передаче фаза ограничена интервалом {-π, π}, как определено преобразованием Фурье. Вследствие представления фазы по модулю 2π, структурные фазовые соотношения внутри кадра теряются и, на первый взгляд, выглядят как случайная величина с распределением белого шума.

Однако, поскольку фаза является интегралом от частоты, в принципе, передача фазы не требуется. Это называется продолжением фазы и значительно снижает скорость передачи данных.

При продолжении фазы передают только частоту и фазу восстанавливают в декодере из данных частоты, используя интегральную зависимость между фазой и частотой. Однако известно, что используя продолжение фазы, фаза может быть восстановлена только приблизительно. Если происходит ошибка, вследствие ошибки измерения частоты или вследствие шума квантования, то фаза, будучи восстановленной с использованием интегральной зависимости, обычно содержит ошибки, имеющие характер дрейфа. Это происходит вследствие того, что ошибки по частоте имеют вид практически белого шума. Интегрирование усиливает низкочастотные ошибки и, следовательно, восстановленная фаза имеет тенденцию дрейфа от реально измеренной фазы. Это приводит к слышимым артефактам.

Это проиллюстрировано на Фиг.2(а), где и представляют реальную частоту и фазу для трека. Как в кодере, так и декодере частота и фаза имеют интегральную зависимость, представляемую I. Процесс квантования в кодере смоделирован как аддитивный белый шум n. В декодере восстановленная фаза таким образом включает в себя два компонента: реальную фазу и шумовую компоненту , где, как спектр восстановленной фазы, функция спектральной плотности мощности шума имеет выраженный низкочастотный характер.

Таким образом, видно, что при продолжении фазы, поскольку восстановленная фаза представляет собой интеграл от низкочастотного сигнала, востановленная фаза сама является низкочастотным сигналом. Однако шум, вводимый в процессе реконструкции, также доминирует в указанном низкочастотном диапазоне. Следовательно, имеются трудности при разделении указанных источников, имея в виду фильтрацию шума n, введенного в процессе кодирования.

В настоящем изобретении предпринята попытка уменьшить указанную проблему.

РАСКРЫТИЕ ИЗОБРЕТЕНИЯ

Согласно настоящему изобретению предоставляется способ по пункту 1 формулы изобретения.

Согласно настоящему изобретению обращают способ синусоидального кодирования предшествующего уровня техники, т.е. передают не частоту, а фазу. В декодере частота может быть приближенно восстановлена из квантованной информации фазы, используя конечные разности, как приближение для дифференцирования. Шумовой компонент восстановленной частоты обладает выраженным высокочастотным поведением, исходя из допущения, что шум, введенный при квантовании фазы, является приблизительно спектрально плоским. Это проиллюстрировано на Фиг.2(b), причем в кодере и декодере частота представлена, как дифференциал (D) фазы. Опять же, поскольку в кодере и декодере вводится шум n, восстановленная частота включает в себя два компонента: реальную частоту и шумовой компонент , причем частота представляет собой практически постоянный (DC) сигнал и шум сосредоточен главным образом в области высоких частот. Однако, поскольку исходная частота имеет низкочастотное поведение, и добавленный шум имеет высокочастотное поведение, шумовой компонент восстановленной частоты может быть уменьшен при помощи низкочастотной фильтрации.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

На Фиг.1 показан аудиокодер, в котором реализован вариант осуществления настоящего изобретения;

На Фиг.2(а) и 2(b) показана взаимосвязь между фазой и частотой в системах предшествующего уровня техники, и в аудиосистемах согласно настоящему изобретению, соответственно;

На Фиг.3(а) и 3(b) показан предпочтительный вариант осуществления синусоидального кодера, являющегося компонентом аудиокодера по Фиг.1;

На Фиг.4 показан аудиоплеер, в котором реализован вариант осуществления настоящего изобретения;

На Фиг.5(а) и 5(b) показан предпочтительный вариант осуществления синусоидального синтезатора, являющегося компонентом аудиоплеера по Фиг.4; и

На Фиг.6 показана система, содержащая аудиокодер и аудиоплеер, согласно настоящему изобретению.

ОСУЩЕСТВЛЕНИЕ ИЗОБРЕТЕНИЯ

Предпочтительные варианты осуществления настоящего изобретения описаны ниже со ссылками на сопутствующие чертежи, на которых одинаковые компоненты обозначены одинаковыми ссылочными позициями, и, если только не указано противное, выполняют одинаковые функции. В предпочтительном варианте осуществления настоящего изобретения кодер 1 представляет собой синусоидальный кодер типа, описанного в международной заявке на патент WO 01/69593, Фиг.1. Работа этого кодера предшествующего уровня техники и соответствующего ему декодера подробно описана и в настоящем описании упоминается, только если это имеет отношение к настоящему изобретению.

Как в предшествующем уровне техники, так и в предпочтительном варианте осуществления аудиокодер 1 оцифровывает входной аудиосигнал с определенной частотой дискретизации, что дает в результате цифровую репрезентацию x(t) аудиосигнала. Кодер 1 затем разделяет оцифрованный входной сигнал на три компонента: переходные компоненты сигнала, устойчивые детерминированные компоненты и устойчивые стохастические компоненты. Аудиокодер 1 содержит переходной кодер 11, синусоидальный кодер 13 и шумовой кодер 14.

Переходной кодер 11 содержит переходной детектор (TD) 110, переходной анализатор (TA) 111 и переходной синтезатор (TS) 112. Сначала сигнал x(t) поступает в переходной декодер 110. Декодер 110 выполняет оценку наличия переходной компоненты и ее положения. Эту информацию подают в переходной анализатор 111. Если положение переходной компоненты определено, переходной анализатор 111 пытается экстрагировать (основную часть) переходного компонента сигнала. Он сопоставляет функцию формы сегменту сигнала, предпочтительно начинающийся в оцененной стартовой позиции, и определяет содержимое под функцией огибающей, используя, например, (небольшое) количество синусоидальных компонентов. Эта информация содержится в переходном коде СТ и более подробная информация по генерации переходного кода СТ предоставлена в международной заявке на патент № WO 01/695593.

Переходной код СТ подают в переходной синтезатор 112. Синтезированный переходной компонент сигнала вычитают из входного сигнала x(t) в вычитающем устройстве 16, что дает в результате сигнал х1. Механизм GC (12) управления усилением используют для получения х2 из х1.

Сигнал х2 подают в синусоидальный кодер 13, где выполняют его анализ в синусоидальном анализаторе (SA) 130, который определяет (детерминированные) синусоидальные компоненты. Однако можно видеть, что хотя наличие переходного анализатора является желательным, он не является необходимым, и изобретение может быть реализовано без такого анализатора. В качестве альтернативы, как упоминалось выше, изобретение может быть реализовано, например, с комплексным гармоническим анализатором.

Вкратце, синусоидальный кодер кодирует входной сигнал х2 в виде треков синусоидальных компонентов, стыкованных от одного сегмента кадра к другому. Как показано на фиг.3(а), в предпочтительном варианте осуществления, как и в предшествующем уровне техники, каждый сегмент входного сигнала х2 преобразуют в частотный домен в блоке 40 преобразования Фурье (FT). Для каждого сегмента блок FT предоставляет амплитуды А, фазы ϕ и частоты ω. Как упоминалось выше, интервал фаз, предоставляемых преобразованием Фурье, ограничен -π≤ϕ<π. Блок 4 алгоритма трекинга (TA) принимает информацию для каждого сегмента и, используя подходящую функцию стоимости, стыкует синусоиды из одного сегмента со следующим, образуя таким образом последовательность измеренных фаз ϕ(k) и частот ω(k) для каждого трека.

В отличие от предшествующего уровня техники согласно настоящему изобретению синусоидальные коды CS, в конечном счете генерируемые анализатором 130, включают в себя информацию о фазе и частоту восстанавливают из этой информации в декодере.

Однако, как указывалось выше, измеренная фаза ограничена представлением по модулю 2π. Поэтому в предпочтительном варианте осуществления анализатор содержит устройство 44 развертки фазы, в котором представление фазы по модулю 2π разворачивают для представления структурного поведения фазы ψ между кадрами для трека. Поскольку частота в синусоидальных треках является практически постоянной, очевидно, что развернутая фаза ψ обычно является линейно возрастающей (или убывающей) функцией и, тем самым, делает возможным дешевую передачу фазы. Развернутую фазу ψ предоставляют в качестве входного сигнала в кодер 46 фазы (КФ), который предоставляет ее в виде уровней r выходного сигнала, подходящих для передачи.

Обращаясь вновь к работе устройства 44 развертки фазы, как указывалось выше, реальная фаза ψ и реальная частота Ω для трека соотносятся как:

где Т0 является референсным моментом времени.

Синусоидальный трек в кадрах k=K,K+1…K+L-1 имеет измеренные частоты ω(k) (выраженные в радианах в секунду) и измеренные фазы ϕ(k) (измеренные в радианах). Расстояние между центрами кадров дается U (скоростью обновления, выраженной в секундах). Предполагается, что измеренные частоты являются выборками исходного непрерывного по времени частотного трека Ω с ω(k)=Ω(kU) и, аналогично, что измеренные фазы являются выборками соответствующего непрерывного по времени фазового трека ψ с ϕ(k)=ψ(kU)mod(2π). Для синусоидального кодирования предполагают, что Ω является практически постоянной функцией.

При допущении, что частоты являются практически постоянными в пределах сегмента, Уравнение 1 может быть аппроксимировано следующим образом:

Таким образом, видно, что зная фазу и частоту для данного сегмента и частоту для следующего сегмента, возможно оценить значение развернутой фазы для следующего сегмента и аналогично для каждого сегмента в треке.

В предпочтительном варианте осуществления устройство развертывания фазы определяет множитель развертки m(k) в момент k:

Множитель развертывания m(k) указывает устройству 44 развертывания фазы количество циклов, которое надо прибавить для получения развернутой фазы.

Комбинируя уравнения 2 и 3, устройство развертывания фазы определяет инкрементальный множитель е развертки следующим образом:

где е должно быть целым. Однако вследствие ошибок измерения и моделирования инкрементальный множитель е развертки не является в точности целым:

исходя из допущения, что ошибки измерения и моделирования малы.

Имея инкрементальный множитель е развертки и m(k), вычисляют из уравнения (3) как кумулятивную сумму, где без потери общности устройство развертки фазы начинает работу в первом кадре К с m(К)=0 и из m(k) и ϕ(k) определяют (развернутую) фазу ψ(kU).

На практике оцифрованные данные ψ(kU) и Ω(kU) искажены ошибками измерения:

где ε1 и ε2 представляют собой ошибку фазы и частоты, соответственно. Для того чтобы не допустить неоднозначности в определении множителя развертки, измеренные данные должны быть определены с достаточной точностью. Таким образом, в предпочтительном варианте изобретения трекинг ограничен таким образом, что:

где δ представляет собой ошибку в операции округления. Ошибка δ определяется главным образом ошибками в ω, вследствие умножения на U. Допуская, что ω определяют из максимума абсолютного значения преобразования Фурье оцифрованной версии входного сигнала с частотой дискретизации F и что разрешение преобразования Фурье составляет 2π/La, где La является анализирующим размером. Для того чтобы не выходить за рассматриваемые границы, имеем:

Это означает, что анализирующий размер должен быть в несколько раз больше, чем размер обновления, для того чтобы развертка была точной, например, установив δ0=1/4, анализирующий размер должен составлять четыре размера обновления (не учитывая ошибки ε1 в измерении фазы).

Вторая предосторожность, которая может быть предпринята для того чтобы избежать ошибок решения в операции округления, заключается в определении трека соответствующим образом. В блоке 42 трекинга синусоидальные треки обычно определяют, рассматривая разницу в амплитудах и фазах. Дополнительно, также является возможным извлекать информацию о фазе из критерия стыковки. Например, можно определить ошибку ε предсказания фазы как разницу между измеренным значением и предсказанным значением согласно

где предсказанное значение может быть получено как

Таким образом, предпочтительно блок 42 трекинга запрещает треки, где ε больше, чем определенное значение (например, ε>π/2), что дает в результате однозначное определение e(k).

Дополнительно, кодер может вычислять фазы и частоты, которые будут доступны в декодере. Если фазы или частоты, которые будут доступны в декодере, отличаются слишком сильно от фаз и/или частот, которые присутствуют в кодере, также может быть принято решение прервать трек, т.е. обозначить окончание трека и начать новый, используя текущую частоту и фазу и их стыкованные синусоидальные данные.

Оцифрованная развернутая фаза ψ(kU), генерируемая устройством 44 развертки фазы (PU), предоставляется в качестве входного сигнала в фазовый кодер 46 (РЕ) для генерации набора уровней r представления. Способы для эффективной передачи в общем монотонно изменяющихся характеристик, таких как развернутая фаза, известны. В предпочтительном варианте осуществления, Фиг.3(b), используется адаптивная дифференциальная импульсно-кодовая модуляция (ADPCM). В этом случае устройство предсказания (PF) 48 используют для оценки фазы следующего сегмента трека и кодируют только разницу в устройстве 50 квантования (Q). Поскольку предполагается, что ψ является практически линейной функцией, и для упрощения устройство предсказания 48 выбирают в виде фильтра второго порядка:

где х представляет собой входной сигнал и y представляет собой выходной сигнал. Тем не менее, видно, что также является возможным использовать другие функциональные соотношения (в том числе отношения более высокого порядка) и включить адаптивную (обратную или прямую) регулировку коэффициентов фильтра. В предпочтительном варианте осуществления для простоты используют обратный адаптивный механизм управления (QC) 52 для управления устройством 52 квантования. Прямое адаптивное управление также является возможным, но при этом требуется дополнительная скорость передачи служебных данных.

Как показано ниже, инициализация кодера (и декодера) для трека начинается с информации о начальной фазе ϕ(0) и частоте ω(0). Они оцифровываются и передаются посредством отдельного механизма. Дополнительно начальный шаг квантования, используемый в контроллере 52 оцифровки кодера, и соответствующий контроллер 62 в декодере, Фиг.5(b), либо передают, либо устанавливают в определенное значение и в кодере, и в декодере. И, наконец, конец трека может быть либо обозначен в отдельном потоке, либо в виде уникального символа в битовом потоке фаз.

Из синусоидального кода CS, генерируемого синусоидальным кодером, синусоидальный компонент сигнала восстанавливают в синусоидальном синтезаторе (SS) 131 таким же способом, как описано для синусоидального синтезатора (SS) 32 декодера. Этот сигнал вычитают в устройстве 17 вычитания из входного сигнала х2 синусоидального кодера 13, что дает в результате остаточный сигнал х3. Остаточный сигнал х3, генерируемый синусоидальным кодером 13, передают в анализатор 14 шума предпочтительного варианта осуществления, который генерирует шумовой код SN, представляющий этот шум, как описано, например, в международной заявке на патент РСТ/ЕР00/04599.

В завершение, в мультиплексоре 15 создается аудиопоток AS, который включает в себя коды CT, CS, CN. Аудиопоток AS подают, например, на шину данных, антенную систему, устройство хранения и т.д.

На Фиг.4 показан аудиоплеер 3, пригодный для декодирования аудиопотока AS, например, генерируемого кодером 1 по Фиг.1, получаемого через шину данных, антенную систему, устройство хранения и т.д. Аудиопоток AS демультиплексируют в демультиплексоре 30 для получения кодов CT, CS, CN. Эти коды подают в переходной синтезатор 31, синусоидальный синтезатор 32 и шумовой синтезатор 33, соответственно. Из переходного кода CT вычисляют переходные компоненты сигнала в переходном синтезаторе 31. В случае, если переходной код указывает огибающую функцию, вычисляют огибающую, основываясь на принятых параметрах. Далее вычисляют содержимое огибающей, основываясь на частотах и амплитудах синусоидальных компонент. В случае, если переходной код CT указывает шаг, переходной компонент не вычисляют. Полный переходной сигнал yT представляет собой сумму всех переходных компонентов.

Синусоидальный код CS, включающий в себя информацию, кодированную анализатором 130, используется синусоидальным синтезатором 32 для генерации сигнала yS. Как показано на Фиг.5А и 5В, синусоидальный синтезатор 32 содержит фазовый декодер (PD) 56, совместимый с фазовым кодером 46. В этом случае устройство 60 обратного квантования (DQ) в сочетании с предсказывающим фильтром (PF) 64 второго порядка генерирует (оценку) развернутой фазы из: уровней r представления; начальной информации и , предоставляемые в предсказывающий фильтр (PF) 64, и начальный шаг квантования для контроллера 62 квантования (QC).

Как показано на Фиг.2(b), частота может быть восстановлена из развернутой фазы при помощи дифференцирования. Допуская, что ошибка фазы в декодере имеет приблизительно распределение белого шума, и поскольку дифференцирование усиливает высокие частоты, дифференцирование может быть скомбинировано с фильтром высоких частот для уменьшения шума и, тем самым, получения точной оценки частоты в декодере.

В предпочтительном варианте осуществления блок 58 фильтрации (FR) аппроксимирует дифференцирование, необходимое для получения частоты из развернутой фазы при помощи таких процедур, как прямое, обратное или центральное дифференцирование. Это дает возможность декодеру генерировать в качестве выходного сигнала фазы и частоты , используемые обычным способом для синтеза синусоидальной компоненты кодированного сигнала.

В то же самое время, когда синтезируют синусоидальные компоненты сигнала, шумовой код CN подают в шумовой синтезатор NS 33, который, в общем случае, представляет собой фильтр, имеющий частотный отклик, аппроксимирующий шумовой спектр. NS 33 генерирует восстановленный шум yN путем фильтрации сигнала белого шума с шумовым кодом CN. Полный сигнал y(t) содержит сумму переходного сигнала yТ и произведение амплитуды распаковки (g) и суммы синусоидального сигнала yS и шумового сигнала yN. Аудиоплеер содержит два сумматора 36 и 37 для суммирования соответствующих сигналов. Общий сигнал подают в выходной блок 35, который представляет собой, например, громкоговоритель.

На Фиг.6 показана аудиосистема согласно настоящему изобретению, содержащая аудиокодер 1, показанный на Фиг.1, и аудиоплеер 3, показанный на Фиг.4. Такая система обладает возможностями воспроизведения и записи. Аудиопоток AS подают из аудиокодера в аудиоплеер через коммуникационный канал 2, который может представлять собой беспроводное соединение, шину 20 данных или устройство хранения. В случае, если коммуникационный канал 2 представляет собой устройство хранения, устройство хранения может быть встроено в систему или также может представлять собой сменный диск, флэш-карту и т.д. Коммуникационный канал 2 может быть частью аудиосистемы, но часто тем не менее является внешним по отношению к аудиосистеме.

Похожие патенты RU2353980C2

название год авторы номер документа
КОДИРОВАНИЕ АУДИОСИГНАЛА С НИЗКОЙ СКОРОСТЬЮ ПЕРЕДАЧИ БИТОВ 2004
  • Герритс Андреас Й.
  • Ден Бринкер Альбертус С.
RU2368018C2
АУДИОКОДИРОВАНИЕ 2003
  • Схейерс Эрик Г. П.
  • Омен Арнолдус В. Й.
RU2325046C2
АУДИОКОДЕР ДЛЯ КОДИРОВАНИЯ АУДИОСИГНАЛА, ИМЕЮЩЕГО ИМПУЛЬСОПОДОБНУЮ И СТАЦИОНАРНУЮ СОСТАВЛЯЮЩИЕ, СПОСОБЫ КОДИРОВАНИЯ, ДЕКОДЕР, СПОСОБ ДЕКОДИРОВАНИЯ И КОДИРОВАННЫЙ АУДИОСИГНАЛ 2008
  • Херре Юрген
  • Гейгер Ральф
  • Баер Стефан
  • Фуш Гильом
  • Краемер Ульрих
  • Реттелбах Николаус
  • Грилл Бернард
RU2439721C2
СИСТЕМА ОБРАБОТКИ АУДИО 2014
  • Черлинг, Кристофер
  • Пурнхаген, Хейко
  • Виллемоес, Ларс
RU2625444C2
АУДИОКОДЕК, ИСПОЛЬЗУЮЩИЙ СИНТЕЗ ШУМА В ТЕЧЕНИЕ НЕАКТИВНОЙ ФАЗЫ 2012
  • Сетиаван Панджи
  • Шмидт Константин
  • Вильде Штефан
RU2586838C2
УСТРОЙСТВО, СПОСОБ И КОМПЬЮТЕРНАЯ ПРОГРАММА ДЛЯ КОДИРОВАНИЯ ЗВУКОВОГО СИГНАЛА ИЛИ ДЛЯ ДЕКОДИРОВАНИЯ КОДИРОВАННОЙ АУДИОСЦЕНЫ 2021
  • Фукс, Гийом
  • Тамарапу, Арчит
  • Айхензер, Андреа
  • Корсе, Срикантх
  • Дёла, Штефан
  • Мультрус, Маркус
RU2809587C1
ГЕНЕРИРОВАНИЕ ШУМА В АУДИОКОДЕКАХ 2012
  • Сетиаван Панджи
  • Вильде Штефан
  • Ломбар Антони
  • Дитц Мартин
RU2585999C2
АУДИОКОДИРОВАНИЕ 2003
  • Бребарт Дирк Й.
RU2363116C2
АУДИОКОДЕР, АУДИОДЕКОДЕР И АУДИОПРОЦЕССОР, ИМЕЮЩИЙ ДИНАМИЧЕСКИ ИЗМЕНЯЮЩУЮСЯ ХАРАКТЕРИСТИКУ ПЕРЕКОСА 2007
  • Херре Юрген
  • Грилл Бернхард
  • Мултрус Маркус
  • Байер Штефан
  • Кремер Ульрих
  • Хиршфельд Йенс
  • Вабник Штефан
  • Шуллер Геральд
RU2418322C2
АУДИОКОДЕК С ПРЕОБРАЗОВАНИЕМ И СПОСОБЫ КОДИРОВАНИЯ И ДЕКОДИРОВАНИЯ ВРЕМЕННОГО СЕГМЕНТА АУДИОСИГНАЛА 2011
  • Гранчаров Володя
  • Сверриссон Сигурдур
RU2574851C2

Реферат патента 2009 года АУДИОКОДИРОВАНИЕ

Изобретение относится к кодированию и декодированию аудиосигналов. Изобретение раскрывает кодирование аудиосигнала, представленного соответствующим набором значений выборок сигнала для каждого из множества последовательных сегментов. Значения выборок сигнала анализируют для определения одного или нескольких синусоидальных компонентов для каждого из множества последовательных сегментов. Синусоидальные компоненты стыкуют для множества последовательных сегментов для обеспечения синусоидальных треков. Для каждого синусоидального трека определяют фазу, содержащую практически монотонно изменяющееся значение, и генерируют кодированный аудиопоток, включающий в себя синусоидальные коды, представляющие указанную фазу. Технический результат - повышение точности декодирования данных. 7 н. и 9 з.п. ф-лы, 6 ил.

Формула изобретения RU 2 353 980 C2

1. Способ кодирования аудиосигнала, причем способ содержит этапы, на которых:
обеспечивают соответствующий набор значений выборок сигнала для каждого из множества последовательных сегментов;
анализируют значения выборок сигнала для определения одного или нескольких синусоидальных компонентов для каждого из множества последовательных сегментов;
стыкуют синусоидальные компоненты для множества последовательных сегментов для обеспечения синусоидальных треков;
для каждого синусоидального трека определяют фазу, содержащую практически монотонно изменяющееся значение; и
генерируют кодированный аудиопоток, включающий в себя синусоидальные коды, представляющие указанную фазу.

2. Способ по п.1, в котором значение фазы каждого стыкованного сегмента определяют как функцию: интеграла частоты для предыдущего сегмента и частоты указанного стыкованного сегмента; и фазы предыдущего сегмента.

3. Способ по п.1, в котором указанный синусоидальный компонент включает в себя: значение частоты; и значение фазы в диапазоне {-π, π}.

4. Способ по п.1, в котором этап генерации содержит этапы, на которых:
предсказывают значение фазы для сегмента в виде функции фазы, по меньшей мере, предыдущего сегмента; и
квантуют указанные синусоидальные коды в виде функции указанного предсказанного значения указанной фазы и измеренной фазы для указанного сегмента.

5. Способ по п.4, в котором указанные синусоидальные коды для трека включают в себя начальную фазу и частоту, причем указанный этап предсказания использует указанную начальную частоту и указанную фазу для обеспечения первого предсказания.

6. Способ по п.4, в котором указанный этап генерации содержит управление указанным этапом квантования в виде функции указанных квантованных синусоидальных кодов.

7. Способ по п.6, в котором указанные синусоидальные коды для каждого трека включают в себя начальный шаг квантования.

8. Способ по п.1, в котором указанные синусоидальные коды включают в себя индикатор конца трека.

9. Способ по п.1, дополнительно содержащий этапы, на которых:
синтезируют указанные синусоидальные компоненты, используя указанные синусоидальные коды;
вычитают значения указанного синусоидального сигнала из указанных значений выборок сигнала для обеспечения набора значений, представляющих остаточный компонент указанного аудиосигнала;
моделируют остаточный компонент аудиосигнала посредством определения параметров, аппроксимирующих остаточный компонент; и
включают указанные параметры в указанный аудиопоток.

10. Способ по п.1, в котором указанные значения выборок сигнала представляют аудиосигнал, из которого были удалены переходные компоненты.

11. Способ декодирования аудиопотока, причем указанный способ содержит этапы, на которых:
считывают кодированный аудиопоток, включающий в себя синусоидальные коды, представляющие фазу для каждого трека стыкованных синусоидальных компонентов;
для каждого трека из указанных кодов генерируют практически монотонно изменяющееся значение, представляющее указанную фазу;
фильтруют указанное сгенерированное значение для обеспечения оценки частоты для трека; и
используют указанные сгенерированные значения и указанные оценки частот для синтеза указанных синусоидальных компонентов указанного аудиосигнала.

12. Аудиокодер, выполненный с возможностью обработки соответствующего набора значений выборок сигнала для каждого из множества последовательных сегментов, причем указанный кодер содержит:
анализатор для анализа значения выборок сигнала для определения одного или нескольких синусоидальных компонентов для каждого из множества последовательных сегментов;
устройство стыковки для стыковки синусоидальных компонентов для множества последовательных сегментов для обеспечения синусоидальных треков;
устройство выделения фазы для определения фазы для каждого синусоидального трека, содержащей практически монотонно изменяющееся значение; и
кодер фазы для обеспечения кодированного аудиопотока, включающего в себя синусоидальные коды, представляющие указанную фазу.

13. Аудиоплеер, содержащий
средство для считывания кодированного аудиопотока, включающего в себя синусоидальные коды, представляющие фазу для каждого трека стыкованных синусоидальных компонентов;
устройство развертывания фазы для определения, для каждого трека, из указанных кодов практически монотонно изменяющееся значение, представляющее указанную фазу;
фильтр для фильтрации указанного сгенерированного значения для обеспечения оценки частоты для трека; и
синтезатор, выполненный с возможностью использования указанных сгенерированных значений и указанных оценок частот для синтеза указанных синусоидальных компонентов указанного аудиосигнала.

14. Аудиосистема, содержащая аудиокодер по п.12 и аудиоплеер по п.13.

15. Кодированный аудиопоток, содержащий синусоидальные коды, представляющие треки стыкованных синусоидальных компонентов аудиосигнала, причем указанные коды представляют практически монотонно изменяющееся значение, соответствующее фазе для каждого трека стыкованных синусоидальных компонентов.

16. Носитель данных, предназначенный для использования в качестве коммуникационного канала в аудиосистеме, содержащей аудиокодер и аудиоплеер, на котором сохранен кодированный аудиопоток по п.15.

Документы, цитированные в отчете о поиске Патент 2009 года RU2353980C2

Печь для непрерывного получения сернистого натрия 1921
  • Настюков А.М.
  • Настюков К.И.
SU1A1
US 2002133358 A, 2002.09.19
СЖАТИЕ И РАСШИРЕНИЕ ДАННЫХ ЗВУКОВОГО СИГНАЛА 1997
  • Брюкерс Альфонс Антониус Мария Ламбертус
  • Омен Арнольдус Вернер Йоханнес
  • Ван Дер Влетен Ренатус Йозефус
RU2178618C2
УСТРОЙСТВО ДЛЯ КОНТРОЛЯ ПРЕДЕЛЬНОЙ РАЗНОСТЕННОСТИ ТРУБЫ 0
SU337636A1

RU 2 353 980 C2

Авторы

Слеййтер Роберт Й.

Ден Бринкер Албертус С.

Герритс Андреас Й.

Даты

2009-04-27Публикация

2003-11-06Подача