ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ
Настоящее изобретение относится к устройству и способу обработки сигнала. Хотя настоящее изобретение подходит для широкого диапазона применений, оно особенно хорошо подходит для кодирования и декодирования звуковых сигналов с использованием спектральных данных сигнала.
УРОВЕНЬ ТЕХНИКИ
В общем случае при обработке звукового сигнала с использованием характеристики сигнала звуковой сигнал обрабатывают, основываясь на характеристиках сигналов различных диапазонов.
РАСКРЫТИЕ ИЗОБРЕТЕНИЯ
ТЕХНИЧЕСКАЯ ПРОБЛЕМА
Обычный уровень техники недостаточен для эффективной обработки звукового сигнала, основываясь на характеристиках сигналов различных диапазонов.
ТЕХНИЧЕСКОЕ РЕШЕНИЕ
Настоящее изобретение направлено на устройство и способ обработки сигнала, которые по существу устраняют одну или более проблем из-за ограничений и недостатков соотнесенного уровня техники.
Задачей настоящего изобретения является обеспечение устройства и способа обработки сигнала, с помощью которых звуковой сигнал можно обрабатывать, основываясь на характеристиках сигналов различных диапазонов. Другой задачей настоящего изобретения является обеспечение устройства и способа обработки сигнала, с помощью которых спектральные данные различных диапазонов могут быть получены способом выбора соответствующих спектральных данных из множества спектральных данных определенного диапазона.
Дополнительной задачей настоящего изобретения является обеспечение устройства и способа обработки сигнала, с помощью которых можно минимизировать скорость передачи битов, несмотря на то, что такой сигнал, имеющий различные характеристики, обрабатывается как речевой сигнал, как звуковой сигнал и т.п. в соответствии со схемой, подходящей для соответствующей характеристики.
Настоящее изобретение обеспечивает следующие результаты или преимущества.
Во-первых, с помощью настоящего изобретения декодируют сигнал, имеющий характеристику речевого сигнала, как речевой сигнал, и декодируют сигнал, имеющий характеристику звукового сигнала, как звуковой сигнал. Поэтому настоящее изобретение может адаптивно выбирать схему декодирования, которая соответствует характеристике каждого сигнала.
Во-вторых, настоящее изобретение получает спектральные данные различных диапазонов с помощью выбора самых подходящих спектральных данных из передаваемых спектральных данных, таким образом увеличивая скорость восстановления звукового сигнала.
В-третьих, настоящее изобретение выбирает спектральные данные, используя информацию о начальном диапазоне, передаваемую из кодера. Поэтому настоящее изобретение увеличивает точность при выборе спектральных данных, но уменьшает сложность, требуемую для выполнения операции.
В-четвертых, настоящее изобретение выполняет передачу спектральных данных, соответствующих частичному диапазону, таким образом, значительно уменьшая количество битов, требуемых для передачи спектральных данных.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
Сопроводительные чертежи, которые включены для обеспечения дополнительного понимания изобретения и которые представлены в данном описании и составляют его часть, показывают варианты осуществления изобретения и вместе с описанием служат для объяснения принципов изобретения.
На Фиг.1 - структурная схема устройства кодирования звукового сигнала согласно варианту осуществления настоящего изобретения;
Фиг.2 - подробная структурная схема блока кодирования частичного диапазона, показанного на Фиг.1;
Фиг.3 - схема соотношения между копируемым диапазоном, целевым диапазоном и начальным диапазоном согласно настоящему изобретению;
Фиг.4 - схема расширения частичного диапазона согласно различным вариантам осуществления настоящего изобретения;
Фиг.5 - структурная схема устройства декодирования звукового сигнала согласно варианту осуществления настоящего изобретения;
Фиг.6 - подробная структурная схема блока декодирования частичного диапазона, показанного на Фиг.5;
Фиг.7 - схема для случая, когда количество спектральных данных целевого диапазона больше количества спектральных данных копируемого диапазона; и
Фиг.8 - схема для случая, когда количество спектральных данных целевого диапазона меньше количества спектральных данных копируемого диапазона.
ПОДРОБНОЕ ОПИСАНИЕ
ЛУЧШИЙ ВАРИАНТ ОСУЩЕСТВЛЕНИЯ ИЗОБРЕТЕНИЯ
Дополнительные особенности и преимущества изобретения будут сформулированы в последующем описании и частично будут очевидны из описания или их можно изучать с помощью практического применения изобретения. Цели и другие преимущества изобретения будут понятны и обеспечены с помощью структуры, которая конкретно представлена в письменном описании и формуле изобретения, а также на прилагаемых чертежах.
Для обеспечения этих и других преимуществ и в соответствии с целью настоящего изобретения, которое воплощено и подробно описано, устройство обработки сигналов согласно настоящему изобретению включает в себя блок определения копируемого диапазона, блок приема информации расширения диапазона и блок генерации целевого диапазона. Блок генерации целевого диапазона включает в себя блок растяжения/сжатия времени и блок прореживания. Кроме того, блок генерации целевого диапазона может дополнительно включать в себя блок фильтрации.
Блок определения копируемого диапазона принимает спектральные данные, соответствующие низкочастотному диапазону в частотном диапазоне, включающем в себя низкочастотный диапазон и высокочастотный диапазон. Блок определения копируемого диапазона затем определяет копируемый диапазон, основываясь на информации о частоте копируемого диапазона, соответствующего частичному диапазону низкочастотного диапазона.
Блок получения информации расширения диапазона получает дополнительную информацию для генерации целевого диапазона из копируемого диапазона. В этом случае дополнительную информацию можно получать из битового потока, и она может включать в себя информацию об усилении, информацию о гармониках и т.п.
Блок генерации целевой информации генерирует спектральные данные целевого диапазона, соответствующего высокочастотному диапазону, используя спектральные данные копируемого диапазона. В этом случае копируемый диапазон может существовать выше низкочастотного диапазона. Высокочастотный диапазон можно генерировать, используя копируемый диапазон, существующий в низкочастотном диапазоне. Таким же образом можно генерировать низкочастотный диапазон, используя копируемый диапазон, существующий в высокочастотном диапазоне.
Блок генерации целевого диапазона включает в себя блок растяжения/сжатия времени и блок прореживания, и он может дополнительно включать в себя блок фильтрации. В частности, копируемый диапазон можно получать из битового потока, или его можно получать с помощью фильтрации принимаемых спектральных данных.
В этом случае информация о частоте копируемого диапазона указывает по меньшей мере одно из информации о начальной частоте, о начальном диапазоне и об индексе, указывающем начальный диапазон. Спектральные данные целевого диапазона можно генерировать, используя по меньшей мере одно из информации об усилении, соответствующей коэффициенту усиления между спектральными данными копируемого диапазона и спектральными данными целевого диапазона, и информации о гармониках копируемого диапазона. Спектральные данные низкочастотного диапазона можно декодировать с помощью одного из звукового сигнала и речевого сигнала.
Настоящее изобретение можно применять к основному кодированию AAC, AC3, AMR и т.п. или к будущему основному кодированию. Последующее описание главным образом относится к применению к сигналу понижающего микширования, но не ограничено им.
Подразумевается, что и предшествующее общее описание, и последующее подробное описание являются примерными и объяснительными, и они предназначены для обеспечения дополнительного объяснения заявляемого изобретения.
ВАРИАНТЫ ОСУЩЕСТВЛЕНИЯ ИЗОБРЕТЕНИЯ
Подробно представлены предпочтительные варианты осуществления настоящего изобретения, примеры которых показаны на сопроводительных чертежах.
Терминологию в настоящем изобретении можно рассматривать как следующее представление. Терминологию, не раскрытую в данном описании, можно рассматривать как концепции, соответствующие идее настоящего изобретения. Подразумевается, что «кодирование» можно рассматривать и как кодирование, и как декодирование в конкретных случаях. «Информация» в данном раскрытии может в общем случае означать значения, параметры, коэффициенты, элементы и т.п., и их значения можно рассматривать в некоторых случаях как различные, которыми настоящее изобретение неограничено.
Фиг.1 - структурная схема устройства кодирования звукового сигнала согласно варианту осуществления настоящего изобретения, и Фиг.2 - подробная структурная схема блока кодирования частичного диапазона, показанного на Фиг.1.
Обращаясь к Фиг.1, устройство кодирования звукового сигнала согласно варианту осуществления настоящего изобретения включает в себя блок 110 многоканального кодирования, блок 120 кодирования частичного диапазона, блок 130 кодирования звукового сигнала, блок 140 кодирования речевого сигнала и мультиплексор 150.
Блок 110 многоканального кодирования принимает сигналы множества каналов (в дальнейшем называют многоканальным сигналом) и затем генерирует сигнал понижающего микширования с помощью понижающего микширования (уменьшения количества каналов) многоканального сигнала. Блок 110 многоканального кодирования генерирует пространственную информацию, требуемую для повышающего микширования сигнала понижающего микширования в многоканальный сигнал. В этом случае пространственная информация может включать в себя информацию о различии уровней каналов, информацию о корреляции между каналами, коэффициент предсказания канала и информацию об усилении понижающего микширования и т.п.
При этом сигнал понижающего микширования может включать в себя сигнал во временной области (например, разностные данные) или информацию о преобразовании в частотную область (например, коэффициент масштабирования, спектральные данные).
Блок 120 кодирования частичного диапазона генерирует из широкополосного сигнала узкополосный сигнал и информацию расширения диапазона.
В этом случае исходный сигнал, включающий в себя множество диапазонов, называют широкополосным сигналом, а по меньшей мере один из множества диапазонов называют узкополосным сигналом. Например, в широкополосном сигнале, включающем в себя два диапазона (низкочастотный диапазон и высокочастотный диапазон), любой из диапазонов называют узкополосным сигналом. Кроме того, частичный диапазон означает часть всего узкополосного сигнала и будет называться копируемым диапазоном в последующем описании.
Информацией расширения диапазона является информация для генерации целевого диапазона, используя копируемый диапазон. Информация расширения диапазона может включать в себя информацию о частоте, информацию об усилении, информацию о гармониках и т.п. В декодере широкополосный сигнал генерируют с помощью объединения целевого диапазона с узкополосным сигналом.
Если у определенного кадра или фрагмента сигнала понижающего микширования (узкополосного сигнала понижающего микширования DMXn) есть значительная характеристика звукового сигнала, то блок 130 кодирования звукового сигнала кодирует сигнал понижающего микширования согласно схеме кодирования звукового сигнала. В этом случае звуковой сигнал может соответствовать стандарту AAC (перспективного звукового кодирования) или стандарту HE-AAC (перспективного звукового кодирования высокой производительности), которыми не ограничено настоящее изобретение. Кроме того, блок 130 кодирования звукового сигнала может соответствовать кодеру MDCT (модифицированного дискретного преобразования).
Если у определенного кадра или сегмента сигнала понижающего микширования (узкополосного сигнала понижающего микширования DMXn) есть значительная характеристика речевого сигнала, то блок 140 кодирования речевого сигнала кодирует сигнал понижающего микширования согласно схеме кодирования речи. В этом случае речевой сигнал может включать в себя модификации G.7XX или AMR, которыми примеры речевого сигнала не ограничены. При этом блок 140 кодирования речевого сигнала может дополнительно использовать схему кодирования с линейным предсказанием (LPC). Если у гармонического сигнала есть высокая избыточность по оси времени, то его можно моделировать в соответствии с линейным предсказанием для предсказания настоящего сигнала из прошлого сигнала. В этом случае если используют схему кодирования с линейным предсказанием, то можно увеличивать эффективность кодирования. Кроме того, блок 140 кодирования речевого сигнала может соответствовать кодеру во временной области.
Таким образом, узкополосный сигнал понижающего микширования кодируют в кадре или фрагменте или с помощью блока 130 кодирования звукового сигнала, или с помощью блока 140 кодирования речевого сигнала.
Мультиплексор 150 генерирует битовый поток с помощью мультиплексирования пространственной информации, сгенерированной блоком 110 многоканального кодирования, информации расширения диапазона, сгенерированной блоком 120 кодирования частичного диапазона, и кодированного узкополосного сигнала понижающего микширования.
В последующем описании конфигурацию блока 120 кодирования частичного диапазона подробно объясняют в отношении Фиг.2.
Обращаясь к Фиг.2, блок 120 кодирования частичного диапазона включает в себя блок 122 получения спектральных данных, блок 124 определения копируемого диапазона, блок 126 получения информации об усилении, блок 128 получения информации о гармонической составляющей и блок 129 передачи информации расширения диапазона.
Если принятый широкополосный сигнал не является спектральными данными, то блок 122 получения спектральных данных генерирует спектральные данные с помощью способа преобразования сигнала понижающего микширования в спектральные коэффициенты, масштабирования спектральных коэффициентов с помощью коэффициента масштабирования и последующего выполнения квантования. В этом случае спектральные данные включают в себя широкополосные спектральные данные, соответствующие широкополосному сигналу понижающего микширования.
Блок 124 определения копируемого диапазона определяет копируемый диапазон и целевой диапазон, основываясь на широкополосных спектральных данных, и генерирует информацию о частоте для расширения диапазона. В этом случае информация о частоте может включать в себя информацию о начальной частоте, о начальном диапазоне и т.п. В последующем описании копируемый диапазон и т.п. объясняют в отношении Фиг.3 и 4.
Фиг.3 - схема соотношений между копируемым диапазоном, целевым диапазоном и начальным диапазона согласно настоящему изобретению; Фиг.4 - схема расширения частичного диапазона согласно вариантам осуществления настоящего изобретения со второго по четвертый.
Обращаясь к Фиг.3, всего существует n диапазонов коэффициентов масштабирования (sfb) от 0 до n-1, и соответственно существуют спектральные данные, соответствующие диапазонам коэффициентов масштабирования sfb0-sfbn-1. Спектральные данные sdi, принадлежащие определенному диапазону, могут означать набор из множества спектральных данных от sdi_0 до sdi_m-1. Количество mi спектральных данных можно генерировать, чтобы оно соответствовало блоку спектральных данных, блоку диапазона или блоку выше предыдущего блока. В данном примере 0-й диапазон коэффициентов масштабирования sfb0 соответствует низкочастотному диапазону, а (n-1)-й диапазон коэффициентов масштабирования sfbn-i соответствует верхней части, т.е. высокочастотному диапазону. Альтернативно возможна конфигурация, обратная данному примеру.
Спектральные данные, соответствующие широкополосному сигналу, являются спектральными данными, соответствующими всему диапазону sfb0-sfbn-i который включает в себя первый диапазон и второй диапазон. Спектральные данные, соответствующие узкополосному сигналу понижающего микширования DMXn, являются спектральными данными, соответствующими первому диапазону, и они включают в себя спектральные данные от 0-го диапазона sfb0 до (i-1)-го диапазона sfbi-1. В частности, узкополосные спектральные данные передают к декодеру, в то время как спектральные данные остальных диапазонов sfb1-sfbn-1 не передают к нему.
Таким образом, декодер генерирует диапазон, который не переносит спектральные данные. И этот диапазон называют целевым диапазоном tb. При этом копируемый диапазон cb является диапазоном коэффициентов масштабирования спектральных данных, используемых при генерации спектральных данных целевого диапазона tb. Копируемый диапазон включает в себя части sfbs-sfbi-1 диапазонов sfb0-sfbi-1, соответствующие узкополосному сигналу понижающего микширования. Диапазон, с которого начинается копируемый диапазон cb, является начальным диапазоном cb, и частота начального диапазона является начальной частотой. Другими словами, копируемый диапазон cb может быть непосредственно начальным диапазоном cb, может включать в себя начальный диапазон и диапазон частот выше начального диапазона или может включать в себя начальный диапазон и диапазон частот ниже начального диапазона. Согласно настоящему изобретению кодер генерирует узкополосные спектральные данные и информацию расширения диапазона, используя широкополосные спектральные данные, в то время как декодер генерирует спектральные данные целевого диапазона, используя спектральные данные копируемого диапазона из узкополосных спектральных данных.
Фиг.4 показывает три вида вариантов осуществления расширения частичного диапазона. Копируемый диапазон может генерировать целевой диапазон как частичный диапазон всего узкого диапазона. В этом случае копируемый диапазон может быть расположен в верхнем диапазоне частот. Может существовать по меньшей мере один копируемый диапазон, и в случае, если существует множество копируемых диапазонов, диапазоны могут располагаться на одинаковом или на разном расстоянии друг от друга.
Обращаясь к (A) на Фиг.4, показано расширение частичного диапазона в случае, если ширина копируемого диапазона равна ширине целевого диапазона. В частности, копируемый диапазон cb включает в себя s-й диапазон sfbs, соответствующий начальному диапазону cb, (n-4)-й диапазон sfbn-4 и (n-2)-й диапазон sfbn-2. Кодер может не выполнять передачу спектральных данных целевого диапазона, расположенного справа от копируемого диапазона, используя спектральные данные копируемого диапазона. При этом можно генерировать информацию об усилении (g), которая является разностью между спектральными данными копируемого диапазона и спектральными данными целевого диапазона. Это объясняют позднее.
(B) на Фиг.4 показывает копируемый диапазон и целевой диапазон, которые имеют разную ширину. Ширина целевого диапазона равна или больше двух значений ширины (tb и tb') копируемого диапазона. В этом случае целевой диапазон можно генерировать, применяя различные коэффициенты усиления gs и gs+1, соответственно, к спектральным данным копируемого диапазона и целевого диапазона tb.
Обращаясь к (C) на Фиг.4, после того, как спектральные данные целевого диапазона сгенерированы, используя спектральные данные копируемого диапазона, можно генерировать спектральные данные второго целевого диапазона, sfbk-sfbn-1, используя спектральные данные, соответствующие диапазонам sfbk0-sfbk-1, смежным со вторым начальным диапазоном sfbk. В этом случае диапазон частот начального диапазона соответствует 1/8 от частоты дискретизации fc, и вторичный начальный диапазон может соответствовать 1/4 частоты дискретизации fc, которыми не ограничены примеры настоящего изобретения.
Значение целевого диапазона, копируемого диапазона и начального диапазона согласно различным вариантам осуществления настоящего изобретения объясняют ранее. Остальные элементы объясняют в отношении Фиг.2 далее.
Как указано в предыдущем описании, блок 124 определения копируемого диапазона определяет копируемый диапазон, целевой диапазон и начальный диапазон sb копируемого диапазона. Начальный диапазон можно определять в кадре различным образом. Его можно также определять согласно характеристике сигнала в кадре. В частности, начальный диапазон можно определять согласно тому, является ли сигнал изменяющимся или постоянным. Например, начальный диапазон можно определять, как низкочастотный, когда сигнал является изменяющимся, так как сигнал имеет меньше гармонических составляющих, чем тогда, когда он постоянный.
При этом начальный диапазон можно определять, как числовое значение яркости звука, используя центр спектра. Например, если звук относительно высокий (когда высокий тон является преобладающим), то начальный диапазон можно формировать в высокочастотном диапазоне. Если звук относительно низкий (когда низкий тон является преобладающим), то начальный диапазон можно формировать в низкочастотном диапазоне. Хотя начальный диапазон определяют различным образом в кадре, предпочтительно формировать начальный диапазон, рассматривая компромисс (выбор оптимального соотношения) между качеством звука и скоростью передачи битовых данных.
Блок 124 определения копируемого диапазона выводит узкополосный сигнал понижающего микширования DMXn или спектральные данные узкого диапазона частот с помощью исключения спектральных данных целевого диапазона.
Этот узкополосный сигнал понижающего микширования вводят в блок кодирования звукового сигнала или в блок кодирования речевого сигнала, описанные на Фиг.1. Блок 124 определения копируемого диапазона генерирует информацию о начальном диапазоне, которая указывает информацию о начальной частоте, с которой начинается копируемый диапазон cb, или информацию о начальном диапазоне копируемого диапазона cb. Информация о начальном диапазоне может быть представлена не только, как реальное значение, но также и как информация индекса. Когда информация о начальном диапазоне представлена как информация индекса, соответствие информации о начального диапазоне с индексом сохраняют в таблице, и ее можно использовать в декодере. Информацию о начальном диапазоне направляют в блок 129 передачи информации расширения диапазона, и затем он включает ее в себя как информацию расширения диапазона.
Блок 126 получения информации об усилении генерирует информацию об усилении, используя спектральные данных целевого диапазона и копируемого диапазона. В этом случае информацию об усилении можно определять, как отношение энергии целевого диапазона к энергии копируемого диапазону, и ее можно определять с помощью следующей формулы.
[Формула 1]
В формуле 1 «gi» указывает усиление и «i» указывает текущий целевой диапазон. Эту информацию об усилении можно определять для каждого целевого диапазона, как показано ранее. Информацию об усилении направляют в блок 129 передачи информации расширения диапазона, и затем он также включает ее в себя как информацию расширения диапазона.
Блок 128 получения информации о гармонической составляющей генерирует информацию о гармонической составляющей с помощью анализа гармонической составляющей копируемого диапазона. Информацию о гармонической составляющей направляют в блок 129 передачи информации расширения диапазона, и затем он также включает ее в себя как информацию расширения диапазона.
Блок 129 передачи информации расширения диапазона выводит информацию расширения диапазона, которая включает в себя информацию о начальном диапазоне, информацию об усилении и информацию о гармонической составляющей. Эту информацию расширения диапазона вводят в мультиплексор, описанный в отношении Фиг.1.
Таким образом, узкополосный сигнал понижающего микширования и информацию расширения диапазона генерируют описанным выше способом. В последующем описании объясняют процесс генерации в декодере широкополосного сигнала понижающего микширования, используя информацию расширения диапазона и узкополосный сигнал понижающего микширования.
Фиг.5 - структурная схема устройства декодирования звукового сигнала согласно варианту осуществления настоящего изобретения; Фиг.6 - подробная структурная схема блока декодирования частичного диапазона, показанного на Фиг.5.
Обращаясь к Фиг.5, устройство 200 декодирования звукового сигнала согласно варианту осуществления настоящего изобретения включает в себя демультиплексор 210, блок 220 декодирования звукового сигнала, блок 230 декодирования речевого сигнала, блок 240 декодирования частичного диапазона и блок 250 многоканального декодирования.
Демультиплексор 210 извлекает из битового потока узкополосный сигнал понижающего микширования DMXn, информацию расширения диапазона и пространственную информацию. Если узкополосный сигнал понижающего микширования имеет более высокую характеристику звукового сигнала, то блок 220 декодирования звукового сигнала декодирует узкополосный сигнал понижающего микширования с помощью схемы кодирования звука. В этом случае, как указано в предшествующем описании, звуковой сигнал может соответствовать стандарту AAC или HE-AAC. Если узкополосный сигнал понижающего микширования имеет более высокую характеристику речевого сигнала, то блок 230 декодирования речевого сигнала декодирует узкополосный сигнал понижающего микширования с помощью схемы кодирования речи.
Блок 240 декодирования частичного диапазона генерирует широкополосный сигнал, применяя информацию расширения диапазона к узкополосному сигналу понижающего микширования, что будет объяснено подробно в отношении Фиг.6.
Блок 250 многоканального декодирования генерирует выходной сигнал, используя широкополосный сигнал понижающего микширования и пространственную информацию.
Обращаясь к Фиг.6, блок 240 декодирования частичного диапазона включает в себя блок 242 приема информации расширения диапазона, блок 244 определения копируемого диапазона и блок 246 генерации информации о целевом диапазоне. Блок 240 декодирования частичного диапазона может дополнительно включать в себя блок 248 восстановления сигнала.
Блок 242 приема информации расширения диапазона извлекает информацию о начальном диапазоне, информацию об усилении и информацию о гармонической составляющей из информации расширения диапазона, которую посылают блок 244 определения копируемого диапазона и блок 246 генерации информации о целевом диапазоне.
Блок 244 определения копируемого диапазона определяет копируемый диапазон, используя узкополосный сигнал понижающего микширования DMXn и информацию о начальном диапазоне. В этом случае, если узкополосный сигнал понижающего микширования DMXn не является узкополосными спектральными данными, то его преобразовывают в спектральные данные. Кроме того, копируемый диапазон может совпадать или отличаться от начального диапазона. Если копируемый диапазон отличается от начального диапазона, то в качестве копируемого диапазона определяют диапазон от диапазона, соответствующего информации о начальном диапазоне, до диапазона, имеющего спектральные данные. Спектральные данные, определяемые с помощью копируемого диапазона, направляют к блоку 246 генерации информации о целевом диапазоне.
Блок 246 генерации информации о целевом диапазоне генерирует спектральные данные целевого диапазона, используя спектральные данные копируемого диапазона, информацию об усилении и т.п. Данные целевого диапазона можно генерировать с помощью следующей формулы.
[Формула 2]
В формуле 2 «gi» указывает коэффициент усиления для текущего диапазона, «sd(target_band)» указывает спектральные данные целевого диапазона и «sd(copy_band)» указывают спектральные данные копируемого диапазона.
В случае предыдущего варианта осуществления, показанного в (A) на Фиг.4, коэффициенты усиления (gs, gs-4, gs-2 и т.д.) можно применять к копируемому диапазону, который расположен слева от целевого диапазона. В случае предыдущего варианта осуществления, показанного в (B) на Фиг.4, для первого целевого диапазона tb можно применять коэффициенты усиления (gs, gn-3) к спектральным данным копируемого диапазона. Для второго целевого диапазона tb' другие коэффициенты усиления (gs*gs+1, gn-3*gn-2) можно применять к спектральным данным копируемого диапазона. В случае предыдущего варианта осуществления, показанного в (C) на Фиг.4, после применения коэффициента усиления (gs) к спектральным данным sds копируемого диапазона, соответствующего частичной области узкополосного диапазона, спектральные данные вторичного целевого диапазона (tb) генерируют, применяя другой коэффициент усиления (g2nd) ко всему узкополосному диапазону.
При этом количество спектральных данных целевого диапазона Nt может отличаться от количества спектральных данных копируемого диапазона Nc. Этот случай объясняют следующим образом. Фиг.7 - схема для случая, когда количество спектральных данных целевого диапазона Nt больше количества спектральных данных копируемого диапазона Nc, и Фиг.8 является схемой для случая, когда количество спектральных данных целевого диапазона Nt меньше количества спектральных данных копируемого диапазона Nc.
Обращаясь к (A) на Фиг.7, можно заметить, что количество Nt спектральных данных целевого диапазона sfbi равно 36, и можно также заметить, что количество Nc спектральных данных копируемого диапазона sfbs равно 24. На чертеже, чем больше количество данных, тем длиннее становится горизонтальная длина диапазона. Так как количество данных целевого диапазона больше количества данных другого диапазона, можно использовать данные копируемого диапазона по меньшей мере дважды. Например, низкочастотный целевой диапазон, как показано в (B1) на Фиг.7, сначала заполняют 24 данными копируемого диапазона, и остальную часть целевого диапазона затем заполняют 12 данными из передней или задней части копируемого диапазона. Конечно, также можно применять передаваемую информацию об усилении.
Обращаясь к (A) на Фиг.8, можно заметить, что количество Nt спектральных данных целевого диапазона sfbi равно 24, а количество Nc спектральных данных копируемого диапазона sfbs равно 36. Так как количество данных целевого диапазона меньше количества данных другого диапазона, можно частично использовать данные только копируемого диапазона. Например, можно генерировать спектральные данные целевого диапазона sfbi, используя 24 спектральных данных из передней области копируемого диапазона sfbs, как показано в (B) на Фиг.8, или 24 спектральных данных из задней области целевого диапазона sfbi, как показано в (C) на Фиг.8.
Обращаясь теперь к Фиг.6, блок 246 генерации информации о целевом диапазоне генерирует спектральные данные целевого диапазона, применяя коэффициент усиления в указанных выше различных способах. При генерации спектральных данных целевого диапазона блок 246 генерации информации о целевом диапазоне может дополнительно использовать информацию о гармонической составляющей. В частности, используя информацию о гармонической составляющей, передаваемую кодером, можно генерировать субгармонический сигнал, соответствующий количеству величин целевого диапазона с помощью синтеза фазы или аналогичным образом.
Блок 246 генерации информации о целевом диапазоне может генерировать спектральные данные с помощью объединения этапа растяжения/сжатия времени и этапа прореживания. В этом случае этап растяжения/сжатия времени может включать в себя этап растяжения сигнала во временной области во временном направлении, и этот этап растяжения может использовать схему фазового вокодера. Этап прореживания может включать в себя этап сжатия растянутого во времени сигнала к исходному времени. Можно применять этап растяжения/сжатия времени и этап прореживания к спектральным данным целевого диапазона.
Блок 248 восстановления сигнала генерирует широкополосный сигнал, используя спектральные данные целевого диапазона и узкополосный сигнал. В этом случае широкополосный сигнал может включать в себя спектральные данные широкополосного сигнала или может соответствовать сигналу во временной области.
Способ обработки звукового сигнала согласно настоящему изобретению можно воплощать в считываемой компьютером программе и можно хранить на записываемом носителе. Мультимедийные данные, имеющие структуру данных настоящего изобретения, могут также храниться на считываемом компьютером записываемом носителе. Записываемый носитель включает в себя все виды запоминающих устройств, которые могут хранить данные, считываемые компьютерной системой. Записываемый носитель включает в себя, например, ПЗУ (постоянное запоминающее устройство), ОП (оперативную память), привод компакт-диска (CD-ROM), магнитные ленты, гибкие диски, оптические устройства хранения данных и т.п., и также включает в себя реализации типа несущей (например, передачу через Интернет). Битовый поток, сгенерированный способом кодирования, можно хранить на считываемом компьютером записываемом носителе или передавать через проводную сеть/сеть беспроводной связи.
ПРОМЫШЛЕННАЯ ПРИМЕНИМОСТЬ
Соответственно настоящее изобретение можно применять к кодированию/декодированию аудио/видеосигнала.
Хотя настоящее изобретение описано и показано в данной работе в отношении предпочтительных вариантов его осуществления, специалистам будет понятно, что различные модификации и изменения можно выполнять, не отступая от сущности и объема изобретения. Таким образом, настоящее изобретение охватывает модификации и изменения данного изобретения, которые находятся в рамках прилагаемой формулы изобретения и ее эквивалентов.
Изобретение относится к кодированию и декодированию звуковых сигналов с использованием спектральных данных сигнала. Раскрыт способ обработки звукового сигнала, заключающийся в приеме спектральных данных, соответствующих первому диапазону в диапазоне частот, включающем в себя первый диапазон и второй диапазон, определении копируемого диапазона, основываясь на информации о частоте копируемого диапазона, соответствующего частичному диапазону первого диапазона, и генерации спектральных данных целевого диапазона, соответствующего второму диапазону, используя спектральные данные копируемого диапазона, причем копируемый диапазон существует в верхней части первого диапазона. Технический результат - увеличение скорости восстановления звукового сигнала. 5 н. и 10 з.п. ф-лы, 8 ил.
1. Способ обработки звукового сигнала, содержащий этапы, на которых:
принимают спектральные данные, соответствующие первому диапазону из диапазона частот, включающего в себя первый диапазон и второй диапазон;
определяют копируемый диапазон, основываясь на информации о частоте копируемого диапазона, соответствующего частичному диапазону первого диапазона; и
генерируют спектральные данные целевого диапазона, соответствующего второму диапазону, используя спектральные данные копируемого диапазона,
причем копируемый диапазон существует в верхней части первого диапазона.
2. Способ по п.1, при котором спектральные данные целевого диапазона генерируют с помощью объединения этапа растяжения/сжатия времени и этапа прореживания.
3. Способ по п.1, при котором информация о частоте копируемого диапазона содержит, по меньшей мере, одно из информации о начальной частоте, о начальном диапазоне и об индексе, указывающем начальный диапазон.
4. Способ по п.1, при котором спектральные данные целевого диапазона генерируют с использованием, по меньшей мере, одного из информации об усилении, соответствующей коэффициенту усиления между спектральными данными копируемого диапазона и целевого диапазона, и гармонической информации копируемого диапазона.
5. Способ по п.1, при котором спектральные данные первого диапазона генерируют на основании сигнала, декодированного с помощью или схемы кодирования звука, или схемы кодирования речи.
6. Устройство для обработки звукового сигнала, содержащее:
блок определения копируемого диапазона, который принимает спектральные данные, соответствующие первому диапазону в диапазоне частот, включающем в себя первый диапазон и второй диапазон, при этом блок определения копируемого диапазона определяет копируемый диапазон, основываясь на информации о частоте копируемого диапазона, соответствующего частичному диапазону первого диапазона; и
блок генерации информации о целевом диапазоне, который генерирует спектральные данные целевого диапазона, соответствующего второму диапазону, используя спектральные данные копируемого диапазона,
причем копируемый диапазон существует в верхней части первого диапазона.
7. Устройство по п.6, в котором спектральные данные целевого диапазона генерируют с помощью объединения этапа фильтрации, этапа растяжения/сжатия времени и этапа прореживания.
8. Устройство по п.6, в котором информация о частоте копируемого диапазона содержит одно из информации о начальной частоте, о начальном диапазоне и об индексе, указывающем начальный диапазон.
9. Устройство по п.6, в котором спектральные данные целевого диапазона генерируют с использованием, по меньшей мере, одного из информации об усилении, соответствующей коэффициенту усиления между спектральными данными копируемого диапазона и целевого диапазона, и гармонической информации копируемого диапазона.
10. Устройство по п.6, в котором спектральные данные первого диапазона генерируют, основываясь на сигнале, декодированном с помощью или схемы кодирования звука, или схемы кодирования речи.
11. Способ обработки звукового сигнала, содержащий этапы, на которых:
получают спектральные данные диапазона частот, включающего в себя первый диапазон и второй диапазон;
определяют копируемый диапазон и целевой диапазон, используя спектральные данные диапазона частот;
генерируют информацию о частоте копируемого диапазона, причем информация о частоте указывает частоту копируемого диапазона; и
генерируют спектральные данные первого диапазона путем исключения спектральных данных целевого диапазона из спектральных данных диапазона частот.
12. Способ по п.11, дополнительно содержащий этап генерирования информации об усилении, соответствующей коэффициенту усиления между спектральными данными копируемого диапазона и целевого диапазона.
13. Устройство для обработки звукового сигнала, содержащее:
блок получения спектральных данных, который получает широкополосные спектральные данные; и
блок определения копируемого диапазона, который определяет копируемый диапазон и целевой диапазон, используя широкополосные спектральные данные, причем блок определения копируемого диапазона выводит информацию о начальной частоте копируемого диапазона или информацию о начальном диапазоне, соответствующую информации индекса начального диапазона для копируемого диапазона, при этом блок определения копируемого диапазона выводит узкополосные спектральные данные путем исключения спектральных данных целевого диапазона из широкополосных спектральных данных.
14. Устройство по п.13, дополнительно содержащее блок получения информации об усилении, который генерирует информацию об усилении, соответствующую коэффициенту усиления между спектральными данными копируемого диапазона и целевого диапазона.
15. Считываемый компьютером носитель хранения, содержащий хранящиеся на нем цифровые звуковые данные, причем цифровые звуковые данные включают в себя спектральные данные, соответствующие первому диапазону в диапазоне частот, и информацию расширения диапазона,
причем диапазон частот включает в себя первый диапазон и второй диапазон,
причем копируемый диапазон для генерации целевого диапазона второго диапазона включает в себя верхнюю часть первого диапазона, и
причем информация расширения диапазона включает в себя, по меньшей мере, одно из информации о частоте копируемого диапазона, информации об усилении и гармонической информации копируемого диапазона.
US 2007271095 A1, 22.11.2007 | |||
Устройство для упаковки сыпучих материалов в тару | 1989 |
|
SU1768451A1 |
СПОСОБ КОДИРОВАНИЯ РЕЧИ (ВАРИАНТЫ), КОДИРУЮЩЕЕ И ДЕКОДИРУЮЩЕЕ УСТРОЙСТВО | 1998 |
|
RU2214048C2 |
Дорожная спиртовая кухня | 1918 |
|
SU98A1 |
УСТРОЙСТВО КОДИРОВАНИЯ СИГНАЛА, УСТРОЙСТВО ДЕКОДИРОВАНИЯ СИГНАЛА, НОСИТЕЛЬ ЗАПИСИ И СПОСОБ КОДИРОВАНИЯ И ДЕКОДИРОВАНИЯ | 1994 |
|
RU2131169C1 |
US 5956674 A, 21.09.1999. |
Авторы
Даты
2012-01-10—Публикация
2008-12-18—Подача