Область техники
Один или несколько аспектов настоящего изобретения относятся к способу и устройству для кодирования и декодирования аудиосигнала, например речевого сигнала или музыкального сигнала, а конкретнее - к способу и устройству для кодирования и декодирования сигнала, соответствующего диапазону высоких частот аудиосигнала.
Предшествующий уровень техники
Сигнал, соответствующий диапазону высоких частот, менее чувствителен к точной структуре частоты, нежели сигнал, соответствующий диапазону низких частот. Таким образом, когда эффективность кодирования повышается для устранения ограничений в отношении разрядов, доступных для кодирования аудиосигнала, большое количество разрядов назначается сигналу, соответствующему диапазону низких частот, и относительно небольшое количество разрядов назначается сигналу, соответствующему диапазону высоких частот.
Технологией, применяющей вышеописанный способ, является копирование спектральных полос (SBR). В SBR эффективность кодирования повышается путем выражения высокочастотного сигнала с помощью огибающей и синтезирования огибающей во время процесса декодирования. SBR основывается на характеристиках слышимости человека, имеющих относительно низкое разрешение в отношении высокочастотного сигнала.
Подробное описание изобретения
Техническая проблема
Настоящее изобретение предоставляет способы расширения диапазона высоких частот на основе копирования спектральных полос (SBR).
Техническое решение
В соответствии с аспектом настоящего изобретения предоставляется кодирующее устройство, включающее в себя дискретизатор с понижением частоты для понижающей дискретизации входного сигнала; базовый кодер для выполнения базового кодирования входного сигнала с пониженной дискретизацией; преобразователь частоты для выполнения преобразования частоты над входным сигналом и кодер с расширением для выполнения кодирования с расширением полосы частот, используя основной сигнал входного сигнала в частотной области.
В соответствии с другим аспектом настоящего изобретения предоставляется кодирующее устройство, включающее в себя дискретизатор с понижением частоты для понижающей дискретизации входного сигнала; базовый кодер для выполнения базового кодирования входного сигнала с пониженной дискретизацией; преобразователь частоты для выполнения преобразования частоты над входным сигналом и кодер с расширением для выполнения кодирования с расширением полосы частот, используя характеристики входного сигнала и основной сигнал входного сигнала в частотной области.
В соответствии с другим аспектом настоящего изобретения предоставляется кодирующее устройство, включающее в себя селектор режима кодирования для выбора режима кодирования для выполнения кодирования с расширением полосы частот на основе входного сигнала в частотной области и входного сигнала во временной области и кодер с расширением для выполнения кодирования с расширением полосы частот, используя входной сигнал в частотной области и режим кодирования.
Кодер с расширением может включать в себя генератор основного сигнала для формирования основного сигнала входного сигнала в частотной области из частотного спектра входного сигнала в частотной области; модуль оценки коэффициента для оценивания коэффициента регулирования энергии с использованием основного сигнала; модуль извлечения энергии для извлечения энергии из входного сигнала в частотной области; контроллер энергии для регулирования извлеченной энергии с использованием коэффициента регулирования энергии и квантователь энергии для квантования регулируемой энергии.
Кодер с расширением может включать в себя генератор основного сигнала для формирования основного сигнала входного сигнала в частотной области с использованием частотного спектра входного сигнала в частотной области; модуль оценки коэффициента для оценивания коэффициента регулирования энергии на основе использования характеристик входного сигнала и основного сигнала; модуль извлечения энергии для извлечения энергии из входного сигнала в частотной области; контроллер энергии для регулирования извлеченной энергии с использованием коэффициента регулирования энергии и квантователь энергии для квантования регулируемой энергии.
Кодер с расширением может включать в себя модуль извлечения энергии для извлечения энергии из входного сигнала в частотной области на основе режима кодирования; контроллер энергии для регулирования извлеченной энергии с использованием коэффициента регулирования энергии на основе режима кодирования и квантователь энергии для квантования регулируемой энергии на основе режима кодирования.
Генератор основного сигнала может включать в себя генератор искусственного сигнала для формирования искусственного сигнала, соответствующего диапазону высоких частот высокочастотной области, путем копирования и свертывания диапазона низких частот низкочастотной области входного сигнала в частотной области; модуль оценки огибающей для оценивания огибающей основного сигнала с использованием окна и блок применения огибающей для применения оцененной огибающей к искусственному сигналу.
Модуль оценки коэффициента может включать в себя первый вычислитель тональности для вычисления тональности диапазона высоких частот высокочастотной области входного сигнала в частотной области; второй вычислитель тональности для вычисления тональности основного сигнала и вычислитель коэффициента для вычисления коэффициента регулирования энергии с использованием тональности диапазона высоких частот высокочастотной области входного сигнала в частотной области и тональности основного сигнала.
В соответствии с другим аспектом настоящего изобретения предоставляется кодирующее устройство, включающее в себя блок классификации сигнала для определения режима кодирования входного сигнала на основе характеристик входного сигнала; кодер с линейным предсказанием с кодовым возбуждением (CELP) для выполнения кодирования с CELP низкочастотного сигнала входного сигнала, когда режим кодирования входного сигнала определяется как режим кодирования с CELP; кодер во временной области (TD) с расширением для выполнения кодирования с расширением высокочастотного сигнала входного сигнала, когда кодированию с CELP подвергается низкочастотный сигнал входного сигнала; преобразователь частоты для выполнения преобразования частоты над входным сигналом, когда режим кодирования входного сигнала определяется как режим частотной области (FD) и кодер в FD для выполнения FD-кодирования преобразованного входного сигнала.
Кодер в FD может включать в себя кодер нормализации для извлечения энергии из преобразованного входного сигнала для каждой полосы частот и квантования извлеченной энергии; факториально-импульсный кодер для выполнения факториального импульсного кодирования (FPC) значения, полученного посредством масштабирования преобразованного входного сигнала, с использованием квантованного значения нормализации и генератор информации дополнительного шума для формирования информации дополнительного шума в соответствии с выполнением FPC, и преобразованный входной сигнал, введенный в кодер FD, может быть переходным кадром.
Кодер в FD может включать в себя кодер нормализации для извлечения энергии из преобразованного входного сигнала для каждой полосы частот и квантования извлеченной энергии; факториально-импульсный кодер для выполнения факториального импульсного кодирования (FPC) значения, полученного посредством масштабирования преобразованного входного сигнала, с использованием квантованного значения нормализации; генератор информации дополнительного шума для формирования информации дополнительного шума в соответствии с выполнением FPC; и кодер в FD с расширением для выполнения кодирования с расширением высокочастотного сигнала преобразованного входного сигнала, и преобразованный входной сигнал, введенный в кодер FD, может быть постоянным кадром.
Кодер в FD с расширением может выполнять квантование энергии с использованием одной и той же кодовой книги на разных скоростях передачи битов.
Поток двоичных сигналов в соответствии с результатом выполнения FD-кодирования преобразованного входного сигнала может включать в себя информацию о режиме предыдущего кадра.
В соответствии с другим аспектом настоящего изобретения предоставляется кодирующее устройство, включающее в себя блок классификации сигнала для определения режима кодирования входного сигнала на основе характеристик входного сигнала; кодер коэффициентов линейного предсказания (LPC) для извлечения LPC из низкочастотного сигнала входного сигнала и квантования LPC; кодер с линейным предсказанием с кодовым возбуждением (CELP) для выполнения кодирования с CELP сигнала возбуждения LPC низкочастотного сигнала входного сигнала, извлеченного с использованием LPC, когда режим кодирования входного сигнала определяется как режим кодирования с CELP; кодер во временной области (TD) с расширением для выполнения кодирования с расширением высокочастотного сигнала входного сигнала, когда кодированию с CELP подвергается сигнал возбуждения LPC; аудиокодер для выполнения аудиокодирования сигнала возбуждения LPC, когда режим кодирования входного сигнала определяется как аудиорежим; и кодер в FD с расширением для выполнения кодирования с расширением высокочастотного сигнала входного сигнала, когда аудиокодированию подвергается сигнал возбуждения LPC.
Кодер в FD с расширением может выполнять квантование энергии с использованием одной и той же кодовой книги на разных скоростях передачи битов.
В соответствии с другим аспектом настоящего изобретения предоставляется декодирующее устройство, включающее в себя базовый декодер для выполнения базового декодирования кодированного базовым кодированием входного сигнала, включенным в поток двоичных сигналов; дискретизатор с повышением частоты для повышающей дискретизации декодированного базовым декодированием входного сигнала; преобразователь частоты для выполнения преобразования частоты над входным сигналом с повышенной частотой дискретизации и декодер с расширением для выполнения декодирования с расширением полосы частот, используя энергию входного сигнала, включенного в поток двоичных сигналов, и входной сигнал в частотной области.
Декодер с расширением может включать в себя обратный квантователь для обратного квантования энергии входного сигнала; генератор основного сигнала для формирования основного сигнала с использованием входного сигнала в частотной области; вычислитель усиления для вычисления усиления, которое нужно применить к основному сигналу, используя обратно квантованную энергию и энергию основного сигнала; и блок применения усиления для применения усиления к каждой из полос частот.
Генератор основного сигнала может включать в себя генератор искусственного сигнала для формирования искусственного сигнала, соответствующего диапазону высоких частот, путем копирования и свертывания диапазона низких частот входного сигнала в частотной области; модуль оценки огибающей для оценивания огибающей основного сигнала с использованием окна, включенного в поток двоичных сигналов; и блок применения огибающей для применения оцененной огибающей к искусственному сигналу.
В соответствии с другим аспектом настоящего изобретения предоставляется декодирующее устройство, включающее в себя блок проверки информации о режиме для проверки информации о режиме каждого из кадров, включенных в поток двоичных сигналов; декодер с линейным предсказанием с кодовым возбуждением (CELP) для выполнения декодирования с CELP кодированного c CELP кадра на основе результата проверки; декодер во временной области (TD) с расширением для формирования декодированного сигнала диапазона высоких частот с использованием по меньшей мере одного из результата выполнения декодирования с CELP и сигнала возбуждения низкочастотного сигнала; декодер частотной области (FD) для выполнения FD-декодирования кодированного в FD кадре на основе результата проверки и обратный преобразователь частоты для выполнения обратного преобразования частоты над результатом выполнения FD-декодирования.
Декодер в FD может включать в себя декодер нормализации для выполнения декодирования с нормализацией на основе информации нормализации, включенной в поток двоичных сигналов; декодер факториального импульсного кодирования (FPC) для выполнения декодирования FPC на основе информации факториального импульсного кодирования, включенной в поток двоичных сигналов; и блок выполнения шумового заполнения для выполнения шумового заполнения результата выполнения декодирования FPC.
Декодер в FD может включать в себя декодер нормализации для выполнения декодирования с нормализацией на основе информации нормализации, включенной в поток двоичных сигналов; декодер факториального импульсного кодирования (FPC) для выполнения декодирования FPC на основе информации факториального импульсного кодирования, включенной в поток двоичных сигналов; блок выполнения шумового заполнения для выполнения шумового заполнения результата выполнения декодирования FPC; и декодер в FD с расширением высокой частоты для выполнения декодирования с расширением высокой частоты на основе результата выполнения декодирования FPC и результата выполнения шумового заполнения.
Декодер в FD дополнительно может включать в себя кодер в FD с расширением низкой частоты для выполнения кодирования с расширением результатов выполнения декодирования FPC и шумового заполнения, когда значение верхней полосы у полосы частот, выполняющей декодирование FPC, меньше значения верхней полосы у полосы частот базового сигнала.
Декодер в FD с расширением высокой частоты может выполнять обратное квантование энергии путем совместного использования одной кодовой книги на разных скоростях передачи битов.
Декодер в FD может выполнять FD-декодирование кодированного в FD кадра на основе информации о режиме предыдущего кадра, включенной в поток двоичных сигналов.
В соответствии с другим аспектом настоящего изобретения предоставляется декодирующее устройство, включающее в себя блок проверки информации о режиме для проверки информации о режиме каждого из кадров, включенных в поток двоичных сигналов; декодер коэффициентов линейного предсказания (LPC) для выполнения декодирования LPC кадров, включенных в поток двоичных сигналов; декодер с линейным предсказанием с кодовым возбуждением (CELP) для выполнения декодирования с CELP кодированного с CELP кадра на основе результата проверки; декодер во временной области (TD) с расширением для формирования декодированного сигнала диапазона высоких частот с использованием по меньшей мере одного из результата выполнения декодирования с CELP и сигнала возбуждения низкочастотного сигнала; аудиодекодер для выполнения аудиодекодирования кодированного аудиокадра на основе результата проверки; и декодер частотной области (FD) с расширением для выполнения декодирования с расширением с использованием результата выполнения аудиодекодирования.
Декодер в FD с расширением может выполнять обратное квантование энергии путем совместного использования одной кодовой книги на разных скоростях передачи битов.
В соответствии с другим аспектом настоящего изобретения предоставляется способ кодирования, включающий в себя понижающую дискретизацию входного сигнала; выполнение базового кодирования входного сигнала с пониженной дискретизацией; выполнение преобразования частоты над входным сигналом и выполнение кодирования с расширением полосы частот, используя основной сигнал входного сигнала в частотной области.
В соответствии с другим аспектом настоящего изобретения предоставляется способ кодирования, включающий в себя понижающую дискретизацию входного сигнала; выполнение базового кодирования входного сигнала с пониженной дискретизацией; выполнение преобразования частоты входного сигнала и выполнение кодирования с расширением полосы частот, используя характеристики входного сигнала и основной сигнал входного сигнала в частотной области.
В соответствии с другим аспектом настоящего изобретения предоставляется способ кодирования, включающий в себя выбор режима кодирования для выполнения кодирования с расширением полосы частот на основе использования входного сигнала в частотной области и входного сигнала во временной области и выполнение кодирования с расширением полосы частот, используя входной сигнал в частотной области и режим кодирования.
В соответствии с другим аспектом настоящего изобретения предоставляется способ декодирования, включающий в себя выполнение базового декодирования кодированного базовым кодом входного сигнала, включенным в поток двоичных сигналов; повышающую дискретизацию декодированного базовым кодом входного сигнала; выполнение преобразования частоты входного сигнала с повышенной частотой дискретизации и выполнение декодирования с расширением полосы частот, используя входной сигнал в частотной области и энергию входного сигнала, включенного в поток двоичных сигналов.
В соответствии с другим аспектом настоящего изобретения предоставляется способ кодирования, включающий в себя определение режима кодирования входного сигнала на основе характеристик входного сигнала; выполнение кодирования с линейным предсказанием с кодовым возбуждением (CELP) низкочастотного сигнала входного сигнала, когда режим кодирования входного сигнала определяется как режим кодирования с CELP; выполнение кодирования во временной области (TD) с расширением высокочастотного сигнала входного сигнала, когда кодированию с CELP подвергается низкочастотный сигнал входного сигнала; выполнение преобразования частоты входного сигнала, когда режим кодирования входного сигнала определяется как режим частотной области (FD); и выполнение FD-кодирования преобразованного входного сигнала.
Выполнение FD-кодирования может включать в себя выполнение квантования энергии путем совместного использования одной кодовой книги на разных скоростях передачи битов.
Поток двоичных сигналов в соответствии с результатом выполнения FD-кодирования преобразованного входного сигнала может включать в себя информацию о режиме предыдущего кадра.
В соответствии с другим аспектом настоящего изобретения предоставляется способ кодирования, включающий в себя определение режима кодирования входного сигнала на основе характеристик входного сигнала; извлечение коэффициентов линейного предсказания (LPC) из низкочастотного сигнала входного сигнала и квантование LPC; выполнение кодирования с линейным предсказанием с кодовым возбуждением (CELP) сигнала возбуждения LPC низкочастотного сигнала входного сигнала, извлеченного с использованием LPC, когда режим кодирования входного сигнала определяется как режим кодирования с CELP; выполнение кодирования во временной области (TD) с расширением высокочастотного сигнала входного сигнала, когда кодированию с CELP подвергается сигнал возбуждения LPC; выполнение аудиокодирования сигнала возбуждения LPC, когда режим кодирования входного сигнала определяется как режим аудиокодирования; и выполнение кодирования в частотной области (FD) с расширением высокочастотного сигнала входного сигнала, когда аудиокодированию подвергается сигнал возбуждения LPC.
Выполнение FD-кодирования с расширением может включать в себя выполнение квантования энергии путем совместного использования одной кодовой книги на разных скоростях передачи битов.
В соответствии с другим аспектом настоящего изобретения предоставляется способ декодирования, включающий в себя проверку информации о режиме каждого из кадров, включенных в поток двоичных сигналов; выполнение декодирования с линейным предсказанием с кодовым возбуждением (CELP) кодированного с CELP кадром на основе результата проверки; формирование декодированного сигнала диапазона высоких частот с использованием по меньшей мере одного из результата выполнения декодирования с CELP и сигнала возбуждения низкочастотного сигнала; выполнение декодирования в частотной области (FD) кодированного в FD кадра на основе результата проверки и выполнение обратного частотного преобразования результата выполнения FD-декодирования.
Выполнение FD-декодирования может включать в себя выполнение обратного квантования энергии путем совместного использования одной кодовой книги на разных скоростях передачи битов.
Выполнение FD-декодирования может включать в себя выполнение FD-декодирования кодированного в FD кадра на основе информации о режиме предыдущего кадра, включенной в поток двоичных сигналов.
В соответствии с другим аспектом настоящего изобретения предоставляется способ декодирования, включающий в себя проверку информации о режиме каждого из кадров, включенных в поток двоичных сигналов; выполнение декодирования коэффициентов линейного предсказания (LPC) кадров, включенных в поток двоичных сигналов; выполнение декодирования с линейным предсказанием с кодовым возбуждением (CELP) кодированного с CELP кадра на основе результата проверки; формирование декодированного сигнала высокочастотного сигнала с использованием по меньшей мере одного из результата выполнения декодирования с CELP и сигнала возбуждения низкочастотного сигнала; выполнение аудиодекодирования кодированного аудиокадра на основе результата проверки и выполнение декодирования с расширением частотной области (FD) с использованием результата выполнения аудиодекодирования.
Выполнение декодирования в FD с расширением может включать в себя выполнение обратного квантования энергии с использованием одной и той же кодовой книги на разных скоростях передачи битов.
Полезные результаты
В соответствии с вариантом осуществления настоящего изобретения можно эффективно расширить диапазон высоких частот путем извлечения основного сигнала входного сигнала и регулирования энергии входного сигнала с использованием тональности диапазона высоких частот входного сигнала и тональности основного сигнала.
Краткое описание чертежей
Фиг. 1 - структурная схема кодирующего устройства и декодирующего устройства в соответствии с вариантом осуществления настоящего изобретения.
Фиг. 2A - структурная схема всей структуры кодирующего устройства в соответствии с вариантом осуществления настоящего изобретения.
Фиг. 2B - структурная схема всей структуры кодирующего устройства в соответствии с другим вариантом осуществления настоящего изобретения.
Фиг. 2C - структурная схема кодера частотной области (FD), включенного в кодирующее устройство, в соответствии с вариантом осуществления настоящего изобретения.
Фиг. 2D - структурная схема всей структуры кодирующего устройства в соответствии с другим вариантом осуществления настоящего изобретения.
Фиг. 3 - структурная схема базового кодера, включенного в кодирующее устройство, в соответствии с вариантом осуществления настоящего изобретения.
Фиг. 4 - структурная схема кодера с расширением, включенного в кодирующее устройство, в соответствии с вариантом осуществления настоящего изобретения.
Фиг. 5 - структурная схема кодера с расширением, включенного в кодирующее устройство, в соответствии с другим вариантом осуществления настоящего изобретения.
Фиг. 6 - структурная схема генератора основного сигнала, включенного в кодер с расширением, в соответствии с вариантом осуществления настоящего изобретения.
Фиг. 7 - структурная схема модуля оценки коэффициента, включенного в кодер с расширением, в соответствии с вариантом осуществления настоящего изобретения.
Фиг. 8 - блок-схема, иллюстрирующая работу квантователя энергии в соответствии с вариантом осуществления настоящего изобретения.
Фиг. 9 - схема, иллюстрирующая процесс квантования энергии в соответствии с вариантом осуществления настоящего изобретения.
Фиг. 10 - схема, иллюстрирующая процесс формирования искусственного сигнала в соответствии с вариантом осуществления настоящего изобретения.
Фиг. 11A и 11B соответственно иллюстрируют окна для оценивания огибающей в соответствии с вариантами осуществления настоящего изобретения.
Фиг. 12A - структурная схема декодирующего устройства в соответствии с вариантом осуществления настоящего изобретения.
Фиг. 12B - структурная схема декодирующего устройства в соответствии с другим вариантом осуществления настоящего изобретения.
Фиг. 12C - структурная схема декодера FD, включенного в декодирующее устройство, в соответствии с вариантом осуществления настоящего изобретения.
Фиг. 12D - структурная схема декодирующего устройства в соответствии с другим вариантом осуществления настоящего изобретения.
Фиг. 13 - структурная схема декодера с расширением, включенного в декодирующее устройство, в соответствии с вариантом осуществления настоящего изобретения.
Фиг. 14 - блок-схема, иллюстрирующая работу обратного квантователя, включенного в декодер с расширением, в соответствии с вариантом осуществления настоящего изобретения.
Фиг. 15A - блок-схема, иллюстрирующая способ кодирования в соответствии с вариантом осуществления настоящего изобретения.
Фиг. 15B - блок-схема, иллюстрирующая способ кодирования в соответствии с другим вариантом осуществления настоящего изобретения.
Фиг. 15C - блок-схема, иллюстрирующая способ кодирования в соответствии с другим вариантом осуществления настоящего изобретения.
Фиг. 16A - блок-схема, иллюстрирующая способ декодирования в соответствии с вариантом осуществления настоящего изобретения.
Фиг. 16B - блок-схема, иллюстрирующая способ декодирования в соответствии с другим вариантом осуществления настоящего изобретения.
Фиг. 16C - блок-схема, иллюстрирующая способ декодирования в соответствии с другим вариантом осуществления настоящего изобретения.
Фиг. 17 - структурная схема всей структуры кодирующего устройства в соответствии с другим вариантом осуществления настоящего изобретения.
Фиг. 18 - блок-схема, иллюстрирующая работу квантователя энергии, включенного в кодирующее устройство, в соответствии с другим вариантом осуществления настоящего изобретения.
Фиг. 19 - схема, иллюстрирующая процесс квантования энергии с использованием способа неравного распределения разрядов в соответствии с вариантом осуществления настоящего изобретения.
Фиг. 20 - схема, иллюстрирующая векторное квантование с использованием внутрикадрового предсказания в соответствии с вариантом осуществления настоящего изобретения.
Фиг. 21 - схема, иллюстрирующая процесс квантования энергии с использованием способа взвешивания частот в соответствии с другим вариантом осуществления настоящего изобретения.
Фиг. 22 - схема, иллюстрирующая векторное квантование с использованием многоэтапного раздельного векторного квантования и внутрикадрового предсказания в соответствии с вариантом осуществления настоящего изобретения.
Фиг. 23 - схема, иллюстрирующая работу обратного квантователя, включенного в декодирующее устройство, в соответствии с другим вариантом осуществления настоящего изобретения.
Фиг. 24 - структурная схема всей структуры кодирующего устройства в соответствии с другим вариантом осуществления настоящего изобретения.
Фиг. 25 - схема, иллюстрирующая потоки двоичных сигналов в соответствии с вариантом осуществления настоящего изобретения.
Фиг. 26 - схема, иллюстрирующая способ выполнения распределения частот для каждой полосы частот в соответствии с вариантом осуществления настоящего изобретения.
Фиг. 27 - схема, иллюстрирующая полосы частот, используемые в кодере в FD или декодере в FD в соответствии с вариантом осуществления настоящего изобретения.
Варианты осуществления изобретения
Ниже будут подробно описываться типовые варианты осуществления настоящего изобретения со ссылкой на прилагаемые чертежи.
Фиг. 1 - структурная схема кодирующего устройства 101 и декодирующего устройства 102 в соответствии с вариантом осуществления настоящего изобретения.
Кодирующее устройство 101 может формировать основной сигнал (или базовый сигнал) входного сигнала и передавать основной сигнал декодирующему устройству 102. Основной сигнал формируется на основе низкочастотного сигнала входного сигнала. Основной сигнал может быть сигналом возбуждения для расширения диапазона высоких частот, поскольку основной сигнал получается путем отбеливания информации огибающей низкочастотного сигнала. Декодирующее устройство 102 может восстановить входной сигнал из основного сигнала. Другими словами, кодирующее устройство 101 и декодирующее устройство 102 выполняют расширение сверхширокой полосы частот (SWB BWE). Если подробнее, то посредством SWB BWE сигнал, соответствующий диапазону высоких частот от 6,4 до 16 кГц, соответствующему SWB, может формироваться на основе декодированного широкополосного (WB) сигнала, соответствующего диапазону низких частот от 0 до 6,4 кГц. Здесь 16 кГц может меняться в соответствии с обстоятельствами. Декодированный WB-сигнал может формироваться с использованием речевого кодека в соответствии с линейным предсказанием с кодовым возбуждением (CELP) на основе области линейного предсказания (LPD) или путем выполнения квантования в частотной области. Пример способа выполнения квантования в частотной области может включать в себя усовершенствованное аудиокодирование (AAC) на основе модифицированного дискретного косинусного преобразования (MDCT).
Ниже подробно описаны операции кодирующего устройства 101 и декодирующего устройства 102.
Фиг. 2A - структурная схема всей структуры кодирующего устройства 101 в соответствии с вариантом осуществления настоящего изобретения.
Ссылаясь на фиг. 2A, кодирующее устройство 101 может включать в себя дискретизатор 201 с понижением частоты, базовый кодер 202, преобразователь 203 частоты и кодер 204 с расширением.
Для широкополосного (WB) кодирования дискретизатор 201 с понижением частоты может понизить частоту дискретизации у входного сигнала. Обычно входной сигнал, например сверхширокополосный (SWB) сигнал, имеет частоту дискретизации 32 кГц и конвертируется в сигнал, имеющий частоту дискретизации, подходящую для WB-кодирования. Например, дискретизатор 201 с понижением частоты может дискретизировать с понижением частоты входной сигнал, имеющий частоту дискретизации, например, в 32 кГц, до сигнала, имеющего частоту дискретизации, например, в 12,8 кГц.
Базовый кодер 202 может выполнять базовое кодирование входного сигнала с пониженной дискретизацией. Другими словами, базовый кодер 202 может выполнять WB-кодирование. Например, базовый кодер 202 может выполнять WB-кодирование на основе способа CELP.
Преобразователь 203 частоты может выполнять преобразование частоты над входным сигналом. Например, преобразователь 203 частоты может выполнять Быстрое преобразование Фурье (FFT) или MDCT для выполнения преобразования частоты над входным сигналом. В дальнейшем предполагается, что используется MDCT.
Кодер 204 с расширением может выполнять кодирование с расширением полосы частот, используя основной сигнал входного сигнала в частотной области. То есть кодер 204 с расширением может выполнять кодирование SWB BWE на основе входного сигнала в частотной области. В этом случае кодер 204 с расширением не принимает информацию кодирования, которая будет описываться ниже со ссылкой на фиг. 4.
Также кодер 204 с расширением может выполнять кодирование с расширением полосы частот на основе характеристик входного сигнала и на основе основного сигнала входного сигнала в частотной области. В этом случае кодер 204 с расширением может быть реализован, как проиллюстрировано на фиг. 4 или 5, в соответствии с источником характеристик входного сигнала.
Работа кодера 204 с расширением будет подробно описываться ниже со ссылкой на фиг. 4 и фиг. 5.
Таким образом, верхний путь и нижний путь на фиг. 2A обозначают соответственно процесс базового кодирования и процесс кодирования с расширением полосы частот. Информация об энергии входного сигнала может передаваться декодирующему устройству 102 посредством кодирования SWB BWE.
Фиг. 2B - структурная схема всей структуры кодирующего устройства 101 в соответствии с другим вариантом осуществления настоящего изобретения.
Ссылаясь на фиг. 2B, кодирующее устройство 101 может включать в себя блок 205 классификации сигнала, кодер 206 с CELP, кодер 207 во временной области (TD) с расширением, преобразователь 208 частоты и кодер 209 частотной области (FD).
Блок 205 классификации сигнала определяет режим кодирования входного сигнала на основе характеристик входного сигнала. В текущем варианте осуществления режим кодирования может быть способом кодирования.
Например, блок 205 классификации сигнала может определить режим кодирования входного сигнала с учетом характеристик временной области и характеристик частотной области входного сигнала. Также блок 205 классификации сигнала определяет, что нужно выполнить кодирование с CELP входного сигнала, когда характеристиками входного сигнала является речевой сигнал, и определяет, что нужно выполнить FD-кодирование входного сигнала, когда характеристиками входного сигнала является аудиосигнал.
Однако входной сигнал, поступивший в блок 205 классификации сигнала, может быть сигналом, у которого понижена частота дискретизации посредством дискретизатора с понижением частоты (не показан). Например, в соответствии с текущим вариантом осуществления входной сигнал может быть сигналом, имеющим частоту дискретизации 12,8 кГц или 16 кГц в результате повторной дискретизации сигнала, имеющего частоту дискретизации 32 кГц или 48 кГц. Повторная дискретизация может быть понижающей дискретизацией.
Как описано выше со ссылкой на фиг. 2A, сигнал, имеющий частоту дискретизации 32 кГц, может быть сверхширокополосным (SWB) сигналом. SWB-сигнал может быть полнодиапазонным (FB) сигналом. Сигнал, имеющий частоту дискретизации 16 кГц, может быть WB-сигналом.
Блок 205 классификации сигнала может определить режим кодирования низкочастотного сигнала, соответствующего диапазону низких частот входного сигнала, как режим CELP или режим FD на основе характеристик низкочастотного сигнала.
Если режим кодирования входного сигнала определяется как режим CELP, то кодер 206 с CELP выполняет кодирование с CELP низкочастотного сигнала входного сигнала. Например, кодер 206 с CELP может извлечь сигнал возбуждения из низкочастотного сигнала входного сигнала и квантовать извлеченный сигнал возбуждения на основе вклада постоянной кодовой книги и вклада адаптивной кодовой книги, соответствующих информации основного тона.
Однако настоящее изобретение этим не ограничивается, и кодер 206 с CELP может дополнительно извлечь коэффициенты линейного предсказания (LPC) из низкочастотного сигнала входного сигнала, квантовать извлеченный LPC и извлечь сигнал возбуждения, используя квантованный LPC.
Также в соответствии с текущим вариантом осуществления кодер 206 с CELP может выполнить кодирование с CELP низкочастотного сигнала входного сигнала в соответствии с различным режимом кодирования в соответствии с характеристиками низкочастотного сигнала входного сигнала. Например, кодер 206 с CELP может выполнить кодирование с CELP низкочастотного сигнала входного сигнала в соответствии с одним из, например, тонального режима кодирования, нетонального режима кодирования, переходного режима кодирования и общего режима кодирования.
Когда кодированию с CELP подвергается низкочастотный сигнал входного сигнала, кодер 207 в TD с расширением выполняет кодирование с расширением высокочастотного сигнала входного сигнала. Например, кодер 207 в TD с расширением квантует LPC высокочастотного сигнала, соответствующего диапазону высоких частот входного сигнала. В этом случае кодер 207 в TD с расширением может извлечь LPC высокочастотного сигнала входного сигнала и квантовать извлеченный LPC. В противном случае кодер 207 в TD с расширением может сформировать LPC высокочастотного сигнала входного сигнала с использованием сигнала возбуждения низкочастотного сигнала входного сигнала.
Таким образом, кодер 207 в TD с расширением может быть высокочастотным кодером в TD с расширением, но настоящее изобретение им не ограничивается.
Если режим кодирования входного сигнала определяется как режим FD-кодирования, то преобразователь 208 частоты выполняет преобразование частоты над входным сигналом. Например, преобразователь 208 частоты может выполнить преобразование частоты, которое включает в себя перекрывающиеся кадры, например, MDCT, на входном сигнале, но настоящее изобретение этим не ограничивается.
Кодер 209 в FD выполняет FD-кодирование входного сигнала с преобразованной частотой. Например, кодер 209 в FD может выполнить FD-кодирование частотного спектра, преобразованного преобразователем 208 частоты. Кодер 209 в FD будет подробно описываться ниже со ссылкой на фиг. 2C.
В соответствии с текущим вариантом осуществления кодирующее устройство 101 может вывести поток двоичных сигналов путем кодирования входного сигнала, как описано выше. Например, поток двоичных сигналов может включать в себя заголовок и полезную нагрузку.
Заголовок может включать в себя информацию о режиме кодирования, указывающую режим кодирования, используемый для кодирования входного сигнала. Полезная нагрузка может включать в себя информацию в соответствии с режимом кодирования, используемым для кодирования входного сигнала. Если входной сигнал кодируется в соответствии с режимом CELP, то полезная нагрузка может включать в себя информацию CELP и информацию TD высокочастотного расширения. Если входной сигнал кодируется в соответствии с режимом FD, то полезная нагрузка может включать в себя данные предсказания и информацию FD.
Однако в потоке двоичных сигналов в соответствии с текущим вариантом осуществления заголовок может дополнительно включать в себя информацию о режиме предыдущего кадра для исправления ошибки кадра, которая может возникнуть. Например, если режим кодирования входного сигнала определяется как режим FD, то заголовок может дополнительно включать в себя информацию о режиме предыдущего кадра, что будет подробно описываться ниже со ссылкой на фиг. 25.
Таким образом, кодирующее устройство 101 в соответствии с текущим вариантом осуществления переключается на использование режима CELP или режима FD в соответствии с характеристиками входного сигнала, посредством этого кодируя входной сигнал подходящим образом в соответствии с характеристиками входного сигнала. Также кодирующее устройство 101 использует режим FD в соответствии с определением блока 205 классификации сигнала, посредством этого выполняя кодирование подходящим образом в высокоскоростной среде.
Фиг. 2C - структурная схема кодера 209 в FD в соответствии с вариантом осуществления настоящего изобретения.
Ссылаясь на фиг. 2C, кодер 209 в FD может включать в себя кодер 2091 нормализации, факториально-импульсный кодер 2092, генератор 2093 информации дополнительного шума и кодер 2094 в FD с расширением.
Кодер 2091 нормализации извлекает энергию из каждой полосы частот входного сигнала, преобразованного преобразователем 208 частоты, и квантует извлеченную энергию. Также кодер 2091 нормализации может выполнять масштабирование на основе извлеченной энергии. В этом случае может квантоваться масштабированное значение энергии. Например, значение энергии в соответствии с текущим вариантом осуществления можно получить с использованием способа измерения для измерения энергии или мощности, имеющих пропорциональную связь с энергией полосы частот.
Нормализованная информация, то есть результат квантования, выполненного кодером 2091 нормализации, может включаться в поток двоичных сигналов и передаваться вместе с потоком двоичных сигналов в декодирующее устройство 102.
Например, кодер 2091 нормализации делит частотный спектр, соответствующий входному сигналу, на заранее установленное количество полос частот, извлекает энергию из частотного спектра для каждой полосы частот и квантует извлеченные энергии. Квантованное значение может использоваться для нормализации частотного спектра.
Кодер 2091 нормализации дополнительно может кодировать квантованное значение.
Факториально-импульсный кодер 2092 может выполнять факториальное импульсное кодирование (FPC) значения, полученного посредством масштабирования преобразованного входного сигнала, с использованием квантованного значения нормализации. Другими словами, факториально-импульсный кодер 2092 может выполнять FPC значения спектра, нормализованного кодером 2091 нормализации.
Например, факториально-импульсный кодер 2092 назначает некое количество доступных разрядов каждой полосе частот и выполняет FPC нормализованного значения спектра в соответствии с назначенным количеством разрядов. В этом случае количество разрядов, назначенное каждой полосе частот, может определяться в соответствии с целевой скоростью передачи битов. Также факториально-импульсный кодер 2092 может вычислить количество разрядов, которое нужно назначить каждой полосе частот, используя значение кодирования с нормализацией, квантованное кодером 2091 нормализации. В этом случае факториально-импульсный кодер 2092 может выполнять FPC спектра с преобразованной частотой, а не нормализованным спектром.
Генератор 2093 информации дополнительного шума формирует информацию дополнительного шума в соответствии с выполнением FPC. Например, генератор 2093 информации дополнительного шума формирует подходящий уровень шума на основе результата выполнения FPC частотного спектра с помощью факториально-импульсного кодера 2092.
В этом случае информация дополнительного шума, сформированная генератором 2093 информации дополнительного шума, может включаться в поток двоичных сигналов, чтобы декодирующая сторона могла обращаться к информации дополнительного шума для выполнения шумового заполнения.
Кодер 2094 в FD с расширением выполняет кодирование с расширением высокочастотного сигнала входного сигнала. Точнее говоря, кодер 2094 в FD с расширением выполняет высокочастотное расширение с использованием низкочастотного спектра.
Например, кодер 2094 в FD с расширением квантует информацию об энергии частотной области у высокочастотного сигнала, соответствующего диапазону высоких частот входного сигнала. В этом случае кодер 2094 в FD с расширением может разделить частотный спектр, соответствующий входному сигналу, на заранее установленное количество полос частот, получить значение энергии из частотного спектра для каждой полосы частот и выполнить многоэтапное векторное квантование (MSVQ) с использованием значения энергии. MSVQ может быть многоэтапным векторным квантованием.
Точнее говоря, кодер 2094 в FD с расширением может выполнить векторное квантование (VQ) путем сбора информации об энергии нечетных полос частот среди заранее установленного количества полос частот, получить предсказанную ошибку в четной полосе частот на основе квантованного значения в соответствии с результатом векторного квантования и выполнить векторное квантование полученной предсказанной ошибки на следующем этапе.
Однако настоящее изобретение этим не ограничивается, и кодер 2094 в FD с расширением может выполнить векторное квантование путем сбора информации об энергии четных полос частот среди заранее установленного количества полос частот и получить предсказанную ошибку в нечетной полосе частот с использованием квантованного значения в соответствии с результатом векторного квантования.
То есть кодер 2094 в FD с расширением получает предсказанную ошибку в (n+1)ой полосе частот из квантованного значения, полученного путем выполнения векторного квантования nой полосы частот, и квантованного значения, полученного путем выполнения векторного квантования (n+2)ой полосы частот. Здесь "n" обозначает натуральное число.
Также, чтобы выполнить векторное квантование путем сбора информации об энергии, кодер 2094 в FD с расширением может имитировать способ формирования сигнала возбуждения в заранее установленной полосе частот и может регулировать энергию, когда характеристики сигнала возбуждения в соответствии с результатом имитации отличаются от характеристик исходного сигнала в заранее установленной полосе частот. В этом случае характеристики сигнала возбуждения в соответствии с результатом имитации и характеристики исходного сигнала могут включать в себя по меньшей мере одно из тональности и коэффициента шумности, но настоящее изобретение этим не ограничивается. Таким образом, можно предотвратить увеличение шума, когда декодирующая сторона декодирует фактическую энергию.
Кодер 2094 в FD с расширением может использовать многорежимное расширение полосы частот, которое использует различные способы формирования сигнала возбуждения в соответствии с характеристиками высокочастотного сигнала входного сигнала. Например, кодер 2094 в FD с расширением в соответствии с характеристиками входного сигнала может использовать один из нормального режима, режима на гармониках и шумового режима для каждого кадра, чтобы сформировать сигнал возбуждения.
Также в соответствии с текущим вариантом осуществления кодер 2094 в FD с расширением может формировать сигнал полосы частот, которая меняется в соответствии со скоростью передачи битов. То есть диапазон высоких частот, соответствующий высокочастотному сигналу, который кодер 2094 в FD с расширением кодирует с расширением, может задаваться по-разному в соответствии со скоростью передачи битов.
Например, кодер 2094 в FD с расширением может использоваться для формирования сигнала, соответствующего полосе частот приблизительно от 6,4 до 14,4 кГц, на скорости передачи битов в 16 кбит/с и для формирования сигнала, соответствующего полосе частот приблизительно от 8 до 16 кГц, на скорости передачи битов, которая больше либо равна 16 кбит/с. Также кодер 2094 в FD с расширением выполняет кодирование с расширением высокочастотного сигнала, соответствующего полосе частот приблизительно от 6,4 до 14,4 кГц, на скорости передачи битов в 16 кбит/с и выполняет кодирование с расширением высокочастотного сигнала, соответствующего полосе частот приблизительно от 8 до 16 кГц, на скорости передачи битов, которая больше либо равна 16 кбит/с.
В этом случае в соответствии с текущим вариантом осуществления кодер 2094 в FD с расширением может выполнять квантование энергии путем совместного использования одной и той же кодовой книги на разных скоростях передачи битов, что будет подробно описываться ниже со ссылкой на фиг. 26.
Если в кодер 209 в FD вводится постоянный кадр, то в кодере 209 в FD могут работать кодер 2091 нормализации, факториально-импульсный кодер 2092, генератор 2093 информации дополнительного шума и кодер 2094 в FD с расширением.
Однако когда вводится переходный кадр, кодер 2094 в FD с расширением может не работать. В этом случае кодер 2091 нормализации и факториально-импульсный кодер 2092 могут задавать большее значение Fcore верхней полосы у полосы частот, над которой нужно выполнить FPC, чем при вводе постоянного кадра. Значение Fcore верхней полосы будет подробно описываться ниже со ссылкой на фиг. 27.
Фиг. 2D - структурная схема всей структуры кодирующего устройства 101 в соответствии с другим вариантом осуществления настоящего изобретения.
Ссылаясь на фиг. 2D, кодирующее устройство 101 может включать в себя блок 210 классификации сигнала, кодер 211 LPC, кодер 212 с CELP, кодер 213 в TD с расширением, аудиокодер 214 и кодер 215 в FD с расширением.
Блок 210 классификации сигнала определяет режим кодирования входного сигнала в соответствии с характеристиками входного сигнала. В соответствии с текущим вариантом осуществления режим кодирования может быть способом кодирования.
Например, блок 210 классификации сигнала определяет режим кодирования входного сигнала на основе характеристик временной области и характеристик частотной области входного сигнала. Также блок 205 классификации сигнала может определить, что нужно выполнить кодирование с CELP входного сигнала, когда характеристиками входного сигнала является речевой сигнал, и определить, что нужно выполнить аудиокодирование входного сигнала, когда характеристиками входного сигнала является аудиосигнал.
Кодер 211 LPC извлекает LPC из низкочастотного сигнала входного сигнала и квантует LPC. Например, в соответствии с текущим вариантом осуществления кодер 211 LPC может использовать, например, квантование с сетчатой геометрией (TCQ), MSVQ или решетчатое векторное квантование (LVQ), чтобы квантовать LPC, но настоящее изобретение ими не ограничивается.
Точнее говоря, кодер LPC 211 может повторно дискретизировать, например, входной сигнал, имеющий частоту дискретизации 32 кГц или 48 кГц, чтобы извлечь LPC из низкочастотного сигнала входного сигнала, имеющего частоту дискретизации 12,8 кГц или 16 кГц.
Как описано выше со ссылкой на фиг. 2A и 2B, сигнал, имеющий частоту дискретизации 32 кГц, может быть SWB-сигналом. SWB-сигнал может быть FB-сигналом. Также сигнал, имеющий частоту дискретизации 16 кГц, может быть WB-сигналом.
Кодер 211 LPC дополнительно может извлекать сигнал возбуждения LPC с использованием квантованного LPC, но настоящее изобретение этим не ограничивается.
Если режим кодирования входного сигнала определяется как режим с CELP, то кодер 212 с CELP выполняет кодирование с CELP сигнала возбуждения LPC, извлеченного с использованием LPC. Например, кодер 212 с CELP может квантовать сигнал возбуждения LPC на основе вклада постоянной кодовой книги и вклада адаптивной кодовой книги, соответствующих информации основной частоты. В этом случае сигнал возбуждения LPC может формироваться по меньшей мере одним из кодера 212 с CELP и кодера 211 LPC.
В соответствии с текущим вариантом осуществления кодер 212 с CELP также может выполнить кодирование с CELP в соответствии с различными режимами кодирования в соответствии с характеристиками низкочастотного сигнала входного сигнала. Например, кодер 206 с CELP может выполнить кодирование с CELP низкочастотного сигнала входного сигнала с использованием одного из тонального режима кодирования, нетонального режима кодирования, переходного режима кодирования или общего режима кодирования.
Кодер 213 в TD с расширением выполняет кодирование с расширением высокочастотного сигнала входного сигнала, когда кодированию с CELP подвергается сигнал возбуждения LPC низкочастотного сигнала входного сигнала.
Например, кодер 213 в TD с расширением квантует LPC высокочастотного сигнала входного сигнала. В этом случае кодер 213 в TD с расширением может извлечь LPC высокочастотного сигнала входного сигнала с использованием сигнала возбуждения LPC низкочастотного сигнала входного сигнала.
Таким образом, кодер 213 в TD с расширением может быть высокочастотным кодером в TD с расширением, но настоящее изобретение им не ограничивается.
Если режим кодирования входного сигнала определяется как режим аудиокодирования, то аудиокодер 214 выполняет аудиокодирование сигнала возбуждения LPC, извлеченного с использованием LPC.
Например, аудиокодер 214 может выполнять преобразование частоты над сигналом возбуждения LPC и квантовать преобразованный сигнал возбуждения LPC.
Здесь, когда аудиокодер 214 выполняет преобразование частоты, аудиокодер 214 может использовать способ преобразования частоты, который не включает в себя перекрывающиеся кадры, например, дискретное косинусное преобразование (DCT). Также аудиокодер 214 может выполнять квантование спектра сигнала возбуждения с преобразованной частотой в соответствии с FPC или решетчатым VQ (LVQ).
К тому же, если аудиокодер 214 имеет запасные разряды для выполнения квантования сигнала возбуждения LPC, то аудиокодер 214 может квантовать дополнительно на основе информации кодирования в TD во вкладе постоянной кодовой книги и вкладе адаптивной кодовой книги.
Когда аудиокодированию подвергается сигнал возбуждения LPC низкочастотного сигнала входного сигнала, кодер 215 в FD с расширением выполняет кодирование с расширением высокочастотного сигнала входного сигнала. Другими словами, кодер 215 в FD с расширением может выполнять высокочастотное расширение с использованием низкочастотного спектра.
Например, кодер 215 в FD с расширением выполняет квантование информации об энергии частотной области у высокочастотного сигнала, соответствующего диапазону высоких частот входного сигнала. В этом случае кодер 215 в FD с расширением может сформировать частотный спектр с использованием способа преобразования частоты, например MDCT, разделить частотный спектр на заранее установленное количество полос частот, получить энергию частотного спектра для каждой полосы частот и выполнить MSVQ с использованием энергии. Здесь MSVQ может быть многоэтапным векторным квантованием.
Точнее говоря, кодер 215 в FD с расширением может выполнить векторное квантование путем сбора информации об энергии нечетных полос частот среди заранее установленного количества полос частот, получить предсказанную ошибку в четной полосе частот на основе квантованного значения в соответствии с результатом векторного квантования и выполнить векторное квантование предсказанной ошибки на следующем этапе.
Однако настоящее изобретение этим не ограничивается, и кодер 215 в FD с расширением может выполнить векторное квантование путем сбора информации об энергии четных полос частот среди заранее установленного количества полос частот и получить предсказанную ошибку в нечетной полосе частот с использованием квантованного значения в соответствии с результатом векторного квантования.
То есть кодер 215 в FD с расширением получает предсказанную ошибку в (n+1)ой полосе частот с использованием квантованного значения, полученного путем выполнения векторного квантования nой полосы частот, и квантованного значения, полученного путем выполнения векторного квантования (n+2)ой полосы частот. Здесь "n" обозначает натуральное число.
Также, чтобы выполнить векторное квантование путем сбора информации об энергии, кодер 215 в FD с расширением может имитировать способ формирования сигнала возбуждения в заранее установленной полосе частот и может контролировать энергию, когда характеристики сигнала возбуждения в соответствии с результатом имитации отличаются от характеристик исходного сигнала в заранее установленной полосе частот. В этом случае характеристики сигнала возбуждения в соответствии с результатом имитации и характеристики исходного сигнала могут включать в себя по меньшей мере одно из тональности и коэффициента шумности, но настоящее изобретение этим не ограничивается. Таким образом, можно предотвратить увеличение шума, когда декодирующая сторона декодирует фактическую энергию.
Кодер 215 в FD с расширением может использовать многорежимное расширение полосы частот, которое использует различные способы формирования сигнала возбуждения в соответствии с характеристиками высокочастотного сигнала входного сигнала. Например, кодер 215 в FD с расширением в соответствии с характеристиками входного сигнала может сформировать сигнал возбуждения с использованием одного из нормального режима, режима на гармониках, переходного режима или шумового режима для каждого кадра. В переходном режиме также может квантоваться временная информация огибающей.
Также в соответствии с текущим вариантом осуществления кодер 215 в FD с расширением может формировать сигнал полосы частот, которая меняется в соответствии со скоростью передачи битов. Другими словами, диапазон высоких частот, соответствующий высокочастотному сигналу, который кодер 215 в FD с расширением кодирует с расширением, может задаваться по-разному в соответствии со скоростью передачи битов.
Например, кодер 215 в FD с расширением может использоваться для формирования сигнала, соответствующего полосе частот приблизительно от 6,4 до 14,4 кГц, на скорости передачи битов в 16 кбит/с и для формирования сигнала, соответствующего полосе частот приблизительно от 8 до 16 кГц, на скорости передачи битов, которая больше либо равна 16 кбит/с. Также кодер 215 в FD с расширением может выполнять кодирование с расширением высокочастотного сигнала, соответствующего полосе частот приблизительно от 6,4 до 14,4 кГц, на скорости передачи битов в 16 кбит/с и выполнять кодирование с расширением высокочастотного сигнала, соответствующего полосе частот приблизительно от 8 до 16 кГц, на скорости передачи битов, которая больше либо равна 16 кбит/с.
В этом случае в соответствии с текущим вариантом осуществления кодер 215 в FD с расширением может выполнять квантование энергии путем совместного использования одной и той же кодовой книги на разных скоростях передачи битов, что будет подробно описываться ниже со ссылкой на фиг. 26.
В текущем варианте осуществления кодирующее устройство 101 может кодировать входной сигнал, как описано выше, и выводить его в виде кодированного потока двоичных сигналов. Например, поток двоичных сигналов включает в себя заголовок и полезную нагрузку.
В этом случае заголовок может включать в себя информацию о режиме кодирования, указывающую режим кодирования, используемый для кодирования входного сигнала. Полезная нагрузка может включать в себя информацию CELP и информацию TD высокочастотного расширения, когда входной сигнал кодируется с использованием режима CELP, и может включать в себя данные предсказания, информацию аудиокодирования и информацию FD высокочастотного расширения, когда входной сигнал кодируется с использованием режима аудиокодирования.
Кодирующее устройство 101 может переключаться на использование режима CELP или режима аудиокодирования в соответствии с характеристиками входного сигнала. Таким образом, подходящий режим кодирования может выполняться в соответствии с характеристиками входного сигнала. Кроме того, кодирующее устройство 101 может использовать режим FD в соответствии с определением блока 210 классификации сигнала, посредством этого выполняя кодирование подходящим образом в низкоскоростной среде.
Фиг. 3 - структурная схема базового кодера 202 в кодирующем устройстве 101 в соответствии с вариантом осуществления настоящего изобретения.
Ссылаясь на фиг. 3, базовый кодер 202 может включать в себя блок 301 классификации сигнала и кодер 302.
Блок 301 классификации сигнала может классифицировать характеристики входного сигнала с пониженной дискретизацией, например 12,8 кГц. Другими словами, блок 301 классификации сигнала может классифицировать режимы кодирования входного сигнала как различные режимы кодирования в соответствии с характеристиками входного сигнала. Например, в соответствии с кодеком ITU-T G.718 блок 301 классификации сигнала может классифицировать режимы кодирования речевого сигнала как режим кодирования с вокалом, режим кодирования без вокала, переходный режим кодирования и общий режим кодирования. Режим кодирования без вокала предназначен для кодирования кадров без вокала и большинства неактивных кадров.
Кодер 302 может выполнять кодирование, оптимизированное к характеристикам входного сигнала, классифицированным блоком 301 классификации сигнала.
Фиг. 4 - структурная схема кодера 204 c расширением в кодирующем устройстве 101 в соответствии с вариантом осуществления настоящего изобретения.
Ссылаясь на фиг. 4, кодер 204 c расширением может включать в себя генератор 401 основного сигнала, модуль 402 оценки коэффициента, модуль 403 извлечения энергии, контроллер 404 энергии и квантователь 405 энергии. Например, кодер 204 c расширением может оценивать коэффициент регулирования энергии без приема информации о режиме кодирования. В качестве другого примера кодер 204 c расширением может оценивать коэффициент регулирования энергии с использованием режима кодирования. Информация о режиме кодирования может приниматься от базового кодера 202.
Генератор 401 основного сигнала может формировать основной сигнал входного сигнала с использованием частотного спектра входного сигнала в частотной области. Основной сигнал указывает сигнал для выполнения SWB BWE на основе WB-сигнала. Другими словами, основной сигнал указывает сигнал, который составляет точную структуру диапазона низких частот. Процесс формирования основного сигнала будет подробно описываться ниже со ссылкой на фиг. 6.
Например, модуль 402 оценки коэффициента может оценивать коэффициент регулирования энергии с использованием основного сигнала. То есть кодирующее устройство 101 передает информацию об энергии входного сигнала, чтобы сформировать сигнал области SWB в декодирующем устройстве 102. В этом случае модуль 402 оценки коэффициента может оценить коэффициент регулирования энергии, который является параметром для регулирования энергии для управления информацией об энергии с точки зрения восприятия. Процесс оценивания коэффициента регулирования энергии будет подробно описываться ниже со ссылкой на фиг. 7.
В качестве другого примера модуль 402 оценки коэффициента может оценивать коэффициент регулирования энергии с использованием характеристик основного сигнала и входного сигнала. В этом случае характеристики входного сигнала могут приниматься от базового кодера 202.
Модуль 403 извлечения энергии может извлечь энергию из входного сигнала в полосе частот. Извлеченная энергия передается в декодирующее устройство 102. Энергия может извлекаться в каждой полосе частот.
Контроллер 404 энергии может регулировать энергию, извлеченной из входного сигнала, используя коэффициент регулирования энергии. Другими словами, контроллер 404 энергии может регулировать энергию путем применения коэффициента регулирования энергии к энергии, извлеченной в каждой полосе частот.
Квантователь 405 энергии может квантовать регулируемую энергию. Энергию можно конвертировать в децибелы, а затем квантовать. В частности, квантователь 405 энергии может вычислить глобальную энергию, которая является полной энергией, и скалярно квантовать глобальную энергию и разности между глобальной энергией и энергией, извлеченной в каждой полосе частот. В противном случае непосредственно квантуется энергия, извлеченная из первой полосы частот, а затем может квантоваться разность между энергией, извлеченной в каждой из полос частот помимо первой полосы частот, и энергией, извлеченной в предыдущей полосе частот. В противном случае квантователь 405 энергии может непосредственно квантовать энергию, извлеченную в каждой полосе частот, без использования разностей между энергиями, извлеченными в полосах частот. Может использоваться скалярное или векторное квантование, когда непосредственно квантуется извлеченная энергия в каждой полосе частот. Квантователь 405 энергии будет подробно описываться ниже со ссылкой на фиг. 8 и 9.
Фиг. 5 - структурная схема кодера 204 c расширением в кодирующем устройстве 101 в соответствии с другим вариантом осуществления настоящего изобретения.
Ссылаясь на фиг. 5, кодер 204 c расширением по сравнению с кодером 204 c расширением из фиг. 4 может дополнительно включать в себя блок 501 классификации сигнала. Например, модуль 402 оценки коэффициента может оценивать коэффициент регулирования энергии с использованием характеристик основного сигнала и входного сигнала. В этом случае характеристики входного сигнала могут приниматься от блока 501 классификации сигнала, а не от базового кодера 202.
Блок 501 классификации сигнала может классифицировать входной сигнал, например, 32 кГц и спектр MDCT, в соответствии с характеристиками входного сигнала. Если подробнее, то блок 501 классификации сигнала может классифицировать режимы кодирования входного сигнала как различные режимы кодирования на основе характеристик входных сигналов.
С помощью классификации входного сигнала в соответствии с характеристиками входного сигнала коэффициент регулирования энергии может оцениваться только из сигналов, подходящих для выполнения процесса оценки коэффициента регулирования энергии, и может регулировать энергию. Например, может быть неподходящим выполнять процесс оценки коэффициента регулирования энергии над сигналом, не содержащим тоновую составляющую, например, шумовым сигналом или сигналом без вокала. В этом случае, если режим кодирования входного сигнала классифицируется как режим кодирования без вокала, то кодер 204 c расширением может выполнять кодирование с расширением полосы частот без выполнения оценки коэффициента регулирования энергии.
Генератор 401 основного сигнала, модуль 402 оценки коэффициента, модуль 403 извлечения энергии, контроллер 404 энергии и квантователь 405 энергии, проиллюстрированные на фиг. 5, являются такими, как описаны выше со ссылкой на фиг. 4.
Фиг. 6 - структурная схема генератора 401 основного сигнала, включенного в кодер 204 c расширением, в соответствии с вариантом осуществления настоящего изобретения.
Ссылаясь на фиг. 6, генератор 401 основного сигнала может включать в себя генератор 601 искусственного сигнала, модуль 602 оценки огибающей и блок 603 применения огибающей.
Генератор 601 искусственного сигнала может формировать искусственный сигнал, соответствующий диапазону высоких частот, путем копирования и свертывания диапазона низких частот входного сигнала в полосе частот. Другими словами, генератор 601 искусственного сигнала может формировать искусственный сигнал в области SWB путем копирования низкочастотного спектра входного сигнала в частотной области. Процесс формирования искусственного сигнала будет подробно описываться ниже со ссылкой на фиг. 6.
Модуль 602 оценки огибающей может оценивать огибающую основного сигнала с использованием окна. Огибающая основного сигнала может использоваться для исключения информации огибающей о диапазоне низких частот, включенной в частотный спектр искусственного сигнала в области SWB. Огибающая с конкретным индексом частоты может определяться с использованием частотных спектров до и после конкретной частоты. Огибающая основного сигнала также может оцениваться посредством скользящего среднего. Например, если MDCT используется для преобразования частоты, то огибающая основного сигнала может оцениваться посредством абсолютного значения частотного спектра, который преобразован посредством MDCT.
В этом случае модуль 602 оценки огибающей может создать отбеливающие полосы, вычислить среднее величины частоты в каждой из отбеливающих полос и оценить среднее величины частоты у отбеливающей полосы в виде огибающей частот, принадлежащих отбеливающей полосе. Количество частотных спектров, принадлежащих отбеливающей полосе, может задаваться меньше количества полос, из которых извлекается энергия.
Если среднее величины частоты, вычисленное в каждой из отбеливающих полос, оценивается в виде огибающей частоты, принадлежащей отбеливающей полосе, то модуль 602 оценки огибающей может передать информацию, указывающую, является ли большим или маленьким количество частотных спектров, принадлежащих отбеливающим полосам, чтобы управлять степенью неравномерности основного сигнала. Например, модуль 602 оценки огибающей может передать такую информацию в зависимости от двух типов того, что количество частотных спектров равно восьми или трем. Если количество частотных спектров равно трем, то степень неравномерности основного сигнала может быть выше, чем когда количество частотных спектров равно восьми.
В противном случае модуль 602 оценки огибающей может не передавать информацию, указывающую, является ли большим или маленьким количество частотных спектров, принадлежащих отбеливающим полосам, и может определить степень неравномерности основного сигнала в соответствии с режимом кодирования, применяемым базовым кодером 202. Базовый кодер 202 может классифицировать режим кодирования входного сигнала как режим кодирования с вокалом, режим кодирования без вокала, переходный режим кодирования или общий режим кодирования на основе характеристик входного сигнала и может кодировать входной сигнал.
В этом случае модуль 602 оценки огибающей может управлять количеством частотных спектров, принадлежащих отбеливающим полосам, на основе режима кодирования в соответствии с характеристиками входного сигнала. Например, если входной сигнал кодируется в соответствии с режимом кодирования с вокалом, то модуль 602 оценки огибающей может оценить огибающую основного сигнала путем создания трех частотных спектров в отбеливающей полосе. Если входной сигнал кодируется в соответствии с режимом кодирования, отличным от режима кодирования с вокалом, то модуль 602 оценки огибающей может оценить огибающую основного сигнала путем создания трех частотных спектров в отбеливающей полосе.
Блок 603 применения огибающей может применить оцененную огибающую к искусственному сигналу. Такой процесс соответствует процессу отбеливания. Искусственный сигнал может выравниваться с помощью огибающей. Блок 603 применения огибающей может формировать основной сигнал путем разделения искусственного сигнала в соответствии с огибающей каждого из индексов частоты.
Фиг. 7 - структурная схема модуля 402 оценки коэффициента, включенного в кодер 204 c расширением, в соответствии с вариантом осуществления настоящего изобретения.
Ссылаясь на фиг. 7, модуль 402 оценки коэффициента может включать в себя первый вычислитель 701 тональности, второй вычислитель 702 тональности и вычислитель 703 коэффициента.
Первый вычислитель 701 тональности может вычислять тональность диапазона высоких частот входного сигнала в частотной области. Другими словами, первый вычислитель 701 тональности может вычислять тональность области SWB, которая является диапазоном высоких частот входного сигнала в частотной области.
Второй вычислитель 702 тональности может вычислять тональность основного сигнала.
Тональности могут вычисляться путем измерения спектральной неравномерности. Если подробнее, то тональности могут вычисляться с использованием Уравнения (1) ниже. Спектральная неравномерность может измеряться с использованием связи между средним геометрическим и средним арифметическим частотного спектра.
Вычислитель 703 коэффициента может вычислять коэффициент регулирования энергии с использованием тональности диапазона высоких частот входного сигнала и тональности основного сигнала. В этом случае коэффициент регулирования энергии может вычисляться с помощью:
где "α" обозначает коэффициент регулирования энергии, "To" обозначает тональность входного сигнала, а "Tb" обозначает тональность основного сигнала. Также "Nb" обозначает коэффициент шумности, который указывает степень содержания шумовой составляющей в сигнале.
Коэффициент регулирования энергии может вычисляться с помощью:
Вычислитель 703 коэффициента может вычислять коэффициент регулирования энергии для каждой полосы частот. Вычисленный коэффициент регулирования энергии может применяться к энергии входного сигнала. В этом случае коэффициент регулирования энергии может применяться к энергии входного сигнала, когда коэффициент регулирования энергии меньше заранее установленного порогового коэффициента регулирования энергии.
Фиг. 8 - блок-схема, иллюстрирующая работу квантователя 405 энергии в соответствии с вариантом осуществления настоящего изобретения.
На этапе S801 квантователь 405 энергии может предварительно обработать векторы энергии с использованием коэффициента регулирования энергии и выбрать субвектор предварительно обработанного вектора энергии. Например, квантователь 405 энергии может вычесть среднее векторов энергии из каждого из векторов энергии или вычислить вес относительно важности каждого из векторов энергии. В этом случае вес может вычисляться таким образом, что качество синтезированного звука может увеличиваться максимально.
Также квантователь 405 энергии может подходящим образом выбрать субвектор вектора энергии на основе эффективности кодирования. Также квантователь 405 энергии может выбрать субвектор в том же интервале времени, чтобы повысить эффективность интерполяции.
Например, квантователь 405 энергии может выбрать субвектор в соответствии с уравнением (4) ниже.
k×n (n=0, …, N), k≥2, N обозначает наибольшее целое число,
которое меньше размерности вектора (4)
В этом случае, если k=2, то выбираются только четные числа.
На этапе S802 квантователь 405 энергии квантует и обратно квантует выбранный субвектор. Квантователь 405 энергии может квантовать субвектор путем выбора индекса квантования для минимизации среднеквадратической ошибки (MSE), вычисленной с использованием уравнения (5) ниже.
Квантователь 405 энергии может квантовать субвектор с использованием скалярного квантования, векторного квантования, TCQ или LVQ. При векторном квантовании может выполняться MSVQ или раздельное VQ, либо раздельное VQ и многоэтапное VQ могут выполняться одновременно. Индекс квантования передается в декодирующее устройство 102.
Когда веса вычисляются во время предварительной обработки, квантователь 405 энергии может вычислить оптимизированный индекс квантования с использованием взвешенной MSE (WMSE). В этом случае WMSE может вычисляться с помощью:
На этапе S803 квантователь 405 энергии может интерполировать оставшиеся субвекторы, которые не выбраны.
На этапе S804 квантователь 405 энергии может вычислить ошибки интерполяции, которые являются разностями между интерполированными оставшимися субвекторами и исходными субвекторами, которые совпадают с векторами энергии.
На этапе S805 квантователь 405 энергии квантует и обратно квантует ошибку интерполяции. В этом случае квантователь 405 энергии может квантовать ошибку интерполяции с использованием индекса квантования для минимизации MSE. Квантователь 405 энергии может квантовать ошибку интерполяции с использованием скалярного квантования, векторного квантования, TCQ или LVQ. В этом случае при векторном квантовании может выполняться MSVQ или раздельное VQ, либо раздельное VQ и MSVQ могут выполняться одновременно. Если веса вычисляются во время предварительной обработки, то квантователь 405 энергии может вычислить оптимизированный индекс квантования с использованием WMSE.
На этапе S806 квантователь 405 энергии может вычислить оставшиеся субвекторы, которые не выбраны, путем интерполяции квантованных субвекторов, которые выбраны, и вычислить значение квантованной энергии путем сложения квантованных ошибок интерполяции, вычисленных на этапе S805. И квантователь 405 энергии может вычислить итоговую квантованную энергию путем повторного сложения среднего, которое вычитается в предварительной обработке, во время предварительной обработки.
В MSVQ квантователь 405 энергии выполняет квантование с использованием K субвекторов-кандидатов, чтобы повысить производительность квантования на основе одной и той же кодовой книги. Если "K" больше либо равно "2", то квантователь 405 энергии может определить оптимальные возможные субвекторы-кандидаты путем выполнения измерения искажений. В этом случае измерение искажений может определяться в соответствии с одним из двух следующих способов.
В первом квантователь 405 энергии может сформировать индексное множество, чтобы минимизировать MSE или WMSE для каждого из субвекторов-кандидатов на каждом из этапов, и выбрать субвектор-кандидат, имеющий наименьшую сумму MSE или WMSE на всех этапах, из субвекторов-кандидатов. В этом случае объем вычислений небольшой.
Во втором квантователь 405 энергии может сформировать индексное множество, чтобы минимизировать MSE или WMSE для каждого из субвекторов-кандидатов на каждом из этапов, восстановить вектор энергии посредством обратного квантования и выбрать субвектор-кандидат, чтобы минимизировать MSE или WMSE между восстановленным вектором энергии и исходным вектором энергии. В этом случае объем вычислений увеличивается из-за восстановления вектора энергии, но производительность лучше, поскольку MSE вычисляются с использованием фактически квантованных значений.
Фиг. 9 - схема, иллюстрирующая процесс квантования энергии в соответствии с вариантом осуществления настоящего изобретения.
Ссылаясь на фиг. 9, вектор энергии представляет 14 размерностей. На первом этапе квантователь 405 энергии выбирает субвекторы, соответствующие размерности 7, путем выбора четных субвекторов вектора энергии. На первом этапе квантователь 405 энергии использует векторное квантование второго этапа, разделенное на два, чтобы повысить производительность.
Квантователь 405 энергии выполняет квантование на втором этапе с использованием сигнала ошибки первого этапа. Квантователь 405 энергии вычисляет ошибку интерполяции путем обратного квантования выбранных субвекторов и квантует ошибку интерполяции посредством векторного квантования третьего этапа, разделенного на два.
Фиг. 10 - схема, иллюстрирующая процесс формирования искусственного сигнала в соответствии с вариантом осуществления настоящего изобретения.
Ссылаясь на фиг. 10, генератор 601 искусственного сигнала может копировать частотный спектр 1001, соответствующий диапазону низких частот, от fL до 6,4 кГц во всей полосе частот. Скопированный частотный спектр 1001 сдвигается в полосу частот от 6,4 до 12,8-fL кГц. Частотный спектр, соответствующий полосе частот от 12,8-fL до 16 кГц, может формироваться путем свертывания частотного спектра, соответствующего полосе частот от 6,4 до 12,8-fL кГц. Другими словами, искусственный сигнал, соответствующий области SWB, которая является диапазоном высоких частот, формируется от 6,4 до 16 кГц.
Если MDCT выполняется для формирования частотного спектра, то присутствует корреляция между fL и 6,4 кГц. Если подробнее, то когда индекс частоты MDCT, соответствующий 6,4 кГц, является четным числом, индекс частоты у fL также является четным числом. В отличие от этого, если индекс частоты MDCT, соответствующий 4 кГц, является нечетным числом, то индекс частоты у fL также является нечетным числом.
Например, когда MDCT применяется для извлечения 640 частотных спектров из исходного входного сигнала, то индексом, соответствующим 6,4 кГц, является 256ой индекс (то есть 6400/16000*640), то есть четное число. В этом случае fL также выбирается как четное число. Другими словами, 2 (50 Гц) или 4 (100 Гц) может использоваться для fL. Этот процесс также может использоваться во время процесса декодирования.
Фиг. 11A и 11B соответственно иллюстрируют окна 1101 и 1102 для оценивания огибающей в соответствии с вариантами осуществления настоящего изобретения.
Со ссылкой на фиг. 11A и 11B точка пика на каждом из окон 1101 и 1102 обозначает индекс частоты для оценивания текущей огибающей. Текущая огибающая основного сигнала может оцениваться с помощью:
Со ссылкой на фиг. 11A и 11B окна 1101 и 1102 могут использоваться неизменно, и в этом случае не нужно передавать никакие дополнительные биты. Если выборочно используется окно 1101 или 1102, то информацию, указывающую, использовалось ли окно 1101 или 1102 для оценки огибающей, нужно выражать с помощью битов и дополнительно передавать декодирующему устройству 102. Биты могут передаваться для каждой полосы частот или могут передаваться сразу в одном кадре.
Вес дополнительно добавляется к частотному спектру, соответствующему текущему индексу частоты, чтобы оценить огибающую, когда используется окно 1102, по сравнению с тем, когда используется окно 1101. Таким образом, основной сигнал, сформированный с использованием окна 1102, ровнее, чем сформированный с использованием окна 1101. Тип окна из окон 1101 и 1102 может выбираться путем сравнения каждого из основных сигналов, сформированных с помощью окна 1101 и окна 1102, с частотным спектром входного сигнала. В противном случае окно, имеющее тональность, которая ближе к тональности диапазона высоких частот, может выбираться из окон 1101 и 1102 посредством сравнения тональности диапазона высоких частот. В противном случае окно, имеющее большую корреляцию с диапазоном высоких частот, может выбираться из окон 1101 и 1102 посредством сравнения корреляции.
Фиг. 12A - структурная схема декодирующего устройства 102 в соответствии с вариантом осуществления настоящего изобретения.
Процесс декодирования, выполняемый декодирующим устройством 102 из фиг. 12A, является обратным процессом к процессу, выполняемому кодирующим устройством 101 из фиг. 2A. Ссылаясь на фиг. 12A, декодирующее устройство 102 может включать в себя базовый 1201 декодер, дискретизатор 1202 с повышением частоты, преобразователь 1203 частоты, декодер 1204 с расширением и обратный преобразователь 1205 частоты.
Базовый декодер 1201 может выполнять базовое декодирование кодированного базовым кодированием входного сигнала, содержащегося в потоке двоичных сигналов. Посредством базового декодирования можно извлечь сигнал, имеющий частоту дискретизации в 12,8 кГц.
Дискретизатор 1202 с повышением частоты может повысить частоту дискретизации у базового декодированного входного сигнала. Посредством повышающей дискретизации можно извлечь сигнал, имеющий частоту дискретизации в 32 кГц.
Преобразователь 1204 частоты может выполнять преобразование частоты над входным сигналом с повышенной частотой дискретизации. В этом случае может использоваться такое же преобразование частоты, что использовалось в кодирующем устройстве 101. Например, может использоваться MDCT.
Декодер 1204 с расширением может выполнять декодирование с расширением полосы частот, используя входной сигнал в полосе частот и энергию входного сигнала, содержащегося в потоке двоичных сигналов. Работа декодера 1204 с расширением будет подробно описываться ниже со ссылкой на фиг. 9.
Обратный преобразователь 1205 частоты может выполнять обратное преобразование частоты над результатом выполнения декодирования с расширением полосы частот. Другими словами, обратное преобразование частоты может быть обратной операцией к преобразованию частоты, выполняемому преобразователем 1204 частоты. Например, обратное преобразование частоты может быть Обратным модифицированным дискретным косинусным преобразованием (IMDCT).
Фиг. 12B - структурная схема декодирующего устройства 102 в соответствии с другим вариантом осуществления настоящего изобретения.
Процесс декодирования, выполняемый декодирующим устройством 102 из фиг. 12B, является обратным процессом к процессу из фиг. 12A. Ссылаясь на фиг. 12B, декодирующее устройство 102 может включать в себя блок 1206 проверки информации о режиме, декодер 1207 с CELP, декодер 1208 в TD с расширением, декодер 1209 в FD и обратный преобразователь 1210 частоты.
Блок 1206 проверки информации о режиме проверяет информацию о режиме каждого из кадров, включенных в поток двоичных сигналов. Поток двоичных сигналов может быть сигналом, соответствующим потоку двоичных сигналов в соответствии с результатом кодирования, выполненного кодирующим устройством 101, переданным декодирующему устройству 102.
Например, блок 1206 проверки информации о режиме анализирует информацию о режиме из потока двоичных сигналов и выполняет операцию переключения в один из режима декодирования с CELP или режима FD-декодирования в соответствии с режимом кодирования текущего кадра в соответствии с результатом анализа.
Точнее говоря, блок 1206 проверки информации о режиме может переключаться относительно каждого из кадров, включенных в поток двоичных сигналов, таким образом, что кадр, кодированный в соответствии с режимом CELP, может декодироваться с CELP, а кадр, кодированный в соответствии с режимом FD, может декодироваться FD.
Декодер 1207 с CELP выполняет декодирование с CELP кадра, кодированного в соответствии с режимом CELP, на основе результата проверки. Например, декодер 1207 с CELP декодирует LPC, включенный в поток двоичных сигналов, декодирует вклады адаптивной и постоянной кодовой книги, объединяет результаты декодирования и формирует низкочастотный сигнал, соответствующий декодированному сигналу для диапазона низких частот.
Декодер 1208 в TD с расширением формирует декодированный сигнал для диапазона высоких частот с использованием по меньшей мере одного из результата выполнения декодирования с CELP и сигнала возбуждения низкочастотного сигнала. В этом случае сигнал возбуждения низкочастотного сигнала может включаться в поток двоичных сигналов. Также декодер 1208 в TD с расширением может использовать информацию LPC о высокочастотном сигнале, включенном в поток двоичных сигналов, чтобы сформировать высокочастотный сигнал, соответствующий декодированному сигналу для диапазона высоких частот.
Также в соответствии с текущим вариантом осуществления декодер 1208 TD с расширением может сформировать декодированный сигнал путем объединения высокочастотного сигнала с низкочастотным сигналом, сформированным декодером 1207 с CELP. Чтобы сформировать декодированный сигнал, декодер 1208 в TD с расширением может дополнительно преобразовать частоты дискретизации низкочастотного сигнала и высокочастотного сигнала к одинаковым.
Декодер 1209 в FD выполняет FD-декодирование кодированного в FD кадра. Декодер 1209 в FD может сформировать частотный спектр путем декодирования потока двоичных сигналов. Также в соответствии с текущим вариантом осуществления декодер 1209 в FD может выполнять декодирование потока двоичных сигналов на основе информации о режиме предыдущего кадра, включенного в поток двоичных сигналов. Другими словами, декодер 1209 в FD может выполнять FD-декодирование кодированных в FD кадров на основе информации о режиме предыдущего кадра, включенного в поток двоичных сигналов, как будет подробно описываться ниже со ссылкой на фиг. 25. Декодер 1209 в FD будет подробно описываться ниже со ссылкой на фиг. 12C.
Обратный преобразователь 1210 частоты выполняет обратное преобразование частоты над результатом выполнения FD-декодирования. Обратный преобразователь 1210 частоты формирует декодированный сигнал путем выполнения обратного преобразования частоты над декодированным в FD частотным спектром. Например, обратный преобразователь 1210 частоты может выполнять обратное MDCT, но настоящее изобретение им не ограничивается.
Соответственно, декодирующее устройство 102 может выполнять декодирование потока двоичных сигналов на основе режимов кодирования каждого из кадров в потоке двоичных сигналов.
Фиг. 12C - блок-схема декодера 1209 FD, включенного в декодирующее устройство 102, в соответствии с вариантом осуществления настоящего изобретения.
Процесс декодирования, выполняемый декодером 1209 в FD из фиг. 12C, является обратным процессом к процессу из фиг. 12B. Ссылаясь на фиг. 12C, декодер 1209 в FD может включать в себя декодер 12091 нормализации, декодер 12092 FPC, блок 12093 выполнения шумового заполнения и декодер 12094 в FD с расширением. Декодер 12094 в FD с расширением может включать в себя низкочастотный декодер 12095 в FD с расширением и высокочастотный декодер 12096 в FD с расширением.
Декодер 12091 нормализации выполняет декодирование с нормализацией на основе информации нормализации о потоке двоичных сигналов. Информация нормализации может быть информацией в соответствии с результатом кодирования кодером 2091 нормализации из фиг. 2C.
Декодер 12092 FPC выполняет декодирование FPC на основе информации FPC о потоке двоичных сигналов. Информация FPC может быть информацией в соответствии с результатом кодирования факториально-импульсным кодером 209 из фиг. 2C.
Например, декодер 12092 FPC выполняет декодирование FPC путем назначения некоего количества битов, доступных в каждой полосе частот, аналогично кодированию, выполняемому факториально-импульсным кодером 2092 из фиг. 2C.
Блок 12093 выполнения шумового заполнения выполняет шумовое заполнение результата выполнения декодирования FPC. Например, блок 12093 выполнения шумового заполнения добавляет шум в полосы частот, которые подвергаются декодированию FPC. В этом случае блок 12093 выполнения шумового заполнения добавляет шум вплоть до последних полос частот в полосах частот, которые подвергаются декодированию FPC, что будет описываться ниже со ссылкой на фиг. 27.
Декодер 12094 в FD с расширением может включать в себя низкочастотный декодер 12095 в FD с расширением и высокочастотный декодер 12096 в FD с расширением.
Если значение Ffpc верхней полосы у полос частот, выполняющих декодирование FPC, меньше значения Fcore верхней полосы у полос частот, выполняющих кодирование FPC, то низкочастотный декодер 12095 в FD с расширением выполняет кодирование с расширением результата выполнения декодирования FPC и результата выполнения шумового заполнения.
Таким образом, низкочастотный декодер 12095 в FD с расширением формирует частотные спектры вплоть до значения Fcore верхней полосы у полос частот, выполняющих кодирование FPC, используя частотные спектры, сформированные с помощью декодирования FPC и шумового заполнения.
Как описано выше, декодированные низкочастотные спектры могут формироваться путем умножения частотных спектров, сформированных низкочастотным декодером 12095 в FD с расширением, на значение нормализации, декодированное декодером 12091 нормализации.
Однако, когда низкочастотный декодер 12095 в FD с расширением не работает, декодированные низкочастотные спектры могут формироваться путем умножения частотных спектров, сформированных путем выполнения декодирования FPC и выполнения шумового заполнения, на значение нормализации, декодированное декодером 12091 нормализации.
Высокочастотный декодер 12096 в FD с расширением выполняет высокочастотное декодирование с расширением с использованием результатов выполнения декодирования FPC и выполнения шумового заполнения. В текущем варианте осуществления высокочастотный декодер 12096 в FD с расширением работает так, чтобы соответствовать кодеру 2094 в FD с расширением из фиг. 2C.
Например, высокочастотный декодер 12096 в FD с расширением может обратно квантовать высокочастотную энергию на основе информации о высокочастотной энергии потока двоичных сигналов, сформировать сигнал возбуждения высокочастотного сигнала с использованием низкочастотного сигнала в соответствии с различными режимами с расширением диапазона высоких частот и сформировать декодированный высокочастотный сигнал в соответствии с применением усиления, чтобы энергия сигнала возбуждения могла быть симметричной обратно квантованной энергии. Например, различные режимы с расширением диапазона высоких частот могут включать в себя нормальный режим, режим на гармониках или шумовой режим.
В этом случае высокочастотный декодер 12096 в FD с расширением может выполнять обратное квантование энергии путем совместного использования одной кодовой книги по отношению к разным скоростям передачи битов, как будет подробно описываться ниже со ссылкой на фиг. 26.
Если кадр, который нужно декодировать, является постоянным кадром, то может работать декодер 12091 нормализации, декодер 12092 FPC, блок 12093 выполнения шумового заполнения и декодер 12094 в FD с расширением, включенные в декодер 1209 FD.
Однако если кадр, который нужно декодировать, является переходным кадром, то декодер 12094 в FD с расширением может не работать.
Фиг. 12D - структурная схема декодирующего устройства 102 в соответствии с другим вариантом осуществления настоящего изобретения.
Процесс декодирования, выполняемый декодирующим устройством 102 из фиг. 12D, является обратным процессом к процессу из фиг. 2D. Ссылаясь на фиг. 12D, декодирующее устройство 102 может включать в себя блок 1211 проверки информации о режиме, декодер 1212 LPC, декодер 1213 с CELP, декодер 1214 в TD с расширением, аудиодекодер 1215 и декодер 1216 в FD с расширением.
Блок 1211 проверки информации о режиме проверяет информацию о режиме каждого из кадров, включенных в поток двоичных сигналов. Поток двоичных сигналов может быть сигналом, соответствующим потоку двоичных сигналов в соответствии с результатом кодирования, выполненного кодирующим устройством 101, переданным декодирующему устройству 102.
Например, блок 1211 проверки информации о режиме анализирует информацию о режиме из потока двоичных сигналов и выполняет операцию переключения в один из режима декодирования с CELP или режима FD-декодирования в соответствии с режимом кодирования текущего кадра в соответствии с результатом анализа.
Точнее говоря, блок 1211 проверки информации о режиме может переключаться относительно каждого из кадров, включенных в поток двоичных сигналов, таким образом, что кадр, кодированный в соответствии с режимом CELP, может декодироваться с CELP, а кадр, кодированный в соответствии с режимом FD, может декодироваться FD.
Декодер 1212 LPC выполняет декодирование LPC кадров, включенных в поток двоичных сигналов.
Декодер 1213 с CELP выполняет декодирование с CELP кадров, кодированным в соответствии с режимом CELP, на основе результата проверки. Например, декодер 1213 с CELP декодирует вклады адаптивной и постоянной кодовой книги, объединяет результаты декодирования и формирует низкочастотный сигнал, соответствующий декодированному сигналу для диапазона низких частот.
Декодер 1214 в TD с расширением формирует декодированный сигнал для диапазона высоких частот с использованием по меньшей мере одного из результата выполнения декодирования с CELP и сигнала возбуждения низкочастотного сигнала. Сигнал возбуждения низкочастотного сигнала может включаться в поток двоичных сигналов. Также декодер 1208 в TD с расширением может использовать информацию LPC, декодированную декодером 1212 LPC, для формирования высокочастотного сигнала, соответствующего декодированному сигналу для диапазона высоких частот.
Также в соответствии с текущим вариантом осуществления декодер 1214 в TD с расширением может сформировать декодированный сигнал путем объединения высокочастотного сигнала с низкочастотным сигналом, сформированным декодером 1214 с CELP. Чтобы сформировать декодированный сигнал, декодер 1214 в TD с расширением может дополнительно выполнить операцию преобразования над частотами дискретизации низкочастотного сигнала и высокочастотного сигнала, чтобы они были одинаковыми.
Аудиодекодер 1215 выполняет аудиодекодирование кодированного аудиокадра на основе результата проверки. Например, аудиодекодер 1215 обращается к потоку двоичных сигналов и выполняет декодирование на основе вклада временной области и вклада частотной области, когда присутствует вклад временной области, либо выполняет декодирование на основе вклада частотной области, когда вклад временной области отсутствует.
Также аудиодекодер 1215 может сформировать декодированный низкочастотный сигнал возбуждения путем выполнения обратного преобразования частоты, например IDCT, над сигналом, квантованным в соответствии с FPC или LVQ, и сформировать декодированный низкочастотный сигнал путем объединения сигнала возбуждения с обратно квантованным LPC.
Декодер 1216 в FD выполняет декодирование с расширением с использованием результата выполнения аудиодекодирования. Например, декодер 1216 в FD конвертирует декодированный низкочастотный сигнал к частоте дискретизации, подходящей для выполнения высокочастотного декодирования повышения, и выполняет преобразование частоты, например MDCT, над конвертированным сигналом. Декодер 1216 в FD с расширением может обратно квантовать квантованную высокочастотную энергию, сформировать сигнал возбуждения высокочастотного сигнала с использованием низкочастотного сигнала в соответствии с различными режимами с расширением диапазона высоких частот и сформировать декодированный высокочастотный сигнал в соответствии с применением усиления таким образом, что энергия сигнала возбуждения может быть симметричной обратно квантованной энергии. Например, различные режимы с расширением диапазона высоких частот могут включать в себя нормальный режим, режим на гармониках, переходный режим или шумовой режим.
Также декодер 1216 в FD с расширением формирует декодированный сигнал путем выполнения обратного преобразования частоты, например обратного MDCT, над декодированным высокочастотным сигналом и низкочастотным сигналом.
К тому же если переходный режим используется для расширения диапазона высоких частот, то декодер 1216 в FD с расширением может применить усиление, вычисленное во временной области, чтобы сигнал, декодированный после выполнения обратного преобразования частоты, мог совпадать с декодированной временной огибающей, и объединить сигнал, к которому применяется усиление.
Соответственно, декодирующее устройство 102 может выполнять декодирование потока двоичных сигналов на основе режима кодирования каждого из кадров, включенных в поток двоичных сигналов.
Фиг. 13 - структурная схема декодера 1304 с расширением, включенного в декодирующее устройство 102, в соответствии с вариантом осуществления настоящего изобретения.
Ссылаясь на фиг. 13, декодер 1204 с расширением может включать в себя обратный квантователь 1301, вычислитель 1302 усиления, блок 1303 применения усиления, генератор 1304 искусственного сигнала, модуль 1305 оценки огибающей и блок 1306 применения огибающей.
Обратный квантователь 1301 может обратно квантовать энергию входного сигнала. Процесс обратного квантования энергии входного сигнала будет подробно описываться ниже со ссылкой на фиг. 14.
Вычислитель 1302 усиления может вычислять усиление, которое нужно применить к основному сигналу, на основе обратно квантованной энергии и энергии основного сигнала. Если подробно, то усиление может определяться отношением между обратно квантованной энергией и энергией основного сигнала. Обычно энергия определяется с использованием суммы квадратов амплитуды частотного спектра. Таким образом, может использоваться квадратный корень отношения между обратно квантованной энергией и энергией основного сигнала.
Блок 1303 применения усиления может применять усиление для каждой полосы частот, чтобы определить частотный спектр у SWB.
Например, вычисление усиления и применение усиления могут выполняться путем выравнивания полосы с полосой частот, используемой для передачи энергии, как описано выше. В соответствии с другим вариантом осуществления настоящего изобретения вычисление усиления и применение усиления могут выполняться путем деления всех полос частот на поддиапазоны, чтобы предотвратить резкое изменение энергии. В этом случае энергии на границах полосы можно сгладить путем интерполяции обратно квантованных энергий соседних полос. Например, вычисление усиления и применение усиления могут выполняться путем деления каждой полосы на три поддиапазона, назначения обратно квантованной энергии текущей полосы среднему поддиапазону из трех поддиапазонов каждой полосы и использования энергии, назначенной средней полосе предыдущей или последующей полосы, и вновь сглаженной энергии посредством интерполяции. То есть усиление может вычисляться и применяться в единицах поддиапазонов.
Такой способ сглаживания энергии может применяться как постоянный тип. Также способ сглаживания энергии может применяться только к необходимым кадрам путем передачи информации от кодера 204 с расширением, указывающей, что необходимо сглаживание энергии. В этом случае может задаваться информация, указывающая, что необходимо сглаживание энергии, и ошибка квантования во всей энергии, когда выполняется сглаживание энергии, меньше ошибки квантования во всей энергии, когда сглаживание энергии не выполняется.
Основной сигнал может формироваться с использованием входного сигнала в частотной области. Процесс формирования основного сигнала может выполняться, как описано ниже.
Генератор 1304 искусственного сигнала может формировать искусственный сигнал, соответствующий диапазону высоких частот, путем копирования и свертывания диапазона низких частот входного сигнала в частотной области. Входной сигнал в частотной области может быть декодированным широкополосным (WB) сигналом, имеющим частоту дискретизации 32 кГц.
Модуль 1305 оценки огибающей может оценить огибающую основного сигнала с использованием окна, включенного в поток двоичных сигналов. Это окно использовалось кодирующим устройством 101 для оценки огибающей, и информация о типе окна может включаться в поток двоичных сигналов в виде разрядного типа и передаваться декодирующему устройству 102.
Блок 1306 применения огибающей может формировать основной сигнал путем применения оцененной огибающей к искусственному сигналу.
Когда модуль 602 оценки огибающей, включенный в кодирующее устройство 101, оценивает среднее величины частоты для каждой отбеливающей полосы как огибающую частоты, принадлежащей отбеливающей полосе, если информация, указывающая, является ли большим или маленьким количество частотных спектров, принадлежащих отбеливающей полосе, передается декодирующему устройству 102, то модуль 1305 оценки огибающей в декодирующем устройстве 102 может оценить огибающую на основе переданного способа. Затем блок 1306 применения огибающей может применить оцененную огибающую к искусственному сигналу. В противном случае огибающая может определяться в соответствии с режимом базового кодирования, используемым широкополосным (WB) базовым декодером, без необходимости передавать информацию.
Базовый декодер 1201 может декодировать сигналы путем классификации режимов кодирования сигналов на режим кодирования с вокалом, режим кодирования без вокала, переходный режим кодирования и общий режим кодирования на основе характеристик сигналов. В этом случае модуль 602 оценки огибающей может управлять количеством частотных спектров, принадлежащих отбеливающей полосе, на основе режима декодирования в соответствии с характеристиками входного сигнала. Например, если входной сигнал декодируется в соответствии с режимом декодирования с вокалом, то модуль 1305 оценки огибающей может оценить огибающую путем создания трех частотных спектров в отбеливающей полосе. Если входной сигнал декодируется в режиме декодирования, отличном от режима декодирования с вокалом, то модуль 1305 оценки огибающей может оценить огибающую путем создания трех частотных спектров в отбеливающей полосе.
Фиг. 14 - блок-схема, иллюстрирующая работу обратного квантователя 1301, включенного в декодер 1304 с расширением, в соответствии с вариантом осуществления настоящего изобретения.
На этапе S1401 обратный квантователь 1301 может обратно квантовать выбранный субвектор вектора энергии на основе индекса, принятого от кодирующего устройства 101.
На этапе S1402 обратный квантователь 1301 может обратно квантовать ошибки интерполяции, соответствующие оставшимся субвекторам, которые не выбраны, на основе принятого индекса.
На этапе S1403 обратный квантователь 1301 может вычислить оставшиеся субвекторы путем интерполяции обратно квантованного субвектора. Затем обратный квантователь 1301 может добавить обратно квантованные ошибки интерполяции к оставшимся субвекторам. Также обратный квантователь 1301 может вычислить обратно квантованную энергию путем сложения среднего, которое вычиталось во время операции предварительной обработки, посредством операции постобработки.
Фиг. 15A - блок-схема, иллюстрирующая способ кодирования в соответствии с вариантом осуществления настоящего изобретения.
На этапе S1501 кодирующее устройство 101 может понизить частоту дискретизации у входного сигнала.
На этапе S1502 кодирующее устройство 101 может выполнить базовое кодирование входного сигнала с пониженной дискретизацией.
На этапе S1503 кодирующее устройство 101 может выполнить преобразование частоты над входным сигналом.
На этапе S1504 кодирующее устройство 101 может выполнить кодирование с расширением полосы частот входного сигнала в частотной области. Например, кодирующее устройство 101 может выполнить кодирование с расширением полосы частот, используя информацию кодирования, определенную посредством базового кодирования. В этом случае информация кодирования может включать в себя режим кодирования, классифицированный в соответствии с характеристиками входного сигнала, когда выполняется базовое кодирование.
Например, кодирующее устройство 101 может выполнить кодирование с расширением полосы частот, как описано ниже.
Кодирующее устройство 101 может сформировать основной сигнал входного сигнала в частотной области, используя частотные спектры входного сигнала в частотной области. В качестве другого примера кодирующее устройство 101 может сформировать основной сигнал входного сигнала в частотной области на основе характеристик и частотных спектров входного сигнала. В этом случае характеристики входного сигнала могут выводиться посредством базового кодирования или посредством дополнительной классификации сигнала. Кодирующее устройство 101 может оценить коэффициент регулирования энергии с использованием основного сигнала. Кодирующее устройство 101 может извлечь энергию из входного сигнала в частотной области. Затем кодирующее устройство 101 может регулировать извлеченную энергию с использованием коэффициента регулирования энергии. Кодирующее устройство 101 может квантовать регулируемую энергию.
Основной сигнал может формироваться, как описано ниже.
Кодирующее устройство 101 может сформировать искусственный сигнал, соответствующий диапазону высоких частот, путем копирования и свертывания диапазона низких частот входного сигнала в частотной области. Затем кодирующее устройство 101 может оценить огибающую основного сигнала с использованием окна. В этом случае кодирующее устройство 101 может оценить огибающую основного сигнала путем выбора окна посредством сравнения тональности или корреляции. Например, кодирующее устройство 101 может оценить среднее величин частот у каждой из отбеливающих полос в качестве огибающей частоты, принадлежащей каждой из отбеливающих полос. Если подробно, то кодирующее устройство 101 может оценить огибающую основного сигнала путем регулирования количества частотных спектров, принадлежащих отбеливающей полосе, в соответствии с режимом базового кодирования.
Затем кодирующее устройство 101 может применить оцененную огибающую к искусственному сигналу, чтобы сформировать основной сигнал.
Коэффициент регулирования энергии может оцениваться, как описано ниже.
Кодирующее устройство 101 может вычислить тональность диапазона высоких частот входного сигнала в частотной области. Кодирующее устройство 101 может вычислить тональность основного сигнала. Затем кодирующее устройство 101 может вычислить коэффициент регулирования энергии с использованием тональности диапазона высоких частот входного сигнала и тональности основного сигнала.
Квантование регулируемой энергии может выполняться, как описано ниже.
Кодирующее устройство 101 может выбрать и квантовать субвектор и квантовать оставшиеся субвекторы с использованием ошибки интерполяции. В этом случае кодирующее устройство 101 может выбрать субвектор в том же интервале времени.
Например, кодирующее устройство 101 может выполнить MSVQ с использованием по меньшей мере двух этапов путем выбора субвекторов-кандидатов. В этом случае кодирующее устройство 101 может сформировать индексное множество, чтобы минимизировать MSE или WMSE для каждого из субвекторов-кандидатов на каждом из этапов, и выбрать субвектор-кандидат, имеющий наименьшую сумму MSE или WMSE на всех этапах, из субвекторов-кандидатов. В противном случае кодирующее устройство 101 может сформировать индексное множество, чтобы минимизировать MSE или WMSE для каждого из субвекторов-кандидатов на каждом из этапов, восстановить вектор энергии посредством обратного квантования и выбрать субвектор-кандидат, чтобы соответствовать MSE или WMSE между восстановленным вектором энергии и исходным вектором энергии.
Фиг. 15B - блок-схема, иллюстрирующая способ кодирования в соответствии с другим вариантом осуществления настоящего изобретения. Способ кодирования из фиг. 15B может включать в себя этапы, которые последовательно выполняются кодирующим устройством 101 из одной из фиг. 2A-2C. Таким образом, хотя здесь и не описано, вышеприведенные описания кодирующего устройства 101 со ссылкой на фиг. 2A-2C также могут применяться к способу кодирования из фиг. 15B.
На этапе S1505 блок 205 классификации сигнала определяет режим кодирования входного сигнала на основе характеристик входного сигнала.
На этапе S1506, если режим кодирования входного сигнала определяется как режим CELP, то кодер 206 с CELP выполняет кодирование с CELP низкочастотного сигнала входного сигнала.
На этапе S1507, если кодированию с CELP подвергается низкочастотный сигнал входного сигнала, то кодер 207 в TD с расширением выполняет кодирование в TD с расширением высокочастотного сигнала входного сигнала.
На этапе S1508, если режим кодирования входного сигнала определяется как режим FD, то преобразователь 208 частоты выполняет преобразование частоты над входным сигналом.
На этапе S1509 кодер 209 в FD выполняет FD-кодирование входного сигнала с преобразованной частотой.
Фиг. 15C - блок-схема, иллюстрирующая способ кодирования в соответствии с другим вариантом осуществления настоящего изобретения. Способ кодирования из фиг. 15C может включать в себя этапы, которые последовательно выполняются кодирующим устройством 101 из одной из фиг. 2A-2C. Таким образом, хотя здесь и не описано, вышеприведенные описания кодирующего устройства 101 со ссылкой на фиг. 2A-2C также могут применяться к способу кодирования из фиг. 15C.
На этапе S1510 блок 210 классификации сигнала определяет режим кодирования входного сигнала на основе характеристик входного сигнала.
На этапе S1511 кодер 211 LPC извлекает LPC из низкочастотного сигнала входного сигнала и квантует LPC.
На этапе S1512, если режим кодирования входного сигнала определяется как режим CELP, то кодер 212 с CELP выполняет кодирование с CELP сигнала возбуждения LPC, извлеченного с использованием LPC.
На этапе S1513, если кодированию с CELP подвергается сигнал возбуждения LPC низкочастотного сигнала входного сигнала, то кодер 213 в TD с расширением выполняет кодирование в TD с расширением высокочастотного сигнала входного сигнала.
На этапе S1514, если режим кодирования входного сигнала определяется как режим FD, то аудиокодер 214 выполняет аудиокодирование сигнала возбуждения LPC, извлеченного с использованием LPC.
На этапе S1515, если FD-кодированию подвергается сигнал возбуждения LPC низкочастотного сигнала входного сигнала, то кодер 215 в FD с расширением выполняет кодирование в FD с расширением высокочастотного сигнала входного сигнала.
Фиг. 16A - блок-схема, иллюстрирующая способ декодирования в соответствии с вариантом осуществления настоящего изобретения.
На этапе S1601 декодирующее устройство 102 может выполнить базовое декодирование кодированного базовым кодированием входного сигнала, включенным в поток двоичных сигналов.
На этапе S1602 декодирующее устройство 102 может повысить частоту дискретизации у декодированного базовым декодированием входного сигнала.
На этапе S1603 декодирующее устройство 102 может выполнить преобразование частоты над входным сигналом с повышенной частотой дискретизации.
На этапе S1604 декодирующее устройство 102 может выполнить декодирование с расширением полосы частот, используя входной сигнал в частотной области и информацию об энергии входного сигнала, включенного в поток двоичных сигналов.
Точнее говоря, расширение полосы частот может выполняться, как описано ниже.
Декодирующее устройство 102 может обратно квантовать энергию входного сигнала. В этом случае декодирующее устройство 101 может выбрать и обратно квантовать субвектор, интерполировать обратно квантованный субвектор и добавить ошибку интерполяции к интерполированному субвектору, посредством этого обратно квантуя энергию.
Также декодирующее устройство 102 может сформировать основной сигнал входного сигнала в частотной области. Затем декодирующее устройство 102 может вычислить усиление, которое нужно применить к основному сигналу, используя обратно квантованную энергию и энергию основного сигнала. После этого декодирующее устройство 102 может применить усиление для каждой полосы частот.
Основной сигнал может формироваться, как описано ниже.
Декодирующее устройство 102 может сформировать искусственный сигнал, соответствующий диапазону высоких частот входного сигнала, путем копирования и свертывания диапазона низких частот входного сигнала в частотной области. Затем декодирующее устройство 102 может оценить огибающую основного сигнала с использованием информации об окне, включенной в поток двоичных сигналов. В этом случае, если информация об окне задается одинаковой, то никакая информация об окне не включается в поток двоичных сигналов. После этого декодирующее устройство 102 может применить оцененную огибающую к искусственному сигналу.
Фиг. 16B - блок-схема, иллюстрирующая способ декодирования в соответствии с другим вариантом осуществления настоящего изобретения. Способ декодирования из фиг. 16B может включать в себя этапы, которые последовательно выполняются декодирующим устройством 102 из одной из фиг. 12A-12C. Таким образом, хотя здесь и не описано, вышеприведенные описания декодирующего устройства 102 со ссылкой на фиг. 12A-12C также могут применяться к способу декодирования из фиг. 16B.
На этапе S1606 блок 1206 проверки информации о режиме проверяет информацию о режиме каждого из кадров, включенных в поток двоичных сигналов.
На этапе S1607 декодер 1207 с CELP выполняет декодирование с CELP кодированного с CELP кадра на основе результата проверки.
На этапе S1608 декодер 1208 в TD с расширением формирует декодированный сигнал диапазона высоких частот с использованием по меньшей мере одного из результата выполнения декодирования с CELP и сигнала возбуждения низкочастотного сигнала.
На этапе S1609 декодер 1209 в FD выполняет FD-декодирование кодированного в FD кадра на основе результата проверки.
Обратный преобразователь 1210 частоты выполняет обратное преобразование частоты над результатом выполнения FD-декодирования.
Фиг. 16C - блок-схема, иллюстрирующая способ декодирования в соответствии с другим вариантом осуществления настоящего изобретения. Способ декодирования из фиг. 16C может включать в себя этапы, которые последовательно выполняются декодирующим устройством 102 из одной из фиг. 12A-12C. Таким образом, хотя здесь и не описано, вышеприведенные описания декодирующего устройства 102 со ссылкой на фиг. 12A-12C также могут применяться к способу декодирования из фиг. 16C.
На этапе S1611 блок 1211 проверки информации о режиме проверяет информацию о режиме каждого из кадров, включенных в поток двоичных сигналов.
На этапе S1612 декодер 1212 LPC выполняет декодирование LPC кадров, включенных в поток двоичных сигналов.
На этапе S1613 декодер 1213 с CELP выполняет декодирование с CELP кодированного с CELP кадра на основе результата проверки.
На этапе S1614 декодер 1214 в TD с расширением формирует декодированный сигнал диапазона высоких частот с использованием по меньшей мере одного из результата выполнения декодирования с CELP и сигнала возбуждения низкочастотного сигнала.
На этапе S1615 аудиодекодер 1215 выполняет аудиодекодирование кодированного аудиокадра на основе результата проверки.
На этапе S1616 декодер 1216 в FD с расширением выполняет FD-декодирование с расширением с использованием результата выполнения аудиодекодирования.
Касательно других вопросов о способах кодирования и декодирования, которые не описываются со ссылкой на фиг. 15-16, следует обращаться к описаниям со ссылкой на фиг. 1-14.
Фиг. 17 - структурная схема всей структуры кодирующего устройства 1702 в соответствии с другим вариантом осуществления настоящего изобретения.
Ссылаясь на фиг. 17, кодирующее устройство 100 может включать в себя селектор 1701 режима кодирования и кодер 1702 с расширением.
Селектор 1701 режима кодирования может определять режим кодирования у кодирования с расширением полосы частот, используя входной сигнал в частотной области и входной сигнал во временной области.
Точнее говоря, селектор 1701 режима кодирования может классифицировать входной сигнал в частотной области с использованием входного сигнала в частотной области и входного сигнала во временной области и определить режим кодирования у кодирования с расширением полосы частот и количество полос частот в соответствии с режимом кодирования на основе результата классификации. Здесь режим кодирования может задаваться как новый набор режимов кодирования, которые отличаются от режима кодирования, определенного при выполнении базового кодирования, для повышения производительности кодера 1702 с расширением.
Например, режимы кодирования можно классифицировать на нормальный режим, режим на гармониках, переходный режим и шумовой режим. Сначала селектор 1701 режима кодирования определяет, является ли текущий кадр переходным кадром, на основе отношения между долговременной энергией входного сигнала во временной области и энергией диапазона высоких частот текущего кадра. Участок переходного сигнала является участком, где во временной области происходит резкое изменение энергии, и соответственно может быть участком, в котором значительно меняется энергия диапазона высоких частот.
Сейчас будет описываться процесс определения трех остальных режимов кодирования. Сначала получаются глобальные энергии предыдущего кадра и текущего кадра, отношение между глобальными энергиями и сигналом в частотной области разделяются на заранее установленные полосы частот, а затем три режима кодирования определяются на основе средней энергии и максимальной энергии каждой из полос частот. Обычно в режиме на гармониках разность между максимальной энергией и средней энергией сигнала в частотной области является наибольшей. В шумовом режиме степень изменения энергии сигнала в целом небольшая. Режимы кодирования других сигналов за исключением двух сигналов определяются как нормальный режим.
В соответствии с вариантом осуществления настоящего изобретения количество полос частот может определяться равным шестнадцати в нормальном режиме и режиме на гармониках, может определяться равным пяти в переходном режиме и может определяться равным двенадцати в нормальном режиме.
Кодер 1702 с расширением может выбирать режим кодирования у кодирования с расширением полосы частот, используя входной сигнал в частотной области и входной сигнал во временной области. Ссылаясь на фиг. 17, кодер 1702 с расширением может включать в себя генератор 1703 основного сигнала, модуль 1704 оценки коэффициента, модуль 1705 извлечения энергии, контроллер энергии 1706 и квантователь 1707 энергии. Генератор 1703 основного сигнала и модуль 1704 оценки коэффициента являются такими, как описаны выше со ссылкой на фиг. 5.
Модуль 1705 извлечения энергии может извлекать энергию, соответствующую каждой из полос частот, в соответствии с количеством полос частот, определенным в соответствии с режимами кодирования. Генератор 1703 основного сигнала, модуль 1704 оценки коэффициента и контроллер энергии 1706 могут определяться к использованию в соответствии с режимом кодирования. Например, эти элементы могут использоваться в нормальном режиме и режиме на гармониках, но могут не использоваться в переходном режиме и шумовом режиме. Генератор 1703 основного сигнала, модуль 1704 оценки коэффициента и контроллер энергии 1706 являются такими, как описано выше со ссылкой на фиг. 5. Энергия полосы, которая подвергается регулированию энергии, может квантоваться квантователем 1707 энергии.
Фиг. 18 - блок-схема, иллюстрирующая работу квантователя 1710 энергии в соответствии с другим вариантом осуществления настоящего изобретения.
Квантователь 1707 энергии может квантовать энергию, извлеченную из входного сигнала, в соответствии с режимом кодирования. В этом случае квантователь 1707 энергии может квантовать энергию полосы, которую нужно оптимизировать для входного сигнала на основе количества энергии полосы и воспринимаемых характеристик входного сигнала, в соответствии с режимом кодирования.
Например, если режимом кодирования является переходный режим, то квантователь 1707 энергии в отношении пяти энергий полос может квантовать энергию полосы с использованием способа взвешивания частот на основе воспринимаемых характеристик входного сигнала. Если режимом кодирования является нормальный режим или режим на гармониках, то квантователь 1707 энергии в отношении шестнадцати энергий полос может квантовать энергию полосы с использованием способа неравного распределения разрядов на основе воспринимаемых характеристик входного сигнала. Если характеристики входного сигнала не являются точными, то квантователь 1707 энергии может выполнить квантование в соответствии с общим способом, не учитывая воспринимаемые характеристики входного сигнала.
Фиг. 19 - схема, иллюстрирующая процесс квантования энергии с использованием способа неравного распределения разрядов в соответствии с вариантом осуществления настоящего изобретения.
В способе неравного распределения разрядов учитываются воспринимаемые характеристики входного сигнала, который является целью кодирования с расширением. Таким образом, относительно низкочастотные полосы с высокой важностью для восприятия могут квантоваться точнее в соответствии со способом неравного распределения разрядов. С этой целью квантователь 1707 энергии может классифицировать важность восприятия путем назначения одинакового количества разрядов или большего количества разрядов относительно низкочастотным полосам по сравнению с количествами разрядов, назначенными другим полосам частот.
Например, квантователь 1707 энергии назначает большее количество разрядов относительно низкочастотным полосам с назначенными номерами от "0" до "5". Количества разрядов, назначенные относительно низкочастотным полосам с номерами от "0" до "5", могут быть одинаковыми. Чем выше полоса частот, тем меньше количество разрядов, назначенное полосе частот квантователем 1707 энергии. Соответственно, полосы частот с назначенными номерами от "0" до "13" могут квантоваться, как проиллюстрировано на фиг. 19 в соответствии с распределением разрядов, которое описано выше. Другие полосы частот с назначенными номерами "14" и "15" могут квантоваться, как проиллюстрировано на фиг. 20.
Фиг. 20 - схема, иллюстрирующая векторное квантование с использованием внутрикадрового предсказания в соответствии с вариантом осуществления настоящего изобретения.
Квантователь 1707 энергии предсказывает характерное значение целевого вектора квантования, который содержит по меньшей мере два элемента, а затем может выполнить векторное квантование сигнала ошибки между каждым из элементов целевого вектора квантования и предсказанным характерным значением.
Фиг. 20 иллюстрирует такой способ внутрикадрового предсказания. Способ предсказания характерного значения целевого вектора квантования и выведения сигнала ошибки выглядит следующим образом:
где "Env(n)" обозначает энергию полосы, которая не квантуется, "QEnv(n)" обозначает энергию полосы, которая квантуется, "p" обозначает предсказанное характерное значение целевого вектора квантования, "e(n)" обозначает энергию ошибки. В уравнении (8) "e(14)" и "e(15)" являются векторно-квантованными.
Фиг. 21 - схема, иллюстрирующая процесс квантования энергии с использованием способа взвешивания частот в соответствии с другим вариантом осуществления настоящего изобретения.
В способе взвешивания частот относительно низкочастотные полосы с высокой важностью для восприятия могут квантоваться точнее путем учета воспринимаемых характеристик входного сигнала, который является целью кодирования с расширением, как и в способе неравного распределения разрядов. С этой целью важность восприятия классифицируется путем назначения одинакового веса или большего веса относительно низкочастотным полосам по сравнению с весами, назначенными другим полосам частот.
Например, ссылаясь на фиг. 21, квантователь 1707 энергии может выполнить квантование путем назначения большего веса, например 1,0, относительно низкочастотным полосам с назначенными номерами от "0" до "3" и назначения меньшего веса, например 0,7, полосе частот с назначенным номером "15". Чтобы использовать назначенные веса, квантователь 1707 энергии может вычислить оптимальный индекс с использованием WMSE.
Фиг. 22 - схема, иллюстрирующая векторное квантование в многоэтапном раздельном и векторном квантовании с использованием внутрикадрового предсказания в соответствии с вариантом осуществления настоящего изобретения.
Квантователь 1707 энергии может выполнять векторное квантование в нормальном режиме, в котором количество энергий полос равно шестнадцати, как проиллюстрировано на фиг. 22. Здесь квантователь 1707 энергии может выполнять векторное квантование с использованием способа неравного распределения разрядов, внутрикадрового предсказания и многоэтапного раздельного VQ с интерполяцией энергии.
Фиг. 23 - схема, иллюстрирующая работу обратного квантователя 1301, включенного в декодирующее устройство 102, в соответствии с вариантом осуществления настоящего изобретения.
Работа обратного квантователя 1301 из фиг. 23 может быть обратной работой к работе квантователя 1710 энергии из фиг. 18. Когда режимы кодирования используются для выполнения кодирования с расширением, которое описано выше со ссылкой на фиг. 17, обратный квантователь 1301 может декодировать информацию о режимах кодирования.
Сначала обратный квантователь 1301 декодирует информацию о режимах кодирования с использованием принятого индекса. Затем обратный квантователь 1301 выполняет обратное квантование в соответствии с декодированной информацией о режиме кодирования. Ссылаясь на фиг. 23, в соответствии с режимами кодирования блоки, которые являются целями обратного квантования, обратно квантуются в обратном порядке, в котором выполняется квантование.
Часть, которая квантовалась в соответствии с многоэтапным раздельным VQ с интерполяцией энергии, может обратно квантоваться, как проиллюстрировано на фиг. 14. Обратный квантователь 1301 может выполнять обратное квантование с использованием внутрикадрового предсказания, используя следующее уравнение:
где "Env(n)" обозначает энергию полосы, которая не квантуется, и "QEnv(n)" обозначает энергию полосы, которая квантуется. Также "p" обозначает характерное значение целевого вектора квантования, а "ê(n)" обозначает квантованную энергию ошибки.
Фиг. 24 - структурная схема кодирующего устройства 101 в соответствии с другим вариантом осуществления настоящего изобретения.
Основные операции элементов кодирующего устройства 101, проиллюстрированного на фиг. 24, являются такими же, как у элементов кодирующего устройства 101, проиллюстрированного на фиг. 2A, за исключением того, что кодер 2404 с расширением не принимает информации от базового кодера 2402 и может непосредственно принимать входной сигнал во временной области.
Фиг. 25 - схема, иллюстрирующая потоки двоичных сигналов в соответствии с вариантом осуществления настоящего изобретения.
Ссылаясь на фиг. 25, поток 251 двоичных сигналов, поток 252 двоичных сигналов и поток 253 двоичных сигналов соответствуют Nому кадру, (N+1)ому кадру и (N+2)ому кадру соответственно.
Ссылаясь на фиг. 25, потоки 251, 252 и 253 двоичных сигналов включают в себя заголовок 254 и полезную нагрузку 255.
Заголовок 254 может включать в себя информацию 2511, 2521 и 2531 о режиме. Информация 2511, 2521 и 2531 о режиме является информацией о режиме кодирования Nого кадра, (N+1)ого кадра и (N+2)ого кадра соответственно. Например, информация 2511 о режиме представляет режим кодирования, используемый для кодирования Nого кадра, информация 2521 о режиме представляет режим кодирования, используемый для кодирования (N+1)ого кадра, и информация 2531 о режиме представляет режим кодирования, используемый для кодирования (N+2)ого кадра. Например, режимы кодирования могут включать в себя по меньшей мере один из режима CELP, режима FD и режима аудиокодирования, но настоящее изобретение ими не ограничивается.
Полезная нагрузка 255 включает в себя информацию о базовых данных в соответствии с режимами кодирования этих кадров.
Например, в случае Nого кадра, кодированного в режиме CELP, полезная нагрузка 255 может включать в себя информацию 2512 CELP и информацию 2513 TD расширения.
В случае (N+1)ого кадра, кодированного в режиме FD, полезная нагрузка 255 может включать в себя информацию 2523 FD. В случае (N+2)ого кадра, кодированного в режиме FD, полезная нагрузка 255 может включать в себя информацию 2532 FD.
Полезная нагрузка 255 в потоке 252 двоичных сигналов, соответствующем (N+1)ому кадру, может дополнительно включать в себя данные 2522 предсказания. Другими словами, режим кодирования между соседними кадрами переключается с режима CELP на режим FD, поток 252 двоичных сигналов в соответствии с результатом выполнения кодирования в соответствии с режимом FD может включать в себя данные 2522 предсказания.
Точнее говоря, как проиллюстрировано на фиг. 2B, когда кодирующее устройство 101, которое допускает переключение между режимом CELP и режимом FD, выполняет кодирование в соответствии с режимом FD, используется преобразование частоты, например MDCT, которое включает в себя перекрывающиеся кадры.
Таким образом, если Nый кадр и (N+1)ый кадр входного сигнала кодируются в соответствии с режимом CELP и режимом FD соответственно, то (N+1)ый кадр нельзя декодировать с использованием только результата кодирования в соответствии с режимом FD. По этой причине, если режим кодирования между соседними кадрами переключается с режима CELP на режим FD, то поток 252 двоичных сигналов в соответствии с результатом выполнения кодирования в соответствии с режимом FD включает в себя данные 2522 предсказания, представляющие информацию, соответствующую предсказанию.
Соответственно, декодирующая сторона может декодировать поток 252 двоичных сигналов, кодированный в соответствии с режимом FD, посредством предсказания с использованием декодированной информации временной области о текущем кадре, например (N+1)ом кадре, и результата декодирования предыдущего кадра, например Nого кадра, на основе данных 2522 предсказания, включенных в поток 252 двоичных сигналов. Например, информация временной области может быть наложением спектров временной области, но настоящее изобретение этим не ограничивается.
Также полезная нагрузка 255 в потоке 252 двоичных сигналов, соответствующем (N+1)ому кадру, может дополнительно включать в себя информацию 2524 о режиме предыдущего кадра, и полезная нагрузка 255 в потоке 253 двоичных сигналов, соответствующем (N+2)ому кадру, может дополнительно включать в себя информацию 2533 о режиме предыдущего кадра.
Точнее говоря, потоки 252 и 253 двоичных сигналов, кодированные в соответствии с режимом FD, могут дополнительно включать в себя информацию 2524 и 2533 о режиме предыдущего кадра соответственно.
Например, информация 2524 о режиме предыдущего кадра, включенная в поток 252 двоичных сигналов, соответствующий (N+1)ому кадру, может включать в себя информацию об информации 2511 о режиме Nого кадра, и информация 2533 о режиме предыдущего кадра, включенная в поток 253 двоичных сигналов, соответствующий (N+2)ому кадру, может включать в себя информацию об информации 2524 о режиме (N+1)ого кадра.
Таким образом, даже если возникает ошибка в одном из множества кадров, декодирующая сторона может точно обнаружить переход режима.
Фиг. 26 - схема, иллюстрирующая способ выполнения распределения частот для каждой полосы частот в соответствии с вариантом осуществления настоящего изобретения.
Как описано выше, кодер 2094 в FD с расширением из фиг. 2C или кодер 215 в FD с расширением из фиг. 2D могут выполнять квантование энергии путем совместного использования одной и той же кодовой книги даже на разных скоростях передачи битов. Таким образом, когда частотный спектр, соответствующий входному сигналу, разделяется на заранее установленное количество полос частот, кодер 2094 в FD с расширением или кодер 215 в FD с расширением могут назначить одну и ту же ширину полосы частот каждой из полос частот даже на разных скоростях передачи битов.
Сейчас будет описываться случай 261, где полоса частот приблизительно от 6,4 до 14,4 кГц разделяется на скорости передачи битов в 16 кбит/с, и случай 262, где полоса частот приблизительно от 8 до 16 кГц разделяется на скорости передачи битов, которая больше либо равна 16 кбит/с. В этих случаях ширина полосы частот у каждой из полос частот является одинаковой даже на разных скоростях передачи битов.
То есть ширина 263 полосы частот первой полосы частот может быть равна 0,4 кГц и на скорости передачи битов в 16 кбит/с, и скорости передачи битов, которая больше либо равна 16 кбит/с, а ширина 264 полосы частот второй полосы частот может быть равна 0,6 кГц и на скорости передачи битов в 16 кбит/с, и скорости передачи битов, которая больше либо равна 16 кбит/с.
Как описано выше, поскольку ширина полосы частот каждой из полос частот устанавливается одинаковой даже на разных скоростях передачи битов, кодер 2094 в FD с расширением или кодер 215 в FD с расширением в соответствии с текущим вариантом осуществления может выполнять квантование энергии путем совместного использования одной и той же кодовой книги на разных скоростях передачи битов.
Таким образом, в конфигурации, в которой переключение выполняется между режимом CELP и режимом FD или между режимом CELP и режимом аудиокодирования, может выполняться многорежимное расширение полосы частот, и совместное использование кодовой книги выполняется для поддержки различных скоростей передачи битов, посредством этого уменьшая размер, например, постоянной памяти (ROM) и упрощая реализацию.
Фиг. 27 - схема, иллюстрирующая полосу 271 частот, используемую в кодере в FD или декодере в FD в соответствии с вариантом осуществления настоящего изобретения.
Ссылаясь на фиг. 27, полоса 271 частот может быть примером полосы частот, которая может использоваться, например, в кодере 209 в FD из фиг. 2B и декодере 1209 в FD из фиг. 12B в соответствии с каждым из инструментов.
Точнее говоря, факториально-импульсный кодер 2092 в кодере 209 в FD ограничивает полосу частот для выполнения кодирования FPC в соответствии со скоростью передачи битов. Например, полоса Fcore частот для выполнения кодирования FPC может составлять 6,4 кГц, 8 кГц или 9,6 кГц в соответствии со скоростью передачи битов, но настоящее изобретение этим не ограничивается.
Факториально-импульсно-кодированная полоса Ffpc 272 частот может определяться путем выполнения FPC в полосе частот, ограниченной факториально-импульсным кодером 2092. В этом случае блок 12093 выполнения шумового заполнения в декодере 1209 в FD выполняет шумовое заполнение в факториально-импульсно-кодированной полосе Ffpc 272 частот.
В этом случае, если значение верхней полосы у факториально-импульсно-кодированной полосы Ffpc 272 частот меньше значения верхней полосы у полосы Fcore частот для выполнения FPC, то низкочастотный декодер 12095 в FD с расширением в декодере 1209 FD может выполнить низкочастотное декодирование с расширением.
Ссылаясь на фиг. 27, низкочастотный декодер 12095 в FD с расширением может выполнить низкочастотное декодирование в FD с расширением в оставшейся полосе 273 частот из полосы Fcore частот за исключением факториально-импульсно-кодированной полосы Ffpc частот. Однако, если полоса Fcore частот является той же, что и факториально-импульсно-кодированная полоса Ffpc 272 частот, то низкочастотное декодирование в FD с расширением можно не выполнять.
Высокочастотный декодер 12096 в FD с расширением в декодере 1209 в FD может выполнить высокочастотное декодирование в FD с расширением в полосе 274 частот между значением верхней полосы у полосы Fcore частот и значением верхней полосы у полосы Fend частот в соответствии со скоростью передачи битов. Например, значение верхней полосы у полосы Fend частот может быть равно 14 кГц, 14,4 кГц или 16 кГц, но настоящее изобретение этим не ограничивается. Таким образом, используя кодирующее устройство 101 и декодирующее устройство 102 в соответствии с вариантом осуществления настоящего изобретения, речь и музыку можно эффективно кодировать на различных скоростях передачи битов посредством различных систем переключения. Также FD-кодирование с расширением и FD-декодирование с расширением могут выполняться путем совместного использования кодовой книги. Таким образом, можно реализовать высококачественный звук менее сложным способом, даже когда присутствуют различные конфигурации. К тому же, поскольку информация о режиме предыдущего кадра включается в поток двоичных сигналов, когда выполняется FD-кодирование, декодирование можно выполнить точно, даже когда возникает ошибка кадра. Соответственно с помощью кодирующего устройства 101 и декодирующего устройства 102 можно выполнять кодирование и декодирование с низкой сложностью и малой задержкой.
Соответственно, речевой сигнал и музыкальный сигнал в соответствии с улучшенной голосовой услугой (EVS) 3GPP могут кодироваться и декодироваться подходящим образом.
Вышеприведенные способы в соответствии с различными вариантами осуществления настоящего изобретения могут быть реализованы в виде компьютерной программы, которая может выполняться различными типами вычислительного средства и записываться на машиночитаемый носитель записи. Машиночитаемый носитель записи может хранить команды программ, файлы данных, структуры данных или их сочетание. Команды программ могут специально разрабатываться или создаваться в соответствии с настоящим изобретением или могут быть известны в области компьютерного программного обеспечения.
Несмотря на то, что данное изобретение подробно показано и описано со ссылкой на его примерные варианты осуществления, обычным специалистам в данной области техники будет понятно, что в нем могут быть сделаны различные изменения в форме и деталях без отклонения от сущности и объема изобретения, которые определены прилагаемой формулой изобретения.
Изобретение относится к кодированию/декодированию аудиосигнала, соответствующего диапазону высоких частот. Технический результат – расширение диапазона высоких частот. Кодирующее устройство содержит процессор, обеспечивающий разделение входного частотного спектра на сигналы полосы низких и высоких частот, определение, кодируется ли сигнал полосы низких частот в области LP и в области преобразования, и кодирование сигнала полосы высоких частот во временной области или частотной области на основе характеристики входного частотного спектра, когда определено, что сигнал полосы низких частот кодируется в области LP. 3 н. и 9 з.п. ф-лы, 38 ил.
1. Способ кодирования сигнала верхней полосы частот, причем способ содержит:
разделение входного частотного спектра на сигнал полосы низких частот и сигнал полосы высоких частот;
определение, кодируется ли сигнал полосы низких частот в области LP или в области преобразования; и
кодирование сигнала полосы высоких частот во временной области или частотной области на основе характеристики входного частотного спектра, когда определено, что сигнал полосы низких частот кодируется в области LP.
2. Способ по п. 1, в котором кодирование сигнала полосы высоких частот в частотной области содержит:
генерирование спектра базового возбуждения для полосы высоких частот на основе входного частотного спектра;
получение энергии из входного частотного спектра;
получение коэффициента регулирования энергии на основе соотношения между тональностью входного частотного спектра и тональностью спектра базового возбуждения;
регулирование полученной энергии на основе коэффициента регулирования энергии; и
квантование отрегулированной энергии.
3. Способ по п. 2, в котором получение коэффициента регулирования энергии содержит сравнение соотношения между тональностью входного частотного спектра и тональностью спектра базового возбуждения с опорным значением.
4. Способ по п. 2, в котором квантование отрегулированной энергии содержит квантование отрегулированной энергии на основе взвешенной среднеквадратичной ошибки (WMSE).
5. Способ по п. 4, в котором для получения WMSE больший вес назначается диапазону низких частот.
6. Способ по п. 2, в котором квантование отрегулированной энергии содержит квантование отрегулированной энергии на основе интерполяционного процесса.
7. Способ по п. 2, в котором квантование отрегулированной энергии содержит квантование отрегулированной энергии посредством использования многоэтапного векторного квантования.
8. Способ по п. 2, в котором квантование отрегулированной энергии содержит:
выбор множества векторов из числа векторов энергии; и
квантование выбранных векторов и ошибки, полученной интерполяцией выбранных векторов.
9. Долговременный машиночитаемый носитель, хранящий программу для побуждения компьютера к выполнению способа по любому из пп. 1-8.
10. Устройство для кодирования сигнала верхней полосы частот, причем устройство содержит:
по меньшей мере один процессор, выполненный с возможностью:
разделения входного частотного спектра на сигнал полосы низких частот и сигнал полосы высоких частот;
определения, кодируется ли сигнал полосы низких частот в области LP или в области преобразования; и
кодирования сигнала полосы высоких частот во временной области или частотной области на основе характеристики входного частотного спектра, когда определено, что сигнал полосы низких частот кодируется в области LP.
11. Устройство по п. 10, в котором когда сигнал полосы высоких частот кодируется в частотной области, процессор выполнен с возможностью:
генерирования спектра базового возбуждения для полосы высоких частот на основе входного частотного спектра;
получения энергии из входного частотного спектра;
получения коэффициента регулирования энергии на основе соотношения между тональностью входного частотного спектра и тональностью спектра базового возбуждения;
регулирования полученной энергии на основе коэффициента регулирования энергии; и
квантования отрегулированной энергии.
12. Устройство по п. 11, в котором процессор выполнен с возможностью получения коэффициента регулирования энергии посредством сравнения соотношения между тональностью входного частотного спектра и тональностью спектра базового возбуждения с опорным значением.
Печь-кухня, могущая работать, как самостоятельно, так и в комбинации с разного рода нагревательными приборами | 1921 |
|
SU10A1 |
КОДИРОВАНИЕ И ДЕКОДИРОВАНИЕ АУДИОСИГНАЛОВ С ИСПОЛЬЗОВАНИЕМ ГРЕБЕНОК ФИЛЬТРОВ С КОМПЛЕКСНЫМ ЗНАЧЕНИЕМ | 2005 |
|
RU2407069C2 |
КОДИРОВАНИЕ ЗВУКОВЫХ СИГНАЛОВ | 2005 |
|
RU2383943C2 |
СПОСОБ ОБНАРУЖЕНИЯ И КОДИРОВАНИЯ И/ИЛИ ДЕКОДИРОВАНИЯ СТАЦИОНАРНЫХ ФОНОВЫХ ЗВУКОВ И УСТРОЙСТВО ДЛЯ КОДИРОВАНИЯ И/ИЛИ ДЕКОДИРОВАНИЯ СТАЦИОНАРНЫХ ФОНОВЫХ ЗВУКОВ | 1994 |
|
RU2127912C1 |
US 6377915 B1, 23.04.2002 | |||
Колосоуборка | 1923 |
|
SU2009A1 |
US 7454330 B1, 18.11.2008 | |||
СПОСОБ ИЗГОТОВЛЕНИЯ ТРАНСФОРМАТОРА | 1998 |
|
RU2144230C1 |
Авторы
Даты
2018-11-12—Публикация
2017-12-11—Подача