СПОСОБ И УСТРОЙСТВО КОДИРОВАНИЯ АУДИО Российский патент 2024 года по МПК G10L19/16 G10L21/38 

Описание патента на изобретение RU2828171C1

Перекрестная ссылка на родственную заявку

Настоящая заявка испрашивает приоритет заявки на патент Китая № 202010480925.6, поданной в Национальное управление интеллектуальной собственности Китая 30 мая 2020 года и озаглавленной «AUDIO CODING METHOD AND APPARATUS», которая включена сюда во всей своей полноте путем ссылки.

Область техники, к которой относится изобретение

Настоящая заявка относится, в общем, к области технологий кодирования аудиосигнала и, в частности, к способу и устройству кодирования аудио.

Уровень техники

По мере улучшения качества жизни у людей возрастает потребность в высококачественном аудио. Для лучшей передачи аудиосигнала в ограниченной полосе пропускания аудиосигнал сначала кодируется, а затем кодированный битовый поток передается на сторону декодера. Сторона декодера выполняет обработку декодирования принятого битового потока для получения декодированного аудиосигнала, причем декодированный аудиосигнал предназначен для воспроизведения.

То, как повысить эффективность кодирования аудиосигнала становится технической задачей, которую необходимо срочно решить.

Сущность изобретения

Варианты осуществления настоящей заявки предоставляют способ и устройство кодирования аудио для повышения эффективности кодирования аудиосигнала.

Для решения вышеупомянутой технической задачи варианты осуществления настоящей заявки предоставляют следующие технические решения.

Согласно первому аспекту вариант осуществления настоящей заявки предусматривает способ кодирования аудио, включающий в себя: получение текущего кадра аудиосигнала, где текущий кадр включает в себя сигнал полосы высоких частот и сигнал полосы низких частот; выполнение первого кодирования сигнала полосы высоких частот и сигнала полосы низких частот для получения первого параметра кодирования текущего кадра, где первое кодирование включает в себя кодирование с расширением полосы пропускания; определение флага резервирования спектра каждого частотного бина (элемента разрешения) сигнала полосы высоких частот, где флаг резервирования спектра указывает то, зарезервирован ли первый спектр, соответствующий частотному бину, во втором спектре, соответствующем частотному бину, где первый спектр включает в себя спектр, соответствующий частотному бину перед кодированием с расширением полосы пропускания, и второй спектр включает в себя спектр, соответствующий частотному бину после кодирования с расширением полосы пропускания; выполнение второго кодирования над сигналом полосы высоких частот на основе флага резервирования спектра каждого частотного бина сигнала полосы высоких частот для получения второго параметра кодирования текущего кадра, где второй параметр кодирования указывает информацию о целевой тональной компоненте сигнала полосы высоких частот, и информация о тональном компоненте включает в себя информацию о местоположении, информацию о количестве и информацию об амплитуде или информацию об энергии тональной компоненты; и выполнение мультиплексирования битового потока нал первым параметром кодирования и вторым параметром кодирования для получения кодированного битового потока. В этом варианте осуществления настоящей заявки процесс первого кодирования включает в себя кодирование с расширением полосы пропускания. Флаг резервирования спектра каждого частотного бина сигнала полосы высоких частот может быть определен на основе спектров сигнала полосы высоких частот перед и после кодирования с расширением полосы пропускания. То, зарезервирован ли спектр частотного бина сигнала полосы высоких частот перед кодированием с расширением полосы пропускания после кодирования с расширением полосы пропускания, указывается с помощью флага резервирования спектра. Второе кодирование выполняется над сигналом полосы высоких частот на основе флага резервирования спектра каждого частотного бина сигнала полосы высоких частот, и флаг резервирования спектра каждого частотного бина сигнала полосы высоких частот может использоваться во избежание повторного кодирования тональной компоненты, уже зарезервированной при кодировании с расширением полосы пропускания. Это позволяет повысить эффективность кодирования тональных компонент.

В возможной реализации определение флага резервирования спектра для каждого частотного бина сигнала полосы высоких частот включает в себя: определение флага резервирования спектра для каждого частотного бина сигнала полосы высоких частот на основе первого спектра, второго спектра, и частотного диапазона кодирования с расширением полосы пропускания. В приведенном выше решении, в процессе кодирования с расширением полосы пропускания, спектр сигнала (то есть первый спектр) перед кодированием с расширением полосы пропускания, спектр сигнала (то есть второй спектр) после кодирования с расширением полосы, и можно получить диапазон частот кодирования с расширением полосы пропускания. Диапазон частот кодирования с расширением полосы пропускания может быть диапазоном частотных бинов кодирования с расширением полосы пропускания. Например, диапазон частот кодирования с расширением полосы пропускания включает в себя начальный частотный бин и конечный частотный бин для интеллектуальной обработки заполнения промежутков. В качестве альтернативы, диапазон частот кодирования с расширением полосы пропускания может быть представлен другим способом. Например, диапазон частот кодирования с расширением полосы пропускания представлен на основе значения начальной частоты и значения конечной частоты кодирования с расширением полосы пропускания.

В возможной реализации полоса высоких частот, соответствующая сигналу полосы высоких частот, включает в себя по меньшей мере одну частотную область, и по меньшей мере одна частотная область включает в себя текущую частотную область. Выполнение второго кодирования сигнала полосы высоких частот на основе флага резервирования спектра каждого частотного бина сигнала полосы высоких частот для получения второго параметра кодирования текущего кадра включает в себя: выполнение поиска пика на основе сигнала полосы высоких частот текущей частотной области для того, чтобы получить информацию о пике в текущей частотной области, где информация о пике в текущей частотной области включает в себя информацию о количестве пиков, информацию о местоположении пика и информацию об амплитуде пика или информацию об энергии пика в текущей частотной области; выполнения фильтрации пиков над информацией о пиках в текущей частотной области на основе флага резервирования спектра каждого частотного бина в текущей частотной области для получения информации о тональном компоненте-кандидате в текущей частотной области; получение информации о целевой тональной компоненте текущей частотной области на основе информации о тональном компоненте-кандидате текущей частотной области; и получение второго параметра кодирования текущей частотной области на основе информации о целевой тональной компоненте текущей частотной области. В приведенном выше решении фильтрация пиков выполняется над информацией о пиках в текущей частотной области на основе флага резервирования спектра каждого частотного бина в текущей частотной области для получения информации о тональном компоненте-кандидате в текущей частотной области. Флаг резервирования спектра каждого частотного бина сигнала полосы высоких частот может использоваться во избежание повторного кодирования тональной компоненты, уже зарезервированной при кодировании с расширением полосы пропускания. Это позволяет повысить эффективность кодирования тональных компонент.

В возможной реализации полоса высоких частот, соответствующая сигналу полосы высоких частот, включает в себя по меньшей мере одну частотную область, и по меньшей мере одна частотная область включает в себя текущую частотную область. Когда первый частотный бин в текущей частотной области не принадлежит частотному диапазону кодирования с расширением полосы пропускания, значение флага резервирования спектра первого частотного бина равно первому заданному значению флага. В качестве альтернативы, когда второй частотный бин в текущей частотной области принадлежит частотному диапазону кодирования с расширением полосы пропускания, значение флага резервирования спектра второго частотного бина равно второму заданному значению, если значение спектра, соответствующее второму частотному бину перед кодированием с расширением полосы пропускания, и значение спектра, соответствующее второму частотному бину после кодирования с расширением полосы пропускания, удовлетворяют заданному условию; или значение флага резервирования спектра второго частотного бина равно третьему заданному значению, если значение спектра, соответствующее второму частотному бину перед кодированием с расширением полосы пропускания, и значение спектра, соответствующее второму частотному бину после кодирования с расширением полосы пропускания, не удовлетворяют заданному условию. В частности, устройство кодирования аудио определяет то, принадлежат ли один или более частотных бинов в текущей частотной области частотному диапазону кодирования с расширением полосы пропускания. Например, первый частотный бин определяется как частотный бин, который находится в текущей частотной области и не принадлежит частотному диапазону кодирования с расширением полосы пропускания, и второй частотный бин определяется как частотный бин, который находится в текущей частотной области и принадлежит частотному диапазону кодирования с расширением полосы пропускания. Значение флага резервирования спектра первого частотного бина равно первому заданному значению, и флаг резервирования спектра второго частотного бина имеет два значения, например, второе заданное значение и третье заданное значение, соответственно. В частности, когда значение спектра, соответствующее второму частотному бину перед кодированием с расширением полосы пропускания, и значение спектра, соответствующее второму частотному бину после кодирования с расширением полосы пропускания, удовлетворяют заданному условию, значение флага резервирования спектра второго частотного бина соответствует второму заданному значению. Когда значение спектра, соответствующее второму частотному бину перед кодированием с расширением полосы пропускания, и значение спектра, соответствующее второму частотному бину после кодирования с расширением полосы пропускания, не удовлетворяют заданному условию, значением флага резервирования спектра второго частотного бина является третье заданное значение. Заданное условие может быть реализовано множеством способов. Это не ограничивается здесь. Например, заданное условие является условием, точно определенным для значения спектра перед кодированием с расширением полосы пропускания и значения спектра после кодирования с расширением полосы пропускания, которые могут быть конкретно определены на основе сценария применения.

В возможной реализации текущая частотная область включает в себя по меньшей мере одну подполосу, и выполнения фильтрации пиков над информацией о пиках в текущей частотной области на основе флага резервирования спектра каждого частотного бина в текущей частотной области, получение информации о тональном компоненте-кандидате текущей частотной области включает в себя: получение флага резервирования спектра каждой подполосы текущей частотной области на основе флага резервирования спектра каждого частотного бина в текущей частотной области; и выполнения фильтрации пиков над информацией о пиках в текущей частотной области на основе флага резервирования спектра каждой подполосы текущей частотной области для получения информации о тональном компоненте-кандидате текущей частотной области. В этом варианте осуществления настоящей заявки флаг резервирования спектра каждой подполосы текущей частотной области может использоваться для того, чтобы предотвратить повторное кодирование тональной компоненты, уже зарезервированной при кодировании с расширением полосы пропускания. Это позволяет повысить эффективность кодирования тональных компонент.

В возможной реализации по меньшей мере одна подполоса включает в себя текущую подполосу; и получение флага резервирования спектра каждой подполосы текущей частотной области на основе флага резервирования спектра каждого частотного бина в текущей частотной области включает в себя: если количество частотных бинов, которые находятся в текущей подполосе, и чьи значения флагов резервирования спектра равны второму заданному значению, больше заданного порогового значения, определение того, что значение флага резервирования спектра текущей подполосы является значением первого флага, где, если значение спектра, соответствующее частотному бину перед кодированием с расширением полосы пропускания, и значение спектра, соответствующее частотному бину после того, как кодирование с расширением полосы пропускания удовлетворяет заданному условию, значение флага резервирования спектра для частотного бина является вторым заданным значением; или, если количество частотных бинов, которые находятся в текущей подполосе, и чьи значения флагов резервирования спектра равны второму заданному значению, меньше или равно заданному пороговому значению, определение того, что значение флага резервирования спектра текущей подполосы равно второму значению флага. Первое значение флага указывает то, что количество частотных бинов, которые находятся в текущей подполосе, и чьи значения флагов резервирования спектра равны второму заданному значению, больше, чем заданное пороговое значение. Если значение спектра, соответствующее частотному бину перед кодированием с расширением полосы пропускания, и значение спектра, соответствующее частотному бину после кодирования с расширением полосы пропускания, удовлетворяют заданному условию, значение флага резервирования спектра для частотного бина является вторым заданным значением, и частотный бин является частотным бином в текущей подполосе. Второе значение флага указывает то, что количество частотных бинов, которые находятся в текущей подполосе, и чьи значения флагов резервирования спектра равны второму заданному значению, меньше или равно заданному пороговому значению. Флаг резервирования спектра текущей подполосы может иметь множество значений. Например, флаг резервирования спектра текущей подполосы является первым значением флага, или флаг резервирования спектра текущей подполосы является вторым значением флага, которое может быть специально определено на основе количества частотных бинов, которые находятся в текущей подполосе, и чьи значения флагов резервирования спектра равны второму заданному значению.

В возможной реализации выполнения фильтрации пиков над информацией о пиках в текущей частотной области на основе флага резервирования спектра каждой подполосы текущей частотной области для получения информации о тональном компоненте- кандидате текущей частотной области включает в себя: получение на основе информации о местоположении пика в текущей частотной области порядкового номера подполосы, соответствующего местоположению пика в текущей частотной области; и выполнения фильтрации пиков над информацией о пиках в текущей частотной области на основе порядкового номера подполосы, соответствующего местоположению пика в текущей частотной области, и флага резервирования спектра каждой подполосы в текущей частотной области для получения информации о тональном компоненте-кандидате в текущей частотной области. Фильтрация пиков выполняется над информацией о пиках в текущей частотной области на основе порядкового номера подполосы, соответствующего местоположению пика в текущей частотной области, и флага резервирования спектра каждой подполосы текущей частотной области для получения отфильтрованной информации о количестве пиков, информации о местоположении пика и информации об амплитуде или информации об энергии пика в текущей частотной области в качестве информации о тональном компоненте-кандидате в текущей частотной области. В этом варианте осуществления настоящей заявки флаг резервирования спектра каждой подполосы текущей частотной области может использоваться для того, чтобы предотвратить повторное кодирование тональной компоненты, уже зарезервированной при кодировании с расширением полосы пропускания. Это позволяет повысить эффективность кодирования тональных компонент.

В возможной реализации, если значение флага резервирования спектра текущей подполосы равно второму значению флага, пик в текущей подполосе является тональной компонентой-кандидатом. Второе значение флага указывает то, что количество частотных бинов, которые находятся в текущей подполосе, и чьи значения флагов резервирования спектра равны второму заданному значению, меньше или равно заданному пороговому значению. Если значение флага резервирования спектра текущей подполосы равно второму значению флага, это указывает то, что спектр текущей подполосы не резервируется при кодировании с расширением полосы пропускания. Таким образом, тональный компонент-кандидат может быть определен тогда, когда значение флага резервирования спектра текущей подполосы равно второму значению флага.

В возможной реализации заданное условие включает в себя: значение спектра, соответствующее частотному бину перед кодированием с расширением полосы пропускания, равно значению спектра, соответствующему частотному бину после кодирования с расширением полосы пропускания. В частности, заданное условие может состоять в том, что значение спектра, соответствующее частотному бину перед кодированием с расширением полосы пропускания, равно значению спектра, соответствующему частотному бину после кодирования с расширением полосы пропускания. Заданным условием может быть то, что значение спектра не изменяется перед и после кодирования с расширением полосы пропускания, то есть значение спектра, соответствующее частотному бину перед кодированием с расширением полосы пропускания, равно значению спектра, соответствующему частотному бину после кодирования с расширением полосы пропускания. В качестве другого примера, заданное условие может также состоять в том, что абсолютное значение разности между значением спектра, соответствующим частотному бину перед кодированием с расширением полосы пропускания, и значением спектра, соответствующим частотному бину после кодирования с расширением полосы пропускания, меньше или равно заданному пороговому значению. Заданное условие основано на том, что может существовать некоторая разность между значениями спектра перед и после кодирования с расширением полосы пропускания, но информация о спектре зарезервирована, то есть разность между значением спектра, соответствующим частотному бину перед кодированием с расширением полосы пропускания, и значением спектра, соответствующим частотному бину после кодирования с расширением полосы пропускания меньше заданного порогового значения. В этом варианте осуществления настоящей заявки флаг резервирования спектра каждого частотного бина сигнала полосы высоких частот определяется путем определения заданного условия. Основываясь на флаге резервирования спектра каждого частотного бина сигнала полосы высоких частот можно избежать повторного кодирования тональной компоненты, уже зарезервированной при кодировании с расширением полосы пропускания. Это позволяет повысить эффективность кодирования тональных компонент.

Согласно второму аспекту вариант осуществления настоящей заявки предусматривает устройство кодирования аудио, включающее в себя: модуль получения, выполненный с возможностью получения текущего кадра аудиосигнала, где текущий кадр включает в себя сигнал полосы высоких частот и сигнал полосы низких частот; первый модуль кодирования, выполненный с возможностью выполнения первого кодирования сигнала полосы высоких частот и сигнала полосы низких частот для получения первого параметра кодирования текущего кадра, где первое кодирование включает в себя кодирование с расширением полосы пропускания; модуль определения флага, выполненный с возможностью определения флага резервирования спектра каждого частотного бина сигнала полосы высоких частот, где флаг резервирования спектра указывает то, зарезервирован ли первый спектр, соответствующий частотному бину, во втором спектре, соответствующем частотному бину, причем первый спектр включает в себя спектр, соответствующий частотному бину перед кодированием с расширением полосы пропускания, и второй спектр включает в себя спектр, соответствующий частотному бину после кодирования с расширением полосы пропускания; второй модуль кодирования, выполненный с возможностью выполнения второго кодирования над сигналом полосы высоких частот на основе флага резервирования спектра каждого частотного бина сигнала полосы высоких частот для получения второго параметра кодирования текущего кадра, где второй параметр кодирования указывает информацию о целевой тональной компоненте сигнала полосы высоких частот, причем информация о тональном компоненте включает в себя информацию о местоположении, информацию о количестве и информацию об амплитуде или информацию об энергии тональной компоненты; и модуль мультиплексирования битового потока, выполненный с возможностью выполнения мультиплексирования битового потока нал первым параметром кодирования и вторым параметром кодирования для получения кодированного битового потока. В этом варианте осуществления настоящей заявки процесс первого кодирования включает в себя кодирование с расширением полосы пропускания. Флаг резервирования спектра каждого частотного бина сигнала полосы высоких частот может быть определен на основе спектров сигнала полосы высоких частот перед и после кодирования с расширением полосы пропускания. То, зарезервирован ли спектр частотного бина сигнала полосы высоких частот перед кодированием с расширением полосы пропускания после кодирования с расширением полосы пропускания, указывается с помощью флага резервирования спектра. Второе кодирование выполняется над сигналом полосы высоких частот на основе флага резервирования спектра каждого частотного бина сигнала полосы высоких частот, и флаг резервирования спектра каждого частотного бина сигнала полосы высоких частот может использоваться для того, чтобы предотвратить повторное кодирование тональной компоненты, уже зарезервированной при кодировании с расширением полосы пропускания. Это позволяет повысить эффективность кодирования тональных компонент.

В возможной реализации модуль определения флага специально выполнен с возможностью: определения флага резервирования спектра каждого частотного бина сигнала полосы высоких частот на основе первого спектра, второго спектра и частотного диапазона кодирования с расширением полосы пропускания.

В возможной реализации полоса высоких частот, соответствующая сигналу полосы высоких частот, включает в себя по меньшей мере одну частотную область, и по меньшей мере одна частотная область включает в себя текущую частотную область. Второй модуль кодирования специально выполнен с возможностью: выполнения поиска пика на основе сигнала полосы высоких частот текущей частотной области, получения информации о пиках в текущей частотной области, где информация о пике в текущей частотной области включает в себя информацию о количестве пиков, информацию о местоположении пика и информацию об амплитуде пика или информацию об энергии пика в текущей частотной области; выполнения фильтрации пиков над информацией о пиках в текущей частотной области на основе флага резервирования спектра каждого частотного бина в текущей частотной области для получения информации о тональном компоненте-кандидате в текущей частотной области; получить информацию о целевой тональной компоненте текущей частотной области на основе информации о тональном компоненте-кандидате текущей частотной области; и получения второго параметра кодирования текущей частотной области на основе информации о целевой тональной компоненте текущей частотной области.

В возможной реализации полоса высоких частот, соответствующая сигналу полосы высоких частот, включает в себя по меньшей мере одну частотную область, и по меньшей мере одна частотная область включает в себя текущую частотную область. Когда первый частотный бин в текущей частотной области не принадлежит частотному диапазону кодирования с расширением полосы пропускания, значение флага резервирования спектра первого частотного бина равно первому заданному значению флага. В качестве альтернативы, когда второй частотный бин в текущей частотной области принадлежит частотному диапазону кодирования с расширением полосы пропускания, значение флага резервирования спектра второго частотного бина равно второму заданному значению, если значение спектра, соответствующее второму частотному бину перед кодированием с расширением полосы пропускания, и значение спектра, соответствующее второму частотному бину после кодирования с расширением полосы пропускания, удовлетворяют заданному условию; или значение флага резервирования спектра второго частотного бина равно третьему заданному значению, если значение спектра, соответствующее второму частотному бину перед кодированием с расширением полосы пропускания, и значение спектра, соответствующее второму частотному бину после кодирования с расширением полосы пропускания, не удовлетворяют заданному условию.

В возможной реализации текущая частотная область включает в себя по меньшей мере одну подполосу, и второй модуль кодирования специально выполнен с возможностью: получения флага резервирования спектра каждой подполосы текущей частотной области на основе флага резервирования спектра каждого частотного бина в текущей частотной области; и выполнения фильтрации пиков над информацией о пиках в текущей частотной области на основе флага резервирования спектра каждой подполосы текущей частотной области для получения информации о тональном компоненте-кандидате в текущей частотной области.

В возможной реализации по меньшей мере одна подполоса включает в себя текущую подполосу; и второй модуль кодирования специально выполнен с возможностью: если количество частотных бинов, которые находятся в текущей подполосе, и чьи значения флагов резервирования спектра равны второму заданному значению, больше заданного порогового значения, определения того, что значение флага резервирования спектра текущей подполосы равно первому значению флага, где, если значение спектра, соответствующее частотному бину перед кодированием с расширением полосы пропускания, и значение спектра, соответствующее частотному бину после кодирования с расширением полосы пропускания, удовлетворяют заданному условию, определения того, что значение флага резервирования спектра частотного бина равно второму заданному значению; или, если количество частотных бинов, которые находятся в текущей подполосе, и чьи значения флагов резервирования спектра равны второму заданному значению, меньше или равно заданному пороговому значению, значение флага резервирования спектра текущей подполосы равно значение второго флага.

В возможной реализации второй модуль кодирования специально выполнен с возможностью: получения, на основе информации о местоположении пика в текущей частотной области, порядкового номера подполосы, соответствующего местоположению пика в текущей частотной области; и выполнения фильтрации пиков над информацией о пиках в текущей частотной области на основе порядкового номера подполосы, соответствующего местоположению пика в текущей частотной области, и флага резервирования спектра каждой подполосы в текущей частотной области для получения информации о тональном компоненте-кандидате в текущей частотной области.

В возможной реализации, если значение флага резервирования спектра текущей подполосы равно второму значению флага, пик в текущей подполосе является тональной компонентой-кандидатом.

В возможной реализации заданное условие включает в себя: значение спектра, соответствующее частотному бину перед кодированием с расширением полосы пропускания, равно значению спектра, соответствующему частотному бину после кодирования с расширением полосы пропускания.

Во втором аспекте настоящей заявки модули устройства кодирования аудио могут дополнительно выполнять этапы, описанные в первом аспекте и возможных реализациях. Для получения подробной информации следует обратиться к предыдущим описаниям в первом аспекте и возможных реализациях.

Согласно третьему аспекту вариант осуществления настоящей заявки предусматривает устройство кодирования аудио, включающее в себя энергонезависимую память и процессор, соединенные друг с другом. Процессор вызывает программный код, хранящийся в памяти, для выполнения способа согласно первому аспекту.

Согласно четвертому аспекту вариант осуществления настоящей заявки предусматривает устройство кодирования аудио, включающее в себя кодер. Кодер выполнен с возможностью выполнения способа согласно первому аспекту.

Согласно пятому аспекту вариант осуществления настоящей заявки предусматривает машиночитаемый носитель данных, включающий в себя компьютерную программу. Когда компьютерная программа исполняется на компьютере, компьютер получает возможность выполнять способ согласно первому аспекту.

Согласно шестому аспекту вариант осуществления настоящей заявки предусматривает машиночитаемый носитель данных, включающий в себя кодированный битовый поток, полученный с использованием способа согласно первому аспекту.

Согласно седьмому аспекту настоящая заявка предусматривает компьютерный программный продукт. Компьютерный программный продукт включает в себя компьютерную программу. Когда компьютерная программа исполняется компьютером, выполняется способ согласно первому аспекту.

Согласно восьмому аспекту настоящая заявка предусматривает микросхему, включающую в себя процессор и память. Память выполнена с возможностью хранения компьютерной программы, и процессор выполнен с возможностью вызова и запуска компьютерной программы, хранящейся в памяти, для выполнения способа согласно первому аспекту.

Краткое описание чертежей

Фиг.1 – схематичное представление примера системы кодирования и декодирования аудио согласно варианту осуществления настоящей заявки;

Фиг.2 – схематичное представление применения кодирования аудио согласно варианту осуществления настоящей заявки;

Фиг.3 – схематичное представление применения кодирования аудио согласно варианту осуществления настоящей заявки;

Фиг.4 – блок-схема последовательности операций способа кодирования аудио согласно варианту осуществления настоящей заявки;

Фиг.5 – блок-схема последовательности операций другого способа кодирования аудио согласно варианту осуществления настоящей заявки;

Фиг.6 – блок-схема последовательности операций другого способа кодирования аудио согласно варианту осуществления настоящей заявки;

Фиг.7 – блок-схема последовательности операций способа декодирования аудио согласно варианту осуществления настоящей заявки;

Фиг.8 – схематичное представление устройства кодирования аудио согласно варианту осуществления настоящей заявки; и

Фиг.9 – схематичное представление устройства кодирования аудио согласно варианту осуществления настоящей заявки.

Подробное описание изобретения

Варианты осуществления настоящей заявки предоставляют способ кодирования аудио и устройство кодирования аудио для повышения эффективности кодирования аудиосигнала.

Ниже приведено описание вариантов осуществления настоящей заявки со ссылкой на сопроводительные чертежи.

В описании, формуле изобретения и на сопроводительных чертежах настоящей заявки термины «первый», «второй» и т.д. предназначены для различения сходных объектов, но они не обязательно указывают конкретный порядок или последовательность. Следует понимать, что термины, используемые таким образом, являются взаимозаменяемыми при соответствующих обстоятельствах, и они используются для различения, используемого тогда, когда объекты, которые имеют одинаковый атрибут, описываются в вариантах осуществления настоящей заявки. В дополнение к этому, термины «включать в себя», «содержать» и любые другие варианты означают охват неисключительного включения, так что процесс, способ, система, изделие или устройство, которое включает в себя ряд блоков, не обязательно ограничены этими блоками, но могут включать в себя другие блоки, не перечисленные явным образом или присущие такому процессу, способу, системе, изделию или устройству.

Следует понимать, что в настоящей заявке «по меньшей мере один (элемент)» относится к одному или более, и «множество» относится к двум или более. Термин «и/или» используется для описания отношения ассоциации между ассоциированными объектами и означает то, что могут существовать три отношения. Например, «А и/или В» может представлять следующие три случая: существует только А, существует только В и существуют и А, и В, где А и В могут использоваться как в единственном, так и в множественном числе. Символ «/» обычно указывает на отношение «или» между ассоциированными объектами. «По меньшей мере, один из следующих элементов (частей)» или выражение, аналогичное этому, относится к любой комбинации этих элементов, включая любую комбинацию элементов (частей) в единственном числе или элементов (частей) в множественном числе. Например, по меньшей мере один из a, b или c может представлять собой: a, b, c, "a и b", "a и c", "b и c" или "a, b и c". Каждый элемент из a, b и c может использоваться как в единственном, так и в множественном числе. В качестве альтернативы, некоторые из a, b и c могут использоваться в единственном числе; и некоторые из a, b и c могут использоваться в множественном числе.

Ниже приведено описание системной архитектуры, к которой применим вариант осуществления настоящей заявки. Обращаясь к фиг.1, на фиг.1 показана блок-схема примера системы 10 кодирования и декодирования аудио, к которой применим вариант осуществления настоящей заявки. Как показано на фиг.1, система 10 кодирования и декодирования аудио может включать в себя устройство-источник 12 и устройство-получатель 14. Устройство-источник 12 вырабатывает кодированные аудиоданные. Таким образом, устройство-источник 12 может упоминаться как устройство кодирования аудио. Устройство-получатель 14 может декодировать кодированные аудиоданные, выработанные устройством-источником 12. Таким образом, устройство-получатель 14 может упоминаться как устройство декодирования аудио. В различных реализациях устройство-источник 12, устройство-получатель 14 или как устройство-источник 12, так и устройство-получатель 14 могут включать в себя один или несколько процессоров и память, подключенную к одному или нескольким процессорам. Память может включать в себя, но без ограничений, оперативную память (random access memory, RAM), постоянную память (read only memory, ROM), электрически стираемую программируемую постоянную память (electrically erasable programmable read only memory, EEPROM), флэш-память или любой другой носитель, который можно использовать для хранения нужного программного кода в виде инструкции или структуры данных, к которой может обращаться компьютер, как описано в этой спецификации. Устройство-источник 12 и устройство-получатель 14 могут включать в себя различные устройства, в том числе настольный компьютер, мобильное вычислительное устройство, ноутбук (например, переносной компьютер), планшетный компьютер, телевизионную приставку, телефонную трубку, например, так называемый «умный» телефон, телевизор, звуковую приставку, цифровой медиаплеер, игровую приставку, бортовой компьютер, устройство беспроводной связи и т.п.

Хотя на фиг.1 показано устройство-источник 12 и устройство-получатель 14 как отдельные устройства, вариант осуществления устройства может альтернативно включать в себя как устройство-источник 12, так и устройство-получатель 14, или функциональные возможности как устройства-источника 12, так и устройства-получателя 14, то есть устройство-источник 12 или соответствующие функциональные возможности и устройство-получатель 14 или соответствующие функциональные возможности. В таких вариантах осуществления устройство-источник 12 или соответствующие функциональные возможности и устройство-получатель 14 или соответствующие функциональные возможности могут быть реализованы с использованием одних и тех же аппаратных средств и/или программного обеспечения, отдельных аппаратных средств и/или программного обеспечения или любого их сочетания.

Коммуникационное соединение между устройством-источником 12 и устройством-получателем 14 может быть реализовано по линии 13 связи, и устройство-получатель 14 может принимать кодированные аудиоданные из устройства-источника 12 по линии 13 связи. Линия 13 связи может включать в себя один или несколько носителей или устройств, способных перемещать кодированные аудиоданные из устройства-источника 12 в устройство-получатель 14. Например, линия 13 связи может включать в себя одно или несколько средств связи, которые позволяют устройству-источнику 12 напрямую передавать кодированные аудиоданные в устройство-получатель 14 в реальном времени. В этом примере устройство-источник 12 может модулировать кодированные аудиоданные в соответствии со стандартом связи (например, протоколом беспроводной связи) и может передавать модулированные аудиоданные в устройство-получатель 14. Одна или несколько коммуникационных сред могут включать в себя среду беспроводной связи и/или среду проводной связи, например, радиочастотный (РЧ, RF) спектр или одну или несколько физических линий передачи. Одна или более сред связи могут образовывать часть пакетной сети, и пакетная сеть представляет собой, например, локальную сеть, региональную сеть или глобальную сеть (например, Интернет). Одно или несколько средств связи могут включать в себя маршрутизатор, коммутатор, базовую станцию или другое устройство, которое обеспечивает связь от устройства-источника 12 до устройства-получателя 14.

Устройство-источник 12 включает в себя кодер 20. При необходимости устройство-источник 12 может дополнительно включать в себя источник 16 аудио, препроцессор 18 и интерфейс 22 связи. В конкретной реализации кодер 20, источник 16 аудио, препроцессор 18 и интерфейс 22 связи могут быть аппаратными компонентами в устройстве-источнике 12 или могут быть программами программного обеспечения в устройстве-источнике 12. Они отдельно описаны ниже.

Источник 16 аудио может включать в себя или может быть устройством захвата звука любого типа, выполненным с возможностью захвата, например, звука из реального мира, и/или устройством выработки аудио любого типа. Источник 16 аудио может представлять собой микрофон, выполненный с возможностью захвата звука, или память, выполненную с возможностью хранения аудиоданных, и источник 16 аудио может дополнительно включать в себя интерфейс любого типа (внутренний или внешний) для хранения ранее захваченных или выработанных аудиоданных и/или для получения или приема аудиоданных. Когда источником 16 аудио является микрофон, источником 16 аудио может быть, например, локальный микрофон или микрофон, встроенный в устройство-источник. Когда источник 16 аудио представляет собой память, источник 16 аудио может быть, например, локальной памятью или памятью, встроенной в устройство-источник. Когда источник 16 аудио включает в себя интерфейс, этот интерфейс может быть, например, внешним интерфейсом для приема аудиоданных из внешнего источника звука. Например, внешний источник звука – это внешнее устройство захвата звука, такое как микрофон, внешнее запоминающее устройство или внешнее устройство выработки аудио. Интерфейс может быть интерфейсом любого типа, например, проводным или беспроводным интерфейсом или оптическим интерфейсом, в соответствии с любым патентованным или стандартизированным интерфейсным протоколом.

В этом варианте осуществления настоящей заявки аудиоданные, передаваемые из источника 16 аудио в препроцессор 18, также могут называться предварительно обработанными аудиоданными 17.

Препроцессор 18 выполнен с возможностью приема и предварительной обработки аудиоданных 17 для получения предварительно обработанного аудио 19 или предварительно обработанных аудиоданных 19. Например, предварительная обработка, выполняемая препроцессором 18, может включать в себя фильтрацию или шумоподавление.

Кодер 20 (или аудиокодер 20) выполнен с возможностью приема предварительно обработанных аудиоданных 19 и выполнен с возможностью выполнения вариантов осуществления, описанных ниже, для реализации применения способа кодирования аудио, описанного в настоящей заявке, на стороне кодера.

Интерфейс 22 связи может быть выполнен с возможностью приема кодированных аудиоданных 21 и передачи кодированных аудиоданных 21 в устройство-получатель 14 или любое другое устройство (например, память) по линии связи 13 связи для хранения или прямого восстановления. Другое устройство может быть любым устройством, используемым для декодирования или хранения. Интерфейс 22 связи может быть, например, выполнен с возможностью инкапсуляции кодированных аудиоданных 21 в соответствующий формат, например, пакет данных, для передачи по линии 13 связи.

Устройство-получатель 14 включает в себя декодер 30. При необходимости устройство-получатель 14 может дополнительно включать в себя интерфейс 28 связи, аудиопостпроцессор 32 и динамик 34. Они отдельно описаны ниже.

Интерфейс 28 связи может быть выполнен с возможностью приема кодированных аудиоданных 21 из устройства-источника 12 или любого другого источника. Любой другой источник – это, например, запоминающее устройство. Запоминающее устройство представляет собой, например, устройство хранения кодированных аудиоданных. Интерфейс 28 связи может быть выполнен с возможностью передачи или приема кодированных аудиоданных 21 по линии 13 связи между устройством-источником 12 и устройством-получателем 14 или через сеть любого типа. Линия 13 связи представляет собой, например, прямое проводное или беспроводное соединение. Любой тип сети представляет собой, например, проводную или беспроводную сеть или любую их комбинацию, или любой тип частной или общедоступной сети, или любую их сочетание. Интерфейс 28 связи может быть, например, выполнен с возможностью декапсуляции пакета данных, переданного через интерфейс 22 связи, для получения кодированных аудиоданных 21.

Как интерфейс связи 28, так и интерфейс 22 связи могут быть сконфигурированы как однонаправленные интерфейсы связи или двунаправленные интерфейсы связи и могут быть выполнены, например, с возможностью отправки и приема сообщений для установления соединения, и подтверждения и обмена любой другой информации, относящийся к линии связи и/или передаче данных, такой как передача кодированных аудиоданных.

Декодер 30 (или аудиодекодер 30) выполнен с возможностью приема кодированных аудиоданных 21 и предоставления декодированных аудиоданных 31 или декодированного аудио 31. В некоторых вариантах осуществления декодер 30 может быть выполнен с возможностью выполнения вариантов осуществления, описанных ниже, для реализации применения способа кодирования аудио, описанного в настоящей заявке, на стороне декодера.

Аудиопостпроцессор 32 выполнен с возможностью постобработки декодированных аудиоданных 31 (также называемых восстановленными аудиоданными) для получения постобработанных аудиоданных 33. Постобработка, выполняемая аудиопостпроцессором 32, может включать в себя, например, рендеринг или любую другую обработку и может дополнительно выполняться с возможностью передачи аудиоданных 33 с постобработкой на динамик 34.

Динамик 34 выполнен с возможностью приема аудиоданных 33 постобработки для воспроизведения звука, например, пользователю или зрителю. Динамик 34 может быть или может включать в себя динамик любого типа, выполненный с возможностью воспроизведения восстановленного звука.

Хотя на фиг.1 показано устройство-источник 12 и устройство-получатель 14 как отдельные устройства, вариант осуществления устройства может альтернативно включать в себя как устройство-источник 12, так и устройство-получатель 14, или функциональные возможности как устройства-источника 12, так и устройства-получателя 14, то есть устройство-источник 12 или соответствующие функциональные возможности и устройство-получатель 14 или соответствующие функциональные возможности. В таких вариантах осуществления устройство-источник 12 или соответствующие функциональные возможности и устройство-получатель 14 или соответствующие функциональные возможности могут быть реализованы с использованием одних и тех же аппаратных средств и/или программного обеспечения, отдельных аппаратных средств и/или программного обеспечения или любого их сочетания.

Специалистам в данной области техники будет очевидно, что, на основе описаний, существование и (точное) разделение функциональных возможностей различных блоков или функциональных возможностей устройства-источника 12 и/или устройства-получателя 14, показанных на фиг.1 может отличаться в зависимости от конкретного устройства и применения. Устройство-источник 12 и устройство-получатель 14 могут включать в себя любое из широкого спектра устройств, включая портативные или стационарные устройства любого типа, например, ноутбук или портативный компьютер, мобильный телефон, смартфон, планшет или планшетный компьютер, видеокамеру, настольный компьютер, телевизионную приставку, телевизор, фотоаппарат, автомобильное устройство, звуковую приставку, цифровой медиаплеер, аудио игровую приставку, устройство передачи потокового аудио (например, сервер службы содержания или сервер распространения содержания), широковещательное приемное устройство, широковещательное передающее устройство, смарт-очки или смарт-часы, и не могут использовать или могут использовать операционную систему любого типа.

Кодер 20 и декодер 30 каждый может быть реализован в виде любой из различных соответствующих схем, например, одного или более микропроцессоров, процессоров цифровых сигналов (digital signal processor, DSP), специализированных интегральных схем (application-specific integrated circuit, ASIC), программируемых пользователем вентильных матриц (field-programmable gate array, FPGA), дискретной логики, аппаратных средств или любого их сочетания. Если технологии реализованы частично с использованием программного обеспечения, устройство может хранить программные инструкции на соответствующем и энергонезависимом машиночитаемом носителе данных и может исполнять инструкции с использованием аппаратных средств, таких как один или более процессоров, для выполнения технологий настоящего раскрытия. Любое из вышеуказанного содержания (включая аппаратные средства, программное обеспечение, комбинацию аппаратных средств и программного обеспечения и т.п.) может рассматриваться как один или более процессоров.

В некоторых случаях система 10 кодирования и декодирования аудио, показанная на фиг.1, является просто примером, и технологии настоящей заявки применимы к настройкам кодирования аудио (например, кодированию аудио или декодированию аудио), которые не обязательно включают в себя какой-либо обмен данными между устройством кодирования и устройством декодирования. В другом примере данные могут быть извлечены из локальной памяти, переданы в потоковом режиме через сеть и т.п. Устройство кодирования аудио может кодировать данные и сохранять данные в памяти, и/или устройство декодирования аудио может извлекать и декодировать данные из памяти. В некоторых примерах кодирование и декодирование выполняются устройствами, которые не взаимодействуют друг с другом, а просто кодируют данные в память и/или извлекают и декодируют данные из памяти.

Кодер может быть многоканальным кодером, например, стереофоническим кодером, 5.1-канальным кодером или 7.1-канальным кодером. Конечно, можно понять, что вышеупомянутый кодер также может быть монокодером.

Аудиоданные также могут упоминаться как аудиосигнал. Аудиосигнал в этом варианте осуществления настоящей заявки является входным сигналом в устройстве кодирования аудио. Аудиосигнал может включать в себя множество кадров. Например, текущий кадр может конкретно относиться к кадру в аудиосигнале. В вариантах осуществления настоящей заявки кодирование и декодирование аудиосигнала текущего кадра используются в качестве примера для описания. Предыдущий кадр или следующий кадр текущего кадра в аудиосигнале могут быть, соответственно, закодированы и декодированы на основе способа кодирования и декодирования аудиосигнала текущего кадра. Процессы кодирования и декодирования предыдущего кадра или следующего кадра текущего кадра в аудиосигнале не описываются один за другим. В дополнение к этому, аудиосигнал в вариантах осуществления настоящей заявки может быть монофоническим аудиосигналом или может быть многоканальным сигналом, например, стереофоническим сигналом. Стереосигнал может быть исходным стереосигналом, может быть стереосигналом, включающим в себя два канала сигналов (сигнал левого канала и сигнал правого канала), включенным в многоканальный сигнал, или может быть стереосигналом, включающим в себя два канала сигналов, вырабатываемых не менее чем тремя каналами сигналов, включенных в многоканальный сигнал. Это не ограничивается вариантами осуществления настоящей заявки.

Например, как показано на фиг.2, этот вариант осуществления описан на примере, в котором кодер 20 расположен в мобильном терминале 230, декодер 30 расположен в мобильном терминале 240, мобильный терминал 230 и мобильный терминал 240 представляют собой электронные устройства, которые используются независимо друг от друга и имеют возможность обработки аудиосигнала, например, мобильные телефоны, носимые устройства, устройства виртуальной реальности (virtual Reality, VR) или устройства дополненной реальности (AR), и мобильный терминал 230 и мобильный терминал 240 подключаются через беспроводную или проводную сеть.

При необходимости мобильный терминал 230 может включать в себя источник 16 аудио, препроцессор 18, кодер 20 и кодер 232 канала. Источник 16 аудио, препроцессор 18, кодер 20 и кодер 232 канала подключены друг к другу.

При необходимости мобильный терминал 240 может включать в себя декодер 242 канала, декодер 30, аудиопостпроцессор 32 и динамик 34. Декодер 242 канала, декодер 30, аудиопостпроцессор 32 и динамик 34 подключены друг к другу.

После получения аудиосигнала через источник 16 аудио мобильный терминал 230 выполняет предварительную обработку аудио, используя препроцессор 18, кодирует аудиосигнал, используя кодер 20, чтобы получить кодированный битовый поток, и затем кодирует кодированный поток битов, используя кодер 232 канала, чтобы получить сигнал передачи.

Мобильный терминал 230 отправляет сигнал передачи в мобильный терминал 240 через беспроводную или проводную сеть.

После приема сигнала передачи мобильный терминал 240 декодирует сигнал передачи, используя декодер 242 канала, чтобы получить кодированный битовый поток; декодирует кодированный поток битов, используя декодер, чтобы получить аудиосигнал; обрабатывает аудиосигнал, используя аудиопостпроцессор 32, и затем воспроизводит аудиосигнал, используя динамик 34. Можно понять, что мобильный терминал 230 может также включать в себя функциональные модули, включенные в мобильный терминал 240, и мобильный терминал 240 также может включать в себя функциональные модули, включенные в мобильный терминал 230.

Например, как показано на фиг.3, для описания используется пример, в котором кодер 20 и декодер 30 расположены в сетевом элементе 350, который имеет возможность обработки аудиосигнала в одной и той же базовой сети или беспроводной сети. Сетевой элемент 350 может осуществлять транскодирование, например, преобразовывать кодированный битовый поток другого аудиокодера (немногоканального кодера) в кодированный битовый поток многоканального кодера. Сетевой элемент 350 может быть медиашлюзом, устройством транскодирования, сервером медиаресурсов и т.п. сети радиодоступа или базовой сети.

При необходимости сетевой элемент 350 включает в себя декодер 351 канала, другой аудиодекодер 352, кодер 20 и кодер 353 канала. Декодер 351 канала, другой аудиодекодер 352, кодер 20 и кодер 353 канала подключены друг к другу.

После приема сигнала передачи, отправленного другим устройством, декодер 351 канала декодирует сигнал передачи для получения первого кодированного битового потока; декодирует первый кодированный битовый поток, используя другой аудиодекодер 352, чтобы получить аудиосигнал; кодирует аудиосигнал, используя кодер 20, чтобы получить второй кодированный битовый поток; и кодирует второй кодированный битовый поток, используя кодер 353 канала, чтобы получить сигнал передачи. То есть первый кодированный битовый поток преобразуется во второй кодированный битовый поток.

Другое устройство может быть мобильным терминалом, имеющим возможность обработки аудиосигнала, или может быть другим сетевым элементом, имеющим возможность обработки аудиосигнала. В этом варианте осуществления это не ограничено.

При необходимости в этом варианте осуществления настоящей заявки устройство, на котором установлен кодер 20, может упоминаться как устройство кодирования аудио. В реальной реализации устройство кодирования аудио может также иметь функцию декодирования аудио. Этот случай не ограничивается этим вариантом осуществления настоящей заявки.

При необходимости в этом варианте осуществления настоящей заявки устройство, на котором установлен декодер 30, может упоминаться как устройство декодирования аудио. Во время фактической реализации устройство декодирования аудио может также иметь функцию кодирования аудио. Этот случай не ограничивается этим вариантом осуществления настоящей заявки.

Кодер может выполнять способ кодирования аудио в вариантах осуществления настоящей заявки. Процесс первого кодирования включает в себя кодирование с расширением полосы пропускания. Флаг резервирования спектра каждого частотного бина сигнала полосы высоких частот может быть определен на основе спектров сигнала полосы высоких частот перед и после кодирования с расширением полосы пропускания и частотного диапазона кодирования с расширением полосы пропускания. То, зарезервировано ли значение спектра частотного бина сигнала полосы высоких частот перед кодированием с расширением полосы пропускания после кодирования с расширением полосы пропускания с использованием флага резервирования спектра. Второе кодирование выполняется над сигналом полосы высоких частот на основе флага резервирования спектра каждого частотного бина сигнала полосы высоких частот, и флаг резервирования спектра каждого частотного бина сигнала полосы высоких частот может использоваться во избежание повторного кодирования тональной компоненты, уже зарезервированной при кодировании с расширением полосы пропускания. Это позволяет повысить эффективность кодирования тональных компонент.

Например, первое кодирование, выполняемое кодером или базовым кодером внутри кодера над сигналом полосы высоких частот и сигналом полосы низких частот, включает в себя кодирование с расширением полосы пропускания, так что флаг резервирования спектра каждого частотного бина полосы сигнала полосы высоких частот может быть записан, то есть то, изменяется ли спектр каждого частотного бина перед и после расширения полосы пропускания, определяется на основе флага резервирования спектра каждого частотного бина сигнала полосы высоких частот. Флаг резервирования спектра каждого частотного бина сигнала полосы высоких частот может использоваться для того, чтобы предотвратить повторное кодирование тональной компоненты, уже зарезервированной при кодировании с расширением полосы пропускания. Это позволяет повысить эффективность кодирования тональных компонент. Для его конкретной реализации следует обратиться к следующему конкретному пояснению и описанию варианта осуществления, показанного на фиг.4.

На фиг.4 показана блок-схема последовательности операций способа кодирования аудио согласно варианту осуществления настоящей заявки. Этот вариант осуществления настоящей заявки может выполняться вышеупомянутым кодером или базовым кодером внутри кодера. Как показано на фиг.4, способ в этом варианте осуществления может включать в себя следующие этапы.

401: Получить текущий кадр аудиосигнала, где текущий кадр включает в себя сигнал полосы высоких частот и сигнал полосы низких частот.

Текущий кадр может быть любым кадром в аудиосигнале, и текущий кадр может включать в себя сигнал полосы высоких частот и сигнал полосы низких частот. Классификация сигнала полосы высоких частот и сигнала полосы низких частот может быть определена с использованием порога полосы частот. Например, сигнал выше порога полосы частот является сигналом полосы высоких частот, и сигнал ниже порога полосы частот является сигналом полосы низких частот. Порог полосы частот может быть определен на основе ширины полосы передачи и возможностей обработки данных устройства кодирования аудио и устройства декодирования аудио. Этот случай не ограничивается здесь.

Сигнал полосы высоких частот и сигнал полосы низких частот являются относительными. Например, сигнал ниже порогового значения частоты является сигналом полосы низких частот, и сигнал выше порогового значения частоты является сигналом полосы высоких частот (сигнал, соответствующий пороговому значению частоты, может быть классифицирован либо как сигнал полосы низких частот, либо как сигнал полосы высоких частот). Пороговое значение частоты варьируется в зависимости от полосы пропускания текущего кадра. Например, когда текущий кадр представляет собой широкополосный сигнал с полосой пропускания сигнала от 0 кГц до 8 кГц, пороговое значение частоты может быть равно 4 кГц; или, когда текущий кадр представляет собой сверхширокополосный сигнал с полосой пропускания сигнала от 0 кГц до 16 кГц, пороговое значение частоты может быть равно 8 кГц.

Следует отметить, что в этом варианте осуществления настоящего изобретения сигнал полосы высоких частот может быть частью или всеми сигналами в области высоких частот. В частности, область высоких частот изменяется в зависимости от различной ширины полосы пропускания сигнала текущего кадра, а также изменяется в зависимости от различных пороговых значений частоты. Например, когда ширина полосы пропускания сигнала текущего кадра составляет от 0 кГц до 8 кГц, и пороговое значение частоты равно 4 кГц, область высоких частот составляет от 4 кГц до 8 кГц. В этом случае сигнал полосы высоких частот может быть сигналом от 4 кГц до 8 кГц, покрывающим всю область высоких частот, или может быть сигналом, покрывающим только часть области высоких частот. Например, сигналы полосы высоких частот могут находиться в диапазоне от 4 кГц до 7 кГц, от 5 кГц до 8 кГц, от 5 кГц до 7 кГц или от 4 кГц до 6 кГц и от 7 кГц до 8 кГц (то есть сигналы полосы высоких частот могут быть несмежными в частотной области). Когда полоса пропускания сигнала текущего кадра составляет от 0 кГц до 16 кГц, и пороговое значение частоты равно 8 кГц, область высоких частот составляет от 8 кГц до 16 кГц. В этом случае сигнал полосы высоких частот может быть сигналом от 8 кГц до 16 кГц, покрывающим всю область высоких частот, или может быть сигналом, покрывающим только часть области высоких частот. Например, сигналы полосы высоких частот могут быть от 8 кГц до 15 кГц, от 9 кГц до 16 кГц, от 9 кГц до 15 кГц или от 8 кГц до 10 кГц и от 11 кГц до 16 кГц (то есть сигналы полосы высоких частот могут быть несмежными в частотной области). Можно понять, что диапазон частот, охватываемый сигналом полосы высоких частот, может быть установлен по мере необходимости или может быть адаптивно определен на основе диапазона частот, в котором необходимо выполнить последующее второе кодирование, например, может быть адаптивно определен на основе диапазона частот, в котором необходимо выполнить обнаружение тональной компоненты.

402: Выполнить первое кодирование сигнала полосы высоких частот и сигнала полосы низких частот, чтобы получить первый параметр кодирования текущего кадра, где первое кодирование включает в себя кодирование с расширением полосы пропускания.

После получения сигнала полосы высоких частот и сигнала полосы низких частот устройство кодирования аудио может выполнить первое кодирование сигнала полосы высоких частот и сигнала полосы низких частот. Первое кодирование может включать в себя кодирование с расширением полосы пропускания, и кодирование с расширением полосы пропускания также может для краткости упоминаться как "расширение полосы пропускания". Кодирование с расширением полосы пропускания (то есть кодирование с расширением полосы пропускания аудио, именуемое ниже расширением полосы пропускания) вводится в процессе первого кодирования, и параметр кодирования с расширением полосы пропускания (сокращенно называемый параметром расширения полосы пропускания) может быть получен путем кодирования с расширением полосы пропускания. Сторона декодера может восстанавливать информацию о высокой частоте в аудиосигнале на основе параметра кодирования с расширением полосы пропускания. Это позволяет расширить эффективную полосу пропускания аудиосигнала и повысить качество аудиосигнала.

В этом варианте осуществления настоящей заявки сигнал полосы высоких частот и сигнал полосы низких частот кодируются в процессе первого кодирования для получения первого параметра кодирования текущего кадра. Первый параметр кодирования может использоваться для мультиплексирования битового потока.

В некоторых вариантах осуществления в дополнение к кодированию с расширением полосы пропускания первое кодирование может дополнительно включать в себя обработку, такую как формирование временного шума, формирование шума в частотной области или дискретизацию спектра. Соответственно, в дополнение к параметру кодирования с расширением полосы пропускания первый параметр кодирования может дополнительно включать в себя параметр формирования временного шума, параметр формирования шума в частотной области или параметр дискретизации спектра. Подробности процесса первого кодирования в этом варианте осуществления настоящей заявки не описаны.

403: Определить флаг резервирования спектра каждого частотного бина сигнала полосы высоких частот, где флаг резервирования спектра указывает то, зарезервирован ли первый спектр, соответствующий частотному бину, во втором спектре, соответствующем частотному бину, причем первый спектр включает в себя спектр сигнала полосы высоких частот, соответствующий частотному бину перед кодированием с расширением полосы пропускания, и второй спектр включает в себя спектр сигнала полосы высоких частот, соответствующий частотному бину после кодирования с расширением полосы пропускания.

В этом варианте осуществления настоящей заявки кодирование с расширением полосы пропускания выполняется над высокочастотным сигналом при первом кодировании, и то, изменяется ли спектр перед и после кодирования с расширением полосы пропускания, может быть записано для каждого частотного бина высокочастотного сигнала. Например, первый спектр является спектром сигнала полосы высоких частот, соответствующим частотному бину перед кодированием с расширением полосы пропускания, и второй спектр является спектром сигнала полосы высоких частот, соответствующим частотному бину после кодирования с расширением полосы пропускания. В этом случае устройство кодирования аудио может вырабатывать флаг резервирования спектра каждого частотного бина сигнала полосы высоких частот. Флаг резервирования спектра каждого частотного бина сигнала полосы высоких частот указывает то, зарезервирован ли первый спектр, соответствующий частотному бину, во втором спектре, соответствующем частотному бину.

Следует отметить, что на этапе 403 определяется флаг резервирования спектра каждого частотного бина сигнала полосы высоких частот, где каждый частотный бин сигнала полосы высоких частот относится к каждому частотному бину, для которого флаг резервирования спектра должен быть определен в сигнале полосы высоких частот. Если диапазон частот, в котором необходимо выполнить обнаружение тональной компоненты, заранее определен, диапазон частот, в котором необходимо определить флаг резервирования спектра в сигнале полосы высоких частот, не является полным диапазоном частот сигнала полосы высоких частот. Таким образом, может быть получен только флаг резервирования спектра каждого частотного бина в диапазоне частот, в котором необходимо выполнить обнаружение тональной компоненты. В дополнение к этому, сигнал полосы высоких частот на этапе 403 также может быть сигналом полосы высоких частот в диапазоне частот, в котором необходимо выполнить обнаружение тональной компоненты. Диапазон частот, в котором необходимо выполнить обнаружение тональной компоненты, может быть определен на основе количества частотных областей, в которых необходимо выполнить обнаружение тональной компоненты. В частности, количество частотных областей, в отношении которых необходимо выполнить обнаружение тональной компоненты, может быть задано заранее.

В некоторых вариантах осуществления настоящей заявки определение флага резервирования спектра каждого частотного бина сигнала полосы высоких частот на этапе 403 включает в себя:

определение флага резервирования спектра каждого частотного бина сигнала полосы высоких частот на основе первого спектра, второго спектра и частотного диапазона кодирования с расширением полосы пропускания.

В процессе кодирования с расширением полосы пропускания спектр сигнала (то есть первого спектра) перед кодированием с расширением полосы, можно получить спектр сигнала (то есть второй спектр) после кодирования с расширением полосы и диапазон частот кодирования с расширением полосы пропускания. Диапазон частот кодирования с расширением полосы пропускания может быть диапазоном частотных бинов кодирования с расширением полосы пропускания. Например, диапазон частот кодирования с расширением полосы пропускания включает в себя начальный частотный бин и конечный частотный бин для обработки интеллектуального заполнения интервалов (intelligent gap filling, IGF). В качестве альтернативы, диапазон частот кодирования с расширением полосы пропускания может быть представлен другим способом. Например, диапазон частот кодирования с расширением полосы пропускания представлен на основе значения начальной частоты и значения конечной частоты кодирования с расширением полосы пропускания.

В процессе первого кодирования, предусмотренного в этом варианте осуществления настоящей заявки, полоса высоких частот может быть разделена на K частотных областей (например, частотная область представлена в виде тайла), и каждая частотная область дополнительно разделена на М диапазонов частот. Значения K и M не ограничены. Диапазон частот кодирования с расширением полосы пропускания может быть определен с использованием частотной области в качестве единицы или может быть определен с использованием полосы частот в качестве единицы.

Устройство кодирования аудио может получать значение флага резервирования спектра каждого частотного бина в сигнале полосы высоких частот множеством способов, которые подробно описаны ниже.

В некоторых вариантах осуществления настоящей заявки полоса высоких частот, соответствующая сигналу полосы высоких частот, включает в себя по меньшей мере одну частотную область, и по меньшей мере одна частотная область включает в себя текущую частотную область.

Когда первый частотный бин в текущей частотной области не принадлежит частотному диапазону кодирования с расширением полосы пропускания, значение флага резервирования спектра первого частотного бина равно первому заданному значению.

В качестве альтернативы, когда второй частотный бин в текущей частотной области принадлежит частотному диапазону кодирования с расширением полосы пропускания, значение флага резервирования спектра второго частотного бина равно второму заданному значению, если значение спектра, соответствующее второму частотному бину перед кодированием с расширением полосы пропускания, и значение спектра, соответствующее второму частотному бину после кодирования с расширением полосы пропускания, удовлетворяют заданному условию; или значение флага резервирования спектра второго частотного бина равно третьему заданному значению, если значение спектра, соответствующее второму частотному бину перед кодированием с расширением полосы пропускания, и значение спектра, соответствующее второму частотному бину после кодирования с расширением полосы пропускания, не удовлетворяют заданному условию.

Первое заданное значение указывает то, что первый частотный бин в текущей частотной области не принадлежит частотному диапазону кодирования с расширением полосы пропускания. Второе заданное значение указывает то, что второй частотный бин в текущей частотной области принадлежит частотному диапазону кодирования с расширением полосы пропускания, и значение спектра, соответствующее второму частотному бину перед кодированием с расширением полосы пропускания, и значение спектра, соответствующее второму частотному бину после кодирования с расширением полосы пропускания, удовлетворяют заданному условию. Третье заданное значение указывает то, что второй частотный бин в текущей частотной области принадлежит частотному диапазону кодирования с расширением полосы пропускания, и значение спектра, соответствующее второму частотному бину перед кодированием с расширением полосы пропускания, и значение спектра, соответствующее второму частотному бину после кодирования с расширением полосы пропускания, не удовлетворяют заданному условию.

В частности, устройство кодирования аудио определяет то, принадлежат ли один или более частотных бинов в текущей частотной области частотному диапазону кодирования с расширением полосы пропускания. Например, первый частотный бин определяется как частотный бин, который находится в текущей частотной области и не принадлежит частотному диапазону кодирования с расширением полосы пропускания, и второй частотный бин определяется как частотный бин, который находится в текущей частотной области и принадлежит частотному диапазону кодирования с расширением полосы пропускания. Значение флага резервирования спектра первого частотного бина равно первому заданному значению, и флаг резервирования спектра второго частотного бина имеет два значения, например, второе заданное значение и третье заданное значение, соответственно. В частности, когда значение спектра, соответствующее второму частотному бину перед кодированием с расширением полосы пропускания, и значение спектра, соответствующее второму частотному бину после кодирования с расширением полосы пропускания, удовлетворяют заданному условию, значение флага резервирования спектра второго частотного бина соответствует второму заданному значению. Когда значение спектра, соответствующее второму частотному бину перед кодированием с расширением полосы пропускания, и значение спектра, соответствующее второму частотному бину после кодирования с расширением полосы пропускания, не удовлетворяют заданному условию, значение флага резервирования спектра второго частотного бина равно третьему заданному значению. Заданное условие может быть реализовано множеством способов. Это не ограничивается здесь. Например, заданное условие является условием, точно определенным для значения спектра перед кодированием с расширением полосы пропускания и значения спектра после кодирования с расширением полосы пропускания, которые могут быть конкретно определены на основе сценария применения.

В некоторых вариантах осуществления настоящей заявки заданное условие включает в себя: значение спектра, соответствующее второму частотному бину перед кодированием с расширением полосы пропускания, равно значению спектра, соответствующему второму частотному бину после кодирования с расширением полосы пропускания.

В частности, заданное условие может состоять в том, что значение спектра, соответствующее второму частотному бину перед кодированием с расширением полосы пропускания, равно значению спектра, соответствующему второму частотному бину после кодирования с расширением полосы пропускания. Заданное условие состоит в том, что значение спектра не изменяется перед и после кодирования с расширением полосы пропускания, то есть значение спектра, соответствующее второму частотному бину перед кодированием с расширением полосы пропускания, равно значению спектра, соответствующему второму частотному бину после кодирования с расширением полосы пропускания. В качестве другого примера, заданное условие может также состоять в том, что абсолютное значение разности между значением спектра, соответствующим второму частотному бину перед кодированием с расширением полосы пропускания, и значением спектра, соответствующим второму частотному бину после кодирования с расширением полосы пропускания, меньше или равно заданному пороговому значению. Заданное условие основано на том, что может существовать некоторая разность между значениями спектра перед и после кодирования с расширением полосы пропускания, но информация о спектре зарезервирована, то есть разность между значением спектра, соответствующим второму частотному бину перед кодированием с расширением полосы пропускания, и значением спектра, соответствующим второму частотному бину после кодирования с расширением полосы пропускания, меньше заданного порогового значения. В этом варианте осуществления настоящей заявки флаг резервирования спектра каждого частотного бина сигнала полосы высоких частот определяется путем определения заданного условия. Основываясь на флаге резервирования спектра каждого частотного бина сигнала полосы высоких частот можно избежать повторного кодирования тональной компоненты, уже зарезервированной при кодировании с расширением полосы пропускания. Это позволяет повысить эффективность кодирования тональных компонент.

Например, значение флага резервирования спектра, соответствующего частотному бину, который не принадлежит частотному диапазону кодирования с расширением полосы пропускания, устанавливается равным первому заданному значению. Для частотного бина, который принадлежит частотному диапазону кодирования с расширением полосы пропускания, если значение спектра, соответствующее частотному бину перед кодированием с расширением полосы пропускания, равно значению спектра, соответствующему частотному бину после кодирования с расширением полосы пропускания, значение флага резервирования спектра частотного бина устанавливается на второе заданное значение. Если значение спектра, соответствующее частотному бину перед кодированием с расширением полосы пропускания, не равно значению спектра, соответствующему частотному бину после кодирования с расширением полосы пропускания, значение флага резервирования спектра частотного бина устанавливается равным третьему заданному значению.

В конкретном варианте осуществления настоящей заявки спектр сигнала перед кодированием с расширением полосы пропускания, то есть спектр модифицированного дискретного косинусного преобразования (modified discrete cosine transform, MDCT) перед интеллектуальным заполнением интервалов (intellectual gap fill, IGF), обозначается как mdctSpectrumBeforeIGF. Спектр сигнала после кодирования с расширением полосы пропускания, то есть спектр mdct после IGF, обозначается как mdctSpectrumAfterIGF. Флаг резервирования спектра частотного бина обозначается как igfActivityMask. Например, первое заданное значение равно –1, второе заданное значение равно 1, и третье заданное значение равно 0. Если значение igfActivityMask равно –1, это указывает то, что частотный бин находится за пределами полосы частот, обрабатываемой IGF (то есть диапазон частот кодирования с расширением полосы пропускания). Если значение igfActivityMask равно 0, это указывает то, что частотный бин не зарезервирован (то есть значение спектра частотного бина было установлено равным нулю во время кодирования с расширением полосы пропускания). Если значение igfActivityMask равно 1, это указывает то, что частотный бин зарезервирован (то есть значение спектра остается неизменным перед и после кодирования с расширением полосы пропускания).

В частности, способ получения igfActivityMask выглядит следующим образом:

sb – порядковый номер частотного бина, igfBgn и igfEnd – начальный частотный бин и конечный частотный бин, соответственно, для обработки IGF, и blockSize – максимальный порядковый номер частотного бина полосы высоких частот .

404: Выполнить второе кодирование сигнала полосы высоких частот на основе флага резервирования спектра каждого частотного бина сигнала полосы высоких частот, чтобы получить второй параметр кодирования текущего кадра, где второй параметр кодирования указывает информацию о целевой тональной компоненте сигнала полосы высоких частот, и информация о тональном компоненте включает в себя информацию о местоположении, информацию о количестве и информацию об амплитуде или информацию об энергии тональной компоненты.

В этом варианте осуществления настоящей заявки, после получения флага резервирования спектра каждого частотного бина сигнала полосы высоких частот, устройство кодирования аудио может выполнять второе кодирование сигнала полосы высоких частот на основе флага резервирования спектра каждого частотного бина сигнала полосы высоких частот. В процессе второго кодирования устройство кодирования аудио может определить путем синтаксического анализа флага резервирования спектра каждого частотного бина то, какой частотный бин изменяется перед и после расширения полосы пропускания и какая частота не изменяется перед и после расширения полосы пропускания, то есть устройство кодирования аудио может определить то, был ли закодирован каждый частотный бин сигнала полосы высоких частот в процессе первого кодирования. Частотный бин сигнала полосы высоких частот, который был закодирован в процессе первого кодирования, может не кодироваться в процессе второго кодирования. Таким образом, флаг резервирования спектра каждого частотного бина сигнала полосы высоких частот может использоваться для того, чтобы предотвратить повторное кодирование тональной компоненты, уже зарезервированной при кодировании с расширением полосы пропускания. Это позволяет повысить эффективность кодирования тональных компонент.

В частности, устройство кодирования аудио может получить второй параметр кодирования текущего кадра посредством вышеупомянутого второго кодирования, и второй параметр кодирования указывает информацию о целевой тональной компоненте сигнала полосы высоких частот. Целевая тональная компонента относится к тональной компоненту, полученной посредством второго кодирования сигнала полосы высоких частот. Например, целевая тональная компонента может конкретно относиться к одному или более тональным компонентам в сигнале полосы высоких частот. В этом варианте осуществления настоящей заявки имеется множество типов информации о целевой тональной компоненте. Например, информация о целевой тональной компоненте может включать в себя информацию о местоположении, информацию о количестве и информацию об амплитуде или информацию об энергии целевой тональной компоненты. В целевую тональную компоненту может быть включена только одна информация об амплитуде или информация об энергии. Например, информация о целевой тональной компоненте может включать в себя информацию о местоположении, информацию о количестве и информацию об амплитуде целевой тональной компоненты. В другом примере информация о целевой тональной компоненте может включать в себя информацию о местоположении, информацию о количестве и информацию об энергии целевой тональной компоненты.

В некоторых вариантах осуществления настоящей заявки второй параметр кодирования включает в себя параметр местоположения-количества целевой тональной компоненты и параметр амплитуды или параметр энергии целевой тональной компоненты. Параметр местоположения-количества указывает информацию о местоположении и информацию о количестве целевой тональной компоненты сигнала полосы высоких частот, параметр амплитуды указывает информацию об амплитуде целевой тональной компоненты сигнала полосы высоких частот, и параметр энергии указывает информацию об энергии целевой тональной компоненты сигнала полосы высоких частот.

Например, второй параметр кодирования включает в себя параметр местоположения-количества тональной компоненты и параметр амплитуды или параметр энергии тональной компоненты. Параметр местоположения-количества представляет то, что местоположение тональной компоненты и количество тональных компонент представлены одним и тем же параметром. В другой реализации второй параметр кодирования включает в себя параметр местоположения тональной компоненты, параметр количества тональных компонент и параметр амплитуды или параметр энергии тональной компоненты. В этом случае местоположение тональной компоненты и количество тональных компонент могут быть представлены с использованием разных параметров.

В конкретной реализации полоса высоких частот, соответствующая сигналу полосы высоких частот, включает в себя по меньшей мере одну частотную область, и по меньшей мере одна частотная область включает в себя текущую частотную область. Параметр местоположения-количества целевой тональной компоненты текущей частотной области и параметр амплитуды или параметр энергии целевой тональной компоненты текущей частотной области определяются на основе сигнала полосы высоких частот текущей частотной области по меньшей мере в одной частотной области и флага резервирования спектра каждого частотного бина в текущей частотной области.

Например, фильтрация пиков выполняется над информацией о пиках в текущей частотной области на основе флага резервирования спектра каждого частотного бина в текущей частотной области для получения информации о тональном компоненте-кандидате в текущей частотной области. Информация о тональном компоненте-кандидате включает в себя информацию о количестве, информацию о местоположении и информацию об амплитуде или информацию об энергии тональной компоненты-кандидата. Например, информация о количестве тональной компоненты-кандидата может быть информацией о количестве пиков после фильтрации пиков, информация о местоположении тональной компоненты-кандидата может быть информацией о местоположении пика после фильтрации пиков, информация об амплитуде тональной компоненты-кандидата может быть информацией об амплитуде пика после фильтрации пиков, и информация об энергии тональной компоненты-кандидата может быть информацией об энергии пика после фильтрации пиков. Параметр местоположения-количества и параметр амплитуды или параметр энергии целевой тональной компоненты текущей частотной области могут быть получены на основе информации о тональном компоненте-кандидате.

В частности, информация о тональном компоненте-кандидате включает в себя информацию о количестве, информацию о местоположении и информацию об амплитуде или информацию об энергии тональной компоненты-кандидата. Например, информация о количестве, информация о местоположении и информация об амплитуде или информация об энергии тональной компоненты-кандидата используются в качестве информации о количестве, информации о местоположении и информации об амплитуде или информации об энергии целевой тональной компоненты в текущей частотной области. Параметр местоположения-количества и параметр амплитуды или параметр энергии целевой тональной компоненты текущей частотной области получают на основе информации о количестве, информации о местоположении, информации об амплитуде или информации об энергии целевой тональной компоненты текущей частотной области.

В качестве другого примера, другая обработка может выполняться на основе информации о количестве, информации о местоположении и информации об амплитуде или информации об энергии тональной компоненты-кандидата для получения информации об обработанном количестве, информации о местоположении и информации об амплитуде или информации об энергии тональной компоненты-кандидата. Обработанная информация о количестве, информация о местоположении и информация об амплитуде или информация об энергии тональной компоненты-кандидата используются в качестве информации о количестве, информации о местоположении и информации об амплитуде или информации об энергии целевой тональной компоненты в текущей частотной области. Параметр местоположения-количества и параметр амплитуды или параметр энергии целевой тональной компоненты текущей частотной области получают на основе информации о количестве, информации о местоположении, информации об амплитуде или информации об энергии целевой тональной компоненты текущей частотной области. Другой обработкой может быть одна или несколько обработок, таких как комбинированная обработка, фильтрация по количеству и коррекция межкадровой непрерывности. То, следует ли выполнять другую обработку, тип, включенный в другую обработку, и способ обработки не ограничены в этом варианте осуществления настоящей заявки.

405: Выполнить мультиплексирование битового потока для первого параметра кодирования и второго параметра кодирования, чтобы получить кодированный битовый поток.

В предыдущем варианте осуществления устройство кодирования аудио получает первый параметр кодирования на этапе 402, получает второй параметр кодирования на этапе 404 и, наконец, выполняет мультиплексирование битового потока для первого параметра кодирования и второго параметра кодирования для получения кодированного битового потока. Например, кодированный битовый поток может быть битовым потоком полезной нагрузки. Битовый поток полезной нагрузки может нести конкретную информацию о каждом кадре аудиосигнала, например, может нести информацию о тональном компоненте каждого кадра.

В некоторых вариантах осуществления настоящей заявки кодированный битовый поток может дополнительно включать в себя битовый поток конфигурации, и битовый поток конфигурации может нести информацию о конфигурации, совместно используемую всеми кадрами в аудиосигнале. Битовый поток полезной нагрузки и битовый поток конфигурации могут быть независимыми друг от друга или могут быть включены в один и тот же битовый поток, то есть битовый поток полезной нагрузки и битовый поток конфигурации могут быть разными частями одного и того же битового потока.

Например, мультиплексирование битового потока выполняется для первого параметра кодирования и второго параметра кодирования, чтобы получить кодированный битовый поток. В соответствии с устройством кодирования аудио в настоящей заявке определяется информация флага резервирования спектра кодирования с расширением полосы пропускания, и в процессе получения второго параметра кодирования избегают повторного кодирования тональной компоненты, уже зарезервированной при кодировании с расширением полосы пропускания, на основе информации о флаге резервирования спектра каждого частотного бина сигнала полосы высоких частот. Это позволяет повысить эффективность кодирования тональных компонент.

Устройство кодирования аудио отправляет кодированный битовый поток в устройство декодирования аудио, и устройство декодирования аудио выполняет демультиплексирование кодированного битового потока для получения параметра кодирования, а также точного получения текущего кадра аудиосигнала.

Из примерного описания настоящей заявки с использованием вышеизложенного варианта осуществления можно узнать, что получается текущий кадр аудиосигнала, где текущий кадр включает в себя сигнал полосы высоких частот и сигнал полосы низких частот; первое кодирование выполняется над сигналом полосы высоких частот и сигналом полосы низких частот для получения первого параметра кодирования текущего кадра, где первое кодирование включает в себя кодирование с расширением полосы пропускания; определяется флаг резервирования спектра каждого частотного бина сигнала полосы высоких частот, где флаг резервирования спектра указывает то, зарезервирован ли первый спектр, соответствующий частотному бину, во втором спектре, соответствующем частотному бину, первый спектр является спектром сигнала полосы высоких частот, соответствующим частотному бину перед кодированием с расширением полосы пропускания, и второй спектр является спектром сигнала полосы высоких частот, соответствующим частотному бину после кодирования с расширением полосы пропускания; второе кодирование выполняется над сигналом полосы высоких частот на основе флага резервирования спектра каждого частотного бина сигнала полосы высоких частот для получения второго параметра кодирования текущего кадра, где второй параметр кодирования указывает информацию о целевой тональной компоненте сигнала полосы высоких частот, и информация о целевой тональной компоненте включает в себя информацию о местоположении, информацию о количестве и информацию об амплитуде или информацию об энергии целевой тональной компоненты; и мультиплексирование битового потока выполняется для первого параметра кодирования и второго параметра кодирования для получения кодированного битового потока. В этом варианте осуществления настоящей заявки процесс первого кодирования включает в себя кодирование с расширением полосы пропускания. Флаг резервирования спектра каждого частотного бина сигнала полосы высоких частот может быть определен на основе спектров сигнала полосы высоких частот перед и после кодирования с расширением полосы пропускания и частотного диапазона кодирования с расширением полосы пропускания. То, зарезервировано ли значение спектра одного или более частотных бинов сигнала полосы высоких частот перед кодированием с расширением полосы пропускания после кодирования с расширением полосы пропускания, указывается с использованием флага резервирования спектра. Второе кодирование выполняется над сигналом полосы высоких частот на основе флага резервирования спектра каждого частотного бина сигнала полосы высоких частот, и флаг резервирования спектра каждого частотного бина сигнала полосы высоких частот может использоваться для того, чтобы предотвратить повторное кодирование тональной компоненты, уже зарезервированной при кодировании с расширением полосы пропускания. Это позволяет повысить эффективность кодирования тональных компонент.

Далее обратимся к некоторым другим вариантам осуществления, представленным в настоящей заявке. Как показано на фиг.5, полоса высоких частот, соответствующая сигналу полосы высоких частот, включает в себя по меньшей мере одну частотную область, и выполнение второго кодирования сигнала полосы высоких частот на основе флага резервирования спектра каждого частотного бина сигнала полосы высоких частот для получения второго параметра кодирования текущего кадра на этапе 404 включает в себя следующие этапы.

4041: Выполнить поиск пиков на основе сигнала полосы высоких частот текущей частотной области для получения информации о пиках в текущей частотной области, где информация о пиках в текущей частотной области включает в себя информацию о количестве пиков, информацию о местоположении пика и информацию об амплитуде пика или информацию об энергии пика в текущей частотной области.

Устройство кодирования аудио может выполнять поиск пиков на основе сигнала полосы высоких частот текущей частотной области. Например, поиск выполняется в текущей частотной области на предмет наличия пиков. Информация о количестве пиков, информация о местоположении пика и информация об амплитуде или информация об энергии пика в текущей частотной области могут быть получены путем поиска пика.

В частности, спектральная плотность мощности сигнала полосы высоких частот текущей частотной области может быть получен на основе сигнала полосы высоких частот текущей частотной области. Пик спектральной плотности мощности ищется на основе спектральной плотности мощности сигнала полосы высоких частот текущей частотной области (текущей области для краткости). Количество пиков используется в качестве информации о количестве пиков в текущей области, порядковый номер частотного бина, соответствующий пику, используется в качестве информации о местоположении пика в текущей области, и амплитуда или энергия пика используется в качестве информации об амплитуде или информация об энергии пика в текущей области. В качестве альтернативы, отношение спектральных плотностей мощности текущего частотного бина в текущей частотной области может быть получено на основе сигнала полосы высоких частот текущей частотной области, где отношение спектральных плотностей мощности текущего частотного бина представляет собой отношение значения спектральной плотности мощности текущего частотного бина к среднему значению спектральных плотностей мощности текущей частотной области. Поиск пиков выполняется в текущей частотной области на основе отношения спектральных плотностей мощности текущего частотного бина для получения информации о количестве пиков, информации о местоположении пика, информации об амплитуде пика или информации об энергии пика в текущей частотной области. Информация об энергии или информация об амплитуде включает в себя отношение спектральных плотностей мощности. Например, отношение спектральных плотностей мощности пиков представляет собой отношение значения спектральной плотности мощности частотного бина, соответствующего местоположению пика, к среднему значению спектральной плотности мощности в текущей частотной области. Конечно, в этом варианте осуществления настоящей заявки поиск пиков также может выполняться другим способом для получения информации о количестве пиков, информации о местоположении пика и информации об амплитуде или информации об энергии пика в текущей области. Этот случай не ограничивается этим вариантом осуществления настоящей заявки.

В варианте осуществления настоящей заявки устройство кодирования аудио может сохранять информацию о местоположении пика и информацию об энергии пика в текущей частотной области в массивах peak_idx и peak_val, соответственно, и сохранять информацию о количестве пиков в текущей частотной области в peak_cnt.

Сигнал полосы высоких частот, в отношении которого выполняется поиск пиков, может быть сигналом в частотной области или может быть сигналом во временной области.

В частности, в реализации поиск пиков может конкретно выполняться на основе по меньшей мере одного из: спектральной плотности мощности, энергетического спектра или амплитудного спектра текущей частотной области.

4042: Выполнение фильтрации пиков над информацией о пиках в текущей частотной области на основе флага резервирования спектра каждого частотного бина в текущей частотной области для получения информации о тональном компоненте-кандидате в текущей частотной области.

Устройство кодирования аудио может получать, на основе информации о флаге резервирования спектра каждого частотного бина в текущей частотной области и информации о количестве пиков, информацию о местоположении пика и информацию об амплитуде или информацию об энергии пика в текущей частотной области, информацию о количестве отфильтрованных пиков, информацию о местоположении пика и информацию об амплитуде или информацию об энергии пика в текущей частотной области. Информация о количестве отфильтрованных пиков, информация о местоположении пика и информация об амплитуде или информация об энергии пика является информацией о тональном компоненте-кандидате в текущей частотной области.

Например, информация об амплитуде или информация об энергии пика может включать в себя отношение значений энергии пика или отношение значений спектральной плотности мощности пика. Устройство кодирования аудио может также получать другую информацию, представляющую энергию или амплитуду пика при поиске пика, например, значение спектральной плотности мощности частотного бина, соответствующего местоположению пика. Отношение спектральных плотностей мощности пика представляет собой отношение значения спектральной плотности мощности пика к среднему значению спектральных плотностей мощности текущей частотной области, то есть отношение значения спектральной плотности мощности частотного бина, соответствующего местоположению пика, к среднему значению спектральных плотностей мощности текущей частотной области. Аналогичным образом, отношение спектральных плотностей мощности тональной компоненты-кандидата представляет собой отношение значения спектральной плотности мощности тональной компоненты-кандидата к среднему значению спектральных плотностей мощности в текущей частотной области, то есть отношение значения спектральной плотности мощности частотного бина, соответствующего положению тональной компоненты-кандидата, к среднему значению спектральных плотностей мощности текущей частотной области.

Следует отметить, что в этом варианте осуществления настоящей заявки фильтрация пиков может выполняться непосредственно на основе флага резервирования спектра каждого частотного бина в текущей частотной области для получения тональной компоненты-кандидата в текущей частотной области. В качестве альтернативы, флаг резервирования спектра каждой подполосы текущей частотной области может быть определен на основе флага резервирования спектра каждого частотного бина в текущей частотной области, и затем выполняется фильтрация пиков на основе флага резервирования спектра каждой подполосы текущей частотной области. Подробности смотри в примерах последующих вариантов осуществления.

4043: Получить информацию о целевой тональной компоненте текущей частотной области на основе информации о тональном компоненте-кандидате текущей частотной области.

После получения информации о тональном компоненте-кандидате в текущей частотной области устройство кодирования аудио может выполнять обработку на основе информации о тональном компоненте-кандидате в текущей частотной области для получения информации о целевой тональной компоненте текущей частотной области. Целевая тональная компонента может быть тональной компонентой, полученной после объединения тональных компонент-кандидатов, целевая тональная компонента может быть тональной компонентой, полученной после фильтрации по количеству возможных тональных компонент, и целевая тональная компонента может быть тональной компонентой, полученной после выполнения обработки межкадровой непрерывности над тональными компонентами-кандидатами. Реализация получения целевой тональной компоненты здесь не ограничивается.

4044: Получить второй параметр кодирования текущей частотной области на основе информации о целевой тональной компоненте текущей частотной области.

В этом варианте осуществления настоящей заявки устройство кодирования аудио может получить второй параметр кодирования текущей частотной области на основе информации о целевой тональной компоненте текущей частотной области, где второй параметр кодирования включает в себя параметр местоположения-количества и параметр амплитуды или параметр энергии целевой тональной компоненты. Параметр местоположения-количества указывает информацию о местоположении и информацию о количестве целевой тональной компоненты сигнала полосы высоких частот, параметр амплитуды указывает информацию об амплитуде целевой тональной компоненты сигнала полосы высоких частот, и параметр энергии указывает информацию об энергии целевой тональной компоненты сигнала полосы высоких частот.

Из вышеприведенных описаний этапов с 4041 по 4044 можно понять, что в этом варианте осуществления настоящей заявки фильтрация пиков выполняется над информацией о пиках в текущей частотной области на основе флага резервирования спектра каждого частотного бина в текущей частотной области для получения информации о тональном компоненте-кандидате в текущей частотной области. Флаг резервирования спектра каждого частотного бина сигнала полосы высоких частот может использоваться для того, чтобы предотвратить повторное кодирование тональной компоненты, уже зарезервированной при кодировании с расширением полосы пропускания. Это позволяет повысить эффективность кодирования тональных компонент.

Далее обратимся к некоторым другим вариантам осуществления, представленным в настоящей заявке. Полоса высоких частот, соответствующая сигналу полосы высоких частот, включает в себя по меньшей мере одну частотную область, и одна частотная область включает в себя по меньшей мере одну подполосу. Как показано на фиг.6, выполнение фильтрации пиков над информацией о пиках в текущей частотной области на основе флага резервирования спектра каждого частотного бина в текущей частотной области для получения информации о тональном компоненте-кандидате в текущей частотной области на предыдущем этапе 4042 включает в себя следующие этапы.

601: Получить флаг резервирования спектра каждой подполосы текущей частотной области на основе флага резервирования спектра каждого частотного бина в текущей частотной области.

Полоса высоких частот, соответствующая сигналу полосы высоких частот, включает в себя по меньшей мере одну частотную область, и одна частотная область включает в себя по меньшей мере одну подполосу. Устройство кодирования аудио может определить значение флага резервирования спектра каждого частотного бина на основе флага резервирования спектра для каждого частотного бина в текущей частотной области. Частотный бин в текущей частотной области может принадлежать определенной подполосе. Таким образом, значение флага резервирования спектра подполосы может быть определено на основе значения флага резервирования спектра частотного бина в подполосе. Вышеупомянутым способом устройство кодирования аудио может получить флаг резервирования спектра каждой подполосы текущей частотной области.

Кроме того, в некоторых вариантах осуществления настоящей заявки получение флага резервирования спектра каждой подполосы текущей частотной области на основе флага резервирования спектра каждого частотного бина в текущей частотной области на предыдущем этапе 601 включает в себя:

если количество частотных бинов, которые находятся в текущей подполосе, и чьи значения флагов резервирования спектра равны второму заданному значению, больше заданного порогового значения, определение того, что значение флага резервирования спектра текущей подполосы является первым флагом значение, где, если значение спектра, соответствующее частотному бину перед кодированием с расширением полосы пропускания, и значение спектра, соответствующее частотному бину после кодирования с расширением полосы пропускания, удовлетворяют заданному условию, значение флага резервирования спектра для частотного бина равно второму заданному значению; или

если количество частотных бинов, которые находятся в текущей подполосе, и чьи значения флагов резервирования спектра равны второму заданному значению, меньше или равно заданному пороговому значению, определение того, что значение флага резервирования спектра текущей подполосы равно второму значению флага.

Первое значение флага указывает то, что количество частотных бинов, которые находятся в текущей подполосе, и чьи значения флагов резервирования спектра равны второму заданному значению, больше заданного порогового значения. Если значение спектра, соответствующее частотному бину перед кодированием с расширением полосы пропускания, и значение спектра, соответствующее частотному бину после кодирования с расширением полосы пропускания, удовлетворяют заданному условию, значение флага резервирования спектра для частотного бина равно второму заданному значению, и частотный бин является частотным бином в текущей подполосе. Второе значение флага указывает то, что количество частотных бинов, которые находятся в текущей подполосе, и чьи значения флагов резервирования спектра равны второму заданному значению, меньше или равно заданному пороговому значению.

Флаг резервирования спектра текущей подполосы может иметь множество значений. Например, флаг резервирования спектра текущей подполосы является первым значением флага, или флаг резервирования спектра текущей подполосы является вторым значением флага, которое может быть специально определено на основе количества частотных бинов, которые находятся в текущей подполосе, и чьи значения флагов резервирования спектра равны второму заданному значению. Конкретные значения первого значения флага и второго значения флага не ограничены в этом варианте осуществления настоящей заявки.

В некоторых вариантах осуществления настоящей заявки заданное условие включает в себя: Значение спектра, соответствующее частотному бину перед кодированием с расширением полосы пропускания, равно значению спектра, соответствующему частотному бину после кодирования с расширением полосы пропускания.

В частности, заданное условие может состоять в том, что значение спектра, соответствующее частотному бину перед кодированием с расширением полосы пропускания, равно значению спектра, соответствующему частотному бину после кодирования с расширением полосы пропускания. Заданным условием может быть то, что значение спектра не изменяется перед и после кодирования с расширением полосы пропускания, то есть значение спектра, соответствующее частотному бину перед кодированием с расширением полосы пропускания, равно значению спектра, соответствующему частотному бину после кодирования с расширением полосы пропускания. В качестве другого примера, заданное условие может также состоять в том, что абсолютное значение разности между значением спектра, соответствующим частотному бину перед кодированием с расширением полосы пропускания, и значением спектра, соответствующим частотному бину после кодирования с расширением полосы пропускания, меньше или равно заданному пороговому значению. Заданное условие основано на том, что может существовать некоторая разность между значениями спектра перед и после кодирования с расширением полосы пропускания, но информация о спектре зарезервирована, то есть разность между значением спектра, соответствующим частотному бину перед кодированием с расширением полосы пропускания, и значением спектра, соответствующим частотному бину после кодирования с расширением полосы пропускания меньше заданного порогового значения. В этом варианте осуществления настоящей заявки флаг резервирования спектра каждого частотного бина сигнала полосы высоких частот определяется путем определения заданного условия. Основываясь на флаге резервирования спектра каждого частотного бина сигнала полосы высоких частот можно избежать повторного кодирования тональной компоненты, уже зарезервированной при кодировании с расширением полосы пропускания. Это позволяет повысить эффективность кодирования тональных компонент.

Например, значение флага резервирования спектра, соответствующего частотному бину, который не принадлежит частотному диапазону кодирования с расширением полосы пропускания, устанавливается равным первому заданному значению. Для частотного бина, который принадлежит частотному диапазону кодирования с расширением полосы пропускания, если значение спектра, соответствующее частотному бину перед кодированием с расширением полосы пропускания, равно значению спектра, соответствующему частотному бину после кодирования с расширением полосы пропускания, значение флага резервирования спектра частотного бина устанавливается на второе заданное значение. Если значение спектра, соответствующее частотному бину перед кодированием с расширением полосы пропускания, не равно значению спектра, соответствующему частотному бину после кодирования с расширением полосы пропускания, значение флага резервирования спектра частотного бина устанавливается равным третьему заданному значению.

Например, в способе получения флага резервирования спектра каждой подполосы текущей частотной области, в частности, флаг резервирования спектра текущей подполосы может быть определен на основе флагов резервирования спектра всех частотных бинов в текущей подполосе. Например, если количество частотных бинов, которые находятся в текущей подполосе, и чьи значения флагов резервирования спектра равны второму заданному значению, больше заданного порогового значения, флаг резервирования спектра текущей подполосы равен 1. В противном случае флаг резервирования спектра текущей подполосы равен 0.

В конкретном варианте осуществления информация флага резервирования спектра кодирования с расширением полосы пропускания обозначается как igfActivityMask, и флаг резервирования спектра каждой подполосы текущей частотной области (фрагмента) обозначается как subband_enc_flag[num_subband], где num_subband равно количеству подполос текущей частотной области (тайла). Способ получения subband_enc_flag включает в себя следующие этапы.

Этап 1: Определить количество подполос.

Для p-го тайла вычисляется количество num_subband подполос, включенных в тайл:

num_subband=tile_width[p]/tone_res[p].

tone_res [p] представляет собой разрешение в частотной области (то есть ширину подполосы) подполосы в p-й частотной области, и tile_width представляет собой ширину p-го тайла (количество частотных бинов, включенных в p-й диапазон частот). Процесс расчета выглядит следующим образом:

tile_width=tile[p+1]-tile[p].

tile[p] и tile[p+1] представляют собой порядковыми номерами интервалов начальной частоты p-го фрагмента и (p+1)-го фрагмента, соответственно.

Этап 2: Получить флаг резервирования спектра для каждой подполосы.

Предполагается, что то, зарезервирован ли спектр в каждой подполосе, помечен как subband_enc_flag[num_subband], и псевдокод для получения этого параметра выглядит следующим образом:

for i = 0 to num_subband–1:

cntEnc = 0

startIdx = tile[p] + tone_res[p]*i

stopIdx = tile[p] + tone_res[p]*(i+1)

for j = startIdx to stopIdx–1:

cntEnc += igfActivityMask[j]

end

if cntEnc > 0:

subband_enc_flag[i] = 1

end

end

cntEnc представляет собой счетчик резервирования спектра и используется для подсчета частотных бинов в i-й подполосе в p-й частотной области, и чье значение флага igfActivityMask резервирования спектра равно второму заданному значению, startIdx представляет собой начальный порядковый номер частотного бина i-й подполосы, и stopIdx представляет собой начальный порядковый номер частотного бина (i+1)-й подполосы.

Псевдокод для получения параметра subband_enc_flag может также представлен следующим образом:

for i = 0 to num_subband–1:

cntEnc = 0

startIdx = tile[p] + tone_res[p]*i

stopIdx = tile[p] + tone_res[p]*(i+1)

for j = startIdx to stopIdx–1:

if igfActivityMask[j]== IGF_Activity

cntEnc ++;

end

end

if cntEnc > Th1:

subband_enc_flag[i] = 1

end

end

Значение IGF_Activity равно второму заданному значению, и в этом варианте осуществления значение IGF_Activity установлено равным 1. Параметр Th1 является заданным порогом, и в этом варианте осуществления он установлен на 0.

602: Выполнить фильтрацию пиков над информацией о пиках в текущей частотной области на основе флага резервирования спектра каждой подполосы текущей частотной области для получения информации о тональном компоненте-кандидате в текущей частотной области.

В этом варианте осуществления настоящей заявки фильтрация пиков на предыдущем этапе 4042 также может выполняться на основе подполосы. Таким образом, устройство кодирования аудио может выполнять фильтрацию пиков над информацией о пиках в текущей частотной области на основе флага резервирования спектра каждой подполосы текущей частотной области.

Например, на основе информации о флаге резервирования спектра каждого частотного бина в текущей частотной области и информации о количестве пиков, информации о местоположении пика и информации об амплитуде или информации об энергии пика в текущей частотной области, получают информацию об экранированном количестве пика, информацию о местоположении пика и информацию об амплитуде или информацию об энергии пика в текущей частотной области. Например, флаг резервирования спектра каждой подполосы текущей частотной области получается на основе флага резервирования спектра каждого частотного бина в текущей частотной области. Основываясь на флаге резервирования спектра каждого частотного бина в текущей частотной области и информации о количестве пиков, информации о местоположении пика и информации об амплитуде или информации об энергии пика в текущей частотной области, получают информацию о количестве отфильтрованных пиков, информацию о местоположении пика и информацию об амплитуде или информацию об энергии пика в текущей частотной области.

Кроме того, в некоторых вариантах осуществления настоящей заявки выполнение скрининга пиков над информацией о пиках в текущей частотной области на основе флага резервирования спектра каждой подполосы текущей частотной области для получения информации о тональном компоненте-кандидате текущей частотной области на предыдущем этапе 602 включает в себя следующие этапы.

A1: Получить, на основе информации о местоположении пика в текущей частотной области, порядкового номера подполосы, соответствующего местоположению пика в текущей частотной области.

A2: Выполнить фильтрацию пиков над информацией о пиках в текущей частотной области на основе порядкового номера подполосы, соответствующего местоположению пика в текущей частотной области, и флага резервирования спектра каждой подполосы в текущей частотной области. для получения информации о тональном компоненте-кандидате в текущей частотной области.

Фильтрация пиков выполняется над информацией о пиках в текущей частотной области на основе порядкового номера подполосы, соответствующего местоположению пика в текущей частотной области, и флага резервирования спектра каждой подполосы в текущей частотной области для получения информации об экранированном количестве пика, информации о местоположении пика и информации об амплитуде или информации об энергии пика в текущей частотной области в качестве информации о тональном компоненте-кандидате в текущей частотной области.

Кроме того, в некоторых вариантах осуществления настоящей заявки, если значение флага резервирования спектра текущей подполосы равно второму значению флага, пик в текущей подполосе является тональной компонентой-кандидатом. Второе значение флага указывает то, что количество частотных бинов, которые находятся в текущей подполосе, и чьи значения флагов резервирования спектра равны второму заданному значению, меньше или равно заданному пороговому значению. Если значение флага резервирования спектра текущей подполосы равно второму значению флага, это указывает то, что спектр текущей подполосы не резервируется при кодировании с расширением полосы пропускания. Таким образом, тональный компонент-кандидат может быть определен тогда, когда значение флага резервирования спектра текущей подполосы равно второму значению флага.

В частности, если флаг резервирования спектра, соответствующий порядковому номеру первой подполосы, соответствующему местоположению пика в текущей частотной области, имеет второе значение флага, можно определить, что информация о тональном компоненте-кандидате текущего частотная область не включает в себя: информацию о местоположении и информацию об амплитуде или информацию об энергии пика, соответствующего порядковому номеру первой подполосы. В качестве альтернативы, если флаг резервирования спектра, соответствующий второму порядковому номеру подполосы, соответствующему местоположению пика в текущей частотной области, имеет второе значение флага, можно определить то, что информация о местоположении тональной компоненты-кандидата в текущей частотной области включает в себя информацию о местоположении пика, соответствующего второму порядковому номеру подполосы, информацию об амплитуде или информацию об энергии тональной компоненты-кандидата текущей частотной области, включает в себя информацию об амплитуде или информацию об энергии пика, соответствующего второму порядковому номеру подполосы, и информация о количестве тональной компоненты-кандидата в текущей частотной области представляет собой общее количество пиков во всех подполосах, которые относятся к текущей частотной области и чьи значения флага резервирования спектра равны второму значению флага.

Например, получение информации о количестве отфильтрованных пиков, информации о местоположении пика и информации об амплитуде или информации об энергии пика в текущей частотной области на основе порядкового номера подполосы, соответствующего местоположению пика в текущей частотной области и флага резервирования спектра каждой подполосы текущей частотной области может представлять собой, в частности, следующее: если флаг резервирования спектра подполосы, соответствующий порядковому номеру подполосы, соответствующему местоположению пика в текущей частотной области, равен 1, информация о местоположении пика и соответствующая информация об амплитуде или энергии пика удаляются из результата поиска пика.

В противном случае информация о местоположении пика и соответствующая информация об амплитуде или энергии пика резервируются. Резервная информация о местоположении и информация об амплитуде или энергии пика составляют информацию о местоположении отфильтрованного пика и информацию об амплитуде пика или информацию об энергии пика. Информация о количестве отфильтрованных пиков представляет собой количество пиков в текущей частотной области за вычетом количества удаленных пиков.

В конкретном варианте осуществления, в текущей частотной области, для пиков спектральной плотности мощности Peak_cnt, полученных в ходе поиска пиков, последовательно определяется порядковый номер subband_idx подполосы, в котором расположена каждая информация Peak_idx о местоположении пика. Если в подполосе существует резервный спектр (то есть subband_enc_flag[subband_idx]==1), пик удаляется. Количество пиков, удаленных из текущей частотной области, обозначается как peak_cnt_remove, и количество пиков, обработанных на этом этапе, обновляется peak_cnt=peak_cnt–peak_cnt_remove.

В этом варианте осуществления настоящей заявки флаг резервирования спектра каждой подполосы текущей частотной области может использоваться для того, чтобы предотвратить повторное кодирование тональной компоненты, уже зарезервированной при кодировании с расширением полосы пропускания. Это позволяет повысить эффективность кодирования тональных компонент.

Способ кодирования аудио, выполняемый устройством кодирования аудио, описан в предыдущем варианте осуществления. Ниже приведено описание способа декодирования аудио, выполняемого устройством декодирования аудио, предусмотренным в варианте осуществления настоящей заявки. Как показано на фиг.7, способ в основном включает в себя следующие этапы.

701: Получить кодированный битовый поток.

Кодированный битовый поток отправляется устройством кодирования аудио в устройство декодирования аудио.

702: Выполнить битовый поток демультиплексирование кодированного битового потока для получения первого параметра кодирования текущего кадра аудиосигнала и второго параметра кодирования текущего кадра.

В отношении первого параметра кодирования и второго параметра кодирования следует обратиться к вышеупомянутому способу кодирования аудио. Подробности здесь повторно не описываются.

703: Получить первый сигнал полосы высоких частот текущего кадра и первый сигнал полосы низких частот текущего кадра на основе первого параметра кодирования.

Первый сигнал полосы высоких частот может включать в себя по меньшей мере один из: декодированного сигнала полосы высоких частот, полученного посредством прямого декодирования на основе первого параметра кодирования, и сигнала с расширенной полосой высоких частот, полученного путем расширения полосы частот на основе первого сигнала полосы низких частот.

704: Получить второй сигнал полосы высоких частот текущего кадра на основе второго параметра кодирования, где второй сигнал полосы высоких частот включает в себя восстановленный тональный сигнал.

Второй параметр кодирования может включать в себя информацию о тональном компоненте сигнала полосы высоких частот. Например, второй параметр кодирования текущего кадра включает в себя параметр местоположения-количества тональной компоненты и параметр амплитуды или параметр энергии тональной компоненты. В другом примере второй параметр кодирования текущего кадра включает в себя параметр местоположения и параметр количества тональных компонент и параметр амплитуды или параметр энергии тональной компоненты. В отношении второго параметра кодирования текущего кадра следует обратиться к способу кодирования. Подробности здесь повторно не описываются.

Аналогичным процедуре обработки на стороне кодера, в процедуре обработки на стороне декодера процесс получения восстановленного сигнала полосы высоких частот текущего кадра на основе второго параметра кодирования также выполняется на основе разделения на частотные области и/или разделения на подполосы полосы высоких частот. Полоса высоких частот, соответствующая сигналу полосы высоких частот, включает в себя по меньшей мере одну частотную область, и одна из таких частотных областей включает в себя по меньшей мере одну подполосу. Количество частотных областей второго параметра кодирования, которое необходимо определить, может быть задано заранее или может быть получено из битового потока. Здесь для дальнейшего описания используется пример, в котором восстановленный сигнал полосы высоких частот текущего кадра получается на основе параметра местоположения-количества тональной компоненты и параметра амплитуды тональной компоненты в частотной области. Детали могут быть следующими:

определить местоположение тональной компоненты текущей частотной области на основе параметра местоположения-количества тональной компоненты текущей частотной области;

определить, на основе параметра амплитуды или параметра энергии тональной компоненты текущей частотной области, амплитуду или энергию, соответствующую местоположению тональной компоненты;

получить восстановленный тональный сигнал на основе местоположения тональной компоненты в текущей частотной области и амплитуды или энергии, соответствующей местоположению тональной компоненты; и

получить восстановленный сигнал полосы высоких частот на основе восстановленного тонального сигнала.

705: Получить декодированный сигнал текущего кадра на основе первого сигнала полосы низких частот, первого сигнала полосы высоких частот и второго сигнала полосы высоких частот текущего кадра.

В этом варианте осуществления настоящей заявки определяется информация о флаге резервирования спектра каждого частотного бина сигнала полосы высоких частот. В процессе получения второго параметра кодирования информация о количестве пиков, информация о местоположении пика и информация об амплитуде или информация об энергии пика сигнала полосы высоких частот фильтруются на основе информации о флаге резервирования спектра каждого частотного бина сигнала полосы высоких частот, во избежание повторного кодирования тональной компоненты, уже зарезервированной при кодировании с расширением полосы пропускания. Это позволяет повысить эффективность кодирования тональных компонент. На стороне соответствующего декодера сигнал полосы высоких частот, зарезервированный в процессе кодирования с расширением полосы пропускания, не декодируется повторно, поэтому эффективность декодирования также, соответственно, повышается.

Следует отметить, что для краткого описания вышеизложенные варианты осуществления способа представлены в виде последовательности действий. Однако специалисту в данной области техники должно быть понятно, что настоящая заявка не ограничивается описанным порядком действий, так как согласно настоящей заявке некоторые этапы могут выполняться в другом порядке или одновременно. Кроме того, специалисту в данной области техники должно быть понятно, что все варианты осуществления, описанные в этом спецификации, относятся к примерным вариантам осуществления, и настоящая заявка не обязательно требует применения описанных действий и модулей.

Чтобы лучше реализовать решения вариантов осуществления настоящей заявки, ниже дополнительно предоставлено соответствующее устройство для реализации решений.

Следует обратиться к фиг.8. Устройство 800 кодирования аудио, предусмотренное в варианте осуществления настоящей заявки, может включать в себя модуль 801 получения, первый модуль 802 кодирования, модуль 803 определения флага, второй модуль 804 кодирования и модуль 805 мультиплексирования битового потока.

Модуль получения выполнен с возможностью получения текущего кадра аудиосигнала, где текущий кадр включает в себя сигнал полосы высоких частот и сигнал полосы низких частот.

Первый модуль кодирования выполнен с возможностью выполнения первого кодирования сигнала полосы высоких частот и сигнала полосы низких частот для получения первого параметра кодирования текущего кадра, где первое кодирование включает в себя кодирование с расширением полосы пропускания.

Модуль определения флага выполнен с возможностью определения флага резервирования спектра каждого частотного бина сигнала полосы высоких частот, где флаг резервирования спектра указывает то, зарезервирован ли первый спектр, соответствующий частотному бину, во втором спектре, соответствующем частотному бину. Первый спектр включает в себя спектр, соответствующий частотному бину перед кодированием с расширением полосы пропускания, и второй спектр включает в себя спектр, соответствующий частотному бину после кодирования с расширением полосы пропускания.

Второй модуль кодирования выполнен с возможностью выполнения второго кодирования над сигналом полосы высоких частот на основе флага резервирования спектра каждого частотного бина сигнала полосы высоких частот, чтобы получить второй параметр кодирования текущего кадра. Второй параметр кодирования указывает информацию о целевой тональной компоненте сигнала полосы высоких частот, и информация о целевой тональной компоненте включает в себя информацию о местоположении, информацию о количестве и информацию об амплитуде или информацию об энергии целевой тональной компоненты.

Модуль мультиплексирования битового потока выполнен с возможностью выполнения мультиплексирования битового потока нал первым параметром кодирования и вторым параметром кодирования для получения кодированного битового потока.

В некоторых вариантах осуществления настоящей заявки модуль определения флага специально выполнен с возможностью определения флага резервирования спектра каждого частотного бина сигнала полосы высоких частот на основе первого спектра, второго спектра и диапазона частот кодирования с расширением полосы пропускания.

В некоторых вариантах осуществления настоящей заявки полоса высоких частот, соответствующая сигналу полосы высоких частот, включает в себя по меньшей мере одну частотную область, и по меньшей мере одна частотная область включает в себя текущую частотную область.

Второй модуль кодирования специально выполнен с возможностью:

выполнения поиска пика на основе сигнала полосы высоких частот текущей частотной области для получения информации о пиках в текущей частотной области, где информация о пике в текущей частотной области включает в себя информацию о количестве пиков, информацию о местоположении пика и информацию об амплитуде пика или информацию об энергии пика в текущей частотной области;

выполнения фильтрации пиков над информацией о пиках в текущей частотной области на основе флага резервирования спектра каждого частотного бина в текущей частотной области для получения информации о тональном компоненте-кандидате в текущей частотной области;

получения информации о целевой тональной компоненте текущей частотной области на основе информации о тональном компоненте-кандидате текущей частотной области; и

получения второго параметра кодирования текущей частотной области на основе информации о целевой тональной компоненте текущей частотной области.

В некоторых вариантах осуществления настоящей заявки второй параметр кодирования включает в себя параметр местоположения-количества целевой тональной компоненты и параметр амплитуды или параметр энергии целевой тональной компоненты. Параметр местоположения-количества указывает информацию о местоположении и информацию о количестве целевой тональной компоненты сигнала полосы высоких частот, параметр амплитуды указывает информацию об амплитуде целевой тональной компоненты сигнала полосы высоких частот, и параметр энергии указывает информацию об энергии целевой тональной компоненты сигнала полосы высоких частот.

В некоторых вариантах осуществления настоящей заявки полоса высоких частот, соответствующая сигналу полосы высоких частот, включает в себя по меньшей мере одну частотную область, и по меньшей мере одна частотная область включает в себя текущую частотную область.

Когда первый частотный бин в текущей частотной области не принадлежит частотному диапазону кодирования с расширением полосы пропускания, значение флага резервирования спектра первого частотного бина равно первому заданному значению флага.

В качестве альтернативы, когда второй частотный бин в текущей частотной области принадлежит частотному диапазону кодирования с расширением полосы пропускания, значение флага резервирования спектра второго частотного бина равно второму заданному значению, если значение спектра, соответствующее второму частотному бину перед кодированием с расширением полосы пропускания, и значение спектра, соответствующее второму частотному бину после кодирования с расширением полосы пропускания, удовлетворяют заданному условию; или значение флага резервирования спектра второго частотного бина равно третьему заданному значению, если значение спектра, соответствующее второму частотному бину перед кодированием с расширением полосы пропускания, и значение спектра, соответствующее второму частотному бину после кодирования с расширением полосы пропускания, не удовлетворяют заданному условию.

В некоторых вариантах осуществления настоящей заявки текущая частотная область включает в себя по меньшей мере одну подполосу, и второй модуль кодирования специально выполнен с возможностью:

получения флага резервирования спектра каждой подполосы текущей частотной области на основе флага резервирования спектра каждого частотного бина в текущей частотной области; и

выполнения фильтрации пиков над информацией о пиках в текущей частотной области на основе флага резервирования спектра каждой подполосы текущей частотной области для получения информации о тональном компоненте-кандидате в текущей частотной области.

В некоторых вариантах осуществления настоящей заявки по меньшей мере одна подполоса включает в себя текущую подполосу, и второй модуль кодирования специально выполнен с возможностью:

если количество частотных бинов, которые находятся в текущей подполосе, и чьи значения флагов резервирования спектра равны второму заданному значению, больше заданного порогового значения, определение того, что значение флага резервирования спектра текущей подполосы является первым флагом значение, где, если значение спектра, соответствующее частотному бину перед кодированием с расширением полосы пропускания, и значение спектра, соответствующее частотному бину после кодирования с расширением полосы пропускания, удовлетворяют заданному условию, значение флага резервирования спектра для частотного бина равно второму заданному значению; или

если количество частотных бинов, которые находятся в текущей подполосе, и чьи значения флагов резервирования спектра равны второму заданному значению, меньше или равно заданному пороговому значению, определение того, что значение флага резервирования спектра текущей подполосы равно второму значению флага.

В некоторых вариантах осуществления настоящей заявки второй модуль кодирования специально выполнен с возможностью:

получения, на основе информации о местоположении пика в текущей частотной области, порядкового номера подполосы, соответствующего местоположению пика в текущей частотной области; и

выполнения фильтрации пиков над информацией о пике в текущей частотной области на основе порядкового номера подполосы, соответствующего местоположению пика в текущей частотной области, и флага резервирования спектра каждой подполосы в текущей частотной области для получения информации о тональном компоненте-кандидате в текущей частотной области.

В некоторых вариантах осуществления настоящей заявки, если значение флага резервирования спектра текущей подполосы равно второму значению флага, пик в текущей подполосе является тональной компонентой-кандидатом.

В некоторых вариантах осуществления настоящей заявки заданное условие включает в себя: значение спектра, соответствующее частотному бину перед кодированием с расширением полосы пропускания, равно значению спектра, соответствующему частотному бину после кодирования с расширением полосы пропускания.

Из примера описания с использованием вышеизложенного варианта осуществления можно узнать, что получается текущий кадр аудиосигнала, где текущий кадр включает в себя сигнал полосы высоких частот и сигнал полосы низких частот; первое кодирование выполняется над сигналом полосы высоких частот и сигналом полосы низких частот для получения первого параметра кодирования текущего кадра, где первое кодирование включает в себя кодирование с расширением полосы пропускания; определяется флаг резервирования спектра каждого частотного бина сигнала полосы высоких частот, где флаг резервирования спектра указывает то, зарезервирован ли первый спектр, соответствующий частотному бину, во втором спектре, соответствующем частотному бину, первый спектр является спектром сигнала полосы высоких частот, соответствующим частотному бину перед кодированием с расширением полосы пропускания, и второй спектр является спектром сигнала полосы высоких частот, соответствующим частотному бину после кодирования с расширением полосы пропускания; второе кодирование выполняется над сигналом полосы высоких частот на основе флага резервирования спектра каждого частотного бина сигнала полосы высоких частот для получения второго параметра кодирования текущего кадра, где второй параметр кодирования указывает информацию о целевой тональной компоненте сигнала полосы высоких частот, и информация о целевой тональной компоненте включает в себя информацию о местоположении, информацию о количестве и информацию об амплитуде или информацию об энергии целевой тональной компоненты; и мультиплексирование битового потока выполняется над первым параметром кодирования и вторым параметром кодирования для получения кодированного битового потока. В этом варианте осуществления настоящей заявки процесс первого кодирования включает в себя кодирование с расширением полосы пропускания. Каждый частотный бин сигнала полосы высоких частот соответствует флагу резервирования спектра. То, зарезервирован ли спектр частотного бина сигнала полосы высоких частот перед кодированием с расширением полосы пропускания после кодирования с расширением полосы пропускания, указывается с помощью флага резервирования спектра. Второе кодирование выполняется над сигналом полосы высоких частот на основе флага резервирования спектра каждого частотного бина сигнала полосы высоких частот, и флаг резервирования спектра каждого частотного бина сигнала полосы высоких частот может использоваться для того, чтобы предотвратить повторное кодирование тональной компоненты, уже зарезервированной при кодировании с расширением полосы пропускания. Это позволяет повысить эффективность кодирования тональных компонент.

Следует отметить, что содержание, такое как обмен информацией между модулями/блоками устройства и их процессы исполнения, основано на той же идее, что и варианты осуществления способа настоящей заявки, и обеспечивает те же технические эффекты, что и варианты осуществления способа настоящей заявки. В отношении конкретного содержания следует обратиться к приведенному выше описанию вариантов осуществления способа настоящей заявки. Подробности здесь повторно не описываются.

На основе той же изобретательской концепции, что и в предыдущем способе, вариант осуществления настоящей заявки предусматривает кодер аудиосигнала. Кодер аудиосигнала выполнен с возможностью кодирования аудиосигнала и включает в себя, например, кодер, описанный в предыдущем одном или более вариантах осуществления. Устройство кодирования аудио выполнено с возможностью выполнения кодирования для выработки соответствующего битового потока.

На основе той же изобретательской концепции, что и в предыдущем способе, вариант осуществления настоящей заявки предусматривает устройство для кодирования аудиосигнала, например, устройство кодирования аудио. Как показано на фиг.9, устройство 900 кодирования аудио включает в себя: процессор 901, память 902 и интерфейс связи 903 (в устройстве 900 кодирования аудио может быть один или несколько процессоров 901, и на фиг.9 показан пример с одним процессором). В некоторых вариантах осуществления настоящей заявки процессор 901, память 902 и интерфейс 903 связи могут быть подключены через шину или другим способом. На фиг.9 показан пример подключения через шину.

Память 902 может включать в себя постоянную память и оперативную память и предоставляет инструкции и данные для процессора 901. Часть памяти 902 может дополнительно включать в себя энергонезависимую оперативную память (non-volatile random access memory, NVRAM). Память 902 хранит операционную систему и рабочие инструкции, исполняемый модуль или структуру данных, или их подмножество или их расширенный набор. Операционные инструкции могут включать в себя различные операционные инструкции для реализации различных операций. Операционная система может включать в себя различные системные программы для реализации различных основных служб и обработки аппаратных задач.

Процессор 901 управляет работой устройства кодирования аудио, и процессор 901 также может упоминаться как центральный процессор (central processing unit, CPU). В конкретном приложении компоненты устройства кодирования аудио соединены вместе с помощью шинной системы. В дополнение к шине данных система шин может дополнительно включать в себя шину питания, шину управления, шину сигналов состояния и т.п. Однако для ясности описания различные типы шин на чертежах обозначены как шинная система.

Способ, раскрытый в предыдущих вариантах осуществления настоящей заявки, может быть применен к процессору 901 или может быть реализован процессором 901. Процессор 901 может быть кристаллом с интегральными схемами и иметь возможность обработки сигналов. В процессе реализации этапы описанных выше способов могут быть реализованы с использованием аппаратной интегральной логической схемы в процессоре 901 или с использованием инструкций в виде программного обеспечения. Процессор 901 может быть процессором общего назначения, процессором цифровых сигналов (digital signal processor, DSP), специализированной интегральной схемой (application specific integrated circuit, ASIC), программируемой пользователем вентильной матрицей (field-programmable gate array, FPGA) или другим программируемым логическим устройством, логическим устройством с дискретным затвором или транзистором или дискретным аппаратным компонентом. Он позволяет реализовать или выполнять способы, этапы и логические блок-схемы, которые раскрыты в вариантах осуществления настоящей заявки. Процессор общего назначения может быть микропроцессором, любым традиционным процессором и т.п. Этапы способов, раскрытых в вариантах осуществления настоящей заявки, могут исполняться и выполняться непосредственно с помощью аппаратного процессора декодирования или могут исполняться и выполняться с использованием комбинации аппаратных и программных модулей в процессоре декодирования. Программный модуль может быть расположен на традиционном носителе данных, известном в уровне техники, таком как оперативная память, флэш-память, постоянная память, программируемая постоянная память, электрически стираемая программируемая память или регистр. Носитель информации находится в памяти 902, и процессор 901 считывает информацию из памяти 902 и выполняет этапы вышеизложенных способов в сочетании с аппаратными средствами процессора 901.

Интерфейс связи 903 может быть выполнен с возможностью приема или отправки цифровой или буквенно-цифровой информации, например, может быть интерфейсом ввода/вывода, контактным выводом или схемой. Например, вышеупомянутый кодированный битовый поток отправляется через интерфейс 903 связи.

Основываясь на той же изобретательской концепции, что и в предыдущем способе, вариант осуществления настоящей заявки предусматривает устройство кодирования аудио, включающее в себя энергонезависимую память и процессор, которые соединены друг с другом. Процессор вызывает программный код, хранящийся в памяти, для выполнения части или всех этапов способа кодирования аудиосигнала в вышеупомянутом одном или более вариантах осуществления.

Основываясь на той же изобретательской концепции, что и в предыдущем способе, вариант осуществления настоящей заявки предусматривает машиночитаемый носитель данных. Машиночитаемый носитель данных хранит программный код, и программный код включает в себя инструкции для выполнения части или всех этапов способа кодирования аудиосигнала в вышеупомянутом одном или более вариантах осуществления.

Основываясь на той же изобретательской концепции, что и в предыдущем способе, вариант осуществления настоящей заявки предусматривает компьютерный программный продукт. Когда компьютерный программный продукт запускается на компьютере, компьютер получает возможность выполнять часть или все этапы способа кодирования аудиосигнала в вышеупомянутом одном или более вариантах осуществления.

Процессор, упомянутый в предыдущих вариантах осуществления, может представлять собой кристалл с интегральными схемами и иметь возможность обработки сигналов. В процессе реализации этапы в вышеупомянутых вариантах осуществления способа могут быть реализованы с использованием аппаратной интегральной логической схемы в процессоре или с использованием инструкций в виде программного обеспечения. Процессор может быть процессором общего назначения, процессором цифровых сигналов (digital signal processor, DSP), специализированной интегральной схемой (application-specific integrated circuit, ASIC), программируемой пользователем вентильной матрицей (field programmable gate array, FPGA) или другим программируемым логическим устройством, логическим устройством с дискретным затвором или транзистором или дискретным аппаратным компонентом. Процессор общего назначения может быть микропроцессором, любым традиционным процессором и т.п. Этапы способов, раскрытых в вариантах осуществления настоящей заявки, могут исполняться и выполняться непосредственно с помощью аппаратного процессора кодирования или могут исполняться и выполняться с использованием комбинации аппаратных и программных модулей в процессоре кодирования. Программный модуль может быть расположен на известном носителе данных, например, в оперативной памяти, флэш-памяти, постоянной памяти, программируемой постоянной памяти, электрически стираемой программируемой памяти или регистре. Носитель данных находится в памяти, и процессор считывает информацию из памяти и выполняет этапы вышеизложенных способов в сочетании с аппаратными средствами процессора.

Память в вышеизложенных вариантах осуществления может быть энергозависимой памятью или энергонезависимой памятью или может включать в себя как энергозависимую память, так и энергонезависимую память. Энергонезависимая память может быть постоянной памятью (read-only memory, ROM), программируемой постоянной памятью (programmable ROM, PROM), стираемой программируемой постоянной памятью (erasable PROM, EPROM), электрически стираемой программируемой постоянной памятью (electrically EPROM, EEPROM) или флэш-памятью. Энергонезависимой памятью может быть оперативная память (random access memory, RAM), используемая в качестве внешнего кэша. В качестве примера, но не ограничивающего описания, доступны многие формы RAM, например, статическая оперативная память (static RAM, SRAM), динамическая оперативная память (dynamic RAM, DRAM), синхронная динамическая оперативная память (synchronous DRAM, SDRAM), синхронная динамическая оперативная память с удвоенной скоростью передачи данных (double data rate SDRAM, DDR SDRAM), расширенная синхронная динамическая оперативная память (enhanced SDRAM, ESDRAM), динамическая оперативная память с синхронной связью (synchlink DRAM, SLDRAM) и оперативная память с шиной прямого резидентного доступа (direct rambus RAM, DR RAM). Следует отметить, что память систем и способов, описанных в этой спецификации, включает в себя, но не ограничивается ими, любую память другого надлежащего типа.

Специалисту в данной области техники может быть известно, что в сочетании с блоками и этапами алгоритма в примерах, описанных в вариантах осуществления, раскрытых в данном описании, настоящая заявка может быть реализована с помощью электронных аппаратных средств или комбинации компьютерного программного обеспечения и электронных аппаратных средств. То, выполняются ли функции с помощью аппаратных средств или программного обеспечения, зависит от конкретных приложений и конструктивных ограничений технических решений. Специалист в данной области техники может использовать разные способы реализации описанных функций для каждого конкретного приложения, но не следует считать, что реализация выходит за рамки настоящей заявки.

Специалист в данной области техники может ясно понимать, что в целях удобного и краткого описания подробные рабочие процессы вышеупомянутой системы, устройства и блока относятся к соответствующим процессам в вышеупомянутых вариантах осуществления способа. В данном документе подробности не описываются повторно.

В нескольких вариантах осуществления, представленных в настоящей заявке, следует понимать, что раскрытые система, устройство и способ могут быть реализованы другими способами. Например, описанный вариант осуществления устройства является просто примером. Например, разделение на блоки является просто логическим разделением функций и в фактической реализации может быть другим разделением. Например, множество блоков или компонентов могут быть объединены или интегрированы в другую систему, или некоторые функции могут быть проигнорированы или не реализованы. В дополнение к этому, отображаемые или обсуждаемые взаимные связи или прямые связи или коммуникационные соединения могут быть реализованы через некоторые интерфейсы. Косвенные связи или коммуникационные соединения между устройствами или блоками могут быть реализованы в электрической, механической или другой форме.

Блоки, описанные как отдельные части, могут быть или не быть физически отдельными, и части, показанные в виде блоков, могут быть или не быть физическими блоками, могут быть расположены в одном месте или могут быть распределены по множеству сетевых блоков. Часть или все блоки могут быть выбраны в соответствии с фактическими требованиями для достижения целей решений вариантов осуществления.

В дополнение к этому, функциональные блоки в вариантах осуществления настоящей заявки могут быть интегрированы в один процессорный блок, или каждый из блоков может физически существовать сам по себе, или два или более блоков могут быть интегрированы в один блок.

Когда функции реализованы в виде функционального модуля программного обеспечения и продаются или используются как независимый продукт, функции могут быть сохранены на машиночитаемом носителе данных. Исходя из такого понимания, технические решения в настоящей заявке, в основном или частично дополняющие традиционную технологию, или часть технических решений могут быть реализованы в виде программного продукта. Компьютерный программный продукт хранится на носителе данных и включает в себя несколько инструкций для предписания компьютерному устройству (персональному компьютеру, серверу, сетевому устройству и т.п.) выполнять все или часть этапов способов в вариантах осуществления настоящая заявка. Вышеупомянутый носитель данных включает в себя любой носитель, на котором может храниться программный код, такой как флэш-накопитель USB, съемный жесткий диск, постоянное запоминающее устройство (read only memory, ROM), оперативное запоминающее устройство (random access memory, RAM), магнитный диск или оптический диск.

Приведенные выше описания являются просто конкретными реализациями настоящей заявки, но не предназначены для ограничения объема защиты настоящей заявки. Любое изменение или замена, легко обнаруженные специалистом в данной области техники в рамках технического объема, раскрытого в настоящей заявке, должны подпадать под объем защиты данной заявки. Таким образом, объем защиты настоящей заявки должен соответствовать объему защиты формулы изобретения.

Похожие патенты RU2828171C1

название год авторы номер документа
УСТРОЙСТВО КОДИРОВАНИЯ АУДИОСИГНАЛА, УСТРОЙСТВО ДЕКОДИРОВАНИЯ АУДИОСИГНАЛА, СПОСОБ КОДИРОВАНИЯ АУДИОСИГНАЛА И СПОСОБ ДЕКОДИРОВАНИЯ АУДИОСИГНАЛА 2015
  • Кавасима Такуя
  • Эхара Хироюки
RU2669706C2
КОДИРОВАНИЕ И ДЕКОДИРОВАНИЕ ИМПУЛЬСНЫХ И ОСТАТОЧНЫХ ЧАСТЕЙ ЗВУКОВОГО СИГНАЛА 2022
  • Маркович, Горан
RU2825308C2
АДАПТИВНОЕ РАСШИРЕНИЕ ПОЛОСЫ ПРОПУСКАНИЯ И УСТРОЙСТВО ДЛЯ ЭТОГО 2014
  • Гао Ян
RU2641224C2
МОДУЛЬ ВЫЧИСЛЕНИЯ И СПОСОБ ДЛЯ ОПРЕДЕЛЕНИЯ ДАННЫХ ФАЗОВОЙ КОРРЕКЦИИ ДЛЯ АУДИОСИГНАЛА 2015
  • Диш Саша
  • Лайтинен Микко-Вилле
  • Пулкки Вилле
RU2676899C2
АУДИОПРОЦЕССОР И СПОСОБ ДЛЯ ОБРАБОТКИ АУДИОСИГНАЛА С ИСПОЛЬЗОВАНИЕМ ВЕРТИКАЛЬНОЙ ФАЗОВОЙ КОРРЕКЦИИ 2015
  • Диш Саша
  • Лайтинен Микко-Вилле
  • Пулкки Вилле
RU2676414C2
АУДИОПРОЦЕССОР И СПОСОБ ДЛЯ ОБРАБОТКИ АУДИОСИГНАЛА С ИСПОЛЬЗОВАНИЕМ ГОРИЗОНТАЛЬНОЙ ФАЗОВОЙ КОРРЕКЦИИ 2015
  • Диш Саша
  • Лайтинен Микко-Вилле
  • Пулкки Вилле
RU2676416C2
ДЕКОДЕР И СПОСОБ ДЛЯ ДЕКОДИРОВАНИЯ АУДИОСИГНАЛА, КОДЕР И СПОСОБ ДЛЯ КОДИРОВАНИЯ АУДИОСИГНАЛА 2015
  • Диш Саша
  • Лайтинен Микко-Вилле
  • Пулкки Вилле
RU2675151C2
ПРОЦЕССОР ДЛЯ ФОРМИРОВАНИЯ СПЕКТРА ПРОГНОЗИРОВАНИЯ НА ОСНОВЕ ДОЛГОСРОЧНОГО ПРОГНОЗИРОВАНИЯ И/ИЛИ ГАРМОНИЧЕСКОЙ ПОСТФИЛЬТРАЦИИ 2022
  • Маркович, Горан
  • Эдлер, Бернд
  • Байер, Штефан
  • Кине, Ян Фредерик
RU2826967C2
УСТРОЙСТВО КОДИРОВАНИЯ РЕЧИ-АУДИО, УСТРОЙСТВО ДЕКОДИРОВАНИЯ РЕЧИ-АУДИО, СПОСОБ КОДИРОВАНИЯ РЕЧИ-АУДИО И СПОСОБ ДЕКОДИРОВАНИЯ РЕЧИ-АУДИО 2013
  • Кавасима Такуя
  • Осикири Масахиро
RU2648629C2
УСТРОЙСТВО КОДИРОВАНИЯ РЕЧИ-АУДИО, УСТРОЙСТВО ДЕКОДИРОВАНИЯ РЕЧИ-АУДИО, СПОСОБ КОДИРОВАНИЯ РЕЧИ-АУДИО И СПОСОБ ДЕКОДИРОВАНИЯ РЕЧИ-АУДИО 2019
  • Кавасима, Такуя
  • Осикири, Масахиро
RU2701065C1

Иллюстрации к изобретению RU 2 828 171 C1

Реферат патента 2024 года СПОСОБ И УСТРОЙСТВО КОДИРОВАНИЯ АУДИО

Изобретение относится к области вычислительной техники для обработки аудиоданных. Технический результат заключается в повышении эффективности кодирования аудиосигнала в ограниченной полосе пропускания. Технический результат достигается за счет определения флага резервирования спектра каждого частотного бина сигнала высокочастотной полосы, причем флаг резервирования спектра указывает то, зарезервирован ли первый спектр, соответствующий частотному бину, во втором спектре, соответствующем частотному бину, при этом первый спектр содержит спектр, соответствующий частотному бину, перед кодированием с расширением полосы пропускания, и второй спектр содержит спектр, соответствующий частотному бину, после кодирования с расширением полосы пропускания; выполнения второго кодирования над сигналом высокочастотной полосы на основе флага резервирования спектра каждого частотного бина сигнала высокочастотной полосы для получения второго параметра кодирования текущего кадра, причем второй параметр кодирования указывает информацию о целевой тональной компоненте сигнала высокочастотной полосы, и информация о тональном компоненте содержит информацию о местоположении, информацию о количестве и информацию об амплитуде или информацию об энергии тональной компоненты. 6 н. и 16 з.п. ф-лы, 9 ил.

Формула изобретения RU 2 828 171 C1

1. Способ кодирования аудио, в котором способ содержит:

получение текущего кадра аудиосигнала, причем текущий кадр содержит сигнал высокочастотной полосы и сигнал низкочастотной полосы;

выполнение первого кодирования сигнала высокочастотной полосы и сигнала низкочастотной полосы для получения первого параметра кодирования текущего кадра, причем первое кодирование содержит кодирование с расширением полосы пропускания;

определение флага резервирования спектра каждого частотного бина сигнала высокочастотной полосы, причем флаг резервирования спектра указывает то, зарезервирован ли первый спектр, соответствующий частотному бину, во втором спектре, соответствующем частотному бину, при этом первый спектр содержит спектр, соответствующий частотному бину, перед кодированием с расширением полосы пропускания, и второй спектр содержит спектр, соответствующий частотному бину, после кодирования с расширением полосы пропускания;

выполнение второго кодирования над сигналом высокочастотной полосы на основе флага резервирования спектра каждого частотного бина сигнала высокочастотной полосы для получения второго параметра кодирования текущего кадра, причем второй параметр кодирования указывает информацию о целевой тональной компоненте сигнала высокочастотной полосы, и информация о тональном компоненте содержит информацию о местоположении, информацию о количестве и информацию об амплитуде или информацию об энергии тональной компоненты; и

выполнение мультиплексирования битового потока над первым параметром кодирования и вторым параметром кодирования для получения кодированного битового потока.

2. Способ по п.1, в котором определение флага резервирования спектра каждого частотного бина сигнала высокочастотной полосы содержит:

определение флага резервирования спектра каждого частотного бина сигнала высокочастотной полосы на основе первого спектра, второго спектра и частотного диапазона кодирования с расширением полосы пропускания.

3. Способ по п.1 или 2, в котором полоса высоких частот, соответствующая сигналу полосы высоких частот, содержит по меньшей мере одну частотную область, и по меньшей мере одна частотная область содержит текущую частотную область; и

выполнение второго кодирования сигнала полосы высоких частот на основе флага резервирования спектра каждого частотного бина сигнала полосы высоких частот для получения второго параметра кодирования текущего кадра содержит:

выполнение поиска пика на основе сигнала полосы высоких частот в текущей частотной области для получения информации о пиках в текущей частотной области, причем информация о пике в текущей частотной области содержит информацию о количестве пиков, информацию о местоположении, информацию о пике и информацию об амплитуде пика или информацию об энергии пика в текущей частотной области;

выполнение фильтрации пиков над информацией о пиках в текущей частотной области на основе флага резервирования спектра каждого частотного бина в текущей частотной области для получения информации о тональном компоненте-кандидате в текущей частотной области;

получение информации о целевой тональной компоненте текущей частотной области на основе информации о тональном компоненте-кандидате текущей частотной области; и

получение второго параметра кодирования текущей частотной области на основе информации о целевой тональной компоненте текущей частотной области.

4. Способ по п.2 или 3, в котором полоса высоких частот, соответствующая сигналу полосы высоких частот, содержит по меньшей мере одну частотную область, и по меньшей мере одна частотная область содержит текущую частотную область;

когда первый частотный бин в текущей частотной области не принадлежит частотному диапазону кодирования с расширением полосы пропускания, значение флага резервирования спектра первого частотного бина равно первому заданному значению; или

когда второй частотный бин в текущей частотной области принадлежит частотному диапазону кодирования с расширением полосы пропускания, значение флага резервирования спектра второго частотного бина равно второму заданному значению, если значение спектра, соответствующее второму частотному бину перед кодированием с расширением полосы пропускания, и значение спектра, соответствующее второму частотному бину после кодирования с расширением полосы пропускания, удовлетворяют заданному условию; или значение флага резервирования спектра второго частотного бина равно третьему заданному значению, если значение спектра, соответствующее второму частотному бину перед кодированием с расширением полосы пропускания, и значение спектра, соответствующее второму частотному бину после кодирования с расширением полосы пропускания, не удовлетворяют заданному условию.

5. Способ по п.3, в котором текущая частотная область содержит по меньшей мере одну подполосу, и выполнение фильтрации пиков над информацией о пиках в текущей частотной области на основе флага резервирования спектра каждого частотного бина в текущей частотной области для получения информации о тональном компоненте-кандидате текущей частотной области содержит:

получение флага резервирования спектра каждой подполосы текущей частотной области на основе флага резервирования спектра каждого частотного бина в текущей частотной области; и

выполнение фильтрации пиков над информацией о пиках в текущей частотной области на основе флага резервирования спектра каждой подполосы текущей частотной области для получения информации о тональном компоненте-кандидате в текущей частотной области.

6. Способ по п.5, в котором по меньшей мере одна подполоса содержит текущую подполосу; и

получение флага резервирования спектра каждой подполосы текущей частотной области на основе флага резервирования спектра каждого частотного бина в текущей частотной области содержит:

если количество частотных бинов, которые находятся в текущей подполосе, и чьи значения флагов резервирования спектра равны второму заданному значению, больше заданного порогового значения, определение того, что значение флага резервирования спектра текущей подполосы является первым флагом значение, причем, если значение спектра, соответствующее частотному бину перед кодированием с расширением полосы пропускания, и значение спектра, соответствующее частотному бину после кодирования с расширением полосы пропускания, удовлетворяют заданному условию, значение флага резервирования спектра для частотного бина равно второму заданному значению; или

если количество частотных бинов, которые находятся в текущей подполосе, и чьи значения флагов резервирования спектра равны второму заданному значению, меньше или равно заданному пороговому значению, определение того, что значение флага резервирования спектра текущей подполосы равно второму значению флага.

7. Способ по п.5 или 6, в котором выполнение фильтрации пиков над информацией о пиках в текущей частотной области на основе флага резервирования спектра каждой подполосы текущей частотной области для получения информации о тональном компоненте-кандидате текущей частотной области содержит:

получение, на основе информации о местоположении пика в текущей частотной области, порядкового номера подполосы, соответствующего местоположению пика в текущей частотной области; и

выполнение фильтрации пиков над информацией о пиках в текущей частотной области на основе порядкового номера подполосы, соответствующего местоположению пика в текущей частотной области, и флага резервирования спектра каждой подполосы в текущей частотной области для получения информации о тональном компоненте-кандидате в текущей частотной области.

8. Способ по п.7, в котором, если значение флага резервирования спектра текущей подполосы равно второму значению флага, пик в текущей подполосе является тональной компонентой-кандидатом.

9. Способ по п.4 или 6, в котором заданное условие содержит: значение спектра, соответствующее частотному бину перед кодированием с расширением полосы пропускания, равно значению спектра, соответствующему частотному бину после кодирования с расширением полосы пропускания.

10. Устройство кодирования аудио, содержащее:

модуль получения, выполненный с возможностью получения текущего кадра аудиосигнала, причем текущий кадр содержит сигнал полосы высоких частот и сигнал полосы низких частот;

первый модуль кодирования, выполненный с возможностью выполнения первого кодирования сигнала полосы высоких частот и сигнала полосы низких частот для получения первого параметра кодирования текущего кадра, причем первое кодирование содержит кодирование с расширением полосы пропускания;

модуль определения флага, выполненный с возможностью определения флага резервирования спектра каждого частотного бина сигнала полосы высоких частот, причем флаг резервирования спектра указывает то, зарезервирован ли первый спектр, соответствующий частотному бину, во втором спектре, соответствующем частотному бину, первый спектр содержит спектр, соответствующий частотному бину перед кодированием с расширением полосы пропускания, и второй спектр содержит спектр, соответствующий частотному бину, после кодирования с расширением полосы пропускания;

второй модуль кодирования, выполненный с возможностью выполнения второго кодирования над сигналом полосы высоких частот на основе флага резервирования спектра каждого частотного бина сигнала полосы высоких частот для получения второго параметра кодирования текущего кадра, причем второй параметр кодирования указывает информацию о целевой тональной компоненте сигнала полосы высоких частот, информация о тональном компоненте содержит информацию о местоположении, информацию о количестве и информацию об амплитуде или информацию об энергии тональной компоненты; и

модуль мультиплексирования битового потока, выполненный с возможностью выполнения мультиплексирования битового потока над первым параметром кодирования и вторым параметром кодирования для получения кодированного битового потока.

11. Устройство по п.10, в котором модуль определения флага специально выполнен с возможностью:

определения флага резервирования спектра каждого частотного бина сигнала полосы высоких частот на основе первого спектра, второго спектра и частотного диапазона кодирования с расширением полосы пропускания.

12. Устройство по п.10 или 11, в котором полоса высоких частот, соответствующая сигналу полосы высоких частот, содержит по меньшей мере одну частотную область, и по меньшей мере одна частотная область содержит текущую частотную область; и

второй модуль кодирования специально выполнен с возможностью:

выполнения поиска пика на основе сигнала полосы высоких частот текущей частотной области для получения информации о пиках в текущей частотной области, причем информация о пике в текущей частотной области содержит информацию о количестве пиков, информацию о местоположении, информацию о пике и амплитуде пика или информацию об энергии пика в текущей частотной области;

выполнения фильтрации пиков над информацией о пиках в текущей частотной области на основе флага резервирования спектра каждого частотного бина в текущей частотной области для получения информации о тональном компоненте-кандидате в текущей частотной области;

получения информации о целевой тональной компоненте текущей частотной области на основе информации о тональном компоненте-кандидате текущей частотной области; и

получения второго параметра кодирования текущей частотной области на основе информации о целевой тональной компоненте текущей частотной области.

13. Устройство по п.11 или 12, в котором полоса высоких частот, соответствующая сигналу полосы высоких частот, содержит по меньшей мере одну частотную область, и по меньшей мере одна частотная область содержит текущую частотную область; и

когда первый частотный бин в текущей частотной области не принадлежит частотному диапазону кодирования с расширением полосы пропускания, значение флага резервирования спектра первого частотного бина равно первому заданному значению; или

когда второй частотный бин в текущей частотной области принадлежит частотному диапазону кодирования с расширением полосы пропускания, значение флага резервирования спектра второго частотного бина равно второму заданному значению, если значение спектра, соответствующее второму частотному бину перед кодированием с расширением полосы пропускания, и значение спектра, соответствующее второму частотному бину после кодирования с расширением полосы пропускания, удовлетворяют заданному условию; или значение флага резервирования спектра второго частотного бина равно третьему заданному значению, если значение спектра, соответствующее второму частотному бину перед кодированием с расширением полосы пропускания, и значение спектра, соответствующее второму частотному бину после кодирования с расширением полосы пропускания, не удовлетворяют заданному условию.

14. Устройство по п.12 или 13, в котором текущая частотная область содержит по меньшей мере одну подполосу, и второй модуль кодирования специально выполнен с возможностью:

получения флага резервирования спектра каждой подполосы текущей частотной области на основе флага резервирования спектра каждого частотного бина в текущей частотной области; и

выполнение фильтрации пиков над информацией о пиках в текущей частотной области на основе флага резервирования спектра каждой подполосы текущей частотной области для получения информации о тональном компоненте-кандидате в текущей частотной области.

15. Устройство по п.14, в котором по меньшей мере одна подполоса содержит текущую подполосу; и

второй модуль кодирования специально выполнен с возможностью:

если количество частотных бинов, которые находятся в текущей подполосе, и чьи значения флагов резервирования спектра равны второму заданному значению, больше заданного порогового значения, определение того, что значение флага резервирования спектра текущей подполосы является первым флагом значение, причем, если значение спектра, соответствующее частотному бину перед кодированием с расширением полосы пропускания, и значение спектра, соответствующее частотному бину после кодирования с расширением полосы пропускания, удовлетворяют заданному условию, определения того, что значение флага резервирования спектра для частотного бина равно второму заданному значению; или

если количество частотных бинов, которые находятся в текущей подполосе, и чьи значения флагов резервирования спектра равны второму заданному значению, меньше или равно заданному пороговому значению, значение флага резервирования спектра текущей подполосы равно второму значению флага.

16. Устройство по п.14, в котором второй модуль кодирования специально выполнен с возможностью:

получения, на основе информации о местоположении пика в текущей частотной области, порядкового номера подполосы, соответствующего местоположению пика в текущей частотной области; и

выполнения фильтрации пиков над информацией о пиках в текущей частотной области на основе порядкового номера подполосы, соответствующего местоположению пика в текущей частотной области, и флага резервирования спектра каждой подполосы в текущей частотной области для получения информации о тональном компоненте-кандидате в текущей частотной области.

17. Устройство по п.16, в котором, если значение флага резервирования спектра текущей подполосы равно второму значению флага, пик в текущей подполосе является тональной компонентой-кандидатом.

18. Устройство по п.13 или 15, в котором заданное условие содержит значение спектра, соответствующее частотному бину перед кодированием с расширением полосы пропускания, которое равно значению спектра, соответствующему частотному бину после кодирования с расширением полосы пропускания.

19. Устройство кодирования аудио, содержащее энергонезависимую память и процессор, соединенные друг с другом, причем процессор вызывает программный код, хранящийся в памяти, для выполнения способа по любому из пп.1-9.

20. Устройство кодирования аудио, содержащее кодер, причем кодер выполнен с возможностью выполнения способа по любому из пп.1-9.

21. Машиночитаемый носитель данных, содержащий компьютерную программу, причем, когда компьютерная программа исполняется на компьютере, компьютер может выполнять способ по любому из пп.1-9.

22. Машиночитаемый носитель данных, содержащий кодированный битовый поток, полученный с использованием способа по любому из пп.1-9.

Документы, цитированные в отчете о поиске Патент 2024 года RU2828171C1

Станок для придания концам круглых радиаторных трубок шестигранного сечения 1924
  • Гаркин В.А.
SU2019A1
Токарный резец 1924
  • Г. Клопшток
SU2016A1
Способ защиты переносных электрических установок от опасностей, связанных с заземлением одной из фаз 1924
  • Подольский Л.П.
SU2014A1
УСТРОЙСТВО И СПОСОБ ФОРМИРОВАНИЯ РАСШИРЕННОГО СИГНАЛА С ИСПОЛЬЗОВАНИЕМ ЗАПОЛНЕНИЯ НЕЗАВИСИМЫМ ШУМОМ 2015
  • Диш Саша
  • Гайгер Ральф
  • Нидермайер Андреас
  • Нойзингер Маттиас
  • Шмидт Константин
  • Вильде Штефан
  • Шуберт Беньямин
  • Нойкам Кристиан
RU2665913C2
УСТРОЙСТВО КОДИРОВАНИЯ АУДИО, СПОСОБ КОДИРОВАНИЯ АУДИО, ПРОГРАММА КОДИРОВАНИЯ АУДИО, УСТРОЙСТВО ДЕКОДИРОВАНИЯ АУДИО, СПОСОБ ДЕКОДИРОВАНИЯ АУДИО И ПРОГРАММА ДЕКОДИРОВАНИЯ АУДИО 2013
  • Цуцуми Кимитака
  • Кикуири Кей
  • Ямагути Ацуси
RU2640743C1

RU 2 828 171 C1

Авторы

Ся, Бининь

Ли, Цзявэй

Ван, Чжэ

Даты

2024-10-07Публикация

2021-05-28Подача