Показать метаданные Скрыть метаданные

(19)

(11)

2 800 626

(13)

(51)

МПК

G10L21/02(2013-01-01)

(21) (22)

Заявка

2021123941, 2020-01-13

(24)

Дата начала отсчета патента

2020-01-13

(22)

дата подачи заявки

2020-01-13

(45)

опубликовано

2023-07-25

(72)

авторы

Гао, Ян

(73)

патентообладатели

Хуавэй Текнолоджиз Ко., Лтд.

(56)

Документы, цитированные в отчете о поиске

КОДИРОВАНИЕ ЗВУКА ВЫСОКОГО РАЗРЕШЕНИЯ Российский патент 2023 года по МПК G10L21/02

Описание патента на изобретение RU2800626C2

Область техники, к которой относится изобретение

[0001] Настоящее раскрытие относится к обработке сигналов и, более конкретно, к повышению эффективности кодирования звуковых сигналов.

Уровень техники

[0002] Звук высокого разрешения (hi-res), также известный как звук высокой четкости или HD-аудио, - это маркетинговый термин, используемый некоторыми розничными продавцами записанной музыки и поставщиками оборудования для воспроизведения звука с высокой точностью воспроизведения. Проще говоря, звук высокого разрешения, как правило, относится к музыкальным файлам, которые имеют более высокую частоту дискретизации и/или битовую глубину по сравнению с компакт-диском (CD), у которого они заданы как 16 бит/44,1 кГц. Основным заявленным преимуществом звуковых файлов высокого разрешения является превосходное качество звука по сравнению со сжатыми звуковыми форматами. Чем больше информации о файле для воспроизведения, тем выше качество звука и текстуры, что приближает слушателей к исходному исполнению.

[0003] У звука высокого разрешения есть и обратная сторона: размер файла. Файл с высоким разрешением обычно может иметь размер в несколько десятков мегабайт, и несколько треков могут быстро израсходовать память на устройстве. Хотя хранилище намного дешевле, чем раньше, размер файлов по-прежнему может затруднить потоковую передачу звука высокого разрешения через Wi-Fi или мобильную сеть без сжатия.

Сущность изобретения

[0004] В некоторых вариантах реализации данный документ описывает методики повышения эффективности кодирования звукового сигнала.

[0005] В первом варианте реализации способ кодирования звука включает в себя: прием звукового сигнала, при этом звуковой сигнал содержит один или более поддиапазонных сигналов; генерирование остаточного сигнала по меньшей мере одного из упомянутого одного или более поддиапазонных сигналов на основе упомянутого по меньшей мере одного из упомянутого одного или более поддиапазонных сигналов; определение того, что упомянутый по меньшей мере один из упомянутого одного или более поддиапазонных сигналов является интенсивным тоновым сигналом; и в ответ на определение того, что упомянутый по меньшей мере один из упомянутого одного или более поддиапазонных сигналов является интенсивным тоновым сигналом, выполнение взвешивания в отношении остаточного сигнала упомянутого по меньшей мере одного из упомянутого одного или более поддиапазонных сигналов для генерирования взвешенного остаточного сигнала.

[0006] Во втором варианте реализации электронное устройство включает в себя: долговременное запоминающее хранилище, содержащее инструкции, и один или более аппаратных процессоров, осуществляющих связь с запоминающим хранилищем, при этом один или более аппаратных процессоров исполняют инструкции для: приема звукового сигнала, при этом звуковой сигнал содержит один или более поддиапазонных сигналов; генерирования остаточного сигнала по меньшей мере одного из упомянутого одного или более поддиапазонных сигналов на основе упомянутого по меньшей мере одного из упомянутого одного или более поддиапазонных сигналов; определения, что упомянутый по меньшей мере один из упомянутого одного или более поддиапазонных сигналов является интенсивным тоновым сигналом; и в ответ на определение того, что упомянутый по меньшей мере один из упомянутого одного или более поддиапазонных сигналов является интенсивным тоновым сигналом, выполнения взвешивание в отношении остаточного сигнала упомянутого по меньшей мере одного из упомянутого одного или более поддиапазонных сигналов для генерирования взвешенного остаточного сигнала.

[0007] В третьем варианте реализации долговременный машиночитаемый носитель, хранящий компьютерные инструкции для кодирования звука, которые при их исполнении одним или более аппаратными процессорами предписывают одному или более аппаратным процессорам выполнять операции, включающие в себя: прием звукового сигнала, при этом звуковой сигнал содержит один или более поддиапазонных сигналов; генерирование остаточного сигнала по меньшей мере одного из упомянутого одного или более поддиапазонных сигналов на основе упомянутого по меньшей мере одного из упомянутого одного или более поддиапазонных сигналов; определение того, что упомянутый по меньшей мере один из упомянутого одного или более поддиапазонных сигналов является интенсивным тоновым сигналом; и в ответ на определение того, что упомянутый по меньшей мере один из упомянутого одного или более поддиапазонных сигналов является интенсивным тоновым сигналом, выполнение взвешивания в отношении остаточного сигнала упомянутого по меньшей мере одного из упомянутого одного или более поддиапазонных сигналов для генерирования взвешенного остаточного сигнала.

[0008] Описанные ранее варианты реализации можно реализовать посредством реализуемого компьютером способа; долговременного машиночитаемого носителя, хранящего машиночитаемые инструкции для выполнения реализуемого компьютером способа; и реализуемой компьютером системой, содержащая компьютерную память, функционально соединенную с аппаратным процессором, выполненным с возможностью выполнения реализуемого компьютером способа и инструкций, хранящихся на долговременном машиночитаемом носителе.

[0009] Подробности одного или более вариантов осуществления заявляемого изобретения в данном описании изложены на прилагаемых чертежах и в описании ниже. Другие признаки, аспекты и преимущества заявляемого изобретения станут очевидными из описания, чертежей и формулы изобретения.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

[0010] На Фиг. 1 показана примерная структура кодера L2HC (кодека с низкой задержкой и низкой сложностью с высоким разрешением) согласно некоторым вариантам реализации.

[0011] На Фиг. 2 показана примерная структура декодера L2HC согласно некоторым вариантам реализации.

[0012] На Фиг. 3 показана примерная структура кодера нижней части нижнего диапазона (LLB) согласно некоторым вариантам реализации.

[0013] На Фиг. 4 показана примерная структура декодера LLB согласно некоторым вариантам реализации.

[0014] На Фиг. 5 показана примерная структура кодера верхней части нижнего диапазона (LHB) согласно некоторым вариантам реализации.

[0015] На Фиг. 6 показана примерная структура декодера LHB согласно некоторым вариантам реализации.

[0016] На Фиг. 7 показана примерная структура кодера для поддиапазона нижней части верхнего диапазона (HLB) и/или верхней части верхнего диапазона (HHB) согласно некоторым вариантам реализации.

[0017] На Фиг. 8 показана примерная структура декодера для поддиапазона HLB и/или HHB согласно некоторым вариантам реализации.

[0018] На Фиг. 9 показана примерная спектральная структура интенсивного тонового сигнала согласно некоторым вариантам реализации.

[0019] На Фиг. 10 показан примерный процесс обнаружения интенсивных тонов согласно некоторым вариантам реализации.

[0020] На Фиг. 11 показана блок-схема последовательности операций, иллюстрирующая примерный способ выполнения взвешивания по восприятию интенсивного тонового сигнала согласно некоторым вариантам реализации.

[0021] На Фиг. 12 показана примерная структура кодера квантования остатка согласно некоторым вариантам реализации.

[0022] На Фиг. 13 показана примерная структура декодера квантования остатка согласно некоторым вариантам реализации.

[0023] На Фиг. 14 показана блок-схема последовательности операций, иллюстрирующая примерный способ выполнения квантования остатка для сигнала согласно некоторым вариантам реализации.

[0024] На Фиг. 15 показан пример вокализованной речи согласно некоторым вариантам реализации.

[0025] На Фиг. 16 показан примерный процесс выполнения управления долгосрочным предсказанием (LTP) согласно некоторым вариантам реализации.

[0026] На Фиг. 17 показан примерный спектр звукового сигнала согласно некоторым вариантам реализации.

[0027] На Фиг. 18 показана блок-схема последовательности операций, иллюстрирующая примерный способ выполнения долгосрочного предсказания (LTP) согласно некоторым вариантам реализации.

[0028] На Фиг. 19 показана блок-схема последовательности операций, иллюстрирующая примерный способ квантования параметров кодирования с линейным предсказанием (LPC) согласно некоторым вариантам реализации.

[0029] На Фиг. 20 показан примерный спектр звукового сигнала согласно некоторым вариантам реализации.

[0030] На Фиг. 21 показана схема, иллюстрирующая примерную структуру электронного устройства согласно некоторому варианту реализации.

[0031] Одинаковые ссылочные позиции и обозначения на различных чертежах обозначают одинаковые элементы.

Подробное описание

[0032] Вначале следует понимать, что хотя иллюстративная реализация одного или более вариантов осуществления приведена ниже, раскрытые системы и/или способы могут быть реализованы с использованием любого количества методик, в настоящее время известных или существующих. Настоящее раскрытие никоим образом не должно ограничиваться иллюстративными реализациями, чертежами и технологиями, проиллюстрированными ниже, включая иллюстративные конструкции и варианты реализации, проиллюстрированные и описанные здесь, но может быть изменено в пределах объема прилагаемой формулы изобретения вместе с полным объемом их эквивалентов.

[0033] Звук высокого разрешения (hi-res), также известный как звук высокой четкости или HD-аудио, - это маркетинговый термин, используемый некоторыми розничными продавцами записанной музыки и поставщиками оборудования для воспроизведения звука с высокой точностью воспроизведения. Звук высокого разрешения медленно, но верно становится массовым благодаря выпуску большего количества продуктов, потоковых служб и даже смартфонов, поддерживающих стандарты высокого разрешения. Однако, в отличие от видео высокой четкости, не существует единого универсального стандарта для звука высокого разрешения. Digital Entertainment Group, Consumer Electronics Association и The Recording Academy вместе с звукозаписывающими компаниями официально определили звук высокого разрешения как: "Звук без потерь, который способен воспроизводить весь диапазон звучания из записей, которые были сведены лучше, чем от музыкальных источников CD-качества». Проще говоря, звук (звучание) высокого разрешения, как правило, относится к музыкальным файлам, которые имеют более высокую частоту дискретизации и/или битовую глубину, чем компакт-диск (CD), для которого эти параметры заданы как 16 бит/44,1 кГц. Частота дискретизации (или скорость дискретизации) означает, сколько раз дискретные отсчеты сигнала берутся в секунду в процессе аналого-цифрового преобразования. Чем больше битов, тем точнее можно измерить сигнал в первую очередь. Следовательно, переход от 16-битной к 24-битной битовой глубине может обеспечить заметный скачок в качестве. В звуковых файлах высокого разрешения обычно используется частота дискретизации 96 кГц (или даже намного выше) при 24 битах. В некоторых случаях частота дискретизации в 88,2 кГц также может использоваться для звуковых файлов высокого разрешения. Также существуют записи 44,1 кГц/24 бита, которые помечены как HD-аудио.

[0034] Существует несколько различных форматов звуковых файлов высокого разрешения с собственными требованиями к совместимости. Форматы файлов, способные хранить звук высокого разрешения, включают в себя популярные форматы FLAC (Free Lossless Audio Codec (Бесплатный аудиокодек без потерь)) и ALAC (Apple Lossless Audio Codec (Аудиокодек без потерь от Apple), оба из которых сжаты, но таким образом, что теоретически никакая информация не теряется. Другие форматы включают в себя несжатые форматы WAV и AIFF, DSD (формат, используемый для Super Audio CD (CD с супер звуком)) и более поздний MQA (Master Quality Authenticated (Подтвержденное мастер качество)). Ниже приводится классификация основных форматов файлов:

[0035] WAV (высокое разрешение): Стандартный формат, в котором закодированы все компакт-диски. Отличное качество звука, но без сжатия, что означает огромный размер файлов (особенно для файлов с высоким разрешением). У него плохая поддержка метаданных (то есть информации об обложке альбома, исполнителе и названии песни).

[0036] AIFF (высокое разрешение): Альтернатива WAV от Apple с улучшенной поддержкой метаданных. Он работает без потерь и без сжатия (файлы очень большого размера), но не пользуется большой популярностью.

[0037] FLAC (высокое разрешение): Этот формат сжатия без потерь поддерживает частоту дискретизации высокого разрешения, занимает примерно половину пространства WAV и хранит метаданные. Он не требует лицензионных отчислений и широко поддерживается (хотя и не в Apple) и считается предпочтительным форматом для загрузки и хранения альбомов в высоком разрешении.

[0038] ALAC (высокое разрешение): Собственный формат сжатия Apple без потерь также обеспечивает высокое разрешение, хранит метаданные и занимает половину пространства WAV. Альтернатива FLAC, удобная для iTunes и iOS.

[0039] DSD (высокое разрешение): Однобитовый формат, используемый для Super Audio CD. Он доступен в вариантах 2,8 МГц, 5,6 МГц и 11,2 МГц, но широко не поддерживается.

[0040] MQA (высокое разрешение): Формат сжатия без потерь, который упаковывает файлы высокого разрешения с большим упором на временную область. Он используется для потоковой передачи в высоком разрешении Tidal Masters, но имеет ограниченную поддержку по продуктам.

[0041] MP3 (без высокого разрешения): Популярный формат сжатия с потерями обеспечивает небольшой размер файла, но далеко не лучшее качество звука. Удобно хранить музыку на смартфонах и iPod, но не поддерживает высокое качество.

[0042] AAC (без высокого разрешения): Альтернатива MP3, со сжатием и с потерями, но звучит лучше. Используется для загрузки iTunes, потоковой передачи Apple Music (со скоростью 256 кбит/с) и потоковой передачи YouTube.

[0043] Основным заявленным преимуществом звуковых файлов высокого разрешения является превосходное качество звука по сравнению со сжатыми звуковыми форматами. Загрузки с таких сайтов, как Amazon и iTunes, и потоковые сервисы, такие как Spotify, используют сжатые форматы файлов с относительно низкой битовой скоростью (битрейтом), такие как файлы AAC 256 кбит/с в Apple Music и потоки Ogg Vorbis 320 кбит/с в Spotify. Использование сжатия с потерями означает, что данные теряются в процессе кодирования, что, в свою очередь, означает, что разрешение приносится в жертву ради удобства и меньшего размера файла. Это влияет на качество звука. Например, MP3 самого высокого качества имеет битовую скорость 320 кбит/с, тогда как файл с форматом 24 бит/192 кГц имеет битовую скорость 9216 кбит/с. Музыкальные компакт-диски имеют битовую скорость 1411 кбит/с. Следовательно, файлы с высоким разрешением 24 бит/96 кГц или 24 бит/192 кГц должны более точно воспроизводить качество звука, с которым музыканты и инженеры работали в студии. Благодаря большему количеству информации о файле для воспроизведения звук в высоком разрешении имеет тенденцию похвастаться большей детализацией и текстурой, приближая слушателей к исходному исполнению - при условии, что система воспроизведения достаточно прозрачна.

[0044] У звука высокого разрешения есть и обратная сторона: размер файла. Файл с высоким разрешением обычно может иметь размер в несколько десятков мегабайт, и несколько треков могут быстро израсходовать память на устройстве. Хотя хранилища намного дешевле, чем раньше, размер файлов по-прежнему может затруднить потоковую передачу звука высокого разрешения через Wi-Fi или мобильную сеть без сжатия.

[0045] Существует огромное количество разнообразных продуктов, которые могут воспроизводить и поддерживать звук высокого разрешения. Все зависит от того, насколько велика или мала система, сколько у нее бюджета и какой способ в основном используется для прослушивания мелодий. Некоторые примеры продуктов, поддерживающих звук высокого разрешения, описаны ниже.

[0046] Смартфоны

[0047] Смартфоны все чаще поддерживают воспроизведение в высоком разрешении. Однако это ограничено флагманскими моделями Android, такими как текущие Samsung Galaxy S9, S9+ и Note 9 (все они поддерживают файлы DSD) и Sony Xperia XZ3. Телефоны LG V30 и V30S ThinQ с поддержкой высокого разрешения в настоящее время предлагают совместимость с MQA, а телефоны Samsung S9 даже поддерживают Dolby Atmos. Apple iPhone пока что не поддерживает звук высокого разрешения по умолчанию, хотя есть способы обойти это, используя подходящее приложение, а затем либо подключив цифро-аналоговый преобразователь (ЦАП), либо используя наушники Lightning с Разъем Lightning для iPhone.

[0048] Планшеты

[0049] Также существуют планшеты с высоким разрешением, например, Samsung Galaxy Tab S4. На MWC 2018 был представлен ряд новых совместимых моделей, включая линейку M5 от Huawei и интригующий планшет Granbeat от Onkyo.

[0050] Портативные музыкальные проигрыватели

[0051] Кроме того, существуют специальные портативные музыкальные проигрыватели высокого разрешения, такие как различные Sony Walkmans и отмеченные наградами портативные проигрыватели Astell & Kern. Эти музыкальные проигрыватели предлагают больше места для хранения и гораздо лучшее качество звука, чем многозадачный смартфон. И хотя он далек от обычного портативного, потрясающий дорогой цифровой музыкальный проигрыватель Sony DMP-Z1 наполнен талантами высокого разрешения и прямого цифрового потока (DSD).

[0052] Настольный вариант

[0053] Для настольного решения ноутбук (Windows, Mac, Linux) является основным источником для хранения и воспроизведения музыки в высоком разрешении (в конце концов, именно сюда загружаются мелодии с сайтов загрузки в высоком разрешении).

[0054] ЦАП

[0055] USB или настольный ЦАП (например, Cyrus soundKey или Chord Mojo) - хороший способ получить отличное качество звука из файлов с высоким разрешением, хранящихся на компьютере или смартфоне (звуковые схемы которых обычно не оптимизируются для качества звука). Необходимо всего лишь подключить подходящий цифро-аналоговый преобразователь (ЦАП) между источником и наушниками для мгновенного усиления звука.

[0056] Несжатые звуковые файлы кодируют полный входной звуковой сигнал в цифровой формат, способный хранить полную загрузку входящих данных. Они предлагают высочайшее качество и возможности архивирования, что достигается за счет больших размеров файлов, что во многих случаях препятствует их широкому использованию. Кодирование без потерь - это нечто среднее между несжатым и потерянным. Оно обеспечивает аналогичное или такое же качество звука для несжатых звуковых файлов при уменьшенном размере. Кодеки без потерь достигают этого за счет неразрушающего сжатия входящего звука при кодировании перед восстановлением несжатой информации при декодировании. Размеры файлов звука, закодированного без потерь, по-прежнему слишком велики для многих приложений. Файлы с потерями кодируются иначе, чем несжатые файлы или файлы без потерь. Существенная функция аналого-цифрового преобразования остается неизменной в методиках кодирования с потерями. Потери расходятся с несжатием. Кодеки с потерями отбрасывают значительный объем информации, содержащейся в исходных звуковых волнах, пытаясь сохранить субъективное качество звука как можно ближе к исходным звуковым волнам. Из-за этого звуковые файлы с потерями намного меньше, чем несжатые, что позволяет использовать их в сценариях живого звука. Если нет субъективной разницы в качестве между звуковыми файлами с потерями и несжатыми, качество звуковых файлов с потерями можно рассматривать как «прозрачное». Недавно было разработано несколько звуковых кодеков (аудиокодеков) высокого разрешения с потерями, среди которых наиболее популярны LDAC (Sony) и AptX (Qualcomm). LHDC (Savitech) также является одним из них.

[0057] Потребители и производители высококачественной звуковой техники в последнее время больше говорят о звуке через Bluetooth, чем когда-либо прежде. Будь то беспроводные гарнитуры, наушники с функцией громкой связи, автомобиль или подключенный дом, растет число вариантов использования звука через Bluetooth хорошего качества. Ряд компаний используют решения, которые превосходят по производительности стандартные решения Bluetooth. aptX от Qualcomm уже охватывает громадное количество телефонов Android, но у мультимедийного гиганта Sony есть собственное высокопроизводительное решение под названием LDAC. Ранее эта технология была доступна только в линейке телефонов Sony Xperia, но с выпуском Oreo Android 8.0 кодек Bluetooth будет доступен как часть основного кода AOSP для реализации другими OEMS, если они того пожелают. На самом базовом уровне LDAC поддерживает передачу звуковых файлов 24 бит/96 кГц (высокого разрешения (Hi-Res)) по воздуху через Bluetooth. Ближайшим конкурирующим кодеком является aptX HD от Qualcomm, который поддерживает звуковые данные 24 бит/48 кГц. LDAC имеет три различных режима подключения: приоритет качества, обычный и приоритет подключения. Каждый из них предлагает различную битовую скорость, составляющую 990 кбит/с, 660 кбит/с и 330 кбит/с, соответственно. Следовательно, в зависимости от типа доступного подключения существуют разные уровни качества. Понятно, что самые низкие битовые скорости LDAC не дадут полного качества 24 бит/96 кГц, которым может похвастаться LDAC. LDAC - это технология кодирования звука, разработанная Sony, которая позволяет передавать потоковый звук через соединения Bluetooth со скоростью до 990 кбит/с при 24 битах/96 кГц. Она используется в различных продуктах Sony, включая наушники, смартфоны, портативные медиаплееры, активные колонки и домашние кинотеатры. LDAC - это кодек с потерями, который использует схему кодирования на основе MDCT для обеспечения более эффективного сжатия данных. Основным конкурентом LDAC является технология aptX-HD от Qualcomm. Высококачественный стандартный кодек поддиапазонов низкой сложности (SBC) обеспечивает максимальную скорость 328 кбит/с, aptX от Qualcomm - 352 кбит/с, aptX HD - 576 кбит/с. На бумаге LDAC со скоростью 990 кбит/с передает намного больше данных, чем любой другой кодек Bluetooth. И даже настройка приоритета нижнего конца соединения конкурирует с SBC и aptX, которые будут обслуживать тех, кто транслирует музыку из самых популярных сервисов. LDAC от Sony состоит из двух основных частей. Первая часть - это достижение достаточно высокой скорости передачи данных по Bluetooth для достижения 990 кбит/с, а вторая часть - сжатие звуковых данных высокого разрешения в эту полосу пропускания с минимальной потерей качества. LDAC использует дополнительную технологию Bluetooth Enhanced Data Rate (EDR (Улучшенная скорость передачи данных по Bluetooth)) для увеличения скорости передачи данных за пределы обычных ограничений профиля A2DP (Advanced Audio Distribution Profile (Усовершенствованный профиль распространения звука). Но это зависит от оборудования. Скорости EDR обычно не используются звуковыми профилями (аудиопрофилями) A2DP.

[0058] Первоначальный алгоритм aptX был основан на принципах адаптивной дифференциальной импульсно-кодовой модуляции во временной области (ADPCM) без методик психоакустической слуховой маскировки. Кодирование звука aptX от Qualcomm было впервые представлено на коммерческом рынке в качестве полупроводникового продукта, специально запрограммированной интегральной схемы DSP с названием APTX100ED, которая изначально была принята производителями оборудования для автоматизации вещания, которым требовались средства для хранения звука качества CD на дисководе компьютера для автоматического воспроизведения во время радиопередачи, например, что заменяет задачу диск-жокея. С момента коммерческого внедрения в начале 1990-х годов диапазон алгоритмов aptX для сжатия звуковых данных в реальном времени продолжал расширяться, и интеллектуальная собственность стала доступной в виде программного обеспечения, встроенного программного обеспечения и программируемого оборудования для профессионального звука, телевидения и радиовещания, и бытовой электроники, особенно приложениям для беспроводной передачи звука, передаваемого беспроводным образом звука с малой задержкой для игр и видео, и передачи звука через IP. Кроме того, кодек aptX может использоваться вместо SBC (кодирования поддиапазонов), схемы кодирования поддиапазонов для потоковой передачи стерео/моно звука с потерями, предписанной SIG Bluetooth для A2DP Bluetooth, стандарта беспроводной персональной беспроводной сети малого радиуса действия. AptX поддерживается высокопроизводительными периферийными устройствами Bluetooth. Сегодня как стандартный aptX, так и Enhanced aptX (E-aptX (Усовершенствованный aptX) используются в аппаратном обеспечении звуковых кодеков ISDN и IP от многих производителей широковещательного оборудования. Дополнение к семейству aptX в виде aptX Live, предлагающее сжатие до 8:1, было представлено в 2007 году. А в апреле 2009 года был анонсирован aptX-HD, масштабируемый адаптивный звуковой кодек с потерями. AptX ранее назывался apt-X, пока не был приобретен CSR plc в 2010 году. Впоследствии в августе 2015 года CSR была приобретена Qualcomm. Звуковой кодек aptX используется для бытовых и автомобильных беспроводных звуковых приложений, в частности для потоковой передачи стереозвука с потерями в реальном времени через соединение/сопряжение A2DP Bluetooth между устройством «источником» (таким как смартфон, планшет или ноутбук) и устройством «приемником» (например, стереодинамиком, гарнитурой или наушниками Bluetooth). Эта технология должна быть включена как в передатчик, так и в приемник, чтобы получить звуковые преимущества кодирования звука aptX по сравнению с кодированием поддиапазона по умолчанию (SBC), предусмотренным стандартом Bluetooth. Улучшенный aptX обеспечивает кодирование с коэффициентом сжатия 4:1 для профессиональных приложений звукового вещания и подходит для AM, FM, DAB, HD Radio.

[0059] Усовершенствованный aptX поддерживает битовую глубину в 16, 20 или 24 бит. Для звука с частотой дискретизации 48 кГц битовая скорость для E-aptX составляет 384 кбит/с (двухканальная). AptX-HD имеет битовую скорость 576 кбит/с. Он поддерживает звук высокой четкости с частотой дискретизации до 48 кГц и разрешением дискретизации до 24 бит. В отличие от названия, кодек по-прежнему считается с потерями. Однако он допускает «гибридную» схему кодирования для приложений, в которых средняя или пиковая скорость сжатых данных должна быть ограничена на ограничительном уровне. Это вовлекает динамическое применение кодирования «почти без потерь» для тех участков звука, где кодирование полностью без потерь невозможно из-за ограничений полосы пропускания. Кодирование «почти без потерь» обеспечивает качество звука высокой четкости, сохраняя звуковые частоты до 20 кГц и динамический диапазон не менее 120 дБ. Его главный конкурент - кодек LDAC, разработанный Sony. Еще один масштабируемый параметр в aptX-HD - задержка кодирования. Им можно динамически жертвовать в пользу других параметром, таких как уровни сжатия и вычислительная сложность.

[0060] LHDC означает звуковой кодек высокой четкости с низкой задержкой и анонсирован компанией Savitech. По сравнению с звуковым форматом SBC Bluetooth, LHDC позволяет передавать более чем в 3 раза больше данных, чтобы обеспечить наиболее реалистичный передаваемый беспроводным образом звук высокой четкости и устранить разницу в качестве звука между беспроводными и проводными звуковыми устройствами. Увеличение количества передаваемых данных позволяет пользователям ощутить больше деталей и лучшее звуковое поле, и погрузиться в эмоции музыки. Однако более чем трехкратная скорость передачи данных SBC может быть слишком высокой для многих практических приложений.

[0061] На Фиг. 1 показана примерная структура кодека 100 L2HC (кодек с низкой задержкой и низкой сложностью и высоким разрешением) согласно некоторым вариантам реализации. На Фиг. 2 показана примерная структура декодера 200 L2HC согласно некоторым вариантам реализации. Как правило, L2HC может предложить «прозрачное» качество при достаточно низкой битовой скорости. В некоторых случаях кодер 100 и декодер 200 могут быть реализованы в устройстве кодека сигналов. В некоторых случаях кодер 100 и декодер 200 могут быть реализованы в разных устройствах. В некоторых случаях кодер 100 и декодер 200 могут быть реализованы в любых подходящих устройствах. В некоторых случаях кодер 100 и декодер 200 могут иметь одинаковую задержку алгоритма (например, одинаковый размер кадра или одинаковое количество подкадров). В некоторых случаях размер подкадра в дискретных отсчетах может быть фиксированным. Например, если частота дискретизации составляет 96 кГц или 48 кГц, то размер подкадра может составлять 192 или 96 дискретных отсчетов. Каждый кадр может иметь 1, 2, 3, 4 или 5 подкадров, что соответствует различным задержкам алгоритма. В некоторых примерах, когда входная частота дискретизации кодера 100 составляет 96 кГц, выходная частота дискретизации декодера 200 может составлять 96 кГц или 48 кГц. В некоторых примерах, когда входная частота дискретизации частоты дискретизации составляет 48 кГц, выходная частота дискретизации декодера 200 также может составлять 96 кГц или 48 кГц. В некоторых случаях диапазон высоких частот добавляется искусственно, если частота дискретизации входного сигнала кодера 100 составляет 48 кГц, а частота дискретизации выходного сигнала декодера 200 равна 96 кГц.

[0062] В некоторых примерах, когда входная частота дискретизации кодера 100 составляет 88,2 кГц, выходная частота дискретизации декодера 200 может составлять 88,2 кГц или 44,1 кГц. В некоторых примерах, когда входная частота дискретизации кодера 100 составляет 44,1 кГц, выходная частота дискретизации декодера 200 также может составлять 88,2 кГц или 44,1 кГц. Точно так же диапазон высоких частот также может быть искусственно добавлен, когда частота дискретизации входного сигнала кодера 100 составляет 44,1 кГц, а частота дискретизации выходного сигнала декодера 200 составляет 88,2 кГц. Это тот же кодер, который кодирует входной сигнал 96 кГц или 88,2 кГц. Этот же кодер также используется для кодирования входного сигнала 48 кГц или 44,1 кГц.

[0063] В некоторых случаях в кодере 100 L2HC битовая глубина входного сигнала может составлять 32 бита, 24 бита или 16 бит. В декодере 200 L2HC битовая глубина выходного сигнала также может составлять 32 бита, 24 бита или 16 бит. В некоторых случаях битовая глубина кодера в кодере 100 и битовая глубина декодера в декодере 200 могут быть разными.

[0064] В некоторых случаях режим кодирования (например, ABR_mode) может быть установлен в кодере 100 и может быть изменен в реальном времени во время работы. В некоторых случаях ABR_mode=0 указывает на высокую битовую скорость передачи данных, ABR_mode=1 указывает на среднюю битовую скорость передачи данных, а ABR_mode=2 указывает на низкую битовую скорость передачи данных. В некоторых случаях информация ABR_mode может быть отправлена в декодер 200 через канал потоковой передачи битов, потратив 2 бита. Количество каналов по умолчанию может быть стереофоническим (два канала), как для приложений наушников с Bluetooth. В некоторых примерах средняя битовая скорость для ABR_mode=2 может составлять от 370 до 400 кбит/с, средняя битовая скорость для ABR_mode=1 может составлять от 450 до 550 кбит/с, а средняя битовая скорость для ABR_mode=0 может составлять от 550 до 710 кбит/с. В некоторых случаях максимальная мгновенная битовая скорость для всех случаев/режимов может быть менее 990 кбит/с.

[0065] Как показано на Фиг. 1, кодер 100 включает в себя фильтр 104 предыскажения, набор 106 фильтров анализа квадратурного зеркального фильтра (QMF), кодер 118 нижней части нижнего диапазона (LLB), кодер 120 верхней части нижнего диапазона (LHB), кодер 122 нижней части верхнего диапазона (HLB), кодер 123 верхней части верхнего диапазона (HHB) и мультиплексор 126. Исходный входной цифровой сигнал 102 сначала предварительно выделяется фильтром 104 предыскажения. В некоторых случаях фильтр 104 предыскажения может быть постоянным фильтром верхних частот. Фильтр 104 предыскажения полезен для большинства музыкальных сигналов, поскольку большинство музыкальных сигналов содержат гораздо более высокие энергии в диапазоне низких частот, чем энергии в диапазоне верхних частот. Увеличение энергий в диапазоне верхних частот может повысить точность обработки сигналов диапазона верхних частот.

[0066] Выходной сигнал фильтра 104 предыскажения проходит через набор 106 фильтров анализа QMF для генерирования четырех поддиапазонных сигналов - сигнала 110 LLB, сигнала 112 LHB, сигнала 114 HLB и сигнала 116 HHB. В одном примере исходный входной сигнал генерируется с частотой дискретизации 96 кГц. В этом примере сигнал 110 LLB включает в себя поддиапазон 0-12 кГц, сигнал 112 LHB включает в себя поддиапазон 12-24 кГц, сигнал 114 HLB включает в себя поддиапазон 24-36 кГц, а сигнал 116 HHB включает в себя поддиапазон 36-48 кГц. Как показано, каждый из четырех поддиапазонных сигналов кодируется соответственно кодером 118 LLB, кодером 120 LHB, кодером 122 HLB и кодером 124 HHB для генерирования кодированного поддиапазонного сигнала. Четыре закодированных сигнала могут быть мультиплексированы мультиплексором 126 для генерирования кодированного звукового сигнала.

[0067] Как показано на Фиг. 2, декодер 200 включает в себя декодер 204 LLB, декодер 206 LHB, декодер 208 HLB, декодер 210 HHB, набор 212 фильтров синтеза QMF, компонент 214 постобработки и фильтр 216 устранения предыскажения. В некоторых случаях каждый из декодера 204 LLB, декодера 206 LHB, декодера 208 HLB и декодера 210 HHB может принимать кодированный поддиапазонный сигнал из канала 202 соответственно и генерировать декодированный поддиапазонный сигнал. Декодированные поддиапазонные сигналы от четырех декодеров 204-210 могут быть суммированы обратно через набор 212 фильтров синтеза QMF для генерирования выходного сигнала. Выходной сигнал может подвергаться постобработке компонентом 214 постобработки, если необходимо, а затем подвергаться устранению предыскажения посредством фильтра 216 устранения предыскажения для генерирования декодированного звукового сигнала 218. В некоторых случаях фильтр 216 устранения предыскажения может быть постоянным фильтром и может быть инверсным фильтром фильтра 104 предыскажения. В одном примере декодированный звуковой сигнал 218 может быть сгенерирован декодером 200 с той же частотой дискретизации, что и входной звуковой сигнал (например, звуковой сигнал 102) кодера 100. В этом примере декодированный звуковой сигнал 218 генерируется с частотой дискретизации 96 кГц.

[0068] На Фиг. 3 и на Фиг. 4 иллюстрируют примерные структуры кодера 300 LLB и декодера 400 LLB, соответственно. Как показано на Фиг. 3, кодер 300 LLB включает в себя компонент 304 обнаружения резкого спектрального наклона, фильтр 306 наклона, компонент 308 анализа кодирования с линейным предсказанием (LPC), инверсный фильтр 310 LPC, компонент 312 условия долгосрочного предсказания (LTP), и компонент 314 обнаружения интенсивных тонов, взвешивающий фильтр 316, компонент 318 быстрого вклада LTP, блок 320 функции сложения, компонент 322 управления битовой скоростью, компонент 324 начального квантования остатка, компонент 326 регулировки битовой скорости и компонент 328 оптимизации быстрого квантования.

[0069] Как показано на Фиг. 3, поддиапазонный сигнал 302 LLB сначала проходит через фильтр 306 наклона, которым управляет компонент 304 обнаружения спектрального наклона. В некоторых случаях отфильтрованный по наклону сигнал LLB генерируется фильтром 306 наклона. Отфильтрованный по наклону сигнал LLB может затем подвергаться LPC-анализу посредством компонента 308 анализа LPC, чтобы сгенерировать параметры фильтра LPC в поддиапазоне LLB. В некоторых случаях параметры фильтра LPC могут квантоваться и отправляться в декодер 400 LLB. Инверсный фильтр 310 LPC может использоваться для фильтрации отфильтрованного по наклону сигнала LLB и генерирования остаточного сигнала LLB. В этой области остаточного сигнала взвешивающий фильтр 316 добавляется для интенсивного тонового сигнала. В некоторых случаях взвешивающий фильтр 316 может быть включен или выключен в зависимости от обнаружения интенсивных тонов компонентом 314 обнаружения интенсивных тонов, подробности которого будут объяснены более подробно позже. В некоторых случаях взвешенный остаточный сигнал LLB может генерироваться взвешивающим фильтром 316.

[0070] Как показано на Фиг. 3, взвешенный остаточный сигнал LLB становится опорным сигналом. В некоторых случаях, когда в исходном сигнале существует сильная периодичность, вклад LTP (долгосрочного предсказания) может быть внесен компонентом 318 быстрого вклада LTP на основе условия 312 LTP. В кодере 300 вклад LTP может вычитаться из взвешенного остаточного сигнала LLB блоком 320 функции сложения, чтобы сгенерировать второй взвешенный остаточный сигнал LLB, который становится входным сигналом для компонента 324 начального квантования остатка LLB. В некоторых случаях выходной сигнал компонента 324 начального квантования остатка LLB может обрабатываться компонентом 328 оптимизации быстрого квантования для генерирования квантованного остаточного сигнала 330 LLB. В некоторых случаях квантованный остаточный сигнал 330 LLB вместе с параметрами LTP (когда LTP существует) может быть отправлен в декодер 400 LLB через канал потоковой передачи битов.

[0071] На Фиг. 4 показана примерная структура декодера 400 LLB. Как показано, декодер 400 LLB включает в себя компонент 406 квантованного остатка, компонент 408 быстрого вклада LTP, компонент 410 флага переключения LTP, блок 414 функции сложения, инверсный взвешивающий фильтр 416, компонент 418 флага интенсивных тонов, фильтр 422 LPC, инверсный фильтр 424 наклона и компонент 426 флага резкого спектрального наклона. В некоторых случаях квантованный остаточный сигнал из компонента 406 квантованного остатка, сигнал вклада LTP из компонента 408 быстрого вклада LTP могут быть сложены вместе посредством блока 414 функции сложения, чтобы сгенерировать взвешенный остаточный сигнал LLB в качестве входного сигнала для инверсного взвешивающего фильтра 416.

[0072] В некоторых случаях инверсный взвешивающий фильтр 416 может использоваться для удаления взвешивания и восстановления спектральной равномерности квантованного остаточного сигнала LLB. В некоторых случаях восстановленный остаточный сигнал LLB может быть сгенерирован инверсным взвешивающим фильтром 416. Восстановленный остаточный сигнал LLB может быть снова отфильтрован фильтром 422 LPC для генерирования сигнала LLB в сигнальной области. В некоторых случаях, если фильтр наклона (например, фильтр 306 наклона) существует в кодере 300 LLB, то сигнал LLB в декодере 400 LLB может быть отфильтрован инверсным фильтром 424 наклона, управляемым компонентом 428 флага резкого спектрального наклона. В некоторых случаях декодированный сигнал 430 LLB может быть сгенерирован инверсным фильтром 424 наклона.

[0073] На Фиг. 5 и на Фиг. 6 показаны примерные структуры кодера 500 LHB и декодера 600 LHB. Как показано на Фиг. 5, кодер 500 LHB включает в себя компонент 504 анализа LPC, инверсный фильтр 506 LPC, компонент 510 управления битовой скоростью, компонент 512 начального квантования остатка и компонент 514 оптимизации быстрого квантования. В некоторых случаях поддиапазонный сигнал 502 LHB может быть проанализирован посредством LPC компонентом 504 анализа LPC, чтобы сгенерировать параметры фильтра LPC в поддиапазоне LHB. В некоторых случаях параметры фильтра LPC могут быть квантованы и отправлены в декодер 600 LHB. Поддиапазонный сигнал 502 LHB может быть отфильтрован инверсным фильтром 506 LPC в кодере 500. В некоторых случаях остаточный сигнал LHB может генерироваться инверсным фильтром 506 LPC. Остаточный сигнал LHB, который становится входным сигналом для квантования остатка LHB, может обрабатываться компонентом 512 начального квантования остатка и компонентом 514 оптимизации быстрого квантования для генерирования квантованного остаточного сигнала 516 LHB. В некоторых случаях квантованный остаточный сигнал 516 LHB может быть впоследствии отправлен в декодер 600 LHB. Как показано на Фиг. 6, квантованный остаток 604, полученный из битов 602, может быть обработан фильтром 606 LPC для поддиапазона LHB, чтобы сгенерировать декодированный сигнал 608 LHB.

[0074] На Фиг. 7 и на Фиг. 8 показаны примерные структуры кодера 700 и декодера 800 для поддиапазонов HLB и/или HHB. Как показано, кодер 700 включает в себя компонент 704 анализа LPC, инверсный фильтр 706 LPC, компонент 708 переключения битовой скорости, компонент 710 управления битовой скоростью, компонент 712 квантования остатка и компонент 714 квантования энергетической огибающей. Декодер 800 включает в себя компонент 804 переключения битовой скорости, декодер 806 остатка, декодер 808 энергетической огибающей, компонент 810 генерирования остатка и фильтр 812 LPC. Как правило, как HLB, так и HHB расположены в относительно высокочастотной области. В некоторых случаях они кодируются и декодируются двумя возможными способами. Например, если битовая скорость достаточно высока (например, выше 700 кбит/с для 96 кГц/24-битного стереофонического кодирования), они могут кодироваться и декодироваться как LHB. В одном примере поддиапазонный сигнал 702 HLB или HHB может быть проанализирован посредством LPC компонентом 704 анализа LPC для генерирования параметров фильтра LPC в поддиапазоне HLB или HHB. В некоторых случаях параметры фильтра LPC могут квантоваться и отправляться в декодер 800 HLB или HHB. Поддиапазонный сигнал 702 HLB или HHB может быть отфильтрован инверсным фильтром 706 LPC для генерирования остаточного сигнала HLB или HHB. Остаточный сигнал HLB или HHB, который становится целевым сигналом для квантования остатка, может обрабатываться компонентом 712 квантования остатка для генерирования квантованного остаточного сигнала 716 HLB или HHB. Квантованный остаточный сигнал 716 HLB или HHB может быть впоследствии отправлен на сторону декодера (например, декодера 800) и обработан декодером 806 остатка и фильтром 812 LPC для генерирования декодированного сигнала 814 HLB или HHB.

[0075] В некоторых случаях, если битовая скорость относительно низкая (например, ниже 500 кбит/с для 96 кГц/24-битного стереофонического кодирования), параметры фильтра LPC, сгенерированные компонентом 704 анализа LPC для поддиапазонов HLB или HHB, могут по-прежнему квантоваться и отправляется на сторону декодера (например, декодера 800). Однако остаточный сигнал HLB или HHB может быть сгенерирован без затрачивания какого-либо бита, и только энергетическая огибающая остаточного сигнала во временной области квантуется и отправляется в декодер с очень низкой битовой скоростью (например, менее 3 кбит/с для кодирования энергетической огибающей). В одном примере компонент 714 квантования энергетической огибающей может принимать остаточный сигнал HLB или HHB от инверсного фильтра LPC и генерировать выходной сигнал, который впоследствии может быть отправлен в декодер 800. Затем выходной сигнал из кодера 700 может быть обработан декодером 808 энергетической огибающей и компонентом 810 генерирования остатка, чтобы сгенерировать входной сигнал для фильтра 812 LPC. В некоторых случаях фильтр 812 LPC может принимать остаточный сигнал HLB или HHB от компонента 810 генерирования остатка и генерировать декодированный сигнал 814 HLB или HHB.

[0076] На Фиг. 9 показана примерная спектральная структура 900 интенсивного тонового сигнала. Обычно нормальный речевой сигнал редко имеет спектральную структуру с относительно интенсивными тонами. Однако музыкальные сигналы и певческие голосовые сигналы часто содержат спектральную структуру интенсивных тонов. Как показано, спектральная структура 900 включает в себя частоту F0 первой гармоники, которая относительно выше (например, F0>500 Гц), и уровень фонового спектра, который относительно ниже. В этом случае звуковой сигнал, имеющий спектральную структуру 900, можно рассматривать как интенсивный тоновый сигнал. В случае интенсивного тонового сигнала ошибка кодирования между 0 Гц и F0 может быть легко услышана из-за отсутствия эффекта слуховой маскировки. Ошибка (например, ошибка между F1 и F2) может маскироваться посредством F1 и F2, пока пиковые энергии F1 и F2 верны. Однако, если битовая скорость недостаточно высокая, то ошибок кодирования не избежать.

[0077] В некоторых случаях поиск правильного короткого промежутка между тонами (интенсивными тонами) в LTP может помочь улучшить качество сигнала. Однако этого может быть недостаточно для достижения «прозрачного» качества. Чтобы повысить качество сигнала надежным образом, может быть введен адаптивный взвешивающий фильтр, который улучшает очень низкие частоты и уменьшает ошибки кодирования на очень низких частотах за счет увеличения ошибок кодирования на более высоких частотах. В некоторых случаях адаптивный взвешивающий фильтр (например, взвешивающий фильтр 316) может быть полюсным фильтром первого порядка, как показано ниже:

[0078] ,

[0079] и инверсный взвешивающий фильтр (например, инверсный взвешивающий фильтр 416) может быть нулевым фильтром первого порядка, как показано ниже:

[0080] .

[0081] В некоторых случаях адаптивный взвешивающий фильтр может проявить улучшения случая интенсивных тонов. Однако в других случаях он может снизить качество. Следовательно, в некоторых случаях адаптивный взвешивающий фильтр может включаться и выключаться на основе обнаружения случая интенсивных тонов (например, с использованием компонента 314 обнаружения интенсивных тонов на Фиг. 3). Есть много способов обнаружить интенсивный тоновый сигнал. Один из способов описан ниже со ссылкой на Фиг. 10.

[0082] Как показано на Фиг. 10, четыре параметра, включающих в себя текущее тоновое усиление 1002, сглаженное тоновое усиление 1004, продолжительность 1006 промежутка между тонами и спектральный наклон 1008, могут использоваться компонентом 1010 обнаружения интенсивных тонов для определения, существует ли интенсивный тоновый сигнал или нет. В некоторых случаях тоновое усиление 1002 указывает периодичность сигнала. В некоторых случаях сглаженное тоновое усиление 1004 представляет нормированное значение тонового усиления 1002. В одном примере, если нормированное тоновое усиление (например, сглаженное тоновое усиление 1004) находится между 0 и 1, то высокое значение нормированного тонового усиления (например, когда нормированное тоновое усиление близко к 1) может указывать на наличие сильных гармоник в спектральной области. Сглаженное тоновое усиление 1004 может указывать на то, что периодичность является стабильной (а не только локальной). В некоторых случаях, если продолжительность 1006 промежутка между тонами мала (например, менее 3 мс), это означает, что частота F0 первой гармоники является большой (высокой). Спектральный наклон 1008 может быть измерен посредством корреляции сегментного сигнала на расстоянии одного дискретного отсчета или первого коэффициента отражения параметров LPC. В некоторых случаях спектральный наклон 1008 может использоваться, чтобы указать, содержит ли область очень низких частот значительную энергию или нет. Если энергия в области очень низких частот (например, частот ниже F0) относительно высока, то интенсивный тоновый сигнал может не существовать. В некоторых случаях, когда обнаруживается интенсивный тоновый сигнал, может применяться взвешивающий фильтр. В противном случае взвешивающий фильтр может не применяться, если интенсивный тоновый сигнал не обнаружен.

[0083] На Фиг. 11 показана блок-схема последовательности операций, иллюстрирующая примерный способ 1100 выполнения взвешивания по восприятию интенсивного тонового сигнала. В некоторых случаях способ 1100 может быть реализован устройством звукового кодека (например, кодером 300 LLB). В некоторых случаях способ 1100 может быть реализован любым подходящим устройством.

[0084] Способ 1100 может начинаться на этапе 1102, на котором принимается сигнал (например, сигнал 102 с Фиг. 1). В некоторых случаях сигнал может быть звуковым сигналом. В некоторых случаях сигнал может включать в себя один или более поддиапазонных компонентов. В некоторых случаях сигнал может включать в себя компонент LLB, компонент LHB, компонент HLB и компонент HHB. В одном примере сигнал может генерироваться с частотой дискретизации 96 кГц и иметь полосу пропускания 48 кГц. В этом примере компонент LLB сигнала может включать в себя поддиапазон 0-12 кГц, компонент LHB может включать в себя поддиапазон 12-24 кГц, компонент HLB может включать в себя поддиапазон 24-36 кГц, а компонент HHB может включать в себя поддиапазон 36-48 кГц. поддиапазон. В некоторых случаях сигнал может обрабатываться фильтром предыскажения (например, фильтром 104 предыскажения) и набором фильтров анализа QMF (например, набором 106 фильтров анализа QMF) для генерирования поддиапазонных сигналов в четырех поддиапазонах. В этом примере поддиапазонный сигнал LLB, поддиапазонный сигнал LHB, поддиапазонный сигнал HLB и поддиапазонный сигнал HHB могут быть сгенерированы соответственно для четырех поддиапазонов.

[0085] На этапе 1104 остаточный сигнал по меньшей мере одного из упомянутого одного или более поддиапазонных сигналов генерируется на основе упомянутого по меньшей мере одного из упомянутого одного или более поддиапазонных сигналов. В некоторых случаях по меньшей мере один из упомянутого одного или более поддиапазонных сигналов может быть отфильтрован по наклону, чтобы сгенерировать отфильтрованный по наклону сигнал. В одном примере, по меньшей мере один из упомянутого одного или более поддиапазонных сигналов может включать в себя поддиапазонный сигнал в поддиапазоне LLB (например, поддиапазонный сигнал 302 LLB на Фиг. 3). В некоторых случаях отфильтрованный по наклону сигнал может дополнительно обрабатываться инверсным фильтром LPC (например, инверсным фильтром 310 LPC) для генерирования остаточного сигнала.

[0086] На этапе 1106 определяется, что упомянутый по меньшей мере один из упомянутого одного или более поддиапазонных сигналов является интенсивным тоновым сигналом. В некоторых случаях, по меньшей мере один из упомянутого одного или более поддиапазонных сигналов определяется как интенсивный тоновый сигнал на основе по меньшей мере одного из текущего тонового усиления, сглаженного тонового усиления, продолжительности промежутка между тонами или спектрального наклона по меньшей мере одного из одного или более поддиапазоных сигналов.

[0087] В некоторых случаях тоновое усиление указывает периодичность сигнала, а сглаженное тоновое усиление представляет нормированное значение тонового усиления. В некоторых примерах нормированное тоновое усиление может составлять от 0 до 1. В этих примерах высокое значение нормированного тонового усиления (например, когда нормированное тоновое усиление близко к 1) может указывать на наличие сильных гармоник в спектральной области. В некоторых случаях короткая продолжительность промежутка между тонами означает, что частота первой гармоники (например, частота F0 906 на Фиг. 9) является большой (высокой). Если частота F0 первой гармоники относительно выше (например, F0>500 Гц) и уровень фонового спектра относительно ниже (например, ниже предварительно определенного порогового значения), то может быть обнаружен интенсивный тоновый сигнал. В некоторых случаях спектральный наклон может быть измерен посредством корреляции сегментарного сигнала на расстоянии одного дискретного отсчета или первого коэффициента отражения параметров LPC. В некоторых случаях спектральный наклон может использоваться, чтобы указать, содержит ли область очень низких частот значительную энергию или нет. Если энергия в области очень низких частот (например, частот ниже F0) относительно высока, интенсивный тоновый сигнал может не существовать.

[0088] На этапе 1108 операция взвешивания выполняется в отношении остаточного сигнала по меньшей мере одного из упомянутого одного или более поддиапазонных сигналов в ответ на определение того, что упомянутый по меньшей мере один из упомянутого одного или более поддиапазонных сигналов является интенсивным тоновым сигналом. В некоторых случаях, когда обнаруживается интенсивный тоновый сигнал, взвешивающий фильтр (например, взвешивающий фильтр 316) может применяться к остаточному сигналу. В некоторых случаях может быть сгенерирован взвешенный остаточный сигнал. В некоторых случаях операция взвешивания может не выполняться, если интенсивный тоновый сигнал не обнаружен.

[0089] Как отмечено, в случае интенсивного тонового сигнала ошибка кодирования в области низких частот может быть ощутимой из-за отсутствия эффекта слуховой маскировки. Если битовая скорость недостаточно высока, ошибок кодирования не избежать. Адаптивный взвешивающий фильтр (например, взвешивающий фильтр 316) и способы взвешивания, как описано в данном документе, могут использоваться для уменьшения ошибки кодирования и улучшения качества сигнала в области низких частот. Однако в некоторых случаях это может увеличить ошибки кодирования на более высоких частотах, что может быть несущественным для качества восприятия интенсивных тоновых сигналов. В некоторых случаях адаптивный взвешивающий фильтр может быть в зависимости от условий включен и выключен на основе обнаружения интенсивного тонового сигнала. Как описано выше, взвешивающий фильтр может быть включен, когда обнаружен интенсивный тоновый сигнал, и может быть выключен, когда интенсивный тоновый сигнал не обнаружен. Таким образом, качество случаев с интенсивными тонами все еще может быть улучшено, в то время как качество случаев без интенсивных тонов может не снижаться.

[0090] На этапе 1110 квантованный остаточный сигнал генерируется на основе взвешенного остаточного сигнала, сгенерированного на этапе 1108. В некоторых случаях взвешенный остаточный сигнал вместе с вкладом LTP может обрабатываться блоком функции сложения для генерирования второго взвешенного остаточного сигнала. В некоторых случаях второй взвешенный остаточный сигнал может быть квантован для генерирования квантованного остаточного сигнала, который может быть дополнительно отправлен на сторону декодера (например, декодер 400 LLB на Фиг. 4).

[0091] На Фиг. 12 и на Фиг. 13 показаны примерные структуры кодера 1200 квантования остатка и декодера 1300 квантования остатка. В некоторых примерах кодер 1200 квантования остатка и декодер 1300 квантования остатка могут использоваться для обработки сигналов в поддиапазоне LLB. Как показано, кодер 1200 квантования остатка включает в себя компонент 1204 кодирования энергетической огибающей, компонент 1206 нормирования остатка, первый компонент 1210 кодирования с большим шагом, первый компонент 1212 с малым шагом, компонент 1214 целевой оптимизации, компонент 1216 регулировки битовой скорости, второй компонент 1218 кодирования с большим шагом и второй компонент 1220 кодирования с малым шагом.

[0092] Как показано, поддиапазонный сигнал 1202 LLB может сначала обрабатываться компонентом 1204 кодирования энергетической огибающей. В некоторых случаях энергетическая огибающая во временной области остаточного сигнала LLB может быть определена и квантована компонентом 1204 кодирования энергетической огибающей. В некоторых случаях квантованная энергетическая огибающая во временной области может быть отправлена на сторону декодера (например, декодера 1300). В некоторых примерах определенная энергетическая огибающая может иметь динамический диапазон от 12 дБ до 132 дБ в области остаточного сигнала, охватывающий очень низкий и очень высокий уровень. В некоторых случаях каждый подкадр в одном кадре имеет квантование одного уровня энергии, и пиковая энергия подкадра в кадре может быть непосредственно закодирована в области дБ. Энергии других подкадров в том же кадре могут кодироваться с использованием подхода кодирования Хаффмана путем кодирования разности между пиковой энергией и текущей энергией. В некоторых случаях, поскольку продолжительность одного подкадра может составлять всего около 2 мс, точность огибающей может быть приемлемой на основе принципа маскировки человеческого уха.

[0093] После наличия квантованной энергетической огибающей во временной области остаточный сигнал LLB может быть затем нормирован компонентом 1206 нормирования остатка. В некоторых случаях остаточный сигнал LLB может быть нормирован на основе квантованной энергетической огибающей во временной области. В некоторых примерах остаточный сигнал LLB может быть разделен квантованной энергетической огибающей во временной области для генерирования нормированного остаточного сигнала LLB. В некоторых случаях нормированный остаточный сигнал LLB может использоваться в качестве начального целевого сигнала 1208 для начального квантования. В некоторых случаях начальное квантование может включать в себя два этапа кодирования/квантования. В некоторых случаях первый этап кодирования/квантования включает в себя кодирование Хаффмана с большим шагом, а второй этап кодирования/квантования включает в себя равномерное кодирование с малым шагом. Как показано, начальный целевой сигнал 1208, который является нормированным остаточным сигналом LLB, может быть сначала обработан компонентом 1210 кодирования Хаффмана с большим шагом. Для звукового кодека высокого разрешения каждый дискретный отсчет остатка может быть квантован. Кодирование Хаффмана может сэкономить биты за счет использования специального распределения вероятностей индекса квантования. В некоторых случаях, когда размер шага квантования остатка достаточно велик, распределение вероятностей индекса квантования становится подходящим для кодирования Хаффмана. В некоторых случаях результат квантования из квантования с большим шагом может быть неоптимальным. Равномерное квантование может быть добавлено с меньшим шагом квантования после кодирования Хаффмана. Как показано, компонент 1212 равномерного кодирования с малым шагом может использоваться для квантования выходного сигнала от компонента 1210 кодирования Хаффмана с большим шагом. Таким образом, первый этап кодирования/квантования нормированного остаточного сигнала LLB выбирает относительно большой шаг квантования, потому что специальное распределение квантованного индекса кодирования приводит к более эффективному кодированию Хаффмана, а второй этап кодирования/квантования использует относительно простое равномерное кодирование с относительно небольшим шагом квантования, чтобы дополнительно уменьшить ошибки квантования от кодирования/квантования первого этапа.

[0094] В некоторых случаях начальный остаточный сигнал может быть идеальным целевым опорным сигналом, если квантование остатка не имеет ошибки или имеет достаточно маленькую ошибку. Если битовая скорость кодирования недостаточно высока, ошибка кодирования всегда может существовать и не является незначительной. Следовательно, этот начальный остаточный целевой опорный сигнал 1208 может быть субоптимальным для квантования с точки зрения восприятия. Хотя начальный остаточный целевой опорный сигнал 1208 является субоптимальным с точки зрения восприятия, он может обеспечить быструю оценку ошибки квантования, которая может использоваться не только для регулировки битовой скорости кодирования (например, посредством компонента 1216 регулировки битовой скорости), но также может быть использована для построения оптимизированного для восприятия целевого опорного сигнала. В некоторых случаях оптимизированный для восприятия целевой опорный сигнал может быть сгенерирован компонентом 1214 целевой оптимизации на основе начального остаточного целевого опорного сигнала 1208 и выходного сигнала начального квантования (например, выходного сигнала компонента 1212 равномерного кодирования с малым шагом).

[0095] В некоторых случаях оптимизированный целевой опорный сигнал может быть построен таким образом, чтобы минимизировать влияние ошибок не только текущего дискретного отсчета, но также предыдущих дискретных отсчетов и будущих дискретных отсчетов. Кроме того, он может оптимизировать распределение ошибок в спектральной области для учета эффекта маскировки восприятия человеческого уха.

[0096] После того, как оптимизированный целевой опорный сигнал построен компонентом 1214 целевой оптимизации, кодирование Хаффмана первого этапа и равномерное кодирование второго этапа могут быть выполнены снова, чтобы заменить первый (начальный) результат квантования и получить лучшее качество восприятия. В этом примере второй компонент 1218 кодирования Хаффмана с большим шагом и второй компонент 1220 равномерного кодирования с малым шагом могут использоваться для выполнения кодирования Хаффмана первого этапа и равномерного кодирования второго этапа для оптимизированного целевого опорного сигнала. Квантование начального целевого опорного сигнала и оптимизированного целевого опорного сигнала будет обсуждаться ниже более подробно.

[0097] В некоторых примерах не квантованный остаточный сигнал или начальный целевой остаточный сигнал могут быть представлены как r_i(n). Используя r_i(n) в качестве цели, остаточный сигнал можно сначала квантовать, чтобы получить первый квантованный остаточный сигнал, обозначенный как На основе r_i(n), и импульсной характеристикиh_w(n) взвешивающего по восприятию фильтраможно оценить оптимизированный для восприятияцелевой остаточный сигнал r_o(n). Используя r_o(n) в качестве обновленной или оптимизированной цели, остаточный сигнал можно снова квантовать, чтобы получить второй квантованный остаточный сигнал, обозначенный как который был оптимизирован для восприятия, чтобы заменить первый квантованный остаточный сигнал В некоторых случаях h_w(n) может быть определена многими возможными способами, например, путем оценки h_w(n) на основе фильтра LPC.

[0098] В некоторых случаях фильтр LPC для поддиапазона LLB может быть выражен следующим образом:

[0099]

[0100] Взвешенный по восприятию фильтр W(z) можно определить как:

[0101]

[0102] где α - постоянный коэффициент, 0<α<1. γ может быть первым коэффициентом отражения фильтра LPC или просто константой, -1<γ<1. Импульсную характеристику фильтра W(z) можно определить как h_w(n). В некоторых случаях длина h_w(n) зависит от значений α и γ. В некоторых случаях, когда α и γ близки к нулю, длина h_w(n) становится короткой и быстро спадает до нуля. С точки зрения вычислительной сложности оптимально иметь короткую импульсную характеристику h_w(n). В случае, если h_w(n) недостаточно короткая, ее можно умножить на половину окна Хэмминга или половину окна Хэннинга, чтобы заставить h_w(n) быстро спадать до нуля. После получения импульсной характеристики h_w(n) цель в области взвешенного по восприятию сигнала может быть выражена как

[0103]

[0104] что является сверткой между r_i(n) и h_w(n). Вклад первоначально квантованного остатка в области взвешенного по восприятию сигнала может быть выражен как

[0105]

[0106] Ошибка в области остатка

[0107]

[0108] минимизируется, поскольку он квантован в прямой области остатка. Однако ошибка в области взвешенного по восприятию сигнала

[0109]

[0110] не может быть минимизирована. Следовательно, может потребоваться минимизация ошибки квантования в области взвешенного по восприятию сигнала. В некоторых случаях все остаточные дискретные отсчеты могут квантоваться совместно. Однако это может вызвать дополнительные сложности. В некоторых случаях остаток можно квантовать из расчета на дискретный отсчет, но с оптимизацией восприятия. Например, может быть изначально установлено для всех дискретных отсчетов в текущем кадре. Предположим, что все дискретные отсчеты были квантованы, за исключением того, что дискретный отсчет в m не квантован, то наилучшее с точки зрения восприятия значение теперь в m не равноr_i(m), а должно быть

[0111]

[0112] где <T_g'(n), h_w(n)> представляет взаимную корреляцию между вектором {T_g'(n)} и вектором {h_w(n)}, в котором длина вектора равна длине импульсной характеристики h_w(n), а начальная точка вектора {T_g'(n)} находится в m. ||h_w(n)|| - энергия вектора {h_w(n)}, которая является постоянной энергией в одном и том же кадре. T_g'(n) можно выразить как

[0113]

[0114] Как только оптимизированное для восприятия новое целевое значениеr_o(m) определено, оно может быть снова квантовано для генерирования r_ô(m) способом, аналогичным начальному квантованию, включая кодирование Хаффмана с большим шагом и равномерное кодирование с малым шагом. Затем m перейдет к следующей позиции дискретного отсчета. Вышеупомянутая обработка повторяется от дискретного отсчета к дискретному отсчету, в то время как выражения (7) и (8) обновляются новыми результатами до тех пор, пока все дискретные отсчеты не будут оптимально квантованы. Во время каждого обновления для каждого m выражение (8) не нужно пересчитывать, потому что большинство дискретных отсчетов в {r_ô(k)} не изменяется. Знаменатель в выражении (7) является постоянным, так что деление может стать постоянным умножением.

[0115] На стороне декодера, как показано на Фиг. 13, квантованные значения от декодирования 1302 Хаффмана с большим шагом и равномерного декодирования 1304 с малым шагом суммируются вместе посредством блока 1306 функции сложения для генерирования нормированного остаточного сигнала. Нормированный остаточный сигнал может обрабатываться компонентом 1308 декодирования энергетической огибающей во временной области для генерирования декодированного остаточного сигнала 1310.

[0116] На Фиг. 14 показана блок-схема последовательности операций, иллюстрирующая примерный способ 1400 выполнения квантования остатка для сигнала. В некоторых случаях способ 1400 может быть реализован устройством звукового кодека (например, кодером 300 LLB или кодером 1200 квантования остатка). В некоторых случаях способ 1100 может быть реализован любым подходящим устройством.

[0117] Способ 1400 начинается на этапе 1402, где определяется энергетическая огибающая во временной области входного остаточного сигнала. В некоторых случаях входной остаточный сигнал может быть остаточным сигналом в поддиапазоне LLB (например, остаточный сигнал 1202 LLB).

[0118] На этапе 1404 энергетическая огибающая во временной области входного остаточного сигнала квантуется для генерирования квантованной энергетической огибающей во временной области. В некоторых случаях квантованная энергетическая огибающая во временной области может быть отправлена на сторону декодера (например, декодера 1300).

[0119] На этапе 1406 входной остаточный сигнал нормируется на основе квантованной энергетической огибающей во временной области, чтобы сгенерировать первый целевой остаточный сигнал. В некоторых случаях остаточный сигнал LLB может быть разделен квантованной энергетической огибающей во временной области для генерирования нормированного остаточного сигнала LLB. В некоторых случаях нормированный остаточный сигнал LLB может использоваться в качестве начального целевого сигнала для начального квантования.

[0120] На этапе 1408 выполняется первое квантование в отношении первого целевого остаточного сигнала на первой битовой скорости, чтобы сгенерировать первый квантованный остаточный сигнал. В некоторых случаях первое квантование остатка может включать в себя два этапа субквантования/кодирования. Первый этап субквантования может выполняться в отношении первого целевого остаточного сигнала на первом этапе квантования, чтобы сгенерировать первый выходной сигнал субквантования. Второй этап субквантования может выполняться в отношении первого выходного сигнала субквантования на втором этапе квантования, чтобы сгенерировать первый квантованный остаточный сигнал. В некоторых случаях шаг первого квантования больше, чем шаг второго квантования по размеру. В некоторых примерах первый этап субквантования может быть кодированием Хаффмана с большим шагом, а второй этап субквантования может быть равномерным кодированием с малым шагом.

[0121] В некоторых случаях первый целевой остаточный сигнал включает в себя множество дискретных отсчетов. Первое квантование может выполняться в отношении первого целевого остаточного сигнала из расчета на дискретный отсчет. В некоторых случаях это может снизить сложность квантования, тем самым повышая эффективность квантования.

[0122] На этапе 1410 генерируется второй целевой остаточный сигнал на основе, по меньшей мере, первого квантованного остаточного сигнала и первого целевого остаточного сигнала. В некоторых случаях второй целевой остаточный сигнал может быть сгенерирован на основе первого целевого остаточного сигнала, первого квантованного остаточного сигнала и импульсной характеристики h_w(n) фильтра взвешивания по восприятию. В некоторых случаях оптимизированный для восприятия целевой остаточный сигнал, который является вторым целевым остаточным сигналом, может быть сгенерирован для второго квантования остатка.

[0123] На этапе 1412 выполняется второе квантование остатка в отношении второго целевого остаточного сигнала на второй битовой скорости, чтобы сгенерировать второй квантованный остаточный сигнал. В некоторых случаях вторая битовая скорость может отличаться от первой битовой скорости. В одном примере вторая битовая скорость может быть выше первой битовой скорости. В некоторых случаях ошибка кодирования от первого квантования остатка при первой битовой скорости может быть незначительной. В некоторых случаях битовая скорость кодирования может быть отрегулирована (например, повышена) при втором квантовании остатка, чтобы уменьшить скорость кодирования.

[0124] В некоторых случаях второе квантование остатка аналогично первому квантованию остатка. В некоторых примерах второе квантование остатка также может включать в себя два этапа субквантования/кодирования. В этих примерах первый этап субквантования может выполняться в отношении второго целевого остаточного сигнала с большим шагом квантования, чтобы сгенерировать выходной сигнал субквантования. Второй этап субквантования может выполняться в отношении выходного сигнала субквантования с малым шагом квантования, чтобы сгенерировать второй квантованный остаточный сигнал. В некоторых случаях первый этап субквантования может быть кодированием Хаффмана с большим шагом, а второй этап субквантования может быть однородным кодированием с малым шагом. В некоторых случаях второй квантованный остаточный сигнал может быть отправлен на сторону декодера (например, декодер 1300) через канал потоковой передачи битов.

[0125] Как отмечено на Фиг. 3, 4, LTP может по условию включаться и выключаться для лучшего PLC. В некоторых случаях, когда битовая скорость кодека недостаточно высока для достижения прозрачного качества, LTP очень полезен для периодических и гармонических сигналов. Для кодека высокого разрешения может потребоваться решить две проблемы для применения LTP: (1) вычислительная сложность должна быть уменьшена, поскольку традиционный LTP может стоить очень высокой вычислительной сложности в среде с высокой частотой дискретизации; и (2) отрицательное влияние маскировки потери пакетов (PLC) должно быть ограничено, поскольку LTP использует межкадровую корреляцию и может вызвать распространение ошибки, когда происходит потеря пакета в канале передачи.

[0126] В некоторых случаях поиск промежутка между тонами добавляет к LTP дополнительную вычислительную сложность. Для повышения эффективности кодирования может потребоваться более эффективный протокол LTP. Примерный процесс поиска промежутка между тонами описывается ниже со ссылкой на Фиг. 15-16.

[0127] На Фиг. 15 показан пример вокализованной речи, в которой промежуток 1502 между тонами представляет расстояние между двумя соседними периодическими циклами (например, расстояние между пиками P1 и P2). Некоторые музыкальные сигналы могут иметь не только сильную периодичность, но и стабильный промежуток между тонами (почти постоянный промежуток между тонами).

[0128] На Фиг. 16 показан примерный процесс 1600 выполнения управления LTP для лучшего маскирования потери пакетов. В некоторых случаях процесс 1600 может быть реализован устройством кодека (например, кодером 100 или кодером 300). В некоторых случаях процесс 1600 может быть реализован любым подходящим устройством. Процесс 1600 включает в себя поиск промежутка между тонами (который будет описан ниже для краткости как «тоны») и управление LTP. Как правило, поиск тонов может быть затруднен при высокой частоте дискретизации традиционным способом из-за большого количества потенциально подходящих тонов. Описанный здесь процесс 1600 может включать в себя три фазы/этапа. Во время первой фазы/этапа сигнал (например, сигнал 1602 LLB) может быть отфильтрован 1604 по нижним частотам, поскольку периодичность в основном находится в области нижних частот. Затем отфильтрованный сигнал может быть подвергнут понижающей дискретизации, чтобы сгенерировать входной сигнал для быстрого начального грубого поиска 1608 тонов. В одном примере сигнал с пониженной дискретизацией генерируется с частотой дискретизации 2 кГц. Поскольку общее количество потенциально подходящих тонов при низкой частоте дискретизации невелико, грубый результат тонов может быть получен быстро путем поиска всех потенциально подходящих тонов с низкой частотой дискретизации. В некоторых случаях начальный поиск 1608 тонов может выполняться с использованием традиционного подхода максимизации нормированной взаимной корреляции с коротким окном или автокорреляции с большим окном.

[0129] Поскольку результат начального поиска тонов может быть относительно грубым, точный поиск с использованием подхода взаимной корреляции в окрестности множества начальных тонов может все еще быть сложным при высокой частоте дискретизации (например, 24 кГц). Следовательно, во время второй фазы/этапа (например, быстрого точного поиска 1610 тонов) точность тонов может быть увеличена в области формы сигнала путем простого просмотра местоположений пиков формы сигнала при низкой частоте дискретизации. Затем во время третьей фазы/этапа (например, оптимизированного точного поиска 1612 тонов) результат точного поиска тонов из второй фазы/этапа может быть оптимизирован посредством подхода взаимной корреляции в пределах небольшого диапазона поиска при высокой частоте дискретизации.

[0130] Например, во время первой фазы/этапа (например, начальный поиск 1608 тонов) может быть получен результат начального грубого поиска тонов на основе всех потенциально подходящих тонов, которые были найдены. В некоторых случаях окрестность потенциально подходящих тонов может быть определена на основе результата начального грубого поиска тонов и может использоваться для второй фазы/этапа для получения более точного результата поиска тонов. Во время второй фазы/этапа (например, быстрого точного поиска 1610 тонов) местоположения пиков формы волны могут быть определены на основе потенциально подходящих тонов и в пределах окрестности потенциально подходящих тонов, как определено на первом этапе/фазе. В одном примере, показанном на Фиг. 15 положение P1 первого пика на Фиг. 15, может быть определено в пределах ограниченного диапазона поиска, заданного из результата начального поиска тонов (например, окрестность потенциально подходящих тонов определена примерно на 15% отклонения от первой фазы/этапа). Местоположение P2 второго пика на Фиг. 15 можно определить аналогичным образом. Разница местоположения между P1 и P2 становится гораздо более точной оценкой тонов, чем первоначальная оценка тонов. В некоторых случаях более точная оценка тонов, полученная из второй фазы/этапа, может использоваться для определения второй окрестности потенциально подходящих тонов, которая может использоваться на третьей фазе/этапе, чтобы найти оптимизированный точный промежуток между тонами, например, окрестность потенциально подходящих тонов определена около 15% отклонения от второй фазы/этапа. Во время третьей фазы/этапа (например, оптимизированного точного поиска 1612 тонов) оптимизированный точный промежуток между тонами можно искать посредством подхода нормированной взаимной корреляции в пределах очень небольшого диапазона поиска (например, второй окрестности потенциально подходящих тонов).

[0131] В некоторых случаях, если LTP всегда включен, то PLC может быть неоптимальным из-за возможного распространения ошибки при потере пакета битового потока. В некоторых случаях LTP может быть включен, если он может эффективно улучшить качество звука и не окажет существенного влияния на PLC. На практике LTP может быть эффективным, когда тоновое усиление является высоким и стабильным, что означает, что высокая периодичность сохраняется для, по меньшей мере, нескольких кадров (а не только для одного кадра). В некоторых случаях в области сигнала с высокой периодичностью PLC относительно прост и эффективен, поскольку PLC всегда использует периодичность для копирования предыдущей информации в текущий потерянный кадр. В некоторых случаях стабильный промежуток между тонами также может снизить негативное влияние на PLC. Стабильный промежуток между тонами означает, что значение промежутка между тонами существенно не меняется для, по меньшей мере, нескольких кадров, что, вероятно, приведет к стабильному тону в ближайшем будущем. В некоторых случаях, когда текущий кадр пакета битового потока теряется, PLC может использовать предыдущую информацию тонов для восстановления текущего кадра. Таким образом, стабильный промежуток между тонами может помочь в текущей оценке тонов для PLC.

[0132] Продолжая пример со ссылкой на Фиг. 16, обнаружение 1614 периодичности и обнаружение 1616 стабильности выполняются до принятия решения о включении или выключении LTP. В некоторых случаях, когда тоновое усиление стабильно велико, и промежуток между тонами относительно стабилен, LTP может быть включен. Например, тоновое усиление может быть установлено для высокопериодических и стабильных кадров (например, тоновое усиление стабильно выше 0,8), как показано на этапе 1618. В некоторых случаях, как показано на Фиг. 3, сигнал вклада LTP может быть сгенерирован и объединен с взвешенным остаточным сигналом для генерирования входного сигнала для квантования остатка. С другой стороны, если тоновое усиление нестабильно и/или промежуток между тонами нестабилен, LTP может быть отключен.

[0133] В некоторых случаях LTP может быть также отключен для одного или двух кадров, если LTP был ранее включен для нескольких кадров, чтобы избежать возможного распространения ошибки при потере пакета битового потока. В одном примере, как показано на этапе 1620, тоновое усиление может быть по условию сброшено до нуля для лучшего PLC, например, когда LTP был ранее включен для нескольких кадров. В некоторых случаях, когда LTP выключен, в системе кодирования с переменной битовой скоростью может быть установлена немного большая битовая скорость кодирования. В некоторых случаях, когда решено включить LTP, тоновое усиление и промежуток между тонами могут быть квантованы и отправлены на сторону декодера, как показано на этапе 1622.

[0134] На Фиг. 17 показан пример спектрограмм звукового сигнала. Как показано, спектрограмма 1702 показывает частотно-временной график звукового сигнала. Показано, что спектрограмма 1702 включает в себя множество гармоник, что указывает на высокую периодичность звукового сигнала. Спектрограмма 1704 показывает исходное тоновое усиление звукового сигнала. Показано, что тоновое усиление является стабильно высоким в течение большей части времени, что также указывает на высокую периодичность звукового сигнала. Спектрограмма 1706 показывает сглаженное тоновое усиление (корреляцию тонов) звукового сигнала. В этом примере сглаженное тоновое усиление представляет нормированное тоновое усиление. Спектрограмма 1708 показывает промежуток между тонами, а спектрограмма 1710 показывает квантованное тоновое усиление. Показано, что промежуток между тонами относительно стабилен в течение большей части времени. Как показано, тоновое усиление периодически сбрасывается на ноль, что указывает на то, что LTP выключается, чтобы избежать распространения ошибки. Квантованное тоновое усиление также устанавливается на ноль, когда LTP выключен.

[0135] На Фиг. 18 показана блок-схема последовательности операций, иллюстрирующая примерный способ 1800 выполнения LTP. В некоторых случаях способ 1400 может быть реализован устройством звукового кодека (например, кодером 300 LLB). В некоторых случаях способ 1100 может быть реализован любым подходящим устройством.

[0136] Способ 1800 начинается с этапа 1802, где входной звуковой сигнал принимается на первой частоте дискретизации. В некоторых случаях звуковой сигнал может включать в себя множество первых дискретных отсчетов, где множество первых дискретных отсчетов генерируется на первой частоте дискретизации. В одном примере множество первых дискретных отсчетов может быть сгенерировано с частотой дискретизации 96 кГц.

[0137] На этапе 1804 производится понижающая дискретизация звукового сигнала. В некоторых случаях множество первых отсчетов звукового сигнала может подвергаться понижающей дискретизации для генерирования множества вторых дискретных отсчетов со второй частотой дискретизации. В некоторых случаях вторая частота дискретизации ниже первой частоты дискретизации. В этом примере множество вторых дискретных отсчетов может быть сгенерировано на частоте дискретизации 2 кГц.

[0138] На этапе 1806 определяется первый промежуток между тонами при второй частоте дискретизации. Поскольку общее количество потенциально подходящих тонов при низкой частоте дискретизации невелико, грубый результат тонов может быть получен быстро путем поиска всех потенциально подходящих тонов с низкой частотой дискретизации. В некоторых случаях множество потенциально подходящих тонов может быть определено на основе множества вторых дискретных отсчетов при второй частоте дискретизации. В некоторых случаях первый промежуток между тонами может определяться на множестве потенциально подходящих тонов. В некоторых случаях первый промежуток между тонами может быть определен путем максимизации нормированной взаимной корреляции с первым окном или автокорреляции со вторым окном, где второе окно больше, чем первое окно.

[0139] На этапе 1808 определяется второй промежуток между тонами на основе первого промежутка между тонами, как определено на этапе 1804. В некоторых случаях первый диапазон поиска может быть определен на основе первого промежутка между тонами. В некоторых случаях местоположение первого пика и местоположение второго пика могут быть определены в пределах первого диапазона поиска. В некоторых случаях второй промежуток между тонами может быть определен на основе местоположения первого пика и местоположения второго пика. Например, разность местоположений между местоположением первого пика и местоположением второго пика может использоваться для определения второго промежутка между тонами.

[0140] На этапе 1810 третий промежуток между тонами определяется на основе второго промежутка между тонами, как определено на этапе 1808. В некоторых случаях второй промежуток между тонами может использоваться для определения окрестности потенциально подходящих тонов, которая может использоваться для поиска оптимизированного промежутка между тонами. Например, второй диапазон поиска может быть определен на основе второго промежутка между тонами. В некоторых случаях третий промежуток между тонами может определяться в пределах второго диапазона поиска с третьей частотой дискретизации. В некоторых случаях третья частота дискретизации выше, чем вторая частота дискретизации. В этом примере третья частота дискретизации может составлять 24 кГц. В некоторых случаях третий промежуток между тонами может быть определен с использованием подхода нормированной взаимной корреляции в пределах второго диапазона поиска при третьей частоте дискретизации. В некоторых случаях третий промежуток между тонами может быть определен как промежуток между тонами входного звукового сигнала.

[0141] На этапе 1812 определяется, что тоновое усиление входного звукового сигнала превысило предварительно определенное пороговое значение и что изменение промежутка между тонами входного звукового сигнала было в пределах предварительно определенного диапазона для, по меньшей мере, предварительно определенного количества кадров. LTP может быть более эффективным, когда тоновое усиление является высоким и стабильным, что означает, что высокая периодичность сохраняется для, по меньшей мере, нескольких кадров (а не только для одного кадра). В некоторых случаях стабильный промежуток между тонами также может снизить негативное влияние на PLC. Стабильный промежуток между тонами означает, что значение промежутка между тонами существенно не меняется для, по меньшей мере, нескольких кадров, что, вероятно, приведет к стабильной высоте звука в ближайшем будущем.

[0142] На этапе 1814 устанавливается тоновое усиление для текущего кадра входного звукового сигнала в ответ на определение того, что тоновое усиление входного звукового сигнала превысило предварительно определенное пороговое значение и что изменение третьего промежутка между тонами было в пределах предварительно определенного диапазона для, по меньшей мере, предварительно определенного количества предыдущих кадров. Таким образом, тоновое усиление устанавливается для высокопериодических и стабильных кадров, чтобы улучшить качество сигнала, не влияя на PLC.

[0143] В некоторых случаях в ответ на определение того, что тоновое усиление входного звукового сигнала ниже предварительно определенного порогового значения и/или что изменение третьего промежутка между тонами не было в пределах предварительно определенного диапазона, по меньшей мере, в течение предварительно определенного количества предыдущих кадров, тоновое усиление устанавливается на ноль для текущего кадра входного звукового сигнала. Таким образом, распространение ошибок может быть уменьшено.

[0144] Как отмечалось, каждый дискретный отсчет остатка квантуется для звукового кодека высокого разрешения. Это означает, что вычислительная сложность и битовая скорость кодирования квантования дискретных отсчетов остатка не могут существенно измениться при изменении размера кадра с 10 мс до 2 мс. Однако вычислительная сложность и битовая скорость кодирования некоторых параметров кодека, таких как LPC, могут резко возрасти, когда размер кадра изменяется с 10 мс до 2 мс. Обычно параметры LPC необходимо квантовать и передавать для каждого кадра. В некоторых случаях дифференциальное кодирование LPC между текущим кадром и предыдущим кадром может сохранять биты, но оно также может вызывать распространение ошибки, когда пакет битового потока теряется в канале передачи. Следовательно, может быть установлен короткий размер кадра для достижения кодека с низкой задержкой. В некоторых случаях, когда размер кадра такой короткий, как 2 мс, битовая скорость кодирования параметров LPC может быть очень высокой, и вычислительная сложность также может быть высокой, поскольку продолжительность кадра находится в знаменателе битовой скорости или сложности.

[0145] В одном примере со ссылкой на квантование энергетической огибающей во временной области, показанное на Фиг. 12, если размер подкадра составляет 2 мс, то кадр 10 мс должен содержать 5 подкадров. Обычно каждый подкадр имеет уровень энергии, который необходимо квантовать. Поскольку один кадр содержит 5 подкадров, уровни энергии 5 подкадров могут быть квантованы совместно, так что битовая скорость кодирования энергетической огибающей во временной области ограничена. В некоторых случаях, когда размер кадра равен размеру подкадра или один кадр содержит один подкадр, битовая скорость кодирования может значительно увеличиваться, если каждый уровень энергии квантуется независимо. В этих случаях дифференциальное кодирование уровней энергии между последовательными кадрами может снизить битовую скорость кодирования. Однако такой подход может быть неоптимальным, поскольку он может вызвать распространение ошибки, когда пакет битового потока теряется в канале передачи.

[0146] В некоторых случаях векторное квантование в отношении параметров LPC может обеспечить более низкую битовую скорость. Однако это может потребовать большей вычислительной нагрузки. Простое скалярное квантование в отношении параметров LPC может иметь меньшую сложность, но требует более высокой битовой скорости. В некоторых случаях может использоваться специальное скалярное квантование, основанное на кодировании Хаффмана. Однако этого способа может быть недостаточно для очень короткого размера кадра или кодирования с очень малой задержкой. Новый способ квантования параметров LPC будет описан ниже со ссылкой на Фиг. 19-20.

[0147] На этапе 1902 определяется по меньшей мере одно из дифференциального наклона спектра и разности энергий между текущим кадром и предыдущим кадром звукового сигнала. Обращаясь к Фиг. 20 спектрограмма 2002 показывает частотно-временной график звукового сигнала. Спектрограмма 2004 показывает абсолютное значение дифференциального наклона спектра между текущим кадром и предыдущим кадром звукового сигнала. Спектрограмма 2006 показывает абсолютное значение разницы энергий между текущим кадром и предыдущим кадром звукового сигнала. Спектрограмма 2008 показывает решение о копировании, в котором 1 указывает, что текущий кадр будет копировать квантованные параметры LPC из предыдущего кадра, а 0 означает, что текущий кадр снова будет квантовать/отправлять параметры LPC. В этом примере абсолютные значения как дифференциального наклона спектра, так и разности энергий относительно очень малы в течение большей части времени, и они становятся относительно большими в конце (правая сторона).

[0148] На этапе 1904 обнаруживается стабильность звукового сигнала. В некоторых случаях спектральная стабильность звукового сигнала может быть определена на основе дифференциального наклона спектра и/или разности энергий между текущим кадром и предыдущим кадром звукового сигнала. В некоторых случаях спектральная стабильность звукового сигнала может дополнительно определяться на основе частоты звукового сигнала. В некоторых случаях абсолютное значение дифференциального наклона спектра может быть определено на основе спектра звукового сигнала (например, спектрограммы 2004). В некоторых случаях абсолютное значение разности энергий между текущим кадром и предыдущим кадром звукового сигнала также может быть определено на основе спектра звукового сигнала (например, спектрограммы 2006). В некоторых случаях, если определено, что изменение абсолютного значения дифференциального наклона спектра и/или изменение абсолютного значения разности энергий было в пределах предварительно определенного диапазона для, по меньшей мере, предварительно определенного количества кадров, то может быть определено, что обнаружена спектральная стабильность звукового сигнала.

[0149] На этапе 1906 квантованные параметры LPC для предыдущего кадра копируются в текущий кадр звукового сигнала в ответ на обнаружение спектральной стабильности звукового сигнала. В некоторых случаях, когда спектр звукового сигнала очень стабилен и он не меняется значимо от одного кадра к следующему, текущие параметры LPC для текущего кадра могут не кодироваться/квантоваться. Вместо этого предыдущие квантованные параметры LPC могут быть скопированы в текущий кадр, потому что не квантованные параметры LPC сохраняют почти ту же информацию от предыдущего кадра до текущего кадра. В таких случаях может быть отправлен только 1 бит, чтобы сообщить декодеру, что квантованные параметры LPC скопированы из предыдущего кадра, что приводит к очень низкой битовой скорости и очень низкой сложности для текущего кадра.

[0150] Если спектральная стабильность звукового сигнала не обнаружена, параметры LPC могут быть принудительно квантованы и снова закодированы. В некоторых случаях, если определяется, что изменение абсолютного значения дифференциального наклона спектра между текущим кадром и предыдущим кадром для звукового сигнала не было в пределах предварительно определенного диапазона для, по меньшей мере, предварительно определенного количества кадров, то может быть определено, что спектральная стабильность звукового сигнала не обнаружена. В некоторых случаях, если определяется, что изменение абсолютного значения разности энергий не было в пределах предварительно определенного диапазона для, по меньшей мере, предварительно определенного количества кадров, то может быть определено, что спектральная стабильность звукового сигнала не обнаружена.

[0151] На этапе 1908 определяется, что квантованные параметры LPC были скопированы для, по меньшей мере, предварительно определенного количества кадров до текущего кадра. В некоторых случаях, если квантованные параметры LPC были скопированы для нескольких кадров, параметры LPC могут быть принудительно квантованы и снова закодированы.

[0152] На этапе 1910 выполняется квантование в отношении параметров LPC для текущего кадра в ответ на определение того, что квантованные параметры LPC были скопированы для, по меньшей мере, предварительно определенного количества кадров. В некоторых случаях количество последовательных кадров для копирования квантованных параметров LPC ограничено, чтобы избежать распространения ошибки, когда пакет битового потока теряется в канале передачи.

[0153] В некоторых случаях решение о копировании LPC (как показано на спектрограмме 2008) может помочь в квантовании энергетической огибающей во временной области. В некоторых случаях, когда решение о копировании равно 1, дифференциальный уровень энергии между текущим кадром и предыдущим кадром может быть закодирован для сохранения битов. В некоторых случаях, когда решение о копировании равно 0, может выполняться прямое квантование уровня энергии, чтобы избежать распространения ошибки, когда пакет битового потока теряется в канале передачи.

[0154] На Фиг. 21 показана схема, иллюстрирующая примерную структуру электронного устройства 2100, описанного в настоящем раскрытии, согласно одному варианту реализации. Электронное устройство 2100 включает в себя один или более процессоров 2102, память 2104, схему 2106 кодирования и схему 2108 декодирования. В некоторых вариантах реализации электронное устройство 2100 может дополнительно включать в себя одну или более схем для выполнения любого одного или сочетания этапов, описанных в настоящем раскрытии.

[0155] Описанные варианты реализации заявляемого изобретения могут включать в себя одну или более функций, по отдельности или в сочетании.

[0156] В первом варианте реализации способ кодирования звука включает в себя: прием звукового сигнала, при этом звуковой сигнал содержит один или более поддиапазонных сигналов; генерирование остаточного сигнала по меньшей мере одного из упомянутого одного или более поддиапазонных сигналов на основе упомянутого по меньшей мере одного из упомянутого одного или более поддиапазонных сигналов; определение того, что упомянутый по меньшей мере один из упомянутого одного или более поддиапазонных сигналов является интенсивным тоновым сигналом; и в ответ на определение того, что упомянутый по меньшей мере один из упомянутого одного или более поддиапазонных сигналов является интенсивным тоновым сигналом, выполнение взвешивания в отношении остаточного сигнала упомянутого по меньшей мере одного из упомянутого одного или более поддиапазонных сигналов для генерирования взвешенного остаточного сигнала.

[0157] Каждый из вышеизложенных и других описанных вариантов реализации может, в необязательном порядке, включать в себя одну или более из следующих особенностей:

[0158] Первая особенность, сочетающаяся с любой из следующих особенностей, в которой один или более поддиапазонных сигналов включают в себя по меньшей мере один из следующих: сигнал нижней полосы нижней части нижнего диапазона (LLB); сигнал верхней части нижнего диапазона (LHB); сигнал нижней части верхнего диапазона (HLB); или сигнал верхней части верхнего диапазона (HHB).

[0159] Вторая особенность, сочетающаяся с любой из предыдущих или следующих особенностей, при которой генерирование остаточного сигнала упомянутого по меньшей мере одного из упомянутого одного или более поддиапазонных сигналов на основе упомянутого по меньшей мере одного из упомянутого одного или более поддиапазонных сигналов включает в себя: выполнение инверсной фильтрации кодирование с линейным предсказанием (LPC) по меньшей мере одного из упомянутого одного или более поддиапазонных сигналов для генерирования остаточного сигнала упомянутого по меньшей мере одного из упомянутого одного или более поддиапазонных сигналов.

[0160] Третья особенность, сочетающаяся с любой из предыдущих или следующих особенностей, в которой генерирование взвешенного остаточного сигнала упомянутого по меньшей мере одного из упомянутого одного или более поддиапазонных сигналов включает в себя: генерирование отфильтрованного по наклону сигнала из упомянутого по меньшей мере одного из упомянутого одного или более поддиапазонных сигналов на основе упомянутого по меньшей мере одного из упомянутого одного или более поддиапазонных сигналов.

[0161] Четвертая особенность, сочетающаяся с любой из предыдущих или следующих особенностей, в которой определение того, что упомянутый по меньшей мере один из упомянутого одного или более поддиапазонных сигналов является интенсивным тоновым сигналом, включает в себя: определение того, что упомянутый по меньшей мере один из упомянутого одного или более поддиапазонных сигналов является интенсивный тоновый сигнал на основе по меньшей мере одного из текущего тонового усиления, сглаженного тонового усиления, продолжительности промежутка между тонами или спектрального наклона упомянутого по меньшей мере одного из упомянутого одного или более поддиапазонных сигналов.

[0162] Пятая особенность, сочетающаяся с любой из предыдущих или следующих особенностей, в которой по меньшей мере один из упомянутого одного или более поддиапазонных сигналов содержит множество частот гармоник, и в которой определение того, что упомянутый по меньшей мере один из упомянутого одного или более поддиапазонных сигналов является интенсивный тоновый сигнал включает в себя: определение того, что частота первой гармоники из множества частот гармоник превышает первое предварительно определенное пороговое значение и что уровень фонового спектра упомянутого по меньшей мере одного из упомянутого одного или более поддиапазонных сигналов ниже второго предварительно определенного порогового значения.

[0163] Шестая особенность, сочетающаяся с любой из предыдущих или следующих особенностей, в которой выполнение взвешивания в отношении остаточного сигнала упомянутого по меньшей мере одного из упомянутого одного или более поддиапазонных сигналов включает в себя: выполнение взвешивания в отношении остаточного сигнала упомянутого по меньшей мере одного из упомянутого одного или более поддиапазонных сигналов посредством однополюсного фильтра нижних частот.

[0164] Седьмая особенность, сочетающаяся с любой из предыдущих особенностей, в которой способ дополнительно включает в себя: генерацию квантованного остаточного сигнала на основе, по меньшей мере, взвешенного остаточного сигнала упомянутого по меньшей мере одного из упомянутого одного или более поддиапазонных сигналов.

[0165] Во втором варианте реализации электронное устройство включает в себя: долговременное запоминающее хранилище, содержащее инструкции, и один или более аппаратных процессоров, осуществляющих связь с запоминающим хранилищем, при этом один или более аппаратных процессоров исполняют инструкции для: приема звукового сигнала, при этом звуковой сигнал содержит один или более поддиапазонных сигналов; генерирования остаточного сигнала по меньшей мере одного из упомянутого одного или более поддиапазонных сигналов на основе упомянутого по меньшей мере одного из упомянутого одного или более поддиапазонных сигналов; определения, что упомянутый по меньшей мере один из упомянутого одного или более поддиапазонных сигналов является интенсивным тоновым сигналом; и в ответ на определение того, что упомянутый по меньшей мере один из упомянутого одного или более поддиапазонных сигналов является интенсивным тоновым сигналом, выполнения взвешивание в отношении остаточного сигнала упомянутого по меньшей мере одного из упомянутого одного или более поддиапазонных сигналов для генерирования взвешенного остаточного сигнала.

[0166] Каждый из вышеизложенных и других описанных вариантов реализации может, в необязательном порядке, включать в себя одну или более из следующих особенностей:

[0167] Первая особенность, сочетающаяся с любой из следующих особенностей, в которой один или более поддиапазонных сигналов включают в себя по меньшей мере один из следующих: сигнал нижней части нижнего диапазона (LLB); сигнал верхней части нижнего диапазона (LHB); сигнал нижней части верхнего диапазона (HLB); или сигнал верхней части верхнего диапазона (HHB).

[0168] Вторая особенность, сочетающаяся с любой из предыдущих или следующих особенностей, при которой генерирование остаточного сигнала упомянутого по меньшей мере одного из упомянутого одного или более поддиапазонных сигналов на основе упомянутого по меньшей мере одного из упомянутого одного или более поддиапазонных сигналов включает в себя: выполнение инверсной фильтрации кодирования с линейным предсказанием (LPC) в отношении упомянутого по меньшей мере одного из упомянутого одного или более поддиапазонных сигналов для генерирования остаточного сигнала упомянутого по меньшей мере одного из упомянутого одного или более поддиапазонных сигналов.

[0169] Третья особенность, сочетающаяся с любой из предыдущих или следующих особенностей, в которой генерирование взвешенного остаточного сигнала упомянутого по меньшей мере одного из упомянутого одного или более поддиапазонных сигналов включает в себя: генерирование отфильтрованного по наклону сигнала из упомянутого по меньшей мере одного из упомянутого одного или более поддиапазонных сигналов на основе упомянутого по меньшей мере одного из упомянутого одного или более поддиапазонных сигналов.

[0170] Четвертая особенность, сочетающаяся с любой из предыдущих или следующих особенностей, в которой определение того, что упомянутый по меньшей мере один из упомянутого одного или более поддиапазонных сигналов является интенсивным тоновым сигналом, включает в себя: определение того, что упомянутый по меньшей мере один из упомянутого одного или более поддиапазонных сигналов является интенсивный тоновый сигнал на основе по меньшей мере одного из текущего тонового усиления, сглаженного тонового усиления, продолжительности промежутка между тонами или спектрального наклона упомянутого по меньшей мере одного из упомянутого одного или более поддиапазонных сигналов.

[0171] Пятая особенность, сочетающаяся с любой из предыдущих или следующих особенностей, в которой по меньшей мере один из упомянутого одного или более поддиапазонных сигналов содержит множество частот гармоник, и в которой определение того, что упомянутый по меньшей мере один из упомянутого одного или более поддиапазонных сигналов является интенсивный тоновый сигнал включает в себя: определение того, что частота первой гармоники из множества частот гармоник превышает первое предварительно определенное пороговое значение и что уровень фонового спектра упомянутого по меньшей мере одного из упомянутого одного или более поддиапазонных сигналов ниже второго предварительно определенного порогового значения.

[0172] Шестая особенность, сочетающаяся с любой из предыдущих или следующих особенностей, в которой выполнение взвешивания в отношении остаточного сигнала упомянутого по меньшей мере одного из упомянутого одного или более поддиапазонных сигналов включает в себя: выполнение взвешивания в отношении остаточного сигнала упомянутого по меньшей мере одного из упомянутого одного или более поддиапазонных сигналов посредством однополюсного фильтра нижних частот.

[0173] Седьмая особенность, сочетающаяся с любой из предыдущих особенностей, в которой один или более аппаратных процессоров дополнительно исполняют инструкции для: генерирования квантованного остаточного сигнала на основе, по меньшей мере, взвешенного остаточного сигнала упомянутого по меньшей мере одного из упомянутого одного или более поддиапазонных сигналов.

[0174] В третьем варианте реализации долговременный машиночитаемый носитель хранит компьютерные инструкции для кодирования звука, которые при их исполнении одним или более аппаратными процессорами предписывают одному или более аппаратным процессорам выполнять операции, включающие в себя: прием звукового сигнала, причем звуковой сигнал содержит один или более поддиапазонных сигналов; генерирование остаточного сигнала по меньшей мере одного из упомянутого одного или более поддиапазонных сигналов на основе упомянутого по меньшей мере одного из упомянутого одного или более поддиапазонных сигналов; определение того, что упомянутый по меньшей мере один из упомянутого одного или более поддиапазонных сигналов является интенсивным тоновым сигналом; и в ответ на определение того, что упомянутый по меньшей мере один из упомянутого одного или более поддиапазонных сигналов является интенсивным тоновым сигналом, выполнение взвешивания в отношении остаточного сигнала упомянутого по меньшей мере одного из упомянутого одного или более поддиапазонных сигналов для генерирования взвешенного остаточного сигнала.

[0175] Каждый из вышеизложенных и других описанных вариантов реализации может, в необязательном порядке, включать в себя одну или более из следующих особенностей:

[0176] Первая особенность, сочетающаяся с любой из следующих особенностей, в которой один или более поддиапазонных сигналов включают в себя по меньшей мере один из следующих: сигнал нижней части нижнего диапазона (LLB); сигнал верхней части нижнего диапазона (LHB); сигнал нижней части верхнего диапазона (HLB); или сигнал верхней части верхнего диапазона (HHB).

[0177] Вторая особенность, сочетающаяся с любой из предыдущих или следующих особенностей, при которой генерирование остаточного сигнала упомянутого по меньшей мере одного из упомянутого одного или более поддиапазонных сигналов на основе упомянутого по меньшей мере одного из упомянутого одного или более поддиапазонных сигналов включает в себя: выполнение инверсной фильтрации кодирования с линейным предсказанием (LPC) в отношении упомянутого по меньшей мере одного из упомянутого одного или более поддиапазонных сигналов для генерирования остаточного сигнала упомянутого по меньшей мере одного из упомянутого одного или более поддиапазонных сигналов.

[0178] Третья особенность, сочетающаяся с любой из предыдущих или следующих особенностей, в которой генерирование взвешенного остаточного сигнала упомянутого по меньшей мере одного из упомянутого одного или более поддиапазонных сигналов включает в себя: генерирование отфильтрованного по наклону сигнала из упомянутого по меньшей мере одного из упомянутого одного или более поддиапазонных сигналов на основе упомянутого по меньшей мере одного из упомянутого одного или более поддиапазонных сигналов.

[0179] Четвертая особенность, сочетающаяся с любой из предыдущих или следующих особенностей, в которой определение того, что упомянутый по меньшей мере один из упомянутого одного или более поддиапазонных сигналов является интенсивным тоновым сигналом, включает в себя: определение того, что упомянутый по меньшей мере один из упомянутого одного или более поддиапазонных сигналов является интенсивный тоновый сигнал на основе по меньшей мере одного из текущего тонового усиления, сглаженного тонового усиления, продолжительности промежутка между тонами или спектрального наклона упомянутого по меньшей мере одного из упомянутого одного или более поддиапазонных сигналов.

[0180] Пятая особенность, сочетающаяся с любой из предыдущих или следующих особенностей, в которой по меньшей мере один из упомянутого одного или более поддиапазонных сигналов содержит множество частот гармоник, и в которой определение того, что упомянутый по меньшей мере один из упомянутого одного или более поддиапазонных сигналов является интенсивный тоновый сигнал включает в себя: определение того, что частота первой гармоники из множества частот гармоник превышает первое предварительно определенное пороговое значение и что уровень фонового спектра упомянутого по меньшей мере одного из упомянутого одного или более поддиапазонных сигналов ниже второго предварительно определенного порогового значения.

[0181] Шестая особенность, сочетающаяся с любой из предыдущих или следующих особенностей, в которой выполнение взвешивания в отношении остаточного сигнала упомянутого по меньшей мере одного из упомянутого одного или более поддиапазонных сигналов включает в себя: выполнение взвешивания в отношении остаточного сигнала упомянутого по меньшей мере одного из упомянутого одного или более поддиапазонных сигналов посредством однополюсного фильтра нижних частот.

[0182] Седьмая особенность, сочетающаяся с любой из предыдущих особенностей, в которой операции дополнительно включают в себя: генерирование квантованного остаточного сигнала на основе, по меньшей мере, взвешенного остаточного сигнала упомянутого по меньшей мере одного из упомянутого одного или более поддиапазонных сигналов.

[0183] Несмотря на то, что в настоящем раскрытии представлено несколько вариантов осуществления, можно понять, что раскрытые системы и способы могут быть воплощены во многих других конкретных формах, не выходя за рамки сущности или объема настоящего раскрытия. Настоящие примеры следует рассматривать как иллюстративные, а не как ограничительные, и цель не ограничиваться приведенными здесь подробностями. Например, различные элементы или компоненты могут быть объединены или интегрированы в другую систему, или определенные функции могут быть опущены или не реализованы.

[0184] Кроме того, методики, системы, подсистемы и способы, описанные и проиллюстрированные в различных вариантах осуществления как дискретные или отдельные, могут быть объединены или интегрированы с другими системами, компонентами, технологиями или способами без отклонения от объема настоящего раскрытия. Другие примеры изменений, замен и переделок могут быть установлены специалистом в данной области техники и могут быть выполнены без отклонения от сущности и объема, раскрытых в данном документе.

[0185] Варианты осуществления изобретения и все функциональные операции, описанные в данном документе, могут быть реализованы в цифровых электронных схемах, или в компьютерном программном обеспечении, встроенном программном обеспечении или аппаратном обеспечении, включая структуры, раскрытые в данном документе, и их структурные эквиваленты, или в сочетаниях одного или более из них. Варианты осуществления изобретения могут быть реализованы как один или более компьютерных программных продуктов, то есть один или более модулей компьютерных программных инструкций, закодированных на машиночитаемом носителе, для выполнения или управления работой устройства обработки данных. Машиночитаемый носитель может быть долговременным машиночитаемым носителем данных, машиночитаемым запоминающим устройством, машиночитаемой подложкой для хранения данных, запоминающим устройством, композицией, влияющей на машиночитаемый распространяемый сигнал, или сочетанием одного или более из них. Термин «устройство обработки данных» охватывает все устройства, оборудование и машины для обработки данных, включая, например, программируемый процессор, компьютер или множество процессоров или компьютеров. Устройство может включать в себя, помимо аппаратного обеспечения, код, который создает среду выполнения для рассматриваемой компьютерной программы, например, код, который составляет микропрограммное обеспечение процессора, стек протоколов, систему управления базой данных, операционную систему или сочетание одного или более из них. Распространяемый сигнал - это искусственно созданный сигнал, например, электрический, оптический или электромагнитный сигнал, генерируемый машиной, который генерируется для кодирования информации для передачи в подходящее приемное устройство.

[0186] Компьютерная программа (также известная как программа, программное обеспечение, программное приложение, сценарий или код) может быть написана на любом языке программирования, включая скомпилированные или интерпретируемые языки, и может быть развернута в любой форме, в том числе как стандартная отдельная программа или как модуль, компонент, подпрограмма или другое устройство, подходящее для использования в вычислительной среде. Компьютерная программа не обязательно соответствует файлу в файловой системе. Программа может храниться в части файла, который содержит другие программы или данные (например, один или более сценариев, хранящихся в документе на языке разметки), в одном файле, посвященном рассматриваемой программе, или в нескольких скоординированных файлах (например, файлы, в которых хранятся один или более модулей, подпрограмм или частей кода). Компьютерная программа может быть развернута для выполнения на одном компьютере или на нескольких компьютерах, которые расположены в одном месте или распределены по множеству мест и связаны между собой сетью связи.

[0187] Процессы и логические потоки, описанные в данном документе, могут выполняться одним или более программируемыми процессорами, выполняющими одну или более компьютерных программ для выполнения функций, оперируя входными данными и генерируя выходные данные. Процессы и логические потоки также могут выполняться, а устройство может быть реализовано как логическая схема специального назначения, например FPGA (программируемая вентильная матрица) или ASIC (специализированная интегральная схема).

[0188] Процессоры, подходящие для выполнения компьютерной программы, включают в себя, например, микропроцессоры как общего, так и специального назначения, и любой один или более процессоров любого типа цифрового компьютера. Как правило, процессор будет принимать инструкции и данные из постоянного запоминающего устройства или из памяти с произвольным доступом, либо из того и другого. Существенными элементами компьютера являются процессор для выполнения инструкций и одно или более запоминающих устройств для хранения инструкций и данных. Как правило, компьютер также будет включать в себя или быть оперативно подключенным для приема данных или передачи данных на одно или более устройства хранения большой емкости для хранения данных, например магнитные, магнитооптические диски или оптические диски. Однако на компьютере такие устройства не обязательны. Более того, компьютер может быть встроен в другое устройство, например планшетный компьютер, мобильный телефон, персональный цифровой помощник (PDA), мобильный звуковой проигрыватель, приемник глобальной системы позиционирования (GPS), и это лишь некоторые из них. Машиночитаемые носители, подходящие для хранения инструкций и данных компьютерных программ, включают в себя все формы долговременной памяти, носителей и запоминающих устройств, включая, например, полупроводниковые запоминающие устройства, например, EPROM, EEPROM и устройства флэш-памяти; магнитные диски, например внутренние жесткие диски или съемные диски; магнитооптические диски; и диски CD-ROM и DVD-ROM. Процессор и память могут быть дополнены специальной логической схемой или включены в нее.

[0189] Для обеспечения взаимодействия с пользователем варианты осуществления изобретения могут быть реализованы на компьютере, имеющем устройство отображения, например монитор с ЭЛТ (электронно-лучевой трубкой) или ЖК-дисплеем (жидкокристаллическим дисплеем), для отображения информации пользователю и клавиатуру, и координатно-указательное устройство, например, мышь или трекбол, посредством которого пользователь может вводить данные в компьютер. Другие виды устройств также могут использоваться для обеспечения взаимодействия с пользователем; например, обратная связь, предоставляемая пользователю, может быть любой формой сенсорной обратной связи, например, визуальной обратной связью, слуховой обратной связью или тактильной обратной связью; и ввод от пользователя может быть получен в любой форме, включая акустический, речевой или тактильный ввод.

[0190] Варианты осуществления изобретения могут быть реализованы в вычислительной системе, которая включает в себя серверный компонент, например, в качестве сервера данных, или который включает в себя компонент промежуточного программного обеспечения, например, сервер приложений, или который включает в себя внешний компонент, например, клиентский компьютер, имеющий графический пользовательский интерфейс, или веб-браузер, через который пользователь может взаимодействовать с вариантом реализации изобретения, или любое сочетание одного или более таких компонентов внутреннего, промежуточного или внешнего интерфейса. Компоненты системы могут быть связаны между собой любой формой или средой передачи цифровых данных, например, сетью связи. Примеры сетей связи включают в себя локальную сеть («LAN») и глобальную сеть («WAN»), например Интернет.

[0191] Вычислительная система может включать в себя клиентов и серверы. Клиент и сервер обычно удалены друг от друга и обычно взаимодействуют через сеть связи. Отношения клиента и сервера возникают благодаря компьютерным программам, запущенным на соответствующих компьютерах и имеющим отношения клиент-сервер друг к другу.

[0192] Несмотря на то, что несколько вариантов реализации были подробно описаны выше, возможны и другие модификации. Например, в то время как клиентское приложение описывается как доступ к делегату(ам), в других вариантах реализации делегат(ы) может использоваться другими приложениями, реализованными одним или более процессорами, такими как приложение, выполняющееся на одном или более серверах. Кроме того, логические потоки, изображенные на фигурах, не требуют конкретного показанного порядка или последовательного порядка для достижения желаемых результатов. Кроме того, могут быть предусмотрены другие действия или действия могут быть исключены из описанных потоков, а другие компоненты могут быть добавлены или удалены из описанных систем. Соответственно, другие варианты реализации входят в объем прилагаемой формулы изобретения.

[0193] Несмотря на то, что данный документ содержит множество конкретных подробностей реализации, их не следует рассматривать как ограничения объема любого изобретения или того, что может быть заявлено, а скорее как описания функций, которые могут быть специфичными для конкретных вариантов осуществления конкретных изобретений. Некоторые признаки, которые описаны в этом описании в контексте отдельных вариантов осуществления, также могут быть реализованы объединенным образом в одном варианте осуществления. И наоборот, различные признаки, которые описаны в контексте одного варианта осуществления, также могут быть реализованы в нескольких вариантах осуществления по отдельности или в любом подходящем подобъединении. Более того, Несмотря на то, что признаки могут быть описаны выше как действующие в определенных объединениях и даже изначально заявлены как таковые, в некоторых случаях один или более признаков заявленного объединения могут быть исключены из объединения, а заявленное объединения может быть направлено на подобъединение или разновидность подобъединения.

[0194] Точно так же, несмотря на то, что операции изображены на чертежах в определенном порядке, это не следует понимать как требование, чтобы такие операции выполнялись в конкретном показанном порядке или в последовательном порядке, или чтобы все проиллюстрированные операции выполнялись для достижения желаемых результатов. В определенных обстоятельствах могут быть полезны многозадачность и параллельная обработка. Более того, разделение различных системных модулей и компонентов в вариантах осуществления, описанных выше, не следует понимать как требующее такого разделения во всех вариантах осуществления, и следует понимать, что описанные программные компоненты и системы, как правило, могут быть интегрированы вместе в один программный продукт или упакованы в несколько программных продуктов.

[0195] Выше были описаны конкретные варианты осуществления заявляемого изобретения. Другие варианты осуществления находятся в рамках следующей формулы изобретения. Например, действия, изложенные в формуле изобретения, можно выполнять в другом порядке и при этом достигать желаемых результатов. В качестве одного примера, процессы, изображенные на сопроводительных чертежах, не обязательно требуют конкретного показанного порядка или последовательного порядка для достижения желаемых результатов. В некоторых вариантах реализации могут быть полезны многозадачность и параллельная обработка.

Иллюстрации к изобретению RU 2 800 626 C2

Реферат патента 2023 года КОДИРОВАНИЕ ЗВУКА ВЫСОКОГО РАЗРЕШЕНИЯ

Изобретение относится к области вычислительной техники для обработки аудиосигналов. Технический результат заключается в повышении эффективности кодирования звукового сигнала при потоковой передаче звука высокого разрешения через Wi-Fi или мобильную сеть без сжатия. Технический результат достигается за счет приема звукового сигнала, генерирования остаточного сигнала из поддиапазонных сигналов, определения, что данные поддиапазонные сигналы являются интенсивным тоновым сигналом, и в ответ на упомянутое определение того, что поддиапазонный сигнал является интенсивным тоновым сигналом, выполняют взвешивание в отношении упомянутого остаточного сигнала по меньшей мере одного из одного или более поддиапазонных сигналов, чтобы сгенерировать взвешенный остаточный сигнал, при этом упомянутый по меньшей мере один из одного или более поддиапазонных сигналов содержит множество частот гармоник, причем упомянутое определение того, что по меньшей мере один из одного или более поддиапазонных сигналов является интенсивным тоновым сигналом, содержит этап, на котором определяют, что частота первой гармоники из множества частот гармоник превышает первое предварительно определенное пороговое значение и что уровень фонового спектра упомянутого по меньшей мере одного из одного или более поддиапазонных сигналов ниже второго предварительно определенного порогового значения. 3 н. и 12 з.п. ф-лы, 21 ил.

Формула изобретения RU 2 800 626 C2

1. Компьютерно-реализуемый способ кодирования звука, содержащий этапы, на которых:

принимают звуковой сигнал, причем звуковой сигнал содержит один или более поддиапазонных сигналов;

генерируют остаточный сигнал из по меньшей мере одного из упомянутых одного или более поддиапазонных сигналов на основе этого по меньшей мере одного из одного или более поддиапазонных сигналов;

определяют, что данный по меньшей мере один из одного или более поддиапазонных сигналов является интенсивным тоновым сигналом; и

в ответ на упомянутое определение того, что по меньшей мере один из одного или более поддиапазонных сигналов является интенсивным тоновым сигналом, выполняют взвешивание в отношении упомянутого остаточного сигнала по меньшей мере одного из одного или более поддиапазонных сигналов, чтобы сгенерировать взвешенный остаточный сигнал,

при этом упомянутый по меньшей мере один из одного или более поддиапазонных сигналов содержит множество частот гармоник, причем упомянутое определение того, что по меньшей мере один из одного или более поддиапазонных сигналов является интенсивным тоновым сигналом, содержит этап, на котором определяют, что частота первой гармоники из множества частот гармоник превышает первое предварительно определенное пороговое значение и что уровень фонового спектра упомянутого по меньшей мере одного из одного или более поддиапазонных сигналов ниже второго предварительно определенного порогового значения.

2. Компьютерно-реализуемый способ по п.1, в котором упомянутые один или более поддиапазонных сигналов содержат по меньшей мере одно из следующего:

сигнал нижней части нижнего диапазона (LLB);

сигнал верхней части нижнего диапазона (LHB);

сигнал нижней части верхнего диапазона (HLB); и

сигнал верхней части верхнего диапазона (HHB).

3. Компьютерно-реализуемый способ по п.1, в котором упомянутое генерирование остаточного сигнала по меньшей мере одного из одного или более поддиапазонных сигналов на основе по меньшей мере одного из одного или более поддиапазонных сигналов содержит этап, на котором выполняют инверсную фильтрацию кодирования с линейным предсказанием (LPC) в отношении упомянутого по меньшей мере одного из одного или более поддиапазонных сигналов для генерирования остаточного сигнала этого по меньшей мере одного из одного или более поддиапазонных сигналов.

4. Компьютерно-реализуемый способ по п.3, в котором упомянутое генерирование взвешенного остаточного сигнала по меньшей мере одного из одного или более поддиапазонных сигналов содержит этап, на котором генерируют отфильтрованный по наклону сигнал из упомянутого по меньшей мере одного из одного или более поддиапазонных сигналов на основе этого по меньшей мере одного из одного или более поддиапазонных сигналов.

5. Компьютерно-реализуемый способ по п.1, в котором при упомянутом определении того, что по меньшей мере один из одного или более поддиапазонных сигналов является интенсивным тоновым сигналом, определяют, что упомянутый по меньшей мере один из одного или более поддиапазонных сигналов является интенсивным тоновым сигналом, на основе по меньшей мере одного из текущего тонового усиления, сглаженного тонового усиления, продолжительности промежутка между тонами и спектрального наклона этого по меньшей мере одного из одного или более поддиапазонных сигналов.

6. Компьютерно-реализуемый способ по п.1, в котором при упомянутом выполнении взвешивания в отношении остаточного сигнала по меньшей мере одного из одного или более поддиапазонных сигналов выполняют взвешивание в отношении упомянутого остаточного сигнала по меньшей мере одного из одного или более поддиапазонных сигналов посредством однополюсного фильтра нижних частот.

7. Компьютерно-реализуемый способ по п.1, дополнительно содержащий этап, на котором генерируют квантованный остаточный сигнал на основе, по меньшей мере, упомянутого взвешенного остаточного сигнала по меньшей мере одного из одного или более поддиапазонных сигналов.

8. Электронное устройство кодирования звука, содержащее:

долговременное запоминающее хранилище, содержащее инструкции; и

один или более аппаратных процессоров на связи с запоминающим хранилищем, при этом один или более аппаратных процессоров исполняют инструкции, чтобы:

принимать звуковой сигнал, причем звуковой сигнал содержит один или более поддиапазонных сигналов;

генерировать остаточный сигнал по меньшей мере одного из упомянутых одного или более поддиапазонных сигналов на основе этого по меньшей мере одного из одного или более поддиапазонных сигналов;

определять, что данный по меньшей мере один из одного или более поддиапазонных сигналов является интенсивным тоновым сигналом; и

в ответ на упомянутое определение того, что по меньшей мере один из одного или более поддиапазонных сигналов является интенсивным тоновым сигналом, выполнять взвешивание в отношении упомянутого остаточного сигнала по меньшей мере одного из одного или более поддиапазонных сигналов, чтобы сгенерировать взвешенный остаточный сигнал,

при этом упомянутый по меньшей мере один из одного или более поддиапазонных сигналов содержит множество частот гармоник, причем упомянутое определение того, что по меньшей мере один из одного или более поддиапазонных сигналов является интенсивным тоновым сигналом, содержит определение того, что частота первой гармоники из множества частот гармоник превышает первое предварительно определенное пороговое значение и что уровень фонового спектра упомянутого по меньшей мере одного из одного или более поддиапазонных сигналов ниже второго предварительно определенного порогового значения.

9. Электронное устройство по п.8, при этом упомянутый один или более поддиапазонных сигналов содержит по меньшей мере одно из следующего:

сигнал нижней части нижнего диапазона (LLB);

сигнал верхней части нижнего диапазона (LHB);

сигнал нижней части верхнего диапазона (HLB); и

сигнал верхней части верхнего диапазона (HHB).

10. Электронное устройство по п.8, в котором упомянутое генерирование остаточного сигнала по меньшей мере одного из одного или более поддиапазонных сигналов на основе по меньшей мере одного из одного или более поддиапазонных сигналов содержит выполнение инверсной фильтрации кодирования с линейным предсказанием (LPC) в отношении упомянутого по меньшей мере одного из одного или более поддиапазонных сигналов для генерирования остаточного сигнала этого по меньшей мере одного из одного или более поддиапазонных сигналов.

11. Электронное устройство по п.10, в котором упомянутое генерирование взвешенного остаточного сигнала по меньшей мере одного из одного или более поддиапазонных сигналов содержит генерирование отфильтрованного по наклону сигнала из упомянутого по меньшей мере одного из одного или более поддиапазонных сигналов на основе этого по меньшей мере одного из одного или более поддиапазонных сигналов.

12. Электронное устройство по п.8, в котором упомянутое определение того, что по меньшей мере один из одного или более поддиапазонных сигналов является интенсивным тоновым сигналом, содержит определение того, что упомянутый по меньшей мере один из одного или более поддиапазонных сигналов является интенсивным тоновым сигналом, на основе по меньшей мере одного из текущего тонового усиления, сглаженного тонового усиления, продолжительности промежутка между тонами и спектрального наклона этого по меньшей мере одного из одного или более поддиапазонных сигналов.

13. Электронное устройство по п.8, в котором упомянутое выполнение взвешивания в отношении остаточного сигнала по меньшей мере одного из одного или более поддиапазонных сигналов содержит выполнение взвешивания в отношении упомянутого остаточного сигнала по меньшей мере одного из одного или более поддиапазонных сигналов посредством однополюсного фильтра нижних частот.

14. Электронное устройство по п.8, в котором один или более аппаратных процессоров исполняют инструкции, чтобы генерировать квантованный остаточный сигнал на основе, по меньшей мере, упомянутого взвешенного остаточного сигнала по меньшей мере одного из одного или более поддиапазонных сигналов.

15. Долговременный машиночитаемый носитель, хранящий компьютерные инструкции для кодирования звука, которые при их исполнении одним или более аппаратными процессорами предписывают одному или более аппаратным процессорам выполнять способ по любому одному из пп.1-7.

Документы, цитированные в отчете о поиске Патент 2023 года RU2800626C2

Устройство для закрепления лыж на раме мотоциклов и велосипедов взамен переднего колеса	1924	Шапошников Н.П.	SU2015A1
Колосоуборка	1923	Беляков И.Д.	SU2009A1
Способ приготовления лака	1924	Петров Г.С.	SU2011A1
Способ приготовления лака	1924	Петров Г.С.	SU2011A1
УСТРОЙСТВО И СПОСОБ КОДИРОВАНИЯ И ВОСПРОИЗВЕДЕНИЯ ЗВУКА	2008	Лааксонен Лассе Тамми Микко Василаке Адриана Рамо Ансси	RU2477532C2

RU 2 800 626 C2

Авторы

Гао, Ян

Даты

2023-07-25—Публикация

2020-01-13—Подача

название	год	авторы	номер документа
АУДИОКОДЕР И ДЕКОДЕР	2019	Хеделин, Пер, Хенрик Карлссон, Понтус, Ян Самуэльссон, Йонас, Лейф Шуг, Михель	RU2793725C2
АУДИОКОДЕР И ДЕКОДЕР	2008	Хеделин Пер Хенрик Карлссон Понтус Ян Самуэльссон Йонас Лейф Шуг Михель	RU2562375C2
АУДИОКОДЕР И ДЕКОДЕР	2008	Хеделин Пер Хенрик Карлссон Понтус Ян Самуэльссон Йонас Лейф Шуг Михель	RU2456682C2
АУДИОКОДЕР И ДЕКОДЕР	2015	Хеделин Пер Хенрик Карлссон Понтус Ян Самуэльссон Йонас Лейф Шуг Михель	RU2696292C2
АУДИОКОДЕР ДЛЯ КОДИРОВАНИЯ АУДИОСИГНАЛА, ИМЕЮЩЕГО ИМПУЛЬСОПОДОБНУЮ И СТАЦИОНАРНУЮ СОСТАВЛЯЮЩИЕ, СПОСОБЫ КОДИРОВАНИЯ, ДЕКОДЕР, СПОСОБ ДЕКОДИРОВАНИЯ И КОДИРОВАННЫЙ АУДИОСИГНАЛ	2008	Херре Юрген Гейгер Ральф Баер Стефан Фуш Гильом Краемер Ульрих Реттелбах Николаус Грилл Бернард	RU2439721C2
ДЕКОДИРОВАНИЕ КОДИРОВАННЫХ С ПРЕДСКАЗАНИЕМ ДАННЫХ С ИСПОЛЬЗОВАНИЕМ АДАПТАЦИИ БУФЕРА	2007	Оянпера Юха	RU2408089C9
СПОСОБЫ, УСТРОЙСТВА И СИСТЕМЫ ДЛЯ УЛУЧШЕНИЯ УНИФИЦИРОВАННОГО ДЕКОДИРОВАНИЯ И КОДИРОВАНИЯ РЕЧИ И ЗВУКА	2018	Кумар, Раджат Катури, Рамеш Сатувалли, Сакет Раи, Решма	RU2779265C2
УЛУЧШЕНИЕ КЛАССИФИКАЦИИ МЕЖДУ КОДИРОВАНИЕМ ВО ВРЕМЕННОЙ ОБЛАСТИ И КОДИРОВАНИЕМ В ЧАСТОТНОЙ ОБЛАСТИ	2015	Гао Ян	RU2667382C2
РЕШЕНИЕ ОТНОСИТЕЛЬНО НАЛИЧИЯ/ОТСУТСТВИЯ ВОКАЛИЗАЦИИ ДЛЯ ОБРАБОТКИ РЕЧИ	2014	Гао Ян	RU2636685C2
СИСТЕМЫ, СПОСОБЫ И УСТРОЙСТВО ДЛЯ ОГРАНИЧЕНИЯ КОЭФФИЦИЕНТА УСИЛЕНИЯ	2007	Кандхадаи Анантападманабхан А. Кришнан Венкатеш	RU2420817C2