СПОСОБ ПОСТРОЕНИЯ АДАПТИВНОГО К АКУСТИЧЕСКИМ ШУМАМ КОДЕКА РЕЧЕВЫХ СИГНАЛОВ Российский патент 2023 года по МПК G10L19/04 

Описание патента на изобретение RU2805130C1

Изобретение относится к области первичного кодирования речевого сигнала. Техническим результатом является повышение качества передачи речи при действии акустических шумов за счет выбора алгоритмов первичного кодирования и их параметров, обеспечивающих наилучшее качество восстановленной речи на приемной стороне для определенного акустического шума и отношения сигнала и отношения сигнал-шум.

Известны различные алгоритмы построения адаптивных кодеков речи. Примером адаптации параметров речевого кодека может служить известный способ, рассмотренный в патенте, заключающийся в том, что предусматривают адаптивный кодек, способный передавать непрерывный голосовой поток и имеющий информацию о скорости передачи данных источника и полосе пропускания канала, осуществляют проверку канала передачи голосового потока для получения по меньшей мере одного параметра качества, определяют по меньшей мере одно ограничение, связанное с передачей голосового потока, изменяют скорость передачи данных источника и полосу пропускания канала как функцию параметра качества и ограничивающего фактора для получения максимального значения качества получаемого сигнала во время передачи непрерывного голосового потока. Параметром оценки качества передачи речи в указанном способе используется максимальное число медиасимволов в кодовом слове, максимальная длина кодового слова, задержка сети, фактор ухудшения задержки, фактор потерь пакетов, измеренный фактор искажения сигналов, R-фактор для расчета параметра MOS, который используют для согласования скорости передачи данных источника и пропускной способности канала связи (Патент № US 2004160979 Source and channel rate adaptation for VoIP H04L 1/00; H04L 29/06; Н04М 7/00; H04L 12/56, опубл. 19.08.2004 Авторы Christine Pepin, Johnny Matta, Khosrow Lashkari, Ravi Jain).

Другое изобретение относится к кодированию с множеством скоростей, более конкретно к речевому кодированию с множеством скоростней для систем связи. В соответствии с вариантом осуществления изобретения предусмотрен способ многоскоростного кодирования в системе связи. Способ включает этап обеспечения кодека с набором настраиваемых параметром для использования при выборе режимов кодека. Каждый набор параметров настройки обеспечивает некоторую среднюю битовую скорость. Принимается заданное значение битовой скорости для кодирования сигнала кодеком, причем это целевое значение битовой скорости имеет некоторое значение между минимальной и максимальной средней битовой скоростью кодека. Затем режим кодирования выбирается на основе целевого значения битовой скорости и наборов параметров настройки, и сигнал кодируется посредством использования выбранного режима кодирования. Также предусмотрен многоскоростной кодек, содержащий селектор для выбора режима кодирования из набора режимов кодирования на основе целевого значения битовой скорости. Технический результат - повышение качества речи за счет кодирования с переменной скоростью в результате более эффективного кодирования (Патент на изобретение № RU 2364958 С2. Кодирование с множеством скоростей. Патентообладатель: Нокиа Корпорейшн (FI). Авторы: Мякинен Яри М. (FI), Вайнио Янне (FI)).

В следующем патенте описываются различные стратегии управления скоростью/качеством и отказоустойчивости аудиокодеков. Различные стратегии можно использовать в комбинации или независимо. При этом речевой кодек в реальном времени использует внутрикадровое кодирование/декодирование, адаптивную многорежимную прямую коррекцию ошибок «FEC» и методы управления скоростью/качеством. Внутрикадровые кадры помогают декодеру быстро восстановиться после потери кадров, в то время как эффективность сжатия по-прежнему повышается с помощью прогнозируемых кадров. С помощью адаптивного многорежимного FEC, кодер адаптивно выбирает между несколькими режимами, чтобы эффективно и быстро обеспечить уровень FEC, который учитывает полосу пропускания, доступную в настоящее время для FEC. Сама информация FEC может кодироваться и декодироваться с предсказанием относительно первично кодированной информации. Различные стратегии управления скоростью/качеством и FEC позволяют дополнительно адаптироваться к доступной полосе пропускания и условиям сети (Патент № US 7668712 Audio encoding and decoding with intra frames and adaptive forward error correction G10L 19/00, G10L 19/08, G10L 25/93 Авторы Tian Wang, Hosam A. Khalil, Kazuhito Koishida, Wei-ge Chen, Mu Han).

Способ адаптации речевого кодека к режиму кодирования в зависимости от преобладающего состояния канала для передачи речевых кадров в телекоммуникационной системе, содержащий этапы определения коэффициента ошибок на бит (BER) из оцененного отношения несущей к источнику помех (С/I) на речевом пакете, генерируют значения BER речевого кадра множества последовательных пакетов и определяют критический уровень BER для множества речевых кадров посредством максимальной операции над значениями BER кадра для множества речевых кадров (Патент № US 20050267743 A1 Method for codec mode adaptation of adaptive multi-rate codec regarding speech quality G10L 19/04, H04L 1/00, H04L 1/20 Автор: Christian Gerlach).

Изобретение относится к кодированию с множеством скоростей, более контурно к речевому кодированию с множеством скоростей для систем связи. В соответствии с вариантом осуществления изобретения предусмотрен способ многоскоростного кодирования в системе связи. Способ включает этап обеспечения кодека с набором настраиваемых параметров для использования при выборе режима кодека. Каждый набор параметров настройки обеспечивает некоторую среднюю битовую скорость. Принимается заданное значение битовой скорости для кодирования сигнала кодеком, причем это целевое значение битовой скорости имеет некоторое значение между минимальной и максимальной средней битовой скоростью кодека. Затем режим кодирования выбирается на основе целевого значения битовой скорости и наборов параметров настройки, и сигнал кодируется посредством использования выбранного режима кодирования. Также предусмотрен многоскоростной кодек, содержащий селектор для выбора режима кодирования из набора режимов кодирования на основе целевого значения битовой скорости. Технический результат - повышение качества речи за счет кодирования с переменной скоростью в результате более эффективного кодирования (Патент № RU 2415482 C2 Система и способ управления избыточностью G10L 19/14 Авторы: Паси ОЯЛА (FI), Паси ОЯЛА, Ари ЛАКАНИЕМИ (FI), Ари ЛАКАНИЕМИ).

Механизм автоматического распознавания речи приспособлен к неблагоприятной акустической среде. Некоторые исходные данные тренировки, собранные в исходной акустической среде, воспроизводятся в неблагоприятной акустической среде. Данные воспроизведения записываются в неблагоприятной акустической среде для создания записанных данных воспроизведения. Затем существующая речевая модель адаптируется к неблагоприятной акустической среде на основе записанных данных воспроизведения и/или исходных обучающих данных (Патент № US 20190318733 A1 Adaptive enhancement of speech signals G10L 15/06, G10L 15/20, G10L 15/00 Автор: Senthil Kumar MANI)

Таким образом, известные патенты рассматривают адаптивные первичные кодеки, в которых происходит изменение скорости передачи за счет изменения параметров первичного кодека при изменении скорости канала передачи и воздействия ошибок в канале связи при управлении кодеком.

Предлагается алгоритм построения универсального кодека PC адаптивного к акустическим шумам. Суть алгоритма заключается в объединении существующих первичных кодеков речевых сигналов, которые в настоящее время наиболее часто используются в системах передачи PC, в одно устройство. При этом блоки, в разных кодеках выполняющие идентичные функции объединяются в один общий блок, параметры которого могут задаваться устройством управления для каждого алгоритма кодирования.

Предложена система адаптивного управления параметрами системы первичного кодирования, в рамках которой разработаны алгоритмы оценки качества восстановленного речевого сигнала на выходе системы и автоматической классификации акустических шумов в адаптивных системах их активного подавления. Одним из новых подходов к кодированию PC являются системы с переменной структурой. Суть данного подхода состоит в изменении не только параметров, но и структуры кодирующего устройства. Система с переменной структурой подразумевает, что количество функциональных элементов, а также связи между ними, и их расположение меняются тем или иным образом в зависимости от класса действующего АШ. В соответствие с полученными результатами анализа о классе АШ будет выбраться одна из возможных структур первичного кодека, которая обеспечит наилучшее качество восстановленной речи в действующей шумовой обстановке.

В качестве функциональных блоков систем первичного кодирования выберем функциональные блоки следующих основных кодеков источника, описанных в качестве следующих стандартов Международного Союза Электросвязи: G.722.2; G.722.2; G.723.1; G.726; G.727; G.728; G.729.

Соответственно технические характеристики адаптивного кодека PC, определяются техническими характеристиками данных первичных кодеков. При этом, поддерживаются следующие режимы скоростей передачи: 5.3 кбит/с; 6,3 кбит/с; 6,6 кбит/с; 8 кбит/с; 8,85 кбит/с; 12,65 кбит/с; 14,25 кбит/с; 15,85 кбит/с; 16 кбит/с; 18,25 кбит/с; 19,85 кбит/с; 23,05 кбит/с; 23,85 кбит/с; 24 кбит/с; 32 кбит/с. Вносимая задержка составляет от 1 до 30 мс в зависимости от выбранного алгоритма. Анализ данных алгоритмов и их структурных схем выявил блоки, выполняющие идентичные функции. Логичным будет оставить только один комплект таких блоков. Это снизит общее количество блоков и тем самым несколько упростит структуру предлагаемого кодека.

Для пояснения принципа работы адаптивного к АШ алгоритма кодирования PC приведена обобщенная структурная схема алгоритма, которая показана на Фиг. 1. Адаптивный первичный кодер состоит из следующих блоков: блок предобработки (ПО), блок анализа линейного предсказания (АЛП), блок анализа основного тона (АОТ), адаптивная кодовая книга (АКК), фиксированная кодовая книга (ФКК), блок обновление памяти (ОП), блоки кодеров (G.726 и G.727, блоки кодера G.722, блоки кодера G.723.1 и блоки кодера G.728.

На Фиг. 2 показана обобщенная структурная схема адаптивного к АШ декодера. При этом универсальный первичный декодер состоит из декодера адаптивной кодовой книги (АКК), декодера фиксированной кодовой книги (ФКК), декодера линейных спектральных пар (ЛСП), декодера спектральных пар иммитанса (СПИ), сумматора (+), синтезирующего фильтра (СФ), блока постобработки (ПО) и блока выходного ИКМ преобразования (ИКМ). Общая схема алгоритма предполагает возможность его реализации, как в программном виде, так и в аппаратном.

На Фиг. 3 показана структурная схема адаптивного к АШ кодера речевых сигналов. На Фиг. 4 показана структурная схема адаптивного к АШ декодера речевых сигналов. Каждый блок имеет свой идентификатор. С помощью идентификаторов осуществляется управление адаптивным кодеком.

В таблице 1 приведены обозначения блоков адаптивного к АШ кодера речевых сигналов приведенных на Фиг. 3.

В таблице 2 приведены обозначения блоков адаптивного к АШ декодера речевых сигналов приведенных на Фиг. 3.

В зависимости от выбранного алгоритма кодирования в канал будут передаваться соответствующие данные, представленные в таблице 3.

Список источников

1. Патент № US 2004160979 Source and channel rate adaptation for VoIP H04L 1/00; H04L 29/06; H04M 7/00; H04L 12/56, опубл. 19.08.2004 Авторы Christine Pepin, Johnny Matta, Khosrow Lashkari, Ravi Jain

2. Патент на изобретение № RU 2364958 C2. Кодирование с множеством скоростей. Патентообладатель: Нокиа Корпорейшн (FI). Авторы: Мякинен Яри М. (FI), Вайнио Янне (FI). Заявка №2004127121/09. Приоритет изобретения: 09.09.2003 г. Зарегистрировано в Государственном реестре изобретений Российской Федерации 08 сентября 2004 года

3. Патент № US 7668712 Audio encoding and decoding with intra frames and adaptive forward error correction G10L 19/00, G10L 19/08, G10L 25/93 Авторы Tian Wang, Hosam A. Khalil, Kazuhito Koishida, Wei-ge Chen, Mu Han

4. Патент № US 20050267743 A1 Method for codec mode adaptation of adaptive multi-rate codec regarding speech quality G10L 19/04, H04L 1/00, H04L 1/20 Автор: Christian Gerlach

5. Патент № RU 2415482 C2 Система и способ управления избыточностью G10L 19/14 Авторы: Паси ОЯЛА (FI), Паси ОЯЛА, Ари ЛАКАНИЕМИ (FI), Ари ЛАКАНИЕМИ

6. Патент № US 20190318733 A1 Adaptive enhancement of speech signals G10L 15/06, G10L 15/20, G10L 15/00 Автор: Senthil Kumar MANI.

Похожие патенты RU2805130C1

название год авторы номер документа
КОДЕР, ДЕКОДЕР И СПОСОБ КОДИРОВАНИЯ И ДЕКОДИРОВАНИЯ АУДИОКОНТЕНТА С ИСПОЛЬЗОВАНИЕМ ПАРАМЕТРОВ ДЛЯ УЛУЧШЕНИЯ МАСКИРОВАНИЯ 2015
  • Леконт Жереми
  • Шуберт Беньямин
  • Шнабель Михаэль
  • Дитц Мартин
RU2701707C2
СПОСОБ ОСУЩЕСТВЛЕНИЯ ВЗАИМОДЕЙСТВИЯ МЕЖДУ АДАПТИВНЫМ МНОГОСКОРОСТНЫМ ШИРОКОПОЛОСНЫМ КОДЕКОМ (AMR-WB-КОДЕКОМ) И МНОГОРЕЖИМНЫМ ШИРОКОПОЛОСНЫМ КОДЕКОМ С ПЕРЕМЕННОЙ СКОРОСТЬЮ В БИТАХ (VBR-WB-КОДЕКОМ) 2003
  • Желинек Милан
  • Салами Редван
RU2351907C2
ЦИКЛЫ ТЕСТИРОВАНИЯ ДЛЯ КАНАЛЬНЫХ КОДЕКОВ 2002
  • Лемье Бертье
  • Баш Лене
RU2263404C2
СПОСОБ И УСТРОЙСТВО ДЛЯ УПРАВЛЕНИЯ СГЛАЖИВАНИЕМ СТАЦИОНАРНОГО ФОНОВОГО ШУМА 2008
  • Брун Стефан
RU2469419C2
СПОСОБ И УСТРОЙСТВО, ПРЕДНАЗНАЧЕННЫЕ ДЛЯ ЭФФЕКТИВНОЙ ПЕРЕДАЧИ СИГНАЛОВ РАЗМЕРНОСТИ И ПАЧКИ В ПОЛОСЕ ЧАСТОТ И РАБОТЫ С МАКСИМАЛЬНОЙ ПОЛОВИННОЙ СКОРОСТЬЮ ПРИ ШИРОКОПОЛОСНОМ КОДИРОВАНИИ РЕЧИ С ПЕРЕМЕННОЙ СКОРОСТЬЮ ПЕРЕДАЧИ БИТОВ ДЛЯ БЕСПРОВОДНЫХ СИСТЕМ МДКР 2008
  • Йелинек Милан
  • Салами Редван
RU2461897C2
СПОСОБ И УСТРОЙСТВО ДЛЯ КВАНТОВАНИЯ УСИЛЕНИЯ В ШИРОКОПОЛОСНОМ РЕЧЕВОМ КОДИРОВАНИИ С ПЕРЕМЕННОЙ БИТОВОЙ СКОРОСТЬЮ ПЕРЕДАЧИ 2004
  • Желинек Милан
  • Салами Редван
RU2316059C2
СПОСОБ И УСТРОЙСТВО, ПРЕДНАЗНАЧЕННЫЕ ДЛЯ ЭФФЕКТИВНОЙ ПЕРЕДАЧИ СИГНАЛОВ РАЗМЕРНОСТИ И ПАЧКИ В ПОЛОСЕ ЧАСТОТ И РАБОТЫ С МАКСИМАЛЬНОЙ ПОЛОВИННОЙ СКОРОСТЬЮ ПРИ ШИРОКОПОЛОСНОМ КОДИРОВАНИИ РЕЧИ С ПЕРЕМЕННОЙ СКОРОСТЬЮ ПЕРЕДАЧИ БИТОВ ДЛЯ БЕСПРОВОДНЫХ СИСТЕМ МДКР 2003
  • Йелинек Милан
  • Салами Редван
RU2326449C2
КОДИРОВАНИЕ АУДИОСИГНАЛА 2008
  • Рямё Ансси
  • Лааксонен Лассе
  • Василаке Адриана
RU2428748C2
КОДИРОВАНИЕ С МНОЖЕСТВОМ СКОРОСТЕЙ 2004
  • Мякинен Яри М.
  • Вайнио Янне
RU2364958C2
РЕШЕНИЕ ОТНОСИТЕЛЬНО НАЛИЧИЯ/ОТСУТСТВИЯ ВОКАЛИЗАЦИИ ДЛЯ ОБРАБОТКИ РЕЧИ 2014
  • Гао Ян
RU2636685C2

Иллюстрации к изобретению RU 2 805 130 C1

Реферат патента 2023 года СПОСОБ ПОСТРОЕНИЯ АДАПТИВНОГО К АКУСТИЧЕСКИМ ШУМАМ КОДЕКА РЕЧЕВЫХ СИГНАЛОВ

Изобретение относится к методам первичного кодирования речевых сигналов, а именно к методам адаптации кодеков речи к акустическим шумам, путем определения вида акустического шума и выбора алгоритма кодирования речевого сигнала, а также его параметров, обеспечивающих лучшее качество восстановленной речи. Указанный технический результат достигается за счет совмещения в одной структуре функциональных блоков стандартных кодеков речевых сигналов, выбор которых осуществляется исходя из вида и уровня акустических шумов, воздействующих на речевой сигнал, и определяемых на входе устройства кодирования в период паузы, в соответствии с предложенными рекомендациями, полученными в результате экспериментальных исследований, а также в зависимости от оценки качества восстановленной речи на выходе декодера. 4 ил., 3 табл.

Формула изобретения RU 2 805 130 C1

Способ построения адаптивного к акустическим шумам кодека речевых сигналов, отличающийся тем, что кодек содержит функциональные блоки известных алгоритмов кодирования, блок определения вида и параметров акустического шума в паузе речевого сигнала, а также оценки качества речи на выходе кодера и декодера; выбор алгоритма кодирования производится в случае снижения качества речевого сигнала, определяемого в блоке оценки качества или изменения вида или параметров акустического шума, регистрируемых в блоке определения вида и параметров акустического шума в паузе речи, путем выбора рекомендованного алгоритма кодирования речевого сигнала для данного вида акустического шума и отношения сигнал-шум, обеспечивающих максимально возможное качество речи на выходе кодека в заданном диапазоне скоростей передачи.

Документы, цитированные в отчете о поиске Патент 2023 года RU2805130C1

АУДИОКОДЕР И СПОСОБ ДЛЯ КОДИРОВАНИЯ АУДИОСИГНАЛА 2016
  • Бекстрем Том
  • Йокинен Эмма
RU2707144C2
WO 2017193315 A1, 16.11.2017
US 2016314797 A1, 27.10.2016
СПОСОБ ЗАЩИТЫ ВЕГЕТИРУЮЩИХ ПАСЛЁНОВЫХ РАСТЕНИЙ ОТ ВРЕДНЫХ НАСЕКОМЫХ 2002
  • Квасенков О.И.
RU2245622C2

RU 2 805 130 C1

Авторы

Дмитриев Владимир Тимурович

Даты

2023-10-11Публикация

2023-02-03Подача