Область техники
[0001] Настоящее изобретение относится к области обработки сигналов и, в частности, к устройству и способу кодирования сигналов.
Уровень техники
[0002] Система прерывистой передачи (прерывистой передачи, DTX) является широко применяемой системой речевой связи, где в период тишины речевой связи может быть использована методика передачи и кодирования с перерывами кадра речи для сокращения занятости полосы пропускания канала, и между тем, может быть еще гарантировано адекватное субъективное качество вызова.
[0003] Сигналы речи обычно могут быть классифицированы на два типа, а именно, сигнал активной речи и сигнал тишины. Сигнал активной речи относится к сигналу, включающему в себя речь вызова, и сигнал тишины относится к сигналу, не включающему в себя речь вызова. В системе DTX сигнал активной речи передается посредством использования способа непрерывной передачи, и сигнал тишины передается посредством использования способа прерывистой передачи. Прерывистая передача сигнала тишины реализуется следующей методикой: кодер периодически кодирует и отправляет специальный кадр кодирования, а именно, кадр дескриптора тишины (дескриптора тишины, SID), где в системе DTX, ни один из каких-либо других кадров сигнала не кодируется между двумя смежными кадрами SID. Представленный на усмотрение декодер генерирует, согласно принимаемым с перерывами кадрам SID, шум, который обеспечивает возможность комфортной субъективной слышимости пользователя. Комфортный шум (комфортный шум, CN) не нацелен на то, чтобы точно восстанавливать исходный сигнал тишины, но нацелен на то, чтобы удовлетворять требование пользователя декодера в отношении субъективного качества слышимости и обеспечивать возможность пользователю не чувствовать дискомфорт.
[0004] Для того чтобы получать лучшее субъективное качество слышимости на декодере, качество перехода от диапазона активной речи к диапазону CN является критическим. Для получения более плавного перехода, существует один эффективный способ: во время перехода от диапазона активной речи к диапазону тишины, кодер не переходит к состоянию прерывистой передачи без промедления, а дополнительно задерживается в течение периода времени. В этот период времени некоторые кадры тишины в начале диапазона тишины все еще учитываются как кадры активной речи и непрерывно кодируются, и отправляются, то есть, устанавливается интервал затягивания непрерывной передачи. Преимущество этой меры состоит в том, что: декодер может полностью использовать сигнал тишины в пределах интервала затягивания, чтобы лучше оценивать и извлекать характеристику сигнала тишины для того, чтобы генерировать более лучший CN.
[0005] Однако в предшествующем уровне техники механизм затягивания эффективно не контролируется. Условие для запуска механизма затягивания является относительно простым, то есть, запускать ли механизм затягивания, определяется просто посредством проверки, имеются ли достаточно кадров активной речи для непрерывного кодирования и отправки, при окончании активности речевого процесса; после того, как механизм затягивания запущен, может быть обязательно исполнен интервал затягивания с фиксированной длиной. Однако, ненужно, чтобы интервал затягивания с фиксированной длиной был исполнен, когда имеются достаточно кадров активной речи для непрерывного кодирования и отправки, например, когда фоновый шум среды связи является постоянным, даже если не установлено никакого интервала затягивания или установлен короткий интервал затягивания, декодер может получать CN, имеющий лучшее качество. Поэтому, этот режим простого управления механизмом затягивания является причиной расходования полосы рабочих частот канала связи.
Сущность изобретения
[0006] Варианты осуществления настоящего изобретения обеспечивают устройство и способ кодирования сигналов, которые могут сохранять полосу рабочих частот канала связи.
[0007] Согласно первому аспекту, обеспечивается способ кодирования сигналов, включающий в себя: в случае, в котором методика кодирования предыдущего кадра относительно вводимого в настоящий момент кадра является методикой непрерывного кодирования, предсказание комфортного шума, который генерируется декодером согласно вводимому в настоящий момент кадру, в случае, в котором вводимый в настоящий момент кадр кодируется в кадр дескриптора тишины, SID, и определение фактического сигнала тишины, где вводимый в настоящий момент кадр является кадром тишины; определение степени отклонения между комфортным шумом и фактическим сигналом тишины; определение методики кодирования вводимого в настоящий момент кадра согласно степени отклонения, где методика кодирования вводимого в настоящий момент кадра включает в себя методику кодирования c кадром затягивания или методику кодирования с кадром SID; и кодирование вводимого в настоящий момент кадра согласно методике кодирования вводимого в настоящий момент кадра.
[0008] Со ссылкой на первый аспект, в первой возможной методике реализации, предсказание комфортного шума, который генерируется декодером, согласно вводимому в настоящий момент кадру в случае, в котором вводимый в настоящий момент кадр кодируется в кадр SID, и определение фактического сигнала тишины включает в себя: предсказание параметра характеристики комфортного шума и определение параметра характеристики фактического сигнала тишины, где параметр характеристики комфортного шума находится во взаимно однозначном соответствии с параметром характеристики фактического сигнала тишины; и
определение степени отклонения между комфортным шумом и фактическим сигналом тишины включает в себя: определение расстояния между параметром характеристики комфортного шума и параметром характеристики фактического сигнала тишины.
[0009] Со ссылкой на первую возможную методику реализации первого аспекта, во второй возможной методике реализации, определение методики кодирования вводимого в настоящий момент кадра согласно степени отклонения включает в себя: определение в случае, в котором расстояние между параметром характеристики комфортного шума и параметром характеристики фактического сигнала тишины меньше, чем соответствующее пороговое значение в наборе пороговых значений, что методика кодирования вводимого в настоящий момент кадра является методикой кодирования с кадром SID, где расстояние между параметром характеристики комфортного шума и параметром характеристики фактического сигнала тишины находится во взаимно однозначном соответствии с пороговым значением в наборе пороговых значений; и определение в случае, в котором расстояние между параметром характеристики комфортного шума и параметром характеристики фактического сигнала тишины равно или больше, чем соответствующее пороговое значение в наборе пороговых значений, что методика кодирования вводимого в настоящий момент кадра является методикой кодирования c кадром затягивания.
[0010] Со ссылкой на первую возможную методику реализации или вторую возможную методику реализации первого аспекта, в третьей возможный методике реализации, параметр характеристики комфортного шума используется для представления по меньшей мере одной из следующей информации: информации энергии и спектральной информации.
[0011] Со ссылкой на третью возможную методику реализации первого аспекта, в четвертой возможной методике реализации, информация энергии включает в себя энергию возбуждения линейного предсказания с кодовым возбуждением, CELP;
спектральная информация включает в себя по меньшей мере один из следующего: коэффициента фильтра линейного предсказания, коэффициента быстрого преобразования Фурье, FFT, и коэффициента модифицированного дискретного косинусного преобразования, MDCT; и
коэффициент фильтра линейного предсказания включает в себя по меньшей мере один из следующего: коэффициента частоты спектральной линии, LSF, коэффициента пары линейчатого спектра, LSP, коэффициента частоты спектральных иммитансов, ISF, коэффициента пары спектральных иммитансов, ISP, коэффициента отражения и коэффициента кодирования линейного предсказания, LPC.
[0012] Со ссылкой на какую-либо методику реализации из первой возможной методики реализации по четвертую возможную методику реализации первого аспекта, в пятой возможной методике реализации, предсказание параметра характеристики комфортного шума включает в себя: предсказание параметра характеристики комфортного шума согласно параметру комфортного шума предыдущего кадра относительно вводимого в настоящий момент кадра и параметру характеристики вводимого в настоящий момент кадра; или предсказание параметра характеристики комфортного шума согласно параметрам характеристик L кадров затягивания, предшествующих вводимому в настоящий момент кадру, и параметру характеристики вводимого в настоящий момент кадра, где L является положительным целым числом.
[0013] Со ссылкой на какую-либо методику реализации из первой возможной методики реализации по пятую возможную методику реализации первого аспекта, в шестой возможной методике реализации, определение параметра характеристики фактического сигнала тишины включает в себя: определение, что параметр характеристики вводимого в настоящий момент кадра является параметром характеристики фактического сигнала тишины; или сбор статистики в отношении параметров характеристик M кадров тишины для определения параметра характеристики фактического сигнала тишины.
[0014] Со ссылкой на шестую возможную методику реализации первого аспекта, в седьмой возможной методике реализации, M кадров тишины включают в себя вводимый в настоящий момент кадр и (M-1) кадров тишины, предшествующих вводимому в настоящий момент кадру, где M является положительным целым числом.
[0015] Со ссылкой на вторую возможную методику реализации первого аспекта, в восьмой возможной методике реализации, параметр характеристики комфортного шума включает в себя энергию возбуждения линейного предсказания с кодовым возбуждением, CELP, комфортного шума и коэффициент частоты спектральной линии, LSF, комфортного шума, и параметр характеристики фактического сигнала тишины включает в себя энергию возбуждения CELP фактического сигнала тишины и коэффициент LSF фактического сигнала тишины; и
определение расстояния между параметром характеристики комфортного шума и параметром характеристики фактического сигнала тишины включает в себя: определение расстояния De между энергией возбуждения CELP комфортного шума и энергией возбуждения CELP фактического сигнала тишины, и определение расстояния Dlsf между коэффициентом LSF комфортного шума и коэффициентом LSF фактического сигнала тишины.
[0016] Со ссылкой на восьмую возможную методику реализации первого аспекта, в девятой возможной методике реализации, определение в случае, в котором расстояние между параметром характеристики комфортного шума и параметром характеристики фактического сигнала тишины меньше, чем соответствующее пороговое значение в наборе пороговых значений, что методика кодирования вводимого в настоящий момент кадра является методикой кодирования с кадром SID, включает в себя: в случае, в котором расстояние De меньше, чем первое пороговое значение, и расстояние Dlsf меньше, чем второе пороговое значение, определение, что методика кодирования вводимого в настоящий момент кадра является методикой кодирования с кадром SID; и
определение в случае, в котором расстояние между параметром характеристики комфортного шума и параметром характеристики фактического сигнала тишины равно или больше, чем соответствующее пороговое значение в наборе пороговых значений, что методика кодирования вводимого в настоящий момент кадра является методикой кодирования c кадром затягивания, включает в себя: в случае, в котором расстояние De равно или больше, чем первое пороговое значение или расстояние Dlsf равно или больше, чем второе пороговое значение, определение, что методика кодирования вводимого в настоящий момент кадра является методикой кодирования c кадром затягивания.
[0017] Со ссылкой на девятую возможную методику реализации первого аспекта, в десятой возможной методике реализации, способ дополнительно включает в себя: извлечение предустановленного первого порогового значения и предустановленного второго порогового значения; или определение первого порогового значения согласно энергии возбуждения CELP N кадров тишины, предшествующих вводимому в настоящий момент кадру, и определение второго порогового значения согласно коэффициентам LSF N кадров тишины, где N является положительным целым числом.
[0018] Со ссылкой на первый аспект или какую-либо методику реализации из первой возможной методики реализации по десятую возможную методику реализации первого аспекта, в одиннадцатой возможной методике реализации, предсказание комфортного шума, который генерируется декодером согласно вводимому в настоящий момент кадру, в случае, в котором вводимый в настоящий момент кадр кодируется в кадр SID, включает в себя: предсказание комфортного шума первой методикой предсказания, где первая методика предсказания является такой же, как методика, в которой декодер генерирует комфортный шум.
[0019] Согласно второму аспекту, обеспечен способ обработки сигналов, включающий в себя: определение взвешенного спектрального расстояния группы каждого кадра тишины в P кадрах тишины, где взвешенное спектральное расстояние группы каждого кадра тишины в P кадрах тишины является суммой из взвешенных спектральных расстояний между каждым кадром тишины в P кадрах тишины и другими (P-1) кадрами тишины, где P является положительным целым числом; и определение первого спектрального параметра согласно взвешенному спектральному расстоянию группы каждого кадра тишины в P кадрах тишины, где первый спектральный параметр используется для генерирования комфортного шума.
[0020] Со ссылкой на второй аспект, в первой возможной методике реализации, каждый кадр тишины соответствует одной группе весовых коэффициентов, где в одной группе весовых коэффициентов, весовой коэффициент, соответствующий первой группе поддиапазонов, больше, чем весовой коэффициент, соответствующий второй группе поддиапазонов, и перцептивная важность первой группы поддиапазонов больше, чем перцептивная важность второй группы поддиапазонов.
[0021] Со ссылкой на второй аспект или первую возможную методику реализации второго аспекта, во второй возможной методике реализации, определение первого спектрального параметра согласно взвешенному спектральному расстоянию группы каждого кадра тишины в P кадрах тишины включает в себя: выбор первого кадра тишины из P кадров тишины, так что взвешенное спектральное расстояние группы первого кадра тишины в P кадрах тишины является наименьшим; и определение, что спектральный параметр первого кадра тишины является первым спектральным параметром.
[0022] Со ссылкой на второй аспект или первую возможную методику реализации второго аспекта, в третьей возможной методике реализации, определение первого спектрального параметра согласно взвешенному спектральному расстоянию группы каждого кадра тишины в P кадрах тишины включает в себя: выбор по меньшей мере одного кадра тишины из P кадров тишины, так что взвешенное спектральное расстояние группы по меньшей мере одного кадра тишины в P кадрах тишины меньше, чем третье пороговое значение; и определение первого спектрального параметра согласно спектральному параметру по меньшей мере одного кадра тишины.
[0023] Со ссылкой на второй аспект или какую-либо методику реализации из первой возможной методики реализации по третью возможную методику реализации второго аспекта, в четвертой возможной методике реализации, P кадров тишины включают в себя вводимый в настоящий момент кадр тишины и (P-1) кадров тишины, предшествующих вводимому в настоящий момент кадру тишины.
[0024] Со ссылкой на четвертую возможную методику реализации второго аспекта, в пятой возможной методике реализации, способ дополнительно включает в себя: кодирование вводимого в настоящий момент кадра тишины в кадр дескриптора тишины, SID, где кадр SID включает в себя первый спектральный параметр.
[0025] Согласно третьему аспекту, обеспечен способ обработки сигналов, включающий в себя: разделение диапазона частот входного сигнала на R поддиапазонов, где R является положительным целым числом; определение на каждом поддиапазоне из R поддиапазонов спектрального расстояния группы поддиапазонов каждого кадра тишины в S кадрах тишины, где спектральное расстояние группы поддиапазонов каждого кадра тишины в S кадрах тишины является суммой спектральных расстояний между каждым кадром тишины в S кадрах тишины на каждом поддиапазоне и другими (S-1) кадрами тишины, и S является положительным целым числом; и определение на каждом поддиапазоне первого спектрального параметра каждого поддиапазона согласно спектральному расстоянию группы поддиапазонов каждого кадра тишины в S кадрах тишины, где первый спектральный параметр каждого поддиапазона используется для генерирования комфортного шума.
[0026] Со ссылкой на третий аспект, в первой возможной методике реализации, определение на каждом поддиапазоне первого спектрального параметра каждого поддиапазона согласно спектральному расстоянию группы поддиапазонов каждого кадра тишины в S кадрах тишины включает в себя: выбор на каждом поддиапазоне первого кадра тишины из S кадров тишины, так что спектральное расстояние группы поддиапазонов первого кадра тишины в S кадрах тишины на каждом поддиапазоне является наименьшим; и определение на каждом поддиапазоне, что спектральный параметр первого кадра тишины является первым спектральным параметром каждого поддиапазона.
[0027] Со ссылкой на третий аспект, во второй возможной методике реализации, определение на каждом поддиапазоне первого спектрального параметра каждого поддиапазона согласно спектральному расстоянию группы поддиапазонов каждого кадра тишины в S кадрах тишины включает в себя: выбор на каждом поддиапазоне по меньшей мере одного кадра тишины из S кадров тишины, так что спектральное расстояние группы поддиапазонов по меньшей мере одного кадра тишины меньше, чем четвертое пороговое значение; и определение на каждом поддиапазоне первого спектрального параметра каждого поддиапазона согласно спектральному параметру по меньшей мере одного кадра тишины.
[0028] Со ссылкой на третий аспект или первую возможную методику реализации или вторую возможную методику реализации третьего аспекта, в третьей возможной методике реализации, S кадров тишины включают в себя вводимый в настоящий момент кадр тишины и (S-1) кадров тишины, предшествующих вводимому в настоящий момент кадру тишины.
[0029] Со ссылкой на третью возможную методику реализации третьего аспекта, в четвертой возможной методике реализации, способ дополнительно включает в себя: кодирование вводимого в настоящий момент кадра тишины в кадр дескриптора тишины, SID, где кадр SID включает в себя первый спектральный параметр каждого поддиапазона.
[0030] Согласно четвертому аспекту, обеспечен способ обработки сигналов, включающий в себя: определение первого параметра каждого кадра тишины в T кадрах тишины, где первый параметр используется для представления спектральной энтропии, и T является положительным целым числом; и определение первого спектрального параметра согласно первому параметру каждого кадра тишины в T кадрах тишины, где первый спектральный параметр используется для генерирования комфортного шума.
[0031] Со ссылкой на четвертый аспект, в пятой возможной методике реализации, определение первого спектрального параметра согласно первому параметру каждого кадра тишины в T кадрах тишины включает в себя: в случае, в котором определяется, что T кадров тишины могут быть классифицированы на первую группу кадров тишины и вторую группу кадров тишины согласно критерию кластеризации, определение первого спектрального параметра согласно спектральному параметру первой группы кадров тишины, где спектральная энтропия, представленная первыми параметрами первой группы кадров тишины, больше, чем спектральная энтропия, представленная первыми параметрами второй группы кадров тишины; и в случае, в котором определяется, что T кадров тишины не могут быть классифицированы на первую группу кадров тишины и вторую группу кадров тишины согласно критерию кластеризации, выполнение взвешенного усреднения в отношении спектральных параметров T кадров тишины для определения первого спектрального параметра, где спектральная энтропия, представленная первыми параметрами первой группы кадров тишины, больше, чем спектральная энтропия, представленная первыми параметрами второй группы кадров тишины.
[0032] Со ссылкой на первую возможную методику реализации четвертого аспекта, во второй возможной методике реализации, критерий кластеризации включает в себя: расстояние между первым параметром каждого кадра тишины в первой группе кадров тишины и первым средним значением равно или меньше, чем расстояние между первым параметром каждого кадра тишины в первой группе кадров тишины и вторым средним значением; расстояние между первым параметром каждого кадра тишины во второй группе кадров тишины и вторым средним значением равно или меньше, чем расстояние между первым параметром каждого кадра тишины во второй группе кадров тишины и первым средним значением; расстояние между первым средним значением и вторым средним значением больше, чем среднее расстояние между первыми параметрами первой группы кадров тишины и первым средним значением; и расстояние между первым средним значением и вторым средним значением больше, чем среднее расстояние между первыми параметрами второй группы кадров тишины и вторым средним значением, где первое среднее значение является средним значением первых параметров первой группы кадров тишины, и второе среднее значение является средним значением первых параметров второй группы кадров тишины.
[0033] Со ссылкой на четвертый аспект, в третьей возможной методике реализации, определение первого спектрального параметра согласно первому параметру каждого кадра тишины в T кадрах тишины включает в себя:
выполнение взвешенного усреднения в отношении спектральных параметров T кадров тишины для определения первого спектрального параметра, где для iго кадра тишины и jго кадра тишины, которые являются различными, в T кадрах тишины весовой коэффициент, соответствующий iму кадру тишины, равен или больше, чем весовой коэффициент, соответствующий jму кадру тишины; когда первый параметр положительно коррелируется со спектральной энтропией, первый параметр iго кадра тишины больше, чем первый параметр jго кадра тишины; и когда первый параметр отрицательно коррелируется со спектральной энтропией, первый параметр iго кадра тишины меньше, чем первый параметр jго кадра тишины, где i и j оба являются положительными целыми числами, и 1≤i≤T, и 1≤j≤T.
[0034] Со ссылкой на четвертый аспект или какую-либо методику реализации из первой возможной методики реализации по третью возможную методику реализации четвертого аспекта, в четвертой возможной методике реализации, T кадров тишины включают в себя вводимый в настоящий момент кадр тишины и (T-1) кадров тишины, предшествующих вводимому в настоящий момент кадру тишины.
[0035] Со ссылкой на четвертую возможную методику реализации четвертого аспекта, в пятой возможной методике реализации, способ дополнительно включает в себя: кодирование вводимого в настоящий момент кадра тишины в кадр дескриптора тишины, SID, где кадр SID включает в себя первый спектральный параметр.
[0036] Согласно пятому аспекту, обеспечено устройство кодирования сигналов, включающее в себя: первый блок определения, сконфигурированный с возможностью: в случае, в котором методика кодирования предыдущего кадра относительно вводимого в настоящий момент кадра является методикой непрерывного кодирования, предсказания комфортного шума, который генерируется декодером согласно вводимому в настоящий момент кадру, в случае, в котором вводимый в настоящий момент кадр кодируется в кадр дескриптора тишины, SID, и определения фактического сигнала тишины, где вводимый в настоящий момент кадр является кадром тишины; второй блок определения, сконфигурирован с возможностью определения степени отклонения между комфортным шумом, определенным первым блоком определения, и фактическим сигналом тишины, определенным первым блоком определения; третий блок определения, сконфигурированный с возможностью определения методики кодирования вводимого в настоящий момент кадра согласно степени отклонения, определенной вторым блоком определения, где методика кодирования вводимого в настоящий момент кадра включает в себя методику кодирования c кадром затягивания или методику кодирования с кадром SID; и блок кодирования, сконфигурированный с возможностью кодирования вводимого в настоящий момент кадра согласно методике кодирования вводимого в настоящий момент кадра, определенной третьим блоком определения.
[0037] Со ссылкой на пятый аспект, в первой возможной методике реализации, первый блок определения, в частности, сконфигурирован с возможностью предсказания параметра характеристики комфортного шума и определения параметра характеристики фактического сигнала тишины, где параметр характеристики комфортного шума находится во взаимно однозначном соответствии с параметром характеристики фактического сигнала тишины; и второй блок определения, в частности, сконфигурирован с возможностью определения расстояния между параметром характеристики комфортного шума и параметром характеристики фактического сигнала тишины.
[0038] Со ссылкой на первую возможную методику реализации пятого аспекта, во второй возможной методике реализации, третий блок определения, в частности, сконфигурирован с возможностью: в случае, в котором расстояние между параметром характеристики комфортного шума и параметром характеристики фактического сигнала тишины меньше, чем соответствующее пороговое значение в наборе пороговых значений, определения, что методика кодирования вводимого в настоящий момент кадра является методикой кодирования с кадром SID, где расстояние между параметром характеристики комфортного шума и параметром характеристики фактического сигнала тишины находится во взаимно однозначном соответствии с пороговым значением в наборе пороговых значений; и в случае, в котором расстояние между параметром характеристики комфортного шума и параметром характеристики фактического сигнала тишины равно или больше, чем соответствующее пороговое значение в наборе пороговых значений, определения, что методика кодирования вводимого в настоящий момент кадра является методикой кодирования c кадром затягивания.
[0039] Со ссылкой на первую возможную методику реализации или вторую возможную методику реализации пятого аспекта, в третьей возможной методике реализации, первый блок определения, в частности, сконфигурирован с возможностью: предсказания параметра характеристики комфортного шума согласно параметру комфортного шума предыдущего кадра относительно вводимого в настоящий момент кадра и параметру характеристики вводимого в настоящий момент кадра; или предсказания параметра характеристики комфортного шума согласно параметрам характеристик L кадров затягивания, предшествующих вводимому в настоящий момент кадру, и параметру характеристики вводимого в настоящий момент кадра, где L является положительным целым числом.
[0040] Со ссылкой на первую возможную методику реализации или вторую возможную методику реализации или третью возможную методику реализации пятого аспекта, в четвертой возможной методике реализации, первый блок определения, в частности, сконфигурирован с возможностью: определения, что параметр характеристики вводимого в настоящий момент кадра является параметром фактического сигнала тишины; или сбора статистики в отношении параметров характеристик M кадров тишины для определения параметра фактического сигнала тишины.
[0041] Со ссылкой на вторую возможную методику реализации пятого аспекта, в пятой возможной методике реализации, параметр характеристики комфортного шума включает в себя энергию возбуждения линейного предсказания с кодовым возбуждением, CELP, комфортного шума и коэффициент частоты спектральной линии, LSF, комфортного шума, и параметр характеристики фактического сигнала тишины включает в себя энергию возбуждения CELP фактического сигнала тишины и коэффициент LSF фактического сигнала тишины; и второй блок определения, в частности, сконфигурирован с возможностью определения расстояния De между энергией возбуждения CELP комфортного шума и энергией возбуждения CELP фактического сигнала тишины, и определения расстояния Dlsf между коэффициентом LSF комфортного шума и коэффициентом LSF фактического сигнала тишины.
[0042] Со ссылкой на пятую возможную методику реализации пятого аспекта, в шестой возможной методике реализации, третий блок определения, в частности, сконфигурирован с возможностью: в случае, в котором расстояние De меньше, чем первое пороговое значение, и расстояние Dlsf меньше, чем второе пороговое значение, определения, что методика кодирования вводимого в настоящий момент кадра является методикой кодирования с кадром SID; и третий блок определения, в частности, сконфигурирован с возможностью: в случае, в котором расстояние De равно или больше, чем первое пороговое значение или расстояние Dlsf равно или больше, чем второе пороговое значение, определения, что методика кодирования вводимого в настоящий момент кадра является методикой кодирования c кадром затягивания.
[0043] Со ссылкой на шестую возможную методику реализации пятого аспекта, в седьмой возможной методике реализации, устройство дополнительно включает в себя четвертый блок определения, сконфигурированный с возможностью: извлечение предустановленного первого порогового значения и предустановленного второго порогового значения; или определения первого порогового значения согласно энергии возбуждения CELP N кадров тишины, предшествующих вводимому в настоящий момент кадру, и определения второго порогового значения согласно коэффициентам LSF N кадров тишины, где N является положительным целым числом.
[0044] Со ссылкой на пятый аспект или какую-либо методику реализации из первой возможной методики реализации по седьмую возможную методику реализации пятого аспекта, в восьмой возможной методике реализации, первый блок определения, в частности, сконфигурирован с возможностью предсказания комфортного шума первой методикой предсказания, где первая методика предсказания является такой же, как методика, в которой декодер генерирует комфортный шум.
[0045] Согласно шестому аспекту, обеспечено устройство обработки сигналов, включающее в себя: первый блок определения, сконфигурированный с возможностью определения взвешенного спектрального расстояния группы каждого кадра тишины в P кадрах тишины, где взвешенное спектральное расстояние группы каждого кадра тишины в P кадрах тишины является суммой из взвешенных спектральных расстояний между каждым кадром тишины в P кадрах тишины и другими (P-1) кадрами тишины, где P является положительным целым числом; и второй блок определения, сконфигурированный с возможностью определения первого спектрального параметра согласно взвешенному спектральному расстоянию группы, определенному первым блоком определения, каждого кадра тишины в P кадрах тишины, где первый спектральный параметр используется для генерирования комфортного шума.
[0046] Со ссылкой на шестой аспект, в первой возможной методике реализации, второй блок определения, в частности, сконфигурирован с возможностью: выбора первого кадра тишины из P кадров тишины, так что взвешенное спектральное расстояние группы первого кадра тишины в P кадрах тишины является наименьшим; и определения, что спектральный параметр первого кадра тишины является первым спектральным параметром.
[0047] Со ссылкой на шестой аспект, во второй возможной методике реализации, второй блок определения, в частности, сконфигурирован с возможностью: выбора по меньшей мере одного кадра тишины из P кадров тишины, так что взвешенное спектральное расстояние группы по меньшей мере одного кадра тишины в P кадрах тишины меньше, чем третье пороговое значение; и определения первого спектрального параметра согласно спектральному параметру по меньшей мере одного кадра тишины.
[0048] Со ссылкой на шестой аспект или первую возможную методику реализации или вторую возможную методику реализации шестого аспекта, в третьей возможной методике реализации, P кадров тишины включают в себя вводимый в настоящий момент кадр тишины и (P-1) кадров тишины, предшествующих вводимому в настоящий момент кадру тишины; и
устройство дополнительно включает в себя: блок кодирования, сконфигурированный с возможностью кодирования вводимого в настоящий момент кадра тишины в кадр дескриптора тишины, SID, где кадр SID включает в себя первый спектральный параметр, определенный вторым блоком определения.
[0049] Согласно седьмому аспекту, обеспечено устройство обработки сигналов, включающее в себя: блок разделения, сконфигурированный с возможностью разделения диапазона частот входного сигнала на R поддиапазонов, где R является положительным целым числом; первый блок определения, сконфигурированный с возможностью определения на каждом поддиапазоне из R поддиапазонов, полученных после того, как блок разделения выполняет разделение, спектрального расстояния группы поддиапазонов каждого кадра тишины в S кадрах тишины, где спектральное расстояние группы поддиапазонов каждого кадра тишины в S кадрах тишины является суммой спектральных расстояний между каждым кадром тишины в S кадрах тишины на каждом поддиапазоне и другими (S-1) кадрами тишины, и S является положительным целым числом; и второй блок определения, сконфигурированный с возможностью определения на каждом поддиапазоне, полученном после того, как блок разделения выполняет разделение, первого спектрального параметра каждого поддиапазона согласно спектральному расстоянию группы поддипазонов, определенному первым блоком определения, каждого кадра тишины в S кадрах тишины, где первый спектральный параметр каждого поддипазона используется для генерирования комфортного шума.
[0050] Со ссылкой на седьмой аспект, в первой возможной методике реализации, второй блок определения, в частности, сконфигурирован с возможностью: выбора на каждом поддиапазоне первого кадра тишины из S кадров тишины, так что спектральное расстояние группы поддиапазонов первого кадра тишины в S кадрах тишины на каждом поддиапазоне является наименьшим; и определения на каждом поддиапазоне, что спектральный параметр первого кадра тишины является первым спектральным параметром каждого поддиапазона.
[0051] Со ссылкой на седьмой аспект, во второй возможной методике реализации, второй блок определения, в частности, сконфигурирован с возможностью: выбора на каждом поддиапазоне по меньшей мере одного кадра тишины из S кадров тишины, так что спектральное расстояние группы поддиапазонов по меньшей мере одного кадра тишины меньше, чем четвертое пороговое значение; и определения на каждом поддиапазоне первого спектрального параметра каждого поддиапазона согласно спектральному параметру по меньшей мере одного кадра тишины.
[0052] Со ссылкой на седьмой аспект или первую возможную методику реализации или вторую возможную методику реализации седьмого аспекта, в третьей возможной методике реализации, S кадров тишины включают в себя вводимый в настоящий момент кадр тишины и (S-1) кадров тишины, предшествующих вводимому в настоящий момент кадру тишины; и
устройство дополнительно включает в себя: блок кодирования, сконфигурированный с возможностью кодирования вводимого в настоящий момент кадра тишины в кадр дескриптора тишины, SID, где кадр SID включает в себя спектральный параметр каждого поддиапазона.
[0053] Согласно восьмому аспекту, обеспечено устройство обработки сигналов, включающее в себя: первый блок определения, сконфигурированный с возможностью определения первого параметра каждого кадра тишины в T кадрах тишины, где первый параметр используется для представления спектральной энтропии, и T является положительным целым числом; и второй блок определения, сконфигурированный с возможностью определения первого спектрального параметра согласно первому параметру, определенному первым блоком определения, каждого кадра тишины в T кадрах тишины, где первый спектральный параметр используется для генерирования комфортного шума.
[0054] Со ссылкой на восьмой аспект, в первой возможной методике реализации, второй блок определения, в частности, сконфигурирован с возможностью: в случае, в котором определяется, что T кадров тишины могут быть классифицированы на первую группу кадров тишины и вторую группу кадров тишины согласно критерию кластеризации, определения первого спектрального параметра согласно спектральному параметру первой группы кадров тишины, где спектральная энтропия, представленная первыми параметрами первой группы кадров тишины, больше, чем спектральная энтропия, представленная первыми параметрами второй группы кадров тишины; и в случае, в котором определяется, что T кадров тишины не могут быть классифицированы на первую группу кадров тишины и вторую группу кадров тишины согласно критерию кластеризации, выполнения взвешенного усреднения в отношении спектральных параметров T кадров тишины для определения первого спектрального параметра, где спектральная энтропия, представленная первыми параметрами первой группы кадров тишины, больше, чем спектральная энтропия, представленная первыми параметрами второй группы кадров тишины.
[0055] Со ссылкой на восьмой аспект, во второй возможной методике реализации второй блок определения, в частности, сконфигурирован с возможностью выполнения взвешенного усреднения в отношении спектральных параметров T кадров тишины для определения первого спектрального параметра,
где для iго кадра тишины и jго кадра тишины, которые являются различными, в T кадрах тишины весовой коэффициент, соответствующий iму кадру тишины, равен или больше, чем весовой коэффициент, соответствующий jму кадру тишины; когда первый параметр положительно коррелируется со спектральной энтропией, первый параметр iго кадра тишины больше, чем первый параметр jго кадра тишины; и когда первый параметр отрицательно коррелируется со спектральной энтропией, первый параметр iго кадра тишины меньше, чем первый параметр jго кадра тишины, где i и j оба являются положительными целыми числами, и 1≤i≤T, и 1≤j≤T.
[0056] Со ссылкой на восьмой аспект или первую возможную методику реализации или вторую возможную методику реализации восьмого аспекта, в третьей возможной методике реализации, T кадров тишины включают в себя вводимый в настоящий момент кадр тишины и (T-1) кадров тишины, предшествующих вводимому в настоящий момент кадру тишины; и
устройство дополнительно включает в себя: блок кодирования, сконфигурированный с возможностью кодирования вводимого в настоящий момент кадра тишины в кадр дескриптора тишины, SID, где кадр SID включает в себя первый спектральный параметр.
[0057] В вариантах осуществления настоящего изобретения, в случае, в котором методика кодирования предыдущего кадра относительно вводимого в настоящий момент кадра является методикой непрерывного кодирования, предсказывается комфортный шум, который генерируется декодером согласно вводимому в настоящий момент кадру, в случае, в котором вводимый в настоящий момент кадр кодируется в кадр SID, определяется степень отклонения между комфортным шумом и фактическим сигналом тишины, и определяется согласно степени отклонения, что методика кодирования вводимого в настоящий момент кадра является методикой кодирования c кадром затягивания или методикой кодирования с кадром SID, вместо того, что вводимый в настоящий момент кадр просто кодируется в кадр затягивания согласно количеству, полученному посредством сбора статистики кадров активной речи, посредством этого сохраняя полосу рабочих частот канала связи.
Краткое описание чертежей
[0058] Чтобы более четко описать технические решения в вариантах осуществления настоящего изобретения, нижеследующее кратко представляет сопроводительные чертежи, необходимые для описания вариантов осуществления настоящего изобретения. Очевидно, сопроводительные чертежи в нижеследующем описании показывают только некоторые варианты осуществления настоящего изобретения и обычный специалист в данной области техники может все еще выводить другие чертежи из этих сопроводительных чертежей без творческих усилий.
[0059] ФИГ. 1 представляет собой схематическую блок-схему системы речевой связи согласно варианту осуществления настоящего изобретения;
[0060] ФИГ. 2 представляет собой схематическую блок-схему последовательности операций способа кодирования сигналов согласно варианту осуществления настоящего изобретения;
[0061] ФИГ. 3A представляет собой схематическую блок-схему последовательности операций процесса способа кодирования сигналов согласно варианту осуществления настоящего изобретения;
[0062] ФИГ. 3B представляет собой схематическую блок-схему последовательности операций процесса способа кодирования сигналов согласно другому варианту осуществления настоящего изобретения;
[0063] ФИГ. 4 представляет собой схематическую блок-схему последовательности операций способа обработки сигналов согласно варианту осуществления настоящего изобретения;
[0064] ФИГ. 5 представляет собой схематическую блок-схему последовательности операций способа обработки сигналов согласно другому варианту осуществления настоящего изобретения;
[0065] ФИГ. 6 представляет собой схематическую блок-схему последовательности операций способа обработки сигналов согласно другому варианту осуществления настоящего изобретения;
[0066] ФИГ. 7 представляет собой схематическую блок-схему устройства кодирования сигналов согласно варианту осуществления настоящего изобретения;
[0067] ФИГ. 8 представляет собой схематическую блок-схему устройства обработки сигналов согласно другому варианту осуществления настоящего изобретения;
[0068] ФИГ. 9 представляет собой схематическую блок-схему устройства обработки сигналов согласно другому варианту осуществления настоящего изобретения;
[0069] ФИГ. 10 представляет собой схематическую блок-схему устройства обработки сигналов согласно другому варианту осуществления настоящего изобретения;
[0070] ФИГ. 11 представляет собой схематическую блок-схему устройства кодирования сигналов согласно другому варианту осуществления настоящего изобретения;
[0071] ФИГ. 12 представляет собой схематическую блок-схему устройства обработки сигналов согласно другому варианту осуществления настоящего изобретения;
[0072] ФИГ. 13 представляет собой схематическую блок-схему устройства обработки сигналов согласно другому варианту осуществления настоящего изобретения; и
[0073] ФИГ. 14 представляет собой схематическую блок-схему устройства обработки сигналов согласно другому варианту осуществления настоящего изобретения.
Описание вариантов осуществления
[0074] Нижеследующее четко и полностью описывает технические решения в вариантах осуществления настоящего изобретения со ссылкой на сопроводительные чертежи в вариантах осуществления настоящего изобретения. Очевидно, что описанные варианты осуществления представляют собой некоторые, но не все варианты осуществления настоящего изобретения. Все другие варианты осуществления, полученные специалистом в данной области техники на основе вариантов осуществления настоящего изобретения без творческих усилий, должны попадать в объем охраны настоящего изобретения.
[0075] ФИГ. 1 представляет собой схематическую блок-схему системы речевой связи согласно варианту осуществления настоящего изобретения.
[0076] Система 100 на ФИГ. 1 может быть системой DTX. Система 100 может включать в себя кодер 110 и декодер 120.
[0077] Кодер 110 может усекать входной сигнал речи временной области в кадр речи, кодировать кадр речи и отправлять кодированный кадр речи декодеру 120. Декодер 120 может принимать кодированный кадр речи из кодера 110, декодировать кодированный кадр речи и выводить декодированный сигнал речи временной области.
[0078] Кодер 110 может дополнительно включать в себя детектор 110a активности речевого процесса (детектор активности речевого процесса, VAD). VAD 110a может обнаруживать, является ли вводимый в настоящий момент кадр речи кадром активной речи или кадром тишины. Кадр активной речи может представлять кадр, включающий в себя сигнал речи вызова, и кадр тишины может представлять кадр, не включающий в себя сигнал речи вызова. В этом документе, кадр тишины может включать в себя кадр приглушения, чья энергия меньше, чем пороговое значение тишины, или также может включать в себя кадр фонового шума. Кодер 110 может иметь два рабочих состояния, то есть, состояние непрерывной передачи и состояние прерывистой передачи. Когда кодер 110 работает в состоянии непрерывной передачи, кодер 110 может кодировать каждый вводимый кадр речи и отправлять кодированный кадр. Когда кодер 110 работает в состоянии прерывистой передачи, кодер 110 не может кодировать вводимый кадр речи или может кодировать кадр речи в кадр SID. В общем, только когда вводимый кадр речи является кадром тишины, кодер 110 работает в состоянии прерывистой передачи.
[0079] Когда вводимый в настоящий момент кадр тишины является первым кадром после окончания диапазона активной речи, где диапазон активной речи включает в себя интервал затягивания, который может существовать, кодер 110 может кодировать кадр тишины в кадр SID, где SID_FIRST может быть использовано для представления кадра SID. Когда вводимый в настоящий момент кадр тишины является nым кадром после предыдущего кадра SID, где n является положительным целым числом и не имеется кадра активной речи между входным в настоящий момент кадром тишины и предыдущим кадром SID, кодер 110 может кодировать кадр тишины в кадр SID, где SID_UPDATE может быть использовано для представления кадра SID.
[0080] Кадр SID может включать в себя некоторую информацию, описывающую характеристику сигнала тишины. Декодер может генерировать комфортный шум согласно информации характеристики. Например, кадр SID может включать в себя информацию энергии и спектральную информацию сигнала тишины. Дополнительно, например, информация энергии сигнала тишины может включать в себя энергию сигнала возбуждения в модели линейного предсказания с кодовым возбуждением (линейное предсказание с кодовым возбуждением, CELP) или энергию временной области сигнала тишины. Спектральная информация может включать в себя коэффициент частоты спектральной линии (частота спектральной линии, LSF), коэффициент пары линейчатого спектра (пара линейчатого спектра, LSP), коэффициент частоты спектральных иммитансов (частота спектральных иммитансов, ISF), коэффициент пары спектральных иммитансов (пара спектральных иммитансов, ISP), коэффициент кодирования линейного предсказания (кодирование линейного предсказания, LPC), коэффициент быстрого преобразования Фурье (быстрое преобразование Фурье, FFT) или коэффициент модифицированного дискретного косинусного преобразования (модифицированное дискретное косинусное преобразование, MDCT) или подобное.
[0081] Кодированный кадр речи может включать в себя три типа: кодированный кадр речи, кадр SID и кадр NO_DATA. Кодированный кадр речи является кадром, который кодируется кодером 110 в состоянии непрерывной передачи, и кадр NO_DATA может представлять кадр, не имеющий кодированных битов, то есть кадр, который не существует физически, такой как кадр тишины, который не кодируется и находится между кадрами SID.
[0082] Декодер 120 может принимать кодированный кадр речи от кодера 110 и декодировать кодированный кадр речи. Когда принимается кодированный кадр речи, декодер может непосредственно декодировать кадр и выводить кадр речи временной области. Когда принимается кадр SID, декодер может декодировать кадр SID и получать информацию длины затягивания, информацию энергии и спектральную информацию в кадре SID. В частности, когда кадр SID является SID_UPDATE, декодер может получать информацию энергии и спектральную информацию сигнала тишины, то есть, получать параметр CN согласно информации в текущем кадре SID или согласно информации в текущем кадре SID и со ссылкой на другую информацию, так чтобы генерировать кадр CN временной области согласно параметру CN. Когда кадр SID является SID_FIRST, декодер получает согласно информации длины затягивания в кадре SID, информацию статистики энергии и спектра в m кадрах, предшествующих кадру, и получает параметр CN со ссылкой на информацию, которая получается посредством декодирования и находится в кадре SID, так чтобы генерировать кадр CN временной области, где m является положительным целым числом. Когда кадр NO_DATA вводится в декодер, декодер получает параметр CN согласно недавно принятому кадру SID и со ссылкой на другую информацию, так чтобы генерировать кадр CN временной области.
[0083] ФИГ. 2 представляет собой схематическую блок-схему последовательности операций способа кодирования сигналов согласно варианту осуществления настоящего изобретения. Способ на ФИГ. 2 исполняется кодером, например, может быть исполнен кодером 110 на ФИГ. 1.
[0084] 210: В случае, в котором методика кодирования предыдущего кадра относительно вводимого в настоящий момент кадра является методикой непрерывного кодирования, предсказание комфортного шума, который генерируется декодером согласно вводимому в настоящий момент кадру, в случае, в котором вводимый в настоящий момент кадр кодируется в кадр SID, и определение фактического сигнала тишины, где вводимый в настоящий момент кадр является кадром тишины.
[0085] В этом варианте осуществления настоящего изобретения фактический сигнал тишины может относиться к вводимому в кодер фактическому сигналу тишины.
[0086] 220: Определение степени отклонения между комфортным шумом и фактическим сигналом тишины.
[0087] 230: Определение методики кодирования вводимого в настоящий момент кадра согласно степени отклонения, где методика кодирования вводимого в настоящий момент кадра включает в себя методику кодирования c кадром затягивания или методику кодирования с кадром SID.
[0088] В частности, методика кодирования c кадром затягивания может относиться к методике непрерывного кодирования. Кодер может кодировать кадр тишины в интервале затягивания методикой непрерывного кодирования, и кадр, полученный посредством кодирования, может быть упомянут как кадр затягивания.
[0089] 240: Кодирование вводимого в настоящий момент кадра согласно методике кодирования вводимого в настоящий момент кадра.
[0090] На этапе 210, кодер может определять согласно различным факторам, что надо кодировать предыдущий кадр вводимого в настоящий момент кадра методикой непрерывного кодирования, например, если VAD в кодере определяет, что предыдущий кадр находится в диапазоне активной речи или кодер определяет, что предыдущий кадр находится в интервале затягивания, кодер может кодировать предыдущий кадр методикой непрерывного кодирования.
[0091] После того, как входной сигнал речи входит в диапазон тишины, кодер может определять согласно фактической ситуации, работать ли в состоянии непрерывной передачи или состоянии прерывистой передачи. Поэтому, для вводимого в настоящий момент кадра, используемого в качестве кадра тишины, кодер должен определять как кодировать вводимый в настоящий момент кадр.
[0092] Вводимый в настоящий момент кадр может быть первым кадром тишины после того, как входной сигнал речи входит в диапазон тишины или также может быть nым кадром после того, как входной сигнал речи входит в диапазон тишины, где n является положительным целым числом, большим, чем 1.
[0093] Если вводимый в настоящий момент кадр является первым кадром тишины, на этапе 230, то что кодер определяет методику кодирования вводимого в настоящий момент кадра является: определением, должен ли быть установлен интервал затягивания, где, если интервал затягивания должен быть установлен, кодер может кодировать вводимый в настоящий момент кадр в кадр затягивания, и если никакого интервала затягивания не должно быть установлено, кодер может кодировать вводимый в настоящий момент кадр в кадр SID.
[0094] Если вводимый в настоящий момент кадр является nым кадром тишины и кодер может определять, что вводимый в настоящий момент кадр находится в интервале затягивания, то есть, кадры тишины, предшествующие вводимому в настоящий момент кадру, непрерывно кодируются, на этапе 230, то что кодер определяет методику кодирования вводимого в настоящий момент кадра является: определением, оканчивать ли интервал затягивания, где, если интервал затягивания должен быть окончен, кодер может кодировать вводимый в настоящий момент кадр в кадр SID, и если интервал затягивания должен быть продлен, кодер может кодировать вводимый в настоящий момент кадр в кадр затягивания.
[0095] Если вводимый в настоящий момент кадр является nым кадром тишины и не имеется механизма затягивания, на этапе 230, кодер должен определять методику кодирования вводимого в настоящий момент кадра, так что декодер может получать лучший сигнал комфортного шума после декодирования кодированного вводимого в настоящий момент кадра.
[0096] Как можно видеть, этот вариант осуществления настоящего изобретения может быть применен не только в сценарии запуска механизма затягивания, но также может быть применен в сценарии исполнения механизма затягивания, и также может быть применен в сценарии, в котором не имеется механизма затягивания. В частности, в этом варианте осуществления настоящего изобретения может быть определено, запускать ли механизм затягивания, и также заранее может быть определено, оканчивать ли механизм затягивания. В качестве альтернативы, для сценария, в котором не имеется механизма затягивания, в этом варианте осуществления настоящего изобретения, может быть определена методика кодирования кадра тишины для того, чтобы достигать лучших эффектов кодирования и эффектов декодирования.
[0097] В частности, можно предположить, что кодер кодирует вводимый в настоящий момент кадр в кадр SID, если декодер принимает кадр SID, декодер генерирует комфортный шум согласно кадру SID, и кодер может предсказывать комфортный шум. Затем, кодер может оценивать степень отклонения между комфортным шумом и фактическим сигналом тишины, который вводится в кодер. Степень отклонения в этом документе может быть понята как степень подобия. Если предсказанный комфортный шум достаточно близок к фактическому сигналу тишины, кодер может учитывать, что ни одного интервала затягивания не должно быть установлено или интервал затягивания не должен быть продлен.
[0098] В предшествующей области техники, исполнять ли интервал затягивания с фиксированной длиной, определяется просто посредством сбора статистики в отношении количества кадров активной речи. То есть, если имеются достаточно кадров активной речи, которые должны быть непрерывно кодированы, устанавливается интервал затягивания с фиксированной длиной. Неважно, является ли вводимый в настоящий момент кадр первым кадром тишины или nым кадром тишины, который находится в интервале затягивания, вводимый в настоящий момент кадр кодируется в кадр затягивания. Однако ненужные кадры затягивания могут являться причиной расходования полосы рабочих частот канала связи. Однако, в этом варианте осуществления настоящего изобретения методика кодирования вводимого в настоящий момент кадра определяется согласно степени отклонения между предсказанным комфортным шумом и фактическим сигналом тишины, вместо того, что вводимый в настоящий момент кадр просто кодируется в кадр затягивания согласно количеству кадров активной речи, посредством этого сохраняя полосу рабочих частот канала связи.
[0099] В этом варианте осуществления настоящего изобретения, в случае, в котором методика кодирования предыдущего кадра относительно вводимого в настоящий момент кадра является методикой непрерывного кодирования, предсказывается комфортный шум, который генерируется декодером согласно вводимому в настоящий момент кадру, в случае, в котором вводимый в настоящий момент кадр кодируется в кадр SID, определяется степень отклонения между комфортным шумом и фактическим сигналом тишины, и определяется согласно степени отклонения, что методика кодирования вводимого в настоящий момент кадра является методикой кодирования c кадром затягивания или методикой кодирования с кадром SID, вместо того, что вводимый в настоящий момент кадр просто кодируется в кадр затягивания согласно количеству, полученному посредством сбора статистики кадров активной речи, посредством этого сохраняя полосу рабочих частот канала связи.
[0100] Необязательно, в качестве варианта осуществления, на этапе 210, кодер может предсказывать комфортный шум первой методикой предсказания, где первая методика предсказания является такой же как методика, в которой декодер генерирует комфортный шум.
[0101] В частности, кодер и декодер могут определять комфортный шум одной и той же методикой; или кодер и декодер могут определять комфортный шум различными методиками, что не ограничивается в этом варианте осуществления настоящего изобретения.
[0102] Необязательно, в качестве варианта осуществления, на этапе 210, кодер может предсказывать параметр характеристики комфортного шума и определять параметр характеристики фактического сигнала тишины, где параметр характеристики комфортного шума находится во взаимно однозначном соответствии с параметром характеристики фактического сигнала тишины. На этапе 220, кодер может определять расстояние между параметром характеристики комфортного шума и параметром характеристики фактического сигнала тишины.
[0103] В частности, кодер может сравнивать параметр характеристики комфортного шума с параметром характеристики фактического сигнала тишины для получения расстояния между параметрами характеристик, так чтобы определять степень отклонения между комфортным шумом и фактическим сигналом тишины. Параметр характеристики комфортного шума должен быть во взаимно однозначном соответствии с параметром характеристики фактического сигнала тишины. То есть, тип параметра характеристики комфортного шума является таким же, как тип параметра характеристики фактического сигнала тишины. Например, кодер может сравнивать параметр энергии комфортного шума с параметром энергии фактического сигнала тишины или также может сравнивать спектральный параметр комфортного шума со спектральным параметром фактического сигнала тишины.
[0104] В этом варианте осуществления настоящего изобретения, когда параметры характеристик являются скалярными величинами, расстояние между параметрами характеристик может относиться к абсолютной величине разности между параметрами характеристик, то есть, к скалярному расстоянию. Когда параметры характеристик являются векторами, расстояние между параметрами характеристик может относиться к сумме скалярных расстояний соответствующих элементов между параметрами характеристик.
[0105] Необязательно, в качестве другого варианта осуществления, на этапе 230 кодер может определять в случае, в котором расстояние между параметром характеристики комфортного шума и параметром характеристики фактического сигнала тишины меньше, чем соответствующее пороговое значение в наборе пороговых значений, что методика кодирования вводимого в настоящий момент кадра является методикой кодирования с кадром SID, где расстояние между параметром характеристики комфортного шума и параметром характеристики фактического сигнала тишины находится во взаимно однозначном соответствии с пороговым значением в наборе пороговых значений. Кодер также может определять в случае, в котором расстояние между параметром характеристики комфортного шума и параметром характеристики фактического сигнала тишины равно или больше, чем соответствующее пороговое значение в наборе пороговых значений, что методика кодирования вводимого в настоящий момент кадра является методикой кодирования c кадром затягивания.
[0106] В частности, параметр характеристики комфортного шума и параметр характеристики фактического сигнала тишины каждый могут включать в себя по меньшей мере один параметр; поэтому расстояние между параметром характеристики комфортного шума и параметром характеристики фактического сигнала тишины также может включать в себя расстояние между по меньшей мере одним типом параметров. Набор пороговых значений также может включать в себя по меньшей мере одно пороговое значение. Расстояние между каждым типом параметров может соответствовать одному пороговому значению. При определении методики кодирования вводимого в настоящий момент кадра, кодер может раздельно сравнивать расстояние между по меньшей мере одним типом параметров с соответствующим пороговым значением в наборе пороговых значений. По меньшей мере одно пороговое значение в наборе пороговых значений может быть предустановлено или также может быть определено кодером согласно параметрам характеристик нескольких кадров тишины, предшествующих вводимому в настоящий момент кадру.
[0107] Если расстояние между параметром характеристики комфортного шума и параметром характеристики фактического сигнала тишины меньше, чем соответствующее пороговое значение в наборе пороговых значений, кодер может учитывать, что комфортный шум достаточно близок к фактическому сигналу тишины, и поэтому может кодировать вводимый в настоящий момент кадр в кадр SID. Если расстояние между параметром характеристики комфортного шума и параметром характеристики фактического сигнала тишины равно или больше, чем соответствующее пороговое значение в наборе пороговых значений, кодер может учитывать, что отклонение между комфортным шумом и фактическим сигналом тишины относительно большое, и поэтому может кодировать вводимый в настоящий момент кадр в кадр затягивания.
[0108] Необязательно, в качестве другого варианта осуществления, параметр характеристики комфортного шума может быть использован для представления по меньшей мере одной из следующей информации: информации энергии и спектральной информации.
[0109] Необязательно, в качестве другого варианта осуществления, информация энергии может включать в себя энергию возбуждения CELP. Спектральная информация может включать в себя по меньшей мере один из следующего: коэффициента фильтра линейного предсказания, коэффициента FFT и коэффициента MDCT. Коэффициент фильтра линейного предсказания может включать в себя по меньшей мере один из следующего: коэффициента LSF, коэффициента LSP, коэффициента ISF, коэффициента ISP, коэффициента отражения и коэффициента LPC.
[0110] Необязательно, в качестве другого варианта осуществления, на этапе 210, кодер может определять, что параметр характеристики вводимого в настоящий момент кадра является параметром характеристики фактического сигнала тишины. В качестве альтернативы, кодер может собирать статистику в отношении параметров характеристик M кадров тишины для определения параметра характеристики фактического сигнала тишины.
[0111] Необязательно, в качестве другого варианта осуществления, M кадров тишины могут включать в себя вводимый в настоящий момент кадр и (M-1) кадров тишины, предшествующих вводимому в настоящий момент кадру, где M является положительным целым числом.
[0112] Например, если вводимый в настоящий момент кадр является первым кадром тишины, параметр характеристики фактического сигнала тишины может быть параметром характеристики вводимого в настоящий момент кадра; если вводимый в настоящий момент кадр является nым кадром тишины, параметр характеристики фактического сигнала может быть получен кодером посредством сбора статистики в отношении параметров характеристик M кадров тишины, включающих в себя вводимый в настоящий момент кадр. M кадров тишины могут быть непрерывными или также могут быть прерывистыми, что не ограничивается в этом варианте осуществления настоящего изобретения.
[0113] Необязательно, в качестве другого варианта осуществления, на этапе 210, кодер может предсказывать параметр характеристики комфортного шума согласно параметру комфортного шума предыдущего кадра относительно вводимого в настоящий момент кадра и параметру характеристики вводимого в настоящий момент кадра. В качестве альтернативы, кодер может предсказывать параметр характеристики комфортного шума согласно параметрам характеристик L кадров затягивания, предшествующих вводимому в настоящий момент кадру, и параметру характеристики вводимого в настоящий момент кадра, где L является положительным целым числом.
[0114] Например, если вводимый в настоящий момент кадр является первым кадром тишины, кодер может предсказывать параметр характеристики комфортного шума согласно параметру комфортного шума предыдущего кадра и параметру характеристики вводимого в настоящий момент кадра. При кодировании каждого кадра, кодер может сохранять параметр комфортного шума каждого кадра в кодере. Обычно, только когда вводимый кадр является кадром тишины, сохраненный параметр комфортного шума может изменяться относительно параметра предыдущего кадра, поскольку кодер может обновлять сохраненный параметр комфортного шума согласно параметру характеристики вводимого в настоящий момент кадра тишины, и обычно не обновляет параметр комфортного шума, когда вводимый в настоящий момент кадр является кадром активной речи. Поэтому, кодер может извлекать параметр комфортного шума, сохраненный в кодере, предыдущего кадра. Например, параметр комфортного шума может включать в себя параметр энергии и спектральный параметр сигнала тишины.
[0115] В дополнение, если вводимый в настоящий момент кадр в настоящий момент находится в интервале затягивания, кодер может собирать статистику в отношении параметров L кадров затягивания, предшествующих вводимому в настоящий момент кадру, и получать параметр характеристики комфортного шума согласно результату, полученному посредством сбора статистики, и параметру характеристики вводимого в настоящий момент кадра.
[0116] Необязательно, в качестве другого варианта осуществления, параметр характеристики комфортного шума может включать в себя энергию возбуждения CELP комфортного шума и коэффициент LSF комфортного шума, и параметр характеристики фактического сигнала тишины может включать в себя энергию возбуждения CELP фактического сигнала тишины и коэффициент LSF фактического сигнала тишины. На этапе 220, кодер может определять расстояние De между энергией возбуждения CELP комфортного шума и энергией возбуждения CELP фактического сигнала тишины, и определять расстояние Dlsf между коэффициентом LSF комфортного шума и коэффициентом LSF фактического сигнала тишины.
[0117] Следует отметить, что расстояние De и расстояние Dlsf могут включать в себя одну вариацию или также могут включать в себя группу вариаций. Например, расстояние Dlsf может включать в себя две вариации, где одна вариация может быть средним расстоянием между коэффициентами LSF, то есть, средним значением расстояний между коэффициентами LSF, и другая может быть максимальным расстоянием между коэффициентами LSF, то есть, расстоянием между парой коэффициентов LSF, имеющих максимальное расстояние.
[0118] Необязательно, в качестве другого варианта осуществления, на этапе 230, в случае, в котором расстояние De меньше, чем первое пороговое значение, и расстояние Dlsf меньше, чем второе пороговое значение, кодер может определять, что методика кодирования вводимого в настоящий момент кадра является методикой кодирования с кадром SID. В случае, в котором расстояние De равно или больше, чем первое пороговое значение или расстояние Dlsf равно или больше, чем второе пороговое значение, кодер может определять, что методика кодирования вводимого в настоящий момент кадра является методикой кодирования c кадром затягивания. Первое пороговое значение и второе пороговое значение оба принадлежат к набору пороговых значений.
[0119] Необязательно, в качестве другого варианта осуществления, когда De или Dlsf включает в себя группу вариаций, кодер сравнивает каждую вариацию в группе вариаций с соответствующим пороговым значением, так чтобы определять методику для кодирования вводимого в настоящий момент кадра.
[0120] В частности, кодер может определять методику кодирования вводимого в настоящий момент кадра согласно расстоянию De и расстоянию Dlsf. Если расстояние De < первого порогового значения и расстояние Dlsf < второго порогового значения, он может указывать, что энергия возбуждения CELP и коэффициент LSF предсказанного комфортного шума незначительно отличаются от энергии возбуждения CELP и коэффициента LSF фактического сигнала тишины, и кодер может учитывать, что комфортный шум достаточно близок к фактическому сигналу тишины, и может кодировать вводимый в настоящий момент кадр в кадр SID; иначе, кодер может кодировать вводимый в настоящий момент кадр в кадр затягивания.
[0121] Необязательно, в качестве другого варианта осуществления, на этапе 230, кодер может извлекать предустановленное первое пороговое значение и предустановленное второе пороговое значение. В качестве альтернативы, кодер может определять первое пороговое значение согласно энергии возбуждения CELP N кадров тишины, предшествующих вводимому в настоящий момент кадру, и определять второе пороговое значение согласно коэффициентам LSF N кадров тишины, где N является положительным целым числом.
[0122] В частности, и первое пороговое значение, и второе пороговое значение могут быть предустановленными фиксированными значениями. В качестве альтернативы, и первое пороговое значение, и второе пороговое значение могут быть самоприспосабливающимися вариациями. Например, первое пороговое значение может быть получено кодером посредством сбора статистики в отношении энергии возбуждения CELP N кадров тишины, предшествующих вводимому в настоящий момент кадру, и второе пороговое значение может быть получено кодером посредством сбора статистики в отношении коэффициентов LSF N кадров тишины, предшествующих вводимому в настоящий момент кадру, где N кадров тишины могут быть непрерывными или также могут быть прерывистыми.
[0123] Нижеследующее подробно описывает специфический процесс с ФИГ. 2 посредством использования специфических примеров. На примерах с ФИГ. 3A и ФИГ. 3B, два сценария, в которых этот вариант осуществления настоящего изобретения может быть применен, используются для описания. Следует понимать, что эти примеры предназначаются только с целью помощи специалисту в данной области техники в более лучшем понимании этого варианта осуществления настоящего изобретения, вместо того, чтобы ограничивать объем этого варианта осуществления настоящего изобретения.
[0124] ФИГ. 3A представляет собой схематическую блок-схему последовательности операций процесса способа кодирования сигналов согласно варианту осуществления настоящего изобретения. На ФИГ. 3A, предполагается, что методика кодирования предыдущего кадра относительно вводимого в настоящий момент кадра является методикой непрерывного кодирования, и VAD в кодере определяет, что вводимый в настоящий момент кадр является первым кадром тишины после того, как входной сигнал речи входит в диапазон тишины; затем, кодер должен определить, устанавливать ли интервал затягивания, то есть, должен определять, кодировать ли вводимый в настоящий момент кадр в кадр затягивания или кадр SID. Нижеследующее подробно описывает процесс.
[0125] 301а: Определение энергии возбуждения CELP и коэффициента LSF фактического сигнала тишины.
[0126] В частности, кодер может использовать энергию возбуждения CELP e вводимого в настоящий момент кадра в качестве энергии возбуждения CELP eSI фактического сигнала тишины и может использовать коэффициент LSF lsf(i) вводимого в настоящий момент кадра в качестве коэффициента LSF lsfSI(i) вводимого в настоящий момент кадра, где i=0, 1, …, K-1, и K является порядком фильтра. Кодер может определять энергию возбуждения CELP и коэффициент LSF вводимого в настоящий момент кадра со ссылкой на предшествующий уровень техники.
[0127] 302a: Предсказание энергии возбуждения CELP и коэффициента LSF комфортного шума, который генерируется декодером согласно вводимому в настоящий момент кадру, в случае, в котором вводимый в настоящий момент кадр кодируется в кадр SID.
[0128] Можно предполагать, что кодер кодирует вводимый в настоящий момент кадр в кадр SID, декодер генерирует комфортный шум согласно кадру SID. Кодер может предсказывать энергию возбуждения CELP eCN и коэффициент LSF lsfCN(i) комфортного шума, где i=0, 1, …, K-1, и K является порядком фильтра. Кодер может раздельно определять энергию возбуждения CELP и коэффициент LSF комфортного шума согласно параметру комфортного шума, сохраненному в кодере, предыдущего кадра и энергии возбуждения CELP, и коэффициенту LSF вводимого в настоящий момент кадра.
[0129] Например, кодер может предсказывать энергию возбуждения CELP eCN комфортного шума согласно следующему уравнению (1):
где может представлять энергию возбуждения CELP предыдущего кадра, и e может представлять энергию возбуждения CELP вводимого в настоящий момент кадра.
[0130] Кодер может предсказывать коэффициент LSF lsfCN(i) комфортного шума согласно следующему уравнению (2), где i=0, 1, …, K-1, и K является порядком фильтра:
где может представлять коэффициент LSF предыдущего кадра, и lsf(i) может представлять iй коэффициент LSF вводимого в настоящий момент кадра.
[0131] 303a: Определение расстояния De между энергией возбуждения CELP комфортного шума и энергией возбуждения CELP фактического сигнала тишины, и определение расстояния Dlsf между коэффициентом LSF комфортного шума и коэффициентом LSF фактического сигнала тишины.
[0132] В частности, кодер может определять расстояние De между энергией возбуждения CELP комфортного шума и энергией возбуждения CELP фактического сигнала тишины согласно следующему уравнению (3):
[0133] Кодер может определять расстояние Dlsf между коэффициентом LSF комфортного шума и коэффициентом LSF фактического сигнала тишины согласно следующему уравнению (4):
[0134] 304a: Определение, меньше ли расстояние De, чем первое пороговое значение, и меньше ли расстояние Dlsf, чем второе пороговое значение.
[0135] В частности, и первое пороговое значение, и второе пороговое значение могут быть предустановленными фиксированными значениями.
[0136] В качестве альтернативы, и первое пороговое значение, и второе пороговое значение могут быть самоприспосабливающимися вариациями. Кодер может определять первое пороговое значение согласно энергии возбуждения CELP N кадров тишины, предшествующих вводимому в настоящий момент кадру, например, кодер может определять первое пороговое значение thr1 согласно следующему уравнению (5):
[0137] Кодер может определять второе пороговое значение согласно коэффициентам LSF N кадров тишины, например, кодер может определять второе пороговое значение thr2 согласно следующему уравнению (6):
[0138] В уравнении (5) и уравнении (6), [x] может представлять xый кадр и x может быть n, m, или p. Например, может представлять энергию возбуждения CELP mго кадра. может представлять iй коэффициент LSF nго кадра, и может представлять iй коэффициент LSF pго кадра.
[0139] 305a: Если расстояние De меньше, чем первое пороговое значение, и расстояние Dlsf меньше, чем второе пороговое значение, определение не устанавливать интервал затягивания, и кодирование вводимого в настоящий момент кадра в кадр SID.
[0140] Если расстояние De меньше, чем первое пороговое значение, и расстояние Dlsf меньше, чем второе пороговое значение, кодер может учитывать, что комфортный шум, который может быть сгенерирован декодером, находится достаточно близко к фактическому сигналу тишины, никакого интервала затягивания не может быть установлено, и вводимый в настоящий момент кадр кодируется в кадр SID.
[0141] 306a: Если расстояние De равно или больше, чем первое пороговое значение или расстояние Dlsf равно или больше, чем второе пороговое значение, определение об установке интервала затягивания, и кодирование вводимого в настоящий момент кадра в кадр затягивания.
[0142] В этом варианте осуществления настоящего изобретения, определяется согласно степени отклонения между комфортным шумом, который генерируется декодером согласно вводимому в настоящий момент кадру, в случае, в котором вводимый в настоящий момент кадр кодируется в кадр SID, и фактическим сигналом тишины, что методика кодирования вводимого в настоящий момент кадра является методикой кодирования c кадром затягивания или методикой кодирования с кадром SID, вместо того, что вводимый в настоящий момент кадр просто кодируется в кадр затягивания согласно количеству, полученному посредством сбора статистики, кадров активной речи, посредством этого сохраняя полосу рабочих частот канала связи.
[0143] ФИГ. 3B представляет собой схематическую блок-схему последовательности операций процесса способа кодирования сигналов согласно другому варианту осуществления настоящего изобретения. На ФИГ. 3B предполагается, что вводимый в настоящий момент кадр уже находится в интервале затягивания. Кодер должен определять, оканчивать ли интервал затягивания, то есть, кодер должен определять, продолжать ли кодировать вводимый в настоящий момент кадр в кадр затягивания, или кодировать ли вводимый в настоящий момент кадр в кадр SID. Нижеследующее подробно описывает процесс.
[0144] 301b: Определение энергии возбуждения CELP и коэффициента LSF фактического сигнала тишины.
[0145] Необязательно, аналогично этапу 301a, кодер может использовать энергию возбуждения CELP и коэффициент LSF вводимого в настоящий момент кадра в качестве энергии возбуждения CELP и коэффициента LSF фактического сигнала тишины.
[0146] Необязательно, кодер может собирать статистику в отношении энергии возбуждения CELP M кадров тишины, включающих в себя вводимый в настоящий момент кадр, для получения энергии возбуждения CELP фактического сигнала тишины, где M ≤ количеству кадров затягивания, предшествующих вводимому в настоящий момент кадру, в пределах интервала затягивания.
[0147] Например, кодер может определять энергию возбуждения CELP eSI фактического сигнала тишины согласно уравнению (7):
[0148] Для другого примера, кодер может предсказывать коэффициент LSF lsfSI(i) фактического сигнала тишины согласно следующему уравнению (8), где i=0, 1, …, K-1, и K является порядком фильтра:
[0149] В вышеприведенном уравнении (7) и уравнении (8), w(j) может представлять весовой коэффициент, может представлять энергию возбуждения CELP jго кадра тишины, предшествующего вводимому в настоящий момент кадру.
[0150] 302b: Предсказание энергии возбуждения CELP и коэффициента LSF комфортного шума, который генерируется декодером согласно вводимому в настоящий момент кадру, в случае, в котором вводимый в настоящий момент кадр кодируется в кадр SID.
[0151] В частности, кодер может раздельно определять энергию возбуждения CELP eCN и коэффициент LSF lsfCN(i) комфортного шума согласно энергии возбуждения CELP и коэффициентам LSF L кадров затягивания, предшествующих вводимому в настоящий момент кадру, где i=0, 1, …, K-1, и K является порядком фильтра.
[0152] Например, кодер может определять энергию возбуждения CELP eCN комфортного шума согласно следующему уравнению (9):
где может представлять энергию возбуждения jго кадра затягивания, предшествующего вводимому в настоящий момент кадру.
[0153] Для другого примера, кодер может определять коэффициент LSF lsfCN(i) комфортного шума согласно следующему уравнению (10), где i=0, 1, …, K-1, и K является порядком фильтра:
где может представлять iй коэффициент LSF jго кадра затягивания, предшествующего вводимому в настоящий момент кадру.
[0154] В уравнении (9) и уравнении (10), w(j) может представлять весовой коэффициент.
[0155] 303b: Определение расстояния De между энергией возбуждения CELP комфортного шума и энергией возбуждения CELP фактического сигнала тишины, и определение расстояния Dlsf между коэффициентом LSF комфортного шума и коэффициентом LSF фактического сигнала тишины.
[0156] Например, кодер может определять расстояние De между энергией возбуждения CELP комфортного шума и энергией возбуждения CELP фактического сигнала тишины согласно уравнению (3). Кодер может определять расстояние Dlsf между коэффициентом LSF комфортного шума и коэффициентом LSF фактического сигнала тишины согласно уравнению (4).
[0157] 304b: Определение, меньше ли расстояние De, чем первое пороговое значение, и меньше ли расстояние Dlsf, чем второе пороговое значение.
[0158] В частности, и первое пороговое значение, и второе пороговое значение могут быть предустановленными фиксированными значениями.
[0159] В качестве альтернативы, и первое пороговое значение, и второе пороговое значение могут быть самоприспосабливающимися вариациями. Например, кодер может определять первое пороговое значение thr1 согласно уравнению (5), и может определять второе пороговое значение thr2 согласно уравнению (6).
[0160] 305b: Если расстояние De меньше, чем первое пороговое значение, и расстояние Dlsf меньше, чем второе пороговое значение, определение об окончании интервала затягивания, и кодирование вводимого в настоящий момент кадра в кадр SID.
[0161] 306b: Если расстояние De равно или больше, чем первое пороговое значение или расстояние Dlsf равно или больше, чем второе пороговое значение, определение о продолжении продления интервала затягивания, и кодирование вводимого в настоящий момент кадра в кадр затягивания.
[0162] В этом варианте осуществления настоящего изобретения, определяется согласно степени отклонения между комфортным шумом, который генерируется декодером согласно вводимому в настоящий момент кадру, в случае, в котором вводимый в настоящий момент кадр кодируется в кадр SID, и фактическим сигналом тишины, что методика кодирования вводимого в настоящий момент кадра является методикой кодирования c кадром затягивания или методикой кодирования с кадром SID, вместо того, что вводимый в настоящий момент кадр просто кодируется в кадр затягивания согласно количеству, полученному посредством сбора статистики, кадров активной речи, посредством этого сохраняя полосу рабочих частот канала связи.
[0163] Как можно видеть из вышеуказанного, после входа в состояние прерывистой передачи, кодер может периодически кодировать кадр SID. Кадр SID в общем включает в себя некоторую информацию, описывающую энергию и спектр сигнала тишины. После приема кадра SID из кодера, декодер может генерировать комфортный шум согласно информации в кадре SID. В настоящий момент, поскольку кадр SID кодируется и отправляется один раз за каждые несколько кадров, при кодировании кадра SID, кодер обычно получает информацию кадра SID посредством сбора статистики в отношении вводимого в настоящий момент кадра тишины и нескольких кадров тишины, предшествующих вводимому в настоящий момент кадру тишины. Например, в пределах непрерывного интервала тишины, информация кодируемого в настоящий момент кадра SID, обычно, получается посредством сбора статистики в отношении текущего кадра SID и нескольких кадров тишины между текущим кадром SID и предыдущим кадром SID. Для другого примера, информация кодирования первого кадра SID после диапазона активной речи обычно получается кодером посредством сбора статистики в отношении вводимого в настоящий момент кадра тишины и нескольких смежных кадров затягивания в конце диапазона активной речи, то есть, получается посредством сбора статистики в отношении кадров тишины в пределах интервала затягивания. Для удобства описания, несколько кадров тишины, используемых для сбора статистики в отношении параметра кодирования с кадром SID, упоминаются как интервал анализа. В частности, когда кодируется кадр SID, параметр кадра SID получается посредством получения среднего значения или срединного значения параметров нескольких кадров тишины в пределах интервала анализа. Однако, фактический спектр фонового шума может включать в себя различные неожиданные переходные спектральные составляющие. Как только интервал анализа включает в себя такие спектральные составляющие, составляющие могут быть добавлены в кадре SID в способе для получения среднего значения, и спектр тишины, включающий в себя такие спектральные составляющие, может быть даже неправильно кодирован в кадре SID в способе для получения срединного значения, вызывая тем самым уменьшение качества комфортного шума, который генерируется декодером согласно кадру SID.
[0164] ФИГ. 4 представляет собой схематическую блок-схему последовательности операций способа обработки сигналов согласно варианту осуществления настоящего изобретения. Способ на ФИГ. 4 исполняется кодером или декодером, например, может быть исполнен кодером 110 или декодером 120 на ФИГ. 1.
[0165] 410: Определение взвешенного спектрального расстояния группы (взвешенного спектрального расстояния группы) каждого кадра тишины в P кадрах тишины, где взвешенное спектральное расстояние группы каждого кадра тишины в P кадрах тишины является суммой из взвешенных спектральных расстояний между каждым кадром тишины в P кадрах тишины и другими (P-1) кадрами тишины, где P является положительным целым числом.
[0166] Например, кодер или декодер может сохранять параметры нескольких кадров тишины, предшествующих вводимому в настоящий момент кадру тишины, в буфер. Длина буфера может быть фиксированной или переменной. P кадров тишины могут быть выбраны кодером или декодером из буфера.
[0167] 420: Определение первого спектрального параметра согласно взвешенному спектральному расстоянию группы каждого кадра тишины в P кадрах тишины, где первый спектральный параметр используется для генерирования комфортного шума.
[0168] В этом варианте осуществления настоящего изобретения, первый спектральный параметр, используемый для генерирования комфортного шума, определяется согласно взвешенному спектральному расстоянию группы каждого кадра тишины в P кадрах тишины, вместо того, что спектральный параметр, используемый для генерирования комфортного шума, получается просто посредством получения среднего значения или срединного значения спектральных параметров нескольких кадров тишины, посредством этого улучшая качество комфортного шума.
[0169] Необязательно, в качестве варианта осуществления, на этапе 410, взвешенное спектральное расстояние группы каждого кадра тишины может быть определено согласно спектральному параметру каждого кадра тишины в P кадрах тишины. Например, взвешенное спектральное расстояние группы xго кадра в P кадрах тишины может быть определено согласно следующему уравнению (11):
где может представлять iй спектральный параметр xго кадра, может представлять iй спектральный параметр jго кадра, w(i) может быть весовым коэффициентом и K является количеством коэффициентов спектрального параметра.
[0170] Например, спектральный параметр каждого кадра тишины может включать в себя коэффициент LSF, коэффициент LSP, коэффициент ISF, коэффициент ISP, коэффициент LPC, коэффициент отражения, коэффициент FFT или коэффициент MDCT или подобный. Поэтому, соответственно, на этапе 420, первый спектральный параметр может включать в себя коэффициент LSF, коэффициент LSP, коэффициент ISF, коэффициент ISP, коэффициент LPC, коэффициент отражения, коэффициент FFT или коэффициент MDCT, или подобный.
[0171] Нижеследующее описывает процесс этапа 420 посредством использования примера, в котором спектральный параметр является коэффициентом LSF. Например, сумма из взвешенных спектральных расстояний между коэффициентом LSF каждого кадра тишины и коэффициентами LSF других (P-1) кадров тишины, то есть взвешенное спектральное расстояние группы swd коэффициента LSF каждого кадра тишины, может быть определено, например, взвешенное спектральное расстояние группы коэффициента LSF xго кадра в P кадрах тишины может быть определено согласно следующему уравнению (12), где x=0, 1, 2, …, P-1:
где является весовым коэффициентом, и является порядком фильтра.
[0172] Необязательно, в качестве варианта осуществления, каждый кадр тишины может соответствовать одной группе весовых коэффициентов, где в одной группе весовых коэффициентов, весовой коэффициент, соответствующий первой группе поддиапазонов, больше, чем весовой коэффициент, соответствующий второй группе поддиапазонов, и перцептивная важность первой группы поддиапазонов больше, чем перцептивная важность второй группы поддиапазонов.
[0173] Поддиапазоны могут быть получены посредством разделения спектрального коэффициента; для специфического процесса, ссылка может быть сделана на предшествующий уровень техники. Перцептивная важность поддиапазонов может быть определена согласно предшествующему уровню техники. Обычно, перцептивная важность низкочастотного поддиапазона выше, чем перцептивная важность высокочастотного поддиапазона; поэтому, в упрощенном варианте осуществления, весовой коэффициент низкочастотного поддиапазона может быть больше, чем весовой коэффициент высокочастотного поддиапазона.
[0174] Например, в уравнении (12), является весовым коэффициентом, где i=0, 1, …, . Каждый кадр тишины соответствует одной группе весовых коэффициентов, то есть, с . В одной группе весовых коэффициентов, весовой коэффициент коэффициента LSF низкочастотного поддиапазона больше, чем весовой коэффициент коэффициента LSF высокочастотного поддиапазона. Поскольку энергия фонового шума главным образом концентрируется в низкочастотном диапазоне, качество комфортного шума, сгенерированного декодером, в основном определяется качеством сигнала низкочастотного диапазона, и влияние, наложенное спектральным расстоянием коэффициента LSF высокочастотного диапазона на конечном взвешенном спектральном расстоянии, должно уменьшаться надлежащим образом.
[0175] Необязательно, в качестве другого варианта осуществления, на этапе 420, первый кадр тишины может быть выбран из P кадров тишины, так что взвешенное спектральное расстояние группы первого кадра тишины в P кадрах тишины является наименьшим, и может быть определено, что спектральный параметр первого кадра тишины является первым спектральным параметром.
[0176] В частности, то, что взвешенное спектральное расстояние группы является наименьшим, может указывать, что спектральный параметр первого кадра тишины может лучше всего представлять общность спектральных параметров P кадров тишины. Поэтому, спектральный параметр первого кадра тишины может быть кодирован в кадр SID. Например, для взвешенного спектрального расстояния группы коэффициента LSF каждого кадра тишины, взвешенное спектральное расстояние группы коэффициента LSF первого кадра тишины является наименьшим; тогда, это может указывать, что спектр LSF первого кадра тишины является спектром LSF, который может лучше всего представлять общность между спектрами LSF P кадров тишины.
[0177] Необязательно, в качестве другого варианта осуществления, на этапе 420, по меньшей мере один кадр тишины может быть выбран из P кадров тишины, так что взвешенное спектральное расстояние группы по меньшей мере одного кадра тишины в P кадрах тишины меньше, чем третье пороговое значение, и первый спектральный параметр может быть определен согласно спектральному параметру по меньшей мере одного кадра тишины.
[0178] Например, в варианте осуществления, может быть определено, что среднее значение спектрального параметра по меньшей мере одного кадра тишины является первым спектральным параметром. В другом варианте осуществления, может быть определено, что срединное значение спектрального параметра по меньшей мере одного кадра тишины является первым спектральным параметром. В другом варианте осуществления, первый спектральный параметр также может быть определен согласно спектральному параметру по меньшей мере одного кадра тишины посредством использования другого способа в этом варианте осуществления настоящего изобретения.
[0179] Нижеследующее приводит описание все еще посредством использования примера, в котором спектральный параметр является коэффициентом LSF; тогда, спектральный параметр может быть первым коэффициентом LSF. Например, взвешенное спектральное расстояние группы коэффициента LSF каждого кадра тишины в P кадрах тишины может быть получено согласно уравнению (12). По меньшей мере один кадр тишины, чье взвешенное спектральное расстояние группы коэффициента LSF меньше, чем третье пороговое значение, выбирается из P кадров тишины. Затем, среднее значение коэффициента LSF по меньшей мере одного кадра тишины может быть использовано в качестве первого коэффициента LSF. Например, первый коэффициент LSF lsfSID(i) может быть определен согласно следующему уравнению (13), где i=0, 1, …, является порядком фильтра:
где {A} может представлять кадр тишины в P кадрах тишины, за исключением по меньшей мере одного кадра тишины, и может представлять iй коэффициент LSF jго кадра.
[0180] В дополнение, может быть предустановлено третье пороговое значение.
[0181] Необязательно, в качестве другого варианта осуществления, когда способ на ФИГ. 4 исполняется кодером, P кадров тишины могут включать в себя вводимый в настоящий момент кадр тишины и (P-1) кадров тишины, предшествующих вводимому в настоящий момент кадру тишины.
[0182] Когда способ на ФИГ. 4 исполняется декодером, P кадров тишины могут быть P кадрами затягивания.
[0183] Необязательно, в качестве другого варианта осуществления, когда способ на ФИГ. 4 исполняется кодером, кодер может кодировать вводимый в настоящий момент кадр тишины в кадр SID, где кадр SID включает в себя первый спектральный параметр.
[0184] В этом варианте осуществления настоящего изобретения, кодер может кодировать вводимый в настоящий момент кадр в кадр SID, так что кадр SID включает в себя первый спектральный параметр, вместо того, что спектральный параметр кадра SID получается просто посредством получения среднего значения или срединного значения спектральных параметров нескольких кадров тишины, посредством этого улучшая качество комфортного шума, который генерируется декодером согласно кадру SID.
[0185] ФИГ. 5 представляет собой схематическую блок-схему последовательности операций способа обработки сигналов согласно другому варианту осуществления настоящего изобретения. Способ на ФИГ. 5 исполняется кодером или декодером, например, может быть исполнен кодером 110 или декодером 120 на ФИГ. 1.
[0186] 510: Разделение диапазона частот входного сигнала на R поддиапазонов, где R является положительным целым числом.
[0187] 520: Определение на каждом поддиапазоне из R поддиапазонов, спектрального расстояния группы поддиапазонов каждого кадра тишины в S кадрах тишины, где спектральное расстояние группы поддиапазонов каждого кадра тишины в S кадрах тишины является суммой спектральных расстояний между каждым кадром тишины в S кадрах тишины на каждом поддиапазоне и другими (S-1) кадрами тишины, и S является положительным целым числом.
[0188] 530: Определение на каждом поддиапазоне согласно спектральному расстоянию группы поддиапазонов каждого кадра тишины в S кадрах тишины, первого спектрального параметра каждого поддиапазона, где первый спектральный параметр каждого поддиапазона используется для генерирования комфортного шума.
[0189] В этом варианте осуществления настоящего изобретения, первый спектральный параметр, который имеется у каждого поддиапазона и используется для генерирования комфортного шума, определяется на каждом поддиапазоне R поддиапазонов согласно спектральному расстоянию группы поддиапазонов каждого кадра тишины в S кадрах тишины, вместо того, что спектральный параметр, используемый для генерирования комфортного шума, получается просто посредством использования среднего значения или срединного значения спектральных параметров нескольких кадров тишины, посредством этого улучшая качество комфортного шума.
[0190] На этапе 530, для каждого поддиапазона, спектральное расстояние группы поддиапазонов каждого кадра тишины на каждом поддиапазоне может быть определено согласно спектральному параметру каждого кадра тишины в S кадрах тишины. Необязательно, в качестве варианта осуществления, спектральное расстояние группы поддиапазонов yго кадра тишины на kм поддиапазоне может быть определено согласно следующему уравнению (14), где k=1, 2, …, R, и y=0, 1, …, S-1:
где L(k) может представлять количество коэффициентов спектральных параметров, включенных в kй поддиапазон, может представлять iй коэффициент спектрального параметра yго кадра тишины на kм поддиапазоне, и может представлять iй коэффициент спектрального параметра jго кадра тишины на kм поддиапазоне.
[0191] Например, спектральный параметр каждого кадра тишины может включать в себя коэффициент LSF, коэффициент LSP, коэффициент ISF, коэффициент ISP, коэффициент LPC, коэффициент отражения, коэффициент FFT или коэффициент MDCT или подобный.
[0192] Нижеследующее приводит описание посредством использования примера, в котором спектральный параметр является коэффициентом LSF. Например, может быть определено спектральное расстояние группы поддиапазонов коэффициента LSF каждого кадра тишины. Каждый поддиапазон может включать в себя коэффициент LSF или также может включать в себя несколько коэффициентов LSF. Например, спектральное расстояние группы поддиапазонов коэффициента LSF yго кадра тишины на kм поддиапазоне может быть определено согласно следующему уравнению (15), где k=1, 2, …, R, и y=0, 1, …, S-1:
где L(k) может представлять количество коэффициентов LSF, включенных в kй поддиапазон, может представлять iй коэффициент LSF yго кадра тишины на kм поддиапазоне, и может представлять iй коэффициент LSF jго кадра тишины на kм поддиапазоне.
[0193] Соответственно, первый спектральный параметр каждого поддиапазона может включать в себя коэффициент LSF, коэффициент LSP, коэффициент ISF, коэффициент ISP, коэффициент LPC, коэффициент отражения, коэффициент FFT или коэффициент MDCT или подобный.
[0194] Необязательно, в качестве другого варианта осуществления, на этапе 530, первый кадр тишины может быть выбран на каждом поддиапазоне из S кадров тишины, так что спектральное расстояние группы поддиапазонов первого кадра тишины в S кадрах тишины на каждом поддиапазоне является наименьшим. Затем, спектральный параметр первого кадра тишины на каждом поддиапазоне может быть использован в качестве первого спектрального параметра каждого поддиапазона.
[0195] В частности, кодер может определять первый кадр тишины на каждом поддиапазоне и использовать спектральный параметр первого кадра тишины в качестве первого спектрального параметра поддиапазона.
[0196] Нижеследующее приводит описание все еще посредством использования примера, в котором спектральный параметр является коэффициентом LSF. Соответственно, первый спектральный параметр каждого поддиапазона является первым коэффициентом LSF каждого поддиапазона. Например, спектральное расстояние группы поддиапазонов коэффициента LSF каждого кадра тишины на каждом поддиапазоне может быть определено согласно уравнению (15). Для каждого поддиапазона, коэффициент LSF кадра, имеющего наименьшее спектральное расстояние группы поддиапазонов, может быть выбран в качестве первого коэффициента LSF поддиапазона.
[0197] Необязательно, в качестве другого варианта осуществления, на этапе 530, по меньшей мере один кадр тишины может быть выбран на каждом поддиапазоне из S кадров тишины, так что спектральное расстояние группы поддиапазонов по меньшей мере одного кадра тишины меньше, чем четвертое пороговое значение. Затем, первый спектральный параметр каждого поддиапазона может быть определен на каждом поддиапазоне согласно спектральному параметру по меньшей мере одного кадра тишины.
[0198] Например, в варианте осуществления, может быть определено, что среднее значение спектрального параметра по меньшей мере одного кадра тишины в S кадрах тишины на каждом поддиапазоне является первым спектральным параметром каждого поддиапазона. В другом варианте осуществления, может быть определено, что срединное значение спектрального параметра по меньшей мере одного кадра тишины в S кадрах тишины на каждом поддиапазоне является первым спектральным параметром каждого поддиапазона. В другом варианте осуществления, первый спектральный параметр каждого поддиапазона также может быть определен согласно спектральному параметру по меньшей мере одного кадра тишины посредством использования другого способа в настоящем изобретении.
[0199] С использованием коэффициента LSF в качестве примера, спектральное расстояние группы поддиапазонов коэффициента LSF каждого кадра тишины на каждом поддиапазоне может быть определено согласно уравнению (15). Для каждого поддиапазона, по меньшей мере один кадр тишины, чье спектральное расстояние группы поддиапазонов меньше, чем четвертое пороговое значение, может быть выбран, и определяется, что среднее значение коэффициента LSF по меньшей мере одного кадра тишины является первым коэффициентом LSF поддиапазона. Четвертое пороговое значение может быть предустановлено.
[0200] Необязательно, в качестве другого варианта осуществления, когда способ на ФИГ. 5 исполняется кодером, S кадров тишины могут включать в себя вводимый в настоящий момент кадр тишины и (S-1) кадров тишины, предшествующих вводимому в настоящий момент кадру тишины.
[0201] Когда способ на ФИГ. 5 исполняется декодером, S кадров тишины могут быть S кадрами затягивания.
[0202] Необязательно, в качестве другого варианта осуществления, когда способ на ФИГ. 5 исполняется кодером, кодер может кодировать вводимый в настоящий момент кадр тишины в кадр SID, где кадр SID включает в себя первый спектральный параметр каждого поддиапазона.
[0203] В этом варианте осуществления настоящего изобретения, при кодировании кадра SID, кодер может обеспечивать возможность кадру SID включать в себя первый спектральный параметр каждого поддиапазона, вместо того, что спектральный параметр кадра SID получается просто посредством получения среднего значения или срединного значения спектральных параметров нескольких кадров тишины, посредством этого улучшая качество комфортного шума, который генерируется декодером согласно кадру SID.
[0204] ФИГ. 6 представляет собой схематическую блок-схему последовательности операций способа обработки сигналов согласно другому варианту осуществления настоящего изобретения. Способ на ФИГ. 6 исполняется кодером или декодером, например, может быть исполнен кодером 110 или декодером 120 на ФИГ. 1.
[0205] 610: Определение первого параметра каждого кадра тишины в T кадрах тишины, где упомянутый первый параметр используется для представления спектральной энтропии, и T является положительным целым числом.
[0206] Например, когда спектральная энтропия кадра тишины может быть определена непосредственно, первый параметр может быть спектральной энтропией. В некоторых случаях спектральная энтропия, соответствующая строгому определению, не может быть определена непосредственно, и в этом случае, первый параметр может быть другим параметром, который может представлять спектральную энтропию, например, параметром, который может отражать структурную силу спектра, или подобным.
[0207] Например, первый параметр каждого кадра тишины может быть определен согласно коэффициенту LSF каждого кадра тишины. Например, первый параметр zго кадра тишины может быть определен согласно следующему уравнению (16), где z=1, 2, …, T:
где K является порядком фильтра.
[0208] В этом документе, C является параметром, который может отражать структурную силу спектра, и не соответствовать строго определению спектральной энтропии, где больший C может указывать меньшую спектральную энтропию.
[0209] 620: Определение первого спектрального параметра согласно упомянутому первому параметру каждого кадра тишины в T кадрах тишины, где упомянутый первый спектральный параметр используется для генерирования комфортного шума.
[0210] В этом варианте осуществления настоящего изобретения, первый спектральный параметр, используемый для генерирования комфортного шума, определяется согласно первым параметрам, которые используются для представления спектральной энтропии и имеются у T кадров тишины, вместо того, что спектральный параметр, используемый для генерирования комфортного шума, получается просто посредством получения среднего значения или срединного значения спектральных параметров нескольких кадров тишины, посредством этого улучшая качество комфортного шума.
[0211] Необязательно, в качестве варианта осуществления, в случае, в котором определяется, что T кадров тишины могут быть классифицированы на первую группу кадров тишины и вторую группу кадров тишины согласно критерию кластеризации, упомянутый первый спектральный параметр может быть определен согласно спектральному параметру упомянутой первой группы кадров тишины, где спектральная энтропия, представленная первыми параметрами упомянутой первой группы кадров тишины, больше, чем спектральная энтропия, представленная первыми параметрами упомянутой второй группы кадров тишины; и в случае, в котором определяется, что T кадров тишины не могут быть классифицированы на упомянутую первую группу кадров тишины и упомянутую вторую группу кадров тишины согласно критерию кластеризации, взвешенное усреднение может быть выполнено в отношении спектральных параметров T кадров тишины для определения упомянутого первого спектрального параметра, где спектральная энтропия, представленная упомянутыми первыми параметрами упомянутой первой группы кадров тишины, больше, чем спектральная энтропия, представленная упомянутыми первыми параметрами упомянутой второй группы кадров тишины.
[0212] В общем, спектр обычного шум имеет относительно слабую структурную силу, в то время как спектр сигнала без шума или спектр шума, включающий в себя переходную составляющую, имеет относительно сильную структурную силу. Структурная сила спектра непосредственно соответствует размеру спектральной энтропии. В общем и целом, спектральная энтропия обычного шума может быть относительно большой, в то время как спектральная энтропия сигнала без шума или шума, включающего в себя переходную составляющую, может быть относительно маленькой. Поэтому, в случае, в котором T кадров тишины могут быть классифицированы на первую группу кадров тишины и вторую группу кадров тишины, кодер может выбирать, согласно спектральной энтропии кадра тишины, спектральный параметр первой группы кадров тишины, не включающих в себя переходную составляющую, для определения первого спектрального параметра.
[0213] Например, в варианте осуществления, может быть определено, что среднее значение спектрального параметра первой группы кадров тишины является первым спектральным параметром. В другом варианте осуществления, может быть определено, что срединное значение спектрального параметра первой группы кадров тишины является первым спектральным параметром. В другом варианте осуществления, первый спектральный параметр также может быть определен согласно спектральному параметру первой группы кадров тишины посредством использования другого способа в настоящем изобретении.
[0214] Если T кадров тишины не могут быть классифицированы на первую группу кадров тишины и вторую группу кадров тишины, взвешенное усреднение может быть выполнено в отношении спектральных параметров T кадров тишины для получения первого спектрального параметра. Необязательно, в качестве другого варианта осуществления, критерий кластеризации может включать в себя: расстояние между первым параметром каждого кадра тишины в упомянутой первой группе кадров тишины и первым средним значением равно или меньше, чем расстояние между упомянутым первым параметром каждого кадра тишины в упомянутой первой группе кадров тишины и вторым средним значением; расстояние между первым параметром каждого кадра тишины в упомянутой второй группе кадров тишины и упомянутым вторым средним значением равно или меньше, чем расстояние между упомянутым первым параметром каждого кадра тишины в упомянутой второй группе кадров тишины и упомянутым первым средним значением; расстояние между упомянутым первым средним значением и упомянутым вторым средним значением больше, чем среднее расстояние между упомянутыми первыми параметрами упомянутой первой группы кадров тишины и упомянутым первым средним значением; и расстояние между упомянутым первым средним значением и упомянутым вторым средним значением больше, чем среднее расстояние между упомянутыми первыми параметрами упомянутой второй группы кадров тишины и упомянутым вторым средним значением,
где упомянутое первое среднее значение является средним значением упомянутых первых параметров упомянутой первой группы кадров тишины, и упомянутое второе среднее значение является средним значением упомянутых первых параметров упомянутой второй группы кадров тишины.
[0215] Необязательно, в качестве другого варианта осуществления, кодер может выполнять взвешенное усреднение в отношении спектральных параметров T кадров тишины для определения упомянутого первого спектрального параметра, где для iго кадра тишины и jго кадра тишины, которые являются различными, в T кадрах тишины весовой коэффициент, соответствующий iму кадру тишины, равен или больше, чем весовой коэффициент, соответствующий jму кадру тишины; когда упомянутый первый параметр положительно коррелируется со спектральной энтропией, первый параметр iго кадра тишины больше, чем первый параметр jго кадра тишины; и когда упомянутый первый параметр отрицательно коррелируется со спектральной энтропией, упомянутый первый параметр iго кадра тишины меньше, чем упомянутый первый параметр jго кадра тишины, где i и j оба являются положительными целыми числами, и 1≤i≤T, и 1≤j≤T.
[0216] В частности, кодер может выполнять взвешенное усреднение в отношении спектральных параметров T кадров тишины для получения первого спектрального параметра. Как описано выше по тексту, спектральная энтропия обычного шума может быть относительно большой, в то время как спектральная энтропия сигнала без шума или шума, включающего в себя переходную составляющую, может быть относительно маленькой. Поэтому, в T кадрах тишины весовой коэффициент, соответствующий кадру тишины, имеющему относительно большую спектральную энтропию, может быть больше или равен весовому коэффициенту, соответствующему кадру тишины, имеющему относительно маленькую спектральную энтропию.
[0217] Необязательно, в качестве другого варианта осуществления, когда способ на ФИГ. 6 исполняется кодером, T кадров тишины могут включать в себя вводимый в настоящий момент кадр тишины и (T-1) кадров тишины, предшествующих вводимому в настоящий момент кадру тишины.
[0218] Когда способ на ФИГ. 6 исполняется декодером, T кадров тишины могут быть T кадрами затягивания.
[0219] Необязательно, в качестве другого варианта осуществления, когда способ на ФИГ. 6 исполняется кодером, кодер может кодировать вводимый в настоящий момент кадр тишины в кадр SID, где кадр SID включает в себя первый спектральный параметр.
[0220] В этом варианте осуществления настоящего изобретения, при кодировании кадра SID, кодер может обеспечивать возможность кадру SID включать в себя первый спектральный параметр каждого поддиапазона, вместо того, что спектральный параметр кадра SID получается просто посредством получения среднего значения или срединного значения спектральных параметров нескольких кадров тишины, посредством этого улучшая качество комфортного шума, который генерируется декодером согласно кадру SID.
[0221] ФИГ. 7 представляет собой схематическую блок-схему устройства кодирования сигналов согласно варианту осуществления настоящего изобретения. Пример устройства 700 на ФИГ. 7 является кодером, например, кодером 110, показанным на ФИГ. 1. Устройство 700 включает в себя первый блок 710 определения, второй блок 720 определения, третий блок 730 определения и блок 740 кодирования.
[0222] Первый блок 710 определения предсказывает в случае, в котором методика кодирования предыдущего кадра относительно вводимого в настоящий момент кадра является методикой непрерывного кодирования, комфортный шум, который генерируется декодером согласно вводимому в настоящий момент кадру, в случае, в котором вводимый в настоящий момент кадр кодируется в кадр SID, и определяет фактический сигнал тишины, где вводимый в настоящий момент кадр является кадром тишины. Второй блок 720 определения определяет степень отклонения между комфортным шумом, определенным первым блоком 710 определения, и фактическим сигналом тишины, определенным первым блоком 710 определения. Третий блок 730 определения определяет методику кодирования вводимого в настоящий момент кадра согласно степени отклонения, определенной вторым блоком определения, где методика кодирования вводимого в настоящий момент кадра включает в себя методику кодирования c кадром затягивания или методику кодирования с кадром SID. Блок 740 кодирования кодирует вводимый в настоящий момент кадр согласно методике кодирования вводимого в настоящий момент кадра, определенной третьим блоком 730 определения.
[0223] В этом варианте осуществления настоящего изобретения, в случае, в котором методика кодирования предыдущего кадра относительно вводимого в настоящий момент кадра является методикой непрерывного кодирования, предсказывается комфортный шум, который генерируется декодером согласно вводимому в настоящий момент кадру, в случае, в котором вводимый в настоящий момент кадр кодируется в кадр SID, определяется степень отклонения между комфортным шумом и фактическим сигналом тишины, и определяется согласно степени отклонения, что методика кодирования вводимого в настоящий момент кадра является методикой кодирования c кадром затягивания или методикой кодирования с кадром SID, вместо того, что вводимый в настоящий момент кадр просто кодируется в кадр затягивания согласно количеству, полученному посредством сбора статистики кадров активной речи, посредством этого сохраняя полосу рабочих частот канала связи.
[0224] Необязательно, в качестве варианта осуществления, первый блок 710 определения может предсказывать параметр характеристики комфортного шума и определять параметр характеристики фактического сигнала тишины, где параметр характеристики комфортного шума находится во взаимно однозначном соответствии с параметром характеристики фактического сигнала тишины. Второй блок 720 определения может определять расстояние между параметром характеристики комфортного шума и параметром характеристики фактического сигнала тишины.
[0225] Необязательно, в качестве другого варианта осуществления, третий блок 730 определения может определять в случае, в котором расстояние между параметром характеристики комфортного шума и параметром характеристики фактического сигнала тишины меньше, чем соответствующее пороговое значение в наборе пороговых значений, что методика кодирования вводимого в настоящий момент кадра является методикой кодирования с кадром SID, где расстояние между параметром характеристики комфортного шума и параметром характеристики фактического сигнала тишины находится во взаимно однозначном соответствии с пороговым значением в наборе пороговых значений. Третий блок 730 определения может определять в случае, в котором расстояние между параметром характеристики комфортного шума и параметром характеристики фактического сигнала тишины равно или больше, чем соответствующее пороговое значение в наборе пороговых значений, что методика кодирования вводимого в настоящий момент кадра является методикой кодирования c кадром затягивания.
[0226] Необязательно, в качестве другого варианта осуществления, параметр характеристики комфортного шума может быть использован для представления по меньшей мере одной из следующей информации: информации энергии и спектральной информации.
[0227] Необязательно, в качестве другого варианта осуществления, информация энергии может включать в себя энергию возбуждения CELP. Спектральная информация может включать в себя по меньшей мере один из следующего: коэффициента фильтра линейного предсказания, коэффициента FFT и коэффициента MDCT.
[0228] Коэффициент фильтра линейного предсказания может включать в себя по меньшей мере один из следующего: коэффициента LSF, коэффициента LSP, коэффициента ISF, коэффициента ISP, коэффициента отражения и коэффициента LPC.
[0229] Необязательно, в качестве другого варианта осуществления, первый блок 710 определения может предсказывать параметр характеристики комфортного шума согласно параметру комфортного шума предыдущего кадра относительно вводимого в настоящий момент кадра и параметру характеристики вводимого в настоящий момент кадра. В качестве альтернативы, первый блок 710 определения может предсказывать параметр характеристики комфортного шума согласно параметрам характеристик L кадров затягивания, предшествующих вводимому в настоящий момент кадру, и параметру характеристики вводимого в настоящий момент кадра, где L является положительным целым числом.
[0230] Необязательно, в качестве другого варианта осуществления, первый блок 710 определения может определять, что параметр характеристики вводимого в настоящий момент кадра является параметром характеристики фактического сигнала тишины. В качестве альтернативы, первый блок 710 определения может собирать статистику в отношении параметров характеристик M кадров тишины для определения параметра характеристики фактического сигнала тишины.
[0231] Необязательно, в качестве другого варианта осуществления, M кадров тишины могут включать в себя вводимый в настоящий момент кадр и (M-1) кадров тишины, предшествующих вводимому в настоящий момент кадру, где M является положительным целым числом.
[0232] Необязательно, в качестве другого варианта осуществления, параметр характеристики комфортного шума может включать в себя энергию возбуждения линейного предсказания с кодовым возбуждением, CELP, комфортного шума и коэффициент частоты спектральной линии, LSF, комфортного шума, и параметр характеристики фактического сигнала тишины может включать в себя энергию возбуждения CELP фактического сигнала тишины и коэффициент LSF фактического сигнала тишины. Второй блок 720 определения может определять расстояние De между энергией возбуждения CELP комфортного шума и энергией возбуждения CELP фактического сигнала тишины, и определять расстояние Dlsf между коэффициентом LSF комфортного шума и коэффициентом LSF фактического сигнала тишины.
[0233] Необязательно, в качестве другого варианта осуществления, в случае, в котором расстояние De меньше, чем первое пороговое значение, и расстояние Dlsf меньше, чем второе пороговое значение, третий блок 730 определения может определять, что методика кодирования вводимого в настоящий момент кадра является методикой кодирования с кадром SID. В случае, в котором расстояние De равно или больше, чем упомянутое первое пороговое значение, или расстояние Dlsf равно или больше, чем упомянутое второе пороговое значение, третий блок 730 определения может определять, что методика кодирования вводимого в настоящий момент кадра является методикой кодирования c кадром затягивания.
[0234] Необязательно, в качестве другого варианта осуществления, устройство 700 может дополнительно включать в себя четвертый блок 750 определения. Четвертый блок 750 определения может извлекать предустановленное первое пороговое значение и предустановленное второе пороговое значение. В качестве альтернативы, четвертый блок 750 определения может определять первое пороговое значение согласно энергии возбуждения CELP N кадров тишины, предшествующих вводимому в настоящий момент кадру, и определять второе пороговое значение согласно коэффициентам LSF N кадров тишины, где N является положительным целым числом.
[0235] Необязательно, в качестве другого варианта осуществления, первый блок 710 определения может предсказывать комфортный шум первой методикой предсказания, где упомянутая первая методика предсказания является такой же как методика, в которой декодер генерирует комфортный шум.
[0236] Для других функций и операций устройства 700 ссылка может быть сделана на процессы вариантов осуществления способа на ФИГ. c 1 по 3B в вышеприведенном; во избежание повторения, никакие дополнительные подробности не обеспечены еще раз в этом документе.
[0237] ФИГ. 8 представляет собой схематическую блок-схему устройства обработки сигналов согласно другому варианту осуществления настоящего изобретения. Пример устройства 800 на ФИГ. 8 представляет собой кодер или декодер, например, кодер 110 или декодер 120, показанный на ФИГ. 1. Устройство 800 включает в себя первый блок 810 определения и второй блок 820 определения.
[0238] Первый блок 810 определения определяет взвешенное спектральное расстояние группы каждого кадра тишины в P кадрах тишины, где взвешенное спектральное расстояние группы каждого кадра тишины в P кадрах тишины является суммой из взвешенных спектральных расстояний между каждым кадром тишины в P кадрах тишины и другими (P-1) кадрами тишины, где P является положительным целым числом. Второй блок 820 определения определяет первый спектральный параметр согласно взвешенному спектральному расстоянию группы, определенному первым блоком 810 определения, каждого кадра тишины в P кадрах тишины, где первый спектральный параметр используется для генерирования комфортного шума.
[0239] В этом варианте осуществления настоящего изобретения, первый спектральный параметр, используемый для генерирования комфортного шума, определяется согласно взвешенному спектральному расстоянию группы каждого кадра тишины в P кадрах тишины, вместо того, что спектральный параметр, используемый для генерирования комфортного шума, получается просто посредством получения среднего значения или срединного значения спектральных параметров нескольких кадров тишины, посредством этого улучшая качество комфортного шума.
[0240] Необязательно, в качестве варианта осуществления, каждый кадр тишины может соответствовать одной группе весовых коэффициентов, где в одной группе весовых коэффициентов, весовой коэффициент, соответствующий первой группе поддиапазонов, больше, чем весовой коэффициент, соответствующий второй группе поддиапазонов, и перцептивная важность упомянутой первой группы поддиапазонов больше, чем перцептивная важность упомянутой второй группы поддиапазонов.
[0241] Необязательно, в качестве другого варианта осуществления, второй блок 820 определения может выбирать первый кадр тишины из P кадров тишины, так что взвешенное спектральное расстояние группы упомянутого первого кадра тишины в P кадрах тишины является наименьшим, и может определять, что спектральный параметр упомянутого первого кадра тишины является упомянутым первым спектральным параметром.
[0242] Необязательно, в качестве другого варианта осуществления, второй блок 820 определения может выбирать по меньшей мере один кадр тишины из P кадров тишины, так что взвешенное спектральное расстояние группы упомянутого по меньшей мере одного кадра тишины в P кадрах тишины меньше, чем третье пороговое значение, и определять первый спектральный параметр согласно спектральному параметру по меньшей мере одного кадра тишины.
[0243] Необязательно, в качестве другого варианта осуществления, когда устройство 800 является кодером, устройство 800 может дополнительно включать в себя блок 830 кодирования.
[0244] P кадров тишины могут включать в себя вводимый в настоящий момент кадр тишины и (P-1) кадров тишины, предшествующих вводимому в настоящий момент кадру тишины. Блок 830 кодирования может кодировать вводимый в настоящий момент кадр тишины в кадр SID, где кадр SID включает в себя первый спектральный параметр, определенный вторым блоком 820 определения.
[0245] Для других функций и операций устройства 800 ссылка может быть сделана на процесс варианта осуществления способа на ФИГ. 4 в вышеприведенном; во избежание повторения, никакие дополнительные подробности не обеспечены еще раз в этом документе.
[0246] ФИГ. 9 представляет собой схематическую блок-схему устройства обработки сигналов согласно другому варианту осуществления настоящего изобретения. Пример устройства 900 на ФИГ. 9 представляет собой кодер или декодер, например, кодер 110 или декодер 120, показанный на ФИГ. 1. Устройство 900 включает в себя блок 910 разделения, первый блок 920 определения и второй блок 930 определения.
[0247] Блок 910 разделения разделяет диапазон частот входного сигнала на R поддиапазонов, где R является положительным целым числом. Первый блок 920 определения определяет на каждом поддиапазоне из R поддиапазонов, полученных после того, как блок 910 разделения выполняет разделение, спектральное расстояние группы поддиапазонов каждого кадра тишины в S кадрах тишины, где спектральное расстояние группы поддиапазонов каждого кадра тишины в S кадрах тишины является суммой спектральных расстояний между каждым кадром тишины в S кадрах тишины на каждом поддиапазоне и другими (S-1) кадрами тишины, и S является положительным целым числом. Второй блок 930 определения определяет на каждом поддиапазоне первый спектральный параметр каждого поддиапазона согласно спектральному расстоянию, определенному первым блоком 920 определения, каждого кадра тишины в S кадрах тишины, где первый спектральный параметр каждого поддиапазона используется для генерирования комфортного шума.
[0248] В этом варианте осуществления настоящего изобретения, спектральный параметр, который имеется у каждого поддиапазона и используется для генерирования комфортного шума, определяется на каждом поддиапазоне R поддиапазонов согласно спектральному расстоянию каждого кадра тишины в S кадрах тишины, вместо того, что спектральный параметр, используемый для генерирования комфортного шума, получается просто посредством получения среднего значения или срединного значения спектральных параметров нескольких кадров тишины, посредством этого улучшая качество комфортного шума.
[0249] Необязательно, в качестве варианта осуществления, второй блок 930 определения может выбирать на каждом поддиапазоне первый кадр тишины из S кадров тишины, так что спектральное расстояние группы поддиапазонов упомянутого первого кадра тишины в S кадрах тишины на каждом поддиапазоне является наименьшим, и определять на каждом поддиапазоне, что спектральный параметр упомянутого первого кадра тишины является упомянутым первым спектральным параметром каждого поддиапазона.
[0250] Необязательно, в качестве другого варианта осуществления, второй блок 930 определения может выбирать на каждом поддиапазоне по меньшей мере один кадр тишины из S кадров тишины, так что спектральное расстояние группы поддиапазонов упомянутого по меньшей мере одного кадра тишины меньше, чем четвертое пороговое значение, и определять на каждом поддиапазоне упомянутый первый спектральный параметр каждого поддиапазона согласно спектральному параметру упомянутого по меньшей мере одного кадра тишины.
[0251] Необязательно, в качестве другого варианта осуществления, когда устройство 900 является кодером, устройство 900 может дополнительно включать в себя блок 940 кодирования.
[0252] S кадров тишины могут включать в себя вводимый в настоящий момент кадр тишины и (S-1) кадров тишины, предшествующих вводимому в настоящий момент кадру тишины. Блок 940 кодирования может кодировать вводимый в настоящий момент кадр тишины в кадр SID, где кадр SID включает в себя первый спектральный параметр каждого поддиапазона.
[0253] Для других функций и операций устройства 900 ссылка может быть сделана на процесс варианта осуществления способа на ФИГ. 5 в вышеприведенном; во избежание повторения, никакие дополнительные подробности не обеспечены еще раз в этом документе.
[0254] ФИГ. 10 представляет собой схематическую блок-схему устройства обработки сигналов согласно другому варианту осуществления настоящего изобретения. Пример устройства 1000 на ФИГ. 10 представляет собой кодер или декодер, например, кодер 110 или декодер 120, показанный на ФИГ. 1. Устройство 1000 включает в себя первый блок 1010 определения и второй блок 1020 определения.
[0255] Первый блок 1010 определения определяет первый параметр каждого кадра тишины в T кадрах тишины, где упомянутый первый параметр используется для представления спектральной энтропии, и T является положительным целым числом. Второй блок 1020 определения определяет первый спектральный параметр согласно первому параметру, определенному первым блоком 1010 определения, каждого кадра тишины в T кадрах тишины, где первый спектральный параметр используется для генерирования комфортного шума.
[0256] В этом варианте осуществления настоящего изобретения, первый спектральный параметр, используемый для генерирования комфортного шума, определяется согласно первым параметрам, которые используются для представления спектральной энтропии и имеются у T кадров тишины, вместо того, что спектральный параметр, используемый для генерирования комфортного шума, получается просто посредством получения среднего значения или срединного значения спектральных параметров нескольких кадров тишины, посредством этого улучшая качество комфортного шума.
[0257] Необязательно, в качестве варианта осуществления, второй блок 1020 определения может определять в случае, в котором определяется, что T кадров тишины могут быть классифицированы на первую группу кадров тишины и вторую группу кадров тишины согласно критерию кластеризации, упомянутого первый спектральный параметр согласно спектральному параметру упомянутой первой группы кадров тишины, где спектральная энтропия, представленная первыми параметрами упомянутой первой группы кадров тишины, больше, чем спектральная энтропия, представленная первыми параметрами упомянутой второй группы кадров тишины; и в случае, в котором определяется, что T кадров тишины не могут быть классифицированы на упомянутую первую группу кадров тишины и упомянутую вторую группу кадров тишины согласно критерию кластеризации, выполнять взвешенное усреднение в отношении спектральных параметров T кадров тишины для определения упомянутого первого спектрального параметра, где спектральная энтропия, представленная упомянутыми первыми параметрами упомянутой первой группы кадров тишины, больше, чем спектральная энтропия, представленная упомянутыми первыми параметрами упомянутой второй группы кадров тишины.
[0258] Необязательно, в качестве другого варианта осуществления, критерий кластеризации может включать в себя: расстояние между первым параметром каждого кадра тишины в упомянутой первой группе кадров тишины и первым средним значением равно или меньше, чем расстояние между упомянутым первым параметром каждого кадра тишины в упомянутой первой группе кадров тишины и вторым средним значением; расстояние между первым параметром каждого кадра тишины в упомянутой второй группе кадров тишины и упомянутым вторым средним значением равно или меньше, чем расстояние между упомянутым первым параметром каждого кадра тишины в упомянутой второй группе кадров тишины и упомянутым первым средним значением; расстояние между упомянутым первым средним значением и упомянутым вторым средним значением больше, чем среднее расстояние между упомянутыми первыми параметрами упомянутой первой группы кадров тишины и упомянутым первым средним значением; и расстояние между упомянутым первым средним значением и упомянутым вторым средним значением больше, чем среднее расстояние между упомянутыми первыми параметрами упомянутой второй группы кадров тишины и упомянутым вторым средним значением,
где упомянутое первое среднее значение является средним значением упомянутых первых параметров упомянутой первой группы кадров тишины, и упомянутое второе среднее значение является средним значением упомянутых первых параметров упомянутой второй группы кадров тишины.
[0259] Необязательно, в качестве другого варианта осуществления, второй блок 1020 определения может выполнять взвешенное усреднение в отношении спектральных параметров T кадров тишины для определения упомянутого первого спектрального параметра, где для iго кадра тишины и jго кадра тишины, которые являются различными, в T кадрах тишины весовой коэффициент, соответствующий iму кадру тишины, равен или больше, чем весовой коэффициент, соответствующий jму кадру тишины; когда упомянутый первый параметр положительно коррелируется со спектральной энтропией, первый параметр iго кадра тишины больше, чем первый параметр jго кадра тишины; и когда упомянутый первый параметр отрицательно коррелируется со спектральной энтропией, упомянутый первый параметр iго кадра тишины меньше, чем упомянутый первый параметр jго кадра тишины, где i и j оба являются положительными целыми числами, и 1≤i≤T, и 1≤j≤T.
[0260] Необязательно, в качестве другого варианта осуществления, когда устройство 1000 является кодером, устройство 1000 может дополнительно включать в себя блок 1030 кодирования.
[0261] T кадров тишины могут включать в себя вводимый в настоящий момент кадр тишины и (T-1) кадров тишины, предшествующих вводимому в настоящий момент кадру тишины. Блок 1030 кодирования может кодировать вводимый в настоящий момент кадр тишины в кадр SID, где кадр SID включает в себя упомянутый первый спектральный параметр.
[0262] Для других функций и операций устройства 1000 ссылка может быть сделана на процесс варианта осуществления способа на ФИГ. 6 в вышеприведенном; во избежание повторения, никакие дополнительные подробности не обеспечены еще раз в этом документе.
[0263] ФИГ. 11 представляет собой схематическую блок-схему устройства кодирования сигналов согласно другому варианту осуществления настоящего изобретения. Пример устройства 1100 на ФИГ. 11 представляет собой кодер. Устройство 1100 включает в себя память 1110 и процессор 1120.
[0264] Память 1110 может включать в себя оперативную память, флэш-память, постоянную память, программируемую постоянную память, энергонезависимую память или регистр. Процессор 1120 может быть центральным блоком обработки (центральным блоком обработки, CPU).
[0265] Память 1110 сконфигурирована с возможностью хранения исполняемой инструкции. Процессор 1120 может исполнять исполняемую инструкцию, сохраненную в памяти 1110 для: в случае, в котором методика кодирования предыдущего кадра относительно вводимого в настоящий момент кадра является методикой непрерывного кодирования, предсказания комфортного шума, который генерируется декодером согласно вводимому в настоящий момент кадру, в случае, в котором вводимый в настоящий момент кадр кодируется в кадр SID, и определения фактического сигнала тишины, где вводимый в настоящий момент кадр является кадром тишины; определения степени отклонения между комфортным шумом и фактическим сигналом тишины; определения методики кодирования вводимого в настоящий момент кадра согласно степени отклонения, где методика кодирования вводимого в настоящий момент кадра включает в себя методику кодирования c кадром затягивания или методику кодирования с кадром SID; и кодирования вводимого в настоящий момент кадра согласно методике кодирования вводимого в настоящий момент кадра.
[0266] В этом варианте осуществления настоящего изобретения, в случае, в котором методика кодирования предыдущего кадра относительно вводимого в настоящий момент кадра является методикой непрерывного кодирования, предсказывается комфортный шум, который генерируется декодером согласно вводимому в настоящий момент кадру, в случае, в котором вводимый в настоящий момент кадр кодируется в кадр SID, определяется степень отклонения между комфортным шумом и фактическим сигналом тишины, и определяется согласно степени отклонения, что методика кодирования вводимого в настоящий момент кадра является методикой кодирования c кадром затягивания или методикой кодирования с кадром SID, вместо того, что вводимый в настоящий момент кадр просто кодируется в кадр затягивания согласно количеству, полученному посредством сбора статистики кадров активной речи, посредством этого сохраняя полосу рабочих частот канала связи.
[0267] Необязательно, в качестве варианта осуществления, процессор 1120 может предсказывать параметр характеристики комфортного шума и определять параметр характеристики фактического сигнала тишины, где параметр характеристики комфортного шума находится во взаимно однозначном соответствии с параметром характеристики фактического сигнала тишины. Процессор 1120 может определять расстояние между параметром характеристики комфортного шума и параметром характеристики фактического сигнала тишины.
[0268] Необязательно, в качестве другого варианта осуществления, процессор 1120 может определять в случае, в котором расстояние между параметром характеристики комфортного шума и параметром характеристики фактического сигнала тишины меньше, чем соответствующее пороговое значение в наборе пороговых значений, что методика кодирования вводимого в настоящий момент кадра является методикой кодирования с кадром SID, где расстояние между параметром характеристики комфортного шума и параметром характеристики фактического сигнала тишины находится во взаимно однозначном соответствии с пороговым значением в наборе пороговых значений. Процессор 1120 может определять в случае, в котором расстояние между параметром характеристики комфортного шума и параметром характеристики фактического сигнала тишины равно или больше, чем соответствующее пороговое значение в наборе пороговых значений, что методика кодирования вводимого в настоящий момент кадра является методикой кодирования c кадром затягивания.
[0269] Необязательно, в качестве другого варианта осуществления, параметр характеристики комфортного шума может быть использован для представления по меньшей мере одной из следующей информации: информации энергии и спектральной информации.
[0270] Необязательно, в качестве другого варианта осуществления, информация энергии может включать в себя энергию возбуждения CELP. Спектральная информация может включать в себя по меньшей мере один из следующего: коэффициента фильтра линейного предсказания, коэффициента FFT и коэффициента MDCT. Коэффициент фильтра линейного предсказания может включать в себя по меньшей мере один из следующего: коэффициента LSF, коэффициента LSP, коэффициента ISF, коэффициента ISP, коэффициента отражения и коэффициента LPC.
[0271] Необязательно, в качестве другого варианта осуществления, процессор 1120 может предсказывать параметр характеристики комфортного шума согласно параметру комфортного шума предыдущего кадра относительно вводимого в настоящий момент кадра и параметру характеристики вводимого в настоящий момент кадра. В качестве альтернативы, процессор 1120 может предсказывать параметр характеристики комфортного шума согласно параметрам характеристик L кадров затягивания, предшествующих вводимому в настоящий момент кадру, и параметру характеристики вводимого в настоящий момент кадра, где L является положительным целым числом.
[0272] Необязательно, в качестве другого варианта осуществления, процессор 1120 может определять, что параметр характеристики вводимого в настоящий момент кадра является параметром фактического сигнала тишины. В качестве альтернативы, процессор 1120 может собирать статистику в отношении параметров характеристик M кадров тишины для определения параметра фактического сигнала тишины.
[0273] Необязательно, в качестве другого варианта осуществления, M кадров тишины могут включать в себя вводимый в настоящий момент кадр и (M-1) кадров тишины, предшествующих вводимому в настоящий момент кадру, где M является положительным целым числом.
[0274] Необязательно, в качестве другого варианта осуществления, параметр характеристики комфортного шума может включать в себя энергию возбуждения линейного предсказания с кодовым возбуждением, CELP, комфортного шума и коэффициент частоты спектральной линии, LSF, комфортного шума, и параметр характеристики фактического сигнала тишины может включать в себя энергию возбуждения CELP фактического сигнала тишины и коэффициент LSF фактического сигнала тишины. Процессор 1120 может определять расстояние De между энергией возбуждения CELP комфортного шума и энергией возбуждения CELP фактического сигнала тишины, и определять расстояние Dlsf между коэффициентом LSF комфортного шума и коэффициентом LSF фактического сигнала тишины.
[0275] Необязательно, в качестве другого варианта осуществления, в случае, в котором расстояние De меньше, чем первое пороговое значение, и расстояние Dlsf меньше, чем второе пороговое значение, процессор 1120 может определять, что методика кодирования вводимого в настоящий момент кадра является методикой кодирования с кадром SID. В случае, в котором расстояние De равно или больше, чем упомянутое первое пороговое значение, или расстояние Dlsf равно или больше, чем упомянутое второе пороговое значение, процессор 1120 может определять, что методика кодирования вводимого в настоящий момент кадра является методикой кодирования c кадром затягивания.
[0276] Необязательно, в качестве другого варианта осуществления, процессор 1120 может дополнительно извлекать предустановленное первое пороговое значение и предустановленное второе пороговое значение. В качестве альтернативы, процессор 1120 может дополнительно определять первое пороговое значение согласно энергии возбуждения CELP N кадров тишины, предшествующих вводимому в настоящий момент кадру, и определять второе пороговое значение согласно коэффициентам LSF N кадров тишины, где N является положительным целым числом.
[0277] Необязательно, в качестве другого варианта осуществления, процессор 1120 может предсказывать комфортный шум первой методикой предсказания, где упомянутая первая методика предсказания является такой же как методика, в которой декодер генерирует комфортный шум.
[0278] Для других функций и операций устройства 1100 ссылка может быть сделана на процессы вариантов осуществления способа на ФИГ. c 1 по 3B в вышеприведенном; во избежание повторения, никакие дополнительные подробности не обеспечены еще раз в этом документе.
[0279] ФИГ. 12 представляет собой схематическую блок-схему устройства кодирования сигналов согласно другому варианту осуществления настоящего изобретения. Пример устройства 1200 на ФИГ. 12 представляет собой кодер или декодер, например, кодер 110 или декодер 120, показанный на ФИГ. 1. Устройство 1200 включает в себя память 1210 и процессор 1220.
[0280] Память 1210 может включать в себя оперативную память, флэш-память, постоянную память, программируемую постоянную память, энергонезависимую память или регистр. Процессор 1220 может быть CPU.
[0281] Память 1210 сконфигурирована с возможностью хранения исполняемой инструкции. Процессор 1220 может исполнять исполняемую инструкцию, сохраненную в памяти 1210 для: определения взвешенного спектрального расстояния группы каждого кадра тишины в P кадрах тишины, где взвешенное спектральное расстояние группы каждого кадра тишины в P кадрах тишины является суммой из взвешенных спектральных расстояний между каждым кадром тишины в P кадрах тишины и другими (P-1) кадрами тишины, где P является положительным целым числом; и определения первого спектрального параметра согласно взвешенному спектральному расстоянию группы каждого кадра тишины в P кадрах тишины, где упомянутый первый спектральный параметр используется для генерирования комфортного шума.
[0282] В этом варианте осуществления настоящего изобретения, первый спектральный параметр, используемый для генерирования комфортного шума, определяется согласно взвешенному спектральному расстоянию группы каждого кадра тишины в P кадрах тишины, вместо того, что спектральный параметр, используемый для генерирования комфортного шума, получается просто посредством получения среднего значения или срединного значения спектральных параметров нескольких кадров тишины, посредством этого улучшая качество комфортного шума.
[0283] Необязательно, в качестве варианта осуществления, каждый кадр тишины может соответствовать одной группе весовых коэффициентов, где в одной группе весовых коэффициентов, весовой коэффициент, соответствующий первой группе поддиапазонов, больше, чем весовой коэффициент, соответствующий второй группе поддиапазонов, и перцептивная важность упомянутой первой группы поддиапазонов больше, чем перцептивная важность упомянутой второй группы поддиапазонов.
[0284] Необязательно, в качестве другого варианта осуществления, процессор 1220 может выбирать первый кадр тишины из P кадров тишины, так что взвешенное спектральное расстояние группы упомянутого первого кадра тишины в P кадрах тишины является наименьшим, и определять, что спектральный параметр упомянутого первого кадра тишины является упомянутым первым спектральным параметром.
[0285] Необязательно, в качестве другого варианта осуществления, процессор 1220 может выбирать по меньшей мере один кадр тишины из P кадров тишины, так что взвешенное спектральное расстояние группы упомянутого по меньшей мере одного кадра тишины в P кадрах тишины меньше, чем третье пороговое значение, и определять первый спектральный параметр согласно спектральному параметру по меньшей мере одного кадра тишины.
[0286] Необязательно, в качестве другого варианта осуществления, когда устройство 1200 является кодером, P кадров тишины могут включать в себя вводимый в настоящий момент кадр тишины и (P-1) кадров тишины, предшествующих вводимому в настоящий момент кадру тишины. Процессор 1220 может кодировать вводимый в настоящий момент кадр тишины в кадр SID, где кадр SID включает в себя упомянутый первый спектральный параметр.
[0287] Для других функций и операций устройства 1200 ссылка может быть сделана на процесс варианта осуществления способа на ФИГ. 4 в вышеприведенном; во избежание повторения, никакие дополнительные подробности не обеспечены еще раз в этом документе.
[0288] ФИГ. 13 представляет собой схематическую блок-схему устройства обработки сигналов согласно другому варианту осуществления настоящего изобретения. Пример устройства 1300 на ФИГ. 13 представляет собой кодер или декодер, например, кодер 110 или декодер 120, показанный на ФИГ. 1. Устройство 1300 включает в себя память 1310 и процессор 1320.
[0289] Память 1310 может включать в себя оперативную память, флэш-память, постоянную память, программируемую постоянную память, энергонезависимую память или регистр. Процессор 1320 может быть CPU.
[0290] Память 1310 сконфигурирована с возможностью хранения исполняемой инструкции. Процессор 1320 может исполнять исполняемую инструкцию, сохраненную в памяти 1310 для: разделения диапазона частот входного сигнала на R поддиапазонов, где R является положительным целым числом; определения на каждом поддиапазоне из R поддиапазонов спектрального расстояния группы поддиапазонов каждого кадра тишины в S кадрах тишины, где спектральное расстояние группы поддиапазонов каждого кадра тишины в S кадрах тишины является суммой спектральных расстояний между каждым кадром тишины в S кадрах тишины на каждом поддиапазоне и другими (S-1) кадрами тишины, и S является положительным целым числом; и определения на каждом поддиапазоне первого спектрального параметра каждого поддиапазона согласно спектральному расстоянию группы поддиапазонов каждого кадра тишины в S кадрах тишины, где упомянутый первый спектральный параметр каждого поддиапазона используется для генерирования комфортного шума.
[0291] В этом варианте осуществления настоящего изобретения, спектральный параметр, который имеется у каждого поддиапазона и используется для генерирования комфортного шума, определяется на каждом поддиапазоне R поддиапазонов согласно спектральному расстоянию каждого кадра тишины в S кадрах тишины, вместо того, что спектральный параметр, используемый для генерирования комфортного шума, получается просто посредством получения среднего значения или срединного значения спектральных параметров нескольких кадров тишины, посредством этого улучшая качество комфортного шума.
[0292] Необязательно, в качестве варианта осуществления, процессор 1320 может выбирать на каждом поддиапазоне первый кадр тишины из S кадров тишины, так что спектральное расстояние группы поддиапазонов упомянутого первого кадра тишины в S кадрах тишины на каждом поддиапазоне является наименьшим, и определять на каждом поддиапазоне, что спектральный параметр упомянутого первого кадра тишины является упомянутым первым спектральным параметром каждого поддиапазона.
[0293] Необязательно, в качестве другого варианта осуществления, процессор 1320 может выбирать на каждом поддиапазоне по меньшей мере один кадр тишины из S кадров тишины, так что спектральное расстояние группы поддиапазонов упомянутого по меньшей мере одного кадра тишины меньше, чем четвертое пороговое значение, и определять на каждом поддиапазоне упомянутый первый спектральный параметр каждого поддиапазона согласно спектральному параметру упомянутого по меньшей мере одного кадра тишины.
[0294] Необязательно, в качестве другого варианта осуществления, когда устройство 1300 является кодером, S кадров тишины могут включать в себя вводимый в настоящий момент кадр тишины и (S-1) кадров тишины, предшествующих вводимому в настоящий момент кадру тишины. Процессор 1320 кодирования может кодировать вводимый в настоящий момент кадр тишины в кадр SID, где кадр SID включает в себя первый спектральный параметр каждого поддиапазона.
[0295] Для других функций и операций устройства 1300 ссылка может быть сделана на процесс варианта осуществления способа на ФИГ. 5 в вышеприведенном; во избежание повторения, никакие дополнительные подробности не обеспечены еще раз в этом документе.
[0296] ФИГ. 14 представляет собой схематическую блок-схему устройства обработки сигналов согласно другому варианту осуществления настоящего изобретения. Пример устройства 1400 на ФИГ. 14 представляет собой кодер или декодер, например, кодер 110 или декодер 120, показанный на ФИГ. 1. Устройство 1400 включает в себя память 1410 и процессор 1420.
[0297] Память 1410 может включать в себя оперативную память, флэш-память, постоянную память, программируемую постоянную память, энергонезависимую память или регистр. Процессор 1420 может быть CPU.
[0298] Память 1410 сконфигурирована с возможностью хранения исполняемой инструкции. Процессор 1420 может исполнять исполняемую инструкцию, сохраненную в памяти 1410 для: определения первого параметра каждого кадра тишины в T кадрах тишины, где упомянутый первый параметр используется для представления спектральной энтропии, и T является положительным целым числом; и определения первого спектрального параметра согласно упомянутому первому параметру каждого кадра тишины в T кадрах тишины, где упомянутый первый спектральный параметр используется для генерирования комфортного шума.
[0299] В этом варианте осуществления настоящего изобретения, первый спектральный параметр, используемый для генерирования комфортного шума, определяется согласно первым параметрам, которые используются для представления спектральной энтропии и имеются у T кадров тишины, вместо того, что спектральный параметр, используемый для генерирования комфортного шума, получается просто посредством получения среднего значения или срединного значения спектральных параметров нескольких кадров тишины, посредством этого улучшая качество комфортного шума.
[0300] Необязательно, в качестве варианта осуществления, процессор 1420 может определять в случае, в котором определяется, что T кадров тишины могут быть классифицированы на первую группу кадров тишины и вторую группу кадров тишины согласно критерию кластеризации, упомянутого первый спектральный параметр согласно спектральному параметру упомянутой первой группы кадров тишины, где спектральная энтропия, представленная первыми параметрами упомянутой первой группы кадров тишины, больше, чем спектральная энтропия, представленная первыми параметрами упомянутой второй группы кадров тишины; и в случае, в котором определяется, что T кадров тишины не могут быть классифицированы на упомянутую первую группу кадров тишины и упомянутую вторую группу кадров тишины согласно критерию кластеризации, выполнять взвешенное усреднение в отношении спектральных параметров T кадров тишины для определения упомянутого первого спектрального параметра, где спектральная энтропия, представленная упомянутыми первыми параметрами упомянутой первой группы кадров тишины, больше, чем спектральная энтропия, представленная упомянутыми первыми параметрами упомянутой второй группы кадров тишины.
[0301] Необязательно, в качестве другого варианта осуществления, критерий кластеризации может включать в себя: расстояние между первым параметром каждого кадра тишины в упомянутой первой группе кадров тишины и первым средним значением равно или меньше, чем расстояние между упомянутым первым параметром каждого кадра тишины в упомянутой первой группе кадров тишины и вторым средним значением; расстояние между первым параметром каждого кадра тишины в упомянутой второй группе кадров тишины и упомянутым вторым средним значением равно или меньше, чем расстояние между упомянутым первым параметром каждого кадра тишины в упомянутой второй группе кадров тишины и упомянутым первым средним значением; расстояние между упомянутым первым средним значением и упомянутым вторым средним значением больше, чем среднее расстояние между упомянутыми первыми параметрами упомянутой первой группы кадров тишины и упомянутым первым средним значением; и расстояние между упомянутым первым средним значением и упомянутым вторым средним значением больше, чем среднее расстояние между упомянутыми первыми параметрами упомянутой второй группы кадров тишины и упомянутым вторым средним значением,
где упомянутое первое среднее значение является средним значением упомянутых первых параметров упомянутой первой группы кадров тишины, и упомянутое второе среднее значение является средним значением упомянутых первых параметров упомянутой второй группы кадров тишины.
[0302] Необязательно, в качестве другого варианта осуществления, процессор 1420 может выполнять взвешенное усреднение в отношении спектральных параметров T кадров тишины для определения упомянутого первого спектрального параметра, где для iго кадра тишины и jго кадра тишины, которые являются различными, в T кадрах тишины весовой коэффициент, соответствующий iму кадру тишины, равен или больше, чем весовой коэффициент, соответствующий jму кадру тишины; когда упомянутый первый параметр положительно коррелируется со спектральной энтропией, первый параметр iго кадра тишины больше, чем первый параметр jго кадра тишины; и когда упомянутый первый параметр отрицательно коррелируется со спектральной энтропией, упомянутый первый параметр iго кадра тишины меньше, чем упомянутый первый параметр jго кадра тишины, где i и j оба являются положительными целыми числами, и 1≤i≤T, и 1≤j≤T.
[0303] Необязательно, в качестве другого варианта осуществления, когда устройство 1400 является кодером, T кадров тишины могут включать в себя вводимый в настоящий момент кадр тишины и (T-1) кадров тишины, предшествующих вводимому в настоящий момент кадру тишины. Процессор 1420 может кодировать вводимый в настоящий момент кадр тишины в кадр SID, где кадр SID включает в себя упомянутый первый спектральный параметр.
[0304] Для других функций и операций устройства 1400 ссылка может быть сделана на процесс варианта осуществления способа на ФИГ. 6 в вышеприведенном; во избежание повторения, никакие дополнительные подробности не обеспечены еще раз в этом документе.
[0305] Специалисты в данной области техники могут знать, что в комбинации с примерами, описанными в вариантах осуществления, раскрытых в этом подробном описании, модули и этапы алгоритма могут быть реализованы посредством электронных аппаратных средств или комбинации компьютерного программного обеспечения и электронных аппаратных средств. То, выполняются эти функции посредством аппаратных средств или программного обеспечения, зависит от конкретных вариантов применения и проектных ограничений технических решений. Специалисты в данной области техники могут использовать различные способы для того, чтобы реализовывать описанные функции для каждого конкретного варианта применения, но не следует считать, что такая реализация выходит за пределы объема настоящего изобретения.
[0306] Это может быть четко понято специалистом в данной области техники, что с целью удобного и краткого описания, для подробного процесса работы вышеприведенной системы, устройства и блока, может быть сделана ссылка на соответствующий процесс в вышеприведенных вариантах осуществления способа, и подробности повторно не описываются в этом документе.
[0307] В нескольких вариантах осуществления, обеспеченных в настоящей заявке, следует понимать, что раскрытая система, устройство и способ могут быть реализованы другими методами. Например, описанный вариант осуществления устройства является просто примерным. Например, разделение на блоки является просто разделением по логическим функциям и может быть другим разделением в фактической реализации. Например, множество блоков или компонентов может быть комбинировано или интегрировано в другую систему, либо некоторые признаки могут игнорироваться или не выполняться. В дополнение, отображенные или рассмотренные взаимные связи или непосредственные связи, или соединения связи могут быть реализованы посредством использования некоторых интерфейсов. Косвенные связи или соединения связи между устройствами или блоками могут быть реализованы в электронной, механической или других формах.
[0308] Блоки, описанные в качестве отдельных частей, могут быть или не быть физически отдельными, и части, отображенные в качестве блоков, могут быть или не быть физическими блоками, могут быть расположены в одном местоположении, или могут быть распределены на множестве блоков сети. Некоторые или все из блоков могут быть выбраны согласно реальным требованиям для достижения целей решений вариантов осуществления.
[0309] Помимо этого, функциональные блоки в вариантах осуществления настоящего изобретения могут быть интегрированы в один блок обработки или каждый из блоков может существовать отдельно физически, или два или более блоков интегрированы в один блок.
[0310] Когда функции реализуются в форме программного функционального модуля и продаются или используются в качестве независимых продуктов, функции могут быть сохранены на машиночитаемом носителе хранения данных. На основе такого понимания, технические решения настоящего изобретения по существу или их часть, вносящая усовершенствование в предшествующий уровень техники либо некоторые из технических решений, могут быть реализованы в форме продукта программного обеспечения. Продукт компьютерного программного обеспечения сохраняется на носителе данных и включает в себя несколько инструкций для инструктирования компьютерному устройству (которое может представлять собой персональный компьютер, сервер или сетевое устройство) выполнять все или некоторые из этапов способов, описанных в вариантах осуществления настоящего изобретения. Вышеприведенный носитель данных включает в себя: любой носитель, который может сохранять программный код, к примеру, USB-флэш-накопитель, съемный жесткий диск, постоянное запоминающее устройство (ROM, постоянное запоминающее устройство), оперативное запоминающее устройство (RAM, оперативное запоминающее устройство), магнитный диск или оптический диск.
[0311] Вышеприведенное описание представляет собой только конкретные способы реализации настоящего изобретения и не имеет намерение ограничивать объем охраны настоящего изобретения. Все изменения или замены, очевидные для специалистов в данной области техники в пределах объема, раскрытого в настоящем изобретении, должны попадать в объем охраны настоящего изобретения. Следовательно, объем охраны настоящего изобретения должен зависеть от объема охраны формулы изобретения.
название | год | авторы | номер документа |
---|---|---|---|
УСТРОЙСТВО И СПОСОБ КОДИРОВАНИЯ СИГНАЛОВ | 2017 |
|
RU2665236C1 |
СПОСОБ И УСТРОЙСТВО ДЛЯ КОДИРОВАНИЯ И ДЕКОДИРОВАНИЯ | 2009 |
|
RU2461898C2 |
СПОСОБ И СРЕДСТВО ДЛЯ КОДИРОВАНИЯ ИНФОРМАЦИИ ФОНОВОГО ШУМА | 2009 |
|
RU2461080C2 |
СПОСОБ И СРЕДСТВО ДЛЯ КОДИРОВАНИЯ ИНФОРМАЦИИ ФОНОВОГО ШУМА | 2009 |
|
RU2440674C1 |
ГЕНЕРАЦИЯ КОМФОРТНОГО ШУМА | 2013 |
|
RU2658544C1 |
ГЕНЕРАЦИЯ КОМФОРТНОГО ШУМА | 2013 |
|
RU2609080C2 |
СИСТЕМА, СПОСОБЫ И УСТРОЙСТВО ДЛЯ ВОССТАНОВЛЕНИЯ ПРИ СТИРАНИИ КАДРА | 2007 |
|
RU2419167C2 |
СПОСОБ, УСТРОЙСТВО И СИСТЕМА ДЛЯ ОБРАБОТКИ АУДИОДАННЫХ | 2012 |
|
RU2617926C1 |
СИСТЕМЫ, СПОСОБЫ И УСТРОЙСТВА ДЛЯ ОБНАРУЖЕНИЯ ИЗМЕНЕНИЯ СИГНАЛОВ | 2007 |
|
RU2417456C2 |
АУДИОКОДЕК, ИСПОЛЬЗУЮЩИЙ СИНТЕЗ ШУМА В ТЕЧЕНИЕ НЕАКТИВНОЙ ФАЗЫ | 2012 |
|
RU2586838C2 |
Изобретение относится к области обработки сигналов. Технический результат заключается в расширении арсенала технических средств для кодирования сигналов. Технический результат достигается за счет предсказания комфортного шума, который генерируется декодером согласно вводимому в настоящий момент кадру в случае, в котором вводимый в настоящий момент кадр кодируется в кадр дескриптора тишины (SID), и определения фактического сигнала тишины, при этом вводимый в настоящий момент кадр является кадром тишины, определения степени отклонения между комфортным шумом и фактическим сигналом тишины, определения, что методикой кодирования вводимого в настоящий момент кадра является методика кодирования с кадром затягивания, согласно степени отклонения и кодирования вводимого в настоящий момент кадра согласно методике кодирования с кадром затягивания. 2 н. и 19 з.п. ф-лы, 15 ил.
1. Способ кодирования сигналов, содержащий:
в случае, в котором методика кодирования предыдущего кадра относительно вводимого в настоящий момент кадра является методикой непрерывного кодирования, предсказание комфортного шума, который генерируется декодером согласно вводимому в настоящий момент кадру в случае, в котором вводимый в настоящий момент кадр кодируется в кадр дескриптора тишины (SID), и определение фактического сигнала тишины, при этом вводимый в настоящий момент кадр является кадром тишины;
определение степени отклонения между комфортным шумом и фактическим сигналом тишины;
определение, что методикой кодирования вводимого в настоящий момент кадра является методика кодирования с кадром затягивания, согласно степени отклонения; и
кодирование вводимого в настоящий момент кадра согласно методике кодирования с кадром затягивания.
2. Способ по п. 1, при этом предсказание комфортного шума, который генерируется декодером согласно вводимому в настоящий момент кадру в случае, в котором вводимый в настоящий момент кадр кодируется в кадр SID, и определение фактического сигнала тишины содержит:
предсказание параметра характеристики комфортного шума и определение параметра характеристики фактического сигнала тишины, при этом параметр характеристики комфортного шума находится во взаимно однозначном соответствии с параметром характеристики фактического сигнала тишины; и
определение степени отклонения между комфортным шумом и фактическим сигналом тишины содержит:
определение расстояния между параметром характеристики комфортного шума и параметром характеристики фактического сигнала тишины.
3. Способ по п. 2, при этом определение, что методикой кодирования вводимого в настоящий момент кадра является методика кодирования с кадром затягивания, согласно степени отклонения содержит:
определение в случае, в котором расстояние между параметром характеристики комфортного шума и параметром характеристики фактического сигнала тишины равно или больше, чем соответствующее пороговое значение в наборе пороговых значений, что методика кодирования вводимого в настоящий момент кадра является методикой кодирования c кадром затягивания.
4. Способ по п. 2, при этом параметр характеристики комфортного шума используется для представления по меньшей мере одной из следующих информаций: информации энергии и спектральной информации.
5. Способ по п. 4, при этом информация энергии содержит энергию возбуждения линейного предсказания с кодовым возбуждением, CELP;
спектральная информация содержит по меньшей мере один из следующего: коэффициента фильтра линейного предсказания, коэффициента быстрого преобразования Фурье, FFT, и коэффициента модифицированного дискретного косинусного преобразования, MDCT; и
коэффициент фильтра линейного предсказания содержит по меньшей мере один из следующего: коэффициента частоты спектральной линии, LSF, коэффициента пары линейчатого спектра, LSP, коэффициента частоты спектральных иммитансов, ISF, коэффициента пары спектральных иммитансов, ISP, коэффициента отражения и коэффициента кодирования линейного предсказания, LPC.
6. Способ по любому из пп. 2-5, при этом предсказание параметра характеристики комфортного шума содержит:
предсказание параметра характеристики комфортного шума согласно параметру комфортного шума предыдущего кадра относительно вводимого в настоящий момент кадра и параметру характеристики вводимого в настоящий момент кадра; или
предсказание параметра характеристики комфортного шума согласно параметрам характеристик L кадров затягивания, предшествующих вводимому в настоящий момент кадру, и параметру характеристики вводимого в настоящий момент кадра, при этом L является положительным целым числом.
7. Способ по любому из пп. 2-5, при этом определение параметра характеристики фактического сигнала тишины содержит:
использование параметра характеристики вводимого в настоящий момент кадра в качестве параметра характеристики фактического сигнала тишины; или
сбор статистики в отношении параметров характеристик M кадров тишины для определения параметра характеристики фактического сигнала тишины.
8. Способ по п. 7, при этом M кадров тишины содержат вводимый в настоящий момент кадр и (M-1) кадров тишины, предшествующих вводимому в настоящий момент кадру, при этом M является положительным целым числом.
9. Способ по п. 3, при этом параметр характеристики комфортного шума содержит энергию возбуждения линейного предсказания с кодовым возбуждением, CELP, комфортного шума и коэффициент частоты спектральной линии, LSF, комфортного шума и параметр характеристики фактического сигнала тишины содержит энергию возбуждения CELP фактического сигнала тишины и коэффициент LSF фактического сигнала тишины; и
определение расстояния между параметром характеристики комфортного шума и параметром характеристики фактического сигнала тишины содержит:
определение расстояния De между энергией возбуждения CELP комфортного шума и энергией возбуждения CELP фактического сигнала тишины и определение расстояния Dlsf между коэффициентом LSF комфортного шума и коэффициентом LSF фактического сигнала тишины.
10. Способ по п. 9, при этом определение в случае, в котором расстояние между параметром характеристики комфортного шума и параметром характеристики фактического сигнала тишины меньше, чем соответствующее пороговое значение в наборе пороговых значений, что методика кодирования вводимого в настоящий момент кадра является методикой кодирования с кадром SID, содержит:
в случае, в котором расстояние De меньше, чем первое пороговое значение, и расстояние Dlsf меньше, чем второе пороговое значение, определение, что методика кодирования вводимого в настоящий момент кадра является методикой кодирования с кадром SID; и
определение в случае, в котором расстояние между параметром характеристики комфортного шума и параметром характеристики фактического сигнала тишины равно или больше, чем соответствующее пороговое значение в наборе пороговых значений, что методика кодирования вводимого в настоящий момент кадра является методикой кодирования c кадром затягивания, содержит:
в случае, в котором расстояние De равно или больше, чем упомянутое первое пороговое значение, или расстояние Dlsf равно или больше, чем упомянутое второе пороговое значение, определение, что методика кодирования вводимого в настоящий момент кадра является методикой кодирования c кадром затягивания.
11. Способ по п. 10, дополнительно содержащий:
извлечение предустановленного первого порогового значения и предустановленного второго порогового значения; или
определение упомянутого первого порогового значения согласно энергии возбуждения CELP N кадров тишины, предшествующих вводимому в настоящий момент кадру, и определение упомянутого второго порогового значения согласно коэффициентам LSF N кадров тишины, при этом N является положительным целым числом.
12. Способ по любому из пп. 1-5, при этом предсказание комфортного шума, который генерируется декодером согласно вводимому в настоящий момент кадру в случае, в котором вводимый в настоящий момент кадр кодируется в кадр SID, содержит:
предсказание комфортного шума первой методикой предсказания, при этом упомянутая первая методика предсказания является такой же, как методика, в которой декодер генерирует комфортный шум.
13. Устройство кодирования сигналов, содержащее:
первый блок определения, сконфигурированный с возможностью: в случае, в котором методика кодирования предыдущего кадра относительно вводимого в настоящий момент кадра является методикой непрерывного кодирования, предсказания комфортного шума, который генерируется декодером согласно вводимому в настоящий момент кадру в случае, в котором вводимый в настоящий момент кадр кодируется в кадр дескриптора тишины (SID), и определения фактического сигнала тишины, при этом вводимый в настоящий момент кадр является кадром тишины;
второй блок определения, сконфигурированный с возможностью определения степени отклонения между комфортным шумом, определенным упомянутым первым блоком определения, и фактическим сигналом тишины, определенным упомянутым первым блоком определения;
третий блок определения, сконфигурированный с возможностью определения, что методикой кодирования вводимого в настоящий момент кадра является методика кодирования с кадром затягивания, согласно степени отклонения, определенной упомянутым вторым блоком определения; и
блок кодирования, сконфигурированный с возможностью кодирования вводимого в настоящий момент кадра согласно методике кодирования с кадром затягивания.
14. Устройство по п. 13, при этом упомянутый первый блок определения, в частности, сконфигурирован с возможностью предсказания параметра характеристики комфортного шума и определения параметра характеристики фактического сигнала тишины, при этом параметр характеристики комфортного шума находится во взаимно однозначном соответствии с параметром характеристики фактического сигнала тишины; и
упомянутый второй блок определения, в частности, сконфигурирован с возможностью определения расстояния между параметром характеристики комфортного шума и параметром характеристики фактического сигнала тишины.
15. Устройство по п. 14, при этом упомянутый третий блок определения, в частности, сконфигурирован с возможностью: в случае, в котором расстояние между параметром характеристики комфортного шума и параметром характеристики фактического сигнала тишины равно или больше, чем соответствующее пороговое значение в наборе пороговых значений, определения, что методика кодирования вводимого в настоящий момент кадра является методикой кодирования c кадром затягивания.
16. Устройство по п. 14 или 15, при этом упомянутый первый блок определения, в частности, сконфигурирован с возможностью: предсказания параметра характеристики комфортного шума согласно параметру комфортного шума предыдущего кадра относительно вводимого в настоящий момент кадра и параметру характеристики вводимого в настоящий момент кадра; или предсказания параметра характеристики комфортного шума согласно параметрам характеристик L кадров затягивания, предшествующих вводимому в настоящий момент кадру, и параметру характеристики вводимого в настоящий момент кадра, при этом L является положительным целым числом.
17. Устройство по п. 14 или 15, при этом упомянутый первый блок определения, в частности, сконфигурирован с возможностью: определения, что параметр характеристики вводимого в настоящий момент кадра является параметром характеристики фактического сигнала тишины; или сбора статистики в отношении параметров характеристик M кадров тишины для определения параметра характеристики фактического сигнала тишины.
18. Устройство по п. 15, при этом параметр характеристики комфортного шума содержит энергию возбуждения линейного предсказания с кодовым возбуждением, CELP, комфортного шума и коэффициент частоты спектральной линии, LSF, комфортного шума и параметр характеристики фактического сигнала тишины содержит энергию возбуждения CELP фактического сигнала тишины и коэффициент LSF фактического сигнала тишины; и
упомянутый второй блок определения, в частности, сконфигурирован с возможностью определения расстояния De между энергией возбуждения CELP комфортного шума и энергией возбуждения CELP фактического сигнала тишины и определения расстояния Dlsf между коэффициентом LSF комфортного шума и коэффициентом LSF фактического сигнала тишины.
19. Устройство по п. 18, при этом упомянутый третий блок определения, в частности, сконфигурирован с возможностью: в случае, в котором расстояние De меньше, чем первое пороговое значение, и расстояние Dlsf меньше, чем второе пороговое значение, определения, что методика кодирования вводимого в настоящий момент кадра является методикой кодирования с кадром SID; и
упомянутый третий блок определения, в частности, сконфигурирован с возможностью: в случае, в котором расстояние De равно или больше, чем упомянутое первое пороговое значение, или расстояние Dlsf равно или больше, чем упомянутое второе пороговое значение, определения, что методика кодирования вводимого в настоящий момент кадра является методикой кодирования c кадром затягивания.
20. Устройство по п. 19, дополнительно содержащее:
четвертый блок определения, сконфигурированный с возможностью: извлечения предустановленного первого порогового значения и предустановленного второго порогового значения; или определения упомянутого первого порогового значения согласно энергии возбуждения CELP N кадров тишины, предшествующих вводимому в настоящий момент кадру, и определения упомянутого второго порогового значения согласно коэффициентам LSF N кадров тишины, при этом N является положительным целым числом.
21. Устройство по любому из пп. 13, 14, 15, 18, 19 и 20, при этом упомянутый первый блок определения, в частности, сконфигурирован с возможностью предсказания комфортного шума первой методикой предсказания, при этом упомянутая первая методика предсказания является такой же, как методика, в которой декодер генерирует комфортный шум.
Многоступенчатая активно-реактивная турбина | 1924 |
|
SU2013A1 |
US 7124079 B1, 17.10.2006 | |||
Пресс для выдавливания из деревянных дисков заготовок для ниточных катушек | 1923 |
|
SU2007A1 |
Пломбировальные щипцы | 1923 |
|
SU2006A1 |
СПОСОБ И УСТРОЙСТВО ДЛЯ ЭФФЕКТИВНОГО МАСКИРОВАНИЯ СТЕРТЫХ КАДРОВ В РЕЧЕВЫХ КОДЕКАХ НА ОСНОВЕ ЛИНЕЙНОГО ПРЕДСКАЗАНИЯ | 2003 |
|
RU2325707C2 |
Авторы
Даты
2017-12-15—Публикация
2013-09-25—Подача