ОБЛАСТЬ ТЕХНИКИ
[0001] Настоящее изобретение относится к декодированию и кодированию аудиосигналов, чтобы снизить музыкальный шум в аудиосигналах и сигналах музыки (далее упоминаются как аудиосигналы и т.д.)
ПРЕДШЕСТВУЮЩИЙ УРОВЕНЬ ТЕХНИКИ
[0002] Технология кодирования музыки, которая сжимает аудиосигналы с низкой битовой скоростью, является важной технологией в эффективном использовании радиоволн и т.п. в мобильной связи. Кроме того, в последние годы существует возрастающая потребность в повышенном качестве аудио в телефонном вызове, и желательной является служба вызовов, которая дает ощущение реальности. Это может быть реализовано путем кодирования аудиосигналов и т.п. широкого частотного диапазона с высокой битовой скоростью. Однако этот подход вступает в противоречие с эффективным использованием радиоволн и частотных диапазонов.
[0003] Что касается способа кодирования сигналов широкого частотного диапазона с высоким качеством при низкой битовой скорости, существует технология, где спектр входных сигналов делится на два спектра, сегмент нижнего диапазона и сегмент верхнего диапазона, причем сегмент верхнего диапазона замещается дубликатом сегмента нижнего диапазона. То есть, общая битовая скорость сокращается путем замены сегмента верхнего диапазона на сегмент нижнего диапазона (публикация японской не прошедшей экспертизу патентной заявки (перевод PCT-заявки) № 2001-521648).
[0004] На основе этой технологии существует технология, которая, в свете того факта, что спектр верхнего диапазона имеет меньшее отклонение, чем спектр нижнего диапазона, спектр нижнего диапазона нормализуется (сглаживается) для каждого поддиапазона, после чего получают корреляцию со спектром верхнего диапазона. Соответственно, можно предотвратить ухудшение качества звука посредством копирования спектра нижнего диапазона, который имеет высокие пики. Однако эта технология имеет недостаток, заключающийся в том, что поскольку спектр нижнего диапазона выражается как поток дискретных импульсов, огибающая входных сигналов в способе, оценивающем огибающую потока дискретных импульсов, полностью отличается от первоначальной огибающей. Соответственно, вместо этого способа нормализации был предложен способ, в котором нормализация выполняется с максимальным значением амплитуды дискретных импульсов, в каждом поддиапазоне (международная публикация № 2013/035257).
[0005] На фиг. 11 показано устройство кодирования в соответствии с международной публикацией № 2013/035257. В этом устройстве кодирования, входные сигналы преобразуются в сигналы частотной области посредством время-частотного преобразователя 1010 и выводятся в качестве спектра входного сигнала, и область нижних частот спектра входного сигнала кодируется в основном блоке 1020 кодирования и выводится как основные кодированные данные. Основные кодированные данные затем декодируются, и генерируется основной кодированный спектр нижних частот, который нормализуется максимальным значением амплитуды в блоке 1030 нормализации амплитуды поддиапазона, и генерируется нормализованный спектр нижнего диапазона. Получают полосу сегмента верхнего диапазона, где значение корреляции в отношении нормализованного спектра нижнего диапазона является наибольшим, и усиление между нормализованным спектром нижнего диапазона в этой полосе и сегментом верхнего диапазона входного спектра, и они кодируются в блоке 1060 кодирования расширенного диапазона и выводятся как кодированные данные расширенного диапазона.
[0006] Фиг. 12 иллюстрирует устройство декодирования, соответствующее этому. Кодированные данные разделяются на основные кодированные данные и кодированные данные расширенного диапазона в блоке 2010 разделения, основные кодированные данные декодируются в основном блоке 2020 декодирования, и генерируется основной кодированный спектр нижнего диапазона. Основной кодированный спектр нижнего диапазона подвергается той же самой обработке, что и на стороне устройства кодирования, что включает нормализацию наибольшим значением амплитуды выборки, генерируя при этом нормализованные данные спектра нижнего диапазона. Нормализованные данные спектра нижнего диапазона затем используются для декодирования кодированных данных расширенного диапазона посредством блока 2040 декодирования расширенного диапазона, генерируя при этом спектр расширенного диапазона.
[0007] Также раскрыта технология, где выполняется переключение между блоком 1030 нормализации амплитуды поддиапазона, который выполняет нормализацию наибольшим значением выборки, и блоком 7020 нормализации огибающей спектра, который нормализует огибающую спектральной мощности выборки, в соответствии с интенсивностью пиков, как иллюстрируется на фиг. 13.
[0008] Технология нормализации наибольшим значением выборки, описанная в международной публикации № 2013/035257, является эффективной в случае, где спектр нижнего диапазона разреженный, т.е., в случае, где амплитудное значение только части выборок велико, а амплитудное значение других выборок является почти нулевым. То есть, технология в соответствии с международной публикацией № 2013/035257 подавляет генерацию спектров с экстремально большой амплитудой даже для разреженных спектров (гомогенизация) и может сформировать нормализованные спектры нижнего диапазона с плоскими характеристиками (сглаживание).
СУЩНОСТЬ ИЗОБРЕТЕНИЯ
[0009] Однако спектральные провалы легко возникают, когда поток импульсов является разреженным, и такие спектральные провалы вызывают шум, который называется музыкальным шумом. Международная публикация № 2013/035257 не раскрывает каких-либо мер, которые принимались бы против музыкального шума вследствие спектральных провалов при нормализации спектра нижнего диапазона наибольшей амплитудой выборки.
[0010] Один неограничительный и примерный вариант осуществления обеспечивает устройство декодирования и устройство кодирования, способные декодировать высококачественные аудиосигналы и т.д. с подавленным музыкальным шумом, при сокращении общей битовой скорости.
[0011] В одном общем аспекте, технологии, раскрытые в настоящем документе, характеризуют устройство декодирования, включающее в себя:
блок разделения, который разделяет первые кодированные данные, где был закодирован спектр, включающий в себя спектр нижнего диапазона аудиосигналов, и вторые кодированные данные, где был закодирован спектр верхнего диапазона более высокого диапазона, чем спектр нижнего диапазона, на основании первых кодированных данных;
первый блок декодирования, который декодирует первые кодированные данные и генерирует первый декодированный спектр;
первый нормализатор амплитуды, который делит амплитуду первого декодированного спектра на множество поддиапазонов, нормализует спектр каждого поддиапазона наибольшим значением амплитуды первого декодированного спектра в пределах каждого поддиапазона и генерирует нормализованный спектр;
блок суммирования, который добавляет шумовой спектр к нормализованному спектру и генерирует нормализованный спектр с добавленным шумом;
второй блок декодирования, который декодирует вторые кодированные данные, используя нормализованный спектр с добавленным шумом, и генерирует второй спектр с добавленным шумом; и
преобразователь, который выполняет время-частотное преобразование в отношении спектра, связанного на основе первого декодированного спектра и второго спектра с добавленным шумом.
[0012] В соответствии с устройством декодирования согласно варианту осуществления настоящего раскрытия, высококачественные аудиосигналы и т.д. могут быть декодированы с подавленным музыкальным шумом.
[0013] Следует отметить, что общие или конкретные варианты осуществления могут быть реализованы как система, способ, интегральная схема, компьютерная программа, носитель хранения данных или любая отдельная их комбинация.
[0014] Дополнительные выгоды и преимущества раскрытых вариантов осуществления будут понятны из описания и чертежей. Выгоды и/или преимущества могут быть индивидуально получены посредством различных вариантов осуществления и признаков из описания и чертежей, которые не требуется все предоставлять, чтобы получать одно или более из таких выгод и/или преимуществ.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
[0015] Фиг. 1 является схемой конфигурации устройства декодирования в соответствии с первым вариантом осуществления настоящего раскрытия.
Фиг. 2 является схемой конфигурации устройства декодирования в соответствии с вторым вариантом осуществления настоящего раскрытия.
Фиг. 3 является схемой конфигурации другого устройства декодирования в соответствии с вторым вариантом осуществления настоящего раскрытия.
Фиг. 4 является схемой конфигурации устройства декодирования в соответствии с третьим вариантом осуществления настоящего раскрытия.
Фиг. 5 является пояснительной схемой блока генерации шума в соответствии с третьим вариантом осуществления настоящего раскрытия.
Фиг. 6 является схемой конфигурации устройства декодирования в соответствии с четвертым вариантом осуществления настоящего раскрытия.
Фиг. 7 является пояснительной схемой блока корректировки амплитуды в соответствии с четвертым вариантом осуществления настоящего раскрытия.
Фиг. 8 является схемой конфигурации другого устройства декодирования в соответствии с четвертым вариантом осуществления настоящего раскрытия.
Фиг. 9 является пояснительной схемой, иллюстрирующей операции блока повторной корректировки амплитуды другого устройства декодирования в соответствии с четвертым вариантом осуществления настоящего раскрытия.
Фиг. 10 является схемой конфигурации устройства декодирования в соответствии с пятым вариантом осуществления настоящего раскрытия.
Фиг. 11 является схемой конфигурации устройства кодирования в соответствии с уровнем техники.
Фиг. 12 является схемой конфигурации устройства декодирования в соответствии с уровнем техники.
Фиг. 13 является схемой конфигурации устройства кодирования в соответствии уровнем техники.
Фиг. 14 является схемой конфигурации устройства декодирования в соответствии с шестым вариантом осуществления настоящего раскрытия.
Фиг. 15А и 15В являются пояснительными диаграммами, иллюстрирующими операции блока корректировки основной декодированной спектральной амплитуды в соответствии с шестым вариантом осуществления настоящего раскрытия.
Фиг. 16 является схемой конфигурации устройства декодирования в соответствии с первым другим примером шестого варианта осуществления настоящего раскрытия.
Фиг. 17 является схемой конфигурации устройства декодирования в соответствии с вторым другим примером шестого варианта осуществления настоящего раскрытия.
Фиг. 18 является схемой конфигурации устройства декодирования в соответствии с седьмым вариантом осуществления настоящего раскрытия.
Фиг. 19 является схемой конфигурации блока повторной коррекции амплитуды устройства декодирования в соответствии с седьмым вариантом осуществления настоящего раскрытия.
ПОДРОБНОЕ ОПИСАНИЕ
[0016] Конфигурации и операции вариантов осуществления настоящего раскрытия будут описаны ниже со ссылками на чертежи. Отметим, что выходные сигналы с устройств декодирования и входные сигналы на устройства кодирования в настоящем раскрытии охватывают, в дополнение к случаям аудиосигналов в узком смысле, также случаи сигналов музыки, имеющих более широкую ширину полосы, и другие случаи, где они существуют совместно.
[0017] Отметим, что в настоящей спецификации термин ʺвходные сигналыʺ является понятием, которое охватывает не только аудиосигналы, но и сигналы музыки, имеющие более широкую ширину полосы, чем аудиосигналы, и сигналы, где аудиосигналы и сигналы музыки существуют совместно.
[0018] ʺШумовой спектрʺ является спектром, где амплитуда флуктуирует нерегулярным образом. Если цикл регулярный, но является достаточно длинным, чтобы рассматриваться, по существу, как нерегулярный, это рассматривается как подлежащее включению в нерегулярный случай.
[0019] ʺГенерацияʺ шумового спектра включает в себя обеспечение создания шумового спектра, а также включает в себя вывод шумового спектра, ранее сохраненного в устройстве памяти или т.п.
[0020] По отношению к ʺсвязываниюʺ и ʺвремя-частотному преобразованиюʺ, то, которое является первым по времени, является опциональным и может происходить одновременно, как само собой разумеется. Достаточно, чтобы ʺсвязываниеʺ и ʺвремя-частотное преобразованиеʺ в результате выполнялись.
[0021] ʺИнформация распределения битовʺ означает информацию, представляющую число битов, выделенных предварительно определенному диапазону основного декодированного спектра.
[0022] ʺИнформация разреженияʺ является информацией, представляющей состояние распределения нулевых спектров или ненулевых спектров в основном декодированном спектре и, например, является информацией, которая прямо или косвенно указывает долю ненулевых спектров или нулевых спектров относительно полных спектров, предварительно определенный диапазон основного декодированного спектра.
[0023] ʺКорреляцияʺ представляет сходство двух спектров. Это также включает в себя случаи, в которых сходство количественно оценивается с использованием коэффициента корреляции.
[0024] ʺУстройство терминалаʺ является устройством, которое использует пользовательская сторона, примерами которого являются сотовые телефоны, смартфоны, устройства караоке, персональные компьютеры, телевизионные приставки, цифровые диктофоны и т.д.
[0025] ʺУстройство базовой станцииʺ является устройством, которое прямо или опосредованно передает сигналы на устройство терминала или прямо или опосредованно принимает сигналы от устройства терминала. Примеры включают в себя eNode B, различные типы серверов, точки доступа и т.д.
[0026] ʺНенулевой компонентʺ (или ненулевой контент) является компонентом (или контентом), в котором импульс предполагается существующим. Импульсы, которые равны или меньше, чем предварительно определенная интенсивность, при которой импульсы не предполагаются существующими, являются нулевым компонентом (или нулевым контентом), а не ненулевым компонентом. То есть, не все импульсы, содержащиеся в первоначальном нормализованном спектре, обязательно являются ненулевыми компонентами.
Первый вариант осуществления
[0027] Фиг. 1 является блок-схемой, иллюстрирующей конфигурацию устройства декодирования в соответствии с первым вариантом осуществления. Устройство 100 декодирования, иллюстрируемое на фиг. 1, включает в себя блок 101 разделения, основной блок 102 декодирования (первый блок декодирования), блок 103 нормализации амплитуды, блок 104 генерации шума, первый блок 105 суммирования, блок 196 декодирования расширенного диапазона (второй блоку декодирования) и время-частотный преобразователь 107. Антенна A соединена с блоком 101 разделения.
[0028] Антенна A принимает основные кодированные данные и кодированные данные расширенного диапазона. Основные кодированные данные (первые кодированные данные) являются кодированными данными, полученными путем кодирования спектра нижнего диапазона предварительно определенной частоты или ниже во входных сигналах посредством устройства кодирования. Кодированные данные расширенного диапазона являются кодированными данными, полученными путем кодирования спектра верхнего диапазона предварительно определенной частоты или выше во входных сигналах. Кодированные данные расширенного диапазона (вторые кодированные данные) закодированы на основании основного кодированного спектра нижнего диапазона (первого кодированного спектра), полученного путем декодирования основных кодированных данных спектра верхнего диапазона предварительно определенной частоты во входных сигналах.
[0029] Конкретным примером является информация запаздывания (лага), которая является информацией, указывающей конкретный диапазон, где корреляция между спектром верхнего диапазона и основным кодированным спектром нижнего диапазона является наибольшей, и усиление между спектром верхнего диапазона и основным кодированным спектром нижнего диапазона в конкретном диапазоне. Это кодирование будет описано посредством конкретного примера в пятом варианте осуществления. Отметим, что кодированные данные диапазона амплитуд, вводимые в устройство декодирования в соответствии с настоящим вариантом осуществления, не ограничены данным конкретным примером.
[0030] Блок 101 разделения разделяет введенные основные кодированные данные и кодированные данные расширенного диапазона. Блок 101 разделения выводит основные кодированные данные на основной блок 102 декодирования, а кодированные данные расширенного диапазона - на блок 106 декодирования расширенного диапазона.
[0031] Основной блок 102 декодирования декодирует основные кодированные данные и генерирует основной декодированный спектр (первый декодированный спектр). Основной блок 102 декодирования выводит основной декодированный спектр на блок 103 нормализации амплитуды и время-частотный преобразователь 107.
[0032] Блок 103 нормализации амплитуды (первый блок нормализации амплитуды) нормализует основной декодированный спектр и генерирует нормализованный спектр. Более конкретно, блок 103 нормализации амплитуды делит основной декодированный спектр на множество поддиапазонов и нормализует спектр каждого поддиапазона наибольшим значением амплитуды (абсолютным значением) спектра, включенного в каждый поддиапазон. Таким образом, наибольшее значение спектра в каждом поддиапазоне после нормализации унифицируется среди поддиапазонов. Соответственно, больше не имеется каких-либо спектров с экстремально большой амплитудой в нормализованном спектре.
[0033] Отметим, что деление основного декодированного спектра на поддиапазоны является опциональным. Способ деления на поддиапазоны также является опциональным. Например, ширина полосы поддиапазонов может быть одинаковой или неодинаковой.
[0034] Блок 103 нормализации амплитуды выводит нормализованный спектр на первый блок 105 суммирования и блок 106 декодирования расширенного диапазона. Блок 104 генерации шума генерирует шумовой спектр. Шумовой спектр является спектром, в котором амплитуда флуктуирует нерегулярным образом. Конкретным примером является спектр, где положительное/отрицательное значение случайным образом назначается каждому частотному компоненту. Поскольку положительное/отрицательное значение является случайным, амплитуда может быть постоянным значением или может быть случайно генерируемой амплитудой в пределах диапазона.
[0035] Способ генерации шумового спектра может состоять в генерации, как это необходимо, основываясь на случайных числах, или конфигурации, в которой шумовой спектр, сгенерированный заранее, сохранен в устройстве хранения данных, таком как память или т.п., и может вызываться и выводиться. Множество шумовых спектров могут вызываться и суммироваться, четные компоненты и нечетные компоненты могут объединяться, и полярность может назначаться случайным образом при суммировании или объединении. Альтернативно, нулевой спектральный компонент в основном декодированном спектре может обнаруживаться, и шумовой спектр может генерироваться для его заполнения. Кроме того, шумовой спектр может генерироваться в соответствии с характеристиками основного декодированного спектра.
[0036] Отметим, что шумовой спектр не ограничен одним, и что он может быть выбран и выведен из множества шумовых спектров в соответствии с предварительно определенными условиями. Пример генерации множества шумовых спектров будет описан в третьем варианте осуществления.
[0037] Блок 104 генерации шума выводит шумовой спектр на первый блок 105 суммирования. Первый блок 105 суммирования суммирует нормализованный спектр и шумовой спектр и генерирует нормализованный спектр с добавленным шумом. Соответственно, шумовой спектр добавляется по меньшей мере к области нулевого компонента нормализованного спектра. Первый блок 105 суммирования затем выводит нормализованный спектр с добавленным шумом на блок 106 декодирования расширенного диапазона (второй блок декодирования).
[0038] В настоящем варианте осуществления, шумовой спектр добавлен к нормализованному спектру, который является спектром после нормализации в блоке 103 нормализации амплитуды, а не к основному декодированному спектру, который является входным спектром перед нормализацией в блоке 103 нормализации амплитуды. Причина заключается в следующем.
[0039] Амплитуда добавленного шумового спектра обычно меньше, чем амплитуда основного декодированного спектра, и основной декодированный спектр является разреженным, так что в случае выполнения нормализации для коротких поддиапазонов, которые содержат примерно 15 выборок и т.п., многие поддиапазоны будут нулевыми. Добавление шумового спектра к основному перед нормализацией в таком случае имеет следующую проблему.
[0040] Во-первых, шумовой спектр низкого уровня добавляется к полностью нулевому поддиапазону. Этот шумовой спектр сам, таким образом, получает большое значение и нормализуется как 1, так что если нет пика в поддиапазоне, полный шум усиливается. С другой стороны, в случае, когда имеется пик в поддиапазоне, спектр пика, который существует первоначально, является наибольшим значением, так что шумовой компонент остается на низком уровне при нормализации, или в действительности становится меньшим из-за нормализации. Соответственно, шумовые спектры с большой амплитудой локально добавляются к поддиапазонам, первоначально имеющим все нулевые компоненты. Напротив, настоящий вариант осуществления добавляет шумовой спектр после нормализации, поэтому можно предотвратить излишнее усиление шумового спектра из-за нормализации.
[0041] Блок 106 декодирования расширенного диапазона декодирует кодированные данные расширенного диапазона (вторые кодированные данные), используя нормализованный спектр с добавленным шумом и нормализованный спектр. Более конкретно, блок 106 декодирования расширенного диапазона декодирует кодированные данные расширенного диапазона и получает информацию запаздывания и усиление. Блок 106 декодирования расширенного диапазона идентифицирует диапазон нормализованного спектра с добавленным шумом, подлежащий копированию в расширенный диапазон, который является сегментом верхнего диапазона, на основе информации запаздывания и нормализованного спектра, и копирует предварительно определенный диапазон нормализованного спектра с добавленным шумом в расширенный диапазон. Блок 106 декодирования расширенного диапазона получает спектр расширенного диапазона с добавленным шумом путем умножения копированного нормализованного спектра с добавленным шумом на декодированное усиление.
[0042] Блок 106 декодирования расширенного диапазона затем выводит спектр расширенного диапазона с добавленным шумом на время-частотный преобразователь 107. Время-частотный преобразователь 107 связывает основной декодированный спектр, образующий сегмент нижнего диапазона, и спектр расширенного диапазона с добавленным шумом, образующий сегмент верхнего диапазона, тем самым генерируя декодированный спектр. Время-частотный преобразователь 107 затем преобразует декодированный спектр в сигналы временной области путем выполнения ортогонального преобразования декодированного спектра и выводит в качестве выходных сигналов. Выходные сигналы, выведенные из устройства 100 декодирования, проходят через DA (цифро-аналоговый) преобразователь, усилитель, динамик и т.д., которые опущены на чертеже, и выводятся как аудиосигналы, сигналы музыки или сигналы, в которых они существуют совместно.
[0043] Таким образом, в соответствии с настоящим вариантом осуществления, нормализованный спектр суммируется с нормализованным спектром, поэтому появление музыкального шума может быть подавлено даже в случае, когда нормализованный спектр является разреженным. Таким образом, настоящий вариант осуществления обеспечивает преимущества, состоящие в том, что преимущества гомогенизации и сглаживания, которые получают путем нормализации наибольшим значением спектра, могут сохраняться при компенсации недостатков, которые имеет этот метод нормализации.
[0044] Таким образом, шумовой спектр был добавлен к нормализованному спектру после нормализации в блоке 103 нормализации амплитуды в настоящем варианте осуществления, так что избыточное усиление шумового спектра путем нормализации можно предотвратить, тем самым обеспечивая преимущество, состоящее в том, что могут быть получены выходные сигналы с высоким качеством звука.
Второй вариант осуществления
[0045] Далее, конфигурация устройства 200 декодирования в соответствии с вторым вариантом осуществления настоящего раскрытия будет описана со ссылкой на фиг. 2. Блоки, имеющие ту же самую конфигурацию, что и на фиг. 1, обозначены теми же ссылочными позициями. Различие между устройством 200 декодирования в соответствии с настоящим вариантом осуществления и устройством 100 декодирования в первом варианте осуществления состоит в том, что устройство 200 декодирования имеет второй блок 201 суммирования. Другие компоненты в основном те же, что и в первом варианте осуществления, так что их описание будет опущено.
[0046] Второй блок 201 суммирования добавляет шумовой спектр, сгенерированный блоком 104 генерации шума, к основному декодированному спектру, выведенному из основного блока 102 декодирования, и генерирует основной декодированный спектр с добавленным шумом. Второй блок 201 суммирования затем выводит основной декодированный спектр с добавленным шумом на время-частотный преобразователь 107.
[0047] Время-частотный преобразователь 107 связывает основной декодированный спектр, образующий сегмент нижнего диапазона, и спектр расширенного диапазона с добавленным шумом, образующий сегмент верхнего диапазона, тем самым генерируя декодированный спектр. Время-частотный преобразователь 107 затем преобразует декодированный спектр в сигналы временной области путем выполнения ортогонального преобразования декодированного спектра и выводит в качестве выходных сигналов.
[0048] Таким образом, в соответствии с настоящим вариантом осуществления, шумовой спектр добавляется не только к нормализованному спектру, образующему сегмент верхнего диапазона, но также к основному декодированному спектру, образующему сегмент нижнего диапазона, так что музыкальный шум, возникающий из спектра нижнего диапазона, который важен для прослушивания, может быть подавлен. Разумеется, музыкальный шум может быть подавлен даже в случае генерации выходных сигналов с использованием одного только основного декодированного спектра.
Другой пример второго варианта осуществления
[0049] Далее, конфигурация устройства 210 декодирования в соответствии с другим примером второго варианта осуществления настоящего раскрытия будет описана со ссылкой на фиг. 3. Блоки, имеющие ту же самую конфигурацию, что и на фиг. 1 и 2, обозначены теми же ссылочными позициями. Устройство 210 декодирования в соответствии с настоящим вариантом осуществления отличается от устройства 200 декодирования во втором варианте осуществления тем, что оно не выводит шумовой спектр, который выводится на первый блок 105 суммирования, непосредственно из блока 104 генерации шума, а вместо этого генерирует шумовой спектр путем вычитания основного декодированного спектра из основного декодированного спектра с добавленным шумом в блоке 202 вычитания и выводит его. Другие компоненты, в основном, те же, что и во втором варианте осуществления, так что их описание будет опущено.
[0050] Блок 104 генерации шума детектирует нулевой спектральный компонент основного декодированного спектра и генерирует шумовой спектр для его заполнения. Второй блок 201 суммирования добавляет шумовой спектр, сгенерированный блоком 104 генерации шума, к основному декодированному спектру, выведенному из основного блока 102 декодирования, и генерирует основной декодированный спектр с добавленным шумом. Второй блок 201 суммирования затем выводит основной декодированный спектр с добавленным шумом на время-частотный преобразователь 107 и блок 202 вычитания.
[0051] Блок 202 вычитания вычитает основной декодированный спектр из декодированного спектра с добавленным шумом и принимает эту разность в качестве шумового спектра и выводит на первый блок 105 суммирования.
[0052] Причина выполнения такой обработки будет описана ниже. Обработка добавления шумового спектра к основному декодированному спектру может быть реализована путем обнаружения нулевого спектрального компонента основного декодированного спектра и добавления шумового спектра для его заполнения, как в случае настоящего варианта осуществления, помимо случая реализации путем добавления независимо генерируемого шумового спектра к основному декодированному спектру. В этом случае нормализованный спектр накладывается на основной декодированный спектр и сразу же становится интегральным с основным декодированным спектром, так что шумовой спектр, подлежащий выводу на первый блок 105 суммирования, требуется получить отдельным способом.
[0053] Соответственно, блок 202 вычитания обеспечен в настоящем варианте осуществления, и основной декодированный спектр вычитается из основного декодированного спектра с добавленным шумом, тем самым выделяя шумовой спектр. В этом случае блок 104 генерации шума, второй блок 201 суммирования и блок 202 вычитания вместе образуют блок генерации шума в соответствии с настоящим раскрытием.
[0054] Таким образом, в соответствии с настоящим вариантом осуществления, шумовой спектр не добавляется к спектрам иным, чем нулевой спектр спектров, образующих основной декодированный спектр, поэтому может быть выполнено более точное декодирование, и могут быть получены выходные сигналы с высоким качеством изображения.
Третий вариант осуществления
[0055] Далее, конфигурация устройства 300 декодирования в соответствии с третьим вариантом осуществления настоящего раскрытия будет описана со ссылкой на фиг. 4. Блоки, имеющие ту же самую конфигурацию, что и на фиг. 1 и 2, обозначены теми же ссылочными позициями. Различие между устройством декодирования 300 в соответствии с настоящим вариантом осуществления и устройством 200 декодирования в соответствии с вторым вариантом осуществления состоит в том, что устройство 300 декодирования имеет блок 301 генерации шума вместо блока 104 генерации шума. Другие компоненты в основном те же, что и в первом варианте осуществления, так что их описание будет опущено.
[0056] Блок 301 генерации шума способен генерировать множество различных шумовых спектров и может изменять выводимые шумовые спектры в соответствии с характеристиками основных декодированных спектров.
[0057] Фиг. 5 является блок-схемой последовательности операций, иллюстрирующей работу блока 301 генерации шума. Блок 301 генерации шума принимает информацию нормы диапазона от основного блока 102 декодирования (информацию о средней амплитуде диапазона), информацию о распределения битов и информацию о разреженности (S1). Информация о распределении битов является информацией, представляющей число битов, выделенных конкретному диапазону основного декодированного спектра. Например, в ITU-T Рекомендациях G.722.1 и G.719 закодирована информация нормы спектра (среднее значение амплитуды для каждого диапазона или соответствующая этому информация (коэффициент масштабирования, энергия диапазона и т.д.)), и распределение битов является базой принятия решения на основе этой информации нормы. Информация о разрежении является информацией, указывающей долю ненулевых спектров относительно всех спектров в конкретном диапазоне основного декодированного спектра (или, наоборот, может быть определена как доля нулевых спектров).
[0058] Далее, блок 301 генерации шума вычисляет первый коэффициент С1 корректировки амплитуды шума с использованием информации распределения битов (S2). C1 вычисляется с использованием, например, функции F(b) отсчета b выделенных битов. F(b) выводит фиксированное значение Nb, когда b=0; выводит 0, когда b>ns, и выводит значение между Nb и 0, когда 0≤b≤ns, причем, чем b ближе к ns, тем значение ближе к 0. Например, эта функция может иллюстрироваться следующим выражением (1):
где Nb является константой между 0 and 1.0 и является значением коэффициента корректировки амплитуды шума, используемым в случае, когда нет распределения битов; и ns является константой, которая представляет собой отсчет битов, необходимый для высококачественного квантования спектра.
[0059] Если число битов является тем же числом, что и этот отсчет битов или больше, квантование может выполняться на уровне, где ошибка квантования не проблематична, так что нет необходимости добавлять шум. C1 может вычисляться для каждого поддиапазона, где выполняется распределение битов, или несколько диапазонов могут быть сгруппированы, и вычисление может выполняться для всех сгруппированных диапазонов.
[0060] Кроме того, блок 301 генерации шума выводит второй коэффициент С2 корректировки амплитуды шума с использованием информации о разреженности (S3). C2 определяется, например, как в приведенном ниже выражении (2), как доля Sp нулевого спектра в общем числе спектров целевых диапазонов:
где Nz представляет число нулевых спектров, и Lb представляет общее число спектров целевых диапазонов.
[0061] Чем больше доля нулевых спектров, тем больше значение Sp, которое является переменной между 0 и 1.0. Следующее выражение (3) может быть использовано вместо выражения (2):
[0062] Наконец, блок 301 генерации шума использует первый и второй коэффициенты С1, С2 корректировки амплитуды шума для вычисления амплитуды LN шума на основе следующего выражения (4) (S4):
где |E(i)| является информацией нормы диапазона (информацией средней амплитуды диапазона) для i-го диапазона; и b и Sp представляют отсчет распределения битов и информацию пропусков по отношению к i-му диапазону.
[0063] Хотя C1 и C2 были использованы в настоящем варианте осуществления, LN может быть получено с использованием только одного из них.
[0064] Таким образом, в настоящем варианте осуществления, блок 301 генерации шума принимает решение об амплитуде шумового спектра, подлежащего генерации, на основе информации нормы диапазона, информации о распределении битов и информации о разреженности. Соответственно, шумовой спектр может адаптивно добавляться на основе грубости квантования, тем самым обеспечивая преимущество, состоящее в том, что можно избежать шумового ухудшения вследствие добавления большого уровня шума там, где было реализовано точное квантование.
[0065] Хотя в настоящем варианте осуществления был описан пример, где информация о распределении битов и информация о разреженности выводятся из основного блока 102 декодирования, это не накладывает ограничения. Например, может быть реализовано устройство, в котором основной декодированный спектр вводится в блок 301 генерации шума, блок 301 генерации шума анализирует основной декодированный спектр и сам получает информацию нормы диапазона, информацию о распределении битов и информацию о пропусках.
[0066] Отметим, что было описано устройство, где блок 104 генерации шума согласно второму варианту осуществления заменен на блок 301 генерации шума, но также блок 104 генерации шума согласно первому варианту осуществления может быть заменен на блок 301 генерации шума.
[0067] Хотя настоящий вариант осуществления описывает LN как вычисляемое и применяемое для каждого диапазона i, множество диапазонов могут группироваться и вычисляться и адаптироваться, или среднее значение LN, вычисленное для каждого i, может применяться как одинаковое LN для всех диапазонов.
Четвертый вариант осуществления
[0068] Далее, конфигурация устройства 400 декодирования в соответствии с четвертым вариантом осуществления настоящего раскрытия будет описана со ссылкой на фиг. 6. Блоки, имеющие ту же самую конфигурацию, что и на фиг. 1, 2 и 4, обозначены теми же ссылочными позициями. Различие между устройством 400 декодирования в соответствии с настоящим вариантом осуществления и устройством 200 декодирования в соответствии с вторым вариантом осуществления состоит в том, что устройство 400 декодирования в соответствии с настоящим вариантом осуществления включает в себя блок 401 нормализации амплитуды шума (второй блок нормализации амплитуды) и блок 402 корректировки амплитуды. Другие компоненты в основном те же, что и во втором варианте осуществления, так что их описание будет опущено.
[0069] Блок 401 нормализации амплитуды шума нормализует нормализованный спектр, сгенерированный в блоке 104 генерации шума, и генерирует нормализованный шумовой спектр. Операции блока 401 нормализации амплитуды шума те же самые, что и операции блока 103 нормализации амплитуды, но могут быть и различными. Например, в случае, когда в блоке 103 нормализации амплитуды выполняется обработка, чтобы устанавливать спектральные компоненты ниже порогового значения на нуль, чтобы обеспечить разрежение, это пороговое значение может быть установлено на низкое пороговое значение в блоке 401 нормализации амплитуды шума, чтобы сделать малой степень разреженности в отношении шумового спектра.
[0070] Блок 401 нормализации амплитуды шума затем выводит нормализованный шумовой спектр на блок 402 корректировки амплитуды. Блок 402 корректировки амплитуды корректирует амплитуду нормализованного шумового спектра, который вывел блок 401 нормализации амплитуды шума. Нормализованный шумовой спектр, амплитуда которого была скорректирована, затем выводится на первый блок 105 суммирования. Детали операций блока 402 корректировки амплитуды описаны ниже.
[0071] Первый блок 105 суммирования суммирует нормализованный спектр и нормализованный шумовой спектр, амплитуда которого была скорректирована, генерируя при этом нормализованный спектр с добавленным шумом. Первый блок 105 суммирования выводит нормализованный спектр с добавленным шумом на блок 106 декодирования расширенного диапазона.
[0072] Фиг. 7 является блок-схемой последовательности операций, иллюстрирующей операции блока 402 корректировки амплитуды. Блок 402 корректировки амплитуды принимает основной декодированный спектр X(j), информацию нормы диапазона |E(i)|, информацию о распределении битов и информацию о разреженности, выведенные из основного блока 102 декодирования (S1).
[0073] Блок 402 корректировки амплитуды затем анализирует основной декодированный спектр X(j) и информацию нормы диапазона |E(i)| и получает различие между средней амплитудой |XE(i)|, вычисленной из основного декодированного спектра X(j), и информацией нормы диапазона |E(i)| (информацией нормы диапазона). Отношение между полученной ошибкой и декодированной нормой (информацией нормы диапазона) используется для вычисления коэффициента корректировки амплитуды шума в соответствии со следующим выражением (5) (S2):
где i представляет № диапазона, j представляет № спектра, включенного в i-ый диапазон, и α является коэффициентом коррекции, который имеет значение между 0 и 1.0.
[0074] Блок 402 корректировки амплитуды затем вычисляет коэффициент С1 корректировки амплитуды шума в соответствии с выражением (1), таким же путем, как в третьем варианте осуществления, с использованием информации распределения битов (S3).
[0075] Блок 402 корректировки амплитуды дополнительно вычисляет коэффициент С2 корректировки амплитуды шума в соответствии с выражением (2), таким же путем, как в третьем варианте осуществления, с использованием информации о разреженности нормализованного спектра (S4).
[0076] Наконец, блок 402 корректировки амплитуды вычисляет амплитуду LN шума посредством следующего выражения (6) на основе результатов (S2), (S3) и (S4) и корректирует амплитуду нормализованного шумового спектра (S5):
[0077] Хотя все из C0, C1 и C2 были использованы в настоящем варианте осуществления, LN может быть получено с использованием по меньшей мере одного из них. Хотя информация о разреженности нормализованного спектра используется в качестве информации о разреженности при получении C2 в настоящем варианте осуществления, также может использоваться информация о разреженности, полученная из основного декодированного спектра, или обе из них могут использоваться совместно.
[0078] Кроме того, может быть реализовано устройство, в котором отношение амплитуд основного декодированного спектра и шумового спектра, добавленного к декодированному спектру, является коэффициентом С3 корректировки амплитуды шума, и амплитуда LN шума получается из следующего выражения (7) на основе C3. Разумеется, C3 может быть получено независимо, и LN может быть получено с использованием по меньшей мере одного из C0, C1, C2 и C3:
[0079] Отметим, что LN предпочтительно сглаживается между кадрами, для межкадровой стабильности уровня шума. Для сглаживания может быть использовано выражение вида:
LN(f)=μ×LN(f-1)+(1-μ)×LN(f).
Здесь LN(f) представляет собой LN в кадре № f, и μ представляет собой коэффициент сглаживания. μ может быть значением между 0 и 1.
[0080] В соответствии с настоящим вариантом осуществления, основной декодированный спектр нормализуется в блоке 103 нормализации амплитуды, в то время как шумовой спектр нормализуется в блоке 401 нормализации амплитуды, так что создаются спектры, имеющие общий характер (например, амплитуда спектров является, в общем, равномерной), за счет того, что основной декодированный спектр и шумовой спектр проходят через согласующиеся тракты, так что оба сигнала могут быть реализованы как сигналы, которые могут обрабатываться на той же самой стадии.
[0081] Таким образом, в соответствии с настоящим вариантом осуществления, шумовой спектр, добавленный к сегменту верхнего диапазона (нормализованный шумовой спектр), выводится через блок 401 нормализации амплитуды шума и блок 402 корректировки амплитуды, в то время как шумовой спектр, добавленный к сегменту нижнего диапазона, не проходит ни через блок 401 нормализации амплитуды шума, ни через блок 402 корректировки амплитуды, так что могут быть созданы характеристики, отличающиеся между шумовым спектром, добавленным к сегменту верхнего диапазона (нормализованному шумовому спектру), и шумовым спектром, добавленным к сегменту нижнего диапазона. Соответственно, может быть снижена корреляция между сегментом нижнего диапазона и сегментом верхнего диапазона, при этом может быть сгенерирован шумовой спектр с более случайными характеристиками.
[0082] В соответствии с настоящим вариантом осуществления, нормализованный шумовой спектр имеет амплитуду, скорректированную в блоке 402 корректировки амплитуды, тем самым обеспечивая преимущество, состоящее в том, что может избежать ухудшения из-за добавления слишком большого уровня шума.
[0083] Хотя в настоящем варианте осуществления был описан пример, где информация о распределении битов и информация о разреженности выводятся из основного блока 102 декодирования, это не накладывает ограничения. Например, может быть реализовано устройство, в котором основной декодированный спектр вводится в блок 402 корректировки амплитуды, блок 402 корректировки амплитуды сам анализирует основной декодированный спектр и получает информацию нормы диапазона, информацию о распределении битов и информацию о разреженности.
[0084] Отметим, что было описано устройство, в котором блок 401 нормализации амплитуды шума и блок 402 корректировки амплитуды добавлены к конфигурации второго варианта осуществления, но они могут быть добавлены к первому варианту осуществления или третьему варианту осуществления.
Другой пример четвертого варианта осуществления
[0085] Далее, конфигурация другого устройства 410 декодирования в соответствии с четвертым вариантом осуществления настоящего раскрытия будет описана со ссылкой на фиг. 8. Блоки, имеющие ту же самую конфигурацию, что и на фиг. 6, обозначены теми же ссылочными позициями. Различие между устройством 410 декодирования и устройством 400 декодирования в соответствии с четвертым вариантом осуществления состоит в том, что устройство 410 декодирования в соответствии с настоящим вариантом осуществления включает в себя блок 403 повторной корректировки амплитуды. Другие компоненты в основном те же, что и во втором варианте осуществления, так что их описание будет опущено.
[0086] Блок 403 повторной корректировки амплитуды генерирует расширенный диапазон с использованием основного декодированного спектра, к которому добавлен шум, и затем повторно корректирует амплитуду добавленного шумового компонента. Эта повторная корректировка может выполняться, как иллюстрируется на фиг. 9. На фиг. 9, (a) представляет нормализованный спектр, выведенный из блока 103 нормализации амплитуды, и (b) представляет нормализованный спектр с добавленным шумом, выведенный из первого блока 105 суммирования. Как иллюстрируется посредством (c), нормализованный спектр с добавленным шумом сдвинут относительно расширенного диапазона на основе информации запаздывания, тем самым генерируя спектр расширенного диапазона путем умножения на усиление. В (b) иллюстрируется только i-ый диапазон, который является самым нижним диапазоном в расширенном диапазоне. E(i) на этом чертеже представляет информацию нормы диапазона (энергию диапазона) для i-го диапазона, и сегмент, окруженный пунктирной линией (d), является нормализованным спектром с добавленным шумом, определенным информацией запаздывания (определенной блоком 106 декодирования расширенного диапазона). Соответствующий расширенный диапазон (здесь i-ый диапазон), умноженный на соответствующее усиление G, копируется. Сегмент, окруженный пунктирной линией (e), является расширенным диапазоном. Повторная корректировка амплитуды добавленного шумового компонента выполняется следующим образом.
[0087] Сначала определяется пороговое значение Th. Th является значением, которое равно, например, половине наибольшей амплитуды нормализованного спектра. В случае, когда амплитуда нормализованного спектра ограничена конкретной амплитудой или выше, наименьшим значением амплитуды нормализованного спектра может быть Th. Альтернативно, может быть использовано среднее значение амплитуды нормализованных спектров. Вновь, среднее значение амплитуды добавленных шумовых спектров может быть использовано. Более того, эти значения могут представлять собой значения, умноженные на константу и скорректированные.
[0088] Th и его амплитуда в случае, когда наименьшая амплитуда нормализованного спектра используется в качестве Th, иллюстрируется на (b) посредством штрихпунктирной линии. Компоненты, имеющие амплитуду меньшую, чем это Th, определены как шумовые компоненты. Затем усиление G, получаемое декодированием кодированных данных расширенного диапазона, умножается на Th, и вычисляется G⋅Th.
[0089] Затем, по отношению к спектру i-го диапазона, генерируемому расширением диапазона, выбирается спектр, имеющий амплитуду меньше, чем пороговое значение G⋅Th, и определяется как шумовой компонент, и вычисляется энергия шумового компонента i-го диапазона (установленная как EN(i)).
[0090] Затем получают SEN(i), которое представляет собой EN(i), сглаженное в направлении временной оси, посредством следующего выражения (8):
где σ представляет коэффициент сглаживания, который является константой от 0 до 1 и ближе к 1, и pSEN(i) представляет SEN(i) на один кадр раньше.
[0091] Шумовой компонент затем умножается на √SEN(i)/√EN(i), так что энергия шумового спектра i-го диапазона равна SEN(i).
[0092] Таким же образом повторная корректировка амплитуды выполняется на шумовых компонентах диапазонов для других расширенных диапазонов. Кроме того, в случае, если имеется расхождение в SEN(i) диапазонов для других расширенных диапазонов, может выполняться повторная корректировка амплитуды для устранения этого расхождения. Более конкретно, получают среднее значение AEN для EN(i) во всех диапазонах расширенного диапазона, умножают шумовой компонент каждого диапазона на AEN/EN(i), так что EN(i) всех диапазонов равно AEN, и затем выполняют обработку межкадрового сглаживания.
[0093] Отметим, что порядок обработки сглаживания энергии шумового компонента в каждом диапазоне и обработки межкадрового сглаживания является опциональным, и может выполняться только одна или другая.
Пятый вариант осуществления
[0094] Варианты осуществления устройств декодирования были описаны в вариантах осуществления с первого по четвертый. Настоящее раскрытие также применимо к устройствам кодирования. Далее, конфигурация устройства 500 кодирования в соответствии с пятым вариантом осуществления настоящего раскрытия будет описана со ссылкой на фиг. 10.
[0095] Фиг. 10 является блок-схемой, иллюстрирующей конфигурацию устройства кодирования в соответствии с пятым вариантом осуществления. Устройство 500 кодирования, иллюстрируемое на фиг. 10, содержит время-частотный преобразователь 501, основной блок 502 кодирования, блок 503 нормализации амплитуды, блок 504 генерации шума, блок 505 нормализации амплитуды шума, блок 506 корректировки амплитуды, первый блок 507 суммирования, блок 508 поиска диапазона, блок 509 вычисления усиления, блок 510 кодирования расширенного диапазона, мультиплексор 511 и блок 512 хранения положений-кандидатов поиска запаздывания. Антенна А соединена с мультиплексором 511.
[0096] Время-частотный преобразователь 501 преобразует входные сигналы, которые являются аудиосигналами временной области и т.д., в сигналы частотной области и выводит полученный спектр входных сигналов на основной блок 502 кодирования, блок 508 поиска диапазона и блок 509 вычисления усиления.
[0097] Основной блок 502 кодирования кодирует спектр нижнего диапазона спектра входного сигнала и генерирует основные кодированные данные. Примером кодирования является CELP-кодирование и кодирование с преобразованием. Основной блок 502 кодирования выводит основные кодированные данные на мультиплексор 511. Основной блок 502 кодирования декодирует основные кодированные данные и выводит полученный основной декодированный спектр на блок 503 нормализации амплитуды.
[0098] Операции блока 503 нормализации амплитуды, блока 504 генерации шума, блока 505 нормализации амплитуды шума и блока 506 корректировки амплитуды являются такими же, что и операции, описанные в третьем и четвертом вариантах осуществления, так что их описание будет опущено.
[0099] Блок 512 хранения положений-кандидатов поиска запаздывания хранит положения (частоты) компонентов, где амплитуда нормализованного спектра отлична от нуля, в качестве положений-кандидатов для поиска диапазона. Блок 512 хранения положений-кандидатов поиска запаздывания затем выводит сохраненную информацию о положениях-кандидатах на блок 508 поиска диапазона.
[0100] Первый блок 507 суммирования суммирует нормализованный спектр и нормализованный шумовой спектр, амплитуда которого была скорректирована, и генерирует нормализованный спектр с добавленным шумом. Первый блок 507 суммирования затем выводит нормализованный спектр с добавленным шумом на блок 508 поиска диапазона и блок 509 вычисления усиления.
[0101] Блок 508 поиска диапазона, блок 509 вычисления усиления и блок 510 кодирования расширенного диапазона выполняют обработку кодирования спектра верхнего диапазона спектра входного сигнала.
[0102] Блок 508 поиска диапазона выполняет поиск конкретного диапазона, где корреляция между спектром верхнего диапазона и нормализованным спектром с добавленным шумом является наибольшей в спектре входного сигнала. Поиск выполняется путем выбора кандидатов из положений-кандидатов, введенных из блока 512 хранения положений-кандидатов поиска запаздывания, для которых корреляция является наибольшей. Затем блок 508 поиска диапазона выводит информацию запаздывания, которая является информацией, указывающей искомый конкретный диапазон, на блок 509 вычисления усиления и блок 510 кодирования расширенного диапазона.
[0103] Блок 509 вычисления усиления вычисляет усиление между спектром верхнего диапазона в конкретном диапазоне и нормализованным спектром с добавленным шумом и выводит на блок 510 кодирования расширенного диапазона.
[0104] Блок 510 кодирования расширенного диапазона кодирует информацию запаздывания и усиление и генерирует кодированные данные расширенного диапазона. Блок 510 кодирования расширенного диапазона затем выводит кодированные данные расширенного диапазона на мультиплексор 511. Мультиплексор 511 мультиплексирует основные кодированные данные и кодированные данные расширенного диапазона и передает через антенну A.
[0105] Таким образом, в соответствии с настоящим вариантом осуществления, поиск (поиск запаздывания, поиск сходства) спектра верхнего диапазона выполняется с использованием спектра с добавленным шумовым компонентом, так что точность согласования формы спектра может быть улучшена.
[0106] Отметим, что хотя фиг. 10, которая иллюстрирует настоящий вариант осуществления, показывает конфигурацию, где были объединены третий вариант осуществления и четвертый вариант осуществления, которые являются вариантами осуществления устройства декодирования, конфигурация может соответствовать первому, второму, третьему или четвертому вариантам осуществления. Кроме того, конфигурация может соответствовать описанному далее шестому варианту осуществления.
Шестой вариант осуществления
[0107] Далее, конфигурация устройства 600 декодирования в соответствии с шестым вариантом осуществления настоящего раскрытия будет описана со ссылкой на фиг. 14. Блоки, имеющие ту же самую конфигурацию, что и в устройстве 400 декодирования на фиг. 6, обозначены теми же ссылочными позициями. Различие между устройством 600 декодирования в соответствии с настоящим вариантом осуществления и устройством 400 декодирования состоит в том, что в устройстве 600 декодирования детектирование аномалии, обрабатывающее сигнал запроса, вновь включает в себя блок 601 вычисления порогового значения и блок 602 корректировки амплитуды основного декодированного спектра. Кроме того, блок 402 корректировки амплитуды заменен на блок 603 корректировки амплитуды шумового спектра (второй блок корректировки амплитуды).
[0108] Устройство 600 декодирования в соответствии с настоящим вариантом осуществления дополнительно имеет блок 604 генерации и добавления шума и блок 202 вычитания вместо блока 104 генерации шума; это представляет собой конфигурацию для генерации и добавления шумового спектра таким образом, чтобы заполнять нулевой спектральный компонент основного декодированного спектра, как описано в другом примере второго варианта осуществления. Другие компоненты в основном те же самые, что и в четвертом варианте осуществления, так что их описание будет опущено.
[0109] Блок 601 вычисления порогового значения использует информацию о разреженности нормализованного спектра для вычисления порогового значения Th спектральной интенсивности, чтобы различать между шумовым компонентом и нешумовым компонентом. Конкретный способ вычисления будет описан ниже. Отметим, что информация о разреженности основного декодированного спектра может быть использована вместо информации о разреженности нормализованного спектра.
[0110] Блок 601 вычисления порогового значения затем выводит пороговое значение на блок 602 корректировки амплитуды основного декодированного спектра и блок 602 корректировки амплитуды шумового спектра.
[0111] Блок 602 корректировки амплитуды основного декодированного спектра корректирует амплитуду нормализованного спектра, так что ненулевой компонент нормализованного спектра больше, чем пороговое значение. Более конкретно, полный нормализованный спектр повышается путем обеспечения каждого спектра некоторым сдвигом или усилением в некоторой степени, так что наименьшее значение ненулевого компонента в нормализованном спектре больше, чем пороговое значение, как иллюстрируется на фиг. 15(a).
[0112] Одним примером способа усиления является масштабирование посредством Y=aX+Th, где амплитуда после усиления обозначена как Y, перед усилением - как X, и пороговое значение обозначено как Th (отметим, что a=(Xmax-Th)/Xmax, где Xmax является наибольшим значением, которое может принимать X).
[0113] Альтернативно, наименьшее значение спектра, имеющего некоторую интенсивность или больше (называемое ʺобнуляющим пороговым значениемʺ), может быть сделано большим, чем пороговое значение, как иллюстрируется на фиг. 15В. Например, в случае, где диапазон нормализованного спектра нормализован от 0 до 10, обнуляющее пороговое значение установлено на 0.95, и наименьшее значение спектра, имеющее 0.95 или выше, может быть сделано большим, чем пороговое значение Th. В этом случае, спектры меньше 0.95 обнуляются. То есть, в этом случае, спектры обнуляющего порогового значения или выше являются ненулевыми компонентами, а спектры меньшие, чем обнуляющее пороговое значение, являются нулевыми компонентами.
[0114] Хотя фиксированные значения могут быть использованы в качестве обнуляющего порогового значения, как описано выше, переменное значение, которое изменяется в соответствии с другими переменными, также может использоваться в качестве обнуляющего порогового значения. Например, может использоваться обнуляющее пороговое значение=пороговое значение Th×α (где α является константой, например, α=1/4). Также, верхнее предельное значение или нижнее предельное значение может использоваться в связи с обнуляющим пороговым значением. Например, в случае, когда обнуляющее пороговое значение равно 0.9 или ниже, 0.9 может использоваться как обнуляющее пороговое значение. Нормализованный спектр, амплитуда которого была скорректирована, затем выводится на первый блок 105 суммирования.
[0115] Блок 603 корректировки амплитуды шумового спектра корректирует амплитуду нормализованного шумового спектра так, что наибольшее значение нормализованного шумового спектра равно или меньше, чем пороговое значение. Более конкретно, в случае, когда наибольшее значение нормализованного шумового спектра меньше, чем пороговое значение, наибольшее значение нормализованного спектра устанавливается на пороговое значение или ниже путем обеспечения каждого спектра некоторым сдвигом или усиления в некоторой степени. В случае, когда наибольшее значение нормализованного шумового спектра больше, чем пороговое значение, применяется отрицательный сдвиг, то есть вычитание (отсечка), или выполняется усиление в некоторой отрицательной степени, т.е., ослабление. Эта корректировка синонимична нормализации нормализованного шумового спектра пороговым значением.
[0116] Нормализованный шумовой спектр, амплитуда которого была скорректирована, выводится на первый блок 105 суммирования. Первый блок 105 суммирования суммирует нормализованный спектр, амплитуда которого была скорректирована, и нормализованный шумовой спектр, амплитуда которого была скорректирована, и выводит на блок 106 декодирования расширенного диапазона как нормализованный спектр с добавленным шумом.
[0117] Далее описывается способ получения порогового значения. Пороговое значение служит для разделения между шумовым компонентом и нешумовым компонентом. Пороговое значение Th может быть получено посредством следующего выражения (9) с использованием разреженности Sp в выражении (2). Здесь а является константой, установленной, например, на 4 в настоящем варианте осуществления:
[0118] Отметим, что пороговое значение Th может быть получено с использованием следующего выражения (10) вместо выражения (9), использующего Nz:
где Np представляет число спектров, которые являются ненулевыми.
[0119] Также, верхний предел или нижний предел может быть использован вместе с этим в качестве порогового значения Th. То есть, в соответствии с выражением (9), чем больше разреженность Sp, то есть, чем более дискретным является поток импульсов с большим нулевым компонентом, тем ниже шумовая характеристика и ниже пороговое значение Th. Напротив, чем меньше разреженность Sp, то есть, чем плотнее поток импульсов с меньшим нулевым компонентом, тем выше шумовая характеристика и выше пороговое значение Th.
[0120] Если разреженность Sp велика (пороговое значение Th является низким), амплитуда шумового спектра, корректируемая в блоке 603 корректировки амплитуды шумового спектра, подавляется до низкого уровня, и шумовой спектр с малой амплитудой добавляется в блоке 105 суммирования. То есть, шумовая характеристика сигналов нормализованного спектра является низкой, поэтому амплитуда добавленного шумового спектра мала, чтобы поддерживать эту характеристику.
[0121] Напротив, когда разреженность Sp мала (пороговое значение Th является высоким), амплитуда шумового спектра, корректируемая в блоке 603 корректировки амплитуды шумового спектра, велика, и шумовой спектр с большой амплитудой добавляется в блоке 105 суммирования. То есть, шумовая характеристика сигналов нормализованного спектра является высокой, поэтому амплитуда добавленного шумового спектра велика, чтобы поддерживать эту характеристику.
[0122] Отметим, что одно пороговое значение было использовано в настоящем варианте осуществления, общее между блоком 602 корректировки амплитуды основного декодированного спектра и блоком 603 корректировки амплитуды шумового спектра. Однако блок 602 корректировки амплитуды основного декодированного спектра и блок 603 корректировки амплитуды шумового спектра могут использовать разные пороговые значения. Это объясняется тем, что в то время как пороговое значение служит для разделения шумового компонента и нешумового компонента, шумовая характеристика, которую имеет спектр нижнего диапазона, первоначально включенный в нормализованный спектр, и шумовая характеристика, которую имеет сгенерированный шумовой спектр, могут быть разными характеристиками, и использование независимых стандартов для каждой вместо использования того же самого стандарта для обеих может повысить качество изображения в таких случаях. Например, установка порога, используемого блоком 602 корректировки амплитуды основного декодированного спектра, более высоким, чем порог, используемый блоком 603 корректировки амплитуды шумового спектра, позволяет в большей степени усилить компонент, содержащийся в нормализованном спектре, который является первоначальным сигналом.
[0123] Хотя только разреженность была использована в выражении (9) для получения порогового значения, информация нормы диапазона и информация о распределении битов могут комбинироваться или использоваться отдельно, как в третьем варианте осуществления и четвертом варианте осуществления. Например, совместное использование информации о распределении битов возможно в следующем случае.
[0124] Увеличение распределения битов позволяет увеличить число импульсов, так что импульсы с более низкой амплитудой также кодируются, и число квантованных импульсов увеличивается. В результате, разреженность уменьшается. То есть, разреженность зависит не только от характеристик кодируемых сигналов, но и от количества выделенных битов. Соответственно, в случае, когда число выделенных битов сильно изменяется, соотношение между разреженностью и пороговым значением может настраиваться, чтобы корректировать влияние, обусловленное изменением в распределении битов.
[0125] В то время как конфигурация вышеописанного другого примера второго варианта осуществления была использована для блока генерации шума и суммирования в настоящем варианте осуществления, вместо этого могут быть использованы блок 104 генерации шума согласно первому варианту осуществления, блок 104 генерации шума и второй блок 201 суммирования согласно второму варианту осуществления и блок 301 генерации шума и второй блок 201 суммирования согласно третьему варианту осуществления.
[0126] В соответствии с вышеописанным устройством 600 декодирования, может корректироваться амплитуда как нормализованного спектра, так и нормализованного шумового спектра, в отношении амплитуды нормализованного спектра и амплитуды нормализованного шумового спектра, и они могут корректироваться синхронно, так что оптимальный шум может добавляться в соответствии с характеристикой нормализованного спектра, и в результате качество звука выходных сигналов может быть улучшено.
[0127] Более конкретно, шумовая характеристика нормализованного спектра улучшается, и может быть создан спектр, подходящий для выражения частотного спектра верхнего диапазона, так что качество звука выходных сигналов устройства декодирования, основанного на модели расширения спектра, может быть улучшено.
Первый другой пример шестого варианта осуществления
[0128] Далее, конфигурация устройства 610 декодирования в соответствии с первым другим примером шестого варианта осуществления настоящего раскрытия будет описана со ссылкой на фиг. 16. Блоки, имеющие ту же самую конфигурацию, что и на фиг. 14, обозначены теми же ссылочными позициями. Различие между устройством 610 декодирования и устройством 600 декодирования в соответствии с настоящим вариантом осуществления главным образом относится к операциям блока 601 вычисления порогового значения.
[0129] Блок 601 вычисления порогового значения устройства 610 декодирования в соответствии с настоящим вариантом осуществления принимает входную информацию о разреженности в качестве информации о разреженности основного декодированного спектра, получает пороговое значение Th в блоке 601 вычисления порогового значения с использованием выражения (9) и выражения (10) на основе этой информации о разреженности, и также получается обнуляющее пороговое значение с использованием этого порогового значения Th путем вычисления, например, следующим образом: обнуляющее пороговое значение=пороговое значение Th×α.
[0130] Блок 601 вычисления порогового значения затем выводит пороговое значение Th на блок 602 корректировки амплитуды основного декодированного спектра и блок 603 корректировки амплитуды шумового спектра и выводит обнуляющее пороговое значение на блок 103 нормализации амплитуды (первый блок нормализации амплитуды).
[0131] Блок 103 нормализации амплитуды нормализует основной декодированный спектр и устанавливает спектры, меньшие, чем обнуляющее пороговое значение, или равные или меньшие, чем обнуляющее пороговое значение, в нуль (выполняет обнуление) и выводит.
[0132] Хотя настоящий вариант осуществления был описан с блоком, который выполняет обнуление, в качестве блока 103 нормализации амплитуды, однако отдельный блок, который выполняет обнуление, может быть предусмотрен перед или после блока 103 нормализации амплитуды, или это может выполняться в блоке 602 корректировки амплитуды основного декодированного спектра. В этом случае, местом назначения вывода обнуляющего порогового значения может быть блок, который выполняет это обнуление.
Второй другой пример шестого варианта осуществления
[0133] Далее, конфигурация устройства 620 декодирования в соответствии с вторым другим примером шестого варианта осуществления настоящего раскрытия будет описана со ссылкой на фиг. 17. Блоки, имеющие ту же самую конфигурацию, что и на фиг. 16, обозначены теми же ссылочными позициями. Различие между устройством 620 декодирования в соответствии с настоящим вариантом осуществления и устройством 600 декодирования или устройством 610 декодирования заключается в том, что добавлен блок 605 генерации и добавления шума.
[0134] В устройстве 600 декодирования и устройстве 610 декодирования, блок 604 генерации и добавления шума генерирует и добавляет шумовой спектр, чтобы заполнять нулевой спектральный компонент основного декодированного спектра. То есть, данная конфигурация добавляет шум только в положения, соответствующие нулевому спектральному компоненту основного декодированного спектра, так что в конечном счете здесь нет добавления шума к спектральным сегментам, обнуляемым позже посредством блока 103 нормализации амплитуды и т.п.
[0135] Соответственно, блок 605 генерации и добавления шума предусмотрен в настоящем варианте осуществления, чтобы добавлять шум к спектральным сегментам, которые были обнулены. Блок 605 генерации и добавления шума обнаруживает нулевой спектр в нормализованном спектре с добавленным шумом, выведенном из первого блока 105 суммирования, и генерирует и добавляет случайный шум для его заполнения. Наибольшее значение добавляемой амплитуды управляется, как описано выше, так что пороговое значение, генерируемое блоком 601 вычисления порогового значения, может быть выведено на блок 605 генерации и добавления шума, причем это пороговое значение используется для определения наибольшего значения амплитуды. Верхнее предельное значение может быть использовано в этой связи, отдельно от порогового значения.
[0136] Отметим, что вместо обнаружения нулевых спектров в нормализованном спектре с добавленным шумом, может быть реализовано устройство, в котором информация об обнуленных спектрах принимается от блоков, которые выполняют обнуление, например, блока 103 нормализации амплитуды, с шумом, добавленным в положениях обнуленных спектров
[0137] Таким образом, хотя настоящий вариант осуществления был описан так, что блок 605 генерации и добавления шума предусмотрен после первого блока 105 суммирования, вместо этого может быть реализовано устройство, в котором блок 605 генерации и добавления шума предусмотрен между блоком 603 корректировки амплитуды шумового спектра и первым блоком 105 суммирования или между блоком 401 нормализации амплитуды шума и блоком 603 корректировки амплитуды шумового спектра. В этом случае информация об обнуленных спектрах принимается от блока, который выполнял обнуление, и шум добавляется в положениях обнуленных спектров.
Седьмой вариант осуществления
[0138] Далее, конфигурация устройства 700 декодирования в соответствии с седьмым вариантом осуществления настоящего раскрытия будет описана со ссылкой на фиг. 18. Устройство 700 декодирования в соответствии с настоящим вариантом осуществления является устройством декодирования 620 в соответствии с вторым другим примером шестого варианта осуществления, к которому добавлен блок 403 повторной корректировки амплитуды, описанный в другом примере четвертого варианта осуществления. В соответствии с этим пороговое значение Th, вычисляемое в блоке 601 вычисления порогового значения, также выводится на блок 403 повторной корректировки амплитуды. Другие конфигурации являются теми же самыми, что и во втором другом примере шестого варианта осуществления, так что их описание будет опущено.
[0139] Нормализованный спектр с добавленным шумом, сгенерированный в блоке 106 декодирования расширенного диапазона, выводится на блок 403 повторной корректировки амплитуды. Операции блока 403 повторной корректировки амплитуды, в основном, те же самые, что и в другом примере четвертого варианта осуществления, так что описание ниже будет приведено главным образом в отношении второго другого примера шестого варианта осуществления. Блок 403 повторной корректировки амплитуды будет описан в блоках в соответствии с каждой функцией. Блок 403 повторной корректировки амплитуды содержит блок 701 вычисления энергии шума, блок 702 межкадрового сглаживания и блок 703 корректировки амплитуды, как иллюстрируется на фиг. 19.
[0140] Блок 701 вычисления энергии шума вычисляет энергию добавленного шумового спектра для каждого поддиапазона. Добавленный шумовой спектр может быть обнаружен и выделен с использованием порогового значения Th в соответствии с шестым вариантом осуществления. Блок 106 декодирования расширенного диапазона умножает нормализованный спектр с добавленным шумом, идентифицированный информацией запаздывания, декодированной из кодированных данных расширенного диапазона, на усиление, декодированное из тех же кодированных данных расширенного диапазона, тем самым генерируя спектр расширенного диапазона с добавленным шумом. Соответственно, значение, полученное умножением порогового значения Th согласно шестому варианту осуществления на усиление, является пороговым значением для определения шумового компонента в спектре расширенного диапазона с добавленным шумом. То есть, пороговое значение, полученное блоком 601 вычисления порогового значения, умножается на усиление, чтобы получить пороговое значение определения шумового компонента, и компоненты меньшие, чем (равные или меньшие, чем) пороговое значение определения шумового компонента, определяются как шумовой компонент в каждом поддиапазоне. Усиление кодируется для каждого поддиапазона, так что пороговое значение определения шумового компонента вычисляется для каждого поддиапазона.
[0141] Энергия шумового спектра каждого поддиапазона затем выводится на блок 702 межкадрового сглаживания. Блок 702 межкадрового сглаживания использует энергию шумового спектра для каждого поддиапазона, который был принят, чтобы выполнять обработку сглаживания, так что изменение в энергии шумовых спектров является плавным между поддиапазонами. Обработка сглаживания может выполняться с использованием известной обработки межкадрового сглаживания.
[0142] Например, обработка межкадрового сглаживания может выполняться в соответствии со следующим выражением (11):
где ESc представляет энергию шумового спектра после обработки сглаживания, Ec представляет энергию шумового спектра перед обработкой сглаживания, EScp представляет энергию шумового спектра после обработки сглаживания в предыдущем кадре, и σ представляет коэффициент сглаживания (0<σ<1). Чем ближе значение σ к 0, тем сильнее сглаживание. Приемлемым является значение примерно 0.15.
[0143] В случае, когда сигналы текущего кадра стали внезапно ослабленными по сравнению с сигналами предыдущего кадра, применение сильного сглаживания приведет к высокому уровню шума, поддерживаемому в области, где уровни сигнала должны быть ниже, что является проблематичным. Чтобы справиться с такой ситуацией, в случае, когда информация энергии поддиапазона, которая отдельно закодирована, меньше, чем энергия поддиапазона шумового спектра после обработки сглаживания в предыдущем кадре (т.е., EScp), значение σ приводится ближе к 1, чтобы ослабить обработку сглаживания. Например, в случае, когда EScp меньше, чем 80% энергии декодированного поддиапазона в текущем кадре, σ устанавливается на 0.15, чтобы выполнять сильную обработку сглаживания, в то время как в случае, когда EScp равно 80% энергии декодированного поддиапазона в текущем кадре или больше (т.е., энергия декодированного поддиапазона в текущем кадре не достаточно велика по сравнению с энергией поддиапазона сглаженного шумового спектра в предыдущем кадре), σ устанавливается на 0.8, чтобы выполнять слабую обработку сглаживания.
[0144] Блок 703 корректировки амплитуды повторно корректирует амплитуду шумового сегмента входного спектра расширенного диапазона с добавленным шумом с использованием Esc, вычисленного блоком 702 межкадрового сглаживания. Способ повторной корректировки является тем же самым, что и описанный в другом примере четвертого варианта осуществления. То есть, (√ESc/√Ec) умножается как масштабирующий коэффициент, как описано в другом примере четвертого варианта осуществления.
[0145] В случае, когда изменение энергии вследствие масштабирования велико, имеется вероятность того, что энергия полных декодированных сигналов, включая иное, чем шумовой компонент, будет заметно отклоняться от первоначальной величины. В этом случае, наличие масштабирующего коэффициента √(√ESc/√Ec) позволяет изменение в масштабирующем коэффициенте для нелинейного подавления, так что отрицательные влияния на энергию полных декодированных сигналов вследствие масштабирования можно снизить.
[0146] В соответствии с настоящим вариантом осуществления, описанным выше, шумовой компонент сигналов верхнего диапазона, образованный обработкой расширения диапазона, сглаживается во временном направлении, и выполняется обработка для подавления изменения в отношении изменения амплитуды, так что уровень шумового компонента декодированных сигналов стабилизируется, и качество изображения для прослушивания может быть улучшено. Использование этого совместно со способом генерации нормализованного спектра с добавленным шумом в соответствии с настоящим вариантом осуществления устраняет необходимость в отдельном кодировании и передаче информации определения шумового компонента, поэтому может быть реализовано эффективное добавление шумового компонента и стабилизация.
Заключение
[0147] Устройство декодирования и устройство кодирования в соответствии с настоящим раскрытием были описаны со ссылками на варианты осуществления с первого по седьмой. Устройство декодирования и устройство кодирования в соответствии с настоящим раскрытием представляют собой концепции, которые могут быть в форме полузавершенных продуктов или на уровне деталей, таких как системные платы или полупроводниковые приборы, или в форме готовых продуктов, таких как устройства терминалов или устройства базовых станций. В случае, когда устройство декодирования и устройство кодирования в соответствии с настоящим раскрытием представлены в форме полузавершенных продуктов или на уровне деталей, они могут быть доведены до уровня готовых продуктов путем комбинирования с антенной, DA/AD-преобразователем, усилителем, динамиком, микрофоном и т.д.
[0148] Блок-схемы на фиг. 1-8, фиг. 10, фиг. 14 и фиг. 16-19 представляют конфигурации специализированных аппаратных средств и операций (способов) и также включают случаи, где программы, которые исполняют операции (способ) согласно настоящему раскрытию, устанавливаются в аппаратных средствах общего назначения и исполняются процессором. Примеры электронных вычислительных средств, служащих в качестве аппаратных средств общего назначения, включают персональные компьютеры, различные типы мобильных информационных терминалов, таких как смартфоны и сотовые телефоны и т.п.
[0149] Специализированные аппаратные средства не ограничены уровнем готовых продуктов, таких как сотовые телефоны и телефоны наземных линий связи (потребительская электроника), и включают в себя таковые в форме полузавершенных продуктов или на уровне деталей, таких как системные платы, полупроводниковые приборы и т.п.
[0150] Устройство декодирования и устройство кодирования в соответствии с настоящим раскрытием применимы в устройствах, относящихся к записи, передаче и воспроизведению аудиосигналов и сигналов музыки.
Изобретение относится к средствам для кодирования и декодирования аудиосигналов. Технический результат заключается в повышении качества кодированного аудиосигнала. Разделяют первые кодированные данные, где был закодирован спектр, включающий в себя спектр нижнего диапазона аудиосигналов, и вторые кодированные данные, где был закодирован спектр верхнего диапазона, на основании первых кодированных данных. Декодируют первые кодированные данные и генерируют первый декодированный спектр. Разделяют амплитуду первого декодированного спектра на множество поддиапазонов, нормализуют спектр каждого поддиапазона наибольшим значением амплитуды первого декодированного спектра в пределах каждого поддиапазона и генерируют нормализованный спектр. Добавляют шумовой спектр к нормализованному спектру и генерируют нормализованный спектр с добавленным шумом. Декодируют вторые кодированные данные с использованием нормализованного спектра с добавленным шумом и генерируют второй спектр с добавленным шумом. 4 н. и 18 з.п. ф-лы, 19 ил.
1. Устройство декодирования, содержащее:
блок разделения, который разделяет первые кодированные данные, где был закодирован спектр, включающий в себя спектр нижнего диапазона аудиосигналов, и вторые кодированные данные, где был закодирован спектр верхнего диапазона более высокого диапазона, чем спектр нижнего диапазона, на основании первых кодированных данных;
первый блок декодирования, который декодирует первые кодированные данные и генерирует первый декодированный спектр;
первый нормализатор амплитуды, который делит амплитуду первого декодированного спектра на множество поддиапазонов, нормализует спектр каждого поддиапазона наибольшим значением амплитуды первого декодированного спектра в пределах каждого поддиапазона и генерирует нормализованный спектр;
блок суммирования, который добавляет шумовой спектр к нормализованному спектру и генерирует нормализованный спектр с добавленным шумом;
второй блок декодирования, который декодирует вторые кодированные данные, используя нормализованный спектр с добавленным шумом, и генерирует второй спектр с добавленным шумом; и
преобразователь, который выполняет преобразование во временную область в отношении спектра, сгенерированного посредством соединения спектра, основанного на первом декодированном спектре, и спектра, основанного на втором спектре с добавленным шумом.
2. Устройство декодирования по п. 1,
в котором преобразователь выполняет время-частотное преобразование в отношении спектра, основанного на связывании первого декодированного спектра с добавленным шумом, полученного добавлением шумового спектра к первому декодированному спектру, и второго спектра с добавленным шумом.
3. Устройство декодирования по п. 1,
в котором амплитуда шумового спектра основана на по меньшей мере одной из информации о распределении битов первого декодированного спектра и информации о разреженности первого декодированного спектра.
4. Устройство декодирования по п. 1, дополнительно содержащее:
второй блок корректировки амплитуды, который корректирует амплитуду нормализованного шумового спектра, полученного нормализацией шумового спектра в соответствии с по меньшей мере одной из информации о распределении битов первого декодированного спектра, информации о разреженности первого декодированного спектра и информации о разреженности нормализованного спектра,
при этом блок суммирования дополнительно добавляет скорректированный нормализованный шумовой спектр.
5. Устройство декодирования по п. 4,
в котором второй блок корректировки амплитуды выполняет корректировку на основании порогового значения спектральной интенсивности, которое разделяет наибольшее значение нормализованного шумового спектра на шумовой компонент и нешумовой компонент, причем пороговое значение вычисляется с использованием нормализованного спектра или информации о разреженности первого декодированного спектра.
6. Устройство декодирования по п. 5,
в котором первый блок корректировки корректирует амплитуду нормализованного спектра так, что наибольшее значение нормализованного шумового спектра равно или меньше, чем пороговое значение,
и в котором второй блок корректировки амплитуды корректирует амплитуду нормализованного шумового спектра относительно ненулевого контента нормализованного спектра путем удаления ненулевого контента меньшего, чем пороговое значение.
7. Устройство декодирования по п. 6,
в котором первый амплитудный нормализатор обнуляет нулевой контент нормализованного спектра на основе обнуляющего порогового значения, чтобы разделять нулевой контент и ненулевой контент нормализованного спектра, причем обнуляющее пороговое значение вычисляется с использованием порогового значения.
8. Устройство декодирования по п. 7, дополнительно содержащее:
блок добавления шума, который добавляет шумовой спектр в положение нулевого контента, который был обнулен.
9. Устройство декодирования по п. 1, дополнительно содержащее:
блок повторной корректировки амплитуды, который корректирует амплитуду шумового компонента второго спектра с добавленным шумом.
10. Устройство декодирования по п. 9, в котором блок повторной корректировки амплитуды
сглаживает изменение энергии между кадрами первого спектра с добавленным шумом с использованием энергии шумового компонента второго спектра с добавленным шумом, вычисленного на основе порогового значения, и
корректирует амплитуду шумового компонента второго спектра с добавленным шумом с использованием масштабирующего коэффициента, представляющего отношение между энергией шумового компонента и энергией шумового компонента после сглаживания.
11. Блок кодирования, содержащий:
первый блок кодирования, который кодирует спектр, включающий в себя спектр нижнего диапазона аудиосигналов, и генерирует первые кодированные данные;
нормализатор амплитуды, который делит амплитуду первого декодированного спектра, полученного декодированием первых кодированных данных, на множество поддиапазонов, нормализует спектр каждого поддиапазона наибольшим значением амплитуды первого декодированного спектра в пределах каждого поддиапазона и генерирует нормализованный спектр;
блок поиска диапазона, который выполняет поиск конкретного диапазона, где корреляция является наибольшей между нормализованным спектром с добавленным шумом, полученным путем добавления шумового спектра к нормализованному спектру, и спектром верхнего диапазона более высокого диапазона, чем спектр нижнего диапазона; и
мультиплексор, который мультиплексирует и выводит первые кодированные данные и кодированные данные, включающие в себя конкретный диапазон, поиск которого выполнялся.
12. Способ декодирования, содержащий:
разделение первых кодированных данных, где был закодирован спектр, включающий в себя спектр нижнего диапазона аудиосигналов, и вторых кодированных данных, где был закодирован спектр верхнего диапазона более высокого диапазона, чем спектр нижнего диапазона, на основании первых кодированных данных;
декодирование первых кодированных данных и генерацию первого декодированного спектра;
разделение амплитуды первого декодированного спектра на множество поддиапазонов, нормализацию спектра каждого поддиапазона наибольшим значением амплитуды первого декодированного спектра в пределах каждого поддиапазона и генерацию нормализованного спектра;
добавление шумового спектра к нормализованному спектру и генерацию нормализованного спектра с добавленным шумом;
декодирование вторых кодированных данных с использованием нормализованного спектра с добавленным шумом и генерацию второго спектра с добавленным шумом; и
выполнение преобразования во временную область в отношении спектра, сгенерированного посредством соединения спектра, основанного на первом декодированном спектре, и спектра, основанного на втором спектре с добавленным шумом.
13. Способ декодирования по п. 12,
в котором время-частотное преобразование выполняется в отношении спектра, основанного на связывании первого декодированного спектра с добавленным шумом, полученного добавлением шумового спектра к первому декодированному спектру, и второго спектра с добавленным шумом.
14. Способ декодирования по п. 12,
в котором амплитуда шумового спектра основана на по меньшей мере одной из информации о распределении битов первого декодированного спектра и информации о разреженности первого декодированного спектра.
15. Способ декодирования по п. 12, дополнительно содержащий:
корректировку амплитуды нормализованного шумового спектра, полученного нормализацией шумового спектра в соответствии с по меньшей мере одной из информации о распределении битов первого декодированного спектра, информации о разреженности первого декодированного спектра и информации о разреженности нормализованного спектра,
при этом дополнительно добавляется скорректированный нормализованный шумовой спектр.
16. Способ декодирования по п. 15,
в котором корректировка амплитуды выполняется на основании порогового значения спектральной интенсивности, которое разделяет наибольшее значение нормализованного шумового спектра на шумовой компонент и нешумовой компонент, причем пороговое значение вычисляется с использованием нормализованного спектра или информации о разреженности первого декодированного спектра.
17. Способ декодирования по п. 16,
в котором амплитуда нормализованного шумового спектра корректируется так, что наибольшее значение нормализованного шумового спектра равно или меньше, чем пороговое значение,
и в котором амплитуда нормализованного шумового спектра корректируется относительно ненулевого контента нормализованного спектра путем удаления ненулевого контента, меньшего, чем пороговое значение.
18. Способ декодирования по п. 17,
в котором нулевой контент нормализованного спектра обнуляется на основе обнуляющего порогового значения, чтобы разделять нулевой контент и ненулевой контент нормализованного спектра, причем обнуляющее пороговое значение вычисляется с использованием порогового значения.
19. Способ декодирования по п. 18, дополнительно содержащий:
добавление шумового спектра в положение нулевого контента, который был обнулен.
20. Способ декодирования по п. 12, дополнительно содержащий:
корректировку амплитуды шумового компонента второго спектра с добавленным шумом.
21. Способ декодирования по п. 20,
в котором изменение энергии сглаживается между кадрами первого спектра с добавленным шумом с использованием энергии шумового компонента второго спектра с добавленным шумом, вычисленного на основе порогового значения, и
в котором амплитуда шумового компонента второго спектра с добавленным шумом корректируется с использованием масштабирующего коэффициента, представляющего отношение между энергией шумового компонента и энергией шумового компонента после сглаживания.
22. Способ кодирования, содержащий:
кодирование спектра, включающего в себя спектр нижнего диапазона аудиосигналов, и генерацию первых кодированных данных;
разделение амплитуды первого декодированного спектра, полученного декодированием первых кодированных данных, на множество поддиапазонов, нормализацию спектра каждого поддиапазона наибольшим значением амплитуды первого декодированного спектра в пределах каждого поддиапазона и генерацию нормализованного спектра;
генерацию шумового спектра;
добавление шумового спектра к нормализованному спектру и генерацию нормализованного спектра с добавленным шумом;
поиск конкретного диапазона, где корреляция является наибольшей между нормализованным спектром с добавленным шумом, полученным путем добавления шумового спектра к нормализованному спектру, и спектром верхнего диапазона более высокого диапазона, чем спектр нижнего диапазона; и
мультиплексирование первых кодированных данных и кодированных данных, включающих в себя конкретный диапазон, поиск которого выполнялся.
JP 2002372993 A, 26.12.2002 | |||
Многоступенчатая активно-реактивная турбина | 1924 |
|
SU2013A1 |
Изложница с суживающимся книзу сечением и с вертикально перемещающимся днищем | 1924 |
|
SU2012A1 |
Многоступенчатая активно-реактивная турбина | 1924 |
|
SU2013A1 |
Многоступенчатая активно-реактивная турбина | 1924 |
|
SU2013A1 |
Многоступенчатая активно-реактивная турбина | 1924 |
|
SU2013A1 |
УСТРОЙСТВО И СПОСОБ ПРЕОБРАЗОВАНИЯ ЗВУКОВОГО СИГНАЛА В ПАРАМЕТРИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ, УСТРОЙСТВО И СПОСОБ МОДИФИКАЦИИ ПАРАМЕТРИЧЕСКОГО ПРЕДСТАВЛЕНИЯ, УСТРОЙСТВО И СПОСОБ СИНТЕЗА ПАРАМЕТРИЧЕСКОГО ПРЕДСТАВЛЕНИЯ ЗВУКОВОГО СИГНАЛА | 2009 |
|
RU2487426C2 |
Авторы
Даты
2018-07-26—Публикация
2015-02-06—Подача