ПРИТЯЗАНИЕ НА ПРИОРИТЕТ
[01] Настоящая заявка испрашивает приоритет заявки США № 14/265,693, поданной 30 апреля 2014 г., под названием ʺHIGH BAND EXCITATION SIGNAL GENERATIONʺ, содержание которой включено посредством ссылки в полном объеме.
I. ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ
[02] Настоящее изобретение, в целом, относится к генерации высокополосного сигнала возбуждения.
II. ОПИСАНИЕ УРОВНЯ ТЕХНИКИ
[03] Развитие технологии привело к появлению более компактных и более мощных вычислительных устройств. Например, в настоящее время существуют различные портативные персональные вычислительные устройства, включающие в себя беспроводные вычислительные устройства, например, портативные беспроводные телефоны, карманные персональные компьютеры (PDA), и пейджинговые устройства, которые малы, легки и легко переносятся пользователями. В частности, портативные беспроводные телефоны, например, сотовые телефоны и телефоны, работающие по интернет-протоколу (IP), могут передавать голос и пакеты данных по беспроводным сетям. Дополнительно, многие такие беспроводные телефоны включают в себя другие типы устройств, которые упомянуты здесь. Например, беспроводной телефон также может включать в себя цифровой фотоаппарат, цифровую видеокамеру, цифровое устройство записи и проигрыватель аудиофайлов.
[04] Передача голоса цифровыми методами широко распространена, в частности, применительно к дальнодействующей и цифровой радиотелефонии. При передаче речи путем дискретизации и оцифровки, скорость передачи данных порядка шестидесяти четырех килобит в секунду (кбит/с) можно использовать для достижения качества речи аналогового телефона. Методы сжатия можно использовать для уменьшения объема информации, передаваемой по каналу, при поддержании воспринимаемого качества реконструированной речи. Используя анализ речи, сопровождаемый кодированием, передачей и повторным синтезом на приемнике, можно добиться значительного снижения скорости передачи данных.
[05] Устройства для сжатия речи могут находить применение во многих областях телекоммуникаций. Например, беспроводная связь имеет большое количество применений, включающих в себя, например, бесшнуровые телефоны, пейджеры, беспроводные абонентские линии, беспроводную телефонию, например, телефонные системы сотовой и персональной службы связи (PCS), мобильную телефонию на основе интернет-протокола (IP) и спутниковые системы связи. Конкретным применением является беспроводная телефония для мобильных абонентов.
[06] Для систем беспроводной связи разработаны различные радиоинтерфейсы, включающие в себя, например, множественный доступ с частотным разделением (FDMA), множественный доступ с временным разделением (TDMA), множественный доступ с кодовым разделением (CDMA) и синхронный CDMA с временным разделением (TD-SCDMA). В связи с этим, были установлены различные внутренние и международные стандарты, включающие в себя, например, усовершенствованную службу мобильной телефонной связи (AMPS), глобальную систему мобильной связи (GSM) и стандарт Interim 95 (IS-95). Примером беспроводной телефонной системы связи является система множественного доступа с кодовым разделением (CDMA). Стандарт IS-95 и его производные, IS-95A, ANSI J-STD-008 и IS-95B (совместно именуемые здесь IS-95), распространяются Ассоциацией телекоммуникационной промышленности (TIA) и другими общеизвестными органами стандартизации для указания использования радиоинтерфейса CDMA для систем связи сотовой или PCS телефонии.
[07] Стандарт IS-95 затем развился в системы ʺ3Gʺ, например, cdma2000 и WCDMA, которые обеспечивают повышенную емкость и услуги высокоскоростной передачи пакетных данных. Две разновидности cdma2000 представлены документами IS-2000 (cdma2000 1xRTT) и IS-856 (cdma2000 1xEV-DO), выпущенными TIA. Система связи cdma2000 1xRTT обеспечивает пиковую скорость передачи данных 153 кбит/с, тогда как cdma2000 1xEV-DO система связи задает набор скоростей передачи данных, в пределах от 38,4 кбит/с до 2,4 Мбит/с. Стандарт WCDMA реализован в документах №№ 3G TS 25.211, 3G TS 25.212, 3G TS 25.213 и 3G TS 25.214 проекта партнерства третьего поколения ʺ3GPPʺ. Спецификация International Mobile Telecommunications Advanced (развитие международной мобильной связи, IMT-Advanced) устанавливает стандарты ʺ4Gʺ. Спецификация IMT-Advanced устанавливает пиковую скорость передачи данных для услуги 4G на 100 мегабитах в секунду (Мбит/с) для осуществления связи при движении с высокой скоростью (например, в поездах и автомобилях) и 1 гигабите в секунду (Гбит/с) для осуществления связи при движении с низкой скоростью (например, для пешеходов и неподвижных пользователей).
[08] Устройства, где применяются методы сжатия речи путем извлечения параметров, которые относятся к модели генерации человеческой речи, называются речевыми кодерами. Речевые кодеры могут содержать кодер и декодер. Кодер делит входной речевой сигнал на блоки времени или кадры анализа. Длительность каждого отрезка времени (или ʺкадраʺ) можно выбирать достаточно коротким, чтобы можно было ожидать, что спектральная огибающая сигнала остается относительно неподвижной. Например, длина кадра может составлять двадцать миллисекунд, что соответствует 160 выборкам при частоте дискретизации восемь килогерц (кГц), хотя можно использовать любую длину кадра или частоту дискретизации, считающуюся пригодной для конкретного применения.
[09] Кодер анализирует входной речевой кадр для извлечения определенных соответствующих параметров и затем квантует параметры в двоичное представление, например, набор битов или пакет двоичных данных. Пакеты данных передаются по каналу связи (т.е. проводному и/или беспроводному сетевому соединению) на приемник и декодер. Декодер обрабатывает пакеты данных, деквантует обработанные пакеты данных для формирования параметров и повторно синтезирует речевые кадры с использованием деквантованных параметров.
[010] Речевой кодер предназначен для сжатия оцифрованного речевого сигнала в сигнал низкой битовой скорости путем удаления естественных избыточностей, присущих речи. Цифрового сжатия можно добиться путем представления входного речевого кадра набором параметров и использования квантования для представления параметров набором битов. Если входной речевой кадр имеет количество битов Ni, и пакет данных, сформированный речевым кодером, имеет количество битов No, коэффициент сжатия, достигаемый речевым кодером, равен Cr=Ni/No. Задача состоит в сохранении высокого качества голоса декодированной речи одновременно с достижением целевого коэффициента сжатия. Рабочие характеристики речевого кодера зависят от того, (1) насколько хорошо осуществляется модель речи, или комбинация вышеописанных процессов анализа и синтеза, и (2) насколько хорошо осуществляется процесс квантования параметров при целевой битовой скорости No битов на кадр. Таким образом, целью модели речи является захват сущности речевого сигнала, или целевого качества голоса, с малым набором параметров для каждого кадра.
[011] Речевые кодеры, в целом, используют набор параметров (включающих в себя векторы) для описания речевого сигнала. Хороший набор параметров, в идеале, обеспечивает низкую системную полосу для реконструкции перцепционно точного речевого сигнала. Примерами параметров кодирования речи являются основной тон, мощность сигнала, спектральная огибающая (или форманты), амплитудные и фазовые спектры.
[012] Речевые кодеры могут быть реализованы в виде кодеров временной области, которые пытаются захватывать форму волны речи во временной области с использованием обработки с высоким разрешением по времени для кодирования малых сегментов речи (например, подкадров длительностью 5 миллисекунд (мс)) за раз. Для каждого подкадра, представление высокой точности из пространства кодовой книги находится посредством поискового алгоритма. Альтернативно, речевые кодеры могут быть реализованы в виде кодеров частотной области, которые пытаются захватывать спектр кратковременной речи входного речевого кадра с набором параметров (анализ) и используют соответствующий процесс синтеза для воссоздания формы волны речи из спектральных параметров. Квантователь параметров сохраняет параметры путем представления их сохраненными представлениями векторов кода в соответствии с известными методами квантования.
[013] Одним речевым кодером временной области является кодер линейного предсказания с кодовым возбуждением (CELP). В кодере CELP кратковременные корреляции или избыточности удаляются из речевого сигнала посредством анализа с линейным предсказанием (LP), который находит коэффициенты фильтра кратковременных формант. Применение фильтра краткосрочного прогнозирования к входному речевому кадру позволяет генерировать сигнал остатка LP, который дополнительно моделируется и квантуется параметрами фильтра долгосрочного прогнозирования и последующей стохастической кодовой книги. Таким образом, кодирование CELP делит задачу кодирования формы волны речи во временной области на отдельные задачи кодирования коэффициентов кратковременной фильтрации LP и кодирования остатка LP. Кодирование во временной области может осуществляться с фиксированной скорости (т.е. с использованием одного и того же количества битов, No, для каждого кадра) или с переменной скоростью (когда разные битовые скорости используются для кадров с разными типами содержимого). Кодеры переменной скорости пытаются использовать количество битов, необходимое для кодирования параметров до уровня, позволяющего получить целевое качество.
[014] Кодеры временной области, например, кодер CELP может опираться на большом количестве битов, N0, на кадр для сохранения точности формы волны речи во временной области. Такие кодеры могут доставлять отличное качество голоса при условии, что количество битов, No, на кадр относительно велико (например, 8 кбит/с или выше). При низких битовых скоростях (например, 4 кбит/с и ниже), кодерам временной области может не удаться сохранять высокое качество и устойчивые рабочие характеристики вследствие ограниченного количества имеющихся битов. При низких битовых скоростях, ограниченное пространство кодовой книги ограничивает способность согласования форм волны кодеров временной области, которые установлены в высокоскоростных коммерческих применениях. Поэтому, многие системы кодирования CELP, действующие при низких битовых скоростях, страдают перцепционно значительным искажением, характеризуемым как шум.
[015] Альтернативой кодерам CELP при низких битовых скоростях является кодер ʺлинейного предсказания с шумовым возбуждениемʺ (NELP), который действует примерно по таким же принципам, как кодер CELP. Кодеры NELP используют для моделирования речи фильтрованный псевдослучайный шумовой сигнал, а не кодовую книгу. Поскольку NELP использует более простую модель для кодированной речи, NELP достигает более низкой битовой скорости, чем CELP. NELP можно использовать для сжатия или представления невокализованной речи или тишины.
[016] Системы кодирования, которые работают на скоростях порядка 2,4 кбит/с, имеют, в целом, параметрическую природу. Таким образом, такие системы кодирования действуют путем передачи параметров, описывающих период основного тона и спектральную огибающую (или форманты) речевого сигнала с регулярными интервалами. Примером таких параметрических кодеров является вокодер LP.
[017] Вокодеры LP моделируют вокализованный речевой сигнал единичным импульсом на период основного тона. Этот основной метод можно дополнить включением, помимо прочего, передачи информации о спектральной огибающей. Хотя вокодеры LP обеспечивают, в целом, приемлемые рабочие характеристики, они могут вносить перцепционно значительное искажение, характеризуемое как жужжание.
[018] В последние годы появились кодеры, представляющие собой гибридами кодеров форм волны и параметрических кодеров. Примером этих гибридных кодеров является система кодирования речи на основе интерполяции формы волны-прототипа (PWI). Система кодирования речи PWI также известна как речевой кодер периода основного тона прототипа (PPP). Система кодирования речи PWI обеспечивает эффективный способ кодирования вокализованной речи. Основным принципом PWI является извлечением репрезентативного периода основного тона (формы волны-прототипа) с фиксированными интервалами, для передачи его описания, и для реконструкции речевого сигнала путем интерполирования между формами волны-прототипами. Способ PWI может действовать либо на остаточном сигнале LP, либо на речевом сигнале.
[019] В традиционных телефонных системах (например, публичных коммутируемых телефонных сетях (PSTN)), полоса сигнала ограничивается диапазоном частот от 300 герц (Гц) до 3,4 килогерц (кГц). В широкополосных (WB) применениях, например, сотовой телефонии и голосовой связи по интернет-протоколу (VoIP), полоса сигнала может охватывать диапазон частот от 50 Гц до 7 кГц. Сверхширокополосные (SWB) методы кодирования поддерживают полосу, которая доходит до около 16 кГц. Расширение полосы сигнала от узкополосной телефонии на 3,4 кГц до SWB телефонии на 16 кГц может повышать качество реконструкции, разборчивости и естественности сигнала.
[020] Методы широкополосного кодирования предусматривают кодирование и передачу более низкочастотную часть сигнала (например, от 50 Гц до 7 кГц, также именуемую ʺнизкополоснойʺ). Для повышения эффективности кодирования, более высокочастотная часть сигнала (например, от 7 кГц до 16 кГц, также именуемая ʺвысокополоснойʺ) может не полностью кодироваться и передаваться. Свойства низкополосного сигнала можно использовать для генерации высокополосного сигнала. Например, высокополосный сигнал возбуждения может генерироваться на основании низкополосного остатка с использованием нелинейной модели (например, функции абсолютного значения). Когда низкополосный остаток разреженно кодируется импульсами, высокополосный сигнал возбуждения, генерируемый из разреженно кодированного остатка, может приводить к артефактам в невокализованных областях высокой полосы.
III. СУЩНОСТЬ ИЗОБРЕТЕНИЯ
[021] Раскрыты системы и способы генерации высокополосного сигнала возбуждения. Аудиодекодер может принимать аудиосигналы, кодированные аудиокодером на передающем устройстве. Аудиодекодер может определять классификацию вокализованности (например, сильно вокализованный, слабо вокализованный, слабо невокализованный, сильно невокализованный) конкретного аудиосигнала. Например, конкретный аудиосигнал может варьироваться от сильно вокализованного (например, речевого сигнала) до сильно невокализованного (например, шумового сигнала). Аудиодекодер может управлять величиной огибающей представления входного сигнала на основании классификации вокализованности.
[022] Управление величиной огибающей может включать в себя управление характеристикой (например, формой, диапазоном частот, коэффициентом усиления и/или амплитудой) огибающей. Например, аудиодекодер может генерировать низкополосный сигнал возбуждения из кодированного аудиосигнала и может управлять формой огибающей низкополосного сигнала возбуждения на основании классификации вокализованности. Например, аудиодекодер может управлять диапазоном частот огибающей на основании частоты среза фильтра, применяемого к низкополосному сигналу возбуждения. В порядке другого примера, аудиодекодер может управлять амплитудой огибающей, формой огибающей, коэффициентом усиления огибающей или их комбинацией, путем регулировки одного или более полюсов коэффициентов кодирования с линейным предсказанием (LPC) на основании классификации вокализованности. В порядке дополнительного примера, аудиодекодер может управлять амплитудой огибающей, формой огибающей, коэффициентом усиления огибающей, или их комбинацией, путем регулировки коэффициентов фильтра на основании классификации вокализованности, где фильтр применяется к низкополосному сигналу возбуждения.
[023] Аудиодекодер может модулировать сигнал белого шума на основании управляемой величины огибающей. Например, модулированный сигнал белого шума может в большей степени соответствовать низкополосному сигналу возбуждения, когда классификация вокализованности является сильно вокализованным, чем когда классификация вокализованности является сильно невокализованным. Аудиодекодер может генерировать высокополосный сигнал возбуждения на основании модулированного сигнала белого шума. Например, аудиодекодер может расширять низкополосный сигнал возбуждения и может объединять модулированный сигнал белого шума и расширенный низкополосный сигнал для генерации высокополосного сигнала возбуждения.
[024] В конкретном варианте осуществления, способ включает в себя определение, на устройстве, классификации вокализованности входного сигнала. Входной сигнал соответствует аудиосигналу. Способ также включает в себя управление величиной огибающей представления входного сигнала на основании классификации вокализованности. Способ дополнительно включает в себя модулирование сигнала белого шума на основании управляемой величины огибающей. Способ включает в себя генерирование высокополосного сигнала возбуждения на основании модулированного сигнала белого шума.
[025] В другом конкретном варианте осуществления, устройство включает в себя классификатор вокализованности, регулятор огибающей, модулятор и выходную схему. Классификатор вокализованности выполнен с возможностью определения классификации вокализованности входного сигнала. Входной сигнал соответствует аудиосигналу. Регулятор огибающей выполнен с возможностью управления величиной огибающей представления входного сигнала на основании классификации вокализованности. Модулятор выполнен с возможностью модуляции сигнала белого шума на основании управляемой величины огибающей. Выходная схема выполнена с возможностью генерации высокополосного сигнала возбуждения на основании модулированного сигнала белого шума.
[026] В другом конкретном варианте осуществления, в компьютерно-читаемом запоминающем устройстве хранятся инструкции, которые, при выполнении, по меньшей мере, одним процессором, предписывают, по меньшей мере, одному процессору определять классификацию вокализованности входного сигнала. Инструкции, при выполнении, по меньшей мере, одним процессором, дополнительно предписывают, по меньшей мере, одному процессору управлять величиной огибающей представления входного сигнала на основании классификации вокализованности, для модуляции сигнала белого шума на основании управляемой величины огибающей, и генерировать высокополосный сигнал возбуждения на основании модулированного сигнала белого шума.
[027] Конкретные преимущества, обеспеченные, по меньшей мере, одним из раскрытых вариантов осуществления, включают в себя генерирование мягко звучащего синтезированного аудиосигнала, соответствующего невокализованному аудиосигналу. Например, синтезированный аудиосигнал, соответствующий невокализованному аудиосигналу, может иметь мало артефактов (или вовсе не иметь их). Другие аспекты, преимущества и признаки настоящего изобретения явствуют из содержания заявки, включающей в себя следующие разделы: краткое описание чертежей, подробное описание и формула изобретения.
IV. КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
[028] Фиг. 1 - схема, демонстрирующая конкретный вариант осуществления системы, включающей в себя устройство, которое способно осуществлять генерацию высокополосного сигнала возбуждения;
[029] фиг. 2 - схема, демонстрирующая конкретный вариант осуществления декодера, который способен осуществлять генерацию высокополосного сигнала возбуждения;
[030] фиг. 3 - схема, демонстрирующая конкретный вариант осуществления кодера, который способен осуществлять генерацию высокополосного сигнала возбуждения;
[031] фиг. 4 - схема, демонстрирующая конкретный вариант осуществления способа генерации высокополосного сигнала возбуждения;
[032] фиг. 5 - схема, демонстрирующая другой вариант осуществления способа генерации высокополосного сигнала возбуждения;
[033] фиг. 6 - схема, демонстрирующая другой вариант осуществления способа генерации высокополосного сигнала возбуждения;
[034] фиг. 7 - схема, демонстрирующая другой вариант осуществления способа генерации высокополосного сигнала возбуждения;
[035] фиг. 8 - блок-схема операций, демонстрирующая другой вариант осуществления способа генерации высокополосного сигнала возбуждения; и
[036] фиг. 9 - блок-схема устройства, способного осуществлять генерацию высокополосного сигнала возбуждения в соответствии с системами и способами, представленными на фиг. 1-8.
V. ПОДРОБНОЕ ОПИСАНИЕ
[037] Описанные здесь принципы могут применяться, например, в гарнитуре, телефонной трубке или другому аудио-устройству, которое выполнено с возможностью осуществления генерации высокополосного сигнала возбуждения. В отсутствие явных ограничений в этом контексте, термин ʺсигналʺ используется здесь для указания любого из его обычных смысловых значений, включающих в себя состояние ячейки памяти (или набора ячеек памяти), выраженное на проводе, шине или другой среде передачи. В отсутствие явных ограничений в этом контексте, термин ʺгенерированиеʺ используется здесь для указания любого из его обычных смысловых значений, например, вычисления или иного формирования. В отсутствие явных ограничений в этом контексте, термин ʺвычислениеʺ используется здесь для указания любого из его обычных смысловых значений, например, вычисления, оценивания, сглаживания и/или выбора из множества значений. В отсутствие явных ограничений в этом контексте, термин "получение" используется для указания любого из его обычных смысловых значений, например, вычисления, вывода, приема (например, из другого компонента, блока или устройства) и/или извлечения (например, из регистра памяти или массива элементов хранения).
[038] В отсутствие явных ограничений в этом контексте, термин "формирование" используется для указания любого из его обычных смысловых значений, например, вычисления, генерирования, и/или обеспечения. В отсутствие явных ограничений в этом контексте, термин "обеспечение" используется для указания любого из его обычных смысловых значений, например, вычисления, генерирования и/или формирования. В отсутствие явных ограничений в этом контексте, термин ʺсвязанныйʺ используется для указания прямого или непрямого электрического или физического соединения. В случае непрямого соединения, специалисту в данной области техники очевидно, что между ʺсвязаннымиʺ структурами могут существовать другие блоки или компоненты.
[039] Термин ʺконфигурацияʺ можно использовать в отношении способа, устройства и/или системы в соответствии с конкретным контекстом. Термин ʺсодержащийʺ, используемый в настоящем описании и формуле изобретения, не исключает другие элементы или операции. Термин ʺна основанииʺ (например, в выражении ʺA основано на Bʺ) используется для указания любого из его обычных смысловых значений, включающих в себя случаи (i) ʺна основании, по меньшей мереʺ (например, ʺA основано, по меньшей мере, на Bʺ) и, если это имеет смысл в конкретном контексте, (ii) ʺравныйʺ (например, ʺA равно Bʺ). В случае (i), где A основано на B, включает в себя "на основании, по меньшей мере", это может включать в себя конфигурацию, где A связано с B. Аналогично, термин ʺв ответ наʺ используется для указания любого из его обычных смысловых значений, включающих в себя ʺв ответ на, по меньшей мереʺ. Термин ʺпо меньшей мере, одинʺ используется для указания любого из его обычных смысловых значений, включающих в себя ʺодин или болееʺ. Термин ʺпо меньшей мере, дваʺ используется для указания любого из его обычных смысловых значений, включающих в себя ʺдва или болееʺ.
[040] Термины ʺустройствоʺ и ʺоборудованиеʺ используются обобщено и взаимозаменяемо, если обратное не следует из конкретного контекста. Если не указано обратное, любое раскрытие работы устройства, имеющего конкретный признак, также в явном виде призвано раскрывать способ, имеющий аналогичный признак (и наоборот), и любое раскрытие работы устройства согласно конкретной конфигурации также в явном виде призвано раскрывать способ согласно аналогичной конфигурации (и наоборот). Термины ʺспособʺ, ʺпроцессʺ, ʺпроцедураʺ и ʺметодʺ используются обобщено и взаимозаменяемо, если обратное не следует из конкретного контекста. Термины ʺэлементʺ и ʺмодульʺ можно использовать для указания части более крупной конфигурации. Любое включение со ссылкой на часть документа также следует понимать как включение определений терминов или переменных, упомянутых в части, где такие определения появляются в другом месте документа, а также на любых чертежах, упомянутых во включенной части.
[041] Используемый здесь термин ʺустройство связиʺ означает электронное устройство, которое можно использовать для передачи голоса и/или данных по сети беспроводной связи. Примеры устройств связи включают в себя сотовые телефоны, карманные персональные компьютеры (PDA), карманные устройства, гарнитуры, беспроводные модемы, портативные компьютеры, персональные компьютеры и т.д.
[042] На фиг. 1 показан конкретный вариант осуществления системы, которая включает в себя устройства, которые способны осуществлять генерацию высокополосного сигнала возбуждения, и, в целом, обозначенной 100. В конкретном варианте осуществления, один или более компонентов системы 100 могут входить в состав системы или устройства декодирования (например, в беспроводном телефоне или кодере/декодере (кодеке)), системы или устройства кодирования или обеих. В других вариантах осуществления, один или более компонентов системы 100 могут входить в состав телевизионной приставки, музыкального проигрывателя, видеопроигрывателя, увеселительного устройства, навигационного устройства, устройства связи, карманного персонального компьютера (PDA), блока данных с фиксированным местоположением или компьютера.
[043] Следует отметить, что в нижеследующем описании, различные функции, осуществляемые системой 100, показанной на фиг. 1, описаны как осуществляемые определенными компонентами или модулями. Это разделение компонентов и модулей приведено только для иллюстрации. В альтернативном варианте осуществления, функция, осуществляемая конкретным компонентом или модулем, может распределяться между множественными компонентами или модулями. Кроме того, в альтернативном варианте осуществления, два или более компонентов или модулей, показанных на фиг. 1, может быть объединено в единый компонент или модуль. Каждый компонент или модуль, представленный на фиг. 1, может быть реализован с использованием оборудования (например, устройства вентильной матрицы, программируемой пользователем (FPGA), специализированной интегральной схемы (ASIC), цифрового сигнального процессора (DSP), контроллера и т.д.), программного обеспечения (например, инструкций, исполняемых процессором), или любой их комбинации.
[044] Хотя иллюстративные варианты осуществления, изображенные на фиг. 1-9, описаны в отношении высокополосной модели, аналогичной используемой в Enhanced Variable Rate Codec - Narrowband-Wideband (EVRC-NW), один или более из иллюстративных вариантов осуществления могут использовать любую другую высокополосную модель. Следует понимать, что использование любой конкретной модели описано только в порядке примера.
[045] Система 100 включает в себя мобильное устройство 104, осуществляющее связь с первым устройством 102 через сеть 120. Мобильное устройство 104 может быть подключено к микрофону 146 или осуществлять связь с ним. Мобильное устройство 104 может включать в себя модуль 122 генерации сигнала возбуждения, высокополосный кодер 172, мультиплексор (MUX) 174, передатчик 176 или их комбинацию. Первое устройство 102 может быть подключено к громкоговорителю 142 или осуществлять связь с ним. Первое устройство 102 может включать в себя модуль 122 генерации сигнала возбуждения, подключенный к MUX 170 через высокополосный синтезатор 168. Модуль 122 генерации сигнала возбуждения может включать в себя классификатор 160 вокализованности, регулятор 162 огибающей, модулятор 164, выходную схему 166 или их комбинацию.
[046] В ходе эксплуатации, мобильное устройство 104 может принимать входной сигнал 130 (например, пользовательский речевой сигнал первого пользователя 152, невокализованный сигнал или оба). Например, первый пользователь 152 может участвовать в речевом вызове со вторым пользователем 154. Первый пользователь 152 может использовать мобильное устройство 104, и второй пользователь 154 может использовать первое устройство 102 для речевого вызова. В ходе речевого вызова, первый пользователь 152 может говорить в микрофон 146, подключенный к мобильному устройству 104. Входной сигнал 130 может соответствовать речи первого пользователя 152, фоновому шуму (например, музыке, уличному шуму, речи другого человека и т.д.) или их комбинации. Мобильное устройство 104 может принимать входной сигнал 130 через микрофон 146.
[047] В конкретном варианте осуществления, входной сигнал 130 может быть сверхширокополосным (SWB) сигналом, который включает в себя данные в диапазоне частот от приблизительно 50 герц (Гц) до приблизительно 16 килогерц (кГц). Низкополосная часть входного сигнала 130 и высокополосная часть входного сигнала 130 могут занимать неперекрывающиеся полосы частот 50 Гц - 7 кГц и 7 кГц - 16 кГц, соответственно. В альтернативном варианте осуществления, низкополосная часть и высокополосная часть могут занимать неперекрывающиеся полосы частот 50 Гц - 8 кГц и 8 кГц - 16 кГц, соответственно. В другом альтернативном варианте осуществления, низкополосная часть и высокополосная часть могут перекрываться (например, 50 Гц - 8 кГц и 7 кГц - 16 кГц, соответственно).
[048] В конкретном варианте осуществления, входной сигнал 130 может быть широкополосный (WB) сигнал, имеющий диапазон частот от приблизительно 50 Гц до приблизительно 8 кГц. В таком варианте осуществления, низкополосная часть входного сигнала 130 может соответствовать диапазону частот от приблизительно 50 Гц до приблизительно 6,4 кГц, и высокополосная часть входного сигнала 130 может соответствовать диапазону частот от приблизительно 6,4 кГц до приблизительно 8 кГц.
[049] В конкретном варианте осуществления, микрофон 146 может захватывать входной сигнал 130, и аналого-цифровой преобразователь (ADC) на мобильное устройство 104 может преобразовывать захваченный входной сигнал 130 из аналоговое формы волны в цифровую форму волны, состоящую из цифровых выборок аудиосигнала. Цифровые выборки аудиосигнала могут обрабатываться цифровым сигнальным процессором. Регулятор коэффициента усиления может регулировать коэффициент усиления (например, аналоговой формы волны или цифровой формы волны) путем увеличения или уменьшением уровня амплитуды аудиосигнала (например, аналоговой формы волны или цифровой формы волны). Регуляторы коэффициента усиления могут действовать в аналоговой или цифровой области. Например, регулятор коэффициента усиления может действовать в цифровой области и может регулировать цифровые выборки аудиосигнала, сформированные аналого-цифровым преобразователем. После регулировки коэффициента усиления, эхоподавитель может снижать любой эхо-сигнал, который может создаваться выходным сигналом громкоговорителя, поступающим в микрофон 146. Цифровые выборки аудиосигнала могут ʺсжиматьсяʺ вокодером (кодером-декодером голоса). Выход эхоподавителя может быть подключен к блокам предварительной обработки вокодера, например, фильтрам, процессорам шума, преобразователям скорости и т.д. Кодер вокодера может сжимать цифровые выборки аудиосигнала и формировать передаваемый пакет (представление сжатых битов цифровых выборок аудиосигнала). В конкретном варианте осуществления, кодер вокодера может включать в себя модуль 122 генерации сигнала возбуждения. Модуль 122 генерации сигнала возбуждения может генерировать высокополосный сигнал 186 возбуждения, как описано со ссылкой на первое устройство 102. Модуль 122 генерации сигнала возбуждения может выдавать высокополосный сигнал 186 возбуждения на высокополосный кодер 172.
[050] Высокополосный кодер 172 может кодировать высокополосный сигнал входного сигнала 130 на основании высокополосного сигнала 186 возбуждения. Например, высокополосный кодер 172 может генерировать высокополосный битовый поток 190 на основании высокополосного сигнала 186 возбуждения. Высокополосный битовый поток 190 может включать в себя информацию высокополосных параметров. Например, высокополосный битовый поток 190 может включать в себя, по меньшей мере, одно из высокополосных коэффициентов кодирования с линейным предсказанием (LPC), высокополосных линейных спектральных частот (LSF), высокополосных линейных спектральных пар (LSP), формы коэффициента усиления (например, временных параметров коэффициента усиления, соответствующих подкадрам конкретного кадра), кадра коэффициента усиления (например, параметров коэффициента усиления, соответствующих отношению энергии верхней полосы к нижней полосе для конкретного кадра), или других параметров, соответствующих высокополосной части входного сигнала 130. В конкретном варианте осуществления, высокополосный кодер 172 может определять высокополосные коэффициенты LPC с использованием, по меньшей мере, одного из векторного квантователя, скрытой марковской модели (HMM) или модели смеси нормальных распределений (GMM). Высокополосный кодер 172 может определять высокополосные LSF, высокополосные LSP или и те, и другие, на основании коэффициентов LPC.
[051] Высокополосный кодер 172 может генерировать информацию высокополосных параметров на основании высокополосного сигнала входного сигнала 130. Например, декодер мобильного устройства 104 может эмулировать декодер первого устройства 102. Декодер мобильного устройства 104 может генерировать синтезированный аудиосигнал на основании высокополосного сигнала 186 возбуждения, как описано со ссылкой на первое устройство 102. Высокополосный кодер 172 может генерировать значения коэффициента усиления (например, форму коэффициента усиления, кадр коэффициента усиления или оба) на основании сравнения синтезированного аудиосигнала и входного сигнала 130. Например, значения коэффициента усиления может соответствовать разности между синтезированным аудиосигналом и входным сигналом 130. Высокополосный кодер 172 может выдавать высокополосный битовый поток 190 на MUX 174.
[052] MUX 174 может объединять высокополосный битовый поток 190 с низкополосным битовым потоком для генерации битового потока 132. Низкополосный кодер мобильного устройства 104 может генерировать низкополосный битовый поток на основании низкополосного сигнала входного сигнала 130. Низкополосный битовый поток может включать в себя информацию низкополосных параметров (например, низкополосные коэффициенты LPC, низкополосные LSF или и те, и другие) и низкополосный сигнал возбуждения (например, низкополосный остаток входного сигнала 130). Передаваемый пакет может соответствовать битовому потоку 132.
[053] Передаваемый пакет может сохраняться в памяти, которая может совместно использоваться с процессором мобильного устройства 104. Процессором может быть управляющий процессор, который осуществляет связь с цифровым сигнальным процессором. Мобильное устройство 104 может передавать битовый поток 132 на первое устройство 102 через сеть 120. Например, передатчик 176 может модулировать некоторую форму (другая информация может присоединяться к передаваемому пакету) передаваемого пакета и отправлять модулированную информацию по радио через антенну.
[054] Модуль 122 генерации сигнала возбуждения первого устройства 102 может принимать битовый поток 132. Например, антенна первого устройства 102 может принимать некоторую форму входных пакетов, которые содержат передаваемый пакет. Битовый поток 132 может соответствовать кадрам аудиосигнала, кодированного в режиме импульсно-кодовой модуляции (ИКМ). Например, аналого-цифровой преобразователь (ADC) на первом устройстве 102 может преобразовывать битовый поток 132 из аналогового сигнала в цифровой ИКМ-сигнал, имеющий множественные кадры.
[055] Декодер вокодера на первом устройстве 102 может снимать сжатие передаваемого пакета. Форма волны со снятым сжатием (или цифровой ИКМ-сигнал) может именоваться реконструированными выборками аудиосигнала. Реконструированные выборки аудиосигнала могут подвергаться последующей обработке блоками последующей обработки вокодера и могут использоваться эхоподавителем для удаления эха. Для наглядности, декодер вокодера и блоки последующей обработки вокодера можно именовать модулем декодера вокодера. В некоторых конфигурациях, выходной сигнал эхоподавителя может обрабатываться модулем 122 генерации сигнала возбуждения. Альтернативно, в других конфигурациях, выходной сигнал модуля декодера вокодера может обрабатываться модулем 122 генерации сигнала возбуждения.
[056] Модуль 122 генерации сигнала возбуждения может извлекать из битового потока 132 информацию низкополосных параметров, низкополосный сигнал возбуждения и информацию высокополосных параметров. Классификатор 160 вокализованности может определять классификацию 180 вокализованности (например, значение от 0,0 до 1,0), указывающую вокализованный/невокализованный характер (например, сильно вокализованный, слабо вокализованный, слабо невокализованный или сильно невокализованный) входного сигнала 130, как описано со ссылкой на фиг. 2. Классификатор 160 вокализованности может выдавать классификацию 180 вокализованности на регулятор 162 огибающей.
[057] Регулятор 162 огибающей может определять огибающую представления входного сигнала 130. Огибающая может быть огибающей, изменяющейся со временем. Например, огибающая может обновляться больше, чем один раз за кадр входного сигнала 130. В порядке другого примера, огибающая может обновляться всякий раз, когда регулятор 162 огибающей принимает каждую выборку входного сигнала 130. Степень изменения формы огибающей может быть больше, когда классификация 180 вокализованности соответствует сильно вокализованному, чем когда классификация вокализованности соответствует сильно невокализованному. Представление входного сигнала 130 может включать в себя низкополосный сигнал возбуждения входного сигнала 130 (или кодированной версии входного сигнала 130), высокополосный сигнал возбуждения входного сигнала 130 (или кодированной версии входного сигнала 130) или гармонически расширенный сигнал возбуждения. Например, модуль 122 генерации сигнала возбуждения может генерировать гармонически расширенный сигнал возбуждения путем расширения низкополосного сигнала возбуждения входного сигнала 130 (или кодированной версии входного сигнала 130).
[058] Регулятор 162 огибающей может управлять величиной огибающей на основании классификации 180 вокализованности, как описано со ссылкой на фиг. 4-7. Регулятор 162 огибающей может управлять величиной огибающей путем управления характеристикой (например, формой, амплитудой, коэффициентом усиления и/или диапазоном частот) огибающей. Например, регулятор 162 огибающей может управлять диапазоном частот огибающей на основании частоты среза фильтра, как описано со ссылкой на фиг. 4. Частота среза может определяться на основании классификации 180 вокализованности.
[059] В порядке другого примера, регулятор 162 огибающей может управлять формой огибающей, амплитудой огибающей, коэффициентом усиления огибающей или их комбинацией, путем регулировки одного или более полюсов высокополосных коэффициентов кодирования с линейным предсказанием (LPC) на основании классификации 180 вокализованности, как описано со ссылкой на фиг. 5. В порядке дополнительного примера, регулятор 162 огибающей может управлять формой огибающей, амплитудой огибающей, коэффициентом усиления огибающей или их комбинацией, путем регулировки коэффициентов фильтра на основании классификации 180 вокализованности, как описано со ссылкой на фиг. 6. Управление характеристикой огибающей может осуществляться в области преобразования (например, в частотной области) или во временной области, как описано со ссылкой на фиг. 4-6.
[060] Регулятор 162 огибающей может выдавать огибающую 182 сигнала на модулятор 164. Огибающая 182 сигнала может соответствовать управляемой величине огибающей представления входного сигнала 130.
[061] Модулятор 164 может использовать огибающую 182 сигнала для модуляции белого шума 156 для генерации модулированного белого шума 184. Модулятор 164 может выдавать модулированный белый шум 184 на выходную схему 166.
[062] Выходная схема 166 может генерировать высокополосный сигнал 186 возбуждения на основании модулированного белого шума 184. Например, выходная схема 166 может объединять модулированный белый шум 184 с другим сигналом для генерации высокополосного сигнала 186 возбуждения. В конкретном варианте осуществления, другой сигнал может соответствовать расширенному сигналу, генерируемому на основании низкополосного сигнала возбуждения. Например, выходная схема 166 может генерировать расширенный сигнал посредством повышающей дискретизации низкополосного сигнала возбуждения, применения функции абсолютного значения к сигналу, дискретизированному с повышением, понижающей дискретизации результата применения функции абсолютного значения и использования адаптивного приближения к белому шуму для уплощения спектра сигнала, дискретизированного с понижением, с помощью фильтра линейного предсказания (например, фильтра линейного предсказания четвертого порядка). В конкретном варианте осуществления, выходная схема 166 может масштабировать модулированный белый шум 184 и другой сигнал на основании параметра гармоничности, как описано со ссылкой на фиг. 4-7.
[063] В конкретном варианте осуществления, выходная схема 166 может объединять первое отношение модулированного белого шума со вторым отношением немодулированного белого шума для генерации масштабированного белого шума, где первое отношение и второе отношение определяются на основании классификации 180 вокализованности, как описано со ссылкой на фиг. 7. В этом варианте осуществления, выходная схема 166 может объединять масштабированный белый шум с другим сигналом для генерации высокополосного сигнала 186 возбуждения. Выходная схема 166 может выдавать высокополосный сигнал 186 возбуждения на высокополосный синтезатор 168.
[064] Высокополосный синтезатор 168 может генерировать синтезированный высокополосный сигнал 188 на основании высокополосного сигнала 186 возбуждения. Например, высокополосный синтезатор 168 может моделировать и/или декодировать информацию высокополосных параметров на основании конкретной высокополосной модели и может использовать высокополосный сигнал 186 возбуждения для генерации синтезированного высокополосного сигнала 188. Высокополосный синтезатор 168 может выдавать синтезированный высокополосный сигнал 188 на MUX 170.
[065] Низкополосный декодер первого устройства 102 может генерировать синтезированный низкополосный сигнал. Например, низкополосный декодер может декодировать и/или моделировать информацию низкополосных параметров на основании конкретной низкополосной модели и может использовать низкополосный сигнал возбуждения для генерации синтезированного низкополосного сигнала. MUX 170 может объединять синтезированный высокополосный сигнал 188 и синтезированный низкополосный сигнал для генерации выходного сигнала 116 (например, декодированного аудиосигнала).
[066] Выходной сигнал 116 может усиливаться или подавляться регулятором коэффициента усиления. Первое устройство 102 может выдавать выходной сигнал 116, через громкоговоритель 142, второму пользователю 154. Например, выходной сигнал регулятора коэффициента усиления может преобразовываться из цифрового сигнала в аналоговый сигнал цифроаналоговым преобразователем и воспроизводиться через громкоговоритель 142.
[067] Таким образом, система 100 позволяет генерировать ʺмягкоʺ звучащий синтезированный сигнал, когда синтезированный аудиосигнал соответствует невокализованному (или сильно невокализованному) входному сигналу. Синтезированный высокополосный сигнал может генерироваться с использованием шумового сигнала, модулированного на основании классификации вокализованности входного сигнала. Модулированный шумовой сигнал может соответствовать в большей степени входному сигналу, когда входной сигнал является сильно вокализованным, чем когда входной сигнал является сильно невокализованным. В конкретном варианте осуществления, синтезированный высокополосный сигнал может иметь сниженную разреженность или вовсе не иметь ее, когда входной сигнал является сильно невокализованным, что дает более плавный (например, имеющий меньше артефактов) синтезированный аудиосигнал.
[068] На фиг. 2 представлен конкретный вариант осуществления декодера, который способен осуществлять генерацию высокополосного сигнала возбуждения и, в целом, обозначен 200. В конкретном варианте осуществления, декодер 200 может соответствовать, или входить в состав, системы 100, показанной на фиг. 1. Например, декодер 200 может входить в состав первого устройства 102, мобильного устройства 104 или обоих. Декодер 200 может иллюстрировать декодирование кодированного аудиосигнала на принимающем устройстве (например, первом устройстве 102).
[069] Декодер 200 включает в себя демультиплексор (DEMUX) 202, подключенный к низкополосному синтезатору 204, генератор 208 коэффициентов вокализованности и высокополосный синтезатор 168. Низкополосный синтезатор 204 и генератор 208 коэффициентов вокализованности может быть подключен к высокополосному синтезатору 168 через генератор 222 сигнала возбуждения. В конкретном варианте осуществления, генератор 208 коэффициентов вокализованности может соответствовать классификатору 160 вокализованности, показанному на фиг. 1. Генератор 222 сигнала возбуждения может быть конкретным вариантом осуществления модуля 122 генерации сигнала возбуждения, показанного на фиг. 1. Например, генератор 222 сигнала возбуждения может включать в себя регулятор 162 огибающей, модулятор 164, выходную схему 166, классификатор 160 вокализованности или их комбинацию. Низкополосный синтезатор 204 и высокополосный синтезатор 168 могут быть подключены к MUX 170.
[070] В ходе эксплуатации, DEMUX 202 может принимать битовый поток 132. Битовый поток 132 может соответствовать кадрам аудиосигнала, кодированного в режиме импульсно-кодовой модуляции (ИКМ). Например, аналого-цифровой преобразователь (ADC) на первом устройстве 102 может преобразовывать битовый поток 132 из аналогового сигнала в цифровой ИКМ-сигнал, имеющий множественные кадры. DEMUX 202 может генерировать низкополосную часть битового потока 232 и высокополосную часть битового потока 218 из битового потока 132. DEMUX 202 может выдавать низкополосную часть битового потока 232 на низкополосный синтезатор 204 и может выдавать высокополосную часть битового потока 218 на высокополосный синтезатор 168.
[071] Низкополосный синтезатор 204 может извлекать и/или декодировать один или более параметров 242 (например, информацию низкополосных параметров входного сигнала 130) и низкополосный сигнал 244 возбуждения (например, низкополосный остаток входного сигнала 130) из низкополосной части битового потока 232. В конкретном варианте осуществления, низкополосный синтезатор 204 может извлекать параметр 246 гармоничности из низкополосной части битового потока 232.
[072] Параметр 246 гармоничности может включаться в низкополосную часть битового потока 232 в ходе кодирования битового потока 232 и может соответствовать отношению энергии гармоник к энергии шума в верхней полосе входного сигнала 130. Низкополосный синтезатор 204 может определять параметр 246 гармоничности на основании коэффициента усиления основного тона значение. Низкополосный синтезатор 204 может определять значение коэффициента усиления основного тона на основании параметров 242. В конкретном варианте осуществления, низкополосный синтезатор 204 может извлекать параметр 246 гармоничности из низкополосной части битового потока 232. Например, мобильное устройство 104 может включать параметр 246 гармоничности в битовый поток 132, как описано со ссылкой на фиг. 3.
[073] Низкополосный синтезатор 204 может генерировать синтезированный низкополосный сигнал 234 на основании параметров 242 и низкополосного сигнала 244 возбуждения с использованием конкретной низкополосной модели. Низкополосный синтезатор 204 может выдавать синтезированный низкополосный сигнал 234 на MUX 170.
[074] Генератор 208 коэффициентов вокализованности может принимать параметры 242 от низкополосного синтезатора 204. Генератор 208 коэффициентов вокализованности может генерировать коэффициент 236 вокализованности (например, значение от 0,0 до 1,0) на основании параметров 242, предыдущего решения по вокализованности, одного или более других факторов или их комбинации. Коэффициент 236 вокализованности может указывать вокализованный/невокализованный характер (например, сильно вокализованный, слабо вокализованный, слабо невокализованный или сильно невокализованный) входного сигнала 130. Параметры 242 могут включать в себя частоту пересечения нуля низкополосного сигнала входного сигнала 130, первый коэффициент отражения, отношение энергии вклада адаптивной кодовой книги в низкополосное возбуждение к энергии сумму вкладов адаптивной кодовой книги и фиксированной кодовой книги в низкополосное возбуждение, коэффициент усиления основного тона низкополосного сигнала входного сигнала 130, или их комбинация. Генератор 208 коэффициентов вокализованности может определять коэффициент 236 вокализованности на основании уравнения 1.
коэффициент вокализованности=∑ai*pi+c, (уравнение 1)
где i ∈{0, ..., Μ-1}, ai и c - весовые коэффициенты, pi соответствует конкретному измеренному параметру сигнала, и M соответствует количеству параметров, используемому при определении коэффициента вокализованности.
[075] В иллюстративном варианте осуществления, коэффициент вокализованности=-0,4231*ZCR+0,2712*FR+0,0458*ACB_to_excitation+0,1849*PG+0,0138*prev_voicing_decision+0,0611, где ZCR соответствует частоте пересечения нуля, FR соответствует первому коэффициенту отражения, ACB_to_excitation соответствует отношению энергии вклада адаптивной кодовой книги в низкополосное возбуждение к энергии сумму вкладов адаптивной кодовой книги и фиксированной кодовой книги в низкополосное возбуждение, PG соответствует коэффициенту усиления основного тона, и previous_voicing_decision соответствует другому коэффициенту вокализованности, ранее вычисленному для другого кадра. В конкретном варианте осуществления, генератор 208 коэффициентов вокализованности может использовать более высокий порог для классификации кадра как невокализованного, а не как вокализованного. Например, генератор 208 коэффициентов вокализованности может классифицировать кадр как невокализованный, если предыдущий кадр был классифицирован как невокализованный, и кадр имеет значение вокализованности, которое удовлетворяет первому порогу (например, низкому порогу). Генератор 208 коэффициентов вокализованности может определять значение вокализованности на основании частоты пересечения нуля низкополосного сигнала входного сигнала 130, первого коэффициента отражения, отношения энергии вклада адаптивной кодовой книги в низкополосное возбуждение к энергии суммы вкладов адаптивной кодовой книги и фиксированной кодовой книги в низкополосное возбуждение, коэффициента усиления основного тона низкополосного сигнала входного сигнала 130 или их комбинации. Альтернативно, генератор 208 коэффициентов вокализованности может классифицировать кадр как невокализованный, если значение вокализованности кадра удовлетворяет второму порогу (например, очень низкому порогу). В конкретном варианте осуществления, коэффициент 236 вокализованности может соответствовать классификации 180 вокализованности, показанной на фиг. 1.
[076] Генератор 222 сигнала возбуждения может принимать низкополосный сигнал 244 возбуждения и параметр 246 гармоничности от низкополосного синтезатора 204 и может принимать коэффициент 236 вокализованности от генератора 208 коэффициентов вокализованности. Генератор 222 сигнала возбуждения может генерировать высокополосный сигнал 186 возбуждения на основании низкополосного сигнала 244 возбуждения, параметр 246 гармоничности и коэффициент 236 вокализованности, как описано со ссылкой на фиг. 1 и 4-7. Например, регулятор 162 огибающей может управлять величиной огибающей низкополосного сигнала 244 возбуждения на основании коэффициента 236 вокализованности, как описано со ссылкой на фиг. 1 и 4-7. В конкретном варианте осуществления, огибающая 182 сигнала может соответствовать управляемой величине огибающей. Регулятор 162 огибающей может выдавать огибающую 182 сигнала на модулятор 164.
[077] Модулятор 164 может модулировать белый шум 156 с использованием огибающей 182 сигнала для генерации модулированного белого шума 184, как описано со ссылкой на фиг. 1 и 4-7. Модулятор 164 может выдавать модулированный белый шум 184 на выходную схему 166.
[078] Выходная схема 166 может генерировать высокополосный сигнал 186 возбуждения путем объединения модулированного белого шума 184 и другого сигнала, как описано со ссылкой на фиг. 1 и 4-7. В конкретном варианте осуществления, выходная схема 166 может объединять модулированный белый шум 184 и другой сигнал на основании параметра 246 гармоничности, как описано со ссылкой на фиг. 4-7.
[079] Выходная схема 166 может выдавать высокополосный сигнал 186 возбуждения на высокополосный синтезатор 168. Высокополосный синтезатор 168 может выдавать синтезированный высокополосный сигнал 188 на MUX 170 на основании высокополосного сигнала 186 возбуждения и высокополосной части битового потока 218. Например, высокополосный синтезатор 168 может извлекать высокополосные параметры входного сигнала 130 из высокополосной части битового потока 218. Высокополосный синтезатор 168 может использовать высокополосные параметры и высокополосный сигнал 186 возбуждения для генерации синтезированного высокополосного сигнала 188 на основании конкретной высокополосной модели. В конкретном варианте осуществления, MUX 170 может объединять синтезированный низкополосный сигнал 234 и синтезированный высокополосный сигнал 188 для генерации выходного сигнала 116.
[080] Таким образом, декодер 200, показанный на фиг. 2, позволяет генерировать ʺмягкоʺ звучащий синтезированный сигнал, когда синтезированный аудиосигнал соответствует невокализованному (или сильно невокализованному) входному сигналу. Синтезированный высокополосный сигнал может генерироваться с использованием шумового сигнала, модулированного на основании классификации вокализованности входного сигнала. Модулированный шумовой сигнал может соответствовать в большей степени входному сигналу, когда входной сигнал является сильно вокализованным, чем когда входной сигнал является сильно невокализованным. В конкретном варианте осуществления, синтезированный высокополосный сигнал может иметь сниженную разреженность или вовсе не иметь ее, когда входной сигнал является сильно невокализованным, что дает более плавный (например, имеющий меньше артефактов) синтезированный аудиосигнал. Кроме того, определение классификации вокализованности (или коэффициента вокализованности) на основании предыдущего решения по вокализованности позволяет ослаблять эффекты неправильной классификации кадра и может приводить к более плавному переходу между вокализованным и невокализованным кадрами.
[081] На фиг. 3 представлен конкретный вариант осуществления кодера, который способен осуществлять генерацию высокополосного сигнала возбуждения и, в целом, обозначен 300. В конкретном варианте осуществления, кодер 300 может соответствовать, или входить в состав, системы 100, показанной на фиг. 1. Например, кодер 300 может входить в состав первого устройства 102, мобильного устройства 104 или обоих. Кодер 300 может иллюстрировать кодирование аудиосигнала на передающем устройстве (например, мобильном устройстве 104).
[082] Кодер 300 включает в себя набор 302 фильтров, подключенный к низкополосному кодеру 304, генератор 208 коэффициентов вокализованности и высокополосный кодер 172. Низкополосный кодер 304 может быть подключен к MUX 174. Низкополосный кодер 304 и генератор 208 коэффициентов вокализованности могут быть подключены к высокополосному кодеру 172 через генератор 222 сигнала возбуждения. Высокополосный кодер 172 может быть подключен к MUX 174.
[083] В ходе эксплуатации, набор 302 фильтров может принимать входной сигнал 130. Например, входной сигнал 130 может приниматься мобильным устройством 104, показанным на фиг. 1, через микрофон 146. Набор 302 фильтров может разделять входной сигнал 130 на множественные сигналы, включающие в себя низкополосный сигнал 334 и высокополосный сигнал 340. Например, набор 302 фильтров может генерировать низкополосный сигнал 334 с использованием фильтра низких частот, соответствующего более низкой подполосе частот (например, 50 Гц - 7 кГц) входного сигнала 130, и может генерировать высокополосный сигнал 340 с использованием фильтра высоких частот, соответствующего более высокой подполосе частот (например, 7 кГц - 16 кГц) входного сигнала 130. Набор 302 фильтров может выдавать низкополосный сигнал 334 на низкополосный кодер 304 и может выдавать высокополосный сигнал 340 на высокополосный кодер 172.
[084] Низкополосный кодер 304 может генерировать параметры 242 (например, информацию низкополосных параметров) и низкополосный сигнал 244 возбуждения на основании низкополосного сигнала 334. Например, параметры 242 могут включать в себя низкополосные коэффициенты LPC, низкополосные LSF, низкополосные линейные спектральные пары (LSP) или их комбинацию. Низкополосный сигнал 244 возбуждения может соответствовать низкополосному остаточному сигналу. Низкополосный кодер 304 может генерировать параметры 242 и низкополосный сигнал 244 возбуждения на основании конкретной низкополосной модели (например, конкретной модели линейное предсказание). Например, низкополосный кодер 304 может генерировать параметры 242 (например, коэффициенты фильтрации, соответствующие формантам) низкополосного сигнала 334, может обратно фильтровать низкополосный сигнал 334 на основании параметров 242, и может вычитать обратно фильтрованный сигнал из низкополосного сигнала 334 для генерации низкополосного сигнала 244 возбуждения (например, низкополосного остаточного сигнала низкополосного сигнала 334). Низкополосный кодер 304 может генерировать низкополосный битовый поток 342, включающий в себя параметры 242 и низкополосный сигнал 244 возбуждения. В конкретном варианте осуществления, низкополосный битовый поток 342 может включать в себя параметр 246 гармоничности. Например, низкополосный кодер 304 может определять параметр 246 гармоничности, как описано со ссылкой на низкополосный синтезатор 204, показанный на фиг. 2.
[085] Низкополосный кодер 304 может выдавать параметры 242 на генератор 208 коэффициентов вокализованности и может выдавать низкополосный сигнал 244 возбуждения и параметр 246 гармоничности на генератор 222 сигнала возбуждения. Генератор 208 коэффициентов вокализованности может определять коэффициент 236 вокализованности на основании параметров 242, как описано со ссылкой на фиг. 2. Генератор 222 сигнала возбуждения может определять высокополосный сигнал 186 возбуждения на основании низкополосного сигнала 244 возбуждения, параметра 246 гармоничности и коэффициента 236 вокализованности, как описано со ссылкой на фиг. 2 и 4-7.
[086] Генератор 222 сигнала возбуждения может выдавать высокополосный сигнал 186 возбуждения на высокополосный кодер 172. Высокополосный кодер 172 может генерировать высокополосный битовый поток 190 на основании высокополосного сигнала 340 и высокополосного сигнала 186 возбуждения, как описано со ссылкой на фиг. 1. Высокополосный кодер 172 может выдавать высокополосный битовый поток 190 на MUX 174. MUX 174 может объединять низкополосный битовый поток 342 и высокополосный битовый поток 190 для генерации битового потока 132.
[087] Таким образом, кодер 300 позволяет эмулировать на принимающем устройстве декодер, который генерирует синтезированный аудиосигнал с использованием шумового сигнала, модулированного на основании классификации вокализованности входного сигнала. Кодер 300 может генерировать высокополосные параметры (например, значения коэффициента усиления), которые используются для генерации синтезированного аудиосигнала, хорошо аппроксимирующего входной сигнал 130.
[088] На фиг. 4-7 показаны схемы, демонстрирующие конкретные варианты осуществления способов генерации высокополосного сигнала возбуждения. Каждый из способов, представленных на фиг. 4-7 может осуществляться одним или более компонентами систем 100-300, показанных на фиг. 1-3. Например, каждый из способов, представленных на фиг. 4-7, может осуществляться одним или более компонентами высокополосного модуля 122 генерации сигнала возбуждения, показанного на фиг. 1, генератора 222 сигнала возбуждения, показанного на фиг. 2 и/или фиг. 3, генератора 208 коэффициентов вокализованности, показанного на фиг. 2, или их комбинации. Фиг. 4-7 иллюстрируют альтернативные варианты осуществления способов генерирования высокополосного сигнала возбуждения, представленного в области преобразования, во временной области, или либо в области преобразования, либо во временной области.
[089] На фиг. 4 показана схема конкретного варианта осуществления способа генерации высокополосного сигнала возбуждения, в целом, обозначенного 400. Способ 400 может соответствовать генерированию высокополосного сигнала возбуждения, представленного либо в области преобразования, либо во временной области.
[090] Способ 400 включает в себя определение коэффициента вокализованности, на этапе 404. Например, генератор 208 коэффициентов вокализованности, показанный на фиг. 2, может определять коэффициент 236 вокализованности на основании репрезентативного сигнала 422. В конкретном варианте осуществления, генератор 208 коэффициентов вокализованности может определять коэффициент 236 вокализованности на основании одного или более других параметров сигнала. В конкретном варианте осуществления, несколько параметров сигнала могут работать совместно для определения коэффициента 236 вокализованности. Например, генератор 208 коэффициентов вокализованности может определять коэффициент 236 вокализованности на основании низкополосной части битового потока 232 (или низкополосного сигнала 334, показанного на фиг. 3), параметров 242, предыдущего решения по вокализованности, одного или более других факторов или их комбинации, как описано со ссылкой на фиг. 2-3. Репрезентативный сигнал 422 может включать в себя низкополосную часть битового потока 232, низкополосный сигнал 334 или расширенный сигнал, генерируемый путем расширения низкополосного сигнала 244 возбуждения. Репрезентативный сигнал 422 может быть представлен в области преобразования (например, частотной) или во временной области. Например, модуль 122 генерации сигнала возбуждения может генерировать репрезентативный сигнал 422 путем применения преобразования (например, преобразования Фурье) к входному сигналу 130, битовому потоку 132, показанному на фиг. 1, низкополосной части битового потока 232, низкополосному сигналу 334, расширенному сигналу, генерируемому путем расширения низкополосного сигнала 244 возбуждения, показанному на фиг. 2, или их комбинации.
[091] Способ 400 также включает в себя вычисление частоты среза фильтра низких частот (LPF), на этапе 408, и управление величиной огибающей сигнала, на этапе 410. Например, регулятор 162 огибающей, показанный на фиг. 1, может вычислять частоту 426 среза LPF на основании коэффициента 236 вокализованности. Если коэффициент 236 вокализованности указывает сильно вокализованный аудиосигнал, частота 426 среза LPF может быть выше, указывая более высокое влияние гармонической составляющей временной огибающей. Когда коэффициент 236 вокализованности указывает сильно невокализованный аудиосигнал, частота 426 среза LPF может быть ниже, что соответствует более низкому (или отсутствующему) влиянию гармонической составляющей временной огибающей.
[092] Регулятор 162 огибающей может управлять величиной огибающей 182 сигнала путем управления характеристикой (например, диапазоном частот) огибающей 182 сигнала. Например, регулятор 162 огибающей может управлять характеристикой огибающей 182 сигнала путем применения фильтра 450 низких частот к репрезентативному сигналу 422. Частота среза фильтра 450 низких частот может быть, по существу, равна частоте 426 среза LPF. Регулятор 162 огибающей может управлять диапазоном частот огибающей 182 сигнала путем отслеживания временной огибающей репрезентативного сигнала 422 на основании частоты 426 среза LPF. Например, фильтр 450 низких частот может фильтровать репрезентативный сигнал 422 таким образом, что диапазон частот фильтрованного сигнала определяется частотой 426 среза LPF. Для иллюстрации, диапазон частот фильтрованного сигнала может быть ниже частоты 426 среза LPF. В конкретном варианте осуществления, амплитуда фильтрованного сигнала может совпадать с амплитудой репрезентативного сигнала 422 ниже частоты 426 среза LPF и может быть низкой (например, по существу, равной 0) выше частоты 426 среза LPF.
[093] График 470 демонстрирует исходную спектральную форму 482. Исходная спектральная форма 482 может представлять огибающую 182 сигнала репрезентативного сигнала 422. Первая спектральная форма 484 может соответствовать фильтрованному сигналу, генерируемому путем применения фильтра, имеющего частоту 426 среза LPF к репрезентативному сигналу 422.
[094] Частота 426 среза LPF может определять скорость отслеживания. Например, временная огибающая может отслеживаться быстрее (например, чаще обновляться), когда коэффициент 236 вокализованности указывает вокализованный, чем когда коэффициент 236 вокализованности указывает невокализованный. В конкретном варианте осуществления, регулятор 162 огибающей может управлять характеристикой огибающей 182 сигнала во временной области. Например, регулятор 162 огибающей может управлять характеристикой огибающей 182 сигнала для каждой выборки. В альтернативном варианте осуществления, регулятор 162 огибающей может управлять характеристикой огибающей 182 сигнала, представленной в области преобразования. Например, регулятор 162 огибающей может управлять характеристикой огибающей 182 сигнала путем отслеживания спектральной формы на основании скорости отслеживания. Регулятор 162 огибающей может выдавать огибающую 182 сигнала на модулятор 164, показанный на фиг. 1.
[095] Способ 400 дополнительно включает в себя умножение огибающей 182 сигнала на белый шум 156, на этапе 412. Например, модулятор 164, показанный на фиг. 1, может использовать огибающую 182 сигнала для модуляции белого шума 156 для генерации модулированного белого шума 184. Огибающая 182 сигнала может модулировать белый шум 156, представленный в области преобразования или временной области.
[096] Способ 400 также включает в себя принятие решения на смешивание, на этапе 406. Например, модулятор 164, показанный на фиг. 1, может определять первый коэффициент усиления (например, коэффициент 434 усиления шума), подлежащий применению к модулированному белому шуму 184, и второй коэффициент усиления (например, коэффициент 436 усиления гармоник), подлежащий применению к репрезентативному сигналу 422 на основании параметра 246 гармоничности и коэффициента 236 вокализованности. Например, коэффициент 434 усиления шума (например, между 0 и 1) и коэффициент 436 усиления гармоник можно вычислять для согласования отношения энергии гармоник к энергии шума, указанного параметром 246 гармоничности. Модулятор 164 может увеличивать коэффициент 434 усиления шума, когда коэффициент 236 вокализованности указывает сильно невокализованный, и может снижать коэффициент 434 усиления шума, когда коэффициент 236 вокализованности указывает сильно вокализованный. В конкретном варианте осуществления, модулятор 164 может определять коэффициент 436 усиления гармоник на основании коэффициента 434 усиления шума. В конкретном варианте осуществления,
[097] Способ 400 дополнительно включает в себя умножение модулированного белого шума 184 и коэффициента 434 усиления шума, на этапе 414. Например, выходная схема 166, показанная на фиг. 1, может генерировать масштабированный модулированный белый шум 438 путем применения коэффициента 434 усиления шума к модулированному белому шуму 184.
[098] Способ 400 также включает в себя умножение репрезентативного сигнала 422 и коэффициента 436 усиления гармоник, на этапе 416. Например, выходная схема 166, показанная на фиг. 1, может генерировать масштабированный репрезентативный сигнал 440 путем применения коэффициента 436 усиления гармоник к репрезентативному сигналу 422.
[099] Способ 400 дополнительно включает в себя суммирование масштабированного модулированного белого шума 438 и масштабированного репрезентативного сигнала 440, на этапе 418. Например, выходная схема 166, показанная на фиг. 1, может генерировать высокополосный сигнал 186 возбуждения путем объединения (например, суммирования) масштабированного модулированного белого шума 438 и масштабированного репрезентативного сигнала 440. В альтернативных вариантах осуществления, операция 414, операция 416, или обе, могут осуществляться модулятором 164, показанным на фиг. 1. Высокополосный сигнал 186 возбуждения может выражаться в области преобразования или во временной области.
[0100] Таким образом, способ 400 позволяет управлять величиной огибающей сигнала путем управления характеристикой огибающей на основании коэффициента 236 вокализованности. В конкретном варианте осуществления, пропорция модулированного белого шума 184 и репрезентативного сигнала 422 может динамически определяться коэффициентами усиления (например, коэффициентом 434 усиления шума и коэффициентом 436 усиления гармоник) на основании параметра 246 гармоничности. Модулированный белый шум 184 и репрезентативный сигнал 422 можно масштабировать так, чтобы отношение энергии гармоник к энергии шума высокополосного сигнала 186 возбуждения аппроксимировало отношение энергии гармоник к энергии шума высокополосного сигнала входного сигнала 130.
[0101] В конкретных вариантах осуществления, способ 400, показанный на фиг. 4, может быть реализован посредством оборудования (например, устройства вентильной матрицы, программируемой пользователем (FPGA), специализированной интегральной схемы (ASIC) и т.д.) блока обработки, например, центрального процессора (CPU), цифрового сигнального процессора (DSP) или контроллера, посредством программно-аппаратного устройства или любой их комбинации. В порядке примера, способ 400, показанный на фиг. 4, может осуществляться процессором, который выполняет инструкции, как описано в отношении фиг. 9.
[0102] На фиг. 5 показана схема конкретного варианта осуществления способа генерации высокополосного сигнала возбуждения, в целом, обозначенного 500. Способ 500 может включать в себя генерирование высокополосного сигнала возбуждения путем управления величиной огибающей сигнала, представленной в области преобразования, модулирование белого шума, представленного в области преобразования, или оба.
[0103] Способ 500 включает в себя операции 404, 406, 412 и 414 способа 400. Репрезентативный сигнал 422 может быть представлен в области преобразования (например, частотной), как описано со ссылкой на фиг. 4.
[0104] Способ 500 также включает в себя вычисление коэффициента расширения полосы, на этапе 508. Например, регулятор 162 огибающей, показанный на фиг. 1, может определять коэффициент 526 расширения полосы на основании коэффициента 236 вокализованности. Например, коэффициент 526 расширения полосы может указывать большее расширение полосы, когда коэффициент 236 вокализованности указывает сильно вокализованный, чем когда коэффициент 236 вокализованности указывает сильно невокализованный.
[0105] Способ 500 дополнительно включает в себя генерирование спектра путем регулировки высокополосные полюсы LPC, на этапе 510. Например, регулятор 162 огибающей может определять полюсы LPC, связанные с репрезентативным сигналом 422. Регулятор 162 огибающей может управлять характеристикой огибающей 182 сигнала путем управления амплитудой огибающей 182 сигнала, формой огибающей 182 сигнала, коэффициентом усиления огибающей 182 сигнала или их комбинацией. Например, регулятор 162 огибающей может управлять амплитудой огибающей 182 сигнала, формой огибающей 182 сигнала, коэффициентом усиления огибающей 182 сигнала или их комбинацией, путем регулировки полюсов LPC на основании коэффициента 526 расширения полосы. В конкретном варианте осуществления, полюсы LPC можно регулировать в области преобразования. Регулятор 162 огибающей может генерировать спектр на основании отрегулированных полюсов LPC.
[0106] График 570 демонстрирует исходную спектральную форму 582. Исходная спектральная форма 582 может представлять огибающую 182 сигнала репрезентативного сигнала 422. Исходная спектральная форма 582 может генерироваться на основании полюсов LPC, связанных с репрезентативным сигналом 422. Регулятор 162 огибающей может регулировать полюсы LPC на основании коэффициента 236 вокализованности. Регулятор 162 огибающей может применять фильтр, соответствующий отрегулированным полюсам LPC, к репрезентативному сигналу 422 для генерации фильтрованного сигнала, имеющего первую спектральную форму 584 или вторую спектральную форму 586. Первая спектральная форма 584 фильтрованного сигнала может соответствовать отрегулированным полюсам LPC, когда коэффициент 236 вокализованности указывает сильно вокализованный. Вторая спектральная форма 586 фильтрованного сигнала может соответствовать отрегулированным полюсам LPC, когда коэффициент 236 вокализованности указывает сильно невокализованный.
[0107] Огибающая 182 сигнала может соответствовать генерируемому спектру, отрегулированным полюсам LPC, коэффициентам LPC, связанным с репрезентативным сигналом 422, имеющим отрегулированные полюсы LPC, или их комбинации. Регулятор 162 огибающей может выдавать огибающую 182 сигнала на модулятор 164, показанный на фиг. 1.
[0108] Модулятор 164 может модулировать белый шум 156 с использованием огибающей 182 сигнала для генерации модулированного белого шума 184, как описано со ссылкой на операцию 412 способа 400. Модулятор 164 может модулировать белый шум 156, представленный в области преобразования. Выходная схема 166, показанная на фиг. 1, может генерировать масштабированный модулированный белый шум 438 на основании модулированного белого шума 184 и коэффициента 434 усиления шума, как описано со ссылкой на операцию 414 способа 400.
[0109] Способ 500 также включает в себя умножение высокополосного спектра 542 LPC и репрезентативного сигнала 422, на этапе 512. Например, выходная схема 166, показанная на фиг. 1, может фильтровать репрезентативный сигнал 422 с использованием высокополосного спектра 542 LPC для генерации фильтрованного сигнала 544. В конкретном варианте осуществления, выходная схема 166 может определять высокополосный спектр 542 LPC на основании высокополосных параметров (например, высокополосных коэффициентов LPC), связанных с репрезентативным сигналом 422. Для иллюстрации, выходная схема 166 может определять высокополосный спектр 542 LPC на основании высокополосной части битового потока 218, показанной на фиг. 2, или на основании информации высокополосных параметров, генерируемых из высокополосного сигнала 340, показанного на фиг. 3.
[0110] Репрезентативный сигнал 422 может соответствовать расширенному сигналу, генерируемому из низкополосного сигнала 244 возбуждения, показанного на фиг. 2. Выходная схема 166 может синтезировать расширенный сигнал с использованием высокополосного спектра 542 LPC для генерации фильтрованного сигнала 544. Синтез может осуществляться в области преобразования. Например, выходная схема 166 может осуществлять синтез с использованием умножения в частотной области.
[0111] Способ 500 дополнительно включает в себя умножение фильтрованного сигнала 544 и коэффициента 436 усиления гармоник, на этапе 516. Например, выходная схема 166, показанная на фиг. 1, может умножать фильтрованный сигнал 544 на коэффициент 436 усиления гармоник для генерации масштабированного фильтрованного сигнала 540. В конкретном варианте осуществления, операция 512, операция 516 или обе, может осуществляться модулятором 164, показанным на фиг. 1.
[0112] Способ 500 также включает в себя суммирование масштабированного модулированного белого шума 438 и масштабированного фильтрованного сигнала 540, на этапе 518. Например, выходная схема 166, показанная на фиг. 1, может объединять масштабированный модулированный белый шум 438 и масштабированный фильтрованный сигнал 540 для генерации высокополосного сигнала 186 возбуждения. Высокополосный сигнал 186 возбуждения может быть представлен в области преобразования.
[0113] Таким образом, способ 500 позволяет управлять величиной огибающей сигнала путем регулировки высокополосные полюсы LPC в области преобразования на основании коэффициента 236 вокализованности. В конкретном варианте осуществления, пропорция модулированного белого шума 184 и фильтрованного сигнала 544 может динамически определяться коэффициентами усиления (например, коэффициентом 434 усиления шума и коэффициентом 436 усиления гармоник) на основании параметра 246 гармоничности. Модулированный белый шум 184 и фильтрованный сигнал 544 можно масштабировать так, чтобы отношение энергии гармоник к энергии шума высокополосного сигнала 186 возбуждения аппроксимировало отношение энергии гармоник к энергии шума высокополосного сигнала входного сигнала 130.
[0114] В конкретных вариантах осуществления, способ 500, представленный на фиг. 5, может быть реализован посредством оборудования (например, устройства вентильной матрицы, программируемой пользователем (FPGA), специализированной интегральной схемы (ASIC) и т.д.) блока обработки, например, центрального процессора (CPU), цифрового сигнального процессора (DSP) или контроллера, посредством программно-аппаратного устройства или любой их комбинации. В порядке примера, способ 500, представленный на фиг. 5, может осуществляться процессором, который выполняет инструкции, как описано в отношении фиг. 9.
[0115] На фиг. 6 показана схема конкретного варианта осуществления способа генерации высокополосного сигнала возбуждения, в целом обозначенного 600. Способ 600 может включать в себя генерирование высокополосного сигнала возбуждения путем управления величиной огибающей сигнала во временной области.
[0116] Способ 600 включает в себя операции 404, 406 и 414 способа 400 и операцию 508 способа 500. Репрезентативный сигнал 422 и белый шум 156 могут выражаться во временной области.
[0117] Способ 600 также включает в себя осуществление синтеза LPC, на этапе 610. Например, регулятор 162 огибающей, показанный на фиг. 1, может управлять характеристикой (например, формой, амплитудой и/или коэффициентом усиления) огибающей 182 сигнала путем регулировки коэффициентов фильтра на основании коэффициента 526 расширения полосы. В конкретном варианте осуществления, синтез LPC может осуществляться во временной области. Коэффициенты фильтра могут соответствовать высокополосным коэффициентам LPC. Коэффициенты фильтрации LPC могут представлять спектральные пики. Управление спектральными пиками путем регулировки коэффициентов фильтрации LPC позволяет управлять степенью модуляции белого шума 156 на основании коэффициента 236 вокализованности.
[0118] Например, спектральные пики могут сохраняться в неизменном виде, когда коэффициент 236 вокализованности указывает вокализованную речь. В порядке другого примера, спектральные пики могут сглаживаться при сохранении общей спектральной формы, когда коэффициент 236 вокализованности указывает невокализованную речь.
[0119] График 670 демонстрирует исходную спектральную форму 682. Исходная спектральная форма 682 может представлять огибающую 182 сигнала репрезентативного сигнала 422. Исходная спектральная форма 682 может генерироваться на основании коэффициентов фильтрации LPC, связанных с репрезентативным сигналом 422. Регулятор 162 огибающей может регулировать коэффициенты фильтрации LPC на основании коэффициента 236 вокализованности. Регулятор 162 огибающей может применять фильтр, соответствующий отрегулированным коэффициентам фильтрации LPC, к репрезентативному сигналу 422 для генерации фильтрованного сигнала, имеющего первую спектральную форму 684 или вторую спектральную форму 686. Первая спектральная форма 684 фильтрованного сигнала может соответствовать отрегулированным коэффициентам фильтрации LPC, когда коэффициент 236 вокализованности указывает сильно вокализованный. Спектральные пики могут сохраняться в неизменном виде, когда коэффициент 236 вокализованности указывает сильно вокализованный, что иллюстрирует первая спектральная форма 684. Вторая спектральная форма 686 может соответствовать отрегулированным коэффициентам фильтрации LPC, когда коэффициент 236 вокализованности указывает сильно невокализованный. Общая спектральная форма может сохраняться в неизменном виде, но спектральные пики могут сглаживаться, когда коэффициент 236 вокализованности указывает сильно невокализованный, что иллюстрирует вторая спектральная форма 686. Огибающая 182 сигнала может соответствовать отрегулированным коэффициентам фильтрации. Регулятор 162 огибающей может выдавать огибающую 182 сигнала на модулятор 164, показанный на фиг. 1.
[0120] Модулятор 164 может модулировать белый шум 156 с использованием огибающей 182 сигнала (например, отрегулированных коэффициентов фильтрации) для генерации модулированного белого шума 184. Например, модулятор 164 может применять фильтр к белому шуму 156 для генерации модулированного белого шума 184, где фильтр имеет отрегулированные коэффициенты фильтрации. Модулятор 164 может выдавать модулированный белый шум 184 на выходную схему 166, показанную на фиг. 1. Выходная схема 166 может умножать модулированный белый шум 184 на коэффициент 434 усиления шума для генерации масштабированного модулированного белого шума 438, как описано со ссылкой на операцию 414, показанную на фиг. 4.
[0121] Способ 600 дополнительно включает в себя осуществление высокополосного синтез LPC, на 612. Например, выходная схема 166, показанная на фиг. 1, может синтезировать репрезентативный сигнал 422 для генерации синтезированного высокополосного сигнала 614. Синтез может осуществляться во временной области. В конкретном варианте осуществления, репрезентативный сигнал 422 может генерироваться путем расширения низкополосного сигнала возбуждения. Выходная схема 166 может генерировать синтезированный высокополосный сигнал 614 путем применения синтезирующего фильтра с использованием высокополосных LPC к репрезентативному сигналу 422.
[0122] Способ 600 также включает в себя умножение синтезированного высокополосного сигнала 614 и коэффициента 436 усиления гармоник, на этапе 616. Например, выходная схема 166, показанная на фиг. 1, может применять коэффициент 436 усиления гармоник к синтезированному высокополосному сигналу 614 для генерации масштабированного синтезированного высокополосного сигнала 640. В альтернативном варианте осуществления, модулятор 164, показанный на фиг. 1, может осуществлять операцию 612, операцию 616 или обе.
[0123] Способ 600 дополнительно включает в себя суммирование масштабированного модулированного белого шума 438 и масштабированного синтезированного высокополосного сигнала 640, на этапе 618. Например, выходная схема 166, показанная на фиг. 1, может объединять масштабированный модулированный белый шум 438 и масштабированный синтезированный высокополосный сигнал 640 для генерации высокополосного сигнала 186 возбуждения.
[0124] Таким образом, способ 600 позволяет управлять величиной огибающей сигнала путем регулировки коэффициентов фильтра на основании коэффициента 236 вокализованности. В конкретном варианте осуществления, пропорция модулированного белого шума 184 и синтезированного высокополосного сигнала 614 может динамически определяться на основании коэффициента 236 вокализованности. Модулированный белый шум 184 и синтезированный высокополосный сигнал 614 можно масштабировать так, чтобы отношение энергии гармоник к энергии шума высокополосного сигнала 186 возбуждения аппроксимировало отношение энергии гармоник к энергии шума высокополосного сигнала входного сигнала 130.
[0125] В конкретных вариантах осуществления, способ 600,показанный на фиг. 6, может быть реализован посредством оборудования (например, устройства вентильной матрицы, программируемой пользователем (FPGA), специализированной интегральной схемы (ASIC) и т.д.) блока обработки, например, центрального процессора (CPU), цифрового сигнального процессора (DSP) или контроллера, посредством программно-аппаратного устройства или любой их комбинации. В порядке примера, способ 600,показанный на фиг. 6, может осуществляться процессором, который выполняет инструкции, как описано в отношении фиг. 9.
[0126] На фиг. 7 показана схема конкретного варианта осуществления способа генерации высокополосного сигнала возбуждения, в целом, обозначенного 700. Способ 700 может соответствовать генерированию высокополосного сигнала возбуждения путем управления величиной огибающей сигнала, представленной во временной области или в области преобразования (например, частотной).
[0127] Способ 700 включает в себя операции 404, 406, 412, 414 и 416 способа 400. Репрезентативный сигнал 422 может быть представлен в области преобразования или временной области. Способ 700 также включает в себя определение огибающей сигнала, на этапе 710. Например, регулятор 162 огибающей, показанный на фиг. 1, может генерировать огибающую 182 сигнала путем применения фильтра низких частот к репрезентативному сигналу 422 с постоянным коэффициентом.
[0128] Способ 700 также включает в себя определение среднеквадратического значения, на этапе 702. Например, модулятор 164, показанный на фиг. 1, может определять среднеквадратическую энергию огибающей 182 сигнала.
[0129] Способ 700 дополнительно включает в себя умножение среднеквадратического значения на белый шум 156, на этапе 712. Например, выходная схема 166, показанная на фиг. 1, может умножать среднеквадратическое значение на белый шум 156 для генерации немодулированного белого шума 736.
[0130] Модулятор 164, показанный на фиг. 1, может умножать огибающую 182 сигнала на белый шум 156 для генерации модулированного белого шума 184, как описано со ссылкой на операцию 412 способа 400. Белый шум 156 может быть представлен в области преобразования или временной области.
[0131] Способ 700 также включает в себя определение пропорции коэффициента усиления для модулированного и немодулированного белого шума, на этапе 704. Например, выходная схема 166, показанная на фиг. 1, может определять коэффициент 734 усиления немодулированного шума и коэффициент 732 усиления модулированного шума на основании коэффициента 434 усиления шума и коэффициента 236 вокализованности. Если коэффициент 236 вокализованности указывает, что кодированный аудиосигнал соответствует сильно вокализованному аудиосигналу, коэффициент 732 усиления модулированного шума может соответствовать более высокой пропорции коэффициента 434 усиления шума. Если коэффициент 236 вокализованности указывает, что кодированный аудиосигнал соответствует сильно невокализованному аудиосигналу, коэффициент 734 усиления немодулированного шума может соответствовать более высокой пропорции коэффициента 434 усиления шума.
[0132] Способ 700 дополнительно включает в себя умножение коэффициента 734 усиления немодулированного шума и немодулированного белого шума 736, на этапе 714. Например, выходная схема 166, показанная на фиг. 1, может применять коэффициент 734 усиления немодулированного шума к немодулированному белому шуму 736 для генерации масштабированного немодулированного белого шума 742.
[0133] Выходная схема 166 может применять коэффициент 732 усиления модулированного шума к модулированному белому шуму 184 для генерации масштабированного модулированного белого шума 740, как описано со ссылкой на операцию 414 способа 400.
[0134] Способ 700 также включает в себя суммирование масштабированного немодулированного белого шума 742 и масштабированного белого шума 744, на этапе 716. Например, выходная схема 166, показанная на фиг. 1, может объединять масштабированный немодулированный белый шум 742 и масштабированный модулированный белый шум 740 для генерации масштабированного белого шума 744.
[0135] Способ 700 дополнительно включает в себя суммирование масштабированного белого шума 744 и масштабированного репрезентативного сигнала 440, на этапе 718. Например, выходная схема 166 может объединять масштабированный белый шум 744 и масштабированный репрезентативный сигнал 440 для генерации высокополосного сигнала 186 возбуждения. Способ 700 может генерировать высокополосный сигнал 186 возбуждения, представленный в области преобразования (или временной области) с использованием репрезентативного сигнала 422 и белого шума 156, представленного в области преобразования (или временной области).
[0136] Таким образом, способ 700 позволяет динамически определять пропорцию немодулированного белого шума 736 и модулированного белого шума 184 коэффициентами усиления (например, коэффициентом 734 усиления немодулированного шума и коэффициентом 732 усиления модулированного шума) на основании коэффициента 236 вокализованности. Высокополосный сигнал 186 возбуждения для сильно невокализованного аудиосигнала может соответствовать немодулированному белому шуму с меньшим количеством артефактов, чем высокополосный сигнал, соответствующий белому шуму, модулированному на основании разреженно кодированному низкополосному остатку.
[0137] В конкретных вариантах осуществления, способ 700, показанный на фиг. 7, может быть реализован посредством оборудования (например, устройства вентильной матрицы, программируемой пользователем (FPGA), специализированной интегральной схемы (ASIC) и т.д.) блока обработки, например, центрального процессора (CPU), цифрового сигнального процессора (DSP) или контроллера, посредством программно-аппаратного устройства или любой их комбинации. В порядке примера, способ 700, показанный на фиг. 7, может осуществляться процессором, который выполняет инструкции, как описано в отношении фиг. 9.
[0138] На фиг. 8 показана блок-схема операций конкретного варианта осуществления способа генерации высокополосного сигнала возбуждения, в целом, обозначенного 800. Способ 800 может осуществляться одним или более компонентами систем 100-300, показанных на фиг. 1-3. Например, способ 800 может осуществляться одним или более компонентами высокополосного модуля 122 генерации сигнала возбуждения, показанного на фиг. 1, генератора 222 сигнала возбуждения, показанного на фиг. 2 или фиг. 3, генератора 208 коэффициентов вокализованности, показанного на фиг. 2, или их комбинации.
[0139] Способ 800 включает в себя определение, на устройстве, классификации вокализованности входного сигнала, на этапе 802. Входной сигнал может соответствовать аудиосигналу. Например, классификатор 160 вокализованности, показанный на фиг. 1, может определять классификацию 180 вокализованности входного сигнала 130, как описано со ссылкой на фиг. 1. Входной сигнал 130 может соответствовать аудиосигналу.
[0140] Способ 800 также включает в себя управление величиной огибающей представления входного сигнала на основании классификации вокализованности, на этапе 804. Например, регулятор 162 огибающей, показанный на фиг. 1, может управлять величиной огибающей представления входного сигнала 130 на основании классификации 180 вокализованности, как описано со ссылкой на фиг. 1. Представление входного сигнала 130 может быть низкополосной частью битового потока (например, битового потока 232, показанного на фиг. 2), низкополосным сигналом (например, низкополосным сигналом 334, показанным на фиг. 3), расширенным сигнальном, генерируемым путем расширения низкополосного сигнала возбуждения (например, низкополосного сигнала 244 возбуждения, показанного на фиг. 2), другим сигналом или их комбинацией. Например, представление входного сигнала 130 может включать в себя репрезентативный сигнал 422, показанный на фиг. 4-7.
[0141] Способ 800 дополнительно включает в себя модулирование сигнала белого шума на основании управляемой величины огибающей, на этапе 806. Например, модулятор 164, показанный на фиг. 1, может модулировать белый шум 156 на основании огибающей 182 сигнала. Огибающая 182 сигнала может соответствовать управляемой величине огибающей. Для иллюстрации, модулятор 164 может модулировать белый шум 156 во временной области, например, согласно фиг. 4 и 6-7. Альтернативно, модулятор 164 может модулировать белый шум 156, представленный в области преобразования, например, на фиг. 4-7.
[0142] Способ 800 также включает в себя генерирование высокополосного сигнала возбуждения на основании модулированного сигнала белого шума, на этапе 808. Например, выходная схема 166, показанная на фиг. 1, может генерировать высокополосный сигнал 186 возбуждения на основании модулированного белого шума 184, как описано со ссылкой на фиг. 1.
[0143] Таким образом, способ 800, показанный на фиг. 8, позволяет генерировать высокополосный сигнал возбуждения на основании управляемой величины огибающей входного сигнала, где величина огибающей управляется на основании классификации вокализованности.
[0144] В конкретных вариантах осуществления, способ 800, показанный на фиг. 8, может быть реализован посредством оборудования (например, устройства вентильной матрицы, программируемой пользователем (FPGA), специализированной интегральной схемы (ASIC) и т.д.) блока обработки, например, центрального процессора (CPU), цифрового сигнального процессора (DSP) или контроллера, посредством программно-аппаратного устройства или любой их комбинации. В порядке примера, способ 800, показанный на фиг. 8, может осуществляться процессором, который выполняет инструкции, как описано в отношении фиг. 9.
[0145] Хотя варианты осуществления, представленные фиг. 1-8, описывают генерирование высокополосного сигнала возбуждения на основании низкополосного сигнала, в других вариантах осуществления входной сигнал 130 можно фильтровать для формирования многополосные сигналов. Например, многополосные сигналы могут включать в себя низкополосный сигнал, среднеполосный сигнал, высокополосный сигнал, один или более сигналов дополнительных полос или их комбинацию. Среднеполосный сигнал может соответствовать более высокому диапазону частот, чем низкополосный сигнал, и высокополосный сигнал может соответствовать более высокому диапазону частот, чем среднеполосный сигнал. Низкополосный сигнал и среднеполосный сигнал может соответствовать перекрывающимся или неперекрывающимся диапазонам частот. Среднеполосный сигнал и высокополосный сигнал могут соответствовать перекрывающимся или неперекрывающимся диапазонам частот.
[0146] Модуль 122 генерации сигнала возбуждения может использовать сигнал первой полосы (например, низкополосный сигнал или среднеполосный сигнал) для генерации сигнала возбуждения, соответствующего сигналу второй полосы (например, среднеполосному сигналу или высокополосному сигналу), где сигнал первой полосы соответствует более низкому диапазону частот, чем сигнал второй полосы.
[0147] В конкретном варианте осуществления, модуль 122 генерации сигнала возбуждения может использовать сигнал первой полосы для генерации множественных сигналов возбуждения, соответствующих многополосным сигналам. Например, модуль 122 генерации сигнала возбуждения может использовать низкополосный сигнал для генерации среднеполосного сигнала возбуждения, соответствующего среднеполосному сигналу, высокополосного сигнала возбуждения, соответствующего высокополосному сигналу, одного или более сигналов возбуждения дополнительной полосы или их комбинации.
[0148] На фиг. 9 изображена блок-схема конкретного иллюстративного варианта осуществления устройства (например, устройства беспроводной связи), в целом, обозначенного 900. В различных вариантах осуществления, устройство 900 может иметь меньше или больше компонентов, чем показано на фиг. 9. В иллюстративном варианте осуществления, устройство 900 может соответствовать мобильному устройству 104 или первому устройству 102, показанному на фиг. 1. В иллюстративном варианте осуществления, устройство 900 может действовать согласно одному или более из способов 400-800, показанных на фиг. 4-8.
[0149] В конкретном варианте осуществления, устройство 900 включает в себя процессор 906 (например, центральный процессор (CPU)). Устройство 900 может включать в себя один или более дополнительных процессоров 910 (например, один или более цифровых сигнальных процессоров (DSP)). Процессоры 910 может включать в себя речевой и музыкальный кодер-декодер (кодек) 908 и эхоподавитель 912. Речевой и музыкальный кодек 908 может включать в себя модуль 122 генерации сигнала возбуждения, показанный на фиг. 1, генератор 222 сигнала возбуждения, генератор 208 коэффициентов вокализованности, показанный на фиг. 2, кодер 936 вокодера, декодер 938 вокодера или оба. В конкретном варианте осуществления, кодер 936 вокодера может включать в себя высокополосный кодер 172, показанный на фиг. 1, низкополосный кодер 304, показанный на фиг. 3, или оба. В конкретном варианте осуществления, декодер 938 вокодера может включать в себя высокополосный синтезатор 168, показанный на фиг. 1, низкополосный синтезатор 204, показанный на фиг. 2, или оба.
[0150] Как показано, модуль 122 генерации сигнала возбуждения, генератор 208 коэффициентов вокализованности и генератор 222 сигнала возбуждения могут быть совместно используемыми компонентами, доступными кодером 936 вокодера и декодером 938 вокодера. В других вариантах осуществления, один или более из модуля 122 генерации сигнала возбуждения, генератора 208 коэффициентов вокализованности и/или генератора 222 сигнала возбуждения могут входить в состав кодера 936 вокодера и декодера 938 вокодера.
[0151] Хотя речевой и музыкальный кодек 908 проиллюстрирован как компонент процессоров 910 (например, специализированная схема и/или исполнимый программный код), в других вариантах осуществления один или более компонентов речевого и музыкального кодека 908, например, модуль 122 генерации сигнала возбуждения, может входить в состав процессора 906, кодека 934, другого компонента обработки или их комбинации.
[0152] Устройство 900 может включать в себя память 932 и кодек 934. Устройство 900 может включать в себя беспроводной контроллер 940, подключенный к антенне 942 через приемопередатчик 950. Устройство 900 может включать в себя дисплей 928, подключенный к контроллеру 926 дисплея. Громкоговоритель 948, микрофон 946 или оба, могут быть подключены к кодеку 934. В конкретном варианте осуществления, громкоговоритель 948 может соответствовать громкоговорителю 142, показанному на фиг. 1. В конкретном варианте осуществления, микрофон 946 может соответствовать микрофону 146, показанному на фиг. 1. Кодек 934 может включать в себя цифроаналоговый преобразователь (DAC) 902 и аналого-цифровой преобразователь (ADC) 904.
[0153] В конкретном варианте осуществления, кодек 934 может принимать аналоговые сигналы от микрофона 946, преобразовывать аналоговые сигналы в цифровые сигналы с использованием аналого-цифрового преобразователя 904 и выдавать цифровые сигналы на речевой и музыкальный кодек 908, например, в формате импульсно-кодовой модуляции (ИКМ). Речевой и музыкальный кодек 908 может обрабатывать цифровые сигналы. В конкретном варианте осуществления, речевой и музыкальный кодек 908 может выдавать цифровые сигналы на кодек 934. Кодек 934 может преобразовывать цифровые сигналы в аналоговые сигналы с использованием цифроаналогового преобразователя 902 и может выдавать аналоговые сигналы на громкоговоритель 948.
[0154] Память 932 может включать в себя инструкции 956, исполняемые процессором 906, процессорами 910, кодекам 934, другим блокам обработки устройства 900 или их комбинацией, для осуществления раскрытых здесь способов и процессов, например, одного или более из способов 400-800, показанных на фиг. 4-8.
[0155] Один или более компонентов систем 100-300 может быть реализован посредством специализированного оборудования (например, схемы), процессора, выполняющего инструкции для осуществления одной или более задач, или их комбинации. В порядке примера, память 932 или один или более компонентов процессора 906, процессоров 910 и/или кодека 934 может представлять собой запоминающее устройство, например, оперативную память (RAM), магниторезистивную оперативную память (MRAM), MRAM с переносом спинового момента (STT-MRAM), флэш-память, постоянную память (ROM), программируемую постоянную память (PROM), стираемую программируемую постоянную память (EPROM), электрически стираемую программируемую постоянную память (EEPROM), регистры, жесткий диск, сменный диск или компакт-диск с возможностью только чтения (CD-ROM). Запоминающее устройство может включать в себя инструкции (например, инструкции 956), которые, при выполнении компьютером (например, процессором в кодеке 934, процессором 906 и/или процессорами 910), могут предписывать компьютеру осуществлять, по меньшей мере, часть одного или более из способов 400-800, показанных на фиг. 4-8. В порядке примера, память 932 или один или более компонентов процессора 906, процессоров 910, кодека 934 может представлять собой нетранзиторный компьютерно-читаемый носитель, который включает в себя инструкции (например, инструкции 956) которые, при выполнении компьютером (например, процессором в кодеке 934, процессором 906 и/или процессорами 910), предписывают компьютеру осуществлять, по меньшей мере, часть одного или более из способов 400-800, показанных на фиг. 4-8.
[0156] В конкретном варианте осуществления, устройство 900 может входить в состав корпусного или бескорпусного устройства (например, модема мобильной станции (MSM)) 922. В конкретном варианте осуществления, процессор 906, процессоры 910, контроллер 926 дисплея, память 932, кодек 934, беспроводной контроллер 940 и приемопередатчик 950 входят в состав корпусного или бескорпусного устройства 922. В конкретном варианте осуществления, устройство 930 ввода, например, сенсорный экран и/или клавишная панель, и источник 944 питания подключены к бескорпусному устройству 922. Кроме того, в конкретном варианте осуществления, представленном на фиг. 9, дисплей 928, устройство 930 ввода, громкоговоритель 948, микрофон 946, антенна 942 и источник 944 питания являются внешними по отношению к бескорпусному устройству 922. Однако каждый из дисплея 928, устройства 930 ввода, громкоговорителя 948, микрофона 946, антенны 942 и источника 944 питания может быть подключен к компоненту бескорпусного устройства 922, например, интерфейса или контроллера.
[0157] Устройство 900 может включать в себя мобильное устройство связи, смартфон, сотовый телефон, портативный компьютер, компьютер, планшет, карманный персональный компьютер, устройство отображения, телевизор, игровую консоль, музыкальный проигрыватель, радио, цифровой видеопроигрыватель, проигрыватель цифровых видеодисков (DVD), тюнер, камеру, навигационное устройство, систему декодера, систему кодера или любую их комбинацию.
[0158] В иллюстративном варианте осуществления, процессоры 910 способны осуществлять все или часть способов или операций, описанных со ссылкой на фиг. 1-8. Например, микрофон 946 может захватывать аудиосигнал (например, входной сигнал 130, показанный на фиг. 1). ADC 904 может преобразовывать захваченный аудиосигнал из аналоговое формы волны в цифровую форму волны, состоящую из цифровых выборок аудиосигнала. Процессоры 910 могут обрабатывать цифровые выборки аудиосигнала. Регулятор коэффициента усиления может регулировать цифровые выборки аудиосигнала. Эхоподавитель 912 может снижать эхо-сигнал, который может создаваться выходным сигналом громкоговорителя 948, поступающий в микрофон 946.
[0159] Кодер 936 вокодера может сжимать цифровые выборки аудиосигнала, соответствующие обработанному речевому сигналу, и могут формировать передаваемый пакет (например, представление сжатых битов цифровых выборок аудиосигнала). Например, передаваемый пакет может соответствовать, по меньшей мере, части битового потока 132, показанного на фиг. 1. Передаваемый пакет может сохраняться в памяти 932. Приемопередатчик 950 может модулировать некоторому форму передаваемого пакета (например, другая информация может присоединяться к передаваемому пакету) и может передавать модулированные данные через антенну 942.
[0160] В порядке дополнительного примера, антенна 942 может принимать входные пакеты, которые включают в себя принимаемый пакет. Принимаемый пакет может отправляться другим устройством через сеть. Например, принимаемый пакет может соответствовать, по меньшей мере, части битового потока 132, показанного на фиг. 1. Декодер 938 вокодера может снимать сжатие принимаемого пакета. Форма волны со снятым сжатием может именоваться реконструированные выборки аудиосигнала. Эхоподавитель 912 может удалять эхо из реконструированных выборок аудиосигнала.
[0161] Процессоры 910, выполняющие речевой и музыкальный кодек 908, могут генерировать высокополосный сигнал 186 возбуждения, как описано со ссылкой на фиг. 1-8. Процессоры 910 могут генерировать выходной сигнал 116, показанный на фиг. 1, на основании высокополосного сигнала 186 возбуждения. Регулятор коэффициента усиления может усиливать или подавлять выходной сигнал 116. DAC 902 может преобразовывать выходной сигнал 116 из цифровой формы волны в аналоговую форму волны и может выдавать преобразованный сигнал на громкоговоритель 948.
[0162] В соответствии с описанными вариантами осуществления, раскрыто устройство, которое включает в себя средство для определения классификации вокализованности входного сигнала. Входной сигнал может соответствовать аудиосигналу. Например, средство для определения классификации вокализованности может включать в себя классификатор 160 вокализованности, показанный на фиг. 1, одно или более устройств, выполненных с возможностью определения классификации вокализованности входного сигнала (например, процессор, выполняющий инструкции на нетранзиторном компьютерно-читаемом носителе данных) или любую их комбинацию.
[0163] Например, классификатор 160 вокализованности может определять параметры 242, включающие в себя частоту пересечения нуля низкополосного сигнала входного сигнала 130, первый коэффициент отражения, отношение энергии вклада адаптивной кодовой книги в низкополосное возбуждение к энергии сумму вкладов адаптивной кодовой книги и фиксированной кодовой книги в низкополосное возбуждение, коэффициент усиления основного тона низкополосного сигнала входного сигнала 130 или их комбинацию. В конкретном варианте осуществления, классификатор 160 вокализованности может определять параметры 242 на основании низкополосного сигнала 334, показанного на фиг. 3. В альтернативном варианте осуществления, классификатор 160 вокализованности может извлекать параметры 242 из низкополосной части битового потока 232, показанного на фиг. 2.
[0164] Классификатор 160 вокализованности может определять классификацию 180 вокализованности (например, коэффициент 236 вокализованности) на основании уравнения. Например, классификатор 160 вокализованности может определять классификацию 180 вокализованности на основании уравнения 1 и параметров 242. Для иллюстрации, классификатор 160 вокализованности может определять классификацию 180 вокализованности путем вычисления взвешенной суммы частоты пересечения нуля, первого коэффициента отражения, отношения энергии, коэффициента усиления основного тона, предыдущего решения по вокализованности, постоянного значения или их комбинации, как описано со ссылкой на фиг. 4.
[0165] Устройство также включает в себя средство для управления величиной огибающей представления входного сигнала на основании классификации вокализованности. Например, средство для управления величиной огибающей может включать в себя регулятор 162 огибающей, показанный на фиг. 1, одно или более устройств, выполненных с возможностью управления величиной огибающей представления входного сигнала на основании классификации вокализованности (например, процессор, выполняющий инструкции на нетранзиторном компьютерно-читаемом носителе данных) или любую их комбинацию.
[0166] Например, регулятор 162 огибающей может генерировать частотную классификацию вокализованности путем умножения классификации 180 вокализованности, показанной на фиг. 1 (например, коэффициента 236 вокализованности, показанного на фиг. 2) на масштабный коэффициент частоты среза. Масштабный коэффициент частоты среза может быть значением, принятым по умолчанию. Частота 426 среза LPF может соответствовать частотой среза, принятой по умолчанию. Регулятор 162 огибающей может управлять величиной огибающей 182 сигнала путем регулировки частоты 426 среза LPF, как описано со ссылкой на фиг. 4. Например, регулятор 162 огибающей может регулировать частоту 426 среза LPF путем суммирования частотной классификации вокализованности с частотой 426 среза LPF.
[0167] В порядке другого примера, регулятор 162 огибающей может генерировать коэффициент 526 расширения полосы путем умножения классификации 180 вокализованности, показанной на фиг. 1 (например, коэффициента 236 вокализованности, показанного на фиг. 2) на масштабный коэффициент полосы. Регулятор 162 огибающей может определять высокополосные полюсы LPC, связанные с репрезентативным сигналом 422. Регулятор 162 огибающей может определять регулировочный коэффициент полюса путем умножения коэффициента 526 расширения полосы на масштабный коэффициент полюса. Масштабный коэффициент полюса может быть значением, принятым по умолчанию. Регулятор 162 огибающей может управлять величиной огибающей 182 сигнала путем регулировки высокополосных полюсов LPC, как описано со ссылкой на фиг. 5. Например, регулятор 162 огибающей может регулировать высокополосные полюсы LPC к началу отсчета с помощью регулировочного коэффициента полюса.
[0168] В порядке дополнительного примера, регулятор 162 огибающей может определять коэффициенты фильтра. Коэффициенты фильтра могут быть значениями, принятыми по умолчанию. Регулятор 162 огибающей может определять регулировочный коэффициент фильтра путем умножения коэффициента 526 расширения полосы на масштабный коэффициент фильтра. Масштабный коэффициент фильтра может быть значением, принятым по умолчанию. Регулятор 162 огибающей может управлять величиной огибающей 182 сигнала путем регулировки коэффициентов фильтра, как описано со ссылкой на фиг. 6. Например, регулятор 162 огибающей может умножать каждый из коэффициентов фильтра на регулировочный коэффициент фильтра.
[0169] Устройство дополнительно включает в себя средство для модулирования сигнала белого шума на основании управляемой величины огибающей. Например, средство для модулирования сигнала белого шума может включать в себя модулятор 164, показанный на фиг. 1, одно или более устройств, выполненных с возможностью модуляции сигнала белого шума на основании управляемой величины огибающей (например, процессор, выполняющий инструкции на нетранзиторном компьютерно-читаемом носителе данных) или любому их комбинацию. Например, модулятор 164 может определять, представлены ли белый шум 156 и огибающая 182 сигнала в одной и той же области. Если белый шум 156 представлен в другой области, чем огибающая 182 сигнала, модулятор 164 может преобразовывать белый шум 156 в ту же область, в которой представлена огибающая 182 сигнала, или может преобразовывать огибающую 182 сигнала в ту же область, в которой представлен белый шум 156. Модулятор 164 может модулировать белый шум 156 на основании огибающей 182 сигнала, как описано со ссылкой на фиг. 4. Например, модулятор 164 может умножать белый шум 156 и огибающую 182 сигнала во временной области. В порядке другого примера, модулятор 164 может свертывать белый шум 156 и огибающую 182 сигнала в частотной области.
[0170] Устройство также включает в себя средство для генерирования высокополосного сигнала возбуждения на основании модулированного сигнала белого шума. Например, средство для генерирования высокополосного сигнала возбуждения может включать в себя выходную схему 166, показанную на фиг. 1, одно или более устройств, выполненных с возможностью генерации высокополосного сигнала возбуждения на основании модулированного сигнала белого шума (например, процессор, выполняющий инструкции на нетранзиторном компьютерно-читаемом носителе данных), или любую их комбинацию.
[0171] В конкретном варианте осуществления, выходная схема 166 может генерировать высокополосный сигнал 186 возбуждения на основании модулированного белого шума 184, как описано со ссылкой на фиг. 4-7. Например, выходная схема 166 может умножать модулированный белый шум 184 и коэффициент 434 усиления шума для генерации масштабированного модулированного белого шума 438, как описано со ссылкой на фиг. 4-6. Выходная схема 166 может объединять масштабированный модулированный белый шум 438 и другой сигнал (например, масштабированный репрезентативный сигнал 440, показанный на фиг. 4, масштабированный фильтрованный сигнал 540, показанный на фиг. 5, или масштабированный синтезированный высокополосный сигнал 640, показанный на фиг. 6) для генерации высокополосного сигнала 186 возбуждения.
[0172] В порядке другого примера, выходная схема 166 может умножать модулированный белый шум 184 и коэффициент 732 усиления модулированного шума, показанный на фиг. 7, для генерации масштабированного модулированного белого шума 740, как описано со ссылкой на фиг. 7. Выходная схема 166 может объединять (например, суммировать) масштабированный модулированный белый шум 740 и масштабированный немодулированный белый шум 742 для генерации масштабированного белого шума 744. Выходная схема 166 может объединять масштабированный репрезентативный сигнал 440 и масштабированный белый шум 744 для генерации высокополосного сигнала 186 возбуждения.
[0173] Специалистам в данной области техники также очевидно, что различные иллюстративные логические блоки, конфигурации, модули, схемы и этапы алгоритма, описанные в связи с раскрытыми здесь вариантами осуществления, могут быть реализованы в виде электронного оборудования, компьютерного программного обеспечения, выполняемого устройством обработки, например, аппаратным процессором, или их комбинаций. Различные иллюстративные компоненты, блоки, конфигурации, модули, схемы, этапы были описаны выше, в целом, применительно к их функциональным возможностям. Реализованы ли такие функциональные возможности как оборудование или исполняемое программное обеспечение, зависит от конкретного применения и конструкционных ограничений, налагаемых на систему в целом. Специалисты в данной области техники могут реализовывать описанные функциональные возможности по-разному для каждого конкретного применения, но такие решения на реализацию не следует интерпретировать как выходящие за рамки объема настоящего изобретения.
[0174] Этапы способа или алгоритма, описанные в связи с раскрытыми здесь вариантами осуществления, можно реализовать непосредственно в оборудовании, в виде программного модуля, выполняемого процессором, или в виде их комбинации. Программный модуль может располагаться в запоминающем устройстве, например, оперативной памяти (RAM), магниторезистивной оперативной памяти (MRAM), MRAM с переносом спинового момента (STT-MRAM), флэш-памяти, постоянной памяти (ROM), программируемой постоянной памяти (PROM), стираемой программируемой постоянной памяти (EPROM), электрически стираемой программируемой постоянной памяти (EEPROM), регистров, жесткого диска, сменного диска или компакт-диска с возможностью только чтения (CD-ROM). Иллюстративное запоминающее устройство связано с процессором таким образом, что процессор может считывать информацию из запоминающего устройства и записывать информацию на него. В качестве альтернативы, запоминающее устройство может быть встроено в процессор. Процессор и носитель данных могут располагаться в специализированной интегральной схеме (ASIC). ASIC может располагаться на вычислительном устройстве или пользовательском терминале. В качестве альтернативы, процессор и носитель данных могут располагаться на вычислительном устройстве или пользовательском терминале как дискретные компоненты.
[0175] Вышеприведенное описание раскрытых вариантов осуществления обеспечено для того, чтобы специалист в данной области техники мог предложить или использовать раскрытые варианты осуществления. Специалисты в данной области техники могут без труда предложить различные модификации этих вариантов осуществления, и установленные здесь принципы могут применяться к другим вариантам осуществления без отклонения от объема изобретения. Таким образом, настоящее изобретение не подлежит ограничению показанными здесь вариантами осуществления, но соответствует широчайшему возможному объему, согласующемуся с новыми принципами и признаками, определяемыми нижеследующей формулой изобретения.
Изобретение относится к средствам для генерации высокополосного сигнала возбуждения. Технический результат заключается в уменьшении количества артефактов в невокализованной области высокополосного сигнала. Извлекают параметр классификации вокализованности входного сигнала на основе принятого битового потока, причем входной сигнал соответствует аудиосигналу. Управляют диапазоном частот огибающей представления входного сигнала на основании параметра классификации вокализованности, причем упомянутым диапазоном частот управляют на основании частоты среза фильтра низких частот, применяемого к упомянутому представлению входного сигнала. Модулируют сигнал белого шума на основании управляемого диапазона частот огибающей. Генерируют высокополосный сигнал возбуждения, соответствующий декодированной версии аудиосигнала, на основании модулированного сигнала белого шума. 4 н. и 26 з.п. ф-лы, 9 ил.
1. Способ генерации высокополосного сигнала возбуждения, содержащий этапы, на которых:
извлекают параметр классификации вокализованности входного сигнала на основе принятого битового потока, причем входной сигнал соответствует аудиосигналу;
управляют диапазоном частот огибающей представления входного сигнала на основании параметра классификации вокализованности, причем упомянутым диапазоном частот управляют на основании частоты среза фильтра низких частот, применяемого к упомянутому представлению входного сигнала;
модулируют сигнал белого шума на основании управляемого диапазона частот огибающей и
генерируют высокополосный сигнал возбуждения, соответствующий декодированной версии аудиосигнала, на основании модулированного сигнала белого шума.
2. Способ по п. 1, дополнительно содержащий этап, на котором управляют амплитудой огибающей.
3. Способ по п. 1, дополнительно содержащий этап, на котором управляют по меньшей мере одним из формы огибающей или коэффициента усиления огибающей.
4. Способ по п. 3, в котором степень изменения формы огибающей больше, когда параметр классификации вокализованности соответствует сильно вокализованному, чем когда параметр классификации вокализованности соответствует сильно невокализованному.
5. Способ по п. 1, в котором параметр классификации вокализованности указывает, является ли входной сигнал сильно вокализованным сигналом, слабо вокализованным сигналом, слабо невокализованным сигналом или сильно невокализованным сигналом.
6. Способ по п. 1, дополнительно содержащий этап, на котором определяют частоту среза на основании параметра классификации вокализованности.
7. Способ по п. 1, в котором частота среза больше, когда параметр классификации вокализованности соответствует сильно вокализованному, чем когда параметр классификации вокализованности соответствует сильно невокализованному.
8. Способ по п. 1, в котором извлечение параметра классификации вокализованности выполняют декодером.
9. Способ по п. 1, в котором управление диапазоном частот огибающей представления входного сигнала на основании параметра классификации вокализованности выполняют мобильным устройством связи.
10. Способ по п. 1, в котором управление диапазоном частот огибающей представления входного сигнала на основании параметра классификации вокализованности выполняют блоком связи с фиксированным местоположением.
11. Способ по п. 1, в котором упомянутое управление диапазоном частот огибающей представления содержит регулировку представления входного сигнала в области преобразования.
12. Способ по п. 1, в котором представление входного сигнала включает в себя низкополосный сигнал возбуждения кодированной версии аудиосигнала или высокополосный сигнал возбуждения кодированной версии аудиосигнала.
13. Способ по п. 1, в котором представление входного сигнала включает в себя гармонически расширенный сигнал возбуждения, и при этом гармонически расширенный сигнал возбуждения генерируется из низкополосного сигнала возбуждения кодированной версии аудиосигнала.
14. Способ по п. 1, дополнительно содержащий этап, на котором генерируют масштабированный сигнал белого шума путем объединения масштабированного немодулированного сигнала белого шума с масштабированным модулированным сигналом белого шума, причем высокополосный сигнал возбуждения основан на масштабированном сигнале белого шума.
15. Способ по п. 1, в котором огибающая содержит огибающую, изменяющуюся со временем, и дополнительно содержит этап, на котором обновляют огибающую больше чем один раз за кадр входного сигнала.
16. Устройство для генерации высокополосного сигнала возбуждения, содержащее:
классификатор вокализованности, выполненный с возможностью извлечения параметра классификации вокализованности входного сигнала на основе принятого битового потока, причем входной сигнал соответствует аудиосигналу;
регулятор огибающей, выполненный с возможностью управления диапазоном частот огибающей представления входного сигнала на основании параметра классификации вокализованности, причем упомянутый диапазон частот управляется на основании частоты среза фильтра низких частот, применяемого к упомянутому представлению входного сигнала;
модулятор, выполненный с возможностью модуляции сигнала белого шума на основании управляемого диапазона частот огибающей; и
выходную схему, выполненную с возможностью генерации высокополосного сигнала возбуждения на основании модулированного сигнала белого шума.
17. Устройство по п. 16, в котором регулятор огибающей выполнен с возможностью управления на основании параметра классификации вокализованности по меньшей мере одним из формы огибающей, амплитуды огибающей или коэффициента усиления огибающей.
18. Устройство по п. 17, в котором по меньшей мере одно из формы огибающей, амплитуды огибающей или коэффициента усиления огибающей управляется путем регулировки одного или более полюсов коэффициентов кодирования с линейным предсказанием (LPC) на основании параметра классификации вокализованности.
19. Устройство по п. 17, в котором по меньшей мере одно из формы огибающей, амплитуды огибающей или коэффициента усиления огибающей сконфигурировано для управления ими на основании регулированных коэффициентов фильтра, при этом упомянутые регулированные коэффициенты определяются на основании параметра классификации вокализованности и при этом модулятор выполнен с возможностью применения фильтра к сигналу белого шума для генерации модулированного сигнала белого шума.
20. Устройство по п. 16, дополнительно содержащее антенну и приемник, соединенный с антенной и выполненный с возможностью приема битового потока.
21. Устройство по п. 20, в котором приемник, классификатор вокализованности, регулятор огибающей, модулятор и выходная схема встроены в мобильное устройство связи.
22. Устройство по п. 20, в котором приемник, классификатор вокализованности, регулятор огибающей, модулятор и выходная схема встроены в блок связи с фиксированным местоположением.
23. Устройство по п. 16, дополнительно содержащее:
высокополосный кодер, выполненный с возможностью кодирования высокополосной части аудиосигнала на основании высокополосного сигнала возбуждения; и
передатчик, выполненный с возможностью передачи кодированного аудиосигнала на другое устройство, причем кодированный аудиосигнал является кодированной версией аудиосигнала.
24. Компьютерно-читаемое запоминающее устройство, хранящее инструкции, которые при выполнении по меньшей мере одним процессором предписывают по меньшей мере одному процессору:
извлекать параметр классификации вокализованности входного сигнала на основе принятого битового потока, причем входной сигнал соответствует аудиосигналу;
управлять диапазоном частот огибающей представления входного сигнала на основании параметра классификации вокализованности, причем упомянутый диапазон частот управляется на основании частоты среза фильтра низких частот, применяемого к упомянутому представлению входного сигнала;
модулировать сигнал белого шума на основании управляемого диапазона частот огибающей; и
генерировать высокополосный сигнал возбуждения на основании модулированного сигнала белого шума.
25. Компьютерно-читаемое запоминающее устройство по п. 24, в котором упомянутые инструкции дополнительно выполняются для предписания по меньшей мере одному процессору управлять формой огибающей на основании параметра классификации вокализованности.
26. Компьютерно-читаемое запоминающее устройство по п. 24, в котором упомянутые инструкции дополнительно выполняются для предписания по меньшей мере одному процессору управлять по меньшей мере одним из амплитуды огибающей или коэффициента усиления огибающей.
27. Устройство для генерации высокополосного сигнала возбуждения, содержащее:
средство для извлечения параметра классификации вокализованности входного сигнала на основе принятого битового потока, причем входной сигнал соответствует аудиосигналу;
средство для управления диапазоном частот огибающей представления входного сигнала на основании параметра классификации вокализованности, причем упомянутый диапазон частот управляется на основании частоты среза фильтра низких частот, применяемого к упомянутому представлению входного сигнала;
средство для модулирования сигнала белого шума на основании управляемого диапазона частот огибающей; и
средство для генерирования высокополосного сигнала возбуждения на основании модулированного сигнала белого шума.
28. Устройство по п. 27, в котором представление входного сигнала включает в себя низкополосный сигнал возбуждения входного сигнала, высокополосный сигнал возбуждения входного сигнала или гармонически расширенный сигнал возбуждения, при этом гармонически расширенный сигнал возбуждения генерируется из низкополосного сигнала возбуждения входного сигнала.
29. Устройство по п. 27, в котором упомянутое средство для извлечения, упомянутое средство для управления, упомянутое средство для модулирования и упомянутое средство для генерирования встроены в мобильное устройство связи.
30. Устройство по п. 27, в котором упомянутое средство для извлечения, упомянутое средство для управления, упомянутое средство для модулирования и упомянутое средство для генерирования встроены в блок связи с фиксированным местоположением.
Способ приготовления мыла | 1923 |
|
SU2004A1 |
Способ приготовления лака | 1924 |
|
SU2011A1 |
US 5473727 A1, 05.12.1995 | |||
Захватное устройство | 1978 |
|
SU770990A2 |
Способ приготовления мыла | 1923 |
|
SU2004A1 |
Станок для изготовления деревянных ниточных катушек из цилиндрических, снабженных осевым отверстием, заготовок | 1923 |
|
SU2008A1 |
СПОСОБ СЖАТИЯ И ВОССТАНОВЛЕНИЯ РЕЧЕВЫХ СИГНАЛОВ ДЛЯ СИСТЕМ КОДИРОВАНИЯ С ПЕРЕМЕННОЙ СКОРОСТЬЮ ПЕРЕДАЧИ | 2009 |
|
RU2394284C1 |
Авторы
Даты
2019-03-29—Публикация
2015-03-31—Подача