Изобретение относится к подавлению шума и, более конкретно, к подавлению шума в системе связи.
Способы подавления шума в системах связи хорошо известны. Назначением системы подавления шума является уменьшение уровня фонового шума при кодировании речевого сигнала, чтобы улучшить качество в целом кодированного речевого сигнала пользователя. Системы связи, которые осуществляют кодирование речевого сигнала, включают, но при этом без каких-либо ограничений, системы речевой почты, системы сотовой радиотелефонной связи, междугородние системы связи, системы связи на воздушных линиях и т.п.
Одним из способов подавления шума, который используется в системах сотовой радиотелефонной связи, основан на вычитании спектров. При данном способе входной аудиосигнал разделяется на отдельные спектральные полосы (каналы) с помощью соответствующего устройства разделения спектра, и в отдельные спектральные каналы затем вводится ослабление в соответствии с содержанием энергии шума в каждом канале. Способ вычитания спектров использует оценку спектральной плотности мощности фонового шума для формирования отношения сигнал/шум для речевого сигнала в каждом канале, которое, в свою очередь, используется для вычисления коэффициента усиления в каждом отдельном канале. Коэффициент шума затем используется для изменения усиления канала для каждого из отдельных спектральных каналов. Затем каналы повторно объединяются для формирования выходного сигнала с подавленным шумом. Примером способа вычитания спектров, реализованного в аналоговой системе сотовой радиотелефонной связи, может служить способ, описанный в патенте США N 4811404 на имя Вилмура, переуступленный правопреемнику настоящего изобретения.
Как указано в упомянутом патенте США, известные способы подавления шумов оказываются неэффективными при внезапном резком возрастании уровня фонового шума. Для преодоления недостатков способов, известных из предшествующего уровня техники, в патенте Вилмура предлагается выполнять принудительное обновление оценки шума, независимо от суммы метрик речевого сигнала, если M кадров проходят без обновления оценки фонового шума, где M рекомендовано выбирать между 50 и 300. Поскольку в указанном патенте рассматривается кадр длительностью 10 мс, то при выборе M = 100 обновление будет происходить по меньшей мере каждую секунду, независимо от суммы метрик речевого сигнала (т. е. независимо от того, необходимо ли такое обновление или нет).
Осуществление принудительного обновления оценки шума независимо от метрики речевого сигнала может привести к ослаблению пользовательского речевого сигнала несмотря на тот факт, что не произошло добавления фонового шума. Это, в свою очередь, приводит к ухудшению качества аудиосигнала, как это воспринимается конечным пользователем. Кроме того, входные сигналы, иные, чем пользовательский речевой сигнал (например, музыка), могут вызвать проблемы, связанные с тем, что принудительное обновление оценки шума будет происходить на продолжительных интервалах. Это обусловлено тем обстоятельством, что музыка может занимать интервал несколько секунд (или минут) без достаточных пауз, что обеспечило бы нормальное обновление оценки фонового шума. В известном способе поэтому производится принудительное обновление каждые M кадров, поскольку отсутствует механизм различения фонового шума от нестационарных входных сигналов. Такое некорректное принудительное обновление не только вносит ослабление во входной сигнал, но и вызывает значительные искажения, поскольку спектральная оценка обновляется на основании изменяющегося во времени нестационарного входного сигнала.
Таким образом, существует потребность в более точной и надежной системе подавления шума для использования в системах связи.
Фиг. 1 - блок-схема устройства кодирования речевого сигнала для использования в системе связи.
Фиг. 2 - блок-схема системы подавления шума, соответствующей изобретению.
Фиг. 3 - иллюстрация перекрытия кадров, которое происходит в системе подавления шума, соответствующей изобретению.
Фиг. 4 - иллюстрация трапецеидального кадрирования выборок с предыскажением, имеющего место в системе подавления шума, соответствующей изобретению.
Фиг. 5 - блок-схема устройства оценки спектрального отклонения, показанного на фиг. 2 и используемого в системе подавления шума, соответствующей изобретению.
Фиг. 6 - блок-схема последовательности операций, выполняемых в устройстве принятия решения об обновлении, показанном на фиг. 2 и используемом в системе подавления шума, соответствующей изобретению.
Фиг. 7 - блок-схема системы связи, в которой может быть использована система подавления шума, соответствующая изобретению.
Фиг. 8 - графическое представление переменных, связанных с подавлением шума в речевом сигнале в соответствии с предшествующим уровнем техники.
Фиг. 9 - графическое представление переменных, связанных с подавлением шума в речевом сигнале, реализованным в системе подавления шума в соответствии с изобретением
Фиг. 10 - графическое представление переменных, связанных с подавлением шума в сигнале музыки в соответствии с предшествующим уровнем техники.
Фиг. 11 - графическое представление переменных, связанных с подавлением шума в сигнале музыки, реализованным в системе подавления шума в соответствии с изобретением.
Система подавления шума, реализованная в системе связи, обеспечивает улучшенное принятие решения об обновлении в случаях внезапного возрастания уровня фонового шума. Система подавления шума генерирует, в числе прочего, обновление оценки путем непрерывного контроля отклонения спектральной энергии и принудительного обновления на основе предварительно определенного порогового критерия. Отклонение спектральной энергии определяется с использованием элемента, который использует прошлые значения компонент спектральной мощности с экспоненциальным взвешиванием. Экспоненциальное взвешивание представляет собой функцию текущей входной энергии, которая означает, что чем выше энергия входного сигнала, тем длиннее экспоненциальное окно. И наоборот, чем ниже энергия сигнала, тем короче экспоненциальное окно. Тем самым система подавления шума запрещает принудительное обновление на интервалах непрерывных нестационарных входных сигналов, таких как музыкальные.
В принципе устройство кодирования речевых сигналов воплощает в себе систему подавления шума в системе связи. Система связи передает выборки речевого сигнала с использованием информационных кадров в каналах, причем информационные кадры в каналах содержат в себе шум. Устройство кодирования речевых выборок в качестве входного сигнала использует выборки речевого сигнала, а средство для подавления шума, основанное на отклонении в спектральной энергии между текущим кадром выборок речевого сигнала и средней спектральной энергией множества прошлых кадров выборок речевого сигнала для формирования выборок речевого сигнала с подавленным шумом, осуществляет подавление шума в кадре выборок речевого сигнала. Средство кодирования выборок речевого сигнала с подавленным шумом затем кодирует выборки речевого сигнала с подавленным шумом для передачи их системой связи. В предпочтительном варианте осуществления устройство кодирования находится либо в составе централизованного контроллера базовых станций (ЦКБС), либо в мобильной станции (МС) системы связи. Однако в других вариантах осуществления устройство кодирования речевого сигнала может находиться либо в центре коммутации мобильных станций (ЦКМС), либо в базовой приемопередающей станции (БПС). Также в предпочтительном варианте осуществления устройство кодирования речевого сигнала реализуется в системе связи с множественным доступом с кодовым разделением каналов (МДКР), однако специалистам в данной области техники должно быть ясно, что устройство кодирования и система подавления шума, соответствующие настоящему изобретению, могут применяться в системах связи различных других типов.
В предпочтительном варианте осуществления средство для подавления шума в кадре выборок речевого сигнала содержит средство для оценки полной энергии канала в текущем кадре выборок речевого сигнала на основании оценки энергии канала и средство для оценки мощности спектров текущего кадра выборок речевого сигнала на основании оценки энергии канала. Также используется средство для оценки мощности спектров множества прошедших кадров выборок речевого сигнала на основе оценки мощности спектров текущего кадра. С использованием этой информации средство для определения отклонения между оценкой спектров текущего кадра и оценкой мощности спектров множества прошедших кадров определяет спектральное отклонение, как установлено, а также используется средство для обновления оценки шума канала на основании оценки полной энергии канала и полученного отклонения. На основании обновления оценки шума средство для изменения усиления канала изменяет усиление канала для формирования выборок речевого сигнала с подавленным шумом.
В предпочтительном варианте осуществления средство для оценки мощности спектров множества прошедших кадров информации, кроме того, содержит средство для оценки мощности спектров множества прошедших кадров на основе экспоненциального взвешивания прошедших кадров информации, причем экспоненциальное взвешивание прошедших кадров информации является функцией оценки полной энергии канала в текущем кадре информации. Также в предпочтительном варианте осуществления средство для обновления оценки шума канала, основанной на оценке полной энергии канала и полученного отклонения, также содержит средство для обновления оценки шума канала на основе сравнения оценки энергии полного канала с первым порогом и сравнения полученного отклонения с вторым порогом. Более конкретно, средство для обновления оценки шума канала на основании сравнения оценки полной энергии канала с первым порогом и сравнения полученного отклонения с вторым порогом, кроме того, содержит средство для обновления оценки шума канала, когда оценка полной энергии канала выше, чем первый порог, для первого предварительно определенного количества кадров без второго предварительно определенного количества последовательных кадров, имеющих оценку полной энергии канала, меньшую или равную первому порогу, причем когда полученное отклонение ниже второго порога. В предпочтительном варианте осуществления первое предварительно определенное количество кадров равно 50, в то время как второе предварительно определенное количество последовательных кадров равно шести.
На фиг. 1 представлена блок-схема устройства кодирования речевого сигнала 100, предназначенного для использования в системе связи. В предпочтительном варианте осуществления устройство кодирования речевого сигнала 100 представляет собой устройство кодирования речевого сигнала с переменной скоростью, обеспечивающее подавление шума в системе связи с МДКР, совместимой со Временным Стандартом (IS) 95 (см. TIA/EIA/IS-95, Mobile Station-Base Station Compatibility Standard for Dual Mode Wideband Spread Spectrum Cellular System, July 1993). Кроме того, в предпочтительном варианте осуществления устройство кодирования с переменной скоростью 100 поддерживает три или четыре скорости передачи бит, предусмотренные стандартом IS-965, полную скорость (скорость 1 - 170 бит/кадр), половинную скорость (скорость 1/2 - 80 бит/кадр) и одну восьмую скорости (скорость 1/8 - 16 бит/кадр). Специалистам в данной области техники должно быть ясно, что приведенный вариант осуществления описан здесь только для примера, и устройство кодирования 100 совместимо с многими другими типами систем связи.
Показанное на фиг. 1 средство для кодирования выборок речевого сигнала с подавленным шумом 102 основано на хорошо известном алгоритме остаточного линейного предсказания с кодовым возбуждением (ОЛПКВ) (см., например, W.B. KIeijn, P. Kroon, D. Nahumi, "The RCELP Speech-Coding Algorithm", European Transactions on Telecommunications, Vol. 5, N 5, Sept/Oct 1994, pp. 573-582). Более подробная информация об алгоритме ОЛПКВ, соответствующим образом модифицированном для работы в условиях переменных скоростей передачи и обеспечения надежности в условиях МДКР, содержится в работе D. Nahumi, W.B. Kleijn "An Improved 8 kb/s RCELP coder", Proc. ICASSP 1995. Алгоритм ОЛПКВ является обобщением алгоритма линейного предсказания с кодовым возбуждением (ЛПКВ) (см. B.S. Atal, M.R. Schroeder, "Stochastic coding of speech at very low bit rates", Proc Int. Conf. Comm., Amsterdam, 1984, pp. 1610-1613).
Хотя вышеуказанные работы содержат подробные сведения об алгоритме ОЛПКВ/ЛПКВ, однако представляется целесообразным представить краткие сведения о работе алгоритма ОЛПКВ. В отличие от кодирующих устройств, работающих в соответствии с алгоритмом ЛПКВ, алгоритм ОЛПКВ не предназначен для обеспечения точного согласования с исходным пользовательским речевым сигналом. Напротив, алгоритм ОЛПКВ приводит в соответствие "трансформированную во времени" версию исходного остатка, которая согласуется с упрощенным профилем основного тона пользовательского речевого сигнала. Профиль основного тона пользовательского речевого сигнала получается путем оценивания задержки основного тона один раз в каждом кадре и линейного интерполирования основного тона от кадра к кадру. Преимущество использования такого упрощенного представления основного тона состоит в том, что больше бит предоставляются в распоряжение в каждом кадре для стохастического возбуждения и защиты от искажений в канале, чем это имело бы место при использовании традиционного подхода с использованием долей основного тона. Это приводит к улучшению характеристики ошибки кадра и не оказывает влияния на воспринимаемое качество речи при условиях свободного канала.
Как показано на фиг. 1, на входы устройства кодирования 100 речевого сигнала подаются вектор речевого сигнала s(n) 103 и внешний сигнал команды о скорости 106. Вектор речевого сигнала 103 может быть сформирован из аналогового входного сигнала путем дискретизации с частотой 8000 выборок/с и линейного (равномерного) квантования полученных выборок речевого сигнала в динамическом диапазоне по меньшей мере 13 бит. Как вариант, вектор речевого сигнала 103 может быть сформирован из входного 8-битового сигнала с функцией вида μ путем преобразования в регулярный формат с импульсно-кодовой модуляцией (ИКМ) согласно Таблице 2 Рекомендации Международного Телекоммуникационного Союза ITU-T G.711. Внешний сигнал команды о скорости 106 может управлять устройством кодирования для формирования пустого пакета или т.п. вместо пакета скорости 1. Если принят внешний сигнал команды о скорости 106, то этот сигнал 106 заменяет собой внутренний механизм выбора скорости устройства кодирования 100.
Вектор входного речевого сигнала 103 подается на средство для подавления шума 101, которое в предпочтительном варианте осуществления представляет собой систему подавления шума 109. Система подавления шума 109 выполняет подавление шума в соответствии с изобретением. Вектор речевого сигнала с подавленным шумом s'(n) 112 затем подается как на модуль определения скорости 115, так и на модуль оценки параметров модели 118. Модуль определения скорости 115 использует алгоритм обнаружения речевой активности и логику выбора скорости для определения типа скорости пакета (скорость 1/8, 1/2 или 1), которая должна быть сформирована. Модуль оценки параметров модели 118 выполняет анализ путем кодирования методом линейного предсказания (КМЛП) для формирования параметров модели 121. Параметры модели включают набор коэффициентов линейного предсказания (КЛП) и оптимальную задержку основного тона (t). Модуль оценки параметров модели 118 также преобразует КЛП в линейные спектральные пары (ЛСП) и вычисляет долгосрочные и краткосрочные прогнозируемые коэффициенты усиления.
Параметры модели 121 вводятся в модуль кодирования с переменной скоростью 124, который определяет параметры сигнала возбуждения и квантует параметры модели 121 способом, соответствующим выбранной скорости. Информация о скорости получается из сигнала принятия решения о скорости 139, который также вводится в модуль кодирования с переменной скоростью 124. Если выбрана скорость 1/8, то модуль кодирования с переменной скоростью 124 не будет пытаться определять периодичность в остатке речевого сигнала, а просто будет определять его профиль энергии. Для скорости 1/2 и скорости 1 модуль кодирования с переменной скоростью 124 будет применять алгоритм ОЛПКВ для обеспечения согласования трансформированной во времени версии остатка исходного пользовательского речевого сигнала. После кодирования модуль форматирования пакета 133 принимает все параметры, вычисленные и/или квантованные в модуле кодирования с переменной скоростью 124, и форматирует пакет 136 соответственно выбранной скорости. Сформатированный пакет 136 затем подается на субуровень мультиплексирования для дальнейшей обработки, как и сигнал принятия решения о скорости 139. Дополнительная информация о работе устройства кодирования речевого сигнала 100 содержится в документе IS-127 "EVRC Draft Standard (IS-127)", версия 1, номер TR45.5.1.1/95.10.17.06 от 17 октября 1995.
На фиг. 2 показана блок-схема усовершенствованной системы подавления шума 109, соответствующей изобретению. В предпочтительном варианте осуществления система подавления шума 109 используется для улучшения качества сигнала, который подается на модуль оценки параметров модели 118 и на модуль определения скорости 115 устройства кодирования речевого сигнала 100. Однако функционирование системы 109 подавления шума является настраиваемым в том смысле, что она может работать с любым типом устройства кодирования, который разработчик пожелает ввести в конкретную систему связи. Следует отметить, что различные блоки, показанные на фиг. 2 настоящей заявки, работают аналогичным образом, как соответствующие блоки на фиг. 1 в вышеупомянутом патенте США N 4811404.
Система подавления шума 109 содержит фильтр верхних частот 200 и остальные схемы подавителя шума. Выходной сигнал shp(n) фильтра верхних частот 200 используется в качестве входного сигнала для остальных схем подавителя шума. Хотя размер кадра устройства кодирования речевого сигнала равен 20 мс (как определено стандартом IS-95), размер кадра для остальных схем подавителя шума равен 10 мс. Следовательно, в предпочтительном варианте осуществления этапы выполнения подавления шума в соответствии с изобретением выполняются два раза на каждый кадр речевого сигнала длительностью 20 мс.
Для начала подавления шума в соответствии с изобретением входной сигнал s(n) фильтруется в фильтре верхних частот 200 для формирования сигнала shp(n). Фильтр верхних частот 200 представляет собой чебышевский фильтр типа П четвертого порядка с частотой отсечки 120 Гц, хорошо известный из предшествующего уровня техники. Передаточная функция фильтра верхних частот 200 определяется следующим образом:
где соответствующие коэффициенты числителя и знаменателя определяются в следующем виде:
b = {0.898025036, -3.59010601, 5.38416243, -3.59010601, 0.898024917};
a = {1.0 -3.78284979, 5.37379122, -3.39733505, 0.806448996}.
Специалистам в данной области техники должно быть ясно, что могут использоваться любые конфигурации фильтров верхних частот.
Затем в блоке предыскажений 203 сигнал shp(n) подвергается обработке окном с использованием сглаженного трапецеидального окна, в котором первые D выборок d(m) (кадра m) перекрываются, начиная от последних D выборок предыдущего кадра (кадр m-1). Это перекрытие лучше всего видно на фиг. 3. Если иное не установлено, все переменные имеют начальные значения, равные нулю, т.е. d(m) = 0; m ≅ 0. Это может быть записано в следующем виде:
d(m,n) = d(m-1,L+n); 0 ≅ n < D,
где m - текущий кадр, n - индекс выборки для буфера {d(m)}, L = 80 - длина кадра и D = 24 - перекрытие (или задержка) в выборках. Остальные выборки входного буфера затем подвергаются предыскажению в соответствии со следующим соотношением:
d{m,D+n) = shp(n) + ζpshp(n-1); 0 ≅ n < L,
где ζp = -0,8 коэффициент предыскажений. В результате этого во входном буфере содержится L+D = 104 выборки, причем первые D выборок имеют предыскажения и перекрываются с предыдущим кадром, а последующие L выборок являются входными из текущего кадра.
Затем в блоке обработки окном 204 по фиг. 2 используется сглаженное трапецеидальное окно 400 (фиг. 4) для обработки выборок для формирования дискретного преобразования Фурье (ДПФ) входного сигнала g(n). В предпочтительном варианте осуществления g(n) определяется следующим образом:
где M = 128 - длина последовательности ДПФ, а все другие параметры определены выше.
В блоке разделения каналов 206 по фиг. 2 преобразование g(n) в частотную область выполняется с использованием дискретного преобразования Фурье (ДПФ), определяемого в следующем виде:
где ejω - комплексный вектор единичной амплитуды с мгновенным радиальным положением ω, Это нетипичное определение, однако оно позволяет использовать эффективность комплексного быстрого преобразования Фурье (БПФ). Масштабный коэффициент 2/M является результатом предварительной обработки M-точечной действительной последовательности для формирования M/2-точечной комплексной последовательности, которая преобразуется с использованием M/2-точечного комплексного БПФ. В предпочтительном варианте осуществления сигнал G(k) содержит 65 уникальных каналов. Детали этого способа подробно описаны в работе Proakis, Manolakis, Introduction to Digital Signal Processing, 2nd Edition, New York, Macmillan, 1988, pp. 721-722.
Сигнал G(k) затем вводится в устройство оценки энергии канала 109, где оценка энергии канала Ech(m) для текущего кадра m определяется с использованием следующих соотношений:
0 ≅ i < Nc,
где Emin = 0,0625 - минимальная допустимая энергия канала, αch(m) - коэффициент сглаживания энергии канала (определен ниже), Nc = 16 - число объединяемых каналов и fL(i) и fH(i) - i-е элементы таблиц объединения соответственно нижних и верхних каналов. В предпочтительном варианте осуществления fL и fH определяются следующим образом:
fL = {2, 4, 6, 8, 10, 12, 14, 17, 20, 23, 27, 31, 36, 42, 49, 56};
fH = {3, 5, 7, 9, 11, 13, 16, 19, 22, 26, 30, 35, 41, 48, 55, 63).
Коэффициент сглаживания энергии канала αch(m) может быть определен следующим образом:
что означает, что αch(m) имеет нулевое значение для первого кадра (m = 1) и значение 0,45 для всех последующих кадров. Это позволяет инициализировать оценку энергии канала для нефильтрованной энергии канала первого кадра. Кроме того, оценка энергии шума канала (как определено ниже) должна быть инициализирована для энергии канала первого кадра, т.е.
En(m,i) = max{Einit,Ech(m,i)}; m = 1,0 ≅ i < Nc,
где Einit = 16 - минимальная допустимая энергия инициализации шума канала.
Оценка энергии канала Ech(m) для текущего кадра затем используется для оценки квантованных показателей отношения сигнал/шум канала. Эта оценка выполняется в устройстве оценки отношения сигнал/шум (С/Ш) 218 по фиг. 2 и определяется следующим образом:
где En(m) - текущая оценка энергии шума канала (как определено ниже), а значение {σq} ограничено для попадания в пределы от 0 до 89 включительно.
С использованием оценки С/Ш канала {σq} сумма метрик речевого сигнала определяется в вычислителе метрик речевого сигнала 215 с использованием соотношения
где V(k) - k-е значение таблицы метрик речевого сигнала из 90 элементов, которая определена следующим образом:
V = {2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 4, 4, 4, 5, 5, 5, 6, 6, 7, 7, 7, 8, 8, 9, 9, 10, 10, 11, 12, 12, 13, 13, 14, 15, 15, 16, 17, 17, 18, 19, 20, 20, 21, 22, 23, 24, 24, 25, 26, 27, 28, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 50, 50, 50, 50, 50, 50, 50, 50, 50).
Оценка Ech(m) для текущего кадра также используется в качестве входного сигнала для устройства оценки спектрального отклонения 210, которое оценивает спектральное отклонение ΔE(m). Как показано на фиг. 5, оценка энергии канала Ech(m) вводится в логарифмическое устройство оценки спектральной мощности 500, где логарифм спектров мощности оценивается следующим образом:
EdB(m,i) = 10log10(Ech(m,i)), 0 ≅ i < Nc.
Оценка энергии канала Ech(m) для текущего кадра вводится также в устройство оценки полной энергии канала 503 для определения оценки полной энергии канала Etot(m) для текущего кадра m в соответствии со следующим соотношением:
Затем коэффициент экспоненциального кадрирования (обработки окном) (m) (в функции от полной энергии канала Etot(m)) определяется в устройстве определения коэффициента экспоненциального кадрирования 506 с использованием соотношения
которое ограничено между αH и αL в соответствии с соотношением
α(m) = max{αL,min{αH,α(m)}},
где EH и EL - предельные значения энергии (в децибеллах) для линейной интерполяции Etot(m), которая трансформируется в α(m), имеющее пределы αL≅α(m)≅αH. Значения этих констант определены следующим образом: EH = 50, EL = 30, αH = 0,99; αL = 0,50. При таких условиях сигнал с относительной энергией, например 40 дБ, будет использовать коэффициент экспоненциального кадрирования α(m) = 0,745 при использовании вышеизложенных вычислений.
Спектральное отклонение ΔE(m) затем оценивается в устройстве оценки спектрального отклонения 509. Спектральное отклонение ΔE(m) представляет собой разность между текущим спектром мощности и усредненной долговременной спектральной оценкой мощности вида
где является усредненной долговременной спектральной оценкой мощности, которая определяется в устройстве долговременной оценки спектральной энергии 512 с использованием соотношения
0 ≅ i < Nc,
где все переменные определены выше. Первоначальное значение определяется как оценка логарифма спектров мощности кадра 1 или
= EdB(m); m = 1.
В данный момент сумма метрик речевого сигнала v(m), оценка полной энергии канала для текущего кадра Etot(m) и спектральное отклонение ΔE(m) вводятся в устройство определения решения об обновлении 212 для осуществления процедуры подавления шума в соответствии с изобретением. Логика принятия решения, показанная ниже в виде псевдокода и представленная в виде блок-схемы соответствующей процедуры на фиг. 6, показывает, как в конечном счете принимается решение об обновлении оценки шума. Процедура начинается на этапе 600 и переходит к этапу 603, где очищается флаг обновления (update_ flag). Затем на этапе 604 реализуется логика обновления (только сумма метрик речевого сигнала) согласно вышеупомянутому патенту Вилмура путем проверки, является ли сумма метрик речевого сигнала v(m) меньшей, чем порог обновления (UPDATE_ THLD). Если сумма метрик речевого сигнала меньше, чем порог обновления, то счетчик обновления (update_cnt) очищается на этапе 605 и на этапе 606 устанавливается флаг обновления. Псевдокод для этапов 603-606 показан ниже:
update_flag = FALSE;
if (v(m) ≅ UPDATE_THLD) {
update_flag = TRUE
update_cnt = 0
}
Если сумма метрик речевого сигнала больше, чем порог обновления на этапе 604, то реализуется подавление шума, выполняемое в соответствии с изобретением. Во-первых, на этапе 607 оценка полной энергии канала Etot(m) для текущего кадра m сравнивается с уровнем собственных шумов в дБ (NOISE_FLOOR_DB), а спектральное отклонение ΔE(m) сравнивается с порогом отклонения (DEV_ THLD). Если оценка полной энергии канала больше уровня собственных шумов, а спектральное отклонение меньше порога отклонения, то счетчик обновления получает приращение на этапе 608. После того, как счетчик обновления получил приращение, выполняется проверка на этапе 609 для определения того, больше ли значение счетчика обновления или равно порогу счетчика обновления (UPDATE_ CNT_THLD). При положительном результате проверки на этапе 609 затем на этапе 606 устанавливается флаг обновления. Псевдокод для этапов 607-609 и 606 имеет вид
else if ((Etot(m) > NOISE_FLOOR_DB) and ( ΔE(m) < DEV_THLD)) {
update_cnt = update_cnt + 1
if (update_cnt ≥ UPDATE_CNT_THLD)
update_flag = TRUE
}
Как можно видеть из фиг. 6, если любая из проверок на этапах 607 и 609 даст отрицательный результат, то после того как флаг обновления был установлен на этапе 606, реализуется логика, предотвращающая долговременное "сползание" счетчика обновления. Эта гистерезисная логика реализуется для предотвращения накопления минимальных спектральных отклонений в течение длительных периодов, что приводит к некорректному вынужденному обновлению. Процедура начинается на этапе 610, где выполняется проверка для определения того, было ли значение счетчика обновления равно последнему значению счетчика обновления (last_ update_cnt) в течение последних шести кадров (HYSTER_ CNT_ THLD). В предпочтительном варианте осуществления шесть кадров используются как порог, однако может использоваться любое другое количество кадров. Если результат проверки на этапе 610 положителен, то счетчик обновления очищается на этапе 611 и процедура переходит к следующему кадру на этапе 612. Если результат проверки на этапе 610 отрицательный, то процедура осуществляет выход к следующему кадру на этапе 612. Псевдокод для этапов 610-612 показан ниже:
if (update_cnt = = last_update_cnt)
hyster_cnt = hyster_cnt + 1
else
hyster_cnt = 0
last_update_cnt = update_cnt
if (hyster_cnt > HYSTER_CNT_THLD)
update_cnt = 0.
В предпочтительном варианте осуществления значения предварительно использованных констант следующие:
UPDATE_THLD = 35,
NOISE_FLOOR_DB = 10log10(1),
DEV_THLD = 28,
UPDATE_CNT_THLD = 50, and
HYSTER_CNT_THLD = 6.
Если флаг обновления на этапе 606 установлен для конкретного кадра, то оценка шума канала для следующего кадра будет обновляться в соответствии с изобретением. Оценка шума канала обновляется в сглаживающем фильтре 224 с использованием соотношения
En(m+1,i) = max{Emin, αn En(m,i) + (1 - αn )Ech(m,i)}; 0 ≅ i < Nc,
где Emin = 0,0625 - минимальная допустимая энергия канала, αn = 0,9 - коэффициент сглаживания шума канала, запомненный локально в сглаживающем фильтре 224. Обновленная оценка шума канала запоминается в блоке хранения оценки энергии 225, причем выходной сигнал блока хранения оценки энергии 225 представляет собой обновленную оценку шума канала En(m). Обновленная оценка шума канала En(m) используется в качестве входного сигнала в устройство оценки отношения С/Ш канала 218, как описано выше, а также в вычислитель усиления 233, как будет описано ниже.
Затем система подавления шума 109 определяет, следует ли производить изменение отношения С/Ш канала. Это определение выполняется в блоке изменения отношения С/Ш канала 227, который подсчитывает количество каналов, которые имеют значения показателя С/Ш канала, превышающие порог показателя. В течение собственно процедуры изменения блок изменения отношения С/Ш канала 227 уменьшает отношение С/Ш тех каналов, которые имеют показатель С/Ш меньше, чем установленный порог (SETBACK_THLD), или уменьшает отношение С/Ш всех каналов, если сумма метрик речевого сигнала меньше, чем порог метрик (METRIC_ THLD). Псевдокод процедуры изменения отношения С/Ш канала, осуществляемой в блоке изменения отношения С/Ш 227, представлен на схеме 1 (см. в конце описания).
В данный момент показатели С/Ш канала ограничиваются порогом отношения С/Ш в пороговом блоке 230. Постоянная σth запоминается локально в пороговом блоке отношения С/Ш 230. Псевдокод для процедуры, выполняемой в пороговом блоке 230, представлен на схеме 2.
В предпочтительном варианте вышеупомянутые константы и пороги имеют следующие значения:
NM = 5,
INDEX_THLD = 12,
INDEX_CNT_THLD = 5,
METRIC_THLD = 45,
SETBACK_THLD = 12, and
σth = 6.
В данный момент ограниченные показатели вводятся в вычислитель усиления 233, где определяются усиления каналов. Во-первых, определяется общий коэффициент усиления с использованием следующего соотношения:
где γmin = -13 - минимальное общее усиление, Efloor - энергия собственных шумов и En(m) - оценка шумового спектра, вычисленная в течение предыдущего кадра. В предпочтительном варианте осуществления константы γmin и En(m) запоминаются локально в блоке вычисления усиления 233. Затем усиления каналов (в дБ) определяются с использованием следующего соотношения:
где μg = 0,39 - крутизна характеристики усиления (также запоминается локально в блоке вычисления 233). Линейные усиления каналов затем преобразуются с использованием соотношения
0 ≅ i < Nc.
В данный момент определенные выше коэффициенты усиления каналов используются с преобразованными входными сигналами G(k) при следующих критериях для формирования выходного сигнала H(k) с блока изменения усиления канала 239:
Условие "в противном случае" в вышеприведенном уравнении означает, что интервал для k должен быть 0 ≅ k ≅ M/2. Кроме того, предполагается, что H(k) имеет четную симметрию, так что накладывается следующее условие:
H(M-k) = H(k), 0 < k < M/2.
Сигнал H(k) затем преобразуется обратно во временную область в блоке объединения 242 с использованием инверсного ДПФ:
0 ≅ n < M,
и процесс фильтрации в частотной области завершается для формирования выходного сигнала h'(n) путем использования процедуры наложения и суммирования при соблюдении следующих критериев:
Компенсация предыскажений сигнала применяется к сигналу h'(n) в блоке компенсации предыскажений 245 для формирования сигнала s'(n), в котором шумы подавлены в соответствии с изобретением:
s'{n) = h'{n) + ζd s'(n-1); 0 ≅ n < L,
где ζd = 0,8 - коэффициент компенсации предыскажений, запомненный локально в блоке компенсации предыскажений 245.
На фиг. 7 представлена блок-схема системы связи 700, в которой может быть реализована система подавления шума в соответствии с изобретением В предпочтительном варианте осуществления система связи представляет собой систему сотовой радиотелефонной связи с МДКР. Специалистам в данной области техники, однако, должно быть ясно, что система подавления шума, соответствующая изобретению, может быть реализована в любой системе связи, которая может получить преимущества от использования упомянутой системы. К таким системам относятся системы речевой почты, системы сотовой радиотелефонной связи, системы междугородной связи, системы связи по воздушным каналам и т. п. Важно отметить, что система подавления шума, соответствующая изобретению, может быть реализована в системах связи, которые не включают кодирование речевых сигналов, например в аналоговых системах сотовой радиотелефонной связи.
На фиг. 7 для удобства использованы следующие сокращения:
БПС - базовая приемопередающая станция
ЦКБС - централизованный контроллер базовой станции
ЭК - эхокомпенсатор
РМВ - регистр местонахождения "визитеров"
РМП - регистр места приписки
ЦСКУ - цифровая сеть с комплексными услугами
МС - мобильная станция
ЦКМС - центр коммутации мобильных станций
АМ - администратор мобильности
ЦЭОПР - центр эксплуатации и обслуживания подсистемы радиосвязи
ЦЭОПК - центр эксплуатации и обслуживания подсистемы коммутации
КТСОП - коммутируемая телефонная сеть общего пользования
ТК - транскодер
Как показано на фиг. 7, БПС 701-703 связаны с ЦКБС 704. Каждая БПС 701-703 обеспечивает радиочастотную связь с МС 705-706. В предпочтительном варианте осуществления приемопередатчики в БПС 701-703 и в МС 705-706 для поддержания радиочастотной связи определены в документе TIA/EIA/IS-95, Mobile Station-Base Station Compatibility Standard for Dual Mode Wideband Spread Spectrum Cellular System, July 1993, предоставляемом в распоряжение Ассоциацией отраслей промышленности телекоммуникаций (TIA). ЦКБС 704 несет ответственность, в числе прочего, за обработку вызовов посредством ТК 710 и управление мобильностью посредством АМ 709. В предпочтительном варианте функциональные средства устройства кодирования речевого сигнала 100 по фиг. 2 содержатся в ТК 710. Другие задачи ЦКБС 704 включают контроль параметров и обеспечение сопряжения между передачами и сетью. Более подробная информация о ЦКБС 704 содержится в заявке на патент США N 07/997997Ю на имя Бэча и др., переуступленной правопреемнику настоящей заявки.
На фиг. 7 также показан блок ЦЭОПР 712, связанный с АМ 709 ЦКБС 704. Блок ЦЭОПР 712 обеспечивает эксплуатацию и техническое обслуживание подсистемы радиосвязи (комбинации ЦКБС 704 и БПС 701-703) системы связи 700. ЦКБС 704 связано ЦКМС 715, который обеспечивает коммутацию между КТСОП 720/ЦСКУ 722 и ЦКБС 704. Блок ЦЭОПК 724 обеспечивает эксплуатацию и обслуживание подсистемы коммутации (ЦКМС 715) системы связи 700. РМП 716 и РМВ 717 обеспечивают систему связи информацией о пользователях, используемой главным образом для целей выставления счетов за услуги. ЭК 711 и 719 использованы для улучшения качества речевого сигнала, передаваемого в системе связи 700.
Функциональные средства ЦКБС 704, ЦКМС 715, РМП 716 и РМВ 717 показаны на фиг. 7 как распределенные, однако специалистам в данной области техники должно быть ясно, что эти функциональные средства могут быть точно так же сконцентрированы в едином элементе. Кроме того, в других конфигурациях ТК 710 может быть расположен как в ЦКМС 715, так и в БПС 701-703. Поскольку функциональные средства системы подавления шума 109 настраиваются, настоящее изобретение предусматривает и выполнение подавления шума в соответствии с изобретением в одном элементе (например, ЦКМС 715), в то время как выполнение функции кодирования речевого сигнала может выполняться в другом элементе (например, ЦКБС 704). В таком варианте осуществления сигнал с подавленным шумом s'(n) (или данные, представляющие сигнал s'(n) с подавленным шумом) будет передаваться из ЦКМС 715 в ЦКБС 704 по каналу 726.
В предпочтительном варианте ТК 710 выполняет подавление шума в соответствии с изобретением с использованием системы подавления шума 109 по фиг. 2. Канал 726, связывающий ЦКМС 715 и ЦКБС 704, представляет собой канал T1/E1, хорошо известный в технике. При размещении ТК 710 в ЦКБС реализуется улучшение использования ресурса канала в отношении 4:1 вследствие сжатия входного сигнала (входа из канала T1/E1 726) посредством ТК 710. Сжатый сигнал передается в конкретную БПС 701-703 для передачи к конкретному МС 705-706. Важно отметить, что сжатый сигнал, передаваемый к конкретной БПС 701-703, подвергается дополнительной обработке в БПС 701-703 перед осуществлением передачи. Иными словами, конечный сигнал, передаваемый к МС 705-706, отличается по форме, но по существу он тот же самый, что и сжатый сигнал на выходе ТК 710. В любом случае сжатый сигнал на выходе ТК 710 подвергается подавлению шума в соответствии с изобретением с использованием системы подавления шума 109 (как показано на фиг. 2).
Когда МС 705-706 принимает сигнал, переданный БПС 701-703, МС 705-706 будет по существу "отменять" (обычно это определяется как "декодирование") всю обработку, проделанную в БПС 701-703, и речевое кодирование, осуществленное в ТК 710. Если МС 705-706 передает сигнал обратно к БПС 701-703, то МС 705-706 аналогичным образом реализует кодирование речевого сигнала. Таким образом, устройство кодирования речевого сигнала 100 по фиг. 1 находится в МС 705-706, и подавление шума, как таковое, в соответствии с изобретением также выполняется в МС 705-706. После того как сигнал, прошедший подавление шума, передан от МС 705-706 (МС также выполняет другую обработку сигнала для изменения формы, но не сущности сигнала) на БПС 701-703, то БПС 701-703 будет "отменять" обработку, выполненную над сигналом, и передавать результирующий сигнал в ТК 710 для декодирования речевого сигнала. После декодирования речевого сигнала с помощью ТК 710 сигнал передается конечному пользователю посредством канала T1/E1 726. Поскольку как конечный пользователь, так и пользователь в МС 705-706 в конечном счете принимают сигнал, прошедший подавление шума в соответствии с изобретением, каждый пользователь способен реализовать преимущества, обеспечиваемые системой подавления шума 109 устройства кодирования 100.
На фиг. 8 показаны переменные, связанные с подавлением шума речевого сигнала, как это обеспечивается в предшествующем уровне техники, в то время как на фиг. 9 показаны переменные, связанные с подавлением шума речевого сигнала, как это обеспечивается в системе подавления шума, соответствующей изобретению. Здесь различные графики показывают значения различных переменных состояния в функции номера кадра m, как показано на горизонтальной оси. Первый график на каждой из фиг. 8 и фиг. 9 показывает полную энергию канала Etot(m), за которым следуют график суммы метрик речевого сигнала v(m), график значения счетчика обновления (update_cnt или TIMER в вышеупомянутом патенте Вилмура), график флага обновления (update_flag), график суммы оценок шума канала (Σ En(m,i)) и график ослабления оцениваемого сигнала, 10 log10(Einput/Eoutput), где входной сигнал shp(n), а выходной сигнал s'(n).
Как показано на фиг. 8 и на фиг. 9, увеличение фонового шума можно наблюдать на графике 1 как раз перед кадром 600. Перед кадром 600 входной сигнал был "чистым" речевым сигналом 801 (с низким фоновым уровнем). Когда возникает резкое возрастание фонового уровня 803, сумма метрик речевого сигнала v(m), показанная на графике 2, пропорционально возрастает, т.е. эффективность известного способа подавления шума низка. Возможность восстанавливаться из этого состояния иллюстрируется на графике 3, где счетчик обновления (update_ cnt) имеет возможность приращения до тех пор, пока не выполняется обновление. Этот пример показывает, что счетчик обновления достигает порога обновления (UPDATE_CNT_THLD), равного 300 (для случая патента Вилмура) в процессе речевой активности примерно к 900 кадру. Примерно к 900 кадру устанавливается флаг обновления (update_ flag), как показано на фиг. 4, в результате чего формируется обновление оценки фонового шума с использованием сигнала активного речевого сигнала, как показано на графике 5. Это можно наблюдать как ослабление в активном речевом сигнале, как показано на графике 6. Важно отметить, что обновление оценки шума происходит во время речевого сигнала (кадр 900 графика 1 приходится на речевой сигнал) с эффектом "принудительного воздействия" на речевой сигнал, когда обновление не является необходимым. Таким образом, поскольку для порога отсчета обновления существует риск истечения в процессе нормальной речи, требуется относительно высокий порог (300) для предотвращения возможности такого обновления.
В соответствии с фиг. 9 счетчик обновления получает приращения только во время увеличения фонового шума, но перед началом речевого сигнала. Как таковой, порог обновления может быть уменьшен до значения 50 при сохранении надежных обновлений. В данном случае счетчик обновлений достигает порога счетчика обновления (UPDATE_ CNT_THLD), равного 50, к кадру 650, что обеспечивает системе подавления шума 109 достаточное время для сходимости к новым условиям шума перед возвратом к речевому сигналу к моменту кадра 800. В течение этого времени можно видеть, что ослабление имеет место только для кадров, где отсутствует речевой сигнал, т.е. не возникает эффект "принудительного воздействия" на речевой сигнал. В результате формируется речевой сигнал улучшенного качества, прослушиваемый конечным пользователем.
Речевой сигнал улучшенного качества является результатом того, что решение об обновлении принимается на основе спектрального отклонения между энергией текущего кадра и усредненной энергией прошедших кадров вместо того, чтобы просто осуществлять установленный отсчет таймера до его истечения в отсутствие нормальных обновлений метрик речевого сигнала. В последнем случае (подобно патенту Вилмура) система воспринимает внезапное возрастание шума как самого речевого сигнала, таким образом, она не способна различить увеличение уровня фонового шума от истинного речевого сигнала. С использованием спектрального отклонения фоновый шум различается от истинного речевого сигнала и, следовательно, может быть принято улучшенное решение об обновлении.
На фиг. 10 представлены переменные, связанные с подавлением шума в музыкальном сигнале, как это обеспечивалось в известном способе, а на фиг. 11 представлены переменные, связанные с подавлением шума в музыкальном сигнале, как это обеспечивается системой подавления шума, соответствующей изобретению. В данном примере сигнал до кадра 600 на фиг. 10 и фиг. 11 представляет собой тот же самый чистый сигнал 800, что и на фиг. 8 и фиг. 9. Как видно из фиг. 10, способ, известный из предшествующего уровня техники, обеспечивает во многом тот же самый результат, что и в примере подавления шума, иллюстрируемом на фиг. 8. К кадру 600 музыкальный сигнал 805 формирует непрерывное значение суммы метрик речевого сигнала v(m), как показано на фиг. 2, которое в конечном счете заменяется под действием счетчика обновлений (как видно из графика 3) к моменту кадра 900. Поскольку характеристики музыкального сигнала 805 изменяются со временем, ослабление, показанное на графике 6, снижается, но счетчик обновлений продолжает заменять метрику речевого сигнала, как показано в момент кадра 1800. В противоположность этому, как хорошо видно из фиг. 11, счетчик обновлений (как видно на графике 3) никогда не достигает порога (UPDATE_CNT_THLD), равного 50, и, следовательно, обновлений не происходит. Тот факт, что обновлений не происходит, лучше всего поясняется со ссылками на график 6 на фиг. 11, где ослабление музыкального сигнала показано постоянным на уровне 0 дБ (т.е. ослабления не происходит). Таким образом, пользователь, прослушивающий музыку, при использовании подавления шумов в соответствии с известным способом воспринимал бы нежелательные изменения уровня музыкального сигнала, в то время как пользователь, прослушивающий музыку, при использовании подавления шума в соответствии с настоящим изобретением будет воспринимать ее при постоянных уровнях, выбранных по желанию.
Хотя изобретение было представлено и описано на примере конкретного варианта осуществления, однако специалистам в данной области техники должно быть понятно, что различные изменения, касающиеся формы и отдельных деталей, могут быть внесены без изменения сущности и объема изобретения. Соответствующие структуры, материалы, действия и эквиваленты всех средств или элементов, выраженных посредством признака "операция плюс функция", в приведенных пунктах формулы изобретения должны считаться включающими в себя любые структуры, материалы или действия для выполнения функций в комбинации с другими заявленными элементами, как представлено в формуле изобретения.
Система подавления шума, реализованная в системе связи, обеспечивает принятие улучшенного решения об обновлении оценки шума в случаях внезапного возрастания уровня фонового шума. Система подавления шума в числе прочего формирует обновление путем непрерывного контроля отклонения спектральной энергии и обеспечивает вынужденное обновление на основе предварительно определенного порогового критерия, что и является достигаемым техническим результатом. Отклонение спектральной энергии определяется с использованием элемента, который использует экспоненциально взвешенные компоненты спектральной мощности. Экспоненциальное взвешивание является функцией текущей энергии входного сигнала, при этом чем выше энергия входного сигнала, тем длиннее экспоненциальное окно, и наоборот, чем ниже энергия сигнала, тем короче экспоненциальное окно. Система подавления шума также предотвращает вынужденное обновление в течение интервалов непрерывных нестационарных входных сигналов, например музыкальных. 3 с. и 27 з.п.ф-лы, 11 ил.
US 4811404 A, 07.03.1989 | |||
Адаптивное устройство компенсации помех в речевом сигнале | 1988 |
|
SU1660188A1 |
US 4630305 A, 15.12.1986 | |||
US 4654884 A, 31.03.1987. |
Авторы
Даты
2001-06-27—Публикация
1996-09-04—Подача