Изобретение относится к маскированию ошибок передачи в системе радиосвязи и касается, в частности устройства и способа для улучшения декодирования фоновых шумов в такой системе.
Известны средства для улучшения кодирования/декодирования фоновых шумов в цифровых сотовых системах радиотелефонной связи, предназначенные главным образом для такой ситуации, когда соединение между кодером и декодером речи близко к идеальному в том смысле, что после канального декодирования остается лишь небольшое число ошибок в битах или ошибок передачи. Однако поскольку соединение осуществляется по радиоканалу, принятый сигнал может содержать немало ошибок в битах или ошибок передачи. В таком случае может потребоваться модификация известных.
Целью настоящего изобретения является разработка устройства и способа, в которых для того, чтобы сделать декодирование речи более устойчивым или нечувствительным к ошибкам передачи, к принятому сигналу применяется так называемое маскирование ошибок в принятом сигнале.
В соответствии с изобретением в приемнике системы радиосвязи, основанной на передаче кадров, данная цель достигается при помощи устройства маскирования ошибок передачи, обусловленных каналом связи, в декодере речи, который является декодером типа "источник-фильтр" и управляется средствами, переменные внутреннего состояния которых обновляются кадр за кадром для модификации принятых параметров фильтра, представляющих передаваемые по упомянутому каналу связи фоновые шумы, причем указанное устройство отличается тем, что оно содержит:
а) средства обнаружения кадров, содержащих ошибки передачи;
б) решающие средства для принятия решения, является ли приемлемым кадр, в котором были обнаружены ошибки передачи; и
в) средства маскирования упомянутых обнаруженных ошибок передачи путем ограничения обновления по меньшей мере одной из указанных переменных внутреннего состояния, если обнаруженный кадр, содержащий ошибки передачи, признан средствами принятия решения неприемлемым.
Кроме того, в соответствии с изобретением в приемнике системы радиосвязи, основанной на передаче кадров, данная цель достигается также при помощи способа маскирования ошибок передачи, обусловленных каналов связи, в декодере речи типа "источник-фильтр", который включает средства, переменные внутреннего состояния которых обновляются кадр за кадром для модификации принятых параметров фильтра, представляющих передаваемые по указанному каналу связи фоновые шумы, указанный способ отличается тем, что:
а) обнаруживают кадры, содержащие ошибки передачи;
б) принимают решение о том, является ли приемлемым кадр, в котором обнаружены ошибки передачи, и
в) маскируют упомянутые обнаруженные ошибки передачи путем ограничения обновления по меньшей мере одной из указанных переменных внутреннего состояния, если при выполнении операции принятия решения обнаруженный кадр, содержащий ошибки передачи, признают неприемлемым.
Изобретение поясняется чертежом, который представляет собой блок-схему соответствующих частей приемника системы радиосвязи, содержащей устройство в соответствии с настоящим изобретением.
Для пояснения изобретения кратко рассмотрим работу типичного соединения в цифровой сотовой системе радиосвязи, а также типичные методы и алгоритмы маскирования ошибок.
В линии связи цифровой сотовой радиотелефонной системы звуковой сигнал сначала преобразуется в цифровую форму, а затем к нему применяется алгоритм кодирования речи [1]. Этот алгоритм сжимает речевой сигнал и преобразует его в несколько квантованных параметров (обычно на основе кадров). Затем полученные в результате этого биты защищаются путем добавления избыточности при кодировании с использованием методов канального кодирования [2]. Полученная последовательность битов модулирует несущую [3] и передается, например с использованием метода многостанционного доступа с временным разделением каналов. В приемнике сигнал демодулируется. Возможная временная дисперсия или дисперсия, обусловленная многолучевым распространением, может быть скомпенсирована различными способами выравнивания, например, выравниванием по методу Витерби или коррекцией с решающей обратной связью [3]. Затем применяется канальное декодирование [2] для декодирования квантованных параметров, которые необходимы декодеру речи для восстановления переданного речевого сигнала. Из вышесказанного ясно, что помехи в канале связи могут влиять на восстановленный речевой сигнал, ухудшая его качество.
Несмотря на то, что методы канального кодирования/декодирования могут значительно уменьшать чувствительность к помехам, одного канального кодирования для цифровой сотовой системы обычно бывает недостаточно. Напротив, обычно дополнительно используют методы так называемого маскирования ошибок, с тем чтобы еще больше маскировать воспринимаемые последствия ошибок, остающихся на входе декодера речи. Все эти методы используют некоторую информацию о качестве канала передачи, которая поступает на приемный конец или оценивается на приемном конце. Когда такая информация свидетельствует о плохом качестве канала передачи, средства маскирования ошибок инициируют специальные операции в декодере речи с целью уменьшения отрицательного воздействия ошибок на восстановленный речевой сигнал. Уровень сложности методов маскирования ошибок зависит от характера информации о качестве канала передачи. Ниже будут описаны несколько способов получения такой информации.
Непосредственная информация о качестве канала может быть получена путем измерения уровня сигнала. Низкое значение уровня в таком случае будет указывать на низкое отношение сигнал/шум, означающее, что можно ожидать плохое качество канала. Методы канального кодирования обеспечивают более высокий уровень сложности. Одним из этих методов является использование избыточного канального кодирования, например, контроля циклическим избыточным кодом [2], в частности, когда код используется для обнаружения ошибок. Кроме того, "мягкая" (не двоично-квантованная) информация может быть получена от сверточного декодера (в случае, когда используется сверточный код), от демодулятора, от выравнивателя и/или декодера блочного кода [3]. Один из часто применяемых методов заключается в разделении информационных битов, поступающих из декодера речи, на разные классы, для каждого из которых используются различные схемы исправления/обнаружения ошибок, в зависимости от различной важности различных битов [4]. Следовательно, фрагменты информации, содержащие коды обнаружения/исправления ошибок, могут быть использованы в качестве индикаторов возможного наличия ошибок в битах в кадре речи.
Ниже будут кратко описаны несколько методов маскирования ошибок в обычных декодерах речи с целью маскирования кадров, которые считаются содержащими ошибки в битах. Когда обнаруживается плохой кадр, обычно используют информацию из предыдущего признанного пригодным кадра. Часто этот метод комбинируется с заглушением (уменьшением выходного уровня) в случае, когда наблюдается несколько плохих кадров подряд [4]. Такая ситуация является обычной в системах подвижной радиотелефонной связи, где в случае низкой скорости перемещения подвижных абонентов глубокие замирания могут существовать в течение довольно продолжительных периодов времени. Результат заглушения состоит в том, что помехи в восстановленном сигнале маскируются. В частности, устраняются громкие "щелчки". Если имеется более подробная информация о качестве каждой принятой части приходящего потока битов, то становится возможным проследить воздействие возможных ошибок передачи на определенные параметры декодера речи. Так как упомянутые параметры моделируют различные явления речи, могут быть разработаны методы маскирования ошибок, оптимизированные с учетом физического смысла каждого отдельного параметра. Одним из частных примеров такого параметра является так называемое усиление основного тона [5]. Для данного параметра в кратковременные периоды речи иногда требуется значение, большее, чем единица. Однако такое значение соответствует нестабильной модели фильтра, а это значит, что ее в некоторой степени опасно использовать. В частности, можно применить методы маскирования ошибок, которые ограничивают усиление основного тона значением, меньшим единицы, каждый раз, когда обнаруживается возможная ошибка в битах этого параметра. Еще одним примером является модель спектрального фильтра, который обычно используется в современных алгоритмах кодирования речи (см., например [5]). В этом случае методы маскирования ошибок могут быть использованы для того, чтобы предотвратить применение нестабильных фильтров, если в соответствующей спектральной информации отмечены ошибки в битах. Возможно также и обратное: каждый раз, когда обнаруживается нестабильный фильтр, кадр считается плохим и применяются методы маскирования ошибок.
С учетом приведенной информации о современном уровне техники обратимся к чертежу. На нем показаны блоки приемника системы радиосвязи с подвижными объектами, необходимые для описания настоящего изобретения. Антенна 10 принимает переданный сигнал и направляет его на демодулятор 12. Демодулятор 12 демодулирует принятый сигнал и подает его на выравниватель 13, например, на выравниватель Витерби, который преобразует принятый и демодулированный сигнал в одну или несколько последовательностей битов, подаваемых на канальный декодер 14. Демодулятор 12 и выравниватель 13 подают также "мягкую" информацию о принятых битах или символах на решающие средства 16. Канальный декодер 14 преобразует последовательность битов в последовательность параметров фильтра и последовательность параметров возбуждения, необходимых для декодирования речи. Кроме того, канальный декодер 14 осуществляет декодирование циклического избыточного кода контроля по меньшей мере в части каждого принятого кадра. Результаты контроля подаются на решающие средства 16. Таким образом, демодулятор 12, выравниватель 13 и канальный декодер 14 являются средствами обнаружения кадров, содержащих ошибки передачи.
Приемник содержит также детектор 20 речи (называемый также детектором голосовой активности). Детектор 20 речи определяет, исходя из упомянутых параметров фильтра и возбуждения, содержит принятый кадр главным образом речь или же фоновые шумы. Решение детектора 20 речи подается на детектор стационарности, выполненный в виде дискриминатора 22 сигналов, который использует некоторые параметры возбуждения для определения, являются ли принятые сигналы, представляющие фоновые шумы, стационарными или нет. Если кадр признан содержащим стационарные фоновые шумы, то выходной сигнал дискриминатора 22 заставляет модификатор 24 параметров модифицировать принятые параметры фильтра. Указанные детектор 20 речи, дискриминатор 22 сигналов и модификатор 24 параметров представляют собой средства, переменные внутреннего состояния которых обновляются кадр за кадром, для модификации принятых параметров фильтра, представляющих передаваемые по каналу связи фоновые шумы. Параметры фильтра, возможно модифицированные (если принятый сигнал представляет стационарные фоновые шумы), и параметры возбуждения подаются на декодер 26 речи, который выдает сигнал звуковой частоты по выходной линии 28.
Для того, чтобы описать методы маскирования ошибок в соответствии с настоящим изобретением, необходимо кратко рассмотреть воздействие ошибок в битах на так называемые антивихревые алгоритмы. Эти воздействия можно грубо разделить на следующие:
1. Детектор 20 голосовой активности или речи, который используется для управления антивихревым алгоритмом, обычно является адаптивным [6]. Это означает, что имеются пороги и соответствующие состояния, которые автоматически обновляются внутри в детекторе голосовой активности с использованием либо измеренного речевого сигнала либо, если этот детектор находится в приемнике, как описывается в настоящей заявке, декодированных параметров из канального декодера. Когда в приходящих параметрах имеются ошибки, пороги или переменные внутреннего состояния не обновляются правильным образом, что может приводить к неправильным решениям. Следствием этого будет ухудшенное качество восстановленного сигнала звуковой частоты.
2. Детектор 20 голосовой активности или речи формирует решение о наличии речи или фоновых шумов, используя входящие параметры фильтра и возбуждения, а также обновленные внутренние состояния, то есть старые входящие параметры и дополнительную априорную информацию. Поэтому ошибки в битах могут сразу же привести к неправильным решениям в приемнике, что ухудшает качество восставленного сигнала звуковой частоты. Кроме того, поскольку текущее решение зависит от старых входящих параметров, ошибки в битах могут также влиять и на будущие решения.
3. Дискриминатор 22 сигналов, который в предпочтительном варианте осуществления настоящего изобретения может быть частью системы, исследует входящие статистические моменты, предпочтительно - значения средней энергии сигнала для каждого кадра. Необходимо хранить большое число таких значений энергии как для текущего кадра, так и для прежних кадров, в одном или нескольких буферах. Если в этих входящих значениях энергии будут иметься ошибки, то эти ошибки также будут храниться в буферах, вызывая ошибочные решения в течение значительного времени. Результатом этого будет ухудшенное качество восстановленных сигналов фоновых шумов.
4. Обусловленное ошибками в битах неправильное решение отрицательно влияет на операции, используемые для предотвращения "завихрения", которые применяются в случае стационарного сигнала фонового шума. Одним из последствий является разрушение речи, когда ошибочно опознается стационарный фоновый шум и начинаются антивихревые операции. Может появиться также и противоположное ошибочное решение (речь, когда в действительности присутствует стационарный фоновый шум), вследствие чего характер фонового шума мгновенно изменится, что может вызвать неприятные ощущения при восприятии. Многократные переходы от решений, указывающих на наличие речи, к решениям, указывающим на наличие стационарного фонового шума, и наоборот, также нежелательны, так как эти переходы характеризуются постоянными времени. Если вследствие ошибок в битах будут иметь место частые переходы от одного решения к другому, то это будет создавать значительные помехи.
5. Ошибки в битах также отрицательно влияют на реальные антивихревые операции в модификаторе 24 параметров (по существу - спектральную фильтрацию нижних частот в сочетании с расширением полосы частот). При этом один из эффектов возникает вследствие неправильных решений, поступающих от детектора 20 голосовой активности или речи или от дискриминатора 22 сигналов. В этих случаях, в отличие от идеального канала, может начинаться или прерываться обновление параметров фильтра нижних частот. Другой эффект проявляется, когда имеются ошибки в битах, поражающие спектральную информацию, которая используется в фильтрах нижних частот и для расширения полосы пропускания. Оба эти эффекта могут вызывать ухудшение качества.
6. В пост-фильтре (если он имеется) декодера 26 речи возникают проблемы, аналогичные описанным выше в п. 5. Кроме того, чувствительность слуха к восприятию так называемого спектрального наклона велика и, так как на этот наклон может влиять антивихревой алгоритм, ошибки в битах могут значительно ухудшить качество восстановленного речевого сигнала.
7. Описанные выше эффекты могут сочетаться и влиять друг на друга. Например, неправильное решение в детекторе 20 речи может привести к прекращению обновления содержимого буферов дискиминатора 22 сигналов. В свою очередь это будет влиять на дискриминатор 22 сигналов в течение значительного периода времени, вызывая ухудшение качества выполнения антивихревых операций.
Из вышесказанного ясно, что ошибки передачи могут приводить к неправильному обновлению внутренних переменных детектора 20 речи, дискриминатора 22 сигналов, модификатора 24 параметров или к комбинации этих эффектов. В соответствии с настоящим изобретением данные недостатки полностью или частично устраняются путем модификации процесса обновления в течение кадров, в которых обнаружены ошибки передачи. Это модифицированное обновление ниже будет описано более подробно.
Решающие средства 16 получают "мягкую" информацию о достоверности битов от демодулятора 12 и выравнивателя 13, а также результаты контроля с помощью циклического избыточного кода от канального декодера 14. Затем решающие средства 16 определяют, возникли ли ошибки в битах или они являются вероятными ( на основании "мягкой" информации). Кроме того, определяется, влияют ли возможные ошибки в битах на параметры фильтра или возбуждения. Если это так и если эти ошибки в битах появились в параметрах, которые существенно влияют на работу детектора 20 речи, дискриминатора 22 сигналов или модификатора 24 параметров, то на средства 18 маскирования подается соответствующий сигнал. Например, это может происходить, если параметр, соответствующий энергии кадра, содержит одну или более ошибок в битах.
В зависимости от параметра, содержащего ошибки в битах, средства 18 маскирования могут изменять выполнение процесса обновления соответствующих переменных внутреннего состояния в детекторе 20 речи, дискриминаторе 22 сигналов и модификаторе 24 параметров, как показано линиями 30, 32 и 34 управления соответственно. Эти изменения включают следующие:
- приостановку обновления переменных внутреннего состояния (например, порогов) в детекторе 20 речи, когда обнаружен плохой кадр. Это означает, что переменные внутреннего состояния детектора 20 устанавливаются равными тем же значениям, что и в предыдущем кадре, или что обновление этих переменных состояния ограничивается (переменные состояния могут корректироваться на меньшие, чем обычно, величины);
- другой операцией является сохранение решения в детекторе 20 речи равным решению для предыдущего кадра в случае, когда обнаружен неприемлемый кадр, содержащий ошибки передачи;
- если обнаружен неприемлемый кадр, содержащий ошибки передачи в тех параметрах возбуждения, которые имеют отношение к решениям о стационарности, то обновление содержимого буферов в дискриминаторе 22 сигналов может быть приостановлено или ограничено;
- другая возможность заключается в сохранении решения дискриминатора 22 сигналов равным решению для предыдущего кадра;
- если принятый кадр содержит ошибки передачи в битах, содержащих спектральную информацию, то может быть приостановлено или ограничено обновление внутренних коэффициентов фильтра в модификаторе 24 параметров, управляющем фильтрацией нижних частот и/или расширением полосы частот;
- спектральный наклон пост-фильтра, если он используется, может быть сохранен равным наклону для предыдущего кадра.
Поскольку различные параметры влияют на различные блоки, показанные на чертеже (детектор 20 речи, дискриминатор 22 сигналов, модификатор 24 параметров и пост-фильтр, если он имеется), то ясно, что может выполняться одна или несколько из перечисленных операций, в зависимости от того, где были обнаружены ошибки в битах в принятом кадре.
Из вышесказанного также понятно, что если ошибки передачи появляются в определенном принятом параметре в последовательных кадрах, то соответствующая переменная внутреннего состояния соответствующего блока приемника будет сохраняться (или по существу сохраняться) равной своему значению в последнем кадре, где соответствующий параметр были принят правильно.
Предпочтительный вариант осуществления способа в соответствии с настоящим изобретением поясняется с помощью двух программных модулей на языке Паскаль в Приложении.
Очевидно, что возможны различные усовершенствования и изменения настоящего изобретения, не выходящие за пределы его сущности и объема, определенного формулой изобретения.
Список литературы.
1. Atal B.S., Cuperman V. and Gersho, eds. Advances -in Speech Coding. - Kluwer Academic Publishers, 1991.
2. Clark G. C., Cain J. B. Error Correction Coding for Digital Communication. - Plenum Press, 1981.
3. Proakis J. G. Digital Communication, - 2nd edition, McGraw-HilI, 1989.
4. TR-45 Full Rate Speech Codec Compatibility Standart PN-2972. Electronic Industries Association, 1990 (IS-54).
5. Minde T. B., et a1. Techniques for low bit rate speech coding using long analysis frames. - ICASSP, Minneapolis, USA, 1993.
6. Voice Activity Detection. Recommendation GSM 06.32, ETSI/GSM, 1991.
Приемник системы радиосвязи на основе передачи кадров содержит декодер речи типа "источник-фильтр", управляемый средствами, переменные внутреннего состояния которых обновляются кадр за кадром для модификации принятых параметров фильтра, представляющих передаваемые по каналу связи фоновые шумы. Приемник содержит средства обнаружения кадров, содержащих ошибки передачи, средства принятия решения о том, что является ли кадр, в котором обнаружены ошибки передачи, приемлемым, и средства маскирования обнаруженных ошибок передачи путем ограничения обновления по меньшей мере одной из переменных внутреннего состояния, если обнаруженный кадр признан средствами принятия решения неприемлемым. Технический результат данного изобретения состоит в разработке способа и устройства, в которых для того, чтобы сделать декодирование речи более устойчивым или нечувствительным к ошибкам передачи, к принятому сигналу применяется так называемое маскирование ошибок в принятом сигнале. 2 c. и 14 з.п. ф-лы, 1 ил.
SU 915095 A, 23.03.82 | |||
US 4357491 A, 02.11.82 | |||
Связующее | 1974 |
|
SU522213A1 |
US 5319736 A, 07.06.94 | |||
РАЗБРАСЫВАТЕЛЬ МУЛЬЧИ | 2002 |
|
RU2239971C2 |
Авторы
Даты
1998-10-20—Публикация
1994-06-02—Подача