ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ
Изобретение относится к ослаблению шума в сигнале и, в частности, но не исключительно, к ослаблению шума для звуковых и, в частности, речевых сигналов.
УРОВЕНЬ ТЕХНИКИ
Ослабление шума в сигналах желательно во многих применениях для дополнительного улучшения или выделения составляющей нужного сигнала. В частности, ослабление звукового шума желательно во многих сценариях. Например, повышение разборчивости речи при наличии фонового шума вызвало большой интерес из-за своей практической значимости.
Подход к ослаблению звукового шума состоит в использовании системы из двух или более микрофонов вместе с подходящим алгоритмом формирования диаграммы направленности. Однако такие алгоритмы не всегда практичны либо обеспечивают субоптимальную производительность. Например, они имеют склонность к ресурсоемкости и требуют сложных алгоритмов для отслеживания нужного источника звука. Также они имеют склонность обеспечивать субоптимальное ослабление шума, в частности, в отражающихся и рассеянных нестационарных шумовых полях или там, где присутствует несколько источников помех. Методики пространственной фильтрации, например формирование диаграммы направленности, в таких сценариях могут добиться лишь ограниченного успеха, и часто выполняется дополнительное подавление шумов в выходном сигнале формирователя диаграммы направленности на этапе постобработки.
Предложены различные алгоритмы ослабления шума, включая системы, которые основываются на знаниях или допущениях касательно характеристик составляющей нужного сигнала и составляющей шумового сигнала. В частности, основанные на знаниях способы повышения разборчивости речи, например схемы с кодовой книгой, показаны эффективными в условиях нестационарного шума даже при работе на одиночном сигнале микрофона. Примеры таких способов представляются в S. Srinivasan, J. Samuelsson и W. B. Kleijn, "Codebook driven short-term predictor parameter estimation for speech enhancement", IEEE Trans. Speech, Audio and Language Processing, том 14, № 1, стр. 163-176, январь 2006 г., и S. Srinivasan, J. Samuelsson и W. B. Kleijn, "Codebook based Bayesian speech enhancement for non-stationary environments", IEEE Trans. Speech Audio Processing, том 15, № 2, стр. 441-452, февраль 2007 г.
Эти способы опираются на обученные кодовые книги спектральных форм речи и шума, которые параметризуются с помощью, например, коэффициентов линейного предсказания (LP). Использование речевой кодовой книги является интуитивным и легко поддается практической реализации. Речевая кодовая книга может быть либо независимой от говорящего (обученной с использованием данных от нескольких говорящих), либо зависимой от говорящего. Последний случай полезен, например, для применений мобильных телефонов, так как они предназначены быть персональными и часто используются преимущественно одним говорящим. Однако использование шумовых кодовых книг в практической реализации является сложным из-за многообразия типов шума, с которыми можно столкнуться на практике. В результате обычно используется очень большая шумовая кодовая книга.
Обычно такие алгоритмы на основе кодовой книги направлены на отыскание записи речевой кодовой книги и записи шумовой кодовой книги, которые при объединении точнее всего соответствуют зарегистрированному сигналу. Когда найдены подходящие записи кодовой книги, алгоритмы компенсируют принятый сигнал на основе записей кодовой книги. Однако, чтобы идентифицировать подходящие записи кодовой книги, выполняется поиск по всем возможным комбинациям записей речевой кодовой книги и записей шумовой кодовой книги. Это приводит к очень ресурсоемкому в вычислительном отношении процессу, который часто не практичен, в особенности для устройств с низкой сложностью. Кроме того, большое количество возможных сигналов и, в частности, вариантов шума может увеличить риск ошибочной оценки, что приводит к субоптимальному ослаблению шума.
Поэтому был бы полезен усовершенствованный подход к ослаблению шума и, в частности, был бы полезен подход, обеспечивающий повышенную гибкость, уменьшенные вычислительные требования, упрощенную реализацию и/или работу, сниженные затраты и/или повышенную производительность.
СУЩНОСТЬ ИЗОБРЕТЕНИЯ
Соответственно, изобретение предпочтительно направлено на то, чтобы смягчить, ослабить или устранить один или более из вышеупомянутых недостатков, поодиночке или в любом сочетании.
В соответствии с одним аспектом изобретения предоставляется устройство ослабления шума, содержащее: приемник для приема первого сигнала для окружения, причем первый сигнал содержит составляющую нужного сигнала, соответствующую сигналу из нужного источника в окружении, и составляющую шумового сигнала, соответствующую шуму в окружении; первую кодовую книгу, содержащую множество вариантов нужного сигнала для составляющей нужного сигнала, причем каждый вариант нужного сигнала представляет возможную составляющую нужного сигнала; вторую кодовую книгу, содержащую множество вариантов шумового сигнала для составляющей шумового сигнала, причем каждый вариант шумового сигнала представляет возможную составляющую шумового сигнала; вход для приема сигнала датчика, предоставляющего измерение окружения, причем сигнал датчика представляет измерение нужного источника или шума в окружении; сегментатор для сегментирования первого сигнала на временные сегменты; аттенюатор шума, выполненный с возможностью выполнения для каждого временного сегмента этапов: формирования множества оцененных вариантов сигнала путем формирования объединенного сигнала для каждой пары из варианта нужного сигнала в первой группе записей кодовой книги в первой кодовой книге и варианта шумового сигнала во второй группе записей кодовой книги во второй кодовой книге; формирования варианта сигнала для первого сигнала на данном временном сегменте из оцененных вариантов сигнала; и ослабления шума у первого сигнала на данном временном сегменте в ответ на вариант сигнала; причем аттенюатор шума выполнен с возможностью формирования по меньшей мере одной из первой группы и второй группы путем выбора поднабора записей кодовой книги в ответ на опорный сигнал.
Настоящее изобретение может обеспечить улучшенное и/или упрощенное ослабление шума. Во многих вариантах осуществления необходим значительно уменьшенный вычислительный ресурс. Данный подход может сделать возможным более эффективное ослабление шума во многих вариантах осуществления, что может привести к более быстрому ослаблению шума. Во многих сценариях данный подход может дать возможность или обеспечить ослабление шума в реальном масштабе времени. Во многих сценариях и применениях может выполняться более точное ослабление шума благодаря более точной оценке подходящей записи кодовой книги вследствие сокращения рассматриваемых возможных вариантов.
Каждый из вариантов нужного сигнала может иметь длительность, соответствующую длительности временного сегмента. Каждый из вариантов шумового сигнала может иметь длительность, соответствующую длительности временного сегмента.
Сигнал датчика можно сегментировать на временные сегменты, которые могут перекрывать или, в частности, непосредственно соответствовать временным сегментам звукового сигнала. В некоторых вариантах осуществления сегментатор может сегментировать сигнал датчика на такие же временные сегменты, как и звуковой сигнал. Поднабор для каждого временного сегмента может определяться на основе сигнала датчика на том же временном сегменте.
Каждый из вариантов нужного сигнала и шума может представляться набором параметров, который характеризует составляющую сигнала. Например, каждый вариант нужного сигнала может содержать набор коэффициентов линейного предсказания для модели линейного предсказания. Каждый вариант нужного сигнала может содержать набор параметров, характеризующих спектральное распределение, например Спектральную плотность мощности (PSD).
Составляющая шумового сигнала может соответствовать любой составляющей сигнала, не являющейся частью составляющей нужного сигнала. Например, составляющая шумового сигнала может включать в себя белый шум, цветной шум, детерминированный шум от нежелательных источников шума и т.п. Составляющая шумового сигнала может быть нестационарным шумом, который может меняться для разных временных сегментов. Обработка каждого временного сегмента аттенюатором шума может быть независимой для каждого временного сегмента. Таким образом, шум в звуковом окружении может исходить из дискретных источников звука или может быть, например, составляющими отражающегося или рассеянного звука.
Сигнал датчика может приниматься от датчика, который выполняет измерение нужного источника и/или шума.
Поднабор может принадлежать к первой и второй кодовой книге соответственно. В частности, когда сигнал датчика предоставляет измерение источника нужного сигнала, поднабор может быть поднабором первой кодовой книги. Когда сигнал датчика предоставляет измерение шума, поднабор может быть поднабором второй кодовой книги.
Устройство оценки шума может быть выполнено с возможностью формирования оцененного варианта сигнала для варианта нужного сигнала и варианта шума в виде взвешенной комбинации и, в частности, взвешенного суммирования варианта нужного сигнала и варианта шума, причем веса определяются для минимизации функции стоимости, указывающей разность между оцененным вариантом сигнала и звуковым сигналом на временном сегменте.
Варианты нужного сигнала и/или варианты шумового сигнала могут быть, в частности, параметризованными представлениями составляющих возможного сигнала. Количество параметров, используемых для задания варианта, обычно может не превышать 20 или во многих вариантах осуществления преимущественно не превышать 10.
По меньшей мере один из вариантов нужного сигнала в первой кодовой книге и вариантов шумового сигнала во второй кодовой книге может представляться спектральным распределением. В частности, варианты могут представляться записями кодовой книги параметризованных Спектральных плотностей мощности (PSD), или то же самое, что записями кодовой книги параметров линейного предсказания.
Сигнал датчика в некоторых вариантах осуществления может иметь меньшую ширину полосы частот, нежели первый сигнал. В некоторых вариантах осуществления устройство ослабления шума может принимать множество сигналов датчика, и формирование поднабора может основываться на этом множестве сигналов датчика.
Аттенюатор шума может, в частности, включать в себя процессор, схему, функциональный блок или средство для формирования множества оцененных вариантов сигнала путем формирования объединенного сигнала для каждой пары из варианта нужного сигнала в первой группе записей кодовой книги в первой кодовой книге и варианта шумового сигнала во второй группе записей кодовой книги во второй кодовой книге; процессор, схему, функциональный блок или средство для формирования варианта сигнала для первого сигнала на данном временном сегменте из оцененных вариантов сигнала; процессор, схему, функциональный блок или средство для ослабления шума у первого сигнала на данном временном сегменте в ответ на вариант сигнала; и процессор, схему, функциональный блок или средство для формирования по меньшей мере одной из первой группы и второй группы путем выбора поднабора записей кодовой книги в ответ на опорный сигнал.
Сигнал может быть, в частности, звуковым сигналом, окружение может быть звуковым окружением, нужный источник может быть звуковым источником, и шум может быть звуковым шумом.
В частности, устройство ослабления шума может содержать: приемник для приема звукового сигнала для звукового окружения, причем звуковой сигнал содержит составляющую нужного сигнала, соответствующую звуку из нужного источника звука в звуковом окружении, и составляющую шумового сигнала, соответствующую шуму в звуковом окружении; первую кодовую книгу, содержащую множество вариантов нужного сигнала для составляющей нужного сигнала, причем каждый вариант нужного сигнала представляет возможную составляющую нужного сигнала; вторую кодовую книгу, содержащую множество вариантов шумового сигнала для составляющей шумового сигнала, причем каждый вариант шумового сигнала представляет возможную составляющую шумового сигнала; вход для приема сигнала датчика, предоставляющего измерение звукового окружения, причем сигнал датчика представляет измерение нужного источника звука или шума в звуковом окружении; сегментатор для сегментирования звукового сигнала на временные сегменты; аттенюатор шума, выполненный с возможностью выполнения для каждого временного сегмента этапов: формирования множества оцененных вариантов сигнала путем формирования объединенного сигнала для каждой пары из варианта нужного сигнала в первой группе записей кодовой книги в первой кодовой книге и варианта шумового сигнала во второй группе записей кодовой книги во второй кодовой книге; формирования варианта сигнала для звукового сигнала на временном сегменте из оцененных вариантов сигнала, и ослабления шума у звукового сигнала на временном сегменте в ответ на вариант сигнала, причем аттенюатор шума выполнен с возможностью формирования по меньшей мере одной из первой группы и второй группы путем выбора поднабора записей кодовой книги в ответ на опорный сигнал.
Составляющая нужного сигнала может быть, в частности, составляющей речевого сигнала.
Сигнал датчика может приниматься от датчика, который выполняет измерение нужного источника и/или шума. Измерение может быть акустическим измерением, например, с помощью одного или более микрофонов, но не обязательно должно быть им. Например, в некоторых вариантах осуществления измерение может быть механическим или визуальным измерением.
В соответствии с необязательным признаком изобретения сигнал датчика представляет измерение нужного источника, и аттенюатор шума выполнен с возможностью формирования первой группы путем выбора поднабора записей кодовой книги из первой кодовой книги.
Это может сделать возможным уменьшенную сложность, упрощенную работу и/или повышенную производительность во многих вариантах осуществления. Во многих вариантах осуществления особенно полезный сигнал датчика может формироваться для источника нужного сигнала, посредством этого обеспечивается надежное сокращение количества вариантов нужного сигнала для поиска. Например, для источника нужного сигнала, являющегося источником речи, точное, но другое представление речевого сигнала может формироваться из микрофона на основе костной проводимости. Таким образом, определенные характеристики источника нужного сигнала могут преимущественно использоваться во многих сценариях для предоставления существенного сокращения возможных вариантов на основе сигнала датчика, отличного от звукового сигнала.
В соответствии с необязательным признаком изобретения первый сигнал является звуковым сигналом, нужный источник является источником звука, составляющая нужного сигнала является речевым сигналом, и сигнал датчика является сигналом микрофона на основе костной проводимости.
Это может обеспечить особенно эффективное и высокопроизводительное повышение разборчивости речи.
В соответствии с необязательным признаком изобретения сигнал датчика обеспечивает менее точное представление нужного источника, чем составляющая нужного сигнала.
Изобретение может сделать возможным использование дополнительной информации, предоставленной сигналом пониженного качества (и, соответственно, теоретически не подходящей для непосредственного ослабления шума или воспроизведения сигнала), для выполнения высококачественного ослабления шума.
В соответствии с необязательным признаком изобретения сигнал датчика представляет измерение шума, и аттенюатор шума выполнен с возможностью формирования второй группы путем выбора поднабора записей кодовой книги из второй кодовой книги.
Это может сделать возможным уменьшенную сложность, упрощенную работу и/или повышенную производительность во многих вариантах осуществления. Во многих вариантах осуществления особенно полезный сигнал датчика может формироваться для одного или более источников шума (включая рассеянный шум), посредством этого обеспечивается надежное сокращение количества вариантов шумового сигнала для поиска. Во многих вариантах осуществления шум более изменчив, чем составляющая нужного сигнала. Например, повышение разборчивости речи может использоваться во многих разных окружениях и, соответственно, во многих разных шумовых окружениях. Таким образом, характеристики шума могут значительно меняться, тогда как характеристики речи обычно относительно постоянны в разных окружениях. Поэтому шумовая кодовая книга часто может включать в себя записи для многих очень разных окружений, и сигнал датчика во многих сценариях может позволить сформировать поднабор, соответствующий текущему шумовому окружению.
В соответствии с необязательным признаком изобретения сигнал датчика является сигналом обнаружения механической вибрации.
Это может обеспечить очень надежную работу во многих сценариях.
В соответствии с необязательным признаком изобретения сигнал датчика является сигналом акселерометра.
Это может обеспечить очень надежную работу во многих сценариях.
В соответствии с необязательным признаком изобретения устройство ослабления шума дополнительно содержит блок соответствия для формирования соответствия между множеством вариантов сигнала датчика и записями кодовой книги по меньшей мере в одной из первой кодовой книги и второй кодовой книги; и при этом аттенюатор шума выполнен с возможностью выбора поднабора записей кодовой книги в ответ на соответствие.
Это может сделать возможным уменьшенную сложность, упрощенную работу и/или повышенную производительность во многих вариантах осуществления. В частности, это может сделать возможным упрощенное и/или улучшенное формирование подходящего поднабора вариантов.
В соответствии с необязательным признаком изобретения аттенюатор шума выполнен с возможностью выбора первого варианта сигнала датчика из множества вариантов сигнала датчика в ответ на показатель расхождения между каждым из множества вариантов сигнала датчика и сигналом датчика, и формирования поднабора в ответ на соответствие для первого варианта сигнала.
Это во многих вариантах осуществления может обеспечить особенно выгодное и практичное формирование подходящей информации соответствия, обеспечивая надежное формирование подходящего поднабора вариантов.
В соответствии с необязательным признаком изобретения блок соответствия выполнен с возможностью формирования соответствия на основе одновременных измерений от входного датчика, выдающего первый сигнал, и датчика, выдающего сигнал датчика.
Это может обеспечить особенно эффективную реализацию, и в частности, может уменьшить сложность и сделать возможным, например, упрощенное и/или улучшенное определение надежного соответствия.
В соответствии с необязательным признаком изобретения блок соответствия выполнен с возможностью формирования соответствия на основе показателей разности между вариантами сигнала датчика и записями кодовой книги по меньшей мере в одной из первой кодовой книги и второй кодовой книги.
Это может обеспечить особенно эффективную реализацию и, в частности, может уменьшить сложность и сделать возможным, например, упрощенное и/или улучшенное определение надежного соответствия.
В соответствии необязательным признаком изобретения первый сигнал является сигналом микрофона от первого микрофона и сигнал датчика является сигналом микрофона от второго микрофона, удаленного от первого микрофона.
Это может сделать возможным уменьшенную сложность, упрощенную работу и/или повышенную производительность во многих вариантах осуществления.
В соответствии с необязательным признаком изобретения первый сигнал является звуковым сигналом, а сигнал датчика поступает от незвукового датчика.
Это может сделать возможным уменьшенную сложность, упрощенную работу и/или повышенную производительность во многих вариантах осуществления.
В соответствии с одним аспектом изобретения предоставляется способ ослабления шума, содержащий: прием первого сигнала для окружения, причем первый сигнал содержит составляющую нужного сигнала, соответствующую сигналу из нужного источника в окружении, и составляющую шумового сигнала, соответствующую шуму в окружении; предоставление первой кодовой книги, содержащей множество вариантов нужного сигнала для составляющей нужного сигнала, причем каждый вариант нужного сигнала представляет возможную составляющую нужного сигнала; предоставление второй кодовой книги, содержащей множество вариантов шумового сигнала для составляющей шумового сигнала, причем каждый вариант шумового сигнала представляет возможную составляющую шумового сигнала; прием сигнала датчика, предоставляющего измерение окружения, причем сигнал датчика представляет измерение нужного источника или шума в окружении; сегментирование первого сигнала на временные сегменты; для каждого временного сегмента выполнение этапов: формирования множества оцененных вариантов сигнала путем формирования объединенного сигнала для каждой пары из варианта нужного сигнала в первой группе записей кодовой книги в первой кодовой книге и варианта шумового сигнала во второй группе записей кодовой книги во второй кодовой книге, формирования варианта сигнала для первого сигнала на данном временном сегменте из оцененных вариантов сигнала и ослабления шума у первого сигнала на данном временном сегменте в ответ на вариант сигнала; и формирования по меньшей мере одной из первой группы и второй группы путем выбора поднабора записей кодовой книги в ответ на опорный сигнал.
Эти и другие аспекты, признаки и преимущества изобретения станут понятными и будут разъяснены со ссылкой на вариант (варианты) осуществления, описываемые ниже.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
Варианты осуществления изобретения будут описываться только в качестве примера со ссылкой на чертежи, на которых:
Фиг. 1 - иллюстрация примера элементов устройства ослабления шума в соответствии с некоторыми вариантами осуществления изобретения;
Фиг. 2 - иллюстрация примера элементов аттенюатора шума для устройства ослабления шума из фиг. 1;
Фиг. 3 - иллюстрация примера элементов устройства ослабления шума в соответствии с некоторыми вариантами осуществления изобретения; и
Фиг. 4 - иллюстрация задания соответствия кодовой книги для устройства ослабления шума в соответствии с некоторыми вариантами осуществления изобретения.
ПОДРОБНОЕ ОПИСАНИЕ НЕКОТОРЫХ ВАРИАНТОВ ОСУЩЕСТВЛЕНИЯ ИЗОБРЕТЕНИЯ
Нижеследующее описание сосредоточено на вариантах осуществления изобретения, применимых к ослаблению звукового шума и, в частности, к повышению разборчивости речи с помощью ослабления шума. Однако нужно будет принять во внимание, что изобретение не ограничивается этим применением, а может применяться ко многим другим сигналам.
Фиг. 1 иллюстрирует пример аттенюатора шума в соответствии с некоторыми вариантами осуществления изобретения.
Аттенюатор шума содержит приемник 101, который принимает сигнал, который содержит нужную составляющую и нежелательную составляющую. Нежелательная составляющая называется шумовым сигналом и может включать в себя любую составляющую сигнала, не являющуюся частью составляющей нужного сигнала. Составляющая нужного сигнала соответствует звуку, сформированному из нужного источника звука, тогда как нежелательная или составляющая шумового сигнала может соответствовать вкладам от всех других источников звука, включая рассеянный и отражающийся шум и т.п. Составляющая шумового сигнала может включать в себя окружающий шум в окружении, звук от нежелательных источников звука и т.п.
В системе из фиг. 1 сигнал является звуковым сигналом, который может формироваться, в частности, из сигнала микрофона, регистрирующего звуковой сигнал в данном звуковом окружении. Нижеследующее описание будет сосредоточено на вариантах осуществления, в которых составляющая нужного сигнала является речевым сигналом от нужного говорящего.
Приемник 101 соединяется с сегментатором 103, который сегментирует звуковой сигнал на временные сегменты. В некоторых вариантах осуществления временные сегменты могут быть неперекрывающимися, а в других вариантах осуществления временные сегменты могут быть перекрывающимися. Кроме того, сегментация может выполняться путем применения вырезающей функции определенной формы и, в частности, устройство ослабления шума может применять известную методику перекрытия с суммированием при сегментации, используя подходящее окно, например окно Хэннинга или Хэмминга. Длительность временного сегмента будет зависеть от конкретной реализации, но во многих вариантах осуществления будет составлять примерно 10-100 мс.
Сегментатор 103 передает результат в аттенюатор 105 шума, который выполняет ослабление шума на основе сегментов, чтобы выделить составляющую нужного сигнала относительно нежелательной составляющей шумового сигнала. Результирующие сегменты с ослабленным шумом поступают в выходной процессор 107, который предоставляет непрерывный звуковой сигнал. Выходной процессор 107 может, в частности, выполнять десегментацию, например, путем выполнения функции перекрытия с суммированием. Нужно будет принять во внимание, что в других вариантах осуществления выходной сигнал может предоставляться в виде сегментированного сигнала, например в вариантах осуществления, в которых выполняется дополнительная обработка сигналов на основе сегментов над сигналом с ослабленным шумом.
Ослабление шума основывается на подходе с кодовой книгой, который использует отдельные кодовые книги, относящиеся к составляющей нужного сигнала и к составляющей шумового сигнала. Соответственно, аттенюатор 105 шума соединяется с первой кодовой книгой 109, которая является кодовой книгой нужного сигнал и в конкретном примере является речевой кодовой книгой. Аттенюатор 105 шума дополнительно соединяется со второй кодовой книгой 111, которая является кодовой книгой шумового сигнала.
Аттенюатор 105 шума выполнен с возможностью выбора записей кодовой книги из речевой кодовой книги и шумовой кодовой книги, так что комбинация составляющих сигнала, соответствующих выбранным записям, точнее всего совпадает со звуковым сигналом на том временном сегменте. Как только находятся подходящие записи кодовой книги (вместе с их масштабированием), они представляют оценку отдельной составляющей речевого сигнала и составляющей шумового сигнала в зарегистрированном звуковом сигнале. В частности, составляющая сигнала, соответствующая выбранной записи речевой кодовой книги, является оценкой составляющей речевого сигнала в зарегистрированном звуковом сигнале, а записи шумовой кодовой книги предоставляют оценку составляющей шумового сигнала. Соответственно, этот подход использует подход с кодовой книгой для оценки составляющих речевого и шумового сигнала в звуковом сигнале, и как только эти оценки определяются, они могут использоваться для ослабления составляющей шумового сигнала относительно составляющей речевого сигнала в звуковом сигнале, так как оценки позволяют провести различия между этими составляющими.
В системе из фиг. 1 аттенюатор 105 шума соединяется соответствующим образом с кодовой книгой 109 нужного сигнала, которая содержит некоторое количество записей кодовой книги, каждая из которых содержит набор параметров, задающий возможную составляющую нужного сигнала, а в конкретном примере - нужный речевой сигнал. Аналогичным образом, аттенюатор 105 шума соединяется кодовой книгой 111 шумового сигнала, которая содержит некоторое количество записей кодовой книги, каждая из которых содержит набор параметров, задающий возможную составляющую шумового сигнала.
Записи кодовой книги для составляющей нужного сигнала соответствуют возможным вариантам для составляющих нужного сигнала, а записи кодовой книги для составляющей шумового сигнала соответствуют возможным вариантам для составляющих шумового сигнала. Каждая запись содержит набор параметров, которые характеризуют возможную составляющую нужного сигнала или шума соответственно. В конкретном примере каждая запись первой кодовой книги 109 содержит набор параметров, которые характеризуют возможную составляющую речевого сигнала. Таким образом, сигнал, охарактеризованный записью кодовой книги в этой кодовой книге, является сигналом, который обладает характеристиками речевого сигнала, и, соответственно записи кодовой книги вносят знания о характеристиках речи в оценку составляющей речевого сигнала.
Записи кодовой книги для составляющей нужного сигнала могут основываться на модели нужного источника звука либо могут определяться, дополнительно или в качестве альтернативы, с помощью процесса обучения. Например, записи кодовой книги могут быть параметрами для модели речи, разработанной для представления характеристик речи. В качестве другого примера можно записать и статистически обработать большое количество речевых выборок, чтобы сформировать подходящее количество возможных вариантов речи, которые сохраняются в кодовой книге. Аналогичным образом, записи кодовой книги для составляющей шумового сигнала могут основываться на модели шума либо могут определяться, дополнительно или в качестве альтернативы, с помощью процесса обучения.
В частности, записи кодовой книги могут основываться на модели линейного предсказания. В действительности, в конкретном примере каждая запись кодовой книги содержит набор параметров линейного предсказания. Записи кодовой книги могут быть сформированы, в частности, с помощью процесса обучения, в котором сформированы параметры линейного предсказания путем подгонки к большому количеству выборок сигнала.
Записи кодовой книги в некоторых вариантах осуществления могут представляться в виде частотного распределения и, в частности, в виде Спектральной плотности мощности (PSD). PSD может непосредственно соответствовать параметрам линейного предсказания.
Количество параметров для каждой записи кодовой книги обычно относительно небольшое. В действительности обычно имеется не более 20, а часто не более 10 параметров, задающих каждую запись кодовой книги. Таким образом, используется относительно грубая оценка составляющей нужного сигнала. Это обеспечивает уменьшенную сложность и упрощенную обработку, но все же признано обеспечивающим эффективное ослабление шума в большинстве случаев.
Подробнее рассмотрим модель аддитивного шума, где речь и шум предполагаются независимыми:
где y(n), x(n) и w(n) представляют соответственно дискретизованную речь с шумами (входной звуковой сигнал), четкую речь (нужная составляющая речевого сигнала) и шум (составляющая шумового сигнала).
Ослабление шума на основе кодовой книги обычно включает в себя поиски по кодовым книгам, чтобы отыскать такую запись кодовой книги для составляющей сигнала и составляющей шума соответственно масштабированная комбинация точнее всего совпадает с зарегистрированным сигналом, посредством этого предоставляя оценку составляющих речи и шума для каждого короткого временного сегмента. Пусть Py(ω) обозначает Спектральную плотность мощности (PSD) у наблюдаемого сигнала y(n) с шумами, Px(ω) обозначает PSD у составляющей x(n) речевого сигнала и Pw(ω) обозначает PSD у составляющей w(n) шумового сигнала, тогда
Py(ω)=Px(ω)+Pw(ω)
Допустим, ^ обозначает оценку соответствующей PSD, традиционное ослабление шума на основе кодовой книги может уменьшить шум путем применения фильтра H(ω) Винера частотной области к зарегистрированному сигналу, то есть:
Pna(ω)=Py(ω)H(ω)
где фильтр Винера имеет вид:
Кодовые книги содержат варианты речевого сигнала и варианты шумового сигнала, соответственно, и насущная проблема состоит в идентификации наиболее подходящей пары вариантов и относительного веса каждого.
Оценка PSD речи и шума и, соответственно, выбор подходящих вариантов может придерживаться либо подхода максимального правдоподобия (ML), либо байесовского подхода с минимальной среднеквадратической ошибкой (MMSE).
Взаимосвязь между вектором коэффициентов линейного предсказания и лежащей в основе PSD может определяться с помощью
где являются коэффициентами линейного предсказания, и p является порядком модели линейного предсказания, и
Используя эту взаимосвязь, оцененная PSD зарегистрированного сигнала имеет вид
где gx и gw являются частотно-независимыми усилениями уровней, ассоциированными с PSD речи и шума. Эти усиления вводятся для учета колебания в уровне между PSD, сохраненными в кодовой книге и обнаруженными во входном звуковом сигнале.
Традиционные подходы основываются на поиске по всем возможным парным комбинациям записи речевой кодовой книги и записи шумовой кодовой книги, чтобы определить пару, которая максимизирует некую степень сходства между наблюдаемой PSD с шумами и оцененной PSD, как описано ниже.
Рассмотрим пару PSD речи и шума, заданную iой PSD из речевой кодовой книги и jой PSD из шумовой кодовой книги. PSD с шумами, соответствующую этой паре, можно записать в виде
В этом уравнении PSD известны, тогда как усиления - неизвестны. Таким образом, для каждой возможной пары PSD речи и шума необходимо определить усиления. Это можно выполнить на основе подхода с максимальным правдоподобием. Оценку максимального правдоподобия нужных PSD речи и шума можно получить в двухэтапной процедуре. Логарифм правдоподобия, к которому пришла данная пара в наблюдаемой PSD с шумами, представляется следующим уравнением:
На первом этапе определяются неизвестные члены относящиеся к уровню, которые максимизируют . Одним способом выполнить это является дифференцирование по установка результата в ноль и решение результирующей системы совместных уравнений. Однако эти уравнения нелинейные и не поддаются решению в замкнутой форме. Альтернативный подход основывается на том, что правдоподобие максимизируется, когда и, соответственно, члены, относящиеся к усилению, можно получить путем минимизации спектрального расстояния между этими двумя элементами.
Как только члены, относящиеся к уровню, становятся известны, можно определить значение , так как известны все элементы. Эта процедура повторяется для всех пар записей речевой и шумовой кодовой книги, и пара, которая дает наибольшее правдоподобие, используется для получения PSD речи и шума. Так как этот этап выполняется для каждого короткого временного сегмента, способ может точно оценить PSD шума даже в условиях нестационарного шума.
Пусть обозначает пару, приводящую к наибольшему правдоподобию для данного сегмента, и пусть обозначают соответствующие члены, относящиеся к уровню. Тогда PSD речи и шума задаются с помощью
Эти результаты, таким образом, задают фильтр Винера, который применяется к входному звуковому сигналу, чтобы сформировать сигнал с ослабленным шумом.
Таким образом, известный уровень техники основывается на отыскании подходящей записи кодовой книги нужного сигнала, которая является хорошей оценкой для составляющей речевого сигнала, и подходящей записи кодовой книги шумового сигнала, которая является хорошей оценкой для составляющей шумового сигнала. Как только находятся эти записи, можно применять эффективное ослабление шума.
Однако такой подход является очень сложным и ресурсоемким. В частности, необходимо оценить все возможные пары записей шумовой и речевой кодовой книги, чтобы отыскать наилучшее совпадение. Кроме того, поскольку записи кодовой книги обязаны представлять большое многообразие возможных сигналов, это приводит к очень большим кодовым книгам и, соответственно, ко многим возможным парам, которые необходимо оценить. В частности, составляющая шумового сигнала часто может иметь большое отклонение в возможных характеристиках, например, в зависимости от определенных окружений использования и т.п. Поэтому часто необходима очень большая шумовая кодовая книга, чтобы обеспечить достаточно близкую оценку. Это приводит к очень высоким вычислительным требованиям.
В системе из фиг. 1 сложность и, в частности, использование вычислительного ресурса в алгоритме ослабления шума можно существенно уменьшить путем использования второго сигнала, чтобы сократить количество записей кодовой книги, по которым ищет алгоритм. В частности, в дополнение к приему звукового сигнала для ослабления шума из микрофона система также принимает сигнал датчика, который предоставляет измерение преимущественно составляющей нужного сигнала или преимущественно составляющей шумового сигнала.
Аттенюатор шума из фиг. 1 соответственно содержит приемник 113 датчика, который принимает сигнал датчика от подходящего датчика. Сигнал датчика предоставляет измерение звукового окружения, так что он представляет измерение нужного источника звука или измерение звукового окружения.
В примере приемник 113 датчика соединяется с сегментатором 103, который приступает к сегментированию сигнала датчика на такие же временные сегменты, как и звуковой сигнал. Однако нужно будет принять во внимание, что эта сегментация является необязательной, и что в других вариантах осуществления сигнал датчика может, например, сегментироваться на временные сегменты, которые длиннее, короче, перекрываются или не пересекаются и т.п. относительно сегментации звукового сигнала.
В примере из фиг. 1 аттенюатор 105 шума для каждого сегмента, соответственно, принимает звуковой сигнал и сигнал датчика, который предоставляет другое измерение нужного источника звука или шума в звуковом окружении. Аттенюатор шума затем использует дополнительную информацию, предоставленную сигналом датчика, чтобы выбрать поднабор записей кодовой книги для соответствующей кодовой книги. Таким образом, когда сигнал датчика представляет измерение нужного источника звука, аттенюатор 105 шума формирует поднабор вариантов нужного сигнала. Затем выполняется поиск по возможным парным комбинациям варианта шумового сигнала в шумовой кодовой книге 111 и варианта в сформированном поднаборе вариантов нужного сигнала. Когда сигнал датчика представляет измерение шумового окружения, аттенюатор 105 шума формирует поднабор нужных вариантов шума из шумовой кодовой книги 111. Затем выполняется поиск по возможным парным комбинациям варианта нужного сигнала в кодовой книге 109 нужного сигнала и варианта в сформированном поднаборе вариантов шумового сигнала.
Фиг. 2 иллюстрирует пример некоторых элементов аттенюатора 105 шума. Аттенюатор шума содержит процессор 201 оценки, который формирует множество оцененных вариантов сигнала путем формирования объединенного сигнала для каждой пары из варианта нужного сигнала в первой группе записей кодовой книги в кодовой книге нужного сигнала и варианта шумового сигнала во второй группе записей кодовой книги в шумовой кодовой книге. Таким образом, процессор 201 оценки формирует оценку принятого сигнала для каждой парной комбинации варианта шума из группы вариантов (записей кодовой книги) шумовой кодовой книги и варианта нужного сигнала из группы вариантов (записей кодовой книги) кодовой книги нужного сигнала. Оценка для пары вариантов может формироваться, в частности, в виде взвешенной суммы и, в частности, взвешенного суммирования, что приводит к минимизации функции стоимости.
Аттенюатор 105 шума дополнительно содержит групповой процессор 203, который выполнен с возможностью формирования по меньшей мере одной из первой группы и второй группы путем выбора поднабора записей кодовой книги в ответ на опорный сигнал. Таким образом, любая из первой и второй группы может быть просто равна всей кодовой книге, но по меньшей мере одна из групп формируется в виде поднабора кодовой книги, причем этот поднабор формируется на основе сигнала датчика.
Процессор 201 оценки дополнительно соединяется с процессором 205 вариантов, который приступает к формированию варианта сигнала для входного сигнала на временном сегменте из оцененных вариантов сигнала. Например, вариант может формироваться просто путем выбора оценки, приводящей к наименьшей функции стоимости. В качестве альтернативы вариант может формироваться в виде взвешенной комбинации оценок, где веса зависят от значения функции стоимости.
Процессор 205 вариантов соединяется с процессором 207 ослабления шума, который приступает к ослаблению шума у входного сигнала на временном сегменте в ответ на сформированный вариант сигнала. Например, может применяться фильтр Винера, как описано раньше.
Второй сигнал датчика, соответственно, может использоваться для предоставления дополнительной информации, которая может использоваться для управления поиском, так что его можно значительно уменьшить. Однако сигнал датчика не влияет напрямую на звуковой сигнал, а только направляет поиск, чтобы отыскать оптимальную оценку. В результате искажения, шум, неточности и т.п. в измерении с помощью датчика не будут напрямую воздействовать на обработку сигналов или ослабление шума и поэтому напрямую не внесут никакое ухудшение качества сигнала. В результате сигнал датчика может иметь существенно сниженное качество и, в частности, для измерения нужного сигнала может быть сигналом, который предоставил бы недостаточное качество звука (и в частности, речи), если бы непосредственно использовался. В результате может использоваться широкий спектр датчиков, и, в частности, датчик, который может предоставить существенно иную информацию, нежели микрофон, регистрирующий звуковой сигнал, например незвуковые датчики.
В некоторых вариантах осуществления сигнал датчика может представлять измерение нужного источника звука с помощью сигнала датчика, дающего, в частности, менее точное представление нужного источника звука, чем составляющая нужного сигнала у звукового сигнала.
Например, микрофон может использоваться для регистрации речи от человека в шумном окружении. Иной тип датчика может использоваться для предоставления иного измерения речевого сигнала, которое, однако, может не обладать достаточным качеством, чтобы обеспечить надежную речь, и тем не менее быть полезным для сужения поиска в речевой кодовой книге.
Примером опорного датчика, который регистрирует преимущественно только нужный сигнал, является микрофон на основе костной проводимости, который можно носить около гортани пользователя. Этот микрофон на основе костной проводимости будет регистрировать речевые сигналы, распространяющиеся по (человеческой) ткани. Поскольку этот датчик соприкасается с телом пользователя и экранирован от внешних акустических условий, он может регистрировать речевой сигнал с очень высоким отношением сигнал-шум, то есть он предоставляет сигнал датчика в виде сигнала микрофона на основе костной проводимости, где энергия сигнала, возникающая из нужного источника звука (говорящего), значительно выше (например, по меньшей мере на 10 дБ или больше) энергии сигнала, возникающей из других источников.
Однако из-за местоположения датчика качество зарегистрированного сигнала сильно отличается от качества прошедшей по воздуху речи, которая улавливается микрофоном, помещенным перед ртом пользователя. Соответственно, результирующего качества не достаточно для использования непосредственно в качестве речевого сигнала, но оно весьма подходит для направления ослабления шума на основе кодовой книги, чтобы искать только по небольшому поднабору речевой кодовой книги.
Таким образом, в отличие от традиционных подходов, которые требуют совместного повышения разборчивости с использованием больших речевых и шумовых кодовых книг, подходу из фиг. 1 нужно выполнять только оптимизацию на небольшом поднаборе речевой кодовой книги благодаря наличию четкого опорного сигнала. Это приводит к значительной экономии в вычислительной сложности, поскольку количество возможных комбинаций радикально уменьшается с уменьшением количества вариантов. Кроме того, использование четкого опорного сигнала дает возможность выбора поднабора речевой кодовой книги, который точно моделирует правильную четкую речь, то есть составляющую нужного сигнала. Соответственно, вероятность выбора ошибочного варианта значительно уменьшается, и, соответственно, можно повысить производительность всего ослабления шума.
В других вариантах осуществления сигнал датчика может представлять измерение шума в звуковом окружении и аттенюатор 105 шума может быть выполнен с возможностью сокращения количества вариантов/записей шумовой кодовой книги 111, которые рассматриваются.
Измерение шума может быть прямым измерением звукового окружения или может быть, например, косвенным измерением с использованием датчика с другой модальностью, то есть с использованием незвукового датчика.
В качестве примера звукового датчика может выступать микрофон, установленный далеко от микрофона, регистрирующего звуковой сигнал. Например, микрофон, регистрирующий речевой сигнал, может быть установлен близко ко рту говорящего, тогда как второй микрофон используется для предоставления сигнала датчика. Второй микрофон может быть установлен в положении, где шум преобладает над речевым сигналом и, в частности, может быть установлен достаточно далеко от рта говорящего. Звуковой датчик может находиться достаточно далеко, чтобы отношение между энергией, исходящей из нужного источника звука, и энергией шума уменьшилось не менее чем на 10 дБ в сигнале датчика относительно зарегистрированного звукового сигнала.
В некоторых вариантах осуществления незвуковой датчик может использоваться для формирования, например, сигнала обнаружения механической вибрации. Например, акселерометр может использоваться для формирования сигнала датчика в виде сигнала акселерометра. Такой датчик мог бы устанавливаться, например, на устройстве связи и обнаруживать его вибрации. В качестве другого примера в вариантах осуществления, в которых определенный механический объект известен как основной источник шума, акселерометр может прикрепляться к устройству, чтобы предоставлять сигнал незвукового датчика. В качестве конкретного примера в применении для прачечной акселерометры могут быть установлены на стиральных машинах или барабанах.
В качестве другого примера сигнал датчика может быть сигналом визуального обнаружения. Например, видеокамера может использоваться для обнаружения характеристик визуального окружения, которые указывают звуковое окружение. Например, видеообнаружение может сделать возможным обнаружение, активен ли данный источник шума, и может использоваться для сокращения поиска вариантов шума до соответствующего поднабора. (Сигнал видеодатчика также может использоваться для уменьшения количества просматриваемых вариантов нужного сигнала, например, путем применения алгоритмов чтения по губам к говорящему, чтобы получить грубое указание подходящих вариантов, или, например, путем использования системы распознавания лиц для обнаружения говорящего, так что можно выбрать соответствующие записи кодовой книги.)
Такие сигналы опорного датчика шума затем могут использоваться для выбора поднабора записей шумовой кодовой книги, которые рассматриваются. Это может не только эффективно сократить количество пар записей кодовых книг, которые необходимо рассмотреть, и, соответственно, значительно уменьшить сложность, но также может привести к более точной оценке шума и, соответственно, к улучшенному ослаблению шума.
Сигнал датчика представляет измерение либо источника нужного сигнала, либо шума. Однако нужно будет принять во внимание, что сигнал датчика также может включать в себя другие составляющие сигнала, и, в частности, сигнал датчика в некоторых сценариях может включать в себя вклады от нужного источника звука и от шума в окружении. Однако распределение или вес этих составляющих будет отличаться в сигнале датчика, и, в частности, одна из составляющих обычно будет преобладать. Обычно энергия/мощность составляющей, соответствующей кодовой книге, для которой определяется поднабор (то есть нужный сигнал или шумовой сигнал), не менее чем на 3 дБ, 10 дБ или даже 20 дБ превышает энергию другой составляющей.
Как только выполнен поиск по всем парам вариантов записей кодовой книги, формируется оценка варианта сигнала для каждой пары, обычно вместе с указанием, насколько точно оценка соответствует измеренному звуковому сигналу. Вариант сигнала затем формируется для временного сегмента на основе оцененных вариантов сигнала. Вариант сигнала может формироваться с учетом оценки правдоподобия варианта сигнала, приводящего к зарегистрированному звуковому сигналу.
В качестве примера с низкой сложностью система может просто выбрать оцененный вариант сигнала, имеющий наибольшее значение правдоподобия. В более сложных вариантах осуществления вариант сигнала может вычисляться с помощью взвешенной комбинации и, в частности, суммирования всех оцененных вариантов сигнала, причем взвешивание каждого оцененного варианта сигнала зависит от значения логарифмического правдоподобия.
Звуковой сигнал затем компенсируется на основе вычисленного варианта сигнала. В частности, путем фильтрации звукового сигнала с помощью фильтра Винера:
Нужно будет принять во внимание, что могут использоваться и другие подходы для уменьшения шума на основе оцененных составляющих сигнала и шума. Например, система может вычитать оцененный вариант шума из входного звукового сигнала.
Таким образом, аттенюатор 105 шума формирует выходной сигнал из входного сигнала на временном сегменте, на котором составляющая шумового сигнала ослабляется относительно составляющей речевого сигнала.
Нужно будет принять во внимание, что в разных вариантах осуществления могут использоваться разные подходы для определения поднабора записей кодовой книги. Например, в некоторых вариантах осуществления сигнал датчика может быть параметризованным эквивалентно записям кодовой книги, например, путем представления его в виде PSD, имеющей параметры, соответствующие таковым у записей кодовой книги (в частности, используя одинаковый частотный диапазон для каждого параметра). Самое точное совпадение между PSD сигнала датчика и записями кодовой книги тогда можно найти с использованием подходящего показателя расхождения, например средней квадратической ошибки. Аттенюатор 105 шума затем может выбрать предварительно определенное количество записей кодовой книги, ближайших к идентифицированному совпадению.
Однако во многих вариантах осуществления система ослабления шума может быть выполнена с возможностью выбора поднабора на основе соответствия между вариантами сигнала датчика и записями кодовой книги. Система может, таким образом, содержать блок 301 соответствия, который проиллюстрирован на фиг. 2, причем блок 301 соответствия выполнен с возможностью формирования соответствия из вариантов сигнала датчика в записи кодовой книги.
Это соответствие поступает из блока 301 соответствия в аттенюатор 105 шума, где используется для формирования поднабора одной из кодовых книг. Фиг. 3 иллюстрирует пример того, как может работать аттенюатор 105 шума, например, где сигнал датчика выступает как нужный сигнал.
В примере для принятого сигнала датчика формируются параметры LPC, и результирующие параметры квантуются, чтобы соответствовать возможным вариантам сигнала датчика в сформированном соответствии 401. Соответствие 401 предоставляет соответствие из кодовой книги сигнала датчика, содержащей варианты сигнала датчика, в варианты речевого сигнала в речевой кодовой книге 109. Это соответствие используется для формирования поднабора 403 записей речевой кодовой книги.
Аттенюатор 105 шума может отыскивать, в частности, сохраненные варианты сигнала датчика в соответствии 401, чтобы определить вариант сигнала датчика, который является ближайшим к измеренному сигналу датчика в соответствии с подходящим показателем расхождения, например суммарной средней квадратической ошибкой для параметров. Затем он может сформировать соответствие на основе этого поднабора, например путем включения варианта (вариантов) речевого сигнала, которые соответствуют идентифицированному варианту сигнала датчика в поднаборе. Поднабор может формироваться имеющим нужный размер, например путем включения всех вариантов речевого сигнала, для которых данный показатель расхождения до выбранного варианта речевого сигнала меньше данной пороговой величины, или путем включения всех вариантов речевого сигнала, соответствующих варианту сигнала датчика, для которых данный показатель расхождения до выбранного варианта сигнала датчика меньше данной пороговой величины.
На основе звукового сигнала выполняется поиск по поднабору 403 и записям шумовой кодовой книги 111, чтобы сформировать оцененные варианты сигнала, а затем вариант сигнала для заданного сегмента, как описывалось ранее. Нужно будет принять во внимание, что в качестве альтернативы или дополнительно такой же подход может применяться к шумовой кодовой книге 111 на основе сигнала датчика шума.
Соответствие может формироваться, в частности, с помощью процесса обучения, который может формировать записи кодовой книги и варианты сигнала датчика.
Формирование кодовой книги с N записями для конкретного сигнала может основываться на обучающих данных и может, например, основываться на алгоритме Линде-Бузо-Грея (LBG), описанном в Y. Linde, A. Buzo и R. Gray, "An algorithm for vector quantizer design", Communications, IEEE Transactions on, том 28, № 1, стр. 84-95, январь 1980 г.
В частности, пусть X обозначает набор из L обучающих векторов с элементами длины M. Алгоритм начинается с вычисления одной записи кодовой книги, которая соответствует среднему из обучающих векторов, то есть . Эта запись затем разбивается на две, так что
где η - небольшая постоянная. Алгоритм затем разделяет обучающие векторы на два разбиения X1 и X2, так что
где d(.; .) есть некоторый показатель искажения, например среднеквадратическая ошибка (MSE) или взвешенная MSE (WMSE). Записи текущей кодовой книги затем переопределяются в соответствии с:
Два предыдущих этапа повторяются, пока суммарная ошибка кодовой книги не изменится вместе с записями текущей кодовой книги. Каждая запись кодовой книги затем опять разбивается, и такой же процесс повторяется до тех пор, пока количество записей не станет равно N.
Пусть R и Z обозначают набор обучающих векторов для одного и того же источника звука (либо нужного, либо нежелательного/шума), зарегистрированных опорным датчиком и микрофоном звуковых сигналов соответственно. На основе этих обучающих векторов может формироваться соответствие между вариантами сигнала датчика и первичной кодовой книгой (термин "первичный" обозначает, по обстоятельствам, либо шумовую, либо нужную кодовую книгу) с длиной Nd.
Кодовые книги могут формироваться, например, сначала путем независимого формирования двух кодовых книг соответствия (то есть из вариантов сигнала датчика и первичных вариантов), используя описанный выше алгоритм LBG, с последующим созданием соответствия между записями этих кодовых книг. Соответствие может основываться на показателе расхождения между всеми парами записей кодовой книги, чтобы создать либо соответствие 1-к-1 (либо 1-ко-многим/много-к-1) между кодовой книгой сигнала датчика и первичной кодовой книгой.
В качестве другого примера кодовая книга для сигнала датчика может формироваться вместе с первичной кодовой книгой. В частности, в этом примере соответствие может основываться на одновременных измерениях от микрофона, выдающего звуковой сигнал, и от датчика, выдающего сигнал датчика. Соответствие, таким образом, основывается на разных сигналах, одновременно регистрирующих одно и то же звуковое окружение.
В таком примере соответствие может основываться на допущении, что сигналы синхронизируются во времени, и кодовую книгу вариантов сигнала датчика можно вывести с использованием конечных разбиений, происходящих от применения алгоритма LBG к первичным обучающим векторам. Если набор разбиений (первичной кодовой книги) задается в виде
то набор разбиений, соответствующий опорному датчику R, может формироваться так, что:
Затем может применяться результирующее соответствие, как описывалось ранее.
Система может использоваться во многих разных применениях, включая, например, применения, которые требуют шумоподавления одного микрофона, например мобильная телефония и телефоны DECT. В качестве другого примера этот подход может использоваться в системах повышения разборчивости речи с несколькими микрофонами (например, слуховые аппараты, системы "свободные руки" с системой микрофонов и т.п.), которые обычно имеют одноканальный постпроцессор для дополнительного шумоподавления.
Конечно, тогда как предыдущее описание направлено на ослабление звукового шума в звуковом сигнале, нужно будет принять во внимание, что описанные принципы и подходы могут применяться к другим типам сигналов. Несомненно, отметим, что в любом входном сигнале, содержащем составляющую нужного сигнала и шум, можно ослабить шум с использованием описанного подхода с кодовой книгой.
Примером такого незвукового варианта осуществления может быть система, в которой проводятся измерения частоты дыхания с использованием акселерометра. В этом случае измерительный датчик можно поместить возле груди проверяемого человека. К тому же один или более дополнительных акселерометров можно установить на ноге (или обеих ногах), чтобы устранить вносимые шумы, которые могли бы появиться в первичном сигнале (сигналах) акселерометра во время ходьбы/бега. Таким образом, эти акселерометры, установленные на ногах испытуемых, могут использоваться для сужения поиска по шумовой кодовой книге.
Также нужно будет принять во внимание, что множество датчиков и сигналов датчика может использоваться для формирования поднабора записей кодовой книги, которые рассматриваются. Эти несколько сигналов датчика могут использоваться по отдельности или параллельно. Например, используемый сигнал датчика может зависеть от класса, категории или характеристики сигнала, и, соответственно, некий критерий может использоваться для выбора, на каком сигнале датчика основывать формирование поднабора. В других примерах может использоваться более сложный критерий или алгоритм для формирования поднабора, который рассматривает множество сигналов датчика одновременно.
Нужно будет принять во внимание, что вышеприведенное описание для ясности описало варианты осуществления изобретения со ссылкой на разные функциональные схемы, блоки и процессоры. Однако станет очевидно, что может использоваться любое подходящее распределение функциональных возможностей между разными функциональными схемами, блоками или процессорами без отступления от изобретения. Например, функциональные возможности, проиллюстрированные как выполняемые отдельными процессорами или контроллерами, могут выполняться одним процессором или контроллером. Поэтому ссылки на конкретные функциональные блоки или схемы нужно рассматривать только в качестве ссылок на подходящее средство для обеспечения описанных функциональных возможностей, а не указания на строгую логическую или физическую структуру или организацию.
Изобретение может быть реализовано в любой подходящей форме, включая аппаратные средства, программное обеспечение, микропрограммное обеспечение или любое их сочетание. Изобретение при желании может быть реализовано, по меньшей мере частично, в виде компьютерного программного обеспечения, выполняемого на одном или более процессорах данных и/или цифровых процессорах сигналов. Элементы и компоненты из варианта осуществления изобретения могут быть физически, функционально и логически реализованы любым подходящим способом. В действительности функциональные возможности могут быть реализованы в одном блоке, в множестве блоков или как часть других функциональных блоков. По существу, изобретение может быть реализовано в одном блоке или может быть физически и функционально распределено между разными блоками, схемами и процессорами.
Хотя настоящее изобретение описано применительно к некоторым вариантам осуществления, оно не предназначено, чтобы ограничиваться конкретной формой, изложенной в этом документе. Наоборот, объем настоящего изобретения ограничивается только прилагаемой формулой изобретения. Более того, хотя признак может казаться описанным по отношению к конкретным вариантам осуществления, специалист в данной области техники признал бы, что различные признаки описанных вариантов осуществления могут объединяться в соответствии с изобретением. В формуле изобретения термин "содержащий" не исключает наличия других элементов или этапов.
Кроме того, хотя и не перечислено отдельно, множество средств, элементов, схем или этапов способа могут быть реализованы, например, одиночной схемой, блоком или процессором. Более того, хотя отдельные признаки могут включаться в разные пункты формулы изобретения, они могут по возможности выгодно объединяться, и включение в разные пункты формулы не подразумевает, что сочетание признаков не является осуществимым и/или выгодным. Также включение признака в одну категорию пунктов формулы не подразумевает ограничение этой категорией, а скорее указывает, что при необходимости признак в равной степени применим к другим категориям пунктов формулы. Кроме того, порядок признаков в формуле изобретения не подразумевает никакого конкретного порядка, в котором должны осуществляться признаки, и, в частности, порядок отдельных этапов в пункте формулы изобретения на способ не подразумевает, что этапы должны выполняться в этом порядке. Скорее, этапы могут выполняться в любом подходящем порядке. К тому же единичные ссылки не исключают множества. Таким образом, ссылки на "первый", "второй" и т.д. не препятствуют множеству. Ссылочные позиции в формуле изобретения предоставляются лишь в качестве поясняющего примера и не должны толковаться как ограничивающие объем формулы изобретения каким-либо образом.
Изобретение относится к технике ослабления шума в сигнале. Достигаемый технический результат - обеспечение улучшенного более точного ослабления шума и упрощение ослабления шума. Устройство ослабления шума содержит приемник для приема первого сигнала окружения, который содержит составляющую нужного сигнала, соответствующую сигналу из нужного источника в окружении, и составляющую шумового сигнала, соответствующую шуму в окружении, две кодовых книги, вход для приема сигнала датчика, представляющего измерение окружения, сегментатор для сегментирования первого сигнала на временные сегменты, аттенюатор шума, выполненный с возможностью выполнения для каждого временного сегмента этапов формирования множества оцененных вариантов сигнала и ослабления шума первого сигнала на данном временном сегменте в ответ на вариант сигнала. 2 н. и 12 з.п. ф-лы, 4 ил.
1. Устройство ослабления шума, содержащее:
- приемник (101) для приема первого сигнала для окружения, причем первый сигнал содержит составляющую нужного сигнала, соответствующую сигналу из нужного источника в окружении, и составляющую шумового сигнала, соответствующую шуму в окружении;
- первую кодовую книгу (109), содержащую множество вариантов нужного сигнала для составляющей нужного сигнала, причем каждый вариант нужного сигнала представляет возможную составляющую нужного сигнала;
- вторую кодовую книгу (111), содержащую множество вариантов шумового сигнала для составляющей шумового сигнала, причем каждый вариант шумового сигнала представляет возможную составляющую шумового сигнала;
- вход (113) для приема сигнала датчика, предоставляющего измерение окружения, причем сигнал датчика представляет измерение нужного источника или шума в окружении;
- сегментатор (103) для сегментирования первого сигнала на временные сегменты;
- аттенюатор (105) шума, выполненный с возможностью выполнения для каждого временного сегмента этапов:
- формирования множества оцененных вариантов сигнала путем формирования объединенного сигнала для каждой пары из варианта нужного сигнала в первой группе записей кодовой книги в первой кодовой книге и варианта шумового сигнала во второй группе записей кодовой книги во второй кодовой книге;
- формирования варианта сигнала для первого сигнала на данном временном сегменте из оцененных вариантов сигнала, и
- ослабления шума у первого сигнала на данном временном сегменте в ответ на вариант сигнала;
причем аттенюатор (105) шума выполнен с возможностью формирования по меньшей мере одной из первой группы и второй группы путем выбора поднабора записей кодовой книги в ответ на опорный сигнал.
2. Устройство ослабления шума по п. 1, в котором сигнал датчика представляет измерение нужного источника и аттенюатор (105) шума выполнен с возможностью формирования первой группы путем выбора поднабора записей кодовой книги из первой кодовой книги (109).
3. Устройство ослабления шума по п. 2, в котором первый сигнал является звуковым сигналом, нужный источник является источником звука, составляющая нужного сигнала является речевым сигналом и сигнал датчика является сигналом микрофона на основе костной проводимости.
4. Устройство ослабления шума по п. 2, в котором сигнал датчика обеспечивает менее точное представление нужного источника, чем составляющая нужного сигнала.
5. Устройство ослабления шума по п. 1, в котором сигнал датчика представляет измерение шума и аттенюатор (105) шума выполнен с возможностью формирования второй группы путем выбора поднабора записей кодовой книги из второй кодовой книги (111).
6. Устройство ослабления шума по п. 5, в котором сигнал датчика является сигналом обнаружения механической вибрации.
7. Устройство ослабления шума по п. 5, в котором сигнал датчика является сигналом акселерометра.
8. Устройство ослабления шума по п. 1, дополнительно содержащее блок (301) соответствия для формирования соответствия между множеством вариантов сигнала датчика и записями кодовой книги по меньшей мере в одной из первой кодовой книги и второй кодовой книги; и причем аттенюатор (105) шума выполнен с возможностью выбора поднабора записей кодовой книги в ответ на соответствие.
9. Устройство ослабления шума по п. 8, в котором аттенюатор (105) шума выполнен с возможностью выбора первого варианта сигнала датчика из множества вариантов сигнала датчика в ответ на показатель расхождения между каждым из множества вариантов сигнала датчика и сигналом датчика и формирования поднабора в ответ на соответствие для первого варианта сигнала.
10. Устройство ослабления шума по п. 8, в котором блок (301) соответствия выполнен с возможностью формирования соответствия на основе одновременных измерений от входного датчика, выдающего первый сигнал, и датчика, выдающего упомянутый сигнал датчика.
11. Устройство ослабления шума по п. 8, в котором блок (301) соответствия выполнен с возможностью формирования соответствия на основе показателей разности между вариантами сигнала датчика и записями кодовой книги по меньшей мере в одной из первой кодовой книги и второй кодовой книги.
12. Устройство ослабления шума по п. 1, в котором первый сигнал является сигналом микрофона от первого микрофона, а сигнал датчика является сигналом микрофона от второго микрофона, удаленного от первого микрофона.
13. Устройство ослабления шума по п. 1, в котором первый сигнал является звуковым сигналом, а сигнал датчика поступает от незвукового датчика.
14. Способ ослабления шума, содержащий этапы, на которых:
- принимают первый сигнал для окружения, причем первый сигнал содержит составляющую нужного сигнала, соответствующую сигналу из нужного источника в окружении, и составляющую шумового сигнала, соответствующую шуму в окружении;
- предоставляют первую кодовую книгу (109), содержащую множество вариантов нужного сигнала для составляющей нужного сигнала, причем каждый вариант нужного сигнала представляет возможную составляющую нужного сигнала;
- предоставляют вторую кодовую книгу (111), содержащую множество вариантов шумового сигнала для составляющей шумового сигнала, причем каждый вариант шумового сигнала представляет возможную составляющую шумового сигнала;
- принимают сигнал датчика, предоставляющий измерение окружения, причем сигнал датчика представляет измерение нужного источника или шума в окружении;
- сегментируют первый сигнал на временные сегменты;
- для каждого временного сегмента выполняют этапы, на которых:
- формируют множество оцененных вариантов сигнала путем формирования объединенного сигнала для каждой пары из варианта нужного сигнала в первой группе записей кодовой книги в первой кодовой книге и варианта шумового сигнала во второй группе записей кодовой книги во второй кодовой книге,
- формируют вариант сигнала для первого сигнала на данном временном сегменте из оцененных вариантов сигнала, и
- ослабляют шум у первого сигнала на данном временном сегменте в ответ на вариант сигнала;
и формируют по меньшей мере одну из первой группы и второй группы путем выбора поднабора записей кодовой книги в ответ на опорный сигнал.
КВАНТОВАНИЕ КОЭФФИЦИЕНТОВ УСИЛЕНИЯ ДЛЯ РЕЧЕВОГО КОДЕРА ЛИНЕЙНОГО ПРОГНОЗИРОВАНИЯ С КОДОВЫМ ВОЗБУЖДЕНИЕМ | 2001 |
|
RU2257556C2 |
СПОСОБ И УСТРОЙСТВО ЭФФЕКТИВНОЙ МАСКИРОВКИ СТИРАНИЯ КАДРОВ В РЕЧЕВЫХ КОДЕКАХ | 2006 |
|
RU2419891C2 |
УСТРОЙСТВО ПОИСКА ШИРОКОПОЛОСНЫХ СИГНАЛОВ | 1985 |
|
SU1840043A1 |
US 5911128 A, 08.06.1999. |
Авторы
Даты
2017-03-01—Публикация
2012-10-16—Подача