Способ повышения разборчивости речи Российский патент 2018 года по МПК G10L21/02 G10L21/364 

Описание патента на изобретение RU2676022C1

Изобретение относится к области речевых технологий и может быть использовано при передаче речевого сигнала по каналам связи и оптимизации его восприятия при аудировании.

Технический результат - повышение разборчивости речи в разнообразных окружающих условиях.

Из уровня техники известны:

- Эквалайзеры, позволяющие вручную или автоматически регулировать спектральный состав воспроизводимого речевого звука.

- Способы подавление шумовых помех за счет моделирования шума из набора типовых вариантов, однако, трудно построить адекватную на каждый случай комбинацию.

- Оценка реального шума (помехи) в исходном сигнале и, затем, вычитание его из речевого сигнала с шумами. Обычно оценивают шум из предыдущих интервалов исходного сигнала, однако при динамичном изменении шума во времени оценка будет не точной.

- Традиционная система подавления эхо-сигналов, используемая в конференц-связи.

Большинство известных способов повышения разборчивости речи строятся на принципах анализа фонового шума, присутствующего в окружающем пространстве и уменьшения взаимных помех между фоном и речевым сигналом.

Принципиальной особенностью подхода в предлагаемом способе является его независимость от фоновых условий, так как повышение разборчивости речевого сигнала в данном случае производится за счет усиления устойчивых спектрально-фонетических признаков исходного речевого сигнала.

Это достигается посредством воздействия на речевой сигнал системой специально настроенных полосовых фильтров, которые усиливают в исходном сигнале фонетически значимые спектральные области и, тем самым, помогают при аудировании членить речь и распознавать ее сегменты. При этом снижается маскирующее воздействие фонового шума и облегчается опознавание речи при эффектах «недослышания».

Универсальный характер специальной настройки полосовых фильтров обусловлен анатомически заданными резонансными полостями речевого тракта, который выступает в качестве динамично меняющегося фильтрующего устройства. Для определенных совокупностей речевых звуков перемещение резонансных областей (формант) в процессе артикуляции происходит в определенных полосах частот. Набор таких полос определяется статистически, вариативные нюансы при этом размываются именно за счет статистического характера частотных полос, в результате полосы становятся более устойчивыми. Прохождение речевого сигнала в процессе коррекции через подъемы амплитудно-частотных характеристик системы фильтров, перекрывающих зоны унифицированных частотных полос, и создает эффект подчеркнутой артикулированности, отчетливости речевых сегментов. При прослушивании речи различными аудиторами в различных условиях оптимальными могут быть различные комбинации включенных полосовых фильтров.

Практическая реализация предлагаемого способа может быть решена как схематически на базе серийно выпускаемых микросхем, так и на программном уровне с использованием компьютера.

Макет устройства для испытаний эффективности предлагаемого способа был создан на базе операционных усилителей по известным схемным структурам полосовых фильтров. В макет входило четыре полосовых фильтра, настроенных:

1. на интонационно-ритмические компоненты и «носовую» форманту речи;

2. на основные форманты гласных (первую и второю);

3. на третьи форманты гласных и сонорных звуков;

4. на тембральные компоненты шипящих-свистящих звуков.

Устройство работает следующим образом. Речевой сигнал, поступающий с выхода микрофона, усиливается, фильтруется системой полосовых фильтров, любой из которых может быть отключен или включен, суммируется с исходным речевым сигналом и подается на головные телефоны для прослушивания.

При испытании макетного устройства, реализующего рассмотренный способ, использовались речевые записи различного качества, в том числе зашумленные.

Прослушивание проводилось группой экспертов-аудиторов. В качестве критерия служило более отчетливое восприятие обработанного речевого сигнала в сравнении с исходным.

Испытания макета показали однозначно положительный результат, при этом различные аудиторы в зависимости от условий и характера речевого материала задавали различные комбинации включения полосовых фильтров.

Похожие патенты RU2676022C1

название год авторы номер документа
СПОСОБ ОСУЩЕСТВЛЕНИЯ МАШИННОЙ ОЦЕНКИ КАЧЕСТВА ЗВУКОВЫХ СИГНАЛОВ 2005
  • Гусев Михаил Николаевич
  • Дегтярев Владимир Михайлович
  • Жарков Игорь Вениаминович
RU2312405C2
СПОСОБ И УСТРОЙСТВО ФОРМИРОВАНИЯ МАСКИРУЮЩЕЙ ПОМЕХИ 1999
  • Воевода Ф.С.
  • Железняк В.К.
  • Комарович В.Ф.
  • Панкин В.В.
RU2154893C1
СПОСОБ ИЗМЕРЕНИЯ РАЗБОРЧИВОСТИ РЕЧИ 2020
  • Хорев Анатолий Анатольевич
  • Порсев Илья Сергеевич
RU2748934C1
СПОСОБ АДАПТИВНОЙ ФИЛЬТРАЦИИ РЕЧЕВЫХ СИГНАЛОВ В СЛУХОВЫХ АППАРАТАХ 1993
  • Молчанов Александр Павлович
  • Бабкина Людмила Назаровна
RU2047946C1
СПОСОБ РАСПОЗНАВАНИЯ ИЗОЛИРОВАННЫХ СЛОВ РЕЧИ С АДАПТАЦИЕЙ К ДИКТОРУ 1994
  • Сорокин Виктор Николаевич
RU2047912C1
СПОСОБ ИДЕНТИФИКАЦИИ ГОВОРЯЩЕГО ПО ФОНОГРАММАМ ПРОИЗВОЛЬНОЙ УСТНОЙ РЕЧИ НА ОСНОВЕ ФОРМАНТНОГО ВЫРАВНИВАНИЯ 2009
  • Коваль Сергей Львович
RU2419890C1
СПОСОБ И УСТРОЙСТВО ФОРМИРОВАНИЯ ГЛАСНЫХ ЗВУКОВ РЕЧИ ИЗ ШУМОПОДОБНЫХ ЗВУКОВ ПИЩЕВОДНОГО ГОЛОСА 2005
  • Уваров Владимир Константинович
  • Кишинец Павел Павлович
RU2320025C2
СПОСОБ И СИСТЕМА ДИНАМИЧЕСКОЙ АДАПТАЦИИ СИНТЕЗАТОРА РЕЧИ ДЛЯ ПОВЫШЕНИЯ РАЗБОРЧИВОСТИ СИНТЕЗИРУЕМОЙ ИМ РЕЧИ 2002
  • Петер Вепрек
RU2294565C2
СПОСОБ ФОРМИРОВАНИЯ РЕЧЕПОДОБНОГО МАСКИРУЮЩЕГО СИГНАЛА 2005
  • Железняк Владимир Кириллович
  • Червинский Василий Михайлович
RU2308159C2
СПОСОБ АДАПТИВНОЙ ФИЛЬТРАЦИИ РЕЧЕВЫХ СИГНАЛОВ В СЛУХОВЫХ АППАРАТАХ 1996
  • Молчанов А.П.
  • Бабкина Л.Н.
RU2111732C1

Реферат патента 2018 года Способ повышения разборчивости речи

Изобретение относится к средствам для разборчивости речи. Технический результат заключается в повышение разборчивости речи. Речевой сигнал усиливается, фильтруется системой полосовых фильтров, подается на телефон или динамик. При этом обеспечивается возможность отключения полосовых фильтров в различных комбинациях. Полосовые фильтры настроены в соответствии со спектральными зонами, несущими основные фонетические признаки звуков речи. 1 з.п. ф-лы.

Формула изобретения RU 2 676 022 C1

1. Способ повышения разборчивости речи, заключающийся в том, что речевой сигнал усиливается, фильтруется системой полосовых фильтров, подается на телефон или динамик, отличающийся возможностью отключения полосовых фильтров в различных комбинациях и тем, что полосовые фильтры настроены в соответствии со спектральными зонами, несущими основные фонетические признаки звуков речи.

2. Способ по п. 1, отличающийся тем, что речевой сигнал, отфильтрованный системой полосовых фильтров, суммируется с исходным речевым сигналом.

Документы, цитированные в отчете о поиске Патент 2018 года RU2676022C1

СПОСОБ И УСТРОЙСТВО ДЛЯ ЧАСТОТНО-ИЗБИРАТЕЛЬНОГО ВЫДЕЛЕНИЯ ОСНОВНОГО ТОНА СИНТЕЗИРОВАННОЙ РЕЧИ 2003
  • Бессетт Брюно
  • Лафламм Клод
  • Желинек Милан
  • Лефевр Рок
RU2327230C2
СИСТЕМА И СПОСОБ ОБРАБОТКИ ЗВУКОВОГО СИГНАЛА 2004
  • Таурве Бруно К.Р.
RU2347282C2
ПОВЫШЕНИЕ РАЗБОРЧИВОСТИ РЕЧИ В ЗВУКОЗАПИСИ РАЗВЛЕКАТЕЛЬНЫХ ПРОГРАММ 2008
  • Мюш Ханнес
RU2440627C2
ПОВЫШЕНИЕ РАЗБОРЧИВОСТИ РЕЧИ С ПОМОЩЬЮ ЧЕТКОСТИ ГОЛОСА 2008
  • Юй Ронгшан
  • Браун С. Филлип
RU2469423C2
Кантовочная лебедка для открытия и закрытия газовых клапанов и перекидки клапанов воздуха, и продуктов горения коксовых печей 1931
  • Заславский П.В.
SU27259A1
US 8296136 B2, 23.10.2012
US 8606566 B2, 10.12.2013.

RU 2 676 022 C1

Авторы

Мулюкин Николай Васильевич

Ясинская Татьяна Борисовна

Даты

2018-12-25Публикация

2016-07-13Подача