Способ оценки качества канала передачи речевого сигнала Советский патент 1987 года по МПК H04B3/46 

Описание патента на изобретение SU1322486A1

Изобретение относится к электросвязи и может быть использовано для оценки качества передачи речевого сигнала цифровыми и аналоговыми каналами связи, качества передачи информации при записи ее на носитель и воспроизведении с него при передаче речевого сигнала через устройства обработки речевого сигнала, таких, как усилители или процессоры обработки сигналов и т.п.

Цель изобретения - повышение достоверности оценки.

На фиг. 1 приведена структурная электрическая схема устройства, реализующего предлагаемый способ; на фиг. 2 - диаграмма, поясняющая процедуру выравнивания масштабов времени.

Устройство, реализующее предлагаемый способ, содержит блок 1 формирования тестовых сигналов, первьш блок 2 измерения выбранных параметров, блок 3 записи, канал передачи речи (КНР) 4, второй блок 5 измерения выбранных параметров, блок 6 сравне- - кия, блок 7 выравнивания, блок 8 выбора сигналов и решающий блок 9.

Сущность предлагаемого способа состоит в том, что оценка качества КНР производится по речевому стимулу. Получение оценки объективно и максимально приближено к восприятию речевого сигнала пользователем. При этом за счёт локально нелинейного изменения масштабов времени речевых сигналов на выходе и входе КПР достигается нацбо- лее точный выбор соответствия сигналов на выходе вводимым тестовым сигналом, причем учитываются или исключаются искажения и помехи, вносимые в сигнал во время .прохождения его по КПР, в близком соответствии процессу учета или исключения аналогичных искажений слуховой системой человека. Сравнение сигналов на входе и выходе канала проводится с учетом динамических изменений сигнала.

Устройство, реализующее предлагаемый способ, работает следующим образом.

В качестве тестового материала для оценки качества канала передачи речевого сигнала используют полученньй с помощью высококачественного микрофона речевЬй сигнал изолированно произнесенных речевых высказываний, например

словесных. Слоговых или фразовых таблиц. Речевой материал наговаривают несколько дикторов. Произнесения записывают на магнитофон блока 1. Речевой

сигнал каждого высказывания анализируют в блоке 2 измерения выбранных параметров, который состоит из устройств выделения характеристических параметров речевого сигнала, например гребенки полосовых фильтров с детекторами и ФНЧ на выходе каждого фильтра. При этом каждый сигнал разбивают ha последовательность участков, соответствующих равным интервалам времени

длиной 5-40 мс, либо на участки, соответствующие стационарным частям сигнала или выбрасыванию пауз, пропуску отдельных частей сигнала. Для каждого отдельного участка каждого сигнала измеряют характеристические параметры, выбранные в зависимости от задач и возможностей аппаратуры, например это могут быть спектральные параметры, т.е. получаемые с помощью сигнала в различных частотных полосах или это могут быть коэффициенты автокорреляционной функции и т.д. Главным свойством выбранных параметров должно быть отражение ими динамических изменений спек-тра речевого сигнала. Разные с точки зрения слухового восприятия человеком интервалы должны иметь разные значения соответствукяцих им характеристических параметров. ТаКИМ образом, для каждого сигнала образуется совокупность характеристических параметров для последовательности разнесенных во времени участков данного тестового сигнала. Полученные совокупности параметров записывают на носителе информации в блоке 3 записи. Каждый полученный в блоке 1 тестовьй сигнал подается на вход оцениваемого КПР 4. Сигнал может также наговариваться через микрофон дикторами и непосредственно подаваться на вход КПР 4. Под КПР 4 понимается любое устройство обработки речевого сигнала, аппаратуры записи и воспроизведения речевого сигнала, устройства, передающие речевой сигнал (телефоны, усилители, приемопередающие устройства и т.д.). С выхода оцениваемого КПР 4 сигналы поступают в

блок 5, тождественнь1й блоку 2, где измеряют те же самые выбранные параметры для каждого участка каждого сигнала.

31322486

Таким .образом, получают совокупности параметров для каждого сигнала на выходе КНР 4 на последовательности участков, разнесенных во времени аналогично последовательностям участков с тестовых сигналов, например, на последовательности интервалов той же ,-,длительности, которая использовалась при анализе входного тестового речевого сигнала. Полученные совокупное- 10 ти выбранных параметров сигналов на выходе оцениваемого КПР 4 и тестовых сигналов поступают в блок 7, ко- торый состоит из цифрового устройства нелинейного выравнивания длины со- 15 Разность между моментом времени i для вокупностей параметров (например, это A(i) и моментом времени j для B(j)

отдельным частям независимо друг от друга меняться по длительности. При этсм выравнивание должно проводиться, таким образом, чтобы полученные новые локально нелинейно выравненные во времени переменные совпадали друг с другом наилучшим образом среди всех возможных вариантов изменения первоначальных переменных.

Для объяснения такого способа, оптимального с точки зрения разборчивоети выравнивания,рассмотрим плоскость i,j, где переменные A{i) и B(j) отложены соответственно вдоль осей i и j.

может быть специализированная микро- ЭВМ) .

В нем производят нелинейное выравнивание масштабов времени каждого 20 входного тестового сигнала и каждого сигнала на выходе оцениваемого канала с помощью процедуры динамического программирования.

Процедура состоит в следующем. 25 Пусть набор входного тестового сигнала описывается переменной

А А{1), А(1), A(N)}, где A(i) - вектор значений характеристических параметров для i-й части 30 входного тестового сигнала, причем части входного сигнала расположены в порядке их следования во времени.

Пусть таких частей N. Пусть набор параметров сигнала на выходе КПР 4 описывается переменной

В {B(l),B(j), В(М)}, где B(j) - вектор значений параметров

обозначим как С C(i,j). Процесс выравнивания длительностей.A(N) и В(М) можно представить в виде пути на плоскости i, j из точки с координатами (1, 1) в точку с координатами (N, М). При этом на пути его вертикальный участок соответствует участку выравнивания, при котором одному моменту времени j соответствует несколько моментов времени по оси i, т.е. время произнесения А на этом участке сжимается. Аналогично этому горизонтальный участок пути соответствует сжатию времени высказываний В на данном участке. Диагональный участок пути по плоскости соответствует сохранению масштабов времени на этом участке. Таких путей на плоскости, т.е. способов вы- 35 равнивания B(i) и A(i), может быть очень много. Среди них надо выбрать такой, который среди всех возможных путей обеспечивал бы наилучшее совпадение сравниваемых A(i) и B(i). Техника поиска такого пути с помощью динамического программирования обеспечивает быстрое и алгоритмически простое решение данной задачи. Поиск наи- лучшего пути математически эквивалентен поиску минимума расстояния между выровненными по длине переменными A(i) и B(i). Эта задача может быть решена при использовании процедуры динамического программирования. При

для j-и части сигнала на выходе

КПР 4.

Пусть таких частей М. Части расположены в порядке их следования во времени. Поскольку длина высказываний различна и могла изменяться за время прохождения через КПР 4, то М т N. Это значит, что перед сравнением переменных А и В их надо выравнять по длине, т.е. выравнять масштабы времени входного тестового сигнала и сигобозначим как С C(i,j). Процесс вы равнивания длительностей.A(N) и В(М) можно представить в виде пути на пло кости i, j из точки с координатами (1, 1) в точку с координатами (N, М) При этом на пути его вертикальный участок соответствует участку выравнивания, при котором одному моменту времени j соответствует несколько мо ментов времени по оси i, т.е. время произнесения А на этом участке сжима ется. Аналогично этому горизонтальны участок пути соответствует сжатию вр мени высказываний В на данном участ ке. Диагональный участок пути по пло кости соответствует сохранению масштабов времени на этом участке. Таких путей на плоскости, т.е. способов вы 35 равнивания B(i) и A(i), может быть очень много. Среди них надо выбрать такой, который среди всех возможных путей обеспечивал бы наилучшее совпа дение сравниваемых A(i) и B(i). Техника поиска такого пути с помощью ди намического программирования обеспечивает быстрое и алгоритмически прос тое решение данной задачи. Поиск наи лучшего пути математически эквивален тен поиску минимума расстояния между выровненными по длине переменными A(i) и B(i). Эта задача может быть решена при использовании процедуры динамического программирования. При

45

нала на вькоде КПР 4. Природа речево- этом находится наилучшим образом вы- го сигнала такова, что при небольших равнивающий путь. На выравнивающем независимых друг от друга локальных пути сравнивается в блоке 6 -совокуп- изменениях длительности отдельных звуков в пределах высказывания правильности его опознавания человеком не изменяется. Поэтому для выравнивания по длительности А и В переменных необходима процедура, позволяющая их

55

ность параметров сигнала на выходе КПР 4 и запомненная совокупность па- раметров каждого тестового сигнала, таким образом находится мера близости между этими сигналами с учетом вы- равнивпния их масштабов времени. Мер

Разность между моментом времени i для A(i) и моментом времени j для B(j)

отдельным частям независимо друг от друга меняться по длительности. При этсм выравнивание должно проводиться, таким образом, чтобы полученные новые локально нелинейно выравненные во времени переменные совпадали друг с другом наилучшим образом среди всех возможных вариантов изменения первоначальных переменных.

Для объяснения такого способа, оптимального с точки зрения разборчивое ти выравнивания,рассмотрим плоскость i,j, где переменные A{i) и B(j) отложены соответственно вдоль осей i и j.

Разность между моментом времени i для A(i) и моментом времени j для B(j)

обозначим как С C(i,j). Процесс выравнивания длительностей.A(N) и В(М) можно представить в виде пути на плоскости i, j из точки с координатами (1, 1) в точку с координатами (N, М). При этом на пути его вертикальный участок соответствует участку выравнивания, при котором одному моменту времени j соответствует несколько моментов времени по оси i, т.е. время произнесения А на этом участке сжимается. Аналогично этому горизонтальный участок пути соответствует сжатию времени высказываний В на данном участке. Диагональный участок пути по плоскости соответствует сохранению масштабов времени на этом участке. Таких путей на плоскости, т.е. способов вы- равнивания B(i) и A(i), может быть очень много. Среди них надо выбрать такой, который среди всех возможных путей обеспечивал бы наилучшее совпадение сравниваемых A(i) и B(i). Техника поиска такого пути с помощью динамического программирования обеспечивает быстрое и алгоритмически простое решение данной задачи. Поиск наи- лучшего пути математически эквивалентен поиску минимума расстояния между выровненными по длине переменными A(i) и B(i). Эта задача может быть решена при использовании процедуры динамического программирования. При

этом находится наилучшим образом вы- равнивающий путь. На выравнивающем пути сравнивается в блоке 6 -совокуп-

ность параметров сигнала на выходе КПР 4 и запомненная совокупность па- раметров каждого тестового сигнала, таким образом находится мера близости между этими сигналами с учетом вы- равнивпния их масштабов времени. Меру

близости между переменными А и В находят по формулам. Меру близости находят между сигналом на выходе, КПР 4 и каждым запомненным тестовым лом. Эту процедуру проводят для каждого сигнала на выходе КПР 4. В блоке 8, состоящем, например, из микро- ЭВМ Электроника НЦ-80, для каждого выходного сигнала находят наиболее близкий к нему тестовьй сигнал путем поиска среди найденных мер близости минимальной меры близости. Затем по правилу бл ижайшего соседа для каждого сигнала на выходе КПР 4 находят среди записанных тестовых сигналов наиболее -близкий сигнал. Следовательно, каждому тестовому сигналу после его пропускания через КПР 4 соответствует некоторый другой измененный сигнал. По числу совпадений сигналов на выходе КПР 4 с соответствующими им тестовыми сигналами в решающем блоке 9 определяют точность передачи ре- чевьш высказываний оцениваемым КПР 4. Число совпадений нормируют на общее число использованных тестовых сигналов. Полученное число называют значением разборчивости в процентах для. оцениваемого КПР 4. По этому числу

W

t5

0

25

ся в формиро вании тестовых сигналов, измерении.выбранных параметров каждо го тестового сигнала, запоминании из меренных параметров каждого тестовог сигнала, передаче каждого тестового сигнала через оцениваемьй канал пере дачи речевого сигнала, измерении тех же выбранных параметров тестового си нала на выходе канала передачи речевого сигнала и сравнении результатов измерения параметров тестового сигна ла на выходе канала передачи речевог сигнала с запомненными измеренными п раметрами тестового сигнала, отли чающийся тем, что, с целью п вышения достоверности оценки, в качестве тестовых сигналов выбирают те товые речевые высказывания, для каждой части которых измеряют выбранные параметры,-перед сравнением выравнивают длительность каждого тестового сигнала на входе и выходе канала пер дачи речевого сигнала, а сравнение, измеренных параметров для каждой час тестового сигнала на выходе канала передачи речевого сигнала осуществля ют с запомненными параметрами каждой из частей тестового сигнала на входе канала передачи речевого сигнала, из

оцениваемого wir ч. ни -ан. ..- -г судят о качестве передачи речевой ий- 30 которых выбирают часть с наибольшим формации КПР 4, ориентируясь или на числом совпавших параметров, и оце- сравнение значений разборчивости для различных КПР или на соответствующие стандарты, принятые для оценки качест ва каналов речевой связи.35

Формула изобретения. Способ оценки качества канала пе- редачи речевого сигнала, заключающийнивают качество канала передачи реч вого сигнала по количеству выборов соответствующих частей тестового си нала на входе канала передачи речев го сигнала в качестве частей с наибольшим числом совпавших парамет ров .

5

0

5

ся в формиро вании тестовых сигналов,, измерении.выбранных параметров каждого тестового сигнала, запоминании измеренных параметров каждого тестового сигнала, передаче каждого тестового сигнала через оцениваемьй канал передачи речевого сигнала, измерении тех же выбранных параметров тестового сигнала на выходе канала передачи речевого сигнала и сравнении результатов измерения параметров тестового сигнала на выходе канала передачи речевого сигнала с запомненными измеренными параметрами тестового сигнала, отличающийся тем, что, с целью повышения достоверности оценки, в качестве тестовых сигналов выбирают тестовые речевые высказывания, для каждой части которых измеряют выбранные параметры,-перед сравнением выравнивают длительность каждого тестового сигнала на входе и выходе канала передачи речевого сигнала, а сравнение, измеренных параметров для каждой части тестового сигнала на выходе канала передачи речевого сигнала осуществляют с запомненными параметрами каждой из частей тестового сигнала на входе канала передачи речевого сигнала, из

..- -г которых выбирают часть с наибольшим числом совпавших параметров, и оце-

нивают качество канала передачи речевого сигнала по количеству выборов соответствующих частей тестового сигнала на входе канала передачи речевО го сигнала в качестве частей с наибольшим числом совпавших параметров .

А. в

фиг. /

Фиг.2

Похожие патенты SU1322486A1

название год авторы номер документа
СПОСОБ РАСПОЗНАВАНИЯ СЛОВ В СЛИТНОЙ РЕЧИ 2005
  • Аграновский Александр Владимирович
  • Леднов Дмитрий Анатольевич
  • Зулкарнеев Михаил Юрьевич
  • Арутюнян Роман Эрнстович
RU2297676C2
СПОСОБ ЛЕКСИЧЕСКОЙ ИНТЕРПРЕТАЦИИ СЛИТНОЙ РЕЧИ И СИСТЕМА ДЛЯ ЕГО РЕАЛИЗАЦИИ 1997
  • Изилов Яков Юноевич
  • Изилов Роман Юноевич
  • Изилов Юно Романович
RU2119196C1
МЕТОД РАСПОЗНАВАНИЯ ДИКТОРА И УСТРОЙСТВО ДЛЯ ЕГО ОСУЩЕСТВЛЕНИЯ 2002
  • Лабутин П.В.
  • Раев А.Н.
  • Коваль С.Л.
RU2230375C2
СПОСОБ РАСПОЗНАВАНИЯ СЛОВ В СЛИТНОЙ РЕЧИ И СИСТЕМА ДЛЯ ЕГО РЕАЛИЗАЦИИ 1996
  • Изилов Я.Ю.
  • Морозов Б.И.
  • Федотов А.И.
  • Изилов Ю.Р.
RU2101782C1
СПОСОБ И УСТРОЙСТВО АВТОМАТИЧЕСКОЙ ВЕРИФИКАЦИИ ЛИЧНОСТИ ПО ГОЛОСУ 2008
  • Голубинский Андрей Николаевич
RU2399102C2
СИСТЕМА ДЛЯ ВЕРИФИКАЦИИ ГОВОРЯЩЕГО 1996
  • Мэммон Ричард Дж.
  • Фаррел Кевин
  • Шарма Мэниш
  • Дивэнг Нейк
  • Занг Зяою
  • Ассалех Халед
  • Леу Хан-Шенг
RU2161336C2
СПОСОБ УПРАВЛЕНИЯ ФУНКЦИОНАЛЬНЫМИ ОРГАНАМИ ТРАНСПОРТНОГО СРЕДСТВА С ПРЕДОТВРАЩЕНИЕМ ЕГО УГОНА И СИСТЕМЫ ЗАЩИТЫ ТРАНСПОРТНОГО СРЕДСТВА ОТ УГОНА 1995
  • Таубкин Владимир Львович
  • Галунов Виктор Иванович
RU2077999C1
СПОСОБ ГИБРИДНОЙ ГЕНЕРАТИВНО-ДИСКРИМИНАТИВНОЙ СЕГМЕНТАЦИИ ДИКТОРОВ В АУДИО-ПОТОКЕ 2013
  • Хитров Михаил Васильевич
  • Пеховский Тимур Сахиевич
  • Шулипа Андрей Константинович
RU2530314C1
СПОСОБ РАСПОЗНАВАНИЯ РЕЧЕВЫХ КОМАНД УПРАВЛЕНИЯ 2003
  • Тампель Иван Борисович
  • Татарникова Марина Юрьевна
RU2271578C2
СИСТЕМА И СПОСОБ РАСПОЗНАВАНИЯ РЕЧИ 2011
  • Кочаров Даниил Александрович
  • Хомяков Александр Борисович
RU2466468C1

Иллюстрации к изобретению SU 1 322 486 A1

Реферат патента 1987 года Способ оценки качества канала передачи речевого сигнала

Изобретение относится к электросвязи. Цель изобретения - повышение достоверности оценки. Сущность данного способа сос.тоит в том, что оценка качества канала передачи речи (КПР) производится по речевому стимулу. Получение оценки объективно и максимально приближено к восприятию речевого сигнала пользователем. При этом за счет локально нелинейного изменения масштабов времени речевых (: сигналов на выходе и входе КПР дости- гаетсй наиболее точный выбор соответствия сигналов на выходе вводимым тестовым сигналом. При этом учитываются или исключаются искажения и помехи, вносимые в сигнал во время прохождения его по КПР, в близком соответствии процессу учета или исключения аналогичных искажений слуховой системой человека. Сравнение сигнашов на входе и выходе КПР производится с учетом динамических изменений сигнала. Дана ил. выполнения устр-ва, реализующего данный способ. 2 ил. i (Л С

Формула изобретения SU 1 322 486 A1

Документы, цитированные в отчете о поиске Патент 1987 года SU1322486A1

Способ измерения амплитудно-частотной характеристики канала связи 1979
  • Барановский Борис Константинович
SU930703A1
Очаг для массовой варки пищи, выпечки хлеба и кипячения воды 1921
  • Богач Б.И.
SU4A1
Способ определения влагосодержания пароводяной смеси 1957
  • Рагулин Н.Ф.
SU117908A1
Очаг для массовой варки пищи, выпечки хлеба и кипячения воды 1921
  • Богач Б.И.
SU4A1

SU 1 322 486 A1

Авторы

Бром Николай Сергеевич

Галунов Валерий Иванович

Данилов Александр Васильевич

Коваль Сергей Львович

Даты

1987-07-07Публикация

1986-01-08Подача