Устройство для ввода и вывода речевой информации Советский патент 1980 года по МПК G06F3/16

Описание патента на изобретение SU792247A1

Изобретение относится к области речевой связи человека с машинами.

Известны устройства для передачи и приема речевых сигналов на основе идентификации параметров речеобраэующего тракта (1, 2) методами линейного предсказания по критерию минимума дисперсии ошибки предсказания l и 12

Наиболее близким по технической сущности является вокодерное устройство, в котором предполагается, что модель речеобразующего тракта, структура которой одновременно является и структурой синтезатора речи на приемной стороне, содержит генератор возбуждающей функции e(t), которая может быть или шумовой (e(t)e(t)) .для невокализованных участков речи или квазипериодической импульсной последовательностью (e(t)e(t)) с частотой основного тока f;, для невокализованных участков речи з . В соответствии с этим такой синтезатор состоит из генератора белого шума с равномерным спектром и генератора квазипериодических импульсов. В зависимости от вида возбуждающей функции к одному из указанных генераторов подключается с помощью переключателя тон-шум усилитель, регулируемый коэффициент А усиления которого определяет интенсивность соответствующих участков речи. Выходной сигнал усилителя E(t)A e(t) подается i;a первый вход сумматора, выход которого через линейный фильтр с регулируемыми параметрами А

10 ( дClip) подключен ко входу второго сумматора. Указанные сумматор и фильтр образуют линейную систему с переменными параметрами, модулирующу.о речеобразу1мций голосовой 15 тракт. Выходной сигнал этой линейной системы является речевым сигналом S(t). .

На передающей стороне анализатор 20 речевого сигнала по его дискритизированной копии { дает оченки ряда параметров, что выполняет специальные оцениватели, функционирующие по известному алгоритму. В их число 25 входит устройство оценки соотношения тон-шум,устройство оценки интенсивности А участка речи, выделитель основного тона, идентификатор вектора параметров. Последний определяет оценку А вектора d в ссответствин с алгоритмом минимума среднеквадратической ошибки.

С выхода анализатора через уплотнитель в канал (далее он предполагается дискретным) передаются сигнал классификации тон-шум (например О - тон, 1 - шум) оценка А интенсивности анализируемого участка речи, оценка f на выходе блока выделения основного тона, оценка d. вектора ct с выхода блока идентификации параметров, на вход которого подается сигнал и ошибка .

На приемной стороне принятые оценки тон-шум А, f , i после их разделения в блоке разделения сигналов подаются в соответствующие блоки синтезатора: на переключатель тоншум, усилитель с регулируемым коэффициентом усиления, генератор квазипериодических импзльсов, линейный фильтр с регулируемыми параметрами. Структура синтезатора, как указывалось , полностью повторяет модель речеобразующего тракта.

Такой вокодер не позволяет добиться высокого качества системы синтетической телефонии в силу отсутствия в ней компонента моделирующих участков речевого сигнала, соответствующих носовым звукам. Это снижает узнаваемость говорящего, речевое сообщение которого передается по такой системе синтетической телефонии.

Целью изобретения является улуч.шение качества вводимой и выводимой информации путем повышения степени идентификации сигналов.

Поставленная цель достигается тем что в устройство для ввода и вывода речевой информации, содержащее первый линейный фильтр, подключенный к первому вычитателю, и последовательно соединенные преобразователь речевых сигналов, микрофон, аналого-цифровой преобразователь, первый дискриминатор, блок уплотнения сигн.алов параллельно подключенный через блоки измерения интенсивности речевого сигнала и выделения основного тона к . аналого-цифровому преобразователю блок сопряжения, блок разделения сигналов, подключенный через второй линейный фильтр к первому сумматору, первый генератор, первый переключатель , подключенный ко второму генератору и блоку разделения сигналов, и усилитель, подключенный к блоку раделения сигналов, дополнительно введены последовательно соединенные второй переключатель, подключенный к аналогО-цифровому преобразователю и блоку уплотнения сигналов, второй вычитатель, третий вычитатель, третий линейный фильтр, первый блок идентификации параметров, под1с01юченный к третьему вычитателю и первому блоку идентификации параметров, второй дискриминатор, подключенный к

аналого-цифровому преобразователю и блоку уплотнения сигналов, третий переключатель, подключенный ко второму переключателю, второй блок идентификации параметров, подключенный к первому линейному фильтру, блоку уплотнения сигналов и второму вычитателю, четвертый линейный фильтр, подключенный к первому вычиттелю , четвертый вычитатель, подключенный ко второму переключателю, второму вычитателю и первому блоку идентификации параметров, второй сумматор, подключенный к третьему переключателю, и пятый линейный фильтр, подключенный ко второму дискриминатору, и последовательно соединенные четвертый переключатель, подключенный к усилителю, блоку разделения сигналов и первому сумматору, третий сумг.атор, шестой линейный фильтр, подключенный к блоку разделения сигналов, четвертый сумматор, подключенный к выходной шине, и седьмой линейный фильтр, подключенный к блоку разделения сигналов, первому сумматору и второму линейному фильтру.

Предлагаемое уАройство, блоксхема которого представлена на чертеже , содержит аналого-цифровой преобразователь. 1, второй переключатель 2, четвертый :вычитатель. 3, четвертый линейный фильтр 4, первый вычитатель 5, первый линейный фильтр 6, третий переключатель 7, пятый линейный фильтр 8, второй блок 9 идентификации параметров,второй вычитатель 10, третий вычитатель 11, третий линейный фильтр 12, первый блок 13 идентификации параметров, первый дискриминатор 14, блок 15 измерения интенсивности сигнала, блок 16 ВЕЛделения основного тока, второй дискриминатор 17, блок 18 сопряжения, второй генератор 19, первый генератор 20, первый переключатель 21, усилитель 22, четвертый переключатель 23, первый сумматор 24, второй линейный фильтр 25, седьмой линейный фильтр 26, четвертый сумматор 27, шестой линейный фильтр 28, блок 29 уплотнения сигналов, блок 30 разделения сигналов, второй сумматор 31, третий сумматор 32, выходная шина 33 и микрофон 34.

Гфедложенное устройство работает следующимобразом.

Речевой сигнал S(t) подвергается обработке на приемной стороне в анализаторе с целью оценки по нему параметров модели речеобразующего тракта. При цифровой реализации предлагаемого устройства сигнал S(t) проходит блок 1, где дискредитируется с частотой f (обычно 6-20 кГц) и квантуется Полученная последователь ность проходит через схему обtaзoвaния оценки функции возбуждения {.t) для случая прохождения E(t) через модель голосового тракта или E(t для случая прохождения E(t) через мо дель носового тракта. Рассмотрим (t). Переключатель 2 стоит в положении голосовой тракт. В вычитателе 3 образуется (t) - оценк у (t)S(t)-Z(t), а (t) - оценка Z(t) образуемая на выходе сумматора 31. Вычитание Z(t) необходимо для устранения влияния отключенного носового тракта. Сигнал z(t) проходит линейный фильтр 4. Далее полученный на выходе фильтра сигнал x(t) проходит вычитатель 5 и линейный фильтр б цепи обратной связи. Вычитатель 5 и линейный фильтр 6 выполняют роль линейного предсказателя. Точно такую же роль играют вычитатель 11 и линей ный фильтр 12.В вычитателе 10 образуется сигнал T(t) S(t) - y(t), гд устраняется влияние отключенного голосового тракта. Блоки 9 и 13 идентификации параметров на основе анализа соответственно сигналов y(t) и Z(t), а также l(t} и T(t) производят оценки параметров линейных фильтров i., & и . Эти оценки управляют параметрами линейных фильтров 4 и 6 (для d Hjb и линеных фильтров 8 и 12 (для). Новым является второй дискриминатор 17. Его работа в простейшем случае : может быть основана на том, что непосредственно перед лицом говорящего ставят специальный микрофон с двумя раздельными секциями, направленными на нос и рот. Более интенсивный сигнал в одной из секций и определяет положение переключателя. Другое решение - включение избирательного фильтра в схему переключателя (такой случай изображен на чертеже), характеристика которого моделирует носовую полость ((фильтр, согласованный с линейной системой, образующий сигнал y(t) из E(t)). Превышение за интервал анализа уровнем сигнала заданного порога показывает, что E(t) про ходит в течение этого интервала через носовую область. Выходной сигнал дискриминатора 17 подается на спаренные переключатели 2 и 7. Оценки векторов А, и 7 а так же выходные сигналы дискриминаторов 14 и 17, а также блоков 15 и 16 пода ются в блок 18 сопряжения через блок 29 уплотнения сигналов. Рассмотрим работу синтезатора на приемной стороне, параметры которого изменяются под воздействием соответствующих сигналов, принимаемых из канала. Функция возбуждения e(t), соответствующая вокализованным участкам речи, генерируется блоком 20. Частот следования импульсов fg-j соответству ет частоте основного тона и может меняться в требуемых пределах. функция возбуждения e(t) для нёвокализованных участков речи формируется генератором 19, на выходе которого появляется случайный процесс с равномерным спектром. Переключатель 21 выбирает в соответствии с участком речи тип функции возбуждения е (t) путем подключения к формирователю речевого сигнала генераторов 19 или 20. После усиления в блоке 22 функция E(t) А e{t) подается на переключатель 23. Он вьтолняет роль мягкого неба, отключая блоки, моделирующие голосовой тракт в момент произнесения носовых звуков. Функция E(t) с выхода сумматора 24 подается на линейный фильтр 8, вектор параметров tp f ) которого подбирается так, чтобы корректировать требуемым образом сквозную характеристику., «здeлиpyющyю форму голосового тракта. Парготетры d и (i отражают положение артикуляционных органов, причем вектор (5 определяет в некоторой мере характер коартикуляции и взаимодействие голосового и носового трактов. В другом положении переключателя 23 (стрелка вниз) сигнал E(t) подается на линейный фильтр образованный сумма гором 32 и фильтром с параметраи и У ( Т,, . . -Ifi, в петле обратной связи (фильтр 28). В простейшем случае параметры f, постоянны, если считать, что форма носовой полости неизменна. На выходе сумматора 27 образуется речевой сигнал Sjt) Z(t) + y(t), где Z(t) сигнал на выходе линейного фильтра, моделирующего носовой тракт,а y(t) выходной сигнал фильтра 26. Параметрами генератора 20, положением переключателей 21 и 23, усилением блока 22, фильтров 26, 27 и 28 управляют-соответственно переданные через блок 18 выходные сигналы блока 16, дискриминаторов 14 и 17, блока 15, блоков идентификации параметров 9 (оценки oL и pi) и 13 (оценка j). Указанные сигналы подаются в соответствующие блоки после их разделения в блоке 30 разделения сигналов . Предложенное устройство для ввода и.вывода речевых сообщений позволяет существенно повысить качество системы при незначительном увеличении скорости передачи цифровой информации об оценках параметров модели речеобразующего тракта, что обеспечит более высокую степень идентификации говорящего. При использовании предложенного устройства в системах речевого общения человека и ЭВМ значительно расширяются возможности систем путем улучшения характеристик идентификации дикторов или их верификации .

Иллюстрации к изобретению SU 792 247 A1

Реферат патента 1980 года Устройство для ввода и вывода речевой информации

Формула изобретения SU 792 247 A1

SU 792 247 A1

Авторы

Свириденко Владимир Александрович

Звездин Виктор Сергеевич

Даты

1980-12-30—Публикация

1977-12-25—Подача