Устройство для синтеза речи Советский патент 1979 года по МПК G10L1/10 

Описание патента на изобретение SU669381A1

1

Изобретение относится к аппаратам для интеза речевых сигналов по буквенной поледовательности фонем и может быть применено, например, в педагогике, в частноси в лингафонных кабинетах при обучении произношению слов и фраз на иностранном языке, в качестве вспомогательных технических средств для установления контактов между лицами с поражением голосовых связок и окружающими людьми, не знакомыми с системой Брейля, в качестве выводных устройств вычислительных машин специализированного назначения и т. д.

Известны устройства для синтеза речи, предназначенные, в основном для вывода информации специализированных вычислительных машин в звуковом виде 1.

Однако эти устройства сложны и не могут быть использованы для высококачественного синтеза речевых сигналов, например, при обучении иностранному языку в лингафонных кабинетах, поскольку речевой сигнал формируется из набора служебных слов, что не позволяет оперативно строить произвольные фразы.

Известен способ синтеза речевой информации из интонационно цельных фрагментов (синтагм), который позволяет при наличии 200-500 эталонов синтагм (в зависимости от сложности изучаемого языка) путем коммутации строить произвольные фразы любой сложности с весьма высоким качеством звучания речевого сигнала 2.

Известно устройство для синтеза речи, реализующее данный способ, содержащее телетайп, фиксирующий последовательность

слов, предназначенных для синтеза, преобразователь буквенной информации в фонетическую, блок выбора пар фонем (диад), дешифратор диад, блок памяти эталонов диад (синтагм), преобразователь код-аналог, управляющий амплитудой выходного напряжения генераторов синусоидального напряжения с частотами от 100Гц до 4 кГц с интервалом между соседними частотами 100Гц, и воспроизводящее устройство (дннамик) 3.

Однако, несмотря на целый ряд преимуществ перед другими известными устройствами для синтеза речевых сигналов (компактность аппаратуры, невысокая стоимость, хорощая разборчивость воспроизводимых

речсн1.;. сигналов), это устройство неприменимо для использования в качестве обучающих средств лингафонных кабинетов при изучении иностранных языков и лля использования в качестве вспомогательных технических средств обн1ения липами с норажениями голосовых связок по следующим причинам.

Темп выдачи отдельных фонем телетайпом постоянен. В то же время, длительность звучания каждой из диад (синтагм) индивидуален, что приводит либо к накладке соседних синтагм в сложном слове, при длительности данной синтагмы больше, нежели те.ми выдачи диад телетайпом, либо к разрядке синтагм в сложном слове (к провалам между отдельными слогами), при длительности соседних синтагм меньше те.мна выдачи диад телетайпом. И в том и в другом случае внятность синтезированного речевого сигнала снижается.

В большинстве наиболее распространенных языков правильность расстановки ударений в словах имеет весьма больщое значение. Вследствие полного отсутствия ударений в синтезированном речевом сигнале известное устройство не может найти практического применения в лингафонных кабинетах.

В разговорной человеческой речи смысловую нагрузку несет не только наличие тех или иных синтаг.м, но и интонация их произно1иения. В известных технических решениях, направленных на решение задачи синтеза речевых сигналов, интонационная составляющая речевых информации полностью отсутствует, что существенно сужает область применения данных устройств как в процессе обучения иностранным языкам в лингафонных кабинетах, так и при использовании в качестве протезирующих устройств лицами с заболеваниями и поражениями голосовых связок.

Цель изобретения - повын1ение разборчивости синтезируемого речевого сигнала, его инфор.мационной насыщенности и фонетической правильности произношения.

Это достигается тем, что выходы программирующего устройства дополнительно подключены к управляющим входам дополнительно установ.пенных переключателя интонаций речевого сигнала, интегратора, операционного усилителя и блока памяти синтезируемого речевого сигнала, управляющие гя кходы блоков памяти эталонов диад дополнительно подключены к управляющему входу программирующего устройства, интегратора и блока па.мяти синтезируемого речевого сигна.1а. информационные выходы блоков памяти эталонов диад подключены к информационным входам переключателя интонаций речевого сигнала, его информационный выход подключен к информационному входу операционного усилителя, выход которого соединен со входом блока памяти

синтезируемого речевого сигнала, а его выход соединен с информационным входом воспроизводящего устройства.

На чертеже дана структурная схема устройства для синтеза речи.

Выходы программирующего устройства 1

соединены с управляющими входами блока 2 выбора пар диад, переключателя 3 интонации, интегратора 4, операц-ионного усилителя 5 и блока 6 памяти синтезируемого речевого сигнала. Выходы блока 2 выбора

пар .1иад соединены со входами дешифратора 7 диад, выходы которого параллельно подключены к управляющим входам блоков 8 памяти эталонов диад. Управляющие входы блоков 8 памяти эталонов диад подключены к управляющим входам програм.мирую5щего устройства 1, интегратора 4 и блока 6 памяти синтезируемого речевого сигнала. Информационные выходы блоков 8 па.мяти эталонов диад подключены к информационным входам переключателя 3 интонаций,

0 информационный выход которого подключен к информационному входу операционного усилителя 5. К управляющим входам операционного усилителя 5 подключены управляющие выходы программирующего устройства 1 и интегратора 4. Информационный выход

5 операционного усилителя 5 подключен к информационно.му входу б.юка 6 памяти синтезируемого речевого сигнала, выход которого подключен ко входу воспроизводящего устройства 9.

J Синтезатор речевых сигналов работает следующим образом.

Перед началом набора фонетических составляющих речевого сигнала {букв фразы программирующим устройством 1 кодируется интонация произношения, после чего оператор начинает буквенный набор фразы с помощью програ.ммирующего устройства. Например, фраза «Холодно набирается следующим образом:«« холодно, фраза «Холодно набирается следующим образо.м: ««,холодна и т. д. При кодировании ин0тонации произнощения фразы программирующим устройством 1, переключатель 3 интонации произношения подключает к информационному входу операционного усилителя 5 блок 8 памяти эталонов диад с соответствующей интонацией произнощения. Одновременно программирующи.м устройством 1 задается режим иитегрирования интегратора 4 и его знак. По мере набора фразы программирующим устройством 1 блок 2 выбора нар диад выдает команды на дешифратор диад, который выбирает адрес соответствующих диад в параллельно работающих блоках 8 памяти эталонов диад.

В качестве блоков 8 памяти эталонов диад может быть использован, например.

5 четырехдорожечный магнитофон (на трех дорожках синхронно, по началу диад, записаны анологичные диады повелительной, повествовательной и вопросительной интонации.

на четвертой служебной дорожке записаны начала диад соответствующего адреса и концы каждой из диад.

При поступлении на управляющий вход блоков 8 памяти эталонов диад адреса выбранной диады с выхода дешифратора 7 диад блок 8 памяти эталонов диад блокирует программирующее устройство 1, запрещая дальнейщий набор программы до окончания записи выбранной диады. Это исключает как «накладку диад, так и их «разрядку в сложных словах при любой длине диад и изменении их интонации.

Одновременно с началом «выдачи диады соответствующей интонации с выхода блоков 8 памяти эталонов диад через переключатель 3 интонации на информационный вход операционного усилителя 5 управляющий выход блоков 8 памяти эталонов диад вчключает на запись блок 6 памяти синтезируемого речевого сигнала и подключает ко входу интегратора 4 опорное напряжение интегрирования. Отметим, что несмотря на то обстоятельство, что программирующим устройством 1 в начале составления фразы (при выборе интонации) дано разрещение на интегрирование интегратору 4 на протяжении всей фразы, интегратор 4 фактически осуществляет интегрирование только в моменты «выдачи информации блоками 8 памяти эталонов диад через переключатель 3 на вход операционного усилителя 5. Это обеспечивает, несмотря на произвольные разрывы между кодированием оператором на программирующем устройстве 1 аоседних пар диад (длительность «пауз между кодированием соседних диад зависит, в основном, от профессиональной тренировки программиста), плавное увеличение (уменьшение) выходного сигнала интегратора 4 от фактической длительности звучания синтезированного речевого сигнала. Скорость интегрирования интегратора 4 (отношение длительности звучания диады к изменению выходного напряжения интегратора 4) и знак интегрирования задается программирующим устройством 1 при выборе интонации синтезируемой фразы (или участка фразы, например при обращении типа «« гражданин,передайте...). Поскольку выход интегратора 4 подключен к одному из управляющих входов операционного усилителя 5,например к затвору полевого транзистора, установленного в цепи обратной связи операционного усилителя, изменение выходного напряжения интегратора 4 приводит к соответствующим изменениям коэффициента усиления операционного усилителя 5, что приводит либо к подчеркиванию отдельного фрагмента фразы (например, обращения), либо плавному снижению громкости звучания синтезированного речевого сигнала (повествовательное предложение) и т. д.

При кодировании программирующим устройством 1 ударного слога (например.

««вперед) программирующее устройство 1 релейно изменяет коэффициент усиления операционного усилителя 5 на время записи ударного слога (что может достигаться, например, подключением управляющего выхода программирующего устройства 1 к затвору полевого транзистора операционного усилителя 5,сток и исток которого использованы в качестве масштабируюи1его сопротивления на входе операционного усилителя).

Поскольку применение полевых транзисторов для управления коэффициентом усиления операционного усилителя 5 является лишь одним из возможных и широко применяемых вариантов изменения коэффициента усилинения операционных усилителей, конкретные схемы включения не приведены.

При окончании кодирования речевого сигнала программируюпд.ее устройство 1 запускает на воспроизведение блок 6 памяти синтезируемого речевого сигнала, который через воспроизводящее устройство 9 трапслирует синтезированный речевой сигнал.

В качестве блока 8 памяти синтезированного речевого сигнала и воспроизводя1цего устройства 9 может использоваться, например, серийный однодорожечный магнитофон («Десна, «Спутник, «Легенда и т. д.). Использование малогабаритных серийных магнитофонов в данном случае позволяет расширить применение устройства, например «для записи на дом, синтезированных в лингафонных кабинетах фраз и т. д.

30

Формула изобретения

Устройство для синтеза речи, содержащее программирующее устройство, блок выбора пар диад, дешифратор диад, блоки памяти эталонов диад и воспроизводящее устройство, отличающееся тем, что, с целью повышения разборчивости синтезируемого речевого сигнала и его информационной насыщенности, выходы программирующего устройства дополнительно подключены к управляющим входам дополнительно установленных переключателя интонаций речевого сигнала, интегратора, операционного усилителя и блока памяти синтезируемого речевого сигнала, управляющие выходы блоков памяти эталонов диад дополнительно подключены к управляющему входу программирующего устройства, интегратора и блока памяти синтезируемого речевого сигнала, информационные выходы блоков памяти эталонов диад подключены к информационным входам переключателя интонаций речевого сигнала, его информационный выход подключен к информационному входу операционного усилителя, выход которого соединен со входом блока памяти синтезируемого речевого сигнала, а его выход соединен с информационным входом воспроизводящего устройства.

Источники информации, принятые во внимание при экспертизе

1. Авторское свидетельство СССР № 485492, кл. С 10 L 1/10, 1968.

2.Авторское свидетельство СССР № 195725, кл. С 09 В 1/00, 1965.

3.Патент СССР № 401062, кл. С 10 L 1/10, 1968.

Похожие патенты SU669381A1

название год авторы номер документа
Адаптивное устройство для обучения языкам 1987
  • Шеншев Леонид Владимирович
SU1441445A1
Устройство для вывода речевой информации 1975
  • Панченко Борис Васильевич
  • Лобанов Борис Мефодиевич
SU607211A1
Устройство для передачи телеизмерительной информации 1978
  • Толстобров Борис Яковлевич
  • Гольденберг Михаил Львович
  • Екатериничев Борис Павлович
  • Глушковский Борис Игоревич
SU763942A1
Пульт учащегося для устройства обучения языкам 1977
  • Шеншев Леонид Владимирович
SU662957A1
УСТРОЙСТВО СИНТЕЗА РЕЧИ 2014
  • Мещеряков Роман Валерьевич
RU2606312C2
СПОСОБ СИНТЕЗА РЕЧИ 2009
  • Хитров Михаил Васильевич
RU2421827C2
СПОСОБ ОБУЧЕНИЯ И СИГНАЛОГРАММА ДЛЯ ЕГО РЕАЛИЗАЦИИ 1995
  • Биренберг Леонид Яковлевич[Ua]
RU2107327C1
КОМПЬЮТЕРНОЕ УСТРОЙСТВО ДЛЯ ЧТЕНИЯ ПЛОСКОПЕЧАТНОГО ТЕКСТА 1996
  • Золотов С.А.
  • Калинин Н.Н.
  • Балахонцев А.Н.
RU2113726C1
СПОСОБ ПРЕДВАРИТЕЛЬНОЙ ОБРАБОТКИ ТЕКСТА 2007
  • Гусев Михаил Николаевич
  • Егорова Ольга Борисовна
  • Смирнов Валентин Александрович
RU2386178C2
Устройство для графического отображения синтезируемой устной речи 1986
  • Шеншев Леонид Владимирович
SU1411802A1

Реферат патента 1979 года Устройство для синтеза речи

Формула изобретения SU 669 381 A1

SU 669 381 A1

Авторы

Синебоков Евгений Андреевич

Даты

1979-06-25Публикация

1977-04-15Подача