Показать метаданные Скрыть метаданные

(19)

(11)

1 531 133

(13)

(51)

МПК

G10L13/02(2000-01-01)

(21) (22)

Заявка

4320578, 1987-10-23

(22)

дата подачи заявки

1987-10-23

(45)

опубликовано

1989-12-23

(72)

авторы

Орлов Игорь Алексеевич

(56)

Документы, цитированные в отчете о поиске

Способ синтеза речи Советский патент 1989 года по МПК G10L13/02

Описание патента на изобретение SU1531133A1

Изобретение относится к речевой информатике, предназначено для компиляции речевых сообщений, выводимых из ЭВМ, и может быть использовано для воспроизведения речевых инструкций операторами на транспорте и связи.

Цель изобретения - повышение разборчивости синтезированной речи и скорости синтеза.

На чертеже показана блок-схема реализации предлагаемого синтеза речи.

Текстовый процессор 1 соединен шинами 2 передачи данных с адресным ПЗУ 3 и шиной передачи данных с выходным преобразователем 5. ПЗУ 3 соединено шиной 6 передачи данных с блоком 7 формирования фрагментов согласных - гласных (СГ) слогов и отдельных глас3153

ных, шиной 8 передачи данных с ОЗУ 9 состояний, которое соединено шиной 10 передачи данных с ПЗУ 3. Блок 7 соединен шиной 11 передачи адресов с ПЗУ 12 данных и шиной 13 передачи данных с преобразователем 5. ПЗУ 12 соединено шинами и 15 передачи данных с модулятором 1б,выход которого соединен с шиной 17 передачи данных с блоком 7. Преобразователь 5 нагружен на громкоговоритель 18, который является выходом устройства.

В ПЗУ 12 хранят сигналы базовых элементов СГ-слогов и отдельных гласных и сигналы модулирующей огибающей, изменяющейся монотонно в диапазоне от О до 1. Последовательность знаков входного текста синтезируемого сообщения подают на вход текстового процессора 1, Последний осуществляет членение текста на синтагмы, т.е. на последовательность знаков текста, которую воспроизводят слитно, а также выбирает просодические характеристики для каждой такой синтагмы. Процессор 1, кроме того, осуществляет фонетическую транскрипцию текста синтагмы и размечает текст синтагмы на СГ-слоги, на согласные, входящие в сочетания согласнь1х открытых слогов, но не входящие в СГ-слоги, на отдельные гласные и на конечные согласные. Всем открытым слогам текста синтагмы процессор 1 присваивает знак положения относительно ударной позиции в слове. Оттранскри- бированный текст синтагмы вместе с сопровождающими знаками, индицирующими принадлежность каждого символа текста СГ-слогу или сочетанию согласных в открытом слоге, или отдельному гласному, или конечному согласному, и знаками, индицирующими положение открытого слога относительно ударной позиции в слове, процессор 1 направляет на свой выходной порт,

Передачу знаков текста синтагмы вместе с сопровождающей информацией, выделенной в процессоре 1, осуществляют по шине 2 данных в ПЗУ 3 в обратной последовательности относительно исходного текста синтагмы. Последовательность знаков текста синтагмы вместе с дополнительными знаками поступает по шине 2 передачи данных, как последовательность значени11 адресов, на входной порт адресного ПЗУ 3, который выполнен с четырьмя вход33

ными регистрами. На первый регистр поступает текущий знак текста синтагмы, на второй регистр - знак, индицирующий принадлежность каждого символа текста синтагмы к СГ-слогу или сочетанию согласных в открытом слоге, или отдельному гласному, или конечному согласному. На третий ре- гистр поступает знак, индицирующий положение открытого слога относительно ударной позиции в слове. Эти знаки поступают по шине 2 передачи данных из процессора 1. На четвертый

с регистр поступает знак текущего гласного по шине 10 передачи данных от ОЗУ 9,

Все четыре регистра образуют адресный регистр ПЗУ 3. По текущему значе,, нию адреса в этом объединенном адресном регистре выбирают ячейку в ПЗУ 3, которая 3 содержит начальный адрес соответствующего СГ-слога или отдельного гласного в ПЗУ 12, начало фраг5 мента СГ-слога или отдельного гласного относительно этого начального адреса, длину этого фрагмента в отсчетах и текущий гласный. Кроме того, ячейка содержит знак хранения данных. Знак текущего гласного по шине 8 данных поступает в ОЗУ 9 и изменяет предыдущее значение текущего гласного на новое. Остальное содержимое выбранной ячейки ПЗУ 3 переходит по шине 6 передачи данных в блок 7, где

5 его заносят в буферный массив памяти, если это содержимое сопровождается знаком хранения данных Ячейки ПЗУ 3 имеют содержание, которое учитывает все возможные сочетания знаков во всех

четырех регистрах входного порта ПЗУ

3. Таким путем из текста синтагмы получают последовательность адресов фрагментов СГ-слогов и отдельных гласных.

Когда встречаются сочетания согласных, то из них получают также последовательность фрагментов СГ-слогов, образованных каждым согласным и текущим гласным, но длительность

0 фрагмента гласного в таком СГ-слоге является минимальной. Полученную для всей синтагмы последовательность адресов фрагментов СГ-слогов и отдельных гласных с соответствующими

5 параметрами по шине 11 передачи адресов считывают из ПЗУ 12 в обратной последовательности и по шине 14 передачи данных отправляют на первый

515

вход модулятора 16. Отсчеты модулирующей огибающей из ПЗУ 12 отправляют по шине 15 передачи данных на второй вход модулятора 1б. В последнем на краях каждого фрагмента СГ-слога ,или отдельного гласного на длине окна сглаживания модулируют громкость фрагмента отсчетами модулирующей огибающей, изменяющейся монотонно от О до 1 в начале фрагмента и от 1 до О в конце фрагмента. дулятора 1б фрагменты СГ-слогов и отдельных гласных по шине 17 передачи данных пересылают в блок, 7, где их объединяют по мере поступления в непрерывную последовательность отсчетов и с заданной тактовой частотой пересылают по шине 13 передачи данных в преобразователь 5. По шине k передачи данных из процессора 1 в преобразователь 5 поступают знаки просодии синтагмы. Преобразователь 5 управляет просодическими параметрами фрагмента по знакам просодии и преобразует отсчеты сигналов последовательности фрагментов СГ-слогов и отдельных гласных в речевой сигнал, который поступает в громкоговоритель 18, являющийся выходом устройства и соединенный с преобразователем 5.

Предлагаемый способ синтеза речи позволяет повысить разборчивость синтезированной речи за счет подавления звуковых помех на стыках фрагментов путем монотонного уменьшения громкости фрагментов до О на длине окна сглаживания на краях фрагмента. Формирование согласных с переходными фрагментами из последующих гласных только в сочетаниях согласных звуков путем выбора соответствующего фра1- мента СГ-слога, образованного сог1133

ласным и последующим гласным, отвечает законам коартикуляции, улучшает восприятие согласных и также повышае за счет этого разборчивость синтезированной речи, а кроме того, сокращает число операций по получению из текста синтагмы последовательности фрагментов СГ-слогов и отдельных

д гласных с соответствующими параметрами, что позволяет повысить скорость синтеза речи.

Этот способ синтеза речи может применяться в синтезаторах-информатоJ5 рах на транспорте, в технологических и измерительных комплексах, в связи, в обучающих устройствах, в терминалах ЭВМ.

20Формула изобретения

Способ синтеза речи по тексту путем компиляции фрагментов заранее записанных сигналов гласных и откры25 тых слогов типа согласный-гласный, отличающийся тем, что, с целью повышения разборчивости синтезированной речи и скорости синтеза при воспроизведении убавляют уровни

30 громкости краев соединяемых фрагментов, а при синтезе групп согласных для каждого согласного звука, кроме последнего, воспроизводят согласный с переходным фрагментом путем последовательного считывания фрагмента слога, составленного из этого согласного и последующего гласного, причем для синтеза конечных согласных воспроизводят согласный с пере- ходным фрагментом путем последовательного считывания фрагмента слога, составленного из этого согласного и нейтрального гласного.

Иллюстрации к изобретению SU 1 531 133 A1

Реферат патента 1989 года Способ синтеза речи

Изобретение относится к технике синтеза речевой информации, выводимой из ЭВМ, и может быть использовано в информаторах - синтезаторах на транспорте, связи, измерительных и технологических комплексах. Цель изобретения - повышение разборчивости синтезированной речи и скорости синтеза речи по тексту путем компиляции фразментов заранее записанных сигналов гласных и открытых слогов типа согласный - гласный (СГ - слоги) за счет подавления помех, возникающих на стыках фрагментов, а также за счет формирования фрагментов из последующих гласных только в сочетаниях согласных и для конечных согласных из СГ - слогов, что позволяет экономить число операций при преобразовании текста в последовательность фрагментов СГ - слогов и отдельных гласных и тем самым позволяет повысить скорость синтеза речи. Подавление помех и искажений на стыках фрагментов, приводящее к повышению разборчивости, достигается тем, что при воспроизведении фрагментов убавляют уровни громкости краев соединяемых фрагментов. Формирование фрагментов при синтезе групп согласных осуществляют путем последовательного считывания фрагмента СГ - слога, образованного согласным, входящим в эту группу, и последующим гласным. Для конечных согласных в качестве последующего гласного берут нейтральный гласный.

Формула изобретения SU 1 531 133 A1

Документы, цитированные в отчете о поиске Патент 1989 года SU1531133A1

Способ крашения тканей	1922	Костин И.Д.	SU62A1
Печь-кухня, могущая работать, как самостоятельно, так и в комбинации с разного рода нагревательными приборами	1921	Богач В.И.	SU10A1
Видоизменение пишущей машины для тюркско-арабского шрифта	1923	Мадьяров А. Туганов Т.	SU25A1
Способ слоговой компиляции речи	1982	Вайншток Аркадий Пинхосович Книппер Александр Владимирович Орлов Игорь Алексеевич Потапов Владимир Георгиевич	SU1075300A1
Печь-кухня, могущая работать, как самостоятельно, так и в комбинации с разного рода нагревательными приборами	1921	Богач В.И.	SU10A1

SU 1 531 133 A1

Авторы

Орлов Игорь Алексеевич

Даты

1989-12-23—Публикация

1987-10-23—Подача

название	год	авторы	номер документа
КОМПЬЮТЕРНОЕ УСТРОЙСТВО ДЛЯ ЧТЕНИЯ ПЛОСКОПЕЧАТНОГО ТЕКСТА	1996	Золотов С.А. Калинин Н.Н. Балахонцев А.Н.	RU2113726C1
СПОСОБ КОМПИЛЯЦИОННОГО ФОНЕМНОГО СИНТЕЗА РУССКОЙ РЕЧИ И УСТРОЙСТВО ДЛЯ ЕГО РЕАЛИЗАЦИИ	2005	Алперин Евгений Данилович Кнох Владимир Яковлевич	RU2298234C2
СПОСОБ ПРЕДВАРИТЕЛЬНОЙ ОБРАБОТКИ ТЕКСТА	2007	Гусев Михаил Николаевич Егорова Ольга Борисовна Смирнов Валентин Александрович	RU2386178C2
Способ слоговой компиляции речи	1982	Вайншток Аркадий Пинхосович Книппер Александр Владимирович Орлов Игорь Алексеевич Потапов Владимир Георгиевич	SU1075300A1
СПОСОБ СИНТЕЗА РЕЧИ	2009	Хитров Михаил Васильевич	RU2421827C2
Устройство для синтеза речи	1977	Синебоков Евгений Андреевич	SU669381A1
УСТРОЙСТВО СИНТЕЗА РЕЧИ	2014	Мещеряков Роман Валерьевич	RU2606312C2
Способ компиляционного синтеза речи	1988	Григорян Альберт Айрапетович Канаян Карен Оникович	SU1599888A1
СПОСОБ АВТОМАТИЗИРОВАННОЙ ОБРАБОТКИ ТЕКСТА И КОМПЬЮТЕРНОЕ УСТРОЙСТВО ДЛЯ РЕАЛИЗАЦИИ ЭТОГО СПОСОБА	2011	Бредихин Александр Юрьевич Сергейчев Николай Евгеньевич	RU2460154C1
СПОСОБ ОБМЕНА СООБЩЕНИЯМИ И УСТРОЙСТВА ДЛЯ ЕГО РЕАЛИЗАЦИИ	2007	Бредихин Александр Юрьевич Сергейчев Николай Евгеньевич	RU2324296C1