Изобретение относится к речевой информатике, предназначено для компиляции речевых сообщений, выводимых из ЭВМ, и может быть использовано для воспроизведения речевых инструкций операторами на транспорте и связи.
Цель изобретения - повышение разборчивости синтезированной речи и скорости синтеза.
На чертеже показана блок-схема реализации предлагаемого синтеза речи.
Текстовый процессор 1 соединен шинами 2 передачи данных с адресным ПЗУ 3 и шиной передачи данных с выходным преобразователем 5. ПЗУ 3 соединено шиной 6 передачи данных с блоком 7 формирования фрагментов согласных - гласных (СГ) слогов и отдельных глас3153
ных, шиной 8 передачи данных с ОЗУ 9 состояний, которое соединено шиной 10 передачи данных с ПЗУ 3. Блок 7 соединен шиной 11 передачи адресов с ПЗУ 12 данных и шиной 13 передачи данных с преобразователем 5. ПЗУ 12 соединено шинами и 15 передачи данных с модулятором 1б,выход которого соединен с шиной 17 передачи данных с блоком 7. Преобразователь 5 нагружен на громкоговоритель 18, который является выходом устройства.
В ПЗУ 12 хранят сигналы базовых элементов СГ-слогов и отдельных гласных и сигналы модулирующей огибающей, изменяющейся монотонно в диапазоне от О до 1. Последовательность знаков входного текста синтезируемого сообщения подают на вход текстового процессора 1, Последний осуществляет членение текста на синтагмы, т.е. на последовательность знаков текста, которую воспроизводят слитно, а также выбирает просодические характеристики для каждой такой синтагмы. Процессор 1, кроме того, осуществляет фонетическую транскрипцию текста синтагмы и размечает текст синтагмы на СГ-слоги, на согласные, входящие в сочетания согласнь1х открытых слогов, но не входящие в СГ-слоги, на отдельные гласные и на конечные согласные. Всем открытым слогам текста синтагмы процессор 1 присваивает знак положения относительно ударной позиции в слове. Оттранскри- бированный текст синтагмы вместе с сопровождающими знаками, индицирующими принадлежность каждого символа текста СГ-слогу или сочетанию согласных в открытом слоге, или отдельному гласному, или конечному согласному, и знаками, индицирующими положение открытого слога относительно ударной позиции в слове, процессор 1 направляет на свой выходной порт,
Передачу знаков текста синтагмы вместе с сопровождающей информацией, выделенной в процессоре 1, осуществляют по шине 2 данных в ПЗУ 3 в обратной последовательности относительно исходного текста синтагмы. Последовательность знаков текста синтагмы вместе с дополнительными знаками поступает по шине 2 передачи данных, как последовательность значени11 адресов, на входной порт адресного ПЗУ 3, который выполнен с четырьмя вход33
ными регистрами. На первый регистр поступает текущий знак текста синтагмы, на второй регистр - знак, индицирующий принадлежность каждого символа текста синтагмы к СГ-слогу или сочетанию согласных в открытом слоге, или отдельному гласному, или конечному согласному. На третий ре- гистр поступает знак, индицирующий положение открытого слога относительно ударной позиции в слове. Эти знаки поступают по шине 2 передачи данных из процессора 1. На четвертый
с регистр поступает знак текущего гласного по шине 10 передачи данных от ОЗУ 9,
Все четыре регистра образуют адресный регистр ПЗУ 3. По текущему значе,, нию адреса в этом объединенном адресном регистре выбирают ячейку в ПЗУ 3, которая 3 содержит начальный адрес соответствующего СГ-слога или отдельного гласного в ПЗУ 12, начало фраг5 мента СГ-слога или отдельного гласного относительно этого начального адреса, длину этого фрагмента в отсчетах и текущий гласный. Кроме того, ячейка содержит знак хранения данных. Знак текущего гласного по шине 8 данных поступает в ОЗУ 9 и изменяет предыдущее значение текущего гласного на новое. Остальное содержимое выбранной ячейки ПЗУ 3 переходит по шине 6 передачи данных в блок 7, где
5 его заносят в буферный массив памяти, если это содержимое сопровождается знаком хранения данных Ячейки ПЗУ 3 имеют содержание, которое учитывает все возможные сочетания знаков во всех
0
0
четырех регистрах входного порта ПЗУ
3. Таким путем из текста синтагмы получают последовательность адресов фрагментов СГ-слогов и отдельных гласных.
Когда встречаются сочетания согласных, то из них получают также последовательность фрагментов СГ-слогов, образованных каждым согласным и текущим гласным, но длительность
0 фрагмента гласного в таком СГ-слоге является минимальной. Полученную для всей синтагмы последовательность адресов фрагментов СГ-слогов и отдельных гласных с соответствующими
5 параметрами по шине 11 передачи адресов считывают из ПЗУ 12 в обратной последовательности и по шине 14 передачи данных отправляют на первый
515
вход модулятора 16. Отсчеты модулирующей огибающей из ПЗУ 12 отправляют по шине 15 передачи данных на второй вход модулятора 1б. В последнем на краях каждого фрагмента СГ-слога ,или отдельного гласного на длине окна сглаживания модулируют громкость фрагмента отсчетами модулирующей огибающей, изменяющейся монотонно от О до 1 в начале фрагмента и от 1 до О в конце фрагмента. дулятора 1б фрагменты СГ-слогов и отдельных гласных по шине 17 передачи данных пересылают в блок, 7, где их объединяют по мере поступления в непрерывную последовательность отсчетов и с заданной тактовой частотой пересылают по шине 13 передачи данных в преобразователь 5. По шине k передачи данных из процессора 1 в преобразователь 5 поступают знаки просодии синтагмы. Преобразователь 5 управляет просодическими параметрами фрагмента по знакам просодии и преобразует отсчеты сигналов последовательности фрагментов СГ-слогов и отдельных гласных в речевой сигнал, который поступает в громкоговоритель 18, являющийся выходом устройства и соединенный с преобразователем 5.
Предлагаемый способ синтеза речи позволяет повысить разборчивость синтезированной речи за счет подавления звуковых помех на стыках фрагментов путем монотонного уменьшения громкости фрагментов до О на длине окна сглаживания на краях фрагмента. Формирование согласных с переходными фрагментами из последующих гласных только в сочетаниях согласных звуков путем выбора соответствующего фра1- мента СГ-слога, образованного сог1133
ласным и последующим гласным, отвечает законам коартикуляции, улучшает восприятие согласных и также повышае за счет этого разборчивость синтезированной речи, а кроме того, сокращает число операций по получению из текста синтагмы последовательности фрагментов СГ-слогов и отдельных
д гласных с соответствующими параметрами, что позволяет повысить скорость синтеза речи.
Этот способ синтеза речи может применяться в синтезаторах-информатоJ5 рах на транспорте, в технологических и измерительных комплексах, в связи, в обучающих устройствах, в терминалах ЭВМ.
20Формула изобретения
Способ синтеза речи по тексту путем компиляции фрагментов заранее записанных сигналов гласных и откры25 тых слогов типа согласный-гласный, отличающийся тем, что, с целью повышения разборчивости синтезированной речи и скорости синтеза при воспроизведении убавляют уровни
30 громкости краев соединяемых фрагментов, а при синтезе групп согласных для каждого согласного звука, кроме последнего, воспроизводят согласный с переходным фрагментом путем последовательного считывания фрагмента слога, составленного из этого согласного и последующего гласного, причем для синтеза конечных согласных воспроизводят согласный с пере- ходным фрагментом путем последовательного считывания фрагмента слога, составленного из этого согласного и нейтрального гласного.
35
40
название | год | авторы | номер документа |
---|---|---|---|
КОМПЬЮТЕРНОЕ УСТРОЙСТВО ДЛЯ ЧТЕНИЯ ПЛОСКОПЕЧАТНОГО ТЕКСТА | 1996 |
|
RU2113726C1 |
СПОСОБ КОМПИЛЯЦИОННОГО ФОНЕМНОГО СИНТЕЗА РУССКОЙ РЕЧИ И УСТРОЙСТВО ДЛЯ ЕГО РЕАЛИЗАЦИИ | 2005 |
|
RU2298234C2 |
СПОСОБ ПРЕДВАРИТЕЛЬНОЙ ОБРАБОТКИ ТЕКСТА | 2007 |
|
RU2386178C2 |
Способ слоговой компиляции речи | 1982 |
|
SU1075300A1 |
СПОСОБ СИНТЕЗА РЕЧИ | 2009 |
|
RU2421827C2 |
Устройство для синтеза речи | 1977 |
|
SU669381A1 |
УСТРОЙСТВО СИНТЕЗА РЕЧИ | 2014 |
|
RU2606312C2 |
Способ компиляционного синтеза речи | 1988 |
|
SU1599888A1 |
СПОСОБ АВТОМАТИЗИРОВАННОЙ ОБРАБОТКИ ТЕКСТА И КОМПЬЮТЕРНОЕ УСТРОЙСТВО ДЛЯ РЕАЛИЗАЦИИ ЭТОГО СПОСОБА | 2011 |
|
RU2460154C1 |
СПОСОБ ОБМЕНА СООБЩЕНИЯМИ И УСТРОЙСТВА ДЛЯ ЕГО РЕАЛИЗАЦИИ | 2007 |
|
RU2324296C1 |
Изобретение относится к технике синтеза речевой информации, выводимой из ЭВМ, и может быть использовано в информаторах - синтезаторах на транспорте, связи, измерительных и технологических комплексах. Цель изобретения - повышение разборчивости синтезированной речи и скорости синтеза речи по тексту путем компиляции фразментов заранее записанных сигналов гласных и открытых слогов типа согласный - гласный (СГ - слоги) за счет подавления помех, возникающих на стыках фрагментов, а также за счет формирования фрагментов из последующих гласных только в сочетаниях согласных и для конечных согласных из СГ - слогов, что позволяет экономить число операций при преобразовании текста в последовательность фрагментов СГ - слогов и отдельных гласных и тем самым позволяет повысить скорость синтеза речи. Подавление помех и искажений на стыках фрагментов, приводящее к повышению разборчивости, достигается тем, что при воспроизведении фрагментов убавляют уровни громкости краев соединяемых фрагментов. Формирование фрагментов при синтезе групп согласных осуществляют путем последовательного считывания фрагмента СГ - слога, образованного согласным, входящим в эту группу, и последующим гласным. Для конечных согласных в качестве последующего гласного берут нейтральный гласный.
Способ крашения тканей | 1922 |
|
SU62A1 |
Печь-кухня, могущая работать, как самостоятельно, так и в комбинации с разного рода нагревательными приборами | 1921 |
|
SU10A1 |
Видоизменение пишущей машины для тюркско-арабского шрифта | 1923 |
|
SU25A1 |
Способ слоговой компиляции речи | 1982 |
|
SU1075300A1 |
Печь-кухня, могущая работать, как самостоятельно, так и в комбинации с разного рода нагревательными приборами | 1921 |
|
SU10A1 |
Авторы
Даты
1989-12-23—Публикация
1987-10-23—Подача