Изобретение относится к приборостроению и может быть использовано для синтеза произвольного речевого сообщения. Известны способы компиляции речи из отдельных речевых элементов, которые реализуются последовательны соединением аллофонов (частей фонем или дифонов (сочетанием отрезков, двух звуков )1 и С23. Однако указанные способы обладают тем недостатком, что при аллофон ном или дифонном синтезах речи требуются, соответственно, или сложные программы управления, осуществляющие сшивание речи из аллофонов с учетом их контекстной и позиционной вариативности, или большое числ дифонов разнообразного типа, отражаюри-ix коартикуляционные связи межд двумя соседними звуками. Наиболее близким по технической сущности к изобретению является спо соб слоговой компиляции речи по тексту, использующий набор заранее записанных сигналов открытых слогов типа согласный - гласный и отдельных : гласных фиксированной длительности, в котором прои;звольное сообщение фо мируют последовательным выбором и объединением слогов и отдельных звуков линейным интерполированием их параметров на постоянном временном интервале. Позиционную изменчивость звуков задают контуром основного тона и длительностью гласных и согласных звуков на основе фонети ко-просодического анализа синтезируемого текста . Однако известный способ слоговой компиляции речи не имитирует естест венные коартикуляционные связи между соединяемыми слогами и звуками приих линейном интерполировании на постоянном временном интервале. Поэтому слоговая компиляция речи, обладая высокой разборчивость имеет выраженную слоговую структуру что воспринимается слушающими как уху шение качества звучания компилированной речи. Целью изобретения яв/1яется повышение качества звучания компилиро ванной речи. Поставленная цель достигается тем, что согласно способу слоговой компиляции речи по тексту, использующему набор заранее записанных сигналов открытых слогов типа согласный - гласный и отдельных гласных фиксированной длительности, перед согласными звуками слогов форми руют переходные сегменты различной длительности из последующих гласных звуков фиксированной длительности. При этом длительность переходных сегментов выбирают в зависимости от предшествующего звука в пределах 0,1-0,4 от фиксированной длительности гласных, причем, если этот звук согласный, то длительность берут наименьшую, а если гласный, то тем большую, чем больше различия в характеристиках между типами гласных. Более высокое качество звучания компилированной речи по предлагаемому способу объясняется тем, что при сшивании слогов и звуков в слитное речевое сообщение между естественными речевыми элементами формируют переходные сегменты различной длительности из гласного звука последующего слога. Эти переходные сегменты создают искусственную коартикуляцию звуков, близкую к естественной, так как для тех случаев, когда перестройка артикуляторных органов человека более длительна, обеспечивается большая длительность переходных сегментов. Ка фиг. 1 показано формирование переходов, имитирующих коартикуляцию между сшиваемыми базовыми элементами речи; на фиг. 2 - блоксхема системы, реализующей способ слоговой компи ляции речи. Различия между параметрами гласных, и1Ттерпретируемые фазовыми порт-ретами на плоскс стях формантных частот F - р2 , расстояние в этих пространствах. Длительность элементов речи, хранящихся в памяти, мс. Если предшествующий звук согласный, то длительность переходного сегмента составляет 20-30 мс, а если гласный, то 50-120 мс, т.е. длительность переходного гласного составляет 0,1-0,4 от фиксированной длительности гласных, хранящихся в памяти. Способ слоговой компиляции речи мсжет быть реализован в соответствии со структурной схемой, (фиг. 2К В лингвистическом процессоре 1 осуществляю.т фонетико-просодическое преобразование текстовой записи синтезируемой речи. На выходе этого блока текст представляют цепочкой открытых слогов и отдельных гласных звуков. Просодический анализатор задает контур основного тона и производит маркировку слогов на ударные, предударные и заударные. В блоке эмуляции эффекта коартикуляции 2 осуществляют вставку гласных сегментов в цепочку символов с блока 1 в соответствии с предлагаемым способом. В вычислителе временных интервалов 3 формируют временные траектории параметров синтезируемого сообщения и его просодические характеристики для дальТ1ейшего их преобразования в речевой сигнал синтезатором 4 вокодерного типа. Базовые г
элементы, которые могут быть пред- ставлены для экономии памяти в параметрическом виде, хранят в блоке 5 памяти и выэывгиот блоком 3 по мере обраэования временных траекторий параметров синтезируемого сообщения. Громкоговоритель 6 осуществляет преобразование речевого сигнала на выходе синтезатора 4 в акустические колебания.
Использование предлагаемого способа слоговой компиляции речи позволит повысить качество звучания синтезированной речи.
название | год | авторы | номер документа |
---|---|---|---|
СПОСОБ СИНТЕЗА РЕЧИ | 2009 |
|
RU2421827C2 |
КОМПЬЮТЕРНОЕ УСТРОЙСТВО ДЛЯ ЧТЕНИЯ ПЛОСКОПЕЧАТНОГО ТЕКСТА | 1996 |
|
RU2113726C1 |
СПОСОБ КОМПИЛЯЦИОННОГО ФОНЕМНОГО СИНТЕЗА РУССКОЙ РЕЧИ И УСТРОЙСТВО ДЛЯ ЕГО РЕАЛИЗАЦИИ | 2005 |
|
RU2298234C2 |
Способ синтеза речи | 1987 |
|
SU1531133A1 |
УСТРОЙСТВО СИНТЕЗА РЕЧИ | 2014 |
|
RU2606312C2 |
СПОСОБ ПРЕДВАРИТЕЛЬНОЙ ОБРАБОТКИ ТЕКСТА | 2007 |
|
RU2386178C2 |
Способ компиляционного синтеза речи | 1988 |
|
SU1599888A1 |
Способ компиляционного синтеза речи и устройство для его осуществления | 1988 |
|
SU1683063A1 |
СПОСОБ АНАЛИЗА И СИНТЕЗА РЕЧИ | 2005 |
|
RU2296377C2 |
СПОСОБ ОБУЧЕНИЯ РЕЗОНАНСНОМУ ПЕНИЮ И ИНСТРУМЕНТАРИЙ ДЛЯ ЕГО ОСУЩЕСТВЛЕНИЯ | 2001 |
|
RU2202831C2 |
1. СПОСОБ СЛОГОВОЙ КОМПИЛЯЦИИ РЕЧИ по тексту, использующий набор заранее записанных сигна i l.i,:--#K:-J - . -V- . , 1 .Ч S ц г.,; : ...: « и ..:,.-.-ХЧ:л..; S eJits.ij Mrif лов открытых слогов типа согласный гласный и отдельных гласных фиксированной длительности, отличающийся тем, что, с целью повышения качества звучания компилированной речи, перед согласными звуками слогов формируют переходные сегменты различной длительности из последующих гласных звуков. 2. Способ по п. 1, отличающийся тем, что длительность переходных сегментов выбирают в зависимости от предшествующего звука в пределах 0,1-0,4 от фиксированной длительности гласных, при этом, если этот звук согласный, S то длительность берут наименьшую, а если гласный, то длительность (Л берут тем бс5льшую, чем больше различия в характеристиках между типами гласных. сл 00
Текст
Печь для непрерывного получения сернистого натрия | 1921 |
|
SU1A1 |
Патент CLiA № 4278838, кл.Q 10 I 1/00, 1981 | |||
Аппарат для очищения воды при помощи химических реактивов | 1917 |
|
SU2A1 |
G | |||
Печь-кухня, могущая работать, как самостоятельно, так и в комбинации с разного рода нагревательными приборами | 1921 |
|
SU10A1 |
Переносная печь для варки пищи и отопления в окопах, походных помещениях и т.п. | 1921 |
|
SU3A1 |
и Сагисаки Е | |||
Синтез по правилам, использующий СГ-слоги и его качество | |||
- Доклады секции речи Акустического общества Японии, 1980, с | |||
Гидравлическая передача, могущая служить насосом | 1921 |
|
SU371A1 |
Авторы
Даты
1984-02-23—Публикация
1982-12-21—Подача