Способ слоговой компиляции речи Советский патент 1984 года по МПК G10L13/08 

Описание патента на изобретение SU1075300A1

Изобретение относится к приборостроению и может быть использовано для синтеза произвольного речевого сообщения. Известны способы компиляции речи из отдельных речевых элементов, которые реализуются последовательны соединением аллофонов (частей фонем или дифонов (сочетанием отрезков, двух звуков )1 и С23. Однако указанные способы обладают тем недостатком, что при аллофон ном или дифонном синтезах речи требуются, соответственно, или сложные программы управления, осуществляющие сшивание речи из аллофонов с учетом их контекстной и позиционной вариативности, или большое числ дифонов разнообразного типа, отражаюри-ix коартикуляционные связи межд двумя соседними звуками. Наиболее близким по технической сущности к изобретению является спо соб слоговой компиляции речи по тексту, использующий набор заранее записанных сигналов открытых слогов типа согласный - гласный и отдельных : гласных фиксированной длительности, в котором прои;звольное сообщение фо мируют последовательным выбором и объединением слогов и отдельных звуков линейным интерполированием их параметров на постоянном временном интервале. Позиционную изменчивость звуков задают контуром основного тона и длительностью гласных и согласных звуков на основе фонети ко-просодического анализа синтезируемого текста . Однако известный способ слоговой компиляции речи не имитирует естест венные коартикуляционные связи между соединяемыми слогами и звуками приих линейном интерполировании на постоянном временном интервале. Поэтому слоговая компиляция речи, обладая высокой разборчивость имеет выраженную слоговую структуру что воспринимается слушающими как уху шение качества звучания компилированной речи. Целью изобретения яв/1яется повышение качества звучания компилиро ванной речи. Поставленная цель достигается тем, что согласно способу слоговой компиляции речи по тексту, использующему набор заранее записанных сигналов открытых слогов типа согласный - гласный и отдельных гласных фиксированной длительности, перед согласными звуками слогов форми руют переходные сегменты различной длительности из последующих гласных звуков фиксированной длительности. При этом длительность переходных сегментов выбирают в зависимости от предшествующего звука в пределах 0,1-0,4 от фиксированной длительности гласных, причем, если этот звук согласный, то длительность берут наименьшую, а если гласный, то тем большую, чем больше различия в характеристиках между типами гласных. Более высокое качество звучания компилированной речи по предлагаемому способу объясняется тем, что при сшивании слогов и звуков в слитное речевое сообщение между естественными речевыми элементами формируют переходные сегменты различной длительности из гласного звука последующего слога. Эти переходные сегменты создают искусственную коартикуляцию звуков, близкую к естественной, так как для тех случаев, когда перестройка артикуляторных органов человека более длительна, обеспечивается большая длительность переходных сегментов. Ка фиг. 1 показано формирование переходов, имитирующих коартикуляцию между сшиваемыми базовыми элементами речи; на фиг. 2 - блоксхема системы, реализующей способ слоговой компи ляции речи. Различия между параметрами гласных, и1Ттерпретируемые фазовыми порт-ретами на плоскс стях формантных частот F - р2 , расстояние в этих пространствах. Длительность элементов речи, хранящихся в памяти, мс. Если предшествующий звук согласный, то длительность переходного сегмента составляет 20-30 мс, а если гласный, то 50-120 мс, т.е. длительность переходного гласного составляет 0,1-0,4 от фиксированной длительности гласных, хранящихся в памяти. Способ слоговой компиляции речи мсжет быть реализован в соответствии со структурной схемой, (фиг. 2К В лингвистическом процессоре 1 осуществляю.т фонетико-просодическое преобразование текстовой записи синтезируемой речи. На выходе этого блока текст представляют цепочкой открытых слогов и отдельных гласных звуков. Просодический анализатор задает контур основного тона и производит маркировку слогов на ударные, предударные и заударные. В блоке эмуляции эффекта коартикуляции 2 осуществляют вставку гласных сегментов в цепочку символов с блока 1 в соответствии с предлагаемым способом. В вычислителе временных интервалов 3 формируют временные траектории параметров синтезируемого сообщения и его просодические характеристики для дальТ1ейшего их преобразования в речевой сигнал синтезатором 4 вокодерного типа. Базовые г

элементы, которые могут быть пред- ставлены для экономии памяти в параметрическом виде, хранят в блоке 5 памяти и выэывгиот блоком 3 по мере обраэования временных траекторий параметров синтезируемого сообщения. Громкоговоритель 6 осуществляет преобразование речевого сигнала на выходе синтезатора 4 в акустические колебания.

Использование предлагаемого способа слоговой компиляции речи позволит повысить качество звучания синтезированной речи.

Похожие патенты SU1075300A1

название год авторы номер документа
СПОСОБ СИНТЕЗА РЕЧИ 2009
  • Хитров Михаил Васильевич
RU2421827C2
КОМПЬЮТЕРНОЕ УСТРОЙСТВО ДЛЯ ЧТЕНИЯ ПЛОСКОПЕЧАТНОГО ТЕКСТА 1996
  • Золотов С.А.
  • Калинин Н.Н.
  • Балахонцев А.Н.
RU2113726C1
СПОСОБ КОМПИЛЯЦИОННОГО ФОНЕМНОГО СИНТЕЗА РУССКОЙ РЕЧИ И УСТРОЙСТВО ДЛЯ ЕГО РЕАЛИЗАЦИИ 2005
  • Алперин Евгений Данилович
  • Кнох Владимир Яковлевич
RU2298234C2
Способ синтеза речи 1987
  • Орлов Игорь Алексеевич
SU1531133A1
УСТРОЙСТВО СИНТЕЗА РЕЧИ 2014
  • Мещеряков Роман Валерьевич
RU2606312C2
СПОСОБ ПРЕДВАРИТЕЛЬНОЙ ОБРАБОТКИ ТЕКСТА 2007
  • Гусев Михаил Николаевич
  • Егорова Ольга Борисовна
  • Смирнов Валентин Александрович
RU2386178C2
Способ компиляционного синтеза речи 1988
  • Григорян Альберт Айрапетович
  • Канаян Карен Оникович
SU1599888A1
Способ компиляционного синтеза речи и устройство для его осуществления 1988
  • Лобанов Борис Мефодьевич
SU1683063A1
СПОСОБ АНАЛИЗА И СИНТЕЗА РЕЧИ 2005
  • Гусев Михаил Николаевич
  • Дегтярёв Владимир Михайлович
  • Ситников Валерий Валерьевич
RU2296377C2
СПОСОБ ОБУЧЕНИЯ РЕЗОНАНСНОМУ ПЕНИЮ И ИНСТРУМЕНТАРИЙ ДЛЯ ЕГО ОСУЩЕСТВЛЕНИЯ 2001
  • Демченко А.Д.
RU2202831C2

Иллюстрации к изобретению SU 1 075 300 A1

Реферат патента 1984 года Способ слоговой компиляции речи

1. СПОСОБ СЛОГОВОЙ КОМПИЛЯЦИИ РЕЧИ по тексту, использующий набор заранее записанных сигна i l.i,:--#K:-J - . -V- . , 1 .Ч S ц г.,; : ...: « и ..:,.-.-ХЧ:л..; S eJits.ij Mrif лов открытых слогов типа согласный гласный и отдельных гласных фиксированной длительности, отличающийся тем, что, с целью повышения качества звучания компилированной речи, перед согласными звуками слогов формируют переходные сегменты различной длительности из последующих гласных звуков. 2. Способ по п. 1, отличающийся тем, что длительность переходных сегментов выбирают в зависимости от предшествующего звука в пределах 0,1-0,4 от фиксированной длительности гласных, при этом, если этот звук согласный, S то длительность берут наименьшую, а если гласный, то длительность (Л берут тем бс5льшую, чем больше различия в характеристиках между типами гласных. сл 00

Формула изобретения SU 1 075 300 A1

Текст

Документы, цитированные в отчете о поиске Патент 1984 года SU1075300A1

Печь для непрерывного получения сернистого натрия 1921
  • Настюков А.М.
  • Настюков К.И.
SU1A1
Патент CLiA № 4278838, кл.Q 10 I 1/00, 1981
Аппарат для очищения воды при помощи химических реактивов 1917
  • Гордон И.Д.
SU2A1
G
Печь-кухня, могущая работать, как самостоятельно, так и в комбинации с разного рода нагревательными приборами 1921
  • Богач В.И.
SU10A1
Переносная печь для варки пищи и отопления в окопах, походных помещениях и т.п. 1921
  • Богач Б.И.
SU3A1
и Сагисаки Е
Синтез по правилам, использующий СГ-слоги и его качество
- Доклады секции речи Акустического общества Японии, 1980, с
Гидравлическая передача, могущая служить насосом 1921
  • Жмуркин И.А.
SU371A1

SU 1 075 300 A1

Авторы

Вайншток Аркадий Пинхосович

Книппер Александр Владимирович

Орлов Игорь Алексеевич

Потапов Владимир Георгиевич

Даты

1984-02-23Публикация

1982-12-21Подача