Показать метаданные Скрыть метаданные

(19)

(11)

1 075 300

(13)

(51)

МПК

G10L13/08(2000-01-01)

(21) (22)

Заявка

3525639, 1982-12-21

(22)

дата подачи заявки

1982-12-21

(45)

опубликовано

1984-02-23

(72)

авторы

Вайншток Аркадий ПинхосовичКниппер Александр ВладимировичОрлов Игорь АлексеевичПотапов Владимир Георгиевич

(56)

Документы, цитированные в отчете о поиске

Патент CLiA № 4278838, кл.Q 10 I 1/00, 1981Gи Сагисаки ЕСинтез по правилам, использующий СГ-слоги и его качество- Доклады секции речи Акустического общества Японии, 1980, с

Способ слоговой компиляции речи Советский патент 1984 года по МПК G10L13/08

Описание патента на изобретение SU1075300A1

Изобретение относится к приборостроению и может быть использовано для синтеза произвольного речевого сообщения. Известны способы компиляции речи из отдельных речевых элементов, которые реализуются последовательны соединением аллофонов (частей фонем или дифонов (сочетанием отрезков, двух звуков )1 и С23. Однако указанные способы обладают тем недостатком, что при аллофон ном или дифонном синтезах речи требуются, соответственно, или сложные программы управления, осуществляющие сшивание речи из аллофонов с учетом их контекстной и позиционной вариативности, или большое числ дифонов разнообразного типа, отражаюри-ix коартикуляционные связи межд двумя соседними звуками. Наиболее близким по технической сущности к изобретению является спо соб слоговой компиляции речи по тексту, использующий набор заранее записанных сигналов открытых слогов типа согласный - гласный и отдельных : гласных фиксированной длительности, в котором прои;звольное сообщение фо мируют последовательным выбором и объединением слогов и отдельных звуков линейным интерполированием их параметров на постоянном временном интервале. Позиционную изменчивость звуков задают контуром основного тона и длительностью гласных и согласных звуков на основе фонети ко-просодического анализа синтезируемого текста . Однако известный способ слоговой компиляции речи не имитирует естест венные коартикуляционные связи между соединяемыми слогами и звуками приих линейном интерполировании на постоянном временном интервале. Поэтому слоговая компиляция речи, обладая высокой разборчивость имеет выраженную слоговую структуру что воспринимается слушающими как уху шение качества звучания компилированной речи. Целью изобретения яв/1яется повышение качества звучания компилиро ванной речи. Поставленная цель достигается тем, что согласно способу слоговой компиляции речи по тексту, использующему набор заранее записанных сигналов открытых слогов типа согласный - гласный и отдельных гласных фиксированной длительности, перед согласными звуками слогов форми руют переходные сегменты различной длительности из последующих гласных звуков фиксированной длительности. При этом длительность переходных сегментов выбирают в зависимости от предшествующего звука в пределах 0,1-0,4 от фиксированной длительности гласных, причем, если этот звук согласный, то длительность берут наименьшую, а если гласный, то тем большую, чем больше различия в характеристиках между типами гласных. Более высокое качество звучания компилированной речи по предлагаемому способу объясняется тем, что при сшивании слогов и звуков в слитное речевое сообщение между естественными речевыми элементами формируют переходные сегменты различной длительности из гласного звука последующего слога. Эти переходные сегменты создают искусственную коартикуляцию звуков, близкую к естественной, так как для тех случаев, когда перестройка артикуляторных органов человека более длительна, обеспечивается большая длительность переходных сегментов. Ка фиг. 1 показано формирование переходов, имитирующих коартикуляцию между сшиваемыми базовыми элементами речи; на фиг. 2 - блоксхема системы, реализующей способ слоговой компи ляции речи. Различия между параметрами гласных, и1Ттерпретируемые фазовыми порт-ретами на плоскс стях формантных частот F - р2 , расстояние в этих пространствах. Длительность элементов речи, хранящихся в памяти, мс. Если предшествующий звук согласный, то длительность переходного сегмента составляет 20-30 мс, а если гласный, то 50-120 мс, т.е. длительность переходного гласного составляет 0,1-0,4 от фиксированной длительности гласных, хранящихся в памяти. Способ слоговой компиляции речи мсжет быть реализован в соответствии со структурной схемой, (фиг. 2К В лингвистическом процессоре 1 осуществляю.т фонетико-просодическое преобразование текстовой записи синтезируемой речи. На выходе этого блока текст представляют цепочкой открытых слогов и отдельных гласных звуков. Просодический анализатор задает контур основного тона и производит маркировку слогов на ударные, предударные и заударные. В блоке эмуляции эффекта коартикуляции 2 осуществляют вставку гласных сегментов в цепочку символов с блока 1 в соответствии с предлагаемым способом. В вычислителе временных интервалов 3 формируют временные траектории параметров синтезируемого сообщения и его просодические характеристики для дальТ1ейшего их преобразования в речевой сигнал синтезатором 4 вокодерного типа. Базовые г

элементы, которые могут быть пред- ставлены для экономии памяти в параметрическом виде, хранят в блоке 5 памяти и выэывгиот блоком 3 по мере обраэования временных траекторий параметров синтезируемого сообщения. Громкоговоритель 6 осуществляет преобразование речевого сигнала на выходе синтезатора 4 в акустические колебания.

Использование предлагаемого способа слоговой компиляции речи позволит повысить качество звучания синтезированной речи.

Иллюстрации к изобретению SU 1 075 300 A1

Реферат патента 1984 года Способ слоговой компиляции речи

1. СПОСОБ СЛОГОВОЙ КОМПИЛЯЦИИ РЕЧИ по тексту, использующий набор заранее записанных сигна i l.i,:--#K:-J - . -V- . , 1 .Ч S ц г.,; : ...: « и ..:,.-.-ХЧ:л..; S eJits.ij Mrif лов открытых слогов типа согласный гласный и отдельных гласных фиксированной длительности, отличающийся тем, что, с целью повышения качества звучания компилированной речи, перед согласными звуками слогов формируют переходные сегменты различной длительности из последующих гласных звуков. 2. Способ по п. 1, отличающийся тем, что длительность переходных сегментов выбирают в зависимости от предшествующего звука в пределах 0,1-0,4 от фиксированной длительности гласных, при этом, если этот звук согласный, S то длительность берут наименьшую, а если гласный, то длительность (Л берут тем бс5льшую, чем больше различия в характеристиках между типами гласных. сл 00

Формула изобретения SU 1 075 300 A1

Текст

Документы, цитированные в отчете о поиске Патент 1984 года SU1075300A1

Печь для непрерывного получения сернистого натрия	1921	Настюков А.М. Настюков К.И.	SU1A1
Патент CLiA № 4278838, кл.Q 10 I 1/00, 1981
Аппарат для очищения воды при помощи химических реактивов	1917	Гордон И.Д.	SU2A1
G
Печь-кухня, могущая работать, как самостоятельно, так и в комбинации с разного рода нагревательными приборами	1921	Богач В.И.	SU10A1
Переносная печь для варки пищи и отопления в окопах, походных помещениях и т.п.	1921	Богач Б.И.	SU3A1
и Сагисаки Е
Синтез по правилам, использующий СГ-слоги и его качество
- Доклады секции речи Акустического общества Японии, 1980, с
Гидравлическая передача, могущая служить насосом	1921	Жмуркин И.А.	SU371A1

SU 1 075 300 A1

Авторы

Вайншток Аркадий Пинхосович

Книппер Александр Владимирович

Орлов Игорь Алексеевич

Потапов Владимир Георгиевич

Даты

1984-02-23—Публикация

1982-12-21—Подача

название	год	авторы	номер документа
СПОСОБ СИНТЕЗА РЕЧИ	2009	Хитров Михаил Васильевич	RU2421827C2
КОМПЬЮТЕРНОЕ УСТРОЙСТВО ДЛЯ ЧТЕНИЯ ПЛОСКОПЕЧАТНОГО ТЕКСТА	1996	Золотов С.А. Калинин Н.Н. Балахонцев А.Н.	RU2113726C1
СПОСОБ КОМПИЛЯЦИОННОГО ФОНЕМНОГО СИНТЕЗА РУССКОЙ РЕЧИ И УСТРОЙСТВО ДЛЯ ЕГО РЕАЛИЗАЦИИ	2005	Алперин Евгений Данилович Кнох Владимир Яковлевич	RU2298234C2
Способ синтеза речи	1987	Орлов Игорь Алексеевич	SU1531133A1
УСТРОЙСТВО СИНТЕЗА РЕЧИ	2014	Мещеряков Роман Валерьевич	RU2606312C2
СПОСОБ ПРЕДВАРИТЕЛЬНОЙ ОБРАБОТКИ ТЕКСТА	2007	Гусев Михаил Николаевич Егорова Ольга Борисовна Смирнов Валентин Александрович	RU2386178C2
Способ компиляционного синтеза речи	1988	Григорян Альберт Айрапетович Канаян Карен Оникович	SU1599888A1
Способ компиляционного синтеза речи и устройство для его осуществления	1988	Лобанов Борис Мефодьевич	SU1683063A1
СПОСОБ АНАЛИЗА И СИНТЕЗА РЕЧИ	2005	Гусев Михаил Николаевич Дегтярёв Владимир Михайлович Ситников Валерий Валерьевич	RU2296377C2
СПОСОБ ОБУЧЕНИЯ РЕЗОНАНСНОМУ ПЕНИЮ И ИНСТРУМЕНТАРИЙ ДЛЯ ЕГО ОСУЩЕСТВЛЕНИЯ	2001	Демченко А.Д.	RU2202831C2