Изобретение относится к радиотехнике и может быть использовано в способах воспроизведения, системах и устройствах мобильной связи для реализации дополнительной функции - воспроизведения текстового сообщения речью.
Известно компьютерное устройство для чтения плоскопечатного текста, содержащее последовательно соединенные блок оптического ввода плоскопечатного текста и блок оптического распознавания текста, блок синтеза речи по орфографическому тексту, блок формирования аудиосигнала и оконечный аудиоблок, отличающееся тем, что блок оптического ввода плоскопечатного текста выполнен в виде сканера, блок формирования аудиосигнала выполнен в виде звуковой платы, блок синтеза речи по орфографическому тексту выполнен в виде блока синтеза русской речи по орфографическому тексту, в устройство дополнительно введены блок унификации текстового файла, блок текстовой базы данных, тактильный дисплей, блок сопряжения тактильного дисплея с персональным компьютером и блок интерфейса, при этом выход блока оптического распознавания текста через последовательно соединенные блок унификации текстового файла и блок текстовой базы данных соединен с информационным входом блока синтеза русской речи по орфографическому тексту, а через блок сопряжения - с входом тактильного дисплея, выход блока синтеза речи по орфографическому тексту через звуковую плату соединен с оконечным аудиоблоком, управляющие входы блока сопряжения тактильного дисплея и сканера, блока оптического распознавания текста, блока унификации текстового файла, блока синтеза русской речи по орфографическому тексту и блока текстовой базы данных соединены с соответствующими выходами блока интерфейса (патент РФ №2113726, G06К 9/00, опубл. 1998 г.).
В этом техническом решении (фиг.3, патент РФ №2113726) блок (5) синтеза русской речи по орфографическому тексту включает блок (18) выбора текущего абзаца, блок (19) чтения текущего абзаца, блок (20) предварительного синтаксического анализа абзаца, блок (21) выделения слов в абзаце, селектор (22) подслов на подмножествах алфавита метаязыка, блок (23) распознавания слов на русском алфавите, блок (24) трансляции слов метаязыка в слова на русском алфавите, первый блок ИЛИ (25), блок (26) контекстной расшифровки сокращений слов, блок (27) согласования, блок (28) выделения фраз и синтагм, блок (29) определения коммуникативного типа фраз и синтагм, блок (30) определения логического ударения в синтагмах, блок (31) фонетического транскрибирования текста, временной процессор (32), мелодический процессор (33), блок (34) компиляции, блок (35) формирования звукового файла и блок (36) вывода звукового файла. При этом блок (23) распознавания слов на русском алфавите и блок (24) трансляции слов метаязыка в слова на русском алфавите подсоединены параллельно к двум выходам селектора (22) подслов на подмножествах алфавита метаязыка, а выходы этих блоков (23) и (24) подсоединены к двум входам первого блока ИЛИ (25). Все остальные блоки соединены последовательно.
Это устройство позволяет синтезировать речь по сканируемому тексту.
Ограничениями этого устройства являются:
- необходима высокая производительность процессора для обеспечения осуществления большого количества математических операций в единицу времени;
- для воспроизведения текста голосом необходим очень большой объем оперативной памяти.
Наиболее близким является способ обмена сообщениями и система для его реализации, включающие передачу голосового сообщения от терминала связи через оборудование оператора сотовой связи посредством сети на сервер обработки, прием сервером обработки исходного голосового сообщения, его обработку для создания текстового файла, предназначенного для воспроизведения исходного голосового сообщения текстом, сохранение текстового файла и аудиофайла сервером обработки в базе данных и передача текстового файла на мобильный терминал связи через оборудование оператора сотовой связи посредством сети, прием мобильным терминалом связи текстового файла и воспроизведение по нему текста сообщения на дисплее мобильного терминала связи (заявка США №200607272718, Н04М 1/64, опубл. 2006 г.).
Этот способ позволяет решить задачу преобразования голосового сообщения, переданного со стационарного телефонного аппарата, в текстовое сообщение, например, SMS (SMS - short message service - служба коротких сообщений оператора сотовой связи), которое затем передают на мобильный терминал связи.
Для преобразования голосового сообщения в текстовое используют архитектуру языка (Voice XM), которая может быть установлена на оборудовании оператора сотовой связи, и дополнительно используют сервер обработки (компьютер) для выполнения специальных функций, необходимых для реализации обмена сообщениями.
Эти способ и система решают задачу создания текстового файла по звуковому, т.к. текстовой файл занимает объем памяти на два три порядка меньше, чем звуковой файл, то 250 мегабайт памяти на жестком диске позволяет сохранить 100 тысяч страниц текста, что соответствует ста страницам озвученного текста в виде звукового файла.
Ограничениями этого способа и системы являются:
- при использовании системы не выполняется основная функция мобильного терминала связи - осуществления голосового соединения с другим терминалом абонента, поскольку занят канал связи;
- высокое потребление электроэнергии мобильным терминалом связи для постоянного поддержания голосового канала связи с оборудованием оператора;
- постоянное поддержание голосового канала связи с оборудованием оператора отрицательно влияет на здоровье человека, что ограничивает время прослушивания.
Известен мобильный терминал связи, содержащий корпус, процессор, установленный внутри корпуса, приемопередатчик, оперативное запоминающее устройство, блок обработки сигнала, выполненный с цифроаналоговым преобразователем и аналого-цифровым преобразователем, флэш-накопитель, который предназначен для загрузки программного обеспечения и файлов, кнопочную панель, дисплей, микрофон и динамик, установленные внутри корпуса, вход/выход приемопередатчика, вход/выход оперативного запоминающего устройства, вход/выход аналого-цифрового преобразователя и вход/выход цифроаналогового преобразователя, вход/выход флэш-накопителя, выход кнопочной панели, вход дисплея подсоединены через шину к процессору, выход микрофона подсоединен через шину к аналого-цифровому преобразователю, вход динамика подсоединен через шину соответственно к цифроаналоговому преобразователю, при этом программное обеспечение выполнено с возможностью управления работой процессора, дисплея и динамика посредством клавиатуры и меню на дисплее (патент РФ №2193822, Н04М 1/21, опубл. 11.01.1999).
Это мобильный терминал связи выполнен с расширенной памятью для хранения звуковой и видеоинформации и имеет модуль для развлекательных функций для воспроизведения заранее записанных звуковых и видеосигналов, содержащий в себе приемопередатчик для передачи и приема звуковых и информационных сигналов, схему обработки сигналов, которая при работе соединяется с приемопередатчиком и микропроцессором, для обработки сигналов, переданных и принятых приемопередатчиком, модуль для развлекательных функций с запоминающим устройством, которое при работе соединяется с микропроцессором и со схемами обработки сигнала, для хранения звуковых и видеосигналов для последующего воспроизведения, запоминающее устройство для хранения списка предпочтительных абонентов, микропроцессор для управления работой указанного приемопередатчика, указанного модуля для развлекательных функций и указанного запоминающего устройства. Указанный процессор выполнен с возможностью прекращения воспроизведения заранее записанных звуковых и видеосигналов в ответ на входящий телефонный звонок от абонента из списка предпочтительных абонентов и предоставления пользователю возможности приема входящего телефонного звонка без звучания воспроизведения.
Ограничением этого мобильного терминала связи является возможность прослушивания только голосовых сообщений, принимаемых по сети GSM от оборудования оператора сотовой связи. Преобразование текстового файла в голосовое сообщение он не производит.
Решаемая изобретением задача - обеспечение возможности генерации речи мобильным терминалом связи по текстовому сообщению - своему или иному, им принятому, а также повышение технико-эксплуатационных характеристик передачи.
Технический результат, который может быть получен при осуществлении способа, - уменьшение количества передаваемой информации для воспроизведения речи, увеличение объема слов речи для воспроизведения их на мобильном терминале связи по текстовой информации, доступность воспроизведения речи по текстовой информации в любой момент времени, даже при отсутствии сигнала GSM сети оборудования оператора сотовой связи для его воспроизведения.
Технический результат, который может быть получен при выполнении системы, - увеличение быстродействия, уменьшение количества передаваемой информации, снижение нагрузки на процессор мобильного терминала связи, снижение энергопотребления мобильного терминала связи.
Технический результат, который может быть получен при выполнении мобильного терминала связи, - увеличение функциональных возможностей с сохранением основной функции: осуществления голосового соединения с другим терминалом, уменьшение энергопотребления.
Для решения поставленной задачи с достижением указанного технического результата заявленный способ обмена сообщениями включает:
- передачу текстового сообщения от мобильного терминала связи на оборудование оператора сотовой связи посредством сети глобальной системы мобильной связи,
- прием текстового сообщения оборудованием оператора сотовой связи и передачу текстового сообщения на сервер обработки посредством сети Интернет,
- прием сервером обработки текстового сообщения, обработку текстового сообщения сервером обработки путем фонетического, грамматического и синтаксического анализа исходного текстового сообщения, преобразование обработанного текстового сообщения в закодированный текстовый файл для создания закодированного текстового файла с размером, меньшим, чем размер текстового сообщения, и меньшим, чем размер аудиофайла для его воспроизведения,
- сохранение закодированного текстового файла сервером обработки в базе данных и передача закодированного текстового файла на оборудование оператора сотовой связи посредством сети Интернет,
- передачу закодированного текстового файла на мобильный терминал связи от оборудования оператора сотовой связи посредством сети глобальной системы мобильной связи,
- загрузку в память мобильного терминала связи программного обеспечения, позволяющего создать меню на дисплее мобильного терминала связи для воспроизведения текста речью и соответствующего управления работой процессора,
- прием мобильным терминалом связи закодированного текстового файла и его запоминание, создание аудиофайла посредством сопоставления каждому символу закодированного текстового файла определенного образца звука и составления по ним речевой последовательности из определенных образцов звуков,
- воспроизведение мобильным терминалом связи аудиофайла.
Возможны дополнительные варианты осуществления способа, в которых целесообразно, чтобы:
- регулировали скорость воспроизведения или тембр звука путем замены образцов звуков;
просмотр текстового сообщения производили синхронно речи воспроизводимого аудиофайла;
- воспроизведение аудиофайла осуществляли с выбранного слова речи текстового сообщения;
- дополнительно осуществляли просмотр и выбор, по меньшей мере, одного закодированного текстового файла на сервере обработки в базе данных;
- кодировали текстовый файл посредством пятибитной, шестибитной или семибитной таблицы кодирования символов.
Для решения поставленной задачи с достижением указанного технического результата заявленная система содержит мобильный терминал связи, оборудование оператора сотовой связи, связанное с мобильным терминалом связи посредством сети глобальной системы мобильной связи, сервер обработки, связанный с оборудованием оператора сотовой связи посредством сети Интернет, причем сервер обработки выполнен с возможностью фонетического, грамматического и синтаксического анализа принятого текстового сообщения и его кодирования, который соединен с базой данных, а программное обеспечение мобильного терминала связи предназначено для сопоставления каждому символу закодированного текстового файла определенного образца звука и составления речевой последовательности из определенных образцов звуков для формирования аудиофайла и его воспроизведения мобильным терминалом связи.
Для решения поставленной задачи с достижением указанного технического результата мобильный терминал связи содержит корпус, процессор, установленный внутри корпуса, приемопередатчик, оперативное запоминающее устройство, цифроаналоговый преобразователь, аналого-цифровой преобразователь, флэш-накопитель, кнопочную панель, дисплей, микрофон и динамик, установленные внутри корпуса, вход/выход приемопередатчика, вход/выход оперативного запоминающего устройства, вход/выход аналого-цифрового преобразователя, вход/выход цифроаналогового преобразователя, вход/выход флэш-накопителя, кнопочная панель и дисплей подсоединены посредством шины к процессору, выход микрофона подсоединен через шину к аналого-цифровому преобразователю, вход динамика подсоединен через шину соответственно к цифроаналоговому преобразователю, при приеме приемопередатчиком закодированного текстового файла, несущего информацию о соответствующем ему аудиофайле, программное обеспечение позволяет извлечь посредством процессора из флэш-накопителя определенных образцов звуков, соответствующих каждому символу закодированного текстового файла, для формирования в оперативном запоминающем устройстве речевой последовательности из определенных образцов звуков, при этом программное обеспечение предназначено для формирования посредством процессора в оперативном запоминающем устройстве по речевой последовательности из определенных образцов звуков аудиофайла для передачи его через цифроаналоговый преобразователь на динамик.
Проблема преобразования текстовой информации в голос (или наоборот) заключается в том, что такой процесс осуществляется целиком с помощью дополнительного оборудования оператора сотовой связи или полностью на сервере контент провайдера, а затем передача на мобильные терминалы связи осуществляется при помощи голосового соединения. Терминалы мобильной связи по сравнению с современными компьютерами обладают менее мощным процессором, меньшим объемом памяти ОЗУ, более медленной шиной обмена данных. Данные ограничения диктуются рынком мобильных терминалов связи, от которых требуются небольшие габариты, легкость. Все производители, понимая данные ограничения, стараются увеличить производительность терминалов путем усовершенствования технологий создания микросхем и увеличения емкости аккумуляторных батарей. Но производительность терминалов все же еще очень далека от производительности даже домашних персональных компьютеров.
В отличие от других известных технических решений ранее мобильный терминал связи мог воспроизводить (генерировать звуковые волны) речь человека (именно речь человека) только из записанного в флэш-накопителе аудиофайла или из принимаемого сигнала непосредственно с приемопередатчика мобильного терминала связи. Предлагается же решение, при осуществлении которого можно генерировать речь человека из обычного текстового файла, записанного в флэш-накопителе мобильного терминала связи. При этом основная нагрузка по обработке текстовых и аудиофайлов осуществляется сервером обработки, что позволяет добиться высокого качества преобразования текстового сообщения в голосовое, даже с учетом низких технических характеристик мобильных терминалов связи.
Указанные преимущества, а также особенности настоящего изобретения поясняются лучшим вариантом его выполнения со ссылками на прилагаемые фигуры.
Фиг.1 изображает заявленную систему обмена сообщениями;
Фиг.2 - функциональную схему мобильного терминала связи;
Фиг.3 - функциональную схему работы системы на фиг.1;
Фиг.4 - блок-схему алгоритма работы мобильного терминала связи на фиг.2;
Поскольку заявленный способ реализуется при работе системы для обмена сообщениями, то его подробное описание приводится в разделе описания работы системы.
Система для обмена сообщениями (фиг.1) содержит, по меньшей мере, один мобильный терминал 1 связи, оборудование 2, по меньшей мере, одного оператора сотовой связи, связанное с мобильным терминалом 1 связи посредством сети глобальной системы мобильной связи (GSM), сервер 3 обработки, связанный с оборудованием 2, по меньшей мере, одного оператора сотовой связи посредством сети Интернет. Сервер 3 обработки выполнен с возможностью фонетического, грамматического и синтаксического анализа принятого текстового сообщения от мобильного терминала 1 связи и создания закодированного текстового файла с размером, меньшим, чем размер текстового сообщения, и меньшим, чем размер аудиофайла, предназначенного для воспроизведения принятого текстового сообщения речью. Сервер 3 обработки выполнен с возможностью сохранения в базе 4 данных сервера обработки закодированного текстового файла. Мобильный терминал 1 связи выполнен с возможностью загрузки в его память программного обеспечения и создания меню на его дисплее для осуществления сопоставления каждому элементу закодированного текстового файла определенного звука и составления по ним речевой последовательности из определенных звуков.
Мобильный терминал связи (фиг.2) содержит корпус 10, процессор 11, установленный внутри корпуса 10, приемопередатчик 12, оперативное запоминающее устройство 13, блок обработки сигнала 14, выполненный с цифроаналоговым преобразователем 15 и аналого-цифровым преобразователем 16, флэш-накопитель 17, который предназначен для загрузки программного обеспечения и файлов, кнопочную панель 18, дисплей 19, микрофон 20 и динамик 21, установленные внутри корпуса 10, вход/выход приемопередатчика 12, вход/выход оперативного запоминающего устройства 13, вход/выход аналого-цифрового преобразователя 16 и вход/выход цифроаналогового преобразователя 15, вход/выход флэш-накопителя 17, выход кнопочной панели 18, вход дисплея 19 подсоединены через шину 22 к процессору 11, выход микрофона 20 подсоединен через шину 22 к аналого-цифровому преобразователю 16, вход динамика 21 подсоединен через шину 22 соответственно к цифроаналоговому преобразователю 15, при этом программное обеспечение выполнено с возможностью управления работой процессора 11, дисплея 19 и динамика 21 посредством кнопочной панели 18 и меню на дисплее 19, причем при приеме закодированного текстового файла, несущего информацию о соответствующем ему аудиофайле, программное обеспечение выполнено с возможностью извлечения посредством процессора 11 из флэш-накопителя 17 определенных звуков, соответствующих каждому элементу закодированного текстового файла для формирования в оперативном запоминающем устройстве 13 речевой последовательности из определенных звуков, при этом программное обеспечение выполнено с возможностью формирования посредством процессора 11 в оперативном запоминающем устройстве 13 по речевой последовательности из определенных звуков аудиофайла для передачи его через цифроаналоговый преобразователь 15 на динамик 21, причем программное обеспечение выполнено с возможностью регулирования скорости передачи аудиофайла посредством процессора 11, кнопочной панели 18 и меню на дисплее 19.
Работает система (фиг.1, 3) следующим образом.
Система находится в рабочем состоянии при условии:
- сервер 3 обработки находится во включенном состоянии, имеет по крайней мере одно подключение к сети Интернет;
- оборудование 2 оператора сотовой связи функционирует и имеет подключение к сети Интернет и одну функционирующую сеть GSM;
- мобильный терминал 1 связи включен, находится в зоне действия сети GSM оператора связи и на мобильный терминал 1 установлено программное обеспечение (ПО) для синтеза речи по текстовому сообщению.
Система может работать в двух режимах, которые выбирает пользователь мобильного терминала 1 связи посредством установленного на мобильный терминал 1 связи ПО, позволяющее вывести меню на дисплей для выбора функций прослушивания.
Первый режим - пользователь мобильного терминала 1 связи желает прослушать текстовое сообщение, хранимое на его мобильном терминале 1 связи.
Второй режим - пользователь мобильного терминала 1 связи желает прослушать закодированный текстовый файл, ранее сохраненный в базе 4 данных закодированных текстовых файлов на сервере 3 обработки.
При использовании первого режима пользователь мобильного терминала связи 1 (фиг.2, 3), воспользовавшись установленным ранее ПО (например, соответствующим Java-приложением) мобильного терминала 1, создает текстовое сообщение и, обращаясь к меню для выбора функций прослушивания, выбирает режим «отправить», нажав одну из кнопок кнопочной панели 18, передает управляющий сигнал на блок 35 отправки текстового сообщения и запросов закодированных файлов и отправляет текстовое сообщения. Блок 35 использует стандартную функцию мобильного терминала 1 связи по отправке пакетных сообщений в сеть Интернет через сеть GSM посредством оборудования 2 оператора связи. Пакетное сообщение представляет из себя текстовое сообщение пользователя мобильного терминала 1 связи, преобразованного в формат сообщений сети Интернет и направленное на Интернет адрес сервера 3 обработки.
Пакетное сообщение принимается блоком 32 приема текстовых сообщений сервера 3 обработки. Блок 32 использует стандартные функции сетевой карты сервера 3 обработки, которая является сетевой картой компьютера.
Полученное сообщение передается блоку 31 обработки и кодировки текстовых сообщений, который предназначен для осуществления фонетического, грамматического и синтаксического анализа текстового сообщения, реализация которого осуществляется путем синтеза русской речи по орфографическому тексту. Осуществление такого анализа возможно посредством использования блока выбора текущего абзаца, блока чтения текущего абзаца, блока предварительного синтаксического анализа абзаца, блока выделения слов в абзаце, селектора подслов на подмножествах алфавита метаязыка, блока распознавания слов на русском алфавите, блока трансляции слов метаязыка в слова на русском алфавите, блока ИЛИ, блока контекстной расшифровки сокращений слов, блока согласования, блока выделения фраз и синтагм, блока определения коммуникативного типа фраз и синтагм, блока определения логического ударения в синтагмах, блока фонетического транскрибирования текста, которые раскрыты в указанном патенте РФ №2113726.
В результате анализа в исходном текстовом сообщении расставляются все необходимые дополнительные символы, которые несут информацию об эмоциональной окраске текста текстового сообщения.
Полученное текстовое сообщение кодируется.
В обычных персональных компьютерах для отображения символов используется 8-битная кодировка с 256 (2 в 8 степени = 256 вариаций) символами. В связи с тем, что файл по определению является последовательностью данных, в программном обеспечении возможно создание новых кодировок и форматов файлов, которые не ограничены разрядностью файловой системы обычного персонального компьютера. На сервер 3 от мобильного терминала 1 связи поступает файл 8-битной кодировки с 256 символами.
В то же время общее количество используемых символов (букв) в тестовом файле составляет 32 символа, что в принципе позволяет использовать 5-битную таблицу кодирования символов (2 в 5 степени = 32 вариации). Такая кодировка используется в предложенном техническом решении для создания закодированного текстового файла с размером, меньшим, чем размер текстового сообщения, и меньшим, чем размер аудиофайла для воспроизведения текстового сообщения. Для более сложного и качественного анализа текстового сообщения можно использовать например 6- или 7-битную таблицу кодировки символов.
Таким образом, в простейшем случае при кодировании проанализированного текстового сообщения в закодированный текстовый файл для уменьшения нагрузки на каналы связи и экономии памяти флэш-накопителя 17 используется 5-битная таблица кодирования символов, что позволяет уменьшить размер файла до (5/8)×100=62,5% от первоначально размера.
Полученный закодированный текстовый файл сохраняют в блоке 30 сохранения закодированных текстовых файлов базы 4 данных.
Закодированный и запомненный текстовый файл в блоке 30 передают в блок 33 отправки закодированных текстовых файлов, где он преобразуется в пакетное сообщение сети Интернет. Отправка осуществляется с использованием стандартной функции сетевой карты сервера 3.
Пакетное сообщение по сети Интернет доставляется оборудованию 2 оператора сотовой связи для дальнейшей его передачи посредством сети GSM блоку 37 приема и сохранения закодированного текстового файла мобильного терминала 1.
Блок 37 приема и сохранения закодированного текстового файла производит прием пакетного сообщения Интернет посредством приемопередатчика 12 мобильного терминала 1 и преобразует его посредством стандартных функций мобильного терминала 1 в исходный закодированный текстовый файл, который запоминается на флэш-накопителе 17. Особенностью заявленного технического решения является то, что раскодировка исходного закодированного текстового файла не производится, что позволяет использовать процессор 11 с достаточно низкой производительностью и тактовой частотой, а ОЗУ 13 и флэш-накопитель 17 с меньшим объемом памяти. При сохранении закодированного текстового файла на флэш-накопителе 17 мобильного терминала связи 1 блок 37 приема и сохранения закодированного текстового файла информирует блок 36 отображения меню и управления ПО о завершении процесса сохранения, при этом программное обеспечение предназначено для обработки файла, именно с 5 (6 или 7)-битной таблицей кодирования символов.
На дисплее 19 мобильного терминала 1 отображается информация о том, что мобильным терминалом 1 сохранен закодированный текстовый файл. Когда пользователь мобильного терминала 1 выразит желание прослушать текстовое сообщение, то после нажатия одной из кнопок кнопочной панели 18 мобильного терминала 1 блок 36 передает команду блоку 38 формирования аудиофайла на формирование такого файла по сохраненному в блоке 37 закодированному текстовому файлу. Блок 38 предназначен для формирования звукового файла посредством сопоставления каждому символу закодированного текстового файла определенного образца звука и составления по ним речевой последовательности из определенных образцов звуков. Одна из возможных реализации которого раскрыта в патенте РФ 2113726.
Блок 38 на основании загруженного с флэш-накопителя 17 в ОЗУ 13 закодированного текстового файла, например, с 5-битным кодированием осуществляет сопоставление каждому символу (элементу) закодированного текстового файла определенного звука, загруженного на мобильный терминал связи 1 при установке соответствующего ПО.
Программное обеспечение и образцы звуков могут быть загружены в флэш-накопитель 17 либо через модуль подключения компьютерной периферии, либо через модуль подключения к глобальной сети Интернет. Его можно установить на мобильный терминал связи из сети Интернет с помощью GPRS. Программное обеспечение можно ввести с компьютера (куда оно тоже может быть загружено из Интернета, либо взято с компакт-диска) через инфракрасный порт мобильного терминала связи, bluetooth или дата-кабель, либо установить непосредственно с одного мобильного терминала связи на другой посредством инфракрасного порта или bluetooth.
Сформированный блоком 38 аудиофайл сохраняется в ОЗУ 13 мобильного терминала связи 1.
По итогам формирования аудиофайла блок 38 информирует блок 36 о готовности воспроизведения аудиофайла и передает команду блоку 39 воспроизведения аудиофайла для его проигрывания через динамик 21.
Блок 36 отображает на дисплее 19 мобильного терминала связи 1 информацию для пользователя о начале воспроизведения аудиофайла и передает команду блоку 39 о начале его воспроизведения.
В процессе воспроизведения блок 39 информирует блок 36 о процессе воспроизведения аудиофайла для отображения блоком 36 информации о процессе его проигрывания, таким образом, текст отображается на дисплее 19 и осуществляется просмотр текстового сообщения синхронно речи, воспроизводимого аудиофайлом.
При работе пользователя во втором режиме пользователь, пользуясь меню блока 36, отображенном на дисплее 19 мобильного терминала 1 связи, указывает, какой закодированный текстовый файл, сохраненный в базе 4 данных сервера 3, он желает загрузить для дальнейшего его прослушивания. (Перечень текстов, сохраненных на сервере 3, может быть введен при установке программного обеспечения или направлен пользователю мобильного терминала 1 дополнительно от сервера 3, а также обновлен в соответствии с тем, как это обычно делается пользователями компьютеров сети Интернет. Более подробно процесс формирования перечня наименований текстов описан ниже при описании работы мобильного терминала 1 связи).
Блок 36 отображения меню и управления ПО передает запрос на загрузку выбранного закодированного текстового файлы блоку 35 отправки текстового сообщения и запросов закодированный файлов.
Блок 35 использует стандартную функцию мобильного терминала 1 связи по отправке пакетных сообщений в сеть Интернет через сеть GSM посредством оборудования 2 оператора связи. Это пакетное сообщение является запросом на получение закодированного текстового файла, преобразованного в формат сообщений сети Интернет, и направленное на Интернет-адрес сервера 3 обработки.
Пакетное сообщение принимается блоком 34 обработки запросов на загрузку закодированных текстовых файлов сервера 3 обработки. Блок 34 использует стандартные функции сетевой карты сервера 3 обработки, которая является сетевой картой компьютера.
От блока 34 запрос на загрузку закодированного текстового файла передается блоку 33 отправки закодированных текстовых файлов, который в свою очередь запрашивает у блока 30 сохранения закодированных текстовых файлов в базе 4 данных сервера 3 запрашиваемый закодированный текстовый файл.
Далее процесс работы во втором режиме полностью соответствует описанному выше режиму работы системы в первом режиме.
Для объяснения логики работы мобильного терминала 1 рассмотрим один из возможных вариантов алгоритма его работы (фиг.4). В связи с тем, что мобильные терминалы 1 связи разных производителей имеют различные технические характеристики, то логика ПО мобильного терминала 1 связи может незначительно отличаться.
Для инициализации на мобильном терминале 1 связи возможности прослушивания закодированных текстовых файлов необходимо выбрать соответствующее меню запуска ранее установленного на мобильный терминал 1 связи программного обеспечения. Данное действие происходит в блоке 40 «Запуск» ПО, при этом ПО мобильного терминала 1 связи загружает все необходимые данные в ОЗУ 13 мобильного терминала 1 связи и выводит на дисплей 19 мобильного терминала 1 все доступные для пользователя мобильного терминала 1 связи пункты меню.
Далее управление мобильным терминалом 1 связи передается блоку 41 меню, который ожидает действий пользователя мобильного терминала 1 связи на кнопочную панель 18 мобильного терминала 1 связи. При нажатии пользователем одной из кнопок кнопочной панели 18 мобильного терминала 1 связи джойстика или цифр 2 и 8, как например, реализовано в конкретной программе, производится перемещение фокуса активного пункта меню.
В рассматриваемом примере в меню присутствуют пункты: отправить текстовое сообщение, загрузить закодированный текстовый файл с сервера обработки, прослушать закодированный текстовый файл, изменить скорость прослушивания, изменить тембр голоса, изменить уровень громкости прослушивания, выйти из ПО.
При нажатии на кнопочной панели 18 мобильного терминала 1 одной из кнопок, за которой закреплено свойство «Применить» (чаще всего это кнопка «Звонить» или центральная кнопка джойстика меню мобильного терминала связи), блок меню 41 передает номер выбранного меню логическому блоку «Если» 42 отправки текстового сообщения.
Если был выбран пункт меню отправки текстового сообщения, то логический блок 42 передает управление мобильным терминалом 1 связи блоку 43 ввода текста.
Блок 43 осуществляет посредством кнопочной панели 18 мобильного терминала 1 связи процесс ввода пользователем текстового сообщения. По окончании ввода пользователь мобильного терминала 1 связи подтверждает окончание ввода текстового сообщения нажатием на кнопочной панели 18 мобильного терминала 1 связи кнопки «Применить», после чего управление мобильным терминалом 1 связи передается блоку 44 обмена информации с сервером 3 обработки.
Блок 44 обмена информации с сервером 3 обработки через приемопередатчик 12 мобильного терминала 1 по сети глобальной мобильной связи через оборудование 2 оператора связи по сети Интернет производит отправку введенного пользователем текстового сообщения и ожидает ответ от сервера 3 обработки в виде закодированного текстового файла этого сообщения. Сервер 3, как описано выше, создает закодированный текстовый файл, который через описанную систему обработки сообщений передается обратно. При получении закодированного текстового файла мобильным терминалом 1 он записывается на флэш-накопитель 17. По итогам выполнения всех операций данного блока 44 на дисплее 19 мобильного терминала 1 связи выводится информация о завершении работы блока 44, а управление мобильным терминалом 1 связи возвращается на блок 41 меню.
Если же пользователем не был выбран пункт меню отправки текстового сообщения, то логический блок 42 передает управление мобильным терминалом 1 связи логическому блоку 45 отправки запроса на получение закодированного текстового файла.
Если был выбран пункт меню загрузки закодированного текстового файла с сервера 3 обработки, то логический блок 45 передает управление мобильным терминалом 1 связи блоку 46 выбора закодированного текстового файла из базы 4 данных сервера 3.
Блок 46 выбора закодированного текстового файла через описанную систему обработки сообщений производит запрос доступных для загрузки (скачивания) закодированных текстовых файлов, ожидает ответ сервера 3 обработки в виде перечня названий закодированных текстовых файлов. Перечень по получению отображается на дисплее 19 мобильного терминала 1 связи. Пользователь мобильного терминала 1 связи посредством кнопочной панели 18 осуществляет выбор закодированного текстового файла по его названию. При подтверждении загрузки выбранного закодированного текстового файла с помощью кнопочной панели 18 мобильного терминала 1 связи блок 46 выбора закодированного текстового файла передает название необходимого закодированного текстового файла блоку 47 обмена информации с сервером 3 обработки, который уже управляет мобильным терминалом 1 связи.
Блок 47 обмена информации с сервером 3 обработки через описанную систему обработки сообщений производит запрос на получение выбранного закодированного текстового файла по названию, ожидает ответ сервера 3 обработки в виде закодированного текстового файла, соответствующего этому названию. Полученный соответствующий закодированный текстовый файл записывается на флэш-накопитель 17 мобильного терминала 1. По итогам выполнения всех операций данного блока 47 на дисплее 19 мобильного терминала 1 связи выводится информация о выполнении, а управление мобильным терминалом 1 связи возвращается блоку 41 меню.
Если же пользователем не был выбран пункт меню отправки запроса на получение закодированного текстового файла, то логический блок 45 передает управление мобильным терминалом 1 связи логическому блоку 48 прослушивания файла.
Если был выбран пункт меню «прослушать закодированный текстовый файл», то логический блок 48 передает управление мобильным терминалом связи блоку 49 генерации аудиофайла (голосового) и его воспроизведения.
Блок 49 генерации аудиофайла и его воспроизведения производит анализ доступных закодированных текстовых файлов, ранее сохраненных на флэш-накопителе 17 мобильного терминала 1 связи, и отображает список их имен на дисплее 19. Пользователь посредством кнопочной панели 18 производит выбор желаемого для проигрывания закодированного текстового файла, при подтверждении выбора блок 49 генерации аудиофайла и его проигрывания посредством использования процессора 11, ОЗУ 13, ЦАП 15, динамика 21 и флэш-накопителя 17 мобильного терминала 1 связи производит, как описано выше, с учетом битности его кодирования, но без раскодирования. Далее блок 49 посредством меню и дисплея 19 предлагает пользователю мобильного терминала 1 выбрать слово текстового сообщения, с которого необходимо начать генерацию аудиофайла для его дальнейшего проигрывания. После подтверждения пользователем мобильного терминала 1 выбранного слова текстового сообщения для начала проигрывания блок 49 производит генерацию аудиофайла и его проигрывание на динамике 21 с указанного слова текстового сообщения. Прекращение генерации аудиофайла и его проигрывание заканчивается по окончании закодированного текстового файла или по команде пользователя мобильного терминала 1 связи, поданной посредством кнопочной панели 18, при этом управление мобильным терминалом 1 связи передается блоку 41 меню.
При прекращении генерации аудиофайла и его проигрывания по команде пользователя мобильного терминала 1 блок 49 запоминает последнее слово текстового сообщения, которое было сгенерировано в речевую последовательность, и при повторном обращении ПО к блоку 49 предлагает пользователю мобильного терминала 1 начать генерацию аудиофайла и его проигрывание с того слова текстового сообщения, на котором произошла остановка проигрывания при предыдущем прослушивании.
Если же пользователем не был выбран пункт меню прослушивания закодированного текстового файла, то логический блок 48 передает управление мобильным терминалом 1 связи логическому блоку 50 изменения скорости прослушивания закодированного текстового файла.
Если пользователем был выбран пункт меню изменения скорости прослушивания закодированного текстового файла, то логический блок 50 передает управление мобильным терминалом 1 связи блоку 51 изменения скорости прослушивания закодированного текстового файла.
Блок 51 изменения скорости прослушивания закодированного текстового файла отображает на дисплее 19 мобильного терминала 1 связи текущую скорость воспроизведения, выраженную в процентном значении. 100% - максимальное значение скорости и соответствует скорости речи человека говорящего быстро, но понятно. Данный стиль речи чаще всего применяется при докладах или чтении лекции. Пользователь мобильного терминала 1 связи посредством кнопочной панели 18 мобильного терминала 1 связи может выбрать желаемое значение скорости прослушивания закодированного файла, например, с шагом в 10%. После подтверждения пользователем мобильного терминала 1 связи посредством кнопочной панели 18 выбранного значения скорости ПО производит замену образцов звуков, которые используются для создания речевой последовательности звуков.
При обычном увеличении или уменьшении скорости воспроизведения изменяется и тембр (что связано с физическим свойством звуковой волны), поэтому производить изменение скорости воспроизведения при помощи непосредственно мобильного терминала 1 нецелесообразно. Для изменения заложенных ранее в мобильный терминал 1 образцов звуков другими, например, более медленными или более быстрыми, от мобильного терминала 1 через систему обработки сообщений поступает на сервер 3 запрос на получение новых образцов звуков, соответствующих выбранной пользователем скорости воспроизведения. Все образцы звуков хранятся на сервере 3 обработки в базе 4 данных и поступают обратно от сервера 3 по системе обработки сообщений на мобильный терминал связи 1. Старые образцы звуков при помощи ПО удаляются с флэш-накопителя 17, а вновь поступившие сохраняются на их месте. Соответствующим образом, для выбранной скорости воспроизведения тембр воспроизведения сохраняется. Увеличение или уменьшение скорости воспроизведения практически всегда необходимо, т.к. процессоры различных моделей мобильных терминалов 1 разных фирм производителей имеют различную производительность и тактовую частоту. Нужно заметить, что при изменении скорости воспроизведения пользователем основная нагрузка ложится на сервер 3, а на мобильном терминале 1 не увеличивается нагрузка на процессор 11 при генерации речевой последовательности.
Если же не был выбран пункт меню изменения скорости прослушивания закодированного текстового файла, то логический блок 50 передает управление мобильным терминалом связи логическому блоку 52 изменения тембра голоса.
Если был выбран пункт меню изменения тембра воспроизводимого голоса, то логический блок 52 передает управление мобильным терминалом связи блоку 53 изменения тембра воспроизводимого голоса.
Блок 53 изменения тембра воспроизводимого тембра отображает на дисплее мобильного терминала связи текущее значение тембра воспроизводимого голоса, выраженную в процентном значении - 3. 3 - среднее значение тембра воспроизводимого голоса и соответствует тембру голоса мужчины средних лет со среднем тембром голоса. Пользователь мобильного терминала 1 связи посредством кнопочной панели 18 мобильного терминала 1 связи может выбрать желаемое значение тембра воспроизводимого голоса. В конкретном техническом решении доступно пять значений тембра воспроизводимого голоса. 1 - самый низкий тембр. 5 - самый высокий тембр. После подтверждения выбранного значения пользователем мобильного терминала 1 связи посредством кнопочной панели 18 ПО производит замену образцов звуков аналогично, как описано выше, для изменения скорости воспроизведения. По завершении изменения образцов звуков управление мобильным терминалом связи передается блоку 41 меню.
Если же не был выбран пункт меню изменения тембра воспроизводимого голоса, то логический блок 52 передает управление мобильным терминалом 1 связи логическому блоку 54 изменения уровня громкости прослушивания.
Если был выбран пункт меню изменения уровня громкости прослушивания, то логический блок 54 передает управление мобильным терминалом 1 связи блоку 55 изменения уровня громкости прослушивания закодированного текстового файла.
Блок 55 изменения громкости прослушивания закодированного текстового файла посредством стандартной функции мобильного терминала 1 связи производит отображение на дисплее 19 мобильного терминала 1 связи текущего значения уровня громкости воспроизведения закодированного текстового файла. Пользователь мобильного терминала 1 связи посредством кнопочной панели 18 выбирает желаемое значение уровня громкости прослушивания закодированного текстового файла. После подтверждения выбранного значения уровня громкости пользователем ПО производит необходимые изменения в настройках ЦАП 15 и динамика 19, как это обычно и осуществляется во всех мобильных терминалах 1 связи. По завершении необходимых настроек управление мобильным терминалом 1 связи передается блоку 41 меню.
Если же пользователем не был выбран пункт меню изменения уровня громкости прослушивания закодированного текстового файла, то логический блок 54 передает управление мобильным терминалом связи логическому блоку 56 выхода из ПО.
Если пользователем был выбран пункт меню - выход из программного обеспечения, то логический блок 56 передает управление мобильным терминалом связи блоку 57 на остановку ПО.
Если же пользователем не был выбран пункт меню выхода из ПО, то логический блок 56 передает управление мобильным терминалом связи блоку 41 меню.
Блок 57 производит удаления всех созданных программным обеспечением временных файлов из ОЗУ 13 мобильного терминала 1 связи и передает управление мобильным терминалом 1 связи операционной системе мобильного терминала 1 связи.
Наиболее успешно заявленные способ обмена сообщений, система для обмена сообщениями и мобильный терминал связи промышленно применимы в системах сотовой связи стандарта GSM.
Изобретение позволяет по текстовому сообщению создать голосовое сообщение. Технический результат - повышение технико-эксплуатационных характеристик передачи. Способ включает передачу текстового сообщения от мобильного терминала связи через систему для обмена сообщениями на сервер обработки. Обработку текстового сообщения осуществляют путем фонетического, грамматического и синтаксического анализа и его преобразования в закодированный текстовый файл. Передают закодированный текстовый файл на мобильный терминал связи, в котором при помощи программного обеспечения сопоставляют каждому символу закодированного текстового файла определенного образца звука и составляют по ним речевую последовательность. Формируют аудиофайл и воспроизводят его. Система для обмена сообщениями и мобильный терминал связи содержат соответствующие технические средства. 3 н. и 5 з.п. ф-лы, 4 ил.
US 2003135569 A1, 17.07.2003 | |||
СОТОВЫЙ ТЕЛЕФОН С РАСШИРЕННОЙ ПАМЯТЬЮ ДЛЯ ХРАНЕНИЯ ЗВУКОВОЙ И ВИДЕОИНФОРМАЦИИ | 1999 |
|
RU2193822C2 |
КОМПЬЮТЕРНОЕ УСТРОЙСТВО ДЛЯ ЧТЕНИЯ ПЛОСКОПЕЧАТНОГО ТЕКСТА | 1996 |
|
RU2113726C1 |
RU 2003106394 А, 20.08.2004 | |||
СТОЛБЧАТЫЙ ЭЛЕМЕНТ ДЛЯ ОПРЕДЕЛЕНИЯ ПРОСТРАНСТВЕННОГО ПОЛОЖЕНИЯ, В ЧАСТНОСТИ ИМПЛАНТАТА | 2001 |
|
RU2234883C2 |
US 5202912 A, 13.04.1993. |
Авторы
Даты
2008-05-10—Публикация
2007-03-26—Подача