1. Область техники
Настоящее изобретение относится к цифровому сотовому телефону и, в частности, к цифровому сотовому телефону, имеющему возможность опознавания речи, и к способу управления этим телефоном.
2. Описание известного уровня техники
В общем, устройство опознавания речи выделяет такие характерные свойства, как частота, из входного речевого сигнала, чтобы опознать входящую речь. Такое устройство опознавания речи требует значительной обрабатывающей мощности, чтобы обрабатывать большой объем речевых сигналов. Требуемый объем обрабатывающей мощности будет излишне перегружать цифровой сотовый телефон обычного типа. Поэтому обычное устройство опознавания речи не соответствует цифровому сотовому телефону обычного типа.
Известный способ опознавания речи, применяемый для решения проблемы излишней перегрузки цифрового сотового телефона, использует автоматический комплект, выполняющий функцию опознавания речи. Автоматический комплект содержит процессор цифрового сигнала (ПЦС) и энергонезависимую память (например, флэш-память или ЭСППЗУ (электрически стираемое программируемое постоянное запоминающее устройство). ПЦС в автоматическом комплекте обрабатывает сжатый речевой сигнал или первоначальный речевой сигнал, чтобы опознать входящую речь, и направляет опознанный речевой сигнал в сотовый телефон. Таким образом автоматический комплект опознает речь для телефонного номера, произнесенного пользователем, и сотовый телефон набирает телефонный номер согласно опознанному речевому сигналу, направленному из автоматического комплекта.
Фиг. 1 изображает блок-схему обычного устройства опознавания речи, которое можно установить в автоматическом комплекте. Согласно этой иллюстрации, аналоговый входной сигнал из микрофона 30 преобразуют в цифровой сигнал ИКМ (импульсно-кодовой модуляции) посредством аналого-цифрового преобразователя 20 и направляют в процессор 10, который выполняет функцию опознавания речи. Процессор 10 может быть реализован в виде кристалла 80186 или кристалла ПЦС.
Это обычное устройство опознавания речи имеет следующие недостатки: 1) значительная нагрузка обработки, из-за которой это устройство становится непригодным для применения в цифровом сотовом телефоне; 2) требования по обработке устройства опознавания речи создают серьезную обработочную нагрузку для сотового телефона, и это может препятствовать работе сотового телефона; 3) для устройства опознавания речи требуется отдельное запоминающее устройство для выполнения функции опознавания речи. Поэтому для автоматического комплекта требуется отдельное энергонезависимое запоминающее устройство, такое как ЭСППЗУ; 4) для устройства опознавания речи требуется отдельный процессор, такой как ПЦС, для реализации функции опознавания речи; и 5) если устройство опознавания речи установлено в автоматическом комплекте, то опознавание речи можно осуществлять только с помощью автоматического комплекта. Поэтому без автоматического комплекта сотовый телефон не может опознавать речь.
Краткое описание сущности изобретения
В связи с вышеизложенным технической задачей настоящего изобретения является обеспечение цифрового сотового телефона с функцией опознавания речи, обладающего возможностью опознавания речевого сигнала с помощью имеющейся в нем аппаратуры, и способ управления этим телефоном.
Для реализации указанного объекта данное изобретение обеспечивает сотовый телефон с функцией опознавания речи и имеющий вокодер для сжатия речевого сигнала, поступающего из микрофона, в выходные пакетные данные. В сотовом телефоне энергонезависимое запоминающее устройство запоминает пакетные данные и соответствующие им характерные данные. Блок пользовательского интерфейса служит для выбора режима регистрации речи или режима опознавания речи и имеет соответствующие клавиши. Устройство опознавания речи выделяет характерные данные из пакетных данных, выходящих из вокодера, и сравнивает эти характерные данные с характерными данными, зарегистрированными в энергонезависимой памяти, для обнаружения зарегистрированных характерных данных, аналогичных входным характерным данным, и значения разницы между ними.
Микропроцессор запоминает пакетные данные и характерные данные в энергонезависимой памяти в режиме регистрации речи и принимает некоторый индекс для аналогичных характерных данных и значение разницы из устройства опознавания речи в режиме опознавания речи, чтобы определить, успешно ли произошло опознавание входного речевого сигнала.
Краткое описание чертежей
Указанные выше и другие задачи, признаки и преимущества данного изобретения станут более очевидными из следующего ниже подробного описания совместно с прилагаемыми чертежами, на которых:
фиг.1 - блок-схема обычного устройства опознавания речи;
фиг. 2 - блок-схема цифрового сотового телефона с функцией опознавания речи согласно осуществлению данного изобретения;
фиг. 3 - схема распределения памяти первого запоминающего устройства (60), изображенного на фиг.2; и
фиг. 4 - схема последовательности операций для регистрирования и опознавания речевого сигнала согласно осуществлению данного изобретения.
Подробное описание предпочтительных воплощений
Предпочтительное воплощение настоящего изобретения далее описывается подробно со ссылкой на сопровождающие чертежи. Для всестороннего понимания данного изобретения его описание здесь в качестве иллюстрации ограничивается конкретным осуществлением.
Нужно отметить, что данное изобретение может быть осуществлено любым специалистом данной области техники с помощью этого описания. В следующем ниже описании хорошо известные функции или конструкции, которые могут перегружать изложение данного изобретения ненужными подробностями, подробно не описываются. Например, на фиг.2 изображен цифровой сотовый телефон с функцией опознавания речи в соответствии с осуществлением данного изобретения. Радиочастотная (РЧ) схема и ДТМЧ (двухтональная многочастотная) схема могут быть включены в фиг. 2, но они не показаны, поскольку не относятся к сути данного изобретения.
Обращаясь к фиг.2: аналоговый речевой сигнал, входящий из микрофона 30, преобразуют в цифровой ИКМ-сигнал посредством аналого-цифрового преобразователя 20. Вокодер 45 сжимает ИКМ-сигнал, выходящий из аналого-цифрового преобразователя 20, и выводит пакетные данные РКТ. В сотовом телефоне МДКРК (множественный доступ с кодовым разделением каналов) вокодер 45 можно реализовать кодером "линейного предсказания на основе кода "Квэлкомм 8 кб/с"", таким же кодером 13 кб/с или кодером "усовершенствованного кодирования переменной скорости 8 кб/с". В сотовом телефоне GSM (глобальная система связи с подвижными объектами) вокодер 45 может быть реализован с помощью кодера "упорядоченного импульсного возбуждения с долгосрочным предсказанием".
Пакетные данные РКТ, выводимые из вокодера 45, прилагают к микропроцессору 50, который управляет всеми операциями сотового телефона. Первое запоминающее устройство 60, являющееся энергонезависимым запоминающим устройством (например, флэш-память или ЭСППЗУ), запоминает данные и компьютерные программы, включая программу управления и исходные служебные данные.
Второе запоминающее устройство 65 является запоминающим устройством с произвольной выборкой (ЗУПВ) для временного запоминания данных, включая пакетные данные для речевого сигнала, регистрируемого или опознаваемого, и различные данные, формируемые во время работы сотового телефона. Устройство опознавания речи 85 выделяет характерные данные из входных речевых сигналов и выводит характерные данные, предпочтительно на скорости передачи, составляющей от нескольких десятков до нескольких сотен байтов в секунду. Характерные данные содержат данные частоты и напряженности поля входного речевого сигнала.
Устройство опознавания речи 85 можно реализовать либо в аппаратуре, либо в средствах программного обеспечения. Если устройство опознавания речи 85 реализуют с помощью средств программного обеспечения, то программу для реализации устройства опознавания речи 85 можно запомнить в первом запоминающем устройстве 60. Микропроцессор 50 направляет пакетные данные РКТ, выведенные из вокодера 45, в устройство опознавания речи 85. Устройство опознавания речи формирует и выводит характерные данные в микропроцессор 50. Микропроцессор 50 выделяет эталонные характерные данные, ранее зарегистрированные или запомненные в первом запоминающем устройстве 60, и сравнивает их с характерными данными из устройства опознавания речи 85. На основании этого сравнения микропроцессор определяет и набирает телефонный номер, соответствующий выбранным эталонным характерным данным. Определение по этому сравнению предпочтительно основывается на значении разницы между этими двумя совокупностями характерных данных. Затем микропроцессор 50 запоминает пакетные данные, выводимые из вокодера 50, в специальной области памяти первого запоминающего устройства 60, и считывает их из первого запоминающего устройства 60, уведомляя пользователя о том, что опознавание речи завершено. Для удобства считанные пакетные данные называют данными воспроизведения речи ВР. Вокодер 45 преобразует данные воспроизведения речи ВР в ИКМ-сигнал и прилагает его к цифроаналоговому преобразователю 75, который преобразует входной ИКМ-сигнал в аналоговый сигнал, и выводит преобразованный аналоговый сигнал в громкоговоритель 80. Вместо данных воспроизведения речи ВР речевое сообщение, уведомляющее о завершении опознавания речи, можно также запомнить в первом запоминающем устройстве 60. Соединитель 500 автоматического комплекта соединяет автоматический комплект с сотовым телефоном для пересылки речевого сигнала, вводимого из микрофона автоматического комплекта, в вокодер 45 через аналого-цифровой преобразователь 20. Затем, после соединения с автоматическим комплектом, соединитель 500 автоматического комплекта прерывает тракт сигнала между микрофоном сотового телефона и вокодером 45.
Фиг. 3 изображает схему распределения памяти 60 согласно осуществлению данного изобретения. В соответствии с этим изображением, первое запоминающее устройство 60 разделяют на первую область памяти SA1 для управляющей программы, вторую область памяти SA2 для характерных данных, третью область памяти SA3 для данных воспроизведения речи, четвертую область памяти SA4 для телефонного номера и пятую область памяти для речевого сообщения. Ссылочное обозначение ADD обозначает адресный сигнал, вводимый из микропроцессора 50.
Фиг. 4 представляет схему последовательности операций регистрирования и опознавания речевого сигнала согласно осуществлению данного изобретения. Для того, чтобы набрать телефонный номер голосом, пользователь сотового телефона нажимает клавишу речевого набора на блоке пользовательского интерфейса. При обнаружении клавишных данных для речевого набора номера микропроцессор 50 введет режим опознавания речи на этапе 4а. После нажатия клавиши речевого набора номера пользователь нажмет клавишу регистрации речи для регистрации незарегистрированного имени в первом запоминающем устройстве 60 или нажмет на блоке пользовательского интерфейса клавишу опознавания речи, чтобы набрать голосом телефонный номер для зарегистрированного имени, с которым он желает соединиться. Затем микропроцессор 50 определяет на этапе 4b, какая именно из этих клавиш нажата пользователем. Если пользователь нажал клавишу регистрации речи, то микропроцессор 50 проверяет на этапе 4с, введены ли из вокодера 45 действительные пакетные данные для голоса пользователя. Если введены действительные пакетные данные, то микропроцессор 50 направляет входные пакетные данные в устройство опознавания речи 85 на этапе 4d и запоминает пакетные данные в третьей области памяти SA3 первого запоминающего устройства 60 в качестве данных воспроизведения речи ВР на этапе 4е. Затем микропроцессор 50 проверяет на этапе 4f, введены ли из устройства опознавания речи 85 характерные данные для входной речи. Если характерные данные введены, то микропроцессор 50 запоминает входные характерные данные во второй области памяти SA2 первого запоминающего устройства 60. Необходимо отметить, что последовательность этапов 4е и 4f может быть обращена, либо эти два этапа можно выполнять параллельно.
Если пользователь нажал клавишу опознавания речи на блоке пользовательского интерфейса на этапе 4b, то микропроцессор 50 проверяют на этапе 4h, введены ли из вокодера 45 действительные пакетные данные для голоса пользователя. Если действительные пакетные данные введены, то микропроцессор 50 направляет входные пакетные данные в устройство опознавания речи 85 на этапе 4i. После этого микропроцессор 50 проверяет на этапе 4j, введены ли характерные данные для входной речи из устройства опознавания речи 85. После приема характерных данных микропроцессор 50 временно запоминает их во втором запоминающем устройстве 65. Затем на этапе 4j микропроцессор 50 проверяет, введены ли из устройства опознавания речи 85 индекс для аналогичных характерных данных и значение разницы. Здесь индекс для аналогичных характерных данных обозначает индекс для характерных данных, зарегистрированных в первом запоминающем устройстве 60, которые аналогичны характерным данным для вводимой в данное время речи, а значение разницы обозначает значение разницы между зарегистрированными характерными данными и характерными данными из устройства опознавания речи 85. После приема индекса и значения разницы микропроцессор 50 на этапе 4k проверяет, имеет ли значение разницы величину, меньшую, чем пороговое значение, или оно находится в допустимом диапазоне ошибки. Если значение разницы меньше порогового значения, то микропроцессор 50 выводит данные воспроизведения речи в громкоговоритель 80 согласно индексу на этапе 41, тем самым решая, что входная речь опознана правильно. Но если значение разницы равно пороговому значению или превышает пороговое значение, то микропроцессор 50 считывает из пятой области памяти SA5 первого запоминающего устройства 60 речевое сообщение, уведомляющее о том, что входная речь не зарегистрирована в сотовом телефоне и направляет считанное сообщение речи в вокодер 45 на этапе 4m. Затем речевое сообщение, считанное из первого запоминающего устройства 60, обрабатывают вокодером 45, преобразуют в аналоговый сигнал цифроаналоговым преобразователем 75 и выводят в громкоговоритель 80.
При этом во время процесса регистрирования речи соответствующий телефонный номер также регистрируют в четвертой области памяти SA4 первого запоминающего устройства 60, в результате чего микропроцессор 50 может считывать и набирать зарегистрированный телефонный номер посредством схемы ДТИЧ (не изображена), когда пользователь вводит зарегистрированную речь.
Предпочтительно устройство опознавания речи 85 может выделять две или более совокупностей характерных данных для одного и того же голоса и запоминать их во второй области памяти SA2 первого запоминающего устройства 60, что повышает надежность функции опознавания речи.
Как указывалось выше, сотовый телефон данного изобретения применяет пакетные данные, выводимые из вокодера, в результате чего он может посредством простой операции опознавать речь. Сотовый телефон использует встроенный вокодер и запоминающее устройство для опознавания речи. Сотовый телефон предпочтительно имеет интегрированные возможности опознавания речи, которые можно компактно выполнить. Внешний автоматический комплект можно по усмотрению установить внутри телефона.
Несмотря на то, что данное изобретение описывается со ссылкой на считающееся сейчас наиболее практическим и предпочтительным осуществление, подразумевается, что оно не ограничивается раскрываемым здесь осуществлением и может включать в себя различные изменения в рамках формулы изобретения.
Изобретение относится к цифровому сотовому телефону и, в частности, к цифровому сотовому телефону, имеющему возможность опознавания речи, и к способу управления этим телефоном. Цифровой сотовый телефон содержит вокодер, который сжимает речевой сигнал, поступающий из микрофона, в выходные пакетные данные и соответствующие им характерные данные. Устройство опознавания речи выделяет характерные данные из пакетных данных, выводимых из вокодера, и сравнивает эти характерные данные с характерными данными, зарегистрированными в энергонезависимой памяти, для обнаружения зарегистрированных характерных данных, аналогичных входным характерным данным, и значения разницы между ними, чтобы определить, произошло ли успешное опознавание входного речевого сигнала, в зависимости от этого значения разницы. Технический результат, достигаемый при реализации изобретения, состоит в том, что сотовый телефон имеет интегральные возможности опознавания речи. 2 с. и 11 з.п.ф-лы, 4 ил.
МНОГОРЕЖИМНОЕ УСТРОЙСТВО РАДИОСВЯЗИ И МНОГОРЕЖИМНЫЙ СОТОВЫЙ РАДИОТЕЛЕФОН | 1993 |
|
RU2128886C1 |
US 5450525 A, 12.09.1995 | |||
Бесколесный шариковый ход для железнодорожных вагонов | 1917 |
|
SU97A1 |
Авторы
Даты
2003-02-27—Публикация
1998-07-04—Подача