УСТРОЙСТВО ОТОБРАЖЕНИЯ, УСТРОЙСТВО ЗАХВАТА РЕЧИ И СООТВЕТСТВУЮЩИЙ СПОСОБ РАСПОЗНАВАНИЯ РЕЧИ Российский патент 2019 года по МПК G06F3/01 G10L15/30 G10L21/06 H04L12/00 H04N21/00 

Описание патента на изобретение RU2677396C2

ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ

Устройства и способы согласно примерным вариантам осуществления относятся к устройству отображения, устройству захвата речи и способу распознавания речи и, более конкретно, к устройству отображения, устройству захвата речи и соответствующему способу распознавания речи, в котором распознается речь пользователя.

УРОВЕНЬ ТЕХНИКИ

Функция распознавания речи используется в различных электронных устройствах, таких как цифровой телевизор (TV), кондиционер воздуха, домашний кинотеатр, персональный компьютер (ПК), и мобильный телефон и т.д.

Для выполнения функции распознавания речи основное устройство, такое как телевизор, должно иметь микрофон для приема речи пользователя и механизм распознавания речи для распознавания входной речи, и механизм распознавания речи может сравнивать входную речь с сохраненными командными словами-кандидатами и распознавать речь в соответствии с результатом сравнения.

СУЩНОСТЬ ИЗОБРЕТЕНИЯ

ТЕХНИЧЕСКАЯ ПРОБЛЕМА

Однако электронное устройство, которое относится к уровню техники и которое имеет функцию распознавания речи, имеет фиксированное средство для приема речи пользователя и, таким образом, трудно использовать различные средства ввода, такие как мобильный телефон с вводом речи. Кроме этого, если предусмотрены многочисленные командные слова-кандидаты, скорость распознавания следовало бы увеличить, но электронное устройство должно сравнивать командные слова-кандидаты, что приводит к более низкой скорости обработки при распознавании речи. Кроме этого, так как объем памяти основного устройства является ограниченным, число командных слов-кандидатов нельзя постоянно увеличивать.

РЕШЕНИЕ ПРОБЛЕМЫ

Согласно аспекту примерного варианта осуществления выполнено устройство отображения, включающее в себя: блок отображения, на экране которого отображается изображение; блок связи, который осуществляет связь с множеством внешних устройств; и контроллер, который включает в себя механизм распознавания речи для распознавания речи пользователя, принимает речевой сигнал из блока захвата речи и управляет блоком связи для приема командных слов-кандидатов из по меньшей мере одного из множества внешних устройств с целью распознавания принятого речевого сигнала.

Может быть обеспечено множество блоков захвата речи. Если в по меньшей мере одном из множества блоков захвата речи обнаружен ввод речи, контроллер может принять речевой сигнал из блока захвата речи, в котором обнаружен ввод речи.

Блок захвата речи может включать в себя по меньшей мере одно из следующего: встроенный микрофон, выполненный в устройстве отображения, первый внешний микрофон, выполненный в по меньшей мере одном из множества внешних устройств, и второй внешний микрофон, который отличается от встроенного микрофона и первого внешнего микрофона.

Внешнее устройство может включать в себя по меньшей мере одно приложение, которое может управлять командными словами-кандидатами.

Устройство отображения может дополнительно включать в себя собственное приложение, которое управляет командными словами-кандидатами.

Устройство отображения может дополнительно включать в себя блок памяти, который хранит принятые командные слова-кандидаты, и средство распознавания речи может распознавать принятую речь с помощью сохраненных командных слов-кандидатов.

Если по меньшей мере один из множества блоков захвата речи обнаруживает ключевое слово пробуждения, контроллер может включить блок захвата речи, который обнаруживает ключевое слово пробуждения, и получить речевой сигнал из активированного блока захвата речи.

Если сигнал запуска вводится путем манипулирования предварительно определенной кнопкой, которое выполняется в одном из множества блоков захвата речи, контроллер может включить блок захвата речи, с помощью которого вводится сигнал запуска, и принять речевой сигнал из активированного блока захвата речи.

Контроллер может управлять блоком отображения для отображения на нем результатов распознавания речи для речевого сигнала и командных слов-кандидатов, соответствующих результатам распознавания речи.

Блок отображения может отображать информацию относительно приложения, которое управляет командными словами-кандидатами.

Механизм распознавания речи может распознавать речь путем принятия решения относительно того, что командное слово идентично или аналогично принятому речевому сигналу среди принятых командных слов-кандидатов.

Согласно аспекту другого примерного варианта осуществления выполнено устройство захвата речи, включающее в себя: блок связи, который осуществляет связь с устройством отображения, имеющим функцию распознавания речи; блок захвата речи, который принимает речь пользователя; преобразователь речи, который преобразует принятую речь в электрический речевой сигнал; и контроллер, который управляет блоком связи таким образом, чтобы передавать преобразованный речевой сигнал и командные слова-кандидаты в устройство отображения для распознавания речевого сигнала.

Устройство захвата речи может дополнительно включать в себя по меньшей мере одно приложение, которое может управлять командными словами-кандидатами.

Согласно аспекту другого примерного варианта осуществления выполнен способ распознавания речи для устройства отображения, включающий в себя этапы, на которых: принимают речевой сигнал из блока захвата речи; принимают командные слова-кандидаты из по меньшей мере одного из множества внешних устройств для распознавания принятого речевого сигнала; и распознают речь пользователя в соответствии с принятым речевым сигналом и командными словами-кандидатами.

Способ распознавания речи может дополнительно включать в себя обнаружение ввода речи в по меньшей мере одном из множества блоков захвата речи, и прием речевого сигнала может включать в себя прием речевого сигнала из блока захвата речи, в котором обнаружен ввод речи.

Блок захвата речи может включать в себя по меньшей мере одно из встроенного микрофона, выполненного в устройстве отображения, первого внешнего микрофона, выполненного в по меньшей мере одном из множества внешних устройств, и второго внешнего микрофона, выполненного в устройстве, которое отличается от устройства отображения и множества внешних устройств.

Внешнее устройство может включать в себя по меньшей мере одно приложение, которое управляет командными словами-кандидатами.

Устройство отображения может включать в себя собственное приложение, которое управляет командными словами-кандидатами.

Способ распознавания речи может дополнительно включать в себя хранение принятых командных слов-кандидатов, и распознавание речи может включать в себя распознавание речи с помощью сохраненных командных слов-кандидатов.

Обнаружение ввода речи может включать в себя обнаружение ключевого слова пробуждения для одного из множества блоков захвата речи и активацию блока захвата речи, который обнаруживает ключевое слово пробуждения.

Обнаружение ввода речи может включать в себя обнаружение входного сигнала запуска в соответствии с манипулированием заданной кнопкой, выполненной в одном из множества блоков захвата речи, и активацию блока захвата речи, с помощью которого вводится сигнал запуска.

Способ распознавания речи может дополнительно включать в себя отображение результатов распознавания речи для речевого сигнала и командные слова-кандидаты, соответствующие результатам распознавания речи.

Отображение может включать в себя отображение информации о приложении, которое управляет командными словами-кандидатами.

Распознавание речи может включать в себя распознавание речи путем принятия решения относительно того, что командное слово идентично или аналогично принятому речевому сигналу среди принятых командных слов-кандидатов.

ПОЛОЖИТЕЛЬНЫЕ ЭФФЕКТЫ ИЗОБРЕТЕНИЯ

Когда основное устройство согласно примерному варианту осуществления обнаруживает ввод речи с помощью различных устройств, которые принимают речь пользователя, можно использовать различные устройства захвата речи, и с помощью устройств захвата речи можно выполнить связанные с этим услуги.

Командные слова-кандидаты для распознавания речи передаются с помощью множества приложений и затем регистрируются/удаляются. Таким образом, командные слова-кандидаты основного устройства не увеличиваются излишним образом, можно предотвратить задержку в скорости обработки или снижение скорости распознавания, и можно повысить общую эффективность системы распознавания речи.

Результаты распознавания речи, командные слова-кандидаты, информация о приложении, а также информация о различных устройствах захвата речи и устройствах, обеспечивающих командные слова-кандидаты, используемых для распознавания речи, легче распознаются пользователем, и повышается удобство использования.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

Вышеуказанные и/или другие аспекты станут ясными и более понятными из последующего описания примерных вариантов осуществления со ссылкой на прилагаемые чертежи, на которых:

фиг. 1 иллюстрирует пример системы распознавания речи согласно примерному варианту осуществления;

фиг. 2 - блок-схема системы распознавания речи согласно примерному варианту осуществления;

фиг. 3 иллюстрирует пример выполнения распознавания речи согласно примерному варианту осуществления;

фиг. 4 иллюстрирует пример экрана, который отображается в результате распознавания речи (фиг. 3);

фиг. 5 иллюстрирует пример выполнения распознавания речи согласно другому примерному варианту осуществления изобретения;

фиг. 6 - блок-схема, иллюстрирующая способ распознавания речи системы распознавания речи согласно примерному варианту осуществления;

фиг. 7 - блок-схема, показывающая подробности процесса обнаружения ввода речи, показанного на фиг. 6; и

фиг. 8 - блок-схема, показывающая подробности процесса выполнения распознавания речи, показанного на фиг. 6.

ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ

Ниже, со ссылкой на прилагаемые чертежи, будут подробно описаны примерные варианты осуществления. Примерные варианты осуществления можно осуществить в различных формах без ограничения на примерные варианты осуществления, изложенные в данном документе. Для ясности описание известных частей опущено, и одинаковые ссылочные позиции относятся к одинаковым элементам на протяжении всего описания.

Фиг. 1 иллюстрирует пример системы распознавания речи согласно примерному варианту осуществления.

Как показано на фиг. 1, система распознавания речи включает в себя основное устройство 100, множество устройств 201 и 202 захвата речи и множество внешних устройств 301, 302 и 303. Основное устройство 100, множество устройств 201 и 202 захвата речи и множество внешних устройств 301, 302 и 303 соединены друг с другом для осуществления связи между собой.

Основное устройство 100 включает в себя блок 140 захвата речи, такой как микрофон для приема речи пользователя, и механизм 181 распознавания речи для распознавания входной речи и осуществления связи с множеством устройств 201 и 202 захвата речи и множеством внешних устройств 301, 302 и 303 через блок связи 160. Основное устройство 100 дополнительно включает в себя собственные приложения 171 и 172, которые приводятся в действие для основного устройства 100 с целью выполнения различных функций (услуг). Собственные приложения 171 и 172 сохраняют заранее в нем командные слова-кандидаты, соответствующие функциям. То есть, собственные приложения 171 и 172 включены в имеющийся сценарий услуг. Командные слова-кандидаты, хранящиеся в собственных приложениях 171 и 172, передаются в процессор 181 для распознавания речи в момент распознавания речи с тем, чтобы активировать механизм 181 распознавания речи для выполнения распознавания речи.

Каждое из множества устройств 201 и 202 захвата речи может включать в себя блок захвата речи, такой как микрофон для приема речи пользователя, и речевой сигнал, соответствующий принятой речи, передается в основное устройство 100 для распознавания речи.

Множество устройств 201 и 202 захвата речи может принимать речь пользователя, преобразовывать речь в электрический речевой сигнал и передавать электрический речевой сигнал в основное устройство 100. Множество устройств 201 и 202 захвата речи может выполнять беспроводную связь с основным устройством 100. Хотя вышеизложенное не ограничивается этим, беспроводная связь включает в себя беспроводную ЛВС, радиочастотную (РЧ) связь, Bluetooth, Zigbee, инфракрасную (ИК) связь и т.д.

Множество внешних устройств 301, 302 и 303 может включать в себя по меньшей мере одно приложение (которое в дальнейшем будет также называться как приложение для устройства) для выполнения функций (услуг) по мере необходимости. Приложение для устройства сохраняет заранее в них командные слова-кандидаты, соответствующие функциям, которые выполняют внешние устройств 301, 302 и 303. Команды командных слов-кандидатов, которые хранятся в приложении для устройства, передаются в механизм 181 распознавания речи в момент распознавания речи для активации механизма 181 распознавания речи с целью выполнения распознавания речи.

Командные слова-кандидаты, которые хранятся в собственных приложениях 171 и 172 или сохранены заранее в приложении для устройства, могут представлять собой командные слова, которые относятся к функциям/операциям приложений. Например, если основное устройство 100 представляет собой телевизор, командные слова-кандидаты, которые относятся к переключению канала, регулировке громкости и т.д. телевизора, можно сохранить в одном из собственных приложений 171 и 172. Если внешнее устройство 302 представляет собой кондиционер воздуха, командные слова-кандидаты, которые относятся к регулировке температуры (вверх/вниз), регулировке интенсивности потока воздуха (сильный/слабый/умеренный) и т.д. кондиционера воздуха, можно сохранить в приложении, включенном во внешнее устройство 302.

Внешнее устройство или устройство захвата речи может включать в себя как блок захвата речи, так и приложение для устройства. В этом случае, если речь вводится в блок захвата речи в первом внешнем устройстве 301, командные слова-кандидаты, которые сохранены заранее в приложении для устройства первого внешнего устройства 301, передаются в механизм 181 распознавания речи основного устройства 100 для выполнения распознавания речи.

Система распознавания речи согласно примерному варианту осуществления включает в себя по меньшей мере один блок захвата речи. Если обнаружен ввод речи для блока захвата речи, то система распознавания речи принимает речевой поток путем активации блока захвата речи, в котором был обнаружен ввод речи. Если обеспечено множество блоков захвата речи, то система распознавания речи может принимать речевой поток путем активации блока захвата речи, в котором был обнаружен ввод речи, среди множества блоков захвата речи. Множество блоков захвата речи может включать в себя встроенный микрофон, выполненный в основном устройстве 100, первый внешний микрофон, выполненный в по меньшей мере одном из множества внешних устройств 301, 302 и 303, и второй внешний микрофон, выполненный в устройствах 201 и 202 захвата речи, которые отличаются от основного устройства 100 и множества внешних устройств 301, 302 и 303. Устройства 201 и 202 захвата речи расположены отдельно от основного устройства 100 и множества внешних устройств 301, 302 и 303.

Если по меньшей мере один из множества блоков захвата речи обнаруживает ключевое слово пробуждения, основное устройство 100 может активировать блок захвата речи, с помощью которого обнаруживается ключевое слово пробуждения, и принять речевой сигнал из активированного блока захвата речи. Если сигнал запуска вводится путем манипулирования предварительно определенной кнопкой (например, при возникновении события) в по меньшей мере одном из множества блоков захвата речи, основное устройство 100 может включить блок захвата речи, с помощью которого вводится входной сигнал запуска и принимать речевой сигнал из активированного блока захвата речи.

Основное устройство 100 может работать в режиме распознавания речи. Если по меньшей мере один блок захвата речи активируется с помощью ключевого слова пробуждения или сигнала запуска, основное устройство 100 может выключить другие блоки захвата речи для предотвращения возникновения ошибки при распознавании речи. Основное устройство 100 может работать в режиме распознавания речи вблизи или на удалении. Основное устройство 100 может отображать пользовательский интерфейс (UI), показывающий блок захвата речи, соединенный с блоком 130 отображения (который будет описан ниже) для удобства пользователя.

Основное устройство 100 может принимать командные слова-кандидаты из по меньшей мере одного из множества внешних устройств 301, 302 и 303 для распознавания принятого речевого сигнала. Принятые командные слова-кандидаты могут быть переданы в механизм 181 распознавания речи для распознавания речи.

Множество внешних устройств 301, 302 и 303 включает в себя по меньшей мере одно приложение, которое управляет командными словами-кандидатами. Основное устройство 100 включает в себя собственные приложения 171 и 172, которые управляют командными словами-кандидатами. Командные слова-кандидаты, которыми управляют собственные приложения 171 и 172 можно передавать в механизм 181 распознавания речи для распознавания речи.

Основное устройство 100 можно реализовать в виде устройства отображения, такого как телевизор (ТВ), который показан на фиг. 2.

На фиг. 2 показана блок-схема системы распознавания речи согласно примерному варианту осуществления.

Устройство 100 отображения обрабатывает сигнал изображения, подаваемый из внешнего источника подачи изображения (не показан) для отображения изображения на основании обработанного сигнала изображения.

В системе распознавания речи согласно примерному варианту осуществления устройство 100 отображения реализовано в виде телевизора или телевизионной приставки, которая обрабатывает транслируемое изображение на основании транслируемых сигналов/транслируемой информации/транслируемых данных, которые передаются из вещательной станции. Однако следует понимать, что в одном или более других примерных вариантах осуществления устройство 100 отображения можно применять в различных других устройствах, которые обрабатывают и отображают изображение, в дополнение к телевизору или телевизионной приставке. Например, устройство 100 отображения может включать в себя персональный компьютер (ПК), портативный компьютер и т.д.

Кроме того, следует понимать, что тип изображения, который отображается с помощью устройства 100 отображения, не ограничивается транслируемым изображением. Например, устройство 100 отображения может отображать, например, видео, неподвижное изображение, приложения, экранное устройство отображения (OSD), графический пользовательский интерфейс (GUI) для управления различными операциями, основываясь на сигналах/данных, которые передаются с помощью различных источников, предоставляющих изображения (не показаны).

Согласно примерному варианту осуществления устройство 100 отображения можно реализовать в виде интеллектуального телевизора. Интеллектуальный телевизор может принимать и отображать транслируемый сигнал в реальном времени, иметь функцию веб-браузера для отображения транслируемого сигнала в реальном времени и осуществлять поиск различного контента через Интернет, и обеспечивать удобную среду для пользователя, чтобы выполнить вышеизложенное. Интеллектуальный телевизор может включать в себя программное обеспечение с открытой платформой для предоставления пользователю интерактивной услуги и может предоставлять пользователю различный контент через программное обеспечение с открытой платформой, например, приложение, предоставляющее предварительно определенную услугу. Приложение может предоставлять различные типы услуг, например, SNS, финансы, новости, погоду, карты, музыку, фильмы, игры, электронные книги и т.д.

Устройство 100 отображения включает в себя механизм 181 распознавания речи для распознавания речи пользователя. Команда, соответствующая распознанной речи, например, команда управления, передается в соответствующее приложении для выполнения операции. Если приложение, соответствующее команде управления, представляет собой одно из собственных приложений 171 и 172, устройство 100 отображения выполняет операцию в соответствии с командой управления с помощью приложения. Если приложение, соответствующее команде управления, представляет собой приложение для устройства, команда управления передается во внешние устройства 301, 302 и 303, включающее в себя приложение для устройства. Внешние устройства 301, 302 и 303 могут выполнять операцию в соответствии с командой управления с помощью приложения.

Обращаясь к фиг. 2, обеспечено множество устройств захвата речи, например, мобильный телефон 200 и пульт 300 дистанционного управления. Пульт 300 дистанционного управления может действовать как устройство захвата речи, так и внешнее устройство. Мобильный телефон 200 может представлять собой смартфон, имеющий функцию захвата речи.

Пульт 300 дистанционного управления может передавать предварительно установленную команду (команда управления) в соответствующее устройство посредством манипуляции пользователя. Пульт 300 дистанционного управления можно установить для передачи команды в устройство 100 отображения или во внешнее устройство, и можно реализовать в виде встроенного пульта дистанционного управления, передающего команду в множество устройств. Пульт 300 дистанционного управления может включать в себя пульт дистанционного управления телевизором и/или пульт дистанционного управления кондиционером воздуха.

Устройство захвата речи можно реализовать в виде различных устройств, которые принимают речь пользователя, например, мобильный телефон, микрофон-передатчик и т.д.

Как показано на фиг. 2, выполнено множество внешних устройств, например, пульт 300 дистанционного управления и кондиционер 400 воздуха. Как описано выше, пульт 300 дистанционного управления может действовать как устройство захвата речи, так и внешнее устройство.

Хотя фиг. 2 иллюстрирует внешние устройства с пультом 300 дистанционного управления и кондиционер 400 воздуха, примерный вариант осуществления не ограничивается этим. Например, внешние устройства можно реализовать в виде других различных электронных устройств, которые выполняют беспроводную связь, например, в виде домашнего кинотеатра, радиоприемника, видеомагнитофона, DVD-плеера, стиральной машины, холодильника, робота-пылесоса и т.д. Если внешние устройства включают в себя блок захвата речи, такой как микрофон, внешнее устройство может также действовать как устройство захвата речи.

Внешние устройства согласно примерному варианту осуществления включают в себя приложения 372 и 472, соответственно для выполнения функции. Приложения 372 и 472 сохраняют заранее командные слова-кандидаты и управляют командными словами-кандидатами. Командные слова-кандидаты могут быть переданы в устройство 100 отображения для распознавания речи.

Внешние устройства, то есть пульт 300 дистанционного управления и кондиционер 400 воздуха, могут выполнять операции, соответствующие команде управления, переданной с помощью устройства 100 отображения согласно с результату распознавания речи.

Далее, со ссылкой на фиг. 2, будет подробно описан каждый элемент системы распознавания речи.

Устройство 100 отображения может включать в себя приемник 110 изображения, который принимает сигнал изображения, процессор 120 для обработки изображения, который обрабатывает сигнал изображения, принятый из приемника 110 изображения, блок 130 отображения, который отображает изображение на основании сигнала изображения, обработанного с помощью процессора 120 для обработки изображения, первый блок 140 захвата речи, который принимает речь пользователя, первый преобразователь 150 речи, который преобразует принятую речь в электрический речевой сигнал, первый блок 160 связи, который осуществляет связь с внешним устройством, первый блок 170 памяти, который хранит различные данные, и первый контроллер 180, который управляет устройством 100 отображения.

Приемник 110 изображения принимает сигнал изображения и передает сигнал изображения в процессор 120 для обработки изображения. Например, приемник 110 изображений может принимать радиочастотный (РЧ) сигнал беспроводным образом из вещательной станции (не показана) или принимать сигнал изображения проводным образом в соответствии со стандартами, такими как композитное видео, компонентное видео, супер видео, SCART (S yndicat des C onstructeurs d' A ppareils R adiorecpteurs et T eleviseurs - Ассоциация производителей радио- и телевизионных приемников), мультимедийный интерфейс высокой четкости (HDMI) и т.д. Если сигнал изображения включает в себя транслируемый сигнал, приемник 110 изображения включает в себя тюнер для настройки транслируемого сигнала на канал.

Сигнал изображения можно принимать из внешнего устройства, например, ПК, аудиовизуального устройства, смартфона, планшетного компьютера и т.д. Сигнала изображения может представлять собой данные, передаваемые через сеть, такую как Интернет. В этом случае устройство 100 отображения может выполнять передачу данных по сети через первый блок 160 связи и может включать в себя дополнительный блок сетевой связи. Альтернативно, сигнал изображения может представлять собой данные, которые хранятся в первом блоке 170 памяти, например, на флэш-памяти, жестком диске (HDD) и т.д. Первый блок 170 памяти можно выполнить внутри или снаружи устройства 100 отображения. Если первый блок 170 памяти выполнен снаружи устройства 100 отображения, устройство 100 отображения может включать в себя соединитель (не показан), к которому подсоединяется первый блок 170 памяти.

Процессор 120 для обработки изображения выполняет различные операции по обработке изображения по отношению к сигналу изображения и выводит обработанный сигнал изображения в блок 130 отображения.

Операции обработки изображения процессора 120 для обработки изображения могут включать в себя, но не ограничиваться этим, операцию декодирования, соответствующую различным форматам изображения, операцию деперемежения, преобразование скорости обновления кадров, операцию масштабирования, операцию уменьшения шума для повышения качества изображения, операцию выделения деталей, операцию строчной развертки и т.д. Процессор 120 для обработки изображения можно реализовать в виде отдельных групп, которые независимым образом выполняют вышеизложенные операции, или в виде системы на кристалле (SoC), которая выполняет объединенные функции.

Блок 130 отображения отображает изображение на основании сигнала изображения, обработанного с помощью процессора 120 для обработки изображения. Блок 130 отображения может включать в себя, но не ограничиваться этим, жидкокристаллический дисплей (LCD), плазменную панель отображения (PDP), светодиодный дисплей (LED), дисплей на органических светодиодах (OLED), дисплей с поверхностной эмиссией электронов, дисплей на основе углеродных нанотрубок, дисплей на основе нанокристаллов и т.д.

Блок 130 отображения может включать в себя дополнительные элементы в зависимости от их типа варианта осуществления. Например, блок 130 отображения типа LCD включает в себя панель LCD (не показана), блок подсветки (не показан), излучающий свет на панель LCD, и подложку для возбуждения панели (не показана) для возбуждения панели LCD.

Блок 130 отображения может отображать результаты распознавания речи в виде информации относительно распознанной речи. Результаты распознавания речи можно отображать в различном виде, таком как текст, графика, иконки и т.д. Тексты включают в себя знаки и цифры. Блок 130 отображения может дополнительно отображать командные слова-кандидаты в соответствии с результатами распознавания речи и информацией о приложении. Более подробно это будет описано ниже со ссылкой на фиг. 4.

Пользователь может проверить, правильно ли распознана речь, основываясь на результатах распознавания речи, отображаемых на устройстве 130 отображения. Пользователь может манипулировать блоком 330 пользовательского ввода на пульте 300 дистанционного управления, чтобы выбрать командное слово, соответствующее речи пользователя из отображаемых командных слов-кандидатов, или может выбрать и проверить информацию, которая относится к результатам распознавания речи.

Первый блок 140 захвата речи принимает речь пользователя, и можно реализовать в виде микрофона.

Первый преобразователь 150 речи преобразует ввод речи из первого блока 140 захвата речи в электрический речевой сигнал. Преобразованный речевой сигнал может представлять собой сигнал с импульсно-кодовой модуляцией (ИКМ) или сжатый аудиосигнал. Первый преобразователь 150 речи можно реализовать в виде аналого-цифрового преобразователя, который преобразует речь пользователя в цифровую форму.

Если первый блок 140 захвата речи представляет собой цифровой микрофон, то не требуется дополнительного аналого-цифрового преобразования. В этом случае первый блок 140 захвата речи может включать в себя первый преобразователь 150 речи.

Первый блок 160 связи осуществляет связь с устройством захвата речи и внешним устройством, то есть с мобильным телефоном 200, пультом 300 дистанционного управления и кондиционером 400 воздуха. Первый блок 160 связи может осуществлять беспроводную связь, которая включает в себя по меньшей мере одно из инфракрасной связи, РЧ-связи, ZigBee и Bluetooth.

Первый блок 170 памяти сохраняет данные под управлением первого контроллера 180. Первый блок 170 памяти реализован в виде энергонезависимого носителя информации, такого как флэш-память, жесткий диск (HDD) и т.д. Доступ к первому блоку 170 памяти осуществляется с помощью первого контроллера 180, который считывает, записывает, модифицирует, удаляет или обновляет данные.

Данные, которые хранятся в первом блоке 170 памяти, включают в себя, например, операционную систему (ОС) для приведения в действие устройства 100 отображения, различные приложения, исполняемые ОС, данные изображения и дополнительные данные и т.д.

Первый блок 170 памяти может хранить различные данные для распознавания речи пользователя. Например, первый блок 170 памяти может хранить таблицу 171 командных слов, включающую в себя командные слова-кандидаты (которые в дальнейшем будут также называться как группа командных слов-кандидатов) в качестве информации распознанной речи, соответствующей принятому речевому сигналу. Управление командными словами-кандидатами в таблице 171 командных слов может осуществляться с помощью соответствующего приложения.

Первый блок 170 памяти может дополнительно хранить по меньшей мере одно приложение, например, первое и второе приложения 172 и 173 для выполнения функций устройства 100 отображения. Первое и второе приложения 172 и 173 приводятся в действие под управлением первого контроллера 180 (который будет описан позже) и выполняют различные функции устройства 100 отображения. Хотя фиг. 2 иллюстрирует устройство 100 отображения, в котором установлено два приложения 172 и 173, примерные варианты осуществления не ограничиваются ими. То есть в устройстве 100 отображения можно установить три или более приложений.

Первое и второе приложения 172 и 173 могут управлять командными словами-кандидатами в соответствии с выполняемыми функциями. Командные слова-кандидаты, которые управляются с помощью первого и второго приложений 172 и 173, могут быть зарегистрированы в или удалены из таблицы 171 командных слов.

Если командные слова-кандидаты зарегистрированы в таблице 171 командных слов, механизм 181 распознавания речи выполняет распознавание речи с использованием командных слов-кандидатов в таблице 171 командных слов.

Командные слова-кандидаты, которые можно зарегистрировать в или удалить из таблицы 171 командных слов, могут включать в себя командные слова-кандидаты, управляемые третьим приложением 372 пульта 300 дистанционного управления (будет описано позже), и командные слова-кандидаты, управляемые четвертым приложением 472 кондиционера 400 воздуха.

Первый контроллер 180 управляет различными элементами устройства 100 отображения. Например, первый контроллер 180 управляет процессором 120 для обработки изображения для обработки сигнала изображения и выполняет операцию управления в ответ на команду с пульта 300 дистанционного управления для управления всеми операциями устройства 100 отображения.

Первый контроллер 180 можно реализовать, например, в виде центрального процессорного устройства (CPU) совместно с программным обеспечением.

Первый контроллер 180 может включать в себя блок 181 распознавания речи для распознавания речи пользователя. Функция распознавания речи механизма 181 распознавания речи может быть выполнена с помощью известного алгоритма распознавания речи. Например, механизм 181 распознавания речи извлекает характеристический вектор речи речевого сигнала и сравнивает извлеченный характеристический вектор речи с командными словами-кандидатами, хранящимися в таблице 171 командных слов первого блока 170 памяти, для распознавания речи. В случае отсутствия командных слов-кандидатов, хранящихся в таблице 171 командных слов, которая идентична характеристическому вектору речи, механизм 181 распознавания речи может распознать речь путем корректировки результатов распознавания речи в сторону наиболее близкого командного слова. В случае наличия множества аналогичных командных слов-кандидатов, первый контроллер 180 может отображать множество командных слов-кандидатов на блоке 130 отображения для пользователя для выбора одного из множества командных слов-кандидатов.

Механизм 181 распознавания речи согласно примерному варианту осуществления реализован в виде встроенного механизма 181 распознавания речи, выполненного в процессоре, хотя этим не ограничивается. Например, механизм 181 распознавания речи можно реализовать в виде устройства, выполненного в устройстве 100 отображения отдельно от CPU, т.е. реализованного в виде дополнительного чипа, такого как микрокомпьютер.

Примерный вариант осуществления включает в себя механизм 181 распознавания речи, который обеспечен на сервере (который в дальнейшем будет упоминаться как "облачный сервер" (не показан)), который находится отдельно от устройства 100 отображения, хотя этим не ограничивается. Облачный сервер осуществляет связь с устройством 100 отображения по сети, такой как Интернет. Сеть может быть проводной или беспроводной сетью. В этом случае механизм 181 распознавания речи можно реализовать в виде встроенного механизма распознавания речи, выполненного в CPU облачного сервера или в виде устройства, выполненного в облачном сервере отдельно от CPU, т.е., в виде дополнительного чипа, такого как микрокомпьютер.

Первый контроллер 180 может выполнять операцию в соответствии с результатом распознавания механизма 181 распознавания речи. Например, если устройство 100 отображения представляет собой телевизор, или пользователь смотрит фильм или новости, механизм 181 распознавания речи может распознать речь, такую как "увеличить громкость", "уменьшить громкость", "громче", "тише" и т.д., и первый контроллер 180 может регулировать громкость фильма или новостей в зависимости от речи.

Если механизм 181 распознавания речи распознает речь для управления внешним устройством, таким как пульт 300 дистанционного управления или кондиционер 400 воздуха, первый контроллер 180 может управлять первым блоком 160 связи с целью передачи команды управления во внешнее устройство в соответствии с распознанной речью. Например, если механизм 181 распознавания речи распознает речь "увеличить температуру", то первый контроллер 180 может распознать, что речь предназначена для управления кондиционером 400 воздуха, и управлять первым блоком 160 связи с целью передачи команды в кондиционер 400 воздуха увеличить температуру на выходе кондиционера 400 воздуха.

Далее будет описана подробная конфигурация мобильного телефона 200.

Как показано на фиг. 2, мобильный телефон 200 может включать в себя второй блок 240 захвата речи, который принимает речь пользователя, второй преобразователь 250 речи, который преобразует принятую речь в электрический речевой сигнал, второй блок 260 связи, который осуществляет связь с внешней средой, второй блок 270 памяти, который хранит данные, и второй контроллер 280, который управляет мобильным телефоном 200.

Второй блок 240 захвата речи, который принимает речь пользователя, можно реализовать в виде микрофона. Второй преобразователь 250 речи преобразует принятую речь в электрический речевой сигнал. Преобразованный речевой сигнал может представлять собой сигнал с импульсно-кодовой модуляцией (ИКМ) или сжатый аудиосигнал. Второй преобразователь 250 речи может быть реализован в виде аналогового/цифрового преобразователя, который преобразует входную речь пользователя в цифровую форму.

Если второй блок 240 захвата речи представляет собой цифровой микрофон, то не требуется дополнительного аналого-цифрового преобразования. В этом случае второй блок 240 захвата речи может включать в себя второй преобразователь 240 речи.

Второй блок 260 связи, который осуществляет связь с устройством 100 отображения, может осуществлять проводную или беспроводную связь. Беспроводная связь может включать в себя по меньшей мере одно из РЧ-связь, ZigBee и Bluetooth.

Второй блок 260 связи может передавать речевой сигнал из второго преобразователя 250 речи в устройство 100 отображения.

Второй блок 270 памяти может хранить данные под управление второго контроллера 280. Второй блок 270 памяти реализован в виде энергонезависимого носителя информации, такого как флэш-память. Доступ ко второму блоку 270 памяти осуществляется с помощью второго контроллера 280, который считывает, записывает, модифицирует, удаляет или обновляет данные.

Данные, хранящиеся во втором блоке 270 памяти, могут включать в себя, например, ОС для приведения в действие мобильного телефона 200, различные приложения, исполняемые ОС, данные изображения, дополнительные данные и т.д.

Второй контроллер 280 может управлять различными элементами мобильного телефона 200. Например, второй контроллер 280 может вырабатывать команду в ответ на манипуляцию пользователя, выполнять операцию, соответствующую выработанной команде, и отображать результат на экране блока отображения (не показан).

Второй контроллер 280 может быть реализован в виде блока микроконтроллера (MCU) совместно с программным обеспечением.

Если речь пользователя вводится через второй блок 240 захвата речи, второй контроллер 280 управляет вторым преобразователем 250 речи для преобразования речи пользователя в электрический речевой сигнал и управляет вторым блоком 260 связи для передачи преобразованного речевого сигнала в устройство 100 отображения.

Далее будет подробно описана конфигурация пульта 300 дистанционного управления.

Как показано на фиг. 2, пульт 300 дистанционного управления, в виде устройства захвата речи и внешнего устройства, может включать в себя блок 330 ввода пользователя, который принимает манипуляцию пользователя, третий блок 340 захвата речи, который принимает речь пользователя, третий преобразователь 350 речи, который преобразует принятую речь в электрический речевой сигнал, третий блок 360 связи, который осуществляет связь с внешней средой, второй блок 370 памяти, который хранит данные, и третий контроллер 280, который управляет пультом 300 дистанционного управления.

Блок 330 ввода пользователя может передавать различные команды управления или информацию в третий контроллер 380 путем манипуляции и ввода пользователя. Блок 330 ввода пользователя можно реализовать в виде кнопки меню, цифровой кнопки и т.д., выполненной в пульте 300 дистанционного управления. Если пульт 300 дистанционного управления представляет собой пульт дистанционного управления телевизора, блок 330 ввода пользователя может включать в себя сенсорный датчик, который принимает сенсорный ввод пользователя и/или датчик движения для восприятия движения пульта 300 дистанционного управления.

Третий блок 340 захвата речи, который принимает речь пользователя, можно реализовать в виде микрофона.

Третий преобразователь 350 речи преобразует речь, введенную с помощью третьего блока 340 захвата речи, в электрический речевой сигнал. Преобразованный речевой сигнал может представлять собой сигнал с импульсно-кодовой модуляцией (ИКМ) или сжатый аудиосигнал. Третий преобразователь 350 речи можно реализовать в виде аналого-цифрового преобразователя, который преобразует вводимую речь пользователя в цифровую форму.

Если третий блок 340 захвата речи представляет собой цифровой микрофон, не требуется дополнительного аналого-цифрового преобразования. В этом случае третий блок 340 захвата речи может включать в себя третий преобразователь 350 речи.

Третий блок 360 связи осуществляет связь с устройством 100 отображения. Третий блок 360 связи выполняет беспроводную связь. Беспроводная связь включает в себя по меньшей мере одно из РЧ-связи, ZigBee и Bluetooth.

Третий блок 360 связи передает речевой сигнал из третьего преобразователя 350 речи и командные слова-кандидаты под управлением третьего приложения 372 третьего блока 370 памяти (который будет описан позже) в устройстве 100 отображения.

Третий блок 370 памяти, который хранит данные под управлением третьего контроллера 380, можно реализовать в виде энергонезависимого носителя информации, такого как флэш-память и т.д. Доступ к третьему блоку 370 памяти осуществляется с помощью третьего контроллера 380, который считывает, записывает, модифицирует, удаляет или обновляет данные.

Данные, хранящиеся в третьем блоке 370 памяти, могут включать в себя, например, ОС для приведения в действие пульта 300 дистанционного управления, различные приложения, исполняемые OС, данные изображения, дополнительные данные и т.д.

Третий блок 370 памяти дополнительно хранит по меньшей мере одно приложение, например, третье приложение 372, для выполнения функций пульта 300 дистанционного управления. Третье приложение 372 приводится в действие под управлением третьего контроллера 380 (который будет описан позже) и выполняет различные функции пульта 300 дистанционного управления. В данном случае третье приложение 372 и четвертое приложение 472 (которые будут описаны позже) будут упоминаться как приложения для устройств, которые будут отличаться от собственных приложений 172 и 173 устройства 100 отображения.

Хотя фиг. 2 иллюстрирует пульт 300 дистанционного управления, в котором установлено одно приложение 372, примерный вариант осуществления не ограничивается этим. То есть в пульте 300 дистанционного управления может быть установлено два или более приложений.

Третье приложение 372 может управлять командными словами-кандидатами в соответствии с выполняемыми функциями. Командные слова-кандидаты, управляемые третьим приложением 372, можно зарегистрировать в или удалить из таблицы 171 командных слов устройства 100 отображения.

Третий контроллер 380 может управлять различными элементами пульта 300 дистанционного управления. Например, третий контроллер 380 может выработать команду в ответ на манипуляцию пользователя блока ввода 330 пользователя и управлять третьим блоком 360 связи для передачи выработанной команды в устройство 100 отображения.

Третий контроллер 380 может быть реализован в виде MCU совместно с программным обеспечением.

Если речь пользователя вводится через третий блок 340 захвата речи, третий контроллер 380 управляет третьим преобразователем 350 речи для преобразования речи пользователя в электрический речевой сигнал и управляет третьим блоком 360 связи для передачи преобразованного речевого сигнала в устройство 100 отображения.

При осуществлении связи с устройством 100 отображения третий контроллер 380 может передавать командные слова-кандидаты под управлением третьего приложения 372 третьего блока 370 памяти в устройство 100 отображения. Переданные командные слова-кандидаты регистрируются с помощью таблицы 171 командных слов устройства 100 отображения и используются для распознавания речи с помощью механизма 181 распознавания речи.

Если команда управления передается с помощью устройства 100 отображения в результате распознавания речи, третий контроллер 380 может принять команду управления через третий блок 360 связи и выполнить операцию, соответствующую принятой команде управления.

Далее будет описана подробная конфигурация кондиционера 400 воздуха.

Как показано на фиг. 2, кондиционер 400 воздуха в качестве внешнего устройства может включать в себя четвертый блок 460 связи, который сообщается с внешней средой, четвертый блок 470 памяти, который хранит данные, и четвертый контроллер 480, который управляет кондиционером 400 воздуха.

Четвертый блок 460 связи, который осуществляет связь с устройством 100 отображения, может осуществлять беспроводную связь, которая включает в себя по меньшей мере одно из РЧ-связи, ZigBee и Bluetooth.

Четвертый блок 460 связи передает командные слова-кандидаты под управлением четвертого приложения 472 четвертого блока 470 памяти (который будет описан позже) в устройство 100 отображения.

Четвертый блок 470 памяти, который хранит данные под управлением четвертого контроллера 480, можно реализовать в виде энергонезависимого носителя информации, такого как флэш-память. Доступ к четвертому блоку 470 памяти осуществляется с помощью четвертого контроллера 480, который считывает, записывает, модифицирует, удаляет или обновляет данные.

Данные, хранящиеся в четвертом блоке 470 памяти, могут включать в себя, например, ОС для приведения в действие кондиционера 400 воздуха, различные приложения, исполняемые OС, данные изображения, дополнительные данные и т.д.

Четвертый блок 470 памяти может дополнительно хранить по меньшей мере одно приложение (приложение для устройства), например, четвертое приложение 472 для выполнения функций кондиционера 400 воздуха. Четвертое приложение 472 приводится в действие под управлением четвертого контроллера 480 (который будет описан позже) и выполняет различные функции кондиционера 400 воздуха.

Хотя фиг. 2 иллюстрирует кондиционер 400 воздуха, в котором установлено одно приложение 472, примерный вариант осуществления не ограничивается этим. То есть в кондиционере 400 воздуха можно установить два или более приложений.

Четвертое приложение 472 управляет командными словами-кандидатами, соответствующими выполняемым функциям. Командные слова-кандидаты под управлением четвертого приложения 472 моно зарегистрировать в или удалить из таблицы 171 командных слов устройства 100 отображения.

Четвертый контроллер 480 управляет различными элементами кондиционера 400 воздуха. Например, четвертый контроллер 480 может принимать команду управления в ответ на манипуляцию пользователя на пульте дистанционного управления кондиционера 400 воздуха и выполнять операцию управления, например, регулировать температуру в соответствии с выработанной командой управления.

Четвертый контроллер 480 можно реализовать в виде MCU совместно с программным обеспечением.

При осуществлении связи с устройством 100 отображения четвертый контроллер 480 может передавать командные слова-кандидаты под управлением четвертого приложения 472 четвертого блока 470 памяти в устройство 100 отображения. Переданные командные слова-кандидаты регистрируются с помощью таблицы 171 командных слов устройства 100 отображения и используются для распознавания речи с помощью механизма 181 распознавания речи.

Если команда управления передается с помощью устройства 100 отображения в результате распознавания речи, четвертый контроллер 480 может принимать команду управления через четвертый блок 460 связи и выполнять операцию, соответствующую принятой команде управления.

Если ввод речи обнаружен по меньшей мере в одном из множества блоков 140, 240 и 340 захвата речи, первый контроллер 180 устройства 100 отображения в качестве основного устройства системы распознавания речи согласно примерному варианту осуществления управляет первым блоком 140 связи для приема речевого сигнала из блока захвата речи, в котором был обнаружен ввод речи. Первый контроллер 180 принимает командные слова-кандидаты из по меньшей мере одного из приложений 372 и 472 для устройств из множества внешних устройств 300 и 400 через первый блок 140 связи или из собственных приложений 172 и 173 устройства 100 отображения для распознавания принятого речевого сигнала и регистрирует переданные командные слова-кандидаты с помощью таблицы 171 командных слов первого блока 170 памяти. Механизма 181 распознавания речи сравнивает командные слова-кандидаты, зарегистрированные с помощью таблицы 171 командных слов с речевым сигналом, и распознает речь.

Устройство 100 отображения может обнаружить ввод речи через различные устройства, которые вводят речь пользователя. Устройство 100 отображения может использовать командные слова-кандидаты, которые предусматривает приложение для распознавания речи, и может динамическим образом регистрировать или удалять командные слова-кандидаты для распознавания речи. Таким образом, можно предотвратить ненужное увеличение командных слов-кандидатов устройства 100 отображения.

Устройство 100 отображения может принимать сигнал распознавания речи из блока 140 захвата речи, принимать командные слова-кандидаты из по меньшей мере одного из собственных приложений 172 и 173 или из приложений 372 и 472 для устройств и выполнять распознавание речи с помощью механизма 181 распознавания речи.

Далее, со ссылкой на фиг. 3 и 4, будет более подробно описана система распознавания речи, которая распознает речь, согласно примерному варианту осуществления.

Фиг. 3 иллюстрирует пример выполнения распознавания речи, и фиг. 4 иллюстрирует пример экрана, который отображает результаты распознавания речи на фиг. 3.

Как показано на фиг. 3, устройство 100 отображения может иметь зарегистрированные командные слова-кандидаты, которые предусмотрены по меньшей мере одним приложением (включая собственное приложение и приложение для устройства) и хранятся в таблице 171 командных слов.

Например, командные слова А и В передаются с помощью первого приложения 172 (то есть собственного приложения) в таблицу 171 командных слов (этап 501) и сохраняются в таблице 171 командных слов (этап 502). Механизм 181 распознавания речи регистрирует командные слова А и В, которые хранятся в таблице 171 командных слов в качестве командных слов-кандидатов (этап 504).

Командные слова С и D передаются с помощью третьего приложении 372 (то есть приложения для устройства) в таблицу 171 командных слов (этап 505) и сохраняются в таблице 171 командных слов (этап 506). Механизм 181 распознавания речи регистрирует командные слова С и D, которые хранятся в таблице 171 командных слов в качестве командных слов-кандидатов (этап 508).

Соответственно, механизм 181 распознавания речи регистрирует командные слова А, В, С и D, которые передаются их первого и третьего приложений 172 и 372 в качестве командных слов-кандидатов.

Например, когда командные слова А, B, C и D зарегистрированы как командные слова-кандидаты, можно обнаружить ввод речи А во второй блок 240 захвата речи, который находится отдельно от устройства 100 отображения. Обнаруженная речь преобразуется в речевой сигнал с помощью второго преобразователя 250 речи и передается в механизм 181 распознавания речи через второе и первое блоки 260 и 160 связи (этап 509).

Механизм 181 распознавания речи сравнивает речевой сигнал речи А с зарегистрированными командными словами-кандидатами А, B, C и D, принимает решение относительно идентичных или аналогичных команд и распознает речь A (этап 510).

Первый контроллер 180 может передавать результаты распознавания в блок 130 (этап 511) отображения, и блок 130 отображения может отображать результаты распознавания речи так, как показано на фиг. 4.

Как показано на фиг. 4, блок 130 отображения может отображать пользовательский интерфейс, показывающий результат А 60 распознавания речи и командные слова-кандидаты А, В, С и D 61, 62, 63 и 64 в соответствии с результатами распознавания речи. Блок 130 отображения может дополнительно отображать информацию пользовательского интерфейса, показывающую информацию о приложении (о первом приложении) 65, которая управляет командным словом А в соответствии с результатами распознавания речи.

С помощью UI, отображаемого на экране, пользователь может проверить результаты распознавания речи и командные слова-кандидаты. Если результаты распознавания речи не удовлетворяют его/ее намерению говорить, пользователь может выбрать одно из командных слов-кандидатов. Пользователь может получить информацию об устройстве, которая относится к результатам распознавания речи, через информацию для приложения.

Первый контроллер 180 передает команду управления в первое приложение 172 в соответствии с результатами распознавания речи, как показано на фиг. 3 (этап 512). Первое приложение 172 выполняет операцию управления согласно распознанной речи А под управлением первого контроллера 180. Например, если речь А представляет собой "уменьшить громкость", громкость устройства 100 отображения уменьшается.

Как показано на фиг. 3 и 4, устройство 100 отображения может заранее зарегистрировать командные слова (например, A, B, C и D) некоторых приложений, и если речь пользователя обнаружена, может распознать речь, отобразить результаты распознавания речи и выполнить соответствующую операцию управления, основываясь на зарегистрированных командных словах-кандидатах.

Хотя фиг. 3 и 4 иллюстрируют командные слова первого приложения 172 и третьего приложения 372, которые зарегистрированы в качестве командных слов-кандидатов, и речь пользователя вводится через второй блок 240 захвата речи, примерный вариант осуществления не ограничивается этим. Например, командные слова могут быть переданы с помощью других различных собственных приложений и приложений для устройств для регистрации или удаления командных слов-кандидатов, и речь вводится через различные блоки захвата речи.

Далее, со ссылкой на фиг. 5, будет подробно описана система распознавания речи, которая выполняет распознавание речи согласно другому примерному варианту осуществления.

Фиг. 5 иллюстрирует пример выполнения распознавания речи согласно другому примерному варианту осуществления.

Как показано на фиг. 5, можно обнаружить ввод речи Е в третий блок 340 захвата речи, который находится отдельно от устройства 100 отображения. Обнаруженная речь Е преобразуется в речевой сигнал с помощью третьего преобразователя 350 речи и передается в механизм 181 распознавания речи через третий и первый блоки 360 и 160 связи (этап 701).

Устройство 100 отображения может иметь зарегистрированные командные слова-кандидаты. Например, командные слова Е и F передаются с помощью третьего приложения 372 в таблицу 171 командных слов (этап 702) и сохраняются в таблице 171 командных слов (этап 703). Механизм 181 распознавания речи регистрирует командные слова Е и F, хранящиеся в таблице 171 командных слов, в качестве командных слов-кандидатов (этап 705).

То есть, командные слова Е и F, которые передаются с помощью третьего приложения 372, регистрируются как командные слова-кандидаты с помощью механизма 181 распознавания речи.

Когда командные слова E и F зарегистрированы как командные слова-кандидаты, механизм 181 распознавания речи сравнивает речевой сигнал речи E с зарегистрированными командными словами-кандидатами Е и F, принимает решение относительно идентичных или аналогичных командных слов и распознает речь E (этап 706).

Первый контроллер 180 передает результаты распознавания в блок 130 (этап 707) отображения, и блок 130 отображения может отображать результаты распознавания речи.

Первый контроллер 180 передает команду управления в третье приложение 372 согласно результатам распознавания речи (этап 708). Третье приложение 372 выполняет операцию управления согласно распознанной речи Е под управлением третьего контроллера 380. Если команда управления, переданная в соответствии с результатами распознавания речи представляет собой команду для управления устройством 100 отображения, команда управления может быть передана в первое приложение 172 или второе приложение 173.

Как показано на фиг. 5, если речь пользователя обнаружена, устройство 100 отображения может зарегистрировать командные слова (например, Е и F) приложения, соответствующего устройству, в котором выполнялся ввод речи в качестве командных слов-кандидатов, распознать речь, основываясь на зарегистрированных командных словах-кандидатах, отобразить результат распознавания речи и выполнить соответствующую операцию управления.

Хотя фиг. 5 иллюстрирует, что речь пользователя введена через третий блок 340 захвата речи, и командные слова третьего приложения 372 зарегистрированы в качестве командных слов-кандидатов, примерный вариант осуществления не ограничивается этим. Например, речь можно ввести с помощью различных блоков захвата речи, и командные слова можно передать с помощью различных собственных приложений и приложений для устройств для регистрации или удаления командных слов-кандидатов.

Далее, со ссылкой на сопроводительные чертежи, будет описан способ распознавания речи в системе распознавания речи согласно примерному варианту осуществления.

На фиг. 6 представлена блок-схема, иллюстрирующая способ распознавания речи системы распознавания речи согласно примерному варианту осуществления.

Как показано на фиг. 6, система распознавания речи может обнаружить ввод речи по меньшей мере одного из множества блоков 140, 240 и 340 захвата речи (операция S810). Обнаруженная речь преобразуется в электрический речевой сигнал с помощью преобразователей 150, 250 и 350 речи.

Первый контроллер 180 принимает речевой сигнал (операция S820). Если обнаружен ввод речи во внешних блоках 240 и 340 захвата речи, речевой сигнал можно принимать через первый блок 160 связи.

Механизм 181 распознавания речи регистрирует командные слова-кандидаты для распознавания речи, основываясь на речевом сигнале (операция S830). Зарегистрированные командные слова-кандидаты могут представлять собой слова, сохраненные заранее в таблице 171 командных слов или принятые с помощью собственных приложений или приложений 172, 173, 372 и 472 для устройств, и сохраняются в таблице 171 командных слов.

Механизм 181 распознавания речи распознает речь пользователя, основываясь на сохраненных командных словах-кандидатах (операция S840).

Первый контроллер 180 отображает результаты распознавания речи на блоке 130 отображения. Блок 130 отображения может отображать результаты распознавания речи для речевого сигнала, командные слова-кандидаты в соответствии с результатами распознавания речи и информацию о приложении.

Первый контроллер 180 вырабатывает команду управления в соответствии с результатами распознавания речи и передает команду управления в приложение (операция S860). Соответственно, операция может быть выполнена с помощью выработанной команды управления.

На фиг. 7 представлена блок-схема, показывающая подробности процесса обнаружения ввода речи (фиг. 6).

Как показано на фиг. 7, устройство 100 отображения в качестве основного устройства может работать в режиме ввода речи, в котором возможен ввод речи пользователя (операция S811). В режиме ввода речи речь может вводиться с помощью различных блоков 140, 240 и 340 захвата речи.

Например, первый контроллер 180 может обнаружить произнесение ключевого слова пробуждения из одного из множества блоков 140, 240 и 340 захвата речи (операция S812). Ключевое слово пробуждения активирует ввод речи через конкретный блок захвата речи, и его можно установить заранее. Например, первый блок 140 захвата речи устройства 100 отображения может установить речь, которая относится к управлению телевизором, например каналами, громкостью и т.д., в виде ключевого слова пробуждения. Второй блок 240 захвата речи мобильного телефона 200 может установить речь, которая относится к вызову, контактной информации и т.д., в качестве ключевого слова пробуждения.

Альтернативно, если сигнал запуска вводится с помощью одного из множества блоков 140, 240 и 340 захвата речи в результате манипулирования предварительно определенной кнопкой (кнопкой ввода речи), первый контроллер 180 может обнаружить ввод речи с помощью блока захвата речи (операция S813). Например, если пользователь манипулирует кнопкой ввода речи, выполненной в конкретном устройстве захвата речи, обнаруживается ввод речи в блоке ввода речи конкретного устройства захвата речи.

После обнаружения первый контроллер 180 активирует один из множества блоков 140, 240 и 340 захвата речи, в которые вводится речь (операция S812). После включения одного из блоков захвата речи можно предотвратить обнаружение ненужной речи и сбой в функционировании.

Речевой сигнал передается с помощью активированного блока захвата речи в механизм 181 распознавания речи для выполнения распознавания речи.

На фиг. 8 представлена блок-схема, показывающая подробности процесса выполнения распознавания речи (фиг. 6).

Как показано на фиг. 8, механизм 181 распознавания речи может принимать командные слова-кандидаты из по меньшей мере одного из множества приложений 172, 173, 372 и 472 и регистрировать командные слова-кандидаты (операция S830).

Механизм 181 распознавания речи может определить, идентичны ли или аналогичны ли зарегистрированные командных слова-кандидаты принятому речевому сигналу (операция S841).

Если определено, что командные слова-кандидаты идентичны или аналогичны, механизм 181 распознавания речи принимает решение относительно идентичных или аналогичных командных слов и выполняет распознавание речи, и первый контроллер 180 отображает результаты распознавания речи на экране блока 130 отображения (операция S850).

Если определено, что идентичные или аналогичные командные слова-кандидаты отсутствуют, механизм 181 распознавания речи может принять решение относительно того, следует ли принимать и регистрировать командные слова-кандидаты других приложений (операция S842). Первый контроллер 180 может принимать и регистрировать командные слова-кандидаты из других приложений в соответствии с выбором или вводом пользователя и может принимать и регистрировать командные слова-кандидаты из множества приложений в предварительно установленном порядке. С учетом объема первого блока 170 памяти устройства 100 отображения можно выборочно удалить предыдущие зарегистрированные командные слова-кандидаты.

То есть, если командное слово-кандидат не идентично или не аналогично зарегистрированным командным словам-кандидатам, операции S842 и S841 выполняются последовательно для выполнения распознавания речи.

Если в операции S842 принято решение не принимать и не регистрировать командные слова-кандидаты других приложений, механизм 181 распознавания речи приостанавливает распознавание речи, и первый контроллер 180 может отобразить сбой в распознавании речи на экране блока 130 отображения.

Когда основное устройство согласно примерному варианту осуществления обнаруживает ввод речи с помощью различных устройств, которые принимают речь пользователя, можно использовать различные устройства захвата речи, и можно обеспечить связанные с этим услуги с помощью устройств захвата речи.

Командные слова-кандидаты для распознавания речи передаются с помощью множества приложений и регистрируются или удаляются. Таким образом, не происходит ненужного увеличения командных слов-кандидатов основного устройства, можно уменьшить задержку по скорости обработки или снижение скорости распознавания и можно повысить в целом эффективность системы распознавания речи.

Результаты распознавания речи, командные слова-кандидаты, информация о приложении, а также информация о различных устройствах захвата речи и устройствах, обеспечивающих командные слова-кандидаты, которые используются для распознавания речи, распознаются гораздо легче пользователем, и повышается удобство для пользователя.

Хотя этим и не ограничивается, примерные варианты осуществления можно записать в виде компьютерных программ и можно реализовать в виде цифровых компьютеров общего назначения, которые исполняют программы с использованием машиночитаемого носителя информации. Примеры машиночитаемого носителя информации включают в себя магнитный носитель информации (например, ROM, гибкие диски, жесткие диски и т.д.), и оптический носитель информации (например, CD-ROM или DVD). Кроме того, примерные варианты осуществления можно записать в виде компьютерных программ, которые передаются на машиночитаемых носителях передачи, таких как несущая волна, и принимать и реализовать в виде цифровых компьютеров общего назначения, которые исполняют программы. Более того, хотя во всех аспектах это не требуется, один или более блоков устройства могут включать в себя процессор или микропроцессор, исполняющий компьютерную программу, которая хранится на машиночитаемом носителе, таком как локальная память.

Хотя было показано и описано несколько примерных вариантов осуществления, специалистам в данной области техники будет понятно, что в этих примерных вариантах осуществления могут быть сделаны изменения без отклонения от принципов и сущности изобретательской концепции, объем которой определен в прилагаемой формуле изобретения и ее эквивалентах.

Похожие патенты RU2677396C2

название год авторы номер документа
УСТРОЙСТВО ОБРАБОТКИ ИЗОБРАЖЕНИЙ И СООТВЕТСТВУЮЩИЙ СПОСОБ УПРАВЛЕНИЯ И СИСТЕМА ОБРАБОТКИ ИЗОБРАЖЕНИЙ 2013
  • Ли Дзоо-Йеонг
  • Парк Санг-Шин
RU2571520C2
СПОСОБ ГОЛОСОВОГО УПРАВЛЕНИЯ И ЭЛЕКТРОННОЕ УСТРОЙСТВО 2019
  • Чжоу, Сюань
  • Ван, Шоучэн
  • Лун, Цзяюй
  • Гао, Юэ
RU2766255C1
СПОСОБ И УСТРОЙСТВО ПОЛЬЗОВАТЕЛЬСКОГО ВВОДА В ТЕРМИНАЛЕ МОБИЛЬНОЙ СВЯЗИ 2006
  • Парк Ки-Донг
RU2381544C2
ПОЛЬЗОВАТЕЛЬСКИЙ ТЕРМИНАЛ, СПОСОБ ДЛЯ ОБЕСПЕЧЕНИЯ ЕГО ПОЛОЖЕНИЯ И СПОСОБ ДЛЯ НАПРАВЛЕНИЯ ЕГО МАРШРУТА 2010
  • Ю Сеунг-Донг
  • Чанг Воо-Йонг
  • Парк Се-Дзун
  • Моон Мин-Дзеонг
  • Парк Соо-Хонг
  • Дзеонг Дзин-Гук
RU2548156C2
СПОСОБ И УСТРОЙСТВО УПРАВЛЕНИЯ РАСПИСАНИЕМ С ИСПОЛЬЗОВАНИЕМ ОПТИЧЕСКОГО УСТРОЙСТВА ЧТЕНИЯ СИМВОЛОВ 2012
  • Парк Ми Дзунг
  • Ким Тае Йеон
  • Ахн Ю Ми
  • Янг Гу Хиун
RU2621626C2
КОРРЕКЦИЯ ОШИБОК ДЛЯ СИСТЕМ РАСПОЗНАВАНИЯ РЕЧИ 2006
  • Кисс Имре
  • Леппянен Юсси Арттури
RU2379767C2
МОБИЛЬНЫЙ ТЕРМИНАЛ И СПОСОБ УПРАВЛЕНИЯ ИМ 2013
  • Парк Дзонгсеок
RU2536799C1
СПОСОБ ОБЕСПЕЧЕНИЯ ТАКТИЛЬНОГО ЭФФЕКТА В ПОРТАТИВНОМ ТЕРМИНАЛЕ, МАШИННО-СЧИТЫВАЕМЫЙ НОСИТЕЛЬ И ПОРТАТИВНЫЙ ТЕРМИНАЛ 2014
  • Ли Дзу-Йоун
  • Парк Дзин-Хиунг
  • Дзун Дзин-Ха
RU2667047C2
УСТРОЙСТВО ТЕРМИНАЛА ПОЛЬЗОВАТЕЛЯ И СООТВЕТСТВУЮЩИЙ СПОСОБ УПРАВЛЕНИЯ 2013
  • Парк Сун-Хва
  • Дзунг Йоун-Гун
RU2666314C2
ТЕРМИНАЛ МОБИЛЬНОЙ СВЯЗИ И СПОСОБ УПРАВЛЕНИЯ ЕГО МЕНЮ 2008
  • Шин Дзонг-Хо
  • Квак Дзае-До
  • Йоун Дзонг-Кеун
RU2394386C2

Иллюстрации к изобретению RU 2 677 396 C2

Реферат патента 2019 года УСТРОЙСТВО ОТОБРАЖЕНИЯ, УСТРОЙСТВО ЗАХВАТА РЕЧИ И СООТВЕТСТВУЮЩИЙ СПОСОБ РАСПОЗНАВАНИЯ РЕЧИ

Изобретение относится к устройству отображения, устройству захвата речи и способу распознавания речи. Технический результат заключается в обеспечении способа управления устройством отображения. Такой результат достигается за счет того, что хранят в блоке памяти множество командных слов для управления устройством отображения и по меньшей мере одним внешним устройством, причем множество командных слов соответствуют по меньшей мере одному приложению устройства отображения и по меньшей мере одному приложению по меньшей мере одного внешнего устройства; определяют, в ответ на прием речевого сигнала пользователя посредством устройства захвата речи, одно из множества командных слов, сохраненных в блоке памяти, в соответствии с принятым речевым сигналом и командой управления, для управления устройством отображения или по меньшей мере одним внешним устройством, в соответствии с упомянутым определенным командным словом; передают определенную команду управления от устройства отображения на устройство захвата речи так, что устройство захвата речи передает определенную команду управления на определенное внешнее устройство. 3 н. и 15 з.п. ф-лы, 8 ил.

Формула изобретения RU 2 677 396 C2

1. Устройство отображения, содержащее:

блок отображения, который отображает изображение;

блок памяти, выполненный с возможностью хранения данных; и

контроллер, выполненный с возможностью:

управления блоком памяти для хранения командного слова-кандидата и информации приложения, соответствующей командному слову-кандидату;

определения, в ответ на речевой сигнал, принятый от блока захвата речи, командного слова-кандидата, соответствующего упомянутому речевому сигналу;

определения приложения для выполнения определенного командного слова-кандидата на основе информации приложения, соответствующей определенному командному слову-кандидату; и

управления приложением для выполнения определенного командного слова-кандидата.

2. Устройство отображения по п. 1, в котором обеспечено множество блоков захвата речи и, если обнаружен ввод речи в по меньшей мере одном из множества блоков захвата речи, контроллер принимает речевой сигнал из блока захвата речи, в котором обнаружен ввод речи.

3. Устройство отображения по п. 2, в котором блок захвата речи содержит по меньшей мере одно из встроенного микрофона, обеспеченного в устройстве отображения, первого внешнего микрофона, обеспеченного в по меньшей мере одном из множества внешних устройств, и второго внешнего микрофона, обеспеченного в устройстве, которое отличается от устройства отображения и множества внешних устройств.

4. Устройство отображения по п. 2, в котором, если обнаружено произнесение ключевого слова пробуждения в одном из множества блоков захвата речи, контроллер активирует блок захвата речи, с помощью которого обнаруживается ключевое слово пробуждения, и принимает речевой сигнал от активированного блока захвата речи.

5. Устройство отображения по п. 2, в котором, если сигнал запуска вводится путем манипулирования предварительно определенной кнопкой, обеспеченной в одном из множества блоков захвата речи, контроллер активирует блок захвата речи, с помощью которого вводится сигнал запуска, и принимает речевой сигнал от активированного блока захвата речи.

6. Устройство отображения по одному из пп. 1-5, в котором контроллер управляет блоком отображения для отображения на нем результатов распознавания речи для речевого сигнала и командных слов-кандидатов в соответствии с результатами распознавания речи.

7. Устройство отображения по п. 1, дополнительно содержащее блок связи, выполненный с возможностью осуществления связи с множеством внешних устройств, и при этом контроллер управляет блоком связи для приема командных слов-кандидатов от по меньшей мере одного из множества внешних устройств.

8. Устройство отображения по п. 1, дополнительно содержащее блок связи, выполненный с возможностью осуществления связи с множеством внешних устройств, и при этом контроллер управляет блоком связи для передачи одному внешнему устройству управляющего сигнала, соответствующего определенному командному слову-кандидату, так что приложение внешнего устройства выполняет определенное командное слово-кандидат.

9. Устройство отображения по п. 1, в котором контроллер управляет блоком памяти, чтобы в ответ на приложение, выбранное пользователем, удалять командное слово-кандидат, соответствующее выбранному приложению.

10. Устройство захвата речи, содержащее:

блок связи, который осуществляет связь с устройством отображения, имеющим функцию распознавания речи;

блок захвата речи, который принимает речь;

преобразователь речи, который преобразует принятую речь в речевой сигнал; и

контроллер, который управляет блоком связи, чтобы передавать преобразованный речевой сигнал и командные слова-кандидаты в устройство отображения для распознавания преобразованного речевого сигнала,

при этом контроллер содержит по меньшей мере одно приложение, соответствующее командным словам-кандидатам.

11. Способ управления устройством отображения, содержащий этапы, на которых:

хранят командное слово-кандидат и информацию приложения, соответствующую командному слову-кандидату;

определяют, в ответ на речевой сигнал, принятый от блока захвата речи, командное слово-кандидат, соответствующее упомянутому речевому сигналу;

определяют приложение для выполнения определенного командного слова-кандидата на основе информации приложения, соответствующей определенному командному слову-кандидату; и

управляют приложением для выполнения определенного командного слова-кандидата.

12. Способ управления по п. 11, дополнительно содержащий этап, на котором обнаруживают ввод речи в по меньшей мере одном из множества блоков захвата речи, причем прием речевого сигнала содержит прием речевого сигнала из блока захвата речи, в котором обнаружен ввод речи.

13. Способ управления по п. 12, в котором блок захвата речи содержит по меньшей мере одно из встроенного микрофона, обеспеченного в устройстве отображения, первого внешнего микрофона, обеспеченного в по меньшей мере одном из множества внешних устройств, и второго внешнего микрофона, обеспеченного в устройстве, которое отличается от устройства отображения и множества внешних устройств.

14. Способ управления по п. 12 или 13, в котором обнаружение ввода речи содержит обнаружение произнесения ключевого слова пробуждения в одном из множества блоков захвата речи и активацию блока захвата речи, с помощью которого обнаруживается ключевое слово пробуждения.

15. Способ управления по п. 12 или 13, в котором обнаружение ввода речи содержит обнаружение ввода сигнала запуска в соответствии с манипулированием предварительно определенной кнопкой, обеспеченной в одном из множества блоков захвата речи, и активацию блока захвата речи, с помощью которого вводится сигнал запуска.

16. Способ управления по п. 11, дополнительно содержащий этап, на котором принимают командные слова-кандидаты от по меньшей мере одного из множества внешних устройств.

17. Способ управления по п. 11, дополнительно содержащий этап, на котором передают одному внешнему устройству управляющий сигнал, соответствующий определенному командному слову-кандидату, так что приложение внешнего устройства выполняет определенное командное слово-кандидат.

18. Способ управления по п. 11, дополнительно содержащий этап, на котором ответ на приложение, выбранное пользователем, удаляют командное слово-кандидат, соответствующее выбранному приложению.

Документы, цитированные в отчете о поиске Патент 2019 года RU2677396C2

Питатель цилиндрического сепаратора 1983
  • Шелковин Юрий Дмитриевич
  • Сосновский Евгений Леонович
SU1207516A1
Топчак-трактор для канатной вспашки 1923
  • Берман С.Л.
SU2002A1
Топчак-трактор для канатной вспашки 1923
  • Берман С.Л.
SU2002A1
Пломбировальные щипцы 1923
  • Громов И.С.
SU2006A1
Способ посева семян 1958
  • Бабаев А.А.
SU121608A1
Способ приготовления лака 1924
  • Петров Г.С.
SU2011A1

RU 2 677 396 C2

Авторы

Дзанг Дзонг-Хиук

Чои Чан-Хи

Рю Хи-Сеоб

Парк Киунг-Ми

Парк Сеунг-Квон

Бае Дзае-Хиун

Даты

2019-01-16Публикация

2013-11-04Подача