УПРЕЖДАЮЩАЯ ВЫБОРКА РЕЗУЛЬТАТОВ ПОИСКА ДЛЯ ГОЛОСОВЫХ ЗАПРОСОВ Российский патент 2019 года по МПК G06F16/00 G10L15/26 

Описание патента на изобретение RU2701082C1

Область техники, к которой относится изобретение

[0001] Настоящее описание относится к распознаванию речи.

Уровень техники

[0002] Как правило, поисковый запрос включает в себя один или более терминов запроса, которые пользователь предоставляет поисковой машине, когда пользователь запрашивает у поисковой машины выполнять поиск. Среди других подходов пользователь может вводить термины запроса для поискового запроса через контекст голосового запроса, т.е., произнося термины запроса в микрофон мобильного устройства. Голосовые запросы могут быть обработаны с помощью технологии распознавания речи.

Сущность изобретения

[0003] Согласно некоторым инновационным аспектам изобретения, описанным в этом описании, одновременно с обнаружением высказывания, предоставленного пользователем, предварительные результаты поиска идентифицируются на основе промежуточной транскрипции высказывания. При обнаружении полного высказывания один или более предварительных результатов поиска могут быть предоставлены пользователю на основе окончательной транскрипции полного высказывания.

[0004] В одной примерной реализации пользователь может задавать вопрос об исторической достопримечательности. Пользователь может задавать вопрос "Какова высота Empire State Building?" Прежде чем пользователь произносит полный вопрос, мобильное устройство пользователя может обнаруживать начальный фрагмент вопроса и предоставлять его вычислительной системе. Вычислительная система может вычислять промежуточную транскрипцию этого начального фрагмента вопроса, например, "Какова высота", и перед вычислением окончательной транскрипции полного вопроса идентифицировать другие прошлые запросы, которые могут быть связаны с начальным фрагментом вопроса. Например, вычислительная система может идентифицировать предыдущие вопросы "Какова высота Empire State Building" и "Какова высота Washington Monument" в качестве связанных с начальным фрагментом текущего запроса. Результаты поиска получаются или повторно получаются для предыдущих запросов и сохраняются в кэше. При приеме полного вопроса "Какова высота Empire State Building" вычислительная система идентифицирует предыдущий запрос "Какова высота Empire State Building" в качестве связанного с текущим запросом. Вычислительная система может затем предоставлять сохраненный результат поиска, связанный с предыдущим запросом "Какова высота Empire State Building", пользователю для текущего запроса "Какова высота Empire State Building", без ожидания, чтобы полный запрос был транскрибирован перед формированием результатов поиска. Это уменьшает время, затрачиваемое на то, чтобы возвращать результаты поиска пользователю.

[0005] Инновационные аспекты изобретения, раскрытые в этом описании, могут быть осуществлены в компьютерно-реализованных способах, которые включают в себя действия приема данных, кодирующих высказывание; получения промежуточной транскрипции высказывания; прежде чем будет получена окончательная транскрипция высказывания: i) определения того, что промежуточная транскрипция высказывания связана с ранее принятым поисковым запросом, ii) получения одного или более результатов, которые идентифицируются как отвечающие на ранее принятый поисковый запрос, и iii) сохранения одного или более результатов; получения окончательной транскрипции высказывания; определения того, что окончательная транскрипция высказывания также связана с ранее принятым поисковым запросом; и в ответ на определение того, что окончательная транскрипция высказывания также связана с ранее принятым поисковым запросом, предоставления сохраненных одного или более результатов для вывода. Промежуточная транскрипция высказывания может быть транскрипцией начального фрагмента высказывания.

[0006] Другие варианты осуществления этих аспектов включают в себя соответствующие системы, устройство и компьютерные программы, сконфигурированные выполнять действия способов, закодированные на компьютерных устройствах хранения. Например, другой вариант осуществления этих аспектов включает в себя компьютерно-читаемый носитель, который может быть энергонезависимым компьютерно-читаемым носителем, хранящим программное обеспечение, содержащее инструкции, исполняемые одним или более компьютерами, которые, при таком исполнении, предписывают одному или более компьютерам выполнять операции, содержащие прием аудиоданных, кодирующих высказывание; получение промежуточной транскрипции высказывания; прежде чем будет получена окончательная транскрипция высказывания: определение того, что промежуточная транскрипция высказывания связана с ранее принятым поисковым запросом, получение одного или более результатов, которые идентифицируются как отвечающие на ранее принятый поисковый запрос, и сохранение одного или более результатов; получение окончательной транскрипции высказывания; определение того, что окончательная транскрипция высказывания также связана с ранее принятым поисковым запросом; и в ответ на определение того, что окончательная транскрипция высказывания также связана с ранее принятым поисковым запросом, предоставление сохраненных одного или более результатов для вывода.

[0007] Каждый из этих и других вариантов осуществления может, в необязательном порядке, включать в себя один или более следующих признаков. Например, определение того, что промежуточная транскрипция высказывания имеет пороговый размер, при этом промежуточная транскрипция высказывания определяется как связанная с ранее принятым поисковым запросом только после определения, что промежуточная транскрипция имеет пороговый размер. Промежуточная транскрипция высказывания формируется средством распознавания слитной речи, и при этом один или более результатов получаются от поисковой машины. После определения, что промежуточная транскрипция высказывания связана с ранее принятым поисковым запросом, предоставление ранее принятого поискового запроса для повторного выполнения поисковой машиной. Определение того, что местоположение, связанное с высказыванием, связано с местоположением, связанным с ранее принятым поисковым запросом.

[0008] Признаки дополнительно включают в себя, например, определение того, что промежуточная транскрипция высказывания связана с ранее принятым поисковым запросом, который был предоставлен тем же пользователем, который связан с высказыванием. Определение того, что промежуточная транскрипция высказывания связана с ранее принятым поисковым запросом, который был предоставлен пользователем, отличным от пользователя, который связан с высказыванием. Высказывание является голосовой командой, отличной от голосового запроса. Определение того, что промежуточная транскрипция высказывания является идентичной фрагменту ранее принятого поискового запроса. Определение того, что промежуточная транскрипция высказывания находится в пределах порогового сходства с фрагментом ранее принятого поискового запроса.

[0009] Детали одного или более вариантов осуществления изобретения, описанного в этом описании, излагаются в сопровождающих чертежах и описании ниже. Другие потенциальные признаки, аспекты и преимущества изобретения станут очевидны из описания, чертежей и формулы изобретения. Будет понятно, что аспекты и реализации могут быть объединены, и что признаки, описанные в контексте одного аспекта или реализации, могут быть реализованы в контексте других аспектов или реализаций.

Описание чертежей

[0010] Фиг. 1a изображает систему для получения результатов поиска на основе промежуточной транскрипции высказывания.

[0011] Фиг. 1b изображает систему для предоставления результатов поиска для окончательной транскрипции высказывания.

[0012] Фиг. 2 изображает блок-схему последовательности операций примерного процесса для получения результатов поиска на основе промежуточной транскрипции высказывания.

[0013] Фиг. 3 изображает блок-схему последовательности операций примерного процесса для предоставления результатов поиска для окончательной транскрипции высказывания.

[0014] Фиг. 4 изображает компьютерное устройство и мобильное компьютерное устройство, которые могут быть использованы для реализации технических приемов, описанных здесь.

Подробное описание изобретения

[0015] Фиг. 1a изображает систему 100 для получения результатов поиска на основе промежуточной транскрипции высказывания. Вкратце, система 100 может получать промежуточную транскрипцию высказывания, и прежде чем будет получена окончательная транскрипция высказывания, определять, что промежуточная транскрипция связана с ранее принятым поисковым запросом, и получать результаты, которые отвечают на ранее принятый поисковый запрос. Система 100 включает в себя мобильное вычислительное устройство 102, клиентскую часть 104 поисковой системы, средство 106 распознавания слитной речи, завершающую часть 108 поисковой системы, журнал 110 запросов, поисковую машину 112 и кэш 114. В некоторых примерах один или более из средства 106 распознавания слитной речи, завершающей части 108 поисковой системы и поисковой машины 112 могут быть включены в клиентскую часть 104 поисковой системы. Мобильное вычислительное устройство 102 находится на связи с клиентской частью 104 поисковой системы через одну или более сетей. Мобильное вычислительное устройство 102 может включать в себя микрофон, камеру или другое средство обнаружения для обнаружения высказываний от пользователя 116.

[0016] В некоторых примерах пользователь 116 хочет узнать счет игры, в которую играет его любимая команда. Следовательно, пользователь 116 может задавать вопрос, например, произнося запрос на естественном языке, для такого счета. Однако, перед предоставлением, т.е., завершением вопроса или предоставлением полного вопроса, мобильное вычислительное устройство 102 обнаруживает высказывание начального фрагмента вопроса. В иллюстрированном примере, прежде завершения вопроса пользователем 116, мобильное вычислительное устройство 102 обнаруживает начальный фрагмент вопроса, например, "Какой счет" в качестве высказывания во время t0 до предоставления пользователем 116 полного вопроса.

[0017] В некоторых примерах высказывание может включать в себя голосовую команду, отличную от голосового запроса. Например, голосовая команда может включать в себя "слово-ссылку", например, "слово для привлечения внимания" или "команду инициирования голосового действия", которое является предварительно определенным термином, который произносится, чтобы привлекать внимание системы 100.

[0018] Клиентская часть 104 поисковой системы принимает аудиоданные, кодирующие высказывание, от мобильного вычислительного устройства 102, например, через одну или более сетей. Когда мобильное устройство обнаружило начальный фрагмент высказывания, аудиоданные, кодирующие этот начальный фрагмент, могут быть отправлены мобильным устройством клиентской части поисковой системы, после того как начальный фрагмент был обнаружен, даже если пользователь еще не предоставил полный вопрос. В некоторых примерах аудиоданные могут дополнительно включать в себя данные об окружающей обстановке, включающие в себя данные о местоположении мобильного вычислительного устройства 102. Клиентская часть 104 поисковой системы может соответственно обрабатывать аудиоданные, включая в себя извлечение высказывания из аудиоданных, и предоставлять высказывание средству 106 распознавания слитной речи.

[0019] Средство 106 распознавания слитной речи формирует промежуточную транскрипцию высказывания, которая может быть транскрипцией начального фрагмента высказывания. Формирование промежуточной транскрипции высказывания может включать в себя то, что средство 106 распознавания слитной речи транскрибирует высказывание в текстовые или соотносящиеся к тексту данные. В некоторых примерах средство 106 распознавания слитной речи может обеспечивать представление языка в письменной форме высказывания. Например, средство 106 распознавания слитной речи транскрибирует высказывание, чтобы формировать транскрипцию "Какой счет". Средство 106 распознавания слитной речи предоставляет промежуточную транскрипцию клиентской части 104 поисковой системы.

[0020] Клиентская часть 104 поисковой системы получает промежуточную транскрипцию высказывания от средства 106 распознавания слитной речи во время t1. Клиентская часть 104 поисковой системы может соответственно обрабатывать промежуточную транскрипцию и предоставлять промежуточную транскрипцию завершающей части 108 поисковой системы. Для этого, в иллюстрированном примере, завершающая часть 108 поисковой системы принимает промежуточную транскрипцию "Какой счет" и перед получением окончательной транскрипции высказывания, например, посредством клиентской части 104 поисковой системы и/или средства 106 распознавания слитной речи, соответственно обрабатывает промежуточную транскрипцию высказывания, как описано ниже.

[0021] В частности, завершающая часть 108 поисковой системы определяет, что промежуточная транскрипция высказывания связана с ранее принятым поисковым запросом. В иллюстрированном примере завершающая часть 108 поисковой системы осуществляет доступ к журналу 110 запросов, который включает в себя ранее принятые поисковые запросы, показанные как Q1, Q2, …, QN. Завершающая часть 108 поисковой системы определяет, что промежуточная транскрипция "Какой счет" высказывания связана с ранее принятым поисковым запросом Q1, "Какой счет игры Акул", а также связана с ранее принятым поисковым запросом Q2, "Какой счет игры Камбал".

[0022] В некоторых примерах завершающая часть 108 поисковой системы определяет, что промежуточная транскрипция высказывания идентична фрагменту ранее принятого поискового запроса. В частности, завершающая часть 108 поисковой системы определяет, что промежуточная транскрипция высказывания является идентичной, например, совпадает или является такой же, что и начальный фрагмент, или префикс, ранее принятого поискового запроса. В иллюстрированном примере завершающая часть 108 поисковой системы определяет, что промежуточная транскрипция "Какой счет" высказывания является идентичной начальному фрагменту ранее принятого поискового запроса Q1 "Какой счет игры Акул" и идентичной начальному фрагменту ранее принятого поискового запроса Q2 "Какой счет игры Камбал".

[0023] В некоторых примерах завершающая часть 108 поисковой системы определяет, что промежуточная транскрипция высказывания находится в пределах порогового сходства или в пределах предварительно определенного интервала редактирования фрагмента ранее принятого поискового запроса. В частности, завершающая часть 108 поисковой системы определяет, что промежуточная транскрипция высказывания находится в пределах порогового сходства с начальным фрагментом, или префиксом, ранее принятого поискового запроса. Например, завершающая часть 108 поисковой системы может определять, что промежуточная транскрипция "Какой счет" высказывания находится в пределах порогового сходства с начальным фрагментом ранее принятого поискового запроса "Какой счет игры Акул". Завершающая часть 108 поисковой системы определяет, что промежуточная транскрипция "Какой счет" высказывания находится в пределах порогового сходства с начальным фрагментом "Каким является счет" ранее принятого поискового запроса. В некоторых примерах пороговое сходство основывается на интервале редактирования между промежуточной транскрипцией высказывания и фрагментом, например, начальным фрагментом, ранее принятого поискового запроса.

[0024] В некоторых примерах завершающая часть 108 поисковой системы определяет, что промежуточная транскрипция высказывания связана с ранее принятым поисковым запросом, только после определения, что промежуточная транскрипция высказывания имеет пороговый размер или длину. Завершающая часть 108 поисковой системы сравнивает промежуточную транскрипцию высказывания с пороговым размером и в ответ на то, что промежуточная транскрипция высказывания имеет, по меньшей мере, пороговый размер, определяет, что промежуточная транскрипция высказывания связана с ранее принятым поисковым запросом. Например, завершающая часть 108 поисковой системы может сравнивать промежуточную транскрипцию "Какой счет" высказывания с пороговым размером и, в ответ, определять, что промежуточная транскрипция "Какой счет" высказывания связана с ранее принятым поисковым запросом Q1 "Какой счет игры Акул", а также связана с ранее принятым поисковым запросом Q2 "Какой счет игры Камбал". В некоторых примерах пороговый размер основывается на пороговом числе фонем, слогов или слов.

[0025] В некоторых примерах завершающая часть 108 поисковой системы определяет, что местоположение, связанное с высказыванием, связано с местоположением, связанным с ранее принятым поисковым запросом. В частности, клиентская часть 104 поисковой системы может предоставлять местоположение, связанное с высказыванием, когда предоставляется посредством аудиоданных от мобильного вычислительного устройства 102, завершающей части 108 поисковой системы. Завершающая часть 108 поисковой системы может дополнительно определять, что промежуточная транскрипция высказывания связана с ранее принятым поисковым запросом, на основе определения, что местоположение, связанное с высказыванием, связано с местоположением, связанным с ранее принятым поисковым запросом. В некоторых примерах завершающая часть 108 поисковой системы может определять, что промежуточная транскрипция высказывания связана с ранее принятым поисковым запросом, и дополнительно, что местоположение, связанное с высказыванием, связано с местоположением, связанным с ранее принятым поисковым запросом. Например, в иллюстрированном примере, высказывание, предоставленное пользователем 116 во время t0, может быть связано с домашним местоположением пользователя 116. Завершающая часть 108 поисковой системы может определять, что один или оба ранее принятых поисковых запроса Q1 и Q2 также связаны с домашним местоположением.

[0026] В некоторых примерах завершающая часть 108 поисковой системы определяет, что промежуточная транскрипция высказывания связана с ранее принятым поисковым запросом, который был предоставлен пользователем 116. В частности, ранее принятый поисковый запрос был предоставлен тем же пользователем, например, пользователем 116, который связан с высказыванием. Таким образом, завершающая часть 108 поисковой системы может дополнительно определять, что промежуточная транскрипция высказывания связана с ранее принятым поисковым запросом, на основе определения, что высказывание и ранее принятый поисковый запрос связаны с одним и тем же пользователем, например, пользователем 116. Например, в иллюстрированном примере, высказывание и ранее принятые поисковые запросы Q1 и Q2, оба связаны с пользователем 116.

[0027] В некоторых примерах завершающая часть 108 поисковой системы определяет, что промежуточная транскрипция высказывания связана с ранее принятым поисковым запросом, который был предоставлен пользователем, отличным от пользователя 116. В частности, ранее принятый поисковый запрос был предоставлен пользователем, отличным от пользователя 116, который связан с высказыванием. Таким образом, завершающая часть 108 поисковой системы может дополнительно определять, что промежуточная транскрипция высказывания связана с ранее принятым поисковым запросом на основе определения, что высказывание и ранее принятый поисковый запрос связаны с другими пользователями.

[0028] Завершающая часть 108 поисковой системы предоставляет ранее принятые поисковые запросы Q1 и Q2 клиентской части 104 поисковой системы во время t2. Клиентская часть 104 поисковой системы получает результаты, которые идентифицируются как отвечающие на ранее принятые поисковые запросы Q1 и Q2. В частности, клиентская часть 104 поисковой системы предоставляет ранее принятые поисковые запросы Q1 и Q2 поисковой машине 112 для повторного выполнения поисковой машиной 112 во время t3. Поисковая машина 112 проводит поиск электронных документов для каждого из запросов Q1 и Q2, чтобы идентифицировать результаты R1 и R2, которые отвечают на запросы Q1 и Q2, соответственно. Поисковая машина 112 предоставляет результаты R1 и R2 клиентской части 104 поисковой системы во время t4. Клиентская часть 104 поисковой системы сохраняет результаты R1 и R2 в кэше 114 во время t5. В частности, в иллюстрированном примере, клиентская часть 104 поисковой системы хранит запрос Q1, результат R1 и ассоциативную связь между запросом Q1 и результатом R1 в кэше 114 и дополнительно хранит запрос Q2, результат R2 и ассоциативную связь между запросом Q2 и результатом R2 в кэше 114.

[0029] Фиг. 1b иллюстрирует систему 100 для предоставления результатов поиска для окончательной транскрипции высказывания. Вкратце, система 100 может дополнительно получать окончательную транскрипцию высказывания, определять, что окончательная транскрипция высказывания также связана с ранее принятым поисковым запросом, и предоставлять ранее сохраненные результаты для вывода.

[0030] В некоторых примерах пользователь 116 завершает вопрос, т.е., предоставляет полный вопрос, который был первоначально предоставлен во время t0. В иллюстрированном примере мобильное вычислительное устройство 102 обнаруживает высказывание заключительного фрагмента вопроса, например, "игры Акул", во время t6. В некоторых примерах время t6 может происходить между временами t2 и t5. Система 100 может начинать обработку начального фрагмента "Какой счет" высказывания, т.е., получать промежуточную транскрипцию высказывания, определять, что промежуточная транскрипция связана с ранее принятым поисковым запросом, и/или получать результаты, которые отвечают на ранее принятый поисковый запрос, перед и/или одновременно с обнаружением высказывания заключительного фрагмента вопроса, например, "игры Акул".

[0031] Клиентская часть 104 поисковой машины принимает аудиоданные, кодирующие высказывание, от мобильного вычислительного устройства 102, например, через одну или более сетей. Клиентская часть 104 поисковой машины может соответственно обрабатывать аудиоданные, включая в себя извлечение высказывания из аудиоданных, и предоставлять высказывание средству 106 распознавания слитной речи. В некоторых примерах клиентская часть 104 поисковой системы предоставляет полное высказывание "Какой счет игры Акул" средству 106 распознавания слитной речи. В некоторых примерах клиентская часть 104 поисковой системы предоставляет оставшийся фрагмент высказывания "игры Акул" средству 106 распознавания слитной речи.

[0032] Средство 106 распознавания слитной речи формирует окончательную транскрипцию высказывания. Формирование окончательной транскрипции высказывания может включать в себя то, что средство 106 распознавания слитной речи транскрибирует высказывание в текстовые или соотносящиеся к тексту данные. В некоторых примерах средство 106 распознавания слитной речи может обеспечивать представление языка в письменной форме высказывания. Например, средство 106 распознавания слитной речи транскрибирует все высказывание, чтобы формировать окончательную транскрипцию "Какой счет игры Акул". Средство 106 распознавания слитной речи предоставляет окончательную транскрипцию клиентской части 104 поисковой системы.

[0033] Клиентская часть 104 поисковой системы получает окончательную транскрипцию от средства 106 распознавания слитной речи во время t7. Клиентская часть 104 поисковой системы может соответственно обрабатывать окончательную транскрипцию и предоставлять окончательную транскрипцию завершающей части 108 поисковой системы. Для этого, в иллюстрированном примере, завершающая часть 108 поисковой системы принимает окончательную транскрипцию "Какой счет игры Акул" и соответствующим образом обрабатывает окончательную транскрипцию высказывания, как описано ниже.

[0034] В некоторых реализациях завершающая часть 108 поисковой системы определяет, что окончательная транскрипция высказывания также связана с ранее принятым поисковым запросом, во время t8. В частности, завершающая часть 108 поисковой системы осуществляет доступ к ранее принятым поисковым запросам Q1 и Q2, которые были идентифицированы как связанные с промежуточной транскрипцией высказывания. В некоторых примерах завершающая часть 108 поисковой системы сравнивает окончательную транскрипцию высказывания с каждым из ранее принятых поисковых запросов Q1 и Q2. Завершающая часть 108 поисковой системы определяет, что окончательная транскрипция "Какой счет игры Акул" связана с ранее принятым поисковым запросом Q1 "Какой счет игры Акул". Дополнительно, в некоторых примерах, завершающая часть 108 поисковой системы определяет, что окончательная транскрипция "Какой счет игры Акул" не связана с ранее принятым поисковым запросом Q2 "Какой счет игры Камбал".

[0035] В некоторых примерах завершающая часть 108 поисковой системы определяет, что окончательная транскрипция высказывания является идентичной ранее принятому поисковому запросу. Завершающая часть 108 поисковой системы определяет, что окончательная транскрипция высказывания является аналогичной или идентичной, например, совпадает или является такой же или аналогичной, ранее принятому поисковому запросу. В иллюстрированном примере завершающая часть 108 поисковой системы определяет, что окончательная транскрипция "Какой счет игры Акул" высказывания является идентичной ранее принятому поисковому запросу Q1 "Какой счет игры Акул".

[0036] В некоторых примерах завершающая часть 108 поисковой системы определяет, что окончательная транскрипция высказывания находится в пределах порогового сходства с ранее принятым поисковым запросом. Завершающая часть 108 поисковой системы определяет, что окончательная транскрипция высказывания находится в пределах порогового сходства с ранее принятым поисковым запросом. Например, завершающая часть 108 поисковой системы может определять, что окончательная транскрипция "Какой счет игры Акул" высказывания находится в пределах порогового сходства с ранее принятым поисковым запросом "Каким является счет игры Акул". Завершающая часть 108 поисковой машины определяет, что окончательная транскрипция "Какой счет игры Акул" высказывания находится в пределах порогового сходства с "Каким является счет игры Акул" ранее принятого поискового запроса. В некоторых примерах пороговое сходство основывается на интервале редактирования между окончательной транскрипцией высказывания и ранее принятым поисковым запросом.

[0037] Завершающая часть 108 поисковой системы предоставляет ранее принятый поисковый запрос Q1 клиентской части 104 поисковой системы или указание ранее принятого поискового запроса Q1 клиентской части 104 поисковой системы. Клиентская часть 104 поисковой системы осуществляет доступ к кэшу 114, чтобы идентифицировать соответствующий результат, который связан с ранее принятым поисковым запросом Q1. В частности, клиентская часть 104 поисковой системы идентифицирует ассоциативную связь между ранее принятым поисковым запросом Q1 и результатом R1, которая сохранена посредством кэша 114, и принимает результат R1 во время t9. В некоторых примерах, в ответ на идентификацию ассоциативной связи между ранее принятым поисковым запросом Q1 и результатом R1, клиентская часть 104 поисковой системы удаляет из кэша 114 запрос Q2, результат R2 и ассоциативную связь между запросом Q2 и результатом R2.

[0038] Завершающая часть 108 поисковой системы предоставляет сохраненный результат R1 для вывода мобильному вычислительному устройству 102 во время t10. В ответ на то, что завершающая часть 108 поисковой системы определяет, что окончательная транскрипция "Какой счет игры Акул" высказывания также связана с ранее принятым поисковым запросом Q1, клиентская часть 104 поисковой системы предоставляет сохраненный результат R1 для вывода мобильному вычислительному устройству 102.

[0039] Фиг. 2 изображает блок-схему последовательности операций примерного процесса 200 для получения результатов поиска на основе промежуточной транскрипции высказывания. Примерный процесс 200 может быть выполнен с помощью одного или более вычислительных устройств. Например, мобильное вычислительное устройство 102, клиентская часть 104 поисковой системы, средство 106 распознавания слитной речи, завершающая часть 108 поисковой системы и/или поисковая машина 112 могут быть использованы, чтобы исполнять примерный процесс 200.

[0040] Принимаются аудиоданные, которые кодируют высказывание (202). В частности, клиентская часть 104 поисковой системы принимает аудиоданные от мобильного вычислительного устройства 102. Например, аудиоданные включают в себя начальный фрагмент высказывания, например, "Бронирование авиабилета в".

[0041] Получается промежуточная транскрипция высказывания (204). В частности, средство 106 распознавания слитной речи формирует промежуточную транскрипцию высказывания. Например, средство 106 распознавания слитной речи транскрибирует высказывание, чтобы формировать транскрипцию для "Бронирование авиабилета в". Клиентская часть 104 поисковой системы получает промежуточную транскрипцию высказывания от средства 106 распознавания слитной речи.

[0042] Промежуточная транскрипция высказывания определяется как связанная с ранее принятым поисковым запросом (206). В частности, перед получением окончательной транскрипции высказывания, завершающая часть 108 поисковой системы определяет, что промежуточная транскрипция высказывания связана с ранее принятым поисковым запросом. Например, завершающая часть 108 поисковой системы определяет, что промежуточная транскрипция "Бронирование авиабилета в" высказывания связана с ранее принятым поисковым запросом QA "Бронирование авиабилета в Остин", а также связана с ранее принятым поисковым запросом QB "Бронирование авиабилета в Мехико".

[0043] Получаются результаты, которые отвечают на ранее принятый поисковый запрос (208). В частности, перед получением окончательной транскрипции высказывания, поисковая машина 112 выполняет ранее принятые поисковые запросы, чтобы идентифицировать результаты, которые отвечают на ранее принятые поисковые запросы. Например, поисковая машина 112 проводит поиск электронных документов для таких запросов QA и QB, чтобы идентифицировать результаты RA и RB, которые отвечают на запросы QA и QB, соответственно. Клиентская часть 104 поисковой системы получает результаты RA и RB от поисковой машины.

[0044] Результаты сохраняются (210). В частности, перед получением окончательной транскрипции высказывания, клиентская часть 104 поисковой системы сохраняет результаты в кэше. Например, клиентская часть 104 поисковой системы сохраняет запрос QA, результат RA и ассоциативную связь между запросом QA и результатом RA в кэше 114 и дополнительно сохраняет запрос QB, результат RB и ассоциативную связь между запросом QB и результатом RB в кэше 114.

[0045] Фиг. 3 изображает блок-схему последовательности операций примерного процесса 300 для предоставления результатов поиска для окончательной транскрипции высказывания. Примерный процесс 300 может быть выполнен с помощью одного или более вычислительных устройств. Например, мобильное вычислительное устройство 102, клиентская часть 104 поисковой системы, средство 106 распознавания слитной речи, завершающая часть 108 поисковой системы и/или поисковая машина 112 могут быть использованы, чтобы исполнять примерный процесс 300.

[0046] Получается окончательная транскрипция высказывания (302). В частности, средство 106 распознавания слитной речи формирует окончательную транскрипцию высказывания. Например, средство 106 распознавания слитной речи транскрибирует все высказывание, чтобы формировать окончательную транскрипцию "Бронирование авиабилета в Остин". Клиентская часть 104 поисковой системы получает окончательную транскрипцию высказывания от средства 106 распознавания слитной речи.

[0047] Окончательная транскрипция высказывания определяется как также связанная с ранее принятым поисковым запросом (304). В частности, завершающая часть 108 поисковой системы определяет, что окончательная транскрипция высказывания также связана с ранее принятым поисковым запросом. Например, завершающая часть 108 поисковой системы определяет, что окончательная транскрипция "Бронирование авиабилета в Остин" связана с ранее принятым поисковым запросом QA "Бронирование авиабилета в Остин".

[0048] В ответ на определение, что окончательная транскрипция высказывания также связана с ранее принятым поисковым запросом, сохраненные результаты предоставляются для вывода. В частности, клиентская часть 104 поисковой системы осуществляет доступ к кэшу 114, чтобы идентифицировать соответствующий результат, который связана с ранее принятым поисковым запросом. В ответ на то, что завершающая часть 108 поисковой системы определяет, что окончательная транскрипция "Бронирование авиабилета в Остин" высказывания также связана с ранее принятым поисковым запросом QA, клиентская часть 104 поисковой системы предоставляет сохраненный результат RA для вывода мобильному вычислительному устройству 102.

[0049] Фиг. 4 показывает пример типичного компьютерного устройства 400 и типичного мобильного компьютерного устройства 440, которые могут быть использованы с техническими приемами, описанными здесь. Вычислительное устройство 400 предназначается для того, чтобы представлять различные формы цифровых компьютеров, таких как портативные компьютеры, настольные компьютеры, рабочие станции, персональные цифровые помощники, серверы, blade-серверы, универсальные вычислительные машины и другие подходящие компьютеры. Вычислительное устройство 400 предназначается для того, чтобы представлять различные формы мобильных устройств, таких как персональные цифровые помощники, сотовые телефоны, смартфоны и другие аналогичные вычислительные устройства. Компоненты, показанные здесь, их соединения и взаимосвязи, и их функции, предназначены быть только примерами и не предназначены ограничивать реализации изобретения, описанные и/или заявленные в этом документе.

[0050] Вычислительное устройство 400 включает в себя процессор 402, память 404, устройство 406 хранения, высокоскоростной интерфейс 408, присоединенный к памяти 404 и высокоскоростным портам 410 расширения, и низкоскоростной интерфейс 412, присоединенный к низкоскоростной шине 414 и устройству 406 хранения. Каждый из компонентов 402, 404, 406, 408, 410 и 412 взаимно соединяются с помощью различных шин и могут быть установлены на общей материнской плате или другими способами в случае необходимости. Процессор 402 может обрабатывать инструкции для исполнения в вычислительном устройстве 400, в том числе инструкции, сохраненные в памяти 404 или на устройстве 406 хранения, чтобы отображать графическую информацию для GUI на внешнем устройстве ввода/вывода, таком как дисплей 416, соединенный с высокоскоростным интерфейсом 408. В других реализациях может быть использовано множество процессоров и/или множество шин, при необходимости, вместе с множеством запоминающих устройств и типов запоминающего устройства. Также, множество вычислительных устройств 400 может быть соединено, при этом каждое устройство обеспечивает фрагменты необходимых операций (например, в качестве банка серверов, группы blade-серверов или многопроцессорной системы).

[0051] Память 404 хранит информацию в вычислительном устройстве 400. В одной реализации память 404 является энергозависимым запоминающим устройством или устройствами. В другой реализации память 404 является энергонезависимым запоминающим устройством или устройствами. Память 404 может также быть другой формой компьютерно-читаемого носителя, такой как магнитный или оптический диск.

[0052] Устройство 406 хранения способно предоставлять массовое запоминающее устройство для вычислительного устройства 400. В одной реализации устройство 406 хранения может быть или включать в себя компьютерно-читаемый носитель, такой как накопитель на гибких дисках, накопитель на жестких дисках, накопитель на оптических дисках или ленточное устройство, флэш-память или другое аналогичное твердотельное запоминающее устройство, или массив устройств, включающий в себя устройства в сети устройств хранения данных или других конфигурациях. Компьютерный программный продукт может быть материально осуществлен в носителе информации. Компьютерный программный продукт может также содержать инструкции, которые, когда исполняются, выполняют один или более способов, таких как способы, описанные выше. Носитель информации является компьютерно- или машиночитаемым носителем, таким как память 404, устройство 406 хранения или память в процессоре 402.

[0053] Высокоскоростной интерфейс 408 управляет операциями с интенсивной пропускной способностью для вычислительного устройства 400, в то время как низкоскоростной интерфейс 412 управляет операциями с менее интенсивной пропускной способностью. Такое распределение функций является лишь примерным. В одной реализации высокоскоростной интерфейс 408 соединяется с памятью 404, дисплеем 416 (например, через графический процессор или акселератор) и с высокоскоростными портами 410 расширения, которые могут принимать различные карты расширения (не показаны) В реализации, низкоскоростной контроллер 412 соединяется с устройством 406 хранения и низкоскоростным портом 414 расширения. Низкоскоростной порт расширения, который может включать в себя различные порты связи (например, USB, Bluetooth, Ethernet, беспроводной Ethernet), может быть соединен с одним или более устройствами ввода/вывода, такими как клавиатура, указывающее устройство, сканер, или сетевым устройством, таким как коммутатор или маршрутизатор, например, через сетевой адаптер. В некоторых примерах устройство 406 хранения соединяется с высокоскоростной шиной.

[0054] Вычислительное устройство 400 может быть реализовано во множестве различных форм, как показано на чертеже. Например, оно может быть реализовано как обычный сервер 420, или множество раз в группе таких серверов. Оно может также быть реализовано как часть системы 424 стоечного сервера. Кроме того, оно может быть реализовано в персональном компьютере, таком как портативный компьютер 422. Альтернативно, компоненты из вычислительного устройства 400 могут быть объединены с другими компонентами в мобильном устройстве (не показано), таким как устройство 440. Каждое из таких устройств может содержать одно или более вычислительных устройств 400, 440, и вся система может быть создана из множества вычислительных устройств, связывающихся друг с другом.

[0055] Вычислительное устройство 440 включает в себя процессор 452, память 464, устройство ввода/вывода, такое как дисплей 454, интерфейс 476 связи и приемопередатчик 468, среди других компонентов. Устройство 440 может также быть снабжено устройством хранения, таким как микронакопитель или другое устройство, чтобы предоставлять дополнительное хранилище. Каждый из компонентов 440, 452, 464, 454, 476 и 468 взаимно связываются с помощью различных шин, и несколько компонентов могут быть установлены на общей материнской плате или другими способами при необходимости.

[0056] Процессор 452 может исполнять инструкции в мобильном вычислительном устройстве 640, включающие в себя инструкции, сохраненные в памяти 464. Процессор может быть реализован как набор микросхем, который включает в себя отдельные и многочисленные аналоговые и цифровые процессоры. Процессор может предоставляться, например, для координации других компонентов устройства 440, например, управление пользовательскими интерфейсами, приложениями, запускаемыми устройством 440, и беспроводной связью посредством устройства 440.

[0057] Процессор 452 может связываться с пользователем через интерфейс 458 управления и интерфейс 446 дисплея, соединенный с дисплеем 454. Дисплей 454 может быть, например, TFT LCD (тонкопленочным транзисторным жидкокристаллическим дисплеем) дисплеем или OLED (органическим светоизлучающим диодным) дисплеем или другой подходящей технологией отображения. Интерфейс 446 дисплея может содержать соответствующую схему для возбуждения дисплея 454, чтобы представлять графическую и другую информацию пользователю. Интерфейс 448 управления может принимать команды от пользователя и преобразовывать их для предоставления процессору 452. Кроме того, внешний интерфейс 462 может обеспечивать связь с процессором 452, с тем, чтобы предоставлять возможность связи в ближней области устройства 440 с другими устройствами. Внешний интерфейс 462 может предусматриваться, например, для проводной связи в некоторых реализациях, или для беспроводной связи в других реализациях, и также может быть использовано множество интерфейсов.

[0058] Память 464 хранит информацию в вычислительном устройстве 440. Память 464 может быть реализована как один или более компьютерно-читаемый носитель или носители, энергозависимое запоминающее устройство или устройства или энергонезависимое запоминающее устройство или устройства. Дополнительная память 444 может также быть предусмотрена и соединена с устройством 440 через интерфейс 442 расширения, который может включать в себя, например, интерфейсную плату SIMM (модуль памяти с односторонним расположением выводов). Такая дополнительная память 444 может обеспечивать дополнительное пространство хранения для устройства 440 или может также хранить приложения или другую информацию для устройства 440. В частности, дополнительная память 444 может включать в себя инструкции, чтобы выполнять или дополнять процессы, описанные выше, и может включать в себя также защищенную информацию. Таким образом, например, дополнительная память 444 может быть предусмотрена как модуль безопасности для устройства 440 и может быть запрограммирована с помощью инструкций, которые разрешают безопасное использование устройства 440. Кроме того, защищенные приложения могут быть предоставлены через SIMM-платы, вместе с дополнительной информацией, такой как информация, идентифицирующая размещение на SIMM-плате, неуязвимым для хакерских атак образом.

[0059] Память может включать в себя, например, флэш-память и/или NVRAM-память, как обсуждается ниже. В одной реализации компьютерный программный продукт материально осуществляется в носителе информации. Компьютерный программный продукт содержит инструкции, которые, когда исполняются, выполняют один или более способов, таких как способы, описанные выше. Носитель информации является компьютерно- или машиночитаемым носителем, таким как память 464, дополнительная память 444, память в процессоре 452 или распространяемый сигнал, который может быть принят, например, через приемопередатчик 468 или внешний интерфейс 462.

[0060] Устройство 440 может связываться беспроводным образом через интерфейс 476 связи, который может включать в себя схему обработки цифровых сигналов, где необходимо. Интерфейс 476 связи может обеспечивать связь в различных режимах или протоколах, таких как GSM-голосовые вызовы, обмен сообщениями SMS, EMS или MMS, CDMA, TDMA, PDC, WCDMA, CDMA2000 или GPRS, среди прочих. Такая связь может происходить, например, через радиочастотный приемопередатчик 468. Кроме того, связь малого радиуса действия может происходить, например, с помощью Bluetooth, WiFi или другой такой приемопередатчик (не показан). Кроме того, модуль 440 приемника GPS (системы глобального позиционирования) может предоставлять дополнительные навигационные и соотносящиеся к местоположению беспроводные данные устройству 440, которые могут быть использованы при необходимости приложениями, работающими на устройстве 440.

[0061] Устройство 440 может также связываться звуковым образом с помощью аудиокодека 460, который может принимать произносимую информацию от пользователя и преобразовывать ее в пригодную для использования цифровую информацию. Аудиокодек 460 может аналогично формировать слышимый звук для пользователя, например, через динамик, например, в телефонной трубке устройства 440. Такой звук может включать в себя звук от голосовых телефонных вызовов, может включать в себя записанный звук (например, голосовые сообщения, музыкальные файлы и т.д.) и может также включать в себя звук, формируемый приложениями, работающими на устройстве 440.

[0062] Вычислительное устройство 440 может быть реализовано во множестве различных форм, как показано на чертеже. Например, оно может быть реализовано как сотовый телефон 480. Оно может также быть реализовано как часть смартфона 482, персонального цифрового помощника или другого аналогичного мобильного устройства.

[0063] Различные реализации систем и технических способов, описанных здесь, могут быть реализованы в цифровой электронной схеме, интегральной схеме, специально разработанных ASIC (специализированных интегральных схемах), аппаратных средствах компьютера, программно-аппаратных средствах, программном обеспечении и/или их сочетаниях. Эти различные реализации могут включать в себя реализацию в одной или более компьютерных программах, которые являются исполняемыми и/или интерпретируемыми на программируемой системе, включающей в себя, по меньшей мере, один программируемый процессор, который может быть специального или общего назначения, соединенный, чтобы принимать данные и инструкции от, и передавать данные и инструкции в, системы хранения, по меньшей мере, одного устройства ввода и, по меньшей мере, одного устройства вывода.

[0064] Эти компьютерные программы (также известные как программы, программное обеспечение, приложения системы программного обеспечения или код) включают в себя машинные инструкции для программируемого процессора и могут быть реализованы на процедурном и/или объектно-ориентированном языке программирования высокого уровня и/или на языке ассемблера/машины. Когда используются в данном документе, выражения "машиночитаемый носитель" и "компьютерно-читаемый носитель" ссылаются на любой компьютерный программный продукт, аппаратное средство и/или устройство (например, магнитные диски, оптические диски, память, программируемые логические устройства (PLD)), используемое для предоставления машинных инструкций и/или данных программируемому процессору, включающие в себя машиночитаемый носитель, который принимает машинные инструкции в качестве машиночитаемого сигнала. Выражение "машиночитаемый сигнал" ссылается на любой сигнал, используемый, чтобы предоставлять машинные инструкции и/или данные программируемому процессору.

[0065] Чтобы обеспечивать взаимодействие с пользователем, системы и технические приемы, описанные здесь, могут быть реализованы на компьютере, имеющем устройство отображения, например, CRT (катодно-лучевая трубка) или LCD (жидкокристаллический дисплей) монитор, для отображения информации пользователю и клавиатуру и указывающее устройство, например, мышь или трекбол, посредством которых пользователь может предоставлять входные данные компьютеру. Другие виды устройств могут быть использованы, чтобы также обеспечивать взаимодействие с пользователем; например, обратная связь, предоставляемая пользователю, может быть любой формой сенсорной обратной связи, например, визуальной обратной связью, звуковой обратной связью или тактильной обратной связью); и входные данные от пользователя могут приниматься в любой форме, включающей в себя акустический, речевой или тактильный ввод.

[0066] Системы и методы, описанные здесь, могут быть реализованы в вычислительной системе, которая включает в себя внутренний компонент (например, в качестве сервера данных), или которая включает в себя промежуточный компонент (например, сервер приложений), или которая включает в себя компонент первичной обработки данных (например, клиентский компьютер, имеющий графический пользовательский интерфейс или веб-браузер, посредством которого пользователь может взаимодействовать с реализацией систем и методов, описанных здесь), или любую комбинацию таких внутренних, промежуточных или компонентов первичной обработки данных. Компоненты системы могут быть взаимосвязаны посредством любой формы или носителя для обмена цифровыми данными (например, сети связи). Примеры сетей связи включают в себя локальную вычислительную сеть (LAN), глобальную вычислительную сеть (WAN) и Интернет.

[0067] Вычислительная система может включать в себя клиентов и серверы. Клиент и сервер, как правило, удалены друг от друга и типично взаимодействуют через сеть связи. Отношение клиента и сервера возникает посредством компьютерных программ, работающих на соответствующих компьютерах и имеющих отношение клиент-сервер друг с другом.

[0068] В то время как это изобретение включает в себя некоторые особенности, они не должны истолковываться как ограничения рамок изобретения или того, что может быть заявлено, а скорее как описания признаков примерных реализаций изобретения. Некоторые признаки, которые описываются в этом описании изобретения в контексте отдельных реализаций, могут также быть предоставлены в сочетании в одной реализации. Наоборот, различные признаки, которые описываются в контексте одной реализации, могут также быть предоставлены во множестве реализаций отдельно или в любой подходящей подкомбинации. Более того, хотя признаки могут быть описаны выше как действующие в некоторых комбинациях и даже первоначально заявленные как таковые, один или более признаков из заявленной комбинации могут в некоторых случаях быть удалены из комбинации, и заявленная комбинация может быть направлена на подкомбинацию или вариант подкомбинации.

[0069] Аналогично, хотя операции проиллюстрированы на чертежах в конкретном порядке, это не следует понимать как обязательность того, что такие операции должны выполняться в конкретном показанном порядке либо в последовательном порядке, или что все проиллюстрированные операции должны выполняться для того, чтобы достигать требуемых результатов. При определенных обстоятельствах может быть преимущественной многозадачная и параллельная обработка. Кроме того, разделение различных компонентов системы в вариантах осуществления, описанных выше, не должно пониматься как требующее такого разделения во всех вариантах осуществления, и должно быть понятно, что описанные программные компоненты и системы могут, в целом, быть объединены вместе в единый программный продукт или упакованы во множество программных продуктов.

[0070] Таким образом, отдельные реализации настоящего изобретения были описаны. Другие реализации находятся в рамках последующей формулы изобретения. Например, действия, перечисленные в формуле изобретения, могут быть выполнены в другом порядке и все еще добиваться желаемых результатов. Был описан ряд реализаций. Тем не менее, будет понятно, что различные модификации могут быть выполнены без отступления от духа и рамок изобретения. Например, различные формы последовательностей операций, показанных выше, могут быть использованы, с переупорядоченными, добавленными или удаленными этапами. Соответственно, другие реализации находятся в рамках последующей формулы изобретения.

[0071] Например, в вышеописанных реализациях начальный фрагмент высказывания обнаруживается в мобильном устройстве 102. Однако, изобретение не ограничивается этим, и начальный фрагмент высказывания может альтернативно быть обнаружен где-либо еще, например, посредством клиентской части 104 поисковой системы или средства 106 распознавания слитной речи.

Похожие патенты RU2701082C1

название год авторы номер документа
Способ и система для синтеза речи из текста 2017
  • Кириченко Владимир Владимирович
  • Луференко Петр Владиславович
RU2692051C1
СИСТЕМА ГОЛОСОВЫХ ДЕЙСТВИЙ РАЗРАБОТЧИКА 2016
  • Ван Бо
  • Вемури Сунил
  • Джеймс Барнаби Джон
  • Хаффман Скотт Б.
  • Гупта Правир Кумар
RU2704876C1
КОНТЕКСТНЫЕ ДЕЙСТВИЯ В ГОЛОСОВОМ ПОЛЬЗОВАТЕЛЬСКОМ ИНТЕРФЕЙСЕ 2015
  • Кайкин Джил Эрез
  • Степанич Даррон Дж.
  • Бай Энни И.
  • Ян Чэнуан
  • Сето Джули Криста
  • Тхота Венкатешвар Рао
  • Йю Джейми
  • Кришна Ом
  • Воуджел Мэттью Э.
RU2701129C2
ПРЕДСТАВЛЕНИЕ СЛИТНОГО ВИДА ЯРЛЫКОВ НА УДАЛЕННЫЕ ПРИЛОЖЕНИЯ ОТ МНОЖЕСТВА ПОСТАВЩИКОВ 2004
  • Броквей Тэд Дэннис
  • Лейтман Роберт К.
RU2367009C2
СИСТЕМА И СПОСОБ ОБНАРУЖЕНИЯ ОРФАННЫХ ВЫСКАЗЫВАНИЙ 2015
  • Тур Гокхан
  • Деорас Ануп
  • Хаккани-Тур Дилек
RU2699399C2
ИЗУЧЕНИЕ И ИСПОЛЬЗОВАНИЕ КОНТЕКСТНЫХ ПРАВИЛ ИЗВЛЕЧЕНИЯ КОНТЕНТА ДЛЯ УСТРАНЕНИЯ НЕОДНОЗНАЧНОСТИ ЗАПРОСОВ 2015
  • Беннетт Пол
  • Коллинз-Томпсон Кевин
  • Саркизова Сирануш
  • Шокоухи Милад
  • Слоан Марк
RU2701110C2
СПОСОБ И СЕРВЕР ТРАНСКРИПЦИИ ЛЕКСИЧЕСКОЙ ЕДИНИЦЫ ИЗ ПЕРВОГО АЛФАВИТА ВО ВТОРОЙ АЛФАВИТ 2015
  • Зеленков Юрий Григорьевич
RU2632137C2
СПОСОБЫ И УСТРОЙСТВО ДЛЯ ОСУЩЕСТВЛЕНИЯ РАСПРЕДЕЛЕННЫХ МНОГОМОДАЛЬНЫХ ПРИЛОЖЕНИЙ 2008
  • Пирс Майкл Д.
  • Энджелсма Джонатан Р.
  • Ферранс Джеймс С.
RU2494444C2
УПРАВЛЕНИЕ ПОСТАВЩИКАМИ ДАННЫХ ДЛЯ ДИАЛОГА 2016
  • Элсон Дэвид Клайджер
  • Уипп Дэвид П.
  • Йеошуа Шир Джудит
RU2690199C1
СПОСОБЫ И ЭЛЕКТРОННЫЕ УСТРОЙСТВА ДЛЯ ОПРЕДЕЛЕНИЯ НАМЕРЕНИЯ, СВЯЗАННОГО С ПРОИЗНЕСЕННЫМ ВЫСКАЗЫВАНИЕМ ПОЛЬЗОВАТЕЛЯ 2018
  • Карпухин Иван Александрович
RU2711153C2

Иллюстрации к изобретению RU 2 701 082 C1

Реферат патента 2019 года УПРЕЖДАЮЩАЯ ВЫБОРКА РЕЗУЛЬТАТОВ ПОИСКА ДЛЯ ГОЛОСОВЫХ ЗАПРОСОВ

Изобретение относится к способу, машиночитаемому носителю и системе получения результатов поиска на основе промежуточной транскрипции высказывания. Технический результат заключается в автоматизации поиска данных. В способе принимают аудиоданные, кодирующие высказывание; получают промежуточную транскрипцию высказывания; прежде чем будет получена окончательная транскрипция высказывания: определяют, что промежуточная транскрипция высказывания связана с ранее принятым поисковым запросом, получают один или более результатов, которые идентифицируются как отвечающие на этот ранее принятый поисковый запрос, и сохраняют один или более из упомянутых результатов; получают окончательную транскрипцию высказывания; определяют, что окончательная транскрипция высказывания также связана с упомянутым ранее принятым поисковым запросом; и в ответ на определение того, что окончательная транскрипция высказывания также связана с упомянутым ранее принятым поисковым запросом, предоставляют сохраненные один или более результатов для вывода. 3 н. и 14 з.п. ф-лы, 5 ил.

Формула изобретения RU 2 701 082 C1

1. Компьютерно-реализуемый способ получения результатов поиска на основе промежуточной транскрипции высказывания, содержащий этапы, на которых:

принимают аудиоданные, кодирующие высказывание;

получают промежуточную транскрипцию высказывания;

прежде чем будет получена окончательная транскрипция высказывания:

i) определяют, что промежуточная транскрипция высказывания связана с ранее принятым поисковым запросом,

ii) получают один или более результатов, которые идентифицируются как отвечающие на этот ранее принятый поисковый запрос, и

iii) сохраняют один или более из упомянутых результатов;

получают окончательную транскрипцию высказывания;

определяют, что окончательная транскрипция высказывания также связана с упомянутым ранее принятым поисковым запросом; и

в ответ на определение того, что окончательная транскрипция высказывания также связана с упомянутым ранее принятым поисковым запросом, предоставляют сохраненные один или более результатов для вывода.

2. Способ по п.1, дополнительно содержащий этап, на котором определяют, что промежуточная транскрипция высказывания имеет пороговый размер, при этом промежуточная транскрипция высказывания определяется как связанная с ранее принятым поисковым запросом только после определения того, что промежуточная транскрипция имеет пороговый размер.

3. Способ по п.1 или 2, в котором промежуточная транскрипция высказывания формируется средством распознавания слитной речи, при этом упомянутые один или более результатов получаются от поисковой машины.

4. Способ по п.1, 2 или 3, дополнительно содержащий, после определения, что промежуточная транскрипция высказывания связана с ранее принятым поисковым запросом, этап, на котором предоставляют ранее принятый поисковый запрос для повторного исполнения поисковой машиной.

5. Способ по любому предшествующему пункту, в котором определение того, что промежуточная транскрипция высказывания связана с ранее принятым поисковым запросом, содержит этап, на котором определяют, что местоположение, связанное с высказыванием, соответствует местоположению, относящемуся к ранее принятому поисковому запросу.

6. Способ по любому предшествующему пункту, в котором определение того, что промежуточная транскрипция высказывания связана с ранее принятым поисковым запросом, содержит этап, на котором определяют, что промежуточная транскрипция высказывания связана с ранее принятым поисковым запросом, который был предоставлен тем же пользователем, который связан с высказыванием.

7. Способ по любому из пп.1-5, в котором определение того, что промежуточная транскрипция высказывания связана с ранее принятым поисковым запросом, содержит этап, на котором определяют, что промежуточная транскрипция высказывания связана с ранее принятым поисковым запросом, который был предоставлен пользователем, отличным от пользователя, который связан с высказыванием.

8. Способ по любому предшествующему пункту, в котором высказывание является голосовой командой, отличной от голосового запроса.

9. Способ по любому предшествующему пункту, в котором определение того, что промежуточная транскрипция высказывания связана с ранее принятым поисковым запросом, дополнительно содержит этап, на котором определяют, что промежуточная транскрипция высказывания является идентичной фрагменту ранее принятого поискового запроса.

10. Способ по любому из пп.1-8, в котором определение того, что промежуточная транскрипция высказывания связана с ранее принятым поисковым запросом, дополнительно содержит этап, на котором определяют, что промежуточная транскрипция высказывания находится в пределах порогового сходства с фрагментом ранее принятого поискового запроса.

11. Система для получения результатов поиска на основе промежуточной транскрипции высказывания, содержащая:

один или более компьютеров и одно или более запоминающих устройств, хранящих инструкции, которые предназначены, при их исполнении одним или более компьютерами, предписывать одному или более компьютерам выполнять операции, содержащие:

прием аудиоданных, кодирующих высказывание;

получение промежуточной транскрипции высказывания;

прежде чем будет получена окончательная транскрипция высказывания:

i) определение того, что промежуточная транскрипция высказывания связана с ранее принятым поисковым запросом,

ii) получение одного или более результатов, которые идентифицируются как отвечающие на этот ранее принятый поисковый запрос, и

iii) сохранение одного или более из упомянутых результатов;

получение окончательной транскрипции высказывания;

определение того, что окончательная транскрипция высказывания также связана с упомянутым ранее принятым поисковым запросом; и

в ответ на определение того, что окончательная транскрипция высказывания также связана с упомянутым ранее принятым поисковым запросом, предоставление сохраненных одного или более результатов для вывода.

12. Система по п.11, в которой операции дополнительно содержат определение того, что промежуточная транскрипция высказывания имеет пороговый размер, при этом промежуточная транскрипция высказывания определяется как связанная с ранее принятым поисковым запросом только после определения того, что промежуточная транскрипция имеет пороговый размер.

13. Система по п.11 или 12, в которой промежуточная транскрипция высказывания формируется средством распознавания слитной речи, при этом упомянутые один или более результатов получаются от поисковой машины.

14. Система по пп.11, 12 или 13, в которой операции дополнительно содержат, после определения того, что промежуточная транскрипция высказывания связана с ранее принятым поисковым запросом, предоставление ранее принятого поискового запроса для повторного исполнения поисковой машиной.

15. Система по пп.11, 12, 13 или 14, в которой определение того, что промежуточная транскрипция высказывания связана с ранее принятым поисковым запросом, содержит определение того, что местоположение, связанное с высказыванием, соответствует местоположению, относящемуся к ранее принятому поисковому запросу.

16. Система по пп.11, 12, 13, 14 или 15, в которой определение того, что промежуточная транскрипция высказывания связана с ранее принятым поисковым запросом, содержит определение того, что промежуточная транскрипция высказывания связана с ранее принятым поисковым запросом, который был предоставлен тем же пользователем, который связан с высказыванием.

17. Машиночитаемый носитель, хранящий программное обеспечение, содержащее инструкции, исполняемые одним или более компьютерами, которые, при таком исполнении, предписывают одному или более компьютерам выполнять операции, содержащие способ по любому из пп.1-10.

Документы, цитированные в отчете о поиске Патент 2019 года RU2701082C1

Колосоуборка 1923
  • Беляков И.Д.
SU2009A1
Способ приготовления лака 1924
  • Петров Г.С.
SU2011A1
EP 2937860 A1, 28.10.2015
Многоступенчатая активно-реактивная турбина 1924
  • Ф. Лезель
SU2013A1
US 7836044 B2, 16.11.2010
Приспособление для суммирования отрезков прямых линий 1923
  • Иванцов Г.П.
SU2010A1
US 5995928 A1, 30.11.1999
ИСПОЛЬЗОВАНИЕ ОБРАТНОЙ СВЯЗИ С ПОЛЬЗОВАТЕЛЕМ ДЛЯ УЛУЧШЕНИЯ РЕЗУЛЬТАТОВ ПОИСКА 2007
  • Дай Джеймс
  • Фараго Джулия Х.
  • Менезеш Натала Дж.
  • Наам Рамаз
  • Сате Салил
  • Уилльямс Хью Дж.
RU2424566C2

RU 2 701 082 C1

Авторы

Тандионо Кристофер Бо

Бучанан Майкл

Ховард Натан Дэвид

Рабиновиц Ишай

Даты

2019-09-24Публикация

2016-11-18Подача