ФИЛЬТРЫ РЕЗУЛЬТАТОВ ПОИСКА ИЗ СОДЕРЖИМОГО РЕСУРСОВ Российский патент 2020 года по МПК G06F16/9535 G06F16/9538 

Описание патента на изобретение RU2719443C2

ПЕРЕКРЕСТНАЯ ССЫЛКА НА РОДСТВЕННЫЕ ЗАЯВКИ

По данной заявке, согласно 119(e) Раздела 35 Свода законов США, испрашивается приоритет заявки на патент США с порядковым номером №62/192713, озаглавленной ʺSEARCH RESULT FILTERS FROM RESOURCE CONTENTʺ, поданной 15 июля 2015. Раскрытие вышеупомянутой заявки включено в документ путем ссылки полностью во всех отношениях.

ПРЕДШЕСТВУЮЩИЙ УРОВЕНЬ ТЕХНИКИ

Интернет предоставляет доступ к широкому спектру ресурсов, например, файлам видео, файлам изображений, файлам аудио или web-страницам, включающим в себя содержимое для конкретных тематик, книжных статей или новостных статей. Поисковая система может выбирать один или несколько ресурсов в ответ на прием поискового запроса. Поисковым запросом являются данные, которые пользователь подает на поисковую машину, чтобы удовлетворить информационные потребности пользователя. Поисковые запросы обычно находятся в форме текста, например, в виде одного или нескольких терминов запроса. Поисковая система выбирает и оценивает ресурсы на основе их релевантности поисковому запросу и их важности относительно других ресурсов, чтобы предоставить результаты поиска, которые связывают с выбранными ресурсами. Результаты поиска обычно упорядочивают в соответствии с оценками и представляют в соответствии с этим порядком.

Поисковый запрос, однако, часто является неполным выражением информационной потребности пользователя. Таким образом, пользователь часто может уточнять поисковый запрос после анализа результатов поиска или может выбирать ʺпредложенный запросʺ, предоставляемый поисковой машиной, чтобы провести еще один поиск. Пользователь может также делать попытку фильтрации в рамках набора результатов поиска. Однако пользователю может потребоваться сформировать фильтрующий термин или операцию или полагаться на ʺжестко запрограммированныеʺ фильтры, которые, чтобы являться эффективными, требуют экспертных знаний и программирования заранее вместе с локализацией вручную. Кроме того, при данном динамическом характере корпуса ресурсов, доступных через Интернет, новые фильтрующие термины могут быть непредвиденными и выходить из обозрения и пользователей, и администраторов ресурсов.

СУЩНОСТЬ ИЗОБРЕТЕНИЯ

Это описание изобретения представляет технологии, относящиеся к поисковым машинам. В общем, пользователь может запрашивать информацию путем ввода запроса в поисковую машину. Поисковая машина может обработать запрос и может предоставить информацию, включая фильтры запроса, для вывода пользователю в ответ на запрос. Запросы определяются динамически, частично, из содержимого ресурсов, которые являются отвечающими условиям запроса.

В целом, один новаторский аспект изобретения, представленного в этом описании, может быть осуществлен в способах, которые включают в себя действия, в соответствии с которыми принимают, для первого запроса, данные, идентифицирующие набор ресурсов, которые определены отвечающими условиям первого запроса; извлекают, из набора ресурсов, первый набор ключевых слов из содержимого ресурсов; определяют, из первого набора ключевых слов, набор потенциально подходящих фильтров исходя из ключевых слов, причем каждый потенциально подходящий фильтр получен из одного или нескольких ключевых слов в наборе ключевых слов, и при этом набор потенциально подходящих фильтров является надлежащим поднабором первого набора ключевых слов; определяют, из набора потенциально подходящих фильтров, набор фильтров запроса, причем каждый фильтр запроса в наборе фильтров запроса удовлетворяет пороговой величине разнообразия, которая является показателем отфильтрованного набора содержимого, получаемого в результате применения фильтра запроса к набору ресурсов, и отфильтрованного набора содержимого, получаемого в результате применения другого фильтра запроса к набору ресурсов, удовлетворяющих пороговой величине различимости; и предоставляют в ответ на первый запрос, для отображения на пользовательском устройстве и вместе с результатами о содержимом, которые идентифицируют содержимое в наборе ресурсов, набор фильтров запроса для первого запроса. Другие варианты осуществления этого аспекта включают в себя соответствующие системы, устройство и компьютерные программы, сконфигурированные для выполнения действий способов, закодированных на устройствах хранения данных компьютера.

Конкретные варианты осуществления изобретения, представленного в этом описании, могут быть осуществлены с тем, чтобы реализовать одно или несколько из следующих преимуществ. Фильтры поискового запроса могут быть автоматически получены обучением в автономном режиме и/или сгенерированы во время обслуживания, улучшая рабочие характеристики системы поисковой машины и сохраняя пользователям значительную степень затрачиваемого человеком усилия; например, варианты осуществления могут помочь снизить количество шагов поиска, которые пользователь должен предпринять, чтобы найти содержимое, которое подразумевается релевантным вопросу, ответом на который он интересуется. В целом, фильтр может быть получен обучением исходя из каких-либо релевантных метаданных или текста. Например, в контексте приложения, которое используется для предоставления обзоров для некоторых предприятий, например, ресторанов, обучаемые фильтры на основе предметных обзоров и описаний могут использоваться, чтобы сузить поисковый запрос пользователя и подвести пользователя ближе к его конечной цели. Кроме того, обучаемые фильтры из предметных обзоров и описаний дают возможность представляемым фильтрам быть более приспособленными и к конкретной потребности пользователя в этот момент, и к доступным результатам, подлежащим фильтрации. Обучение фильтров на основе предметных обзоров и описаний дает возможность системе поисковой машины предоставлять результаты поиска в специфических предметных областях, которые изменяются не только в зависимости от категорийных запросов, но также и от результатов, доступных во время поиска.

Подробности одного или нескольких вариантов осуществления изобретения, представленных в этом описании изобретения, изложены на сопроводительных чертежах и в описании ниже. Другие признаки, аспекты и преимущества изобретения будут очевидными из описания, чертежей и формулы изобретения.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

Фиг. 1 - блок-схема примерной среды, в которой предоставляются фильтры из предметных обзоров и описаний.

Фиг. 2 - блок-схема примерного процесса для формирования фильтров запроса.

Фиг. 3 - блок-схема примерного процесса для предоставления фильтров запроса.

Фиг. 4 - блок-схема примерного процесса для определения набора потенциально подходящих фильтров из набора ключевых слов.

Фиг. 5 - блок-схема примерного процесса для определения набора фильтров запроса из набора потенциально подходящих фильтров.

Сходные числовые ссылочные позиции и обозначения на различных чертежах указывают сходные элементы.

ПОДРОБНОЕ ОПИСАНИЕ СУЩНОСТИ ИЗОБРЕТЕНИЯ

Общее представление

Система поисковой машины предоставляет выбираемые пользователем фильтры результатов поискового запроса для отображения на пользовательском устройстве в ответ на введенный пользователем поисковый запрос. Система принимает данные, идентифицирующие набор ресурсов, которые определены отвечающими условиям поискового запроса, и извлекает набор ключевых слов из содержимого ресурсов. Ключевые слова обрабатываются согласно критерию выбора потенциально подходящего кандидата и определяют набор потенциально подходящих фильтров запроса. Набор потенциально подходящих фильтров запроса усекают с использованием критерия разнообразия, гарантируя, что оставшиеся потенциально подходящие фильтры запроса имеют приемлемую степень разнообразия в наборах результатов поискового запроса, которые они представляют. Например, в некоторых реализациях, пары потенциально подходящих фильтров запроса сгруппированы в один потенциально подходящий фильтр, если отфильтрованные наборы результатов поискового запроса, полученные в результате применения обоих потенциально подходящих фильтров запроса, являются, по существу, сходными. Разнообразный набор потенциально подходящих фильтров запроса предоставляется для отображения на пользовательском устройстве в ответ на поисковый запрос, вместе с результатами поискового запроса.

Эти признаки и дополнительные признаки описаны более подробно ниже. В примерах, приведенных ниже, признаки описываются в контексте обычной поисковой машины. Однако, эти признаки могут применяться к любой системе или приложению, которое осуществляет поиск в хранилище данных. Например, признаки, описанные ниже, могут применяться к приложению, которое осуществляет поиск в корпусе данных, зависящем от конкретного приложения. Примером последнего является приложение мобильного телефона, которое используется, чтобы осуществлять поиск, предоставлять обзоры для ресторанов и осуществлять бронирование в ресторанах; или, альтернативно, может применяться для поиска в большом web-корпусе.

Примерная операционная среда

Фиг. 1 является блок-схемой примерной среды 100, в которой предоставляются фильтры исходя из предметных обзоров и описаний. Вычислительная сеть 102, такая как локальная сеть (LAN), глобальная сеть (WAN), сеть Интернет или комбинация этого, соединяет web-сайты 104 издателя, пользовательские устройства 106 и поисковую машину 110. Онлайновая среда 100 может включать в себя многие тысячи web-сайтов 104 издателей и пользовательских устройств 106.

Web-сайт 104 издателя включает в себя один или несколько ресурсов 105, ассоциированных с предметной областью и размещенных одним или несколькими серверами в одном или нескольких местоположениях. Обычно, web-сайт является коллекцией web-страниц, форматированных на языке гипертекстовой разметки (HTML), которые могут содержать текст, изображения, мультимедийный контент и элементы программирования, например, сценарии. Каждый web-сайт 104 поддерживается издателем контента, являющимся субъектом, который управляет, администрирует и/или владеет web-сайтом 104.

Ресурс является какими-либо данными, которые могут предоставляться web-сайтом 104 издателя по сети 102, и который имеет адрес ресурса, например, унифицированный указатель ресурса (URL). Ресурсы могут быть HTML-страницами, электронными документами, файлами изображений, файлами видео, файлами аудио и источниками web-каналов, к примеру. Ресурсы могут включать в себя вложенную информацию, например, метаинформацию и гиперссылки и/или вложенные инструкции, например, сценарии клиентской стороны.

Пользовательское устройство 106 является электронным устройством, которое находится под управлением пользователя и способно запрашивать и принимать ресурсы по сети 102. Примерные пользовательские устройства 106 включают в себя персональные компьютеры, устройства мобильной связи и другие устройства, которые могут посылать и принимать данные по сети 102. Пользовательское устройство 106 обычно включает в себя пользовательское приложение, например, web-браузер, чтобы содействовать посылке и приему данных по сети 102. Web-браузер может давать возможность пользователю отображать и взаимодействовать с текстом, изображениями, видео, музыкальной и другой информацией, обычно размещенной на web-странице на web-сайте, в глобальной сети связи или локальной сети.

Чтобы содействовать поиску этих ресурсов 105, поисковая машина 110 идентифицирует ресурсы путем просматривания web-сайтов 104 издателя и индексации ресурсов, обеспечиваемых web-сайтами 104 издателя. Ресурсы индексируются, и индексные данные сохраняются в индексе 112.

Пользовательские устройства 106 подают поисковые запросы на поисковую машину 110. Поисковые запросы подаются в форме поискового предписания, которое включает в себя поисковое предписание и, в необязательном порядке, уникальный идентификатор, который идентифицирует пользовательское устройство 106, которое подает предписание. Уникальный идентификатор может быть данными из cookie-файлов, сохраняемых в пользовательском устройстве, или идентификатором учетной записи пользователя, если пользователь имеет учетную запись с поисковой машиной 110, или некоторым другим идентификатором, который идентифицирует пользовательское устройство 106 или пользователя, использующего пользовательское устройство.

В ответ на поисковое предписание, поисковая машина 110 использует индекс 112, чтобы идентифицировать ресурсы, которые являются релевантными запросам. Поисковая машина 110 идентифицирует ресурсы в форме результатов поиска и возвращает результаты поиска на пользовательские устройства 106 в ресурсе страницы результатов поиска. Результатом поиска являются данные, сформированные поисковой машиной 110, которая идентифицирует ресурс или предоставляет информацию, которая удовлетворяет конкретному поисковому запросу. Для ресурса результат поиска может включать в себя заголовок web-страницы, отрывок текста, извлеченного из web-страницы, и указатель местоположения ресурса для ресурса, например, URL web-страницы.

Результаты поиска ранжируются на основе оценок, связанных с ресурсами, идентифицированными по результатам поиска, таких как оценки информационного поиска (ʺIRʺ), и, в необязательном порядке, отдельного ранжирования каждого ресурса относительно других ресурсов (например, оценки полномочий). Результаты поиска упорядочиваются в соответствии с этими оценками и предоставляют на пользовательское устройство в соответствии с порядком.

Кроме того, в ответ на поисковое предписание, подсистема 108 фильтрации идентифицирует фильтры поискового запроса, которые являются релевантными идентифицированным ресурсам. Подсистема 108 фильтрации идентифицирует фильтры поискового запроса в форме результатов фильтра поискового запроса и возвращает результаты фильтра поискового запроса на пользовательские устройства 106 в ресурсе страницы результатов поиска. Результатом фильтра поискового запроса являются данные, сформированные подсистемой 108 фильтрации, которая может использоваться, чтобы отфильтровать результаты поиска, которые удовлетворяют поисковому запросу, в набор фильтрованных результатов поиска, которое удовлетворяет поисковому запросу и выбранному фильтру.

Пользовательские устройства 106 принимают страницы результатов поиска, включая результаты фильтра поискового запроса, и визуализируют страницы для представления пользователям. В ответ на выбор пользователем результата поиска на пользовательском устройстве 106, пользовательское устройство 106 запрашивает ресурс, идентифицируемый указателем местоположения ресурса, включенным в выбранный результат поиска. Издатель web-сайта 104, размещающий ресурс, принимает запрос на ресурс от пользовательского устройства 106 и предоставляет ресурс на запрашивающее пользовательское устройство 106.

В ответ на выбор пользователем фильтра поискового запроса в пользовательском устройстве 106, пользовательское устройство 106 запрашивает набор отфильтрованных результатов поиска, идентифицированных указателями местоположения ресурсов, включенными в выбранный фильтр поискового запроса. Система 110 поисковой машины принимает запрос на поднабор результатов поиска от пользовательского устройства 106 и предоставляет поднабор результатов поиска на запрашивающее пользовательское устройство 106. Например, на Фиг. 1, набор результатов {SR1 … SRN} поиска показан на странице 107a результатов поиска наряду с набором фильтров {F1 … F4}. Однако, на странице 107b результатов поиска, фильтры F1 и F2 выбраны пользователем на пользовательском устройстве, приводя к отфильтрованному набору результатов поиска {SR1, SR3, … SRM}. Отфильтрованный набор результатов {SR1, SR3, … SRM} поиска является надлежащим поднабором результатов {SR1 … SRN} поиска.

В некоторых реализациях запросы, поданные от пользовательских устройств, сохраняются в журналах 114 регистрации запросов. Журналы 114 регистрации запросов задают данные предыстории поиска, которые включают в себя данные из предыдущих поисковых предписаний и относящиеся к таковым предписаниям, увязанные с уникальными идентификаторами. Журналы 114 регистрации запросов могут использоваться, чтобы соотносить запросы, поданные пользовательскими устройствами, с ресурсами, которые были идентифицированы в результатах поиска, и действиями, предпринятыми пользователями, когда представлены с результатами поиска в ответ на запросы. В некоторых реализациях данные увязываются с идентификаторами из поисковых предписаний, так что можно осуществлять доступ к предыстории поиска для каждого идентификатора. Журналы 114 регистрации запросов также могут включать в себя данные выбора, которые могут использоваться поисковой машиной, чтобы определить соответственные последовательности запросов, поданных пользовательскими устройствами, действия, предпринятые в ответ на запросы, и то, как часто запросы подавались. Подобным образом, данные выбора также могут использоваться, чтобы определять для каждого конкретного ресурса запросы, для которых пользователи находят, что ресурс, будет наиболее полезным.

Формирование фильтров из содержимого ресурсов

Работа системы 100 описывается ниже со ссылкой на Фиг. 2, которая является блок-схемой 200 примерного процесса для формирования фильтров запроса. Например, процесс 200 может выполняться системой 100 в ответ на прием поискового запроса, введенного пользователем. Процесс 200 может быть осуществлен, например, в устройстве обработки данных, которая используется для реализации подсистемы 108 фильтрации.

Система принимает поисковый запрос, введенный пользователем в пользовательском устройстве, таком как пользовательское устройство 106 по Фиг. 1 (202). Поисковый запрос может включать в себя один или несколько терминов, например, слов, чисел или символов. В некоторых исполнениях процесс вызывают, только если поисковый запрос является категорийным запросом, то есть запросом, для которого результаты поиска весьма показательны для конкретной категории, например, «питание», «развлечение» и т.д. Например, запрос "burgers" (бургеры) может быть категорийным запросом, связанным с одной или несколькими категориями "dining" (питание), "food" (пища) и "restaurants" (рестораны), к примеру. Категорийные запросы могут быть предварительно заданными поисковой машиной 110 или могут идентифицироваться во время запроса на основе, например, доминантного намерения, выведенного из содержимого отвечающих запросу ресурсов.

Система выполняет поиск в корпусе, чтобы определить набор ресурсов, которые являются отвечающими принятому поисковому запросу (204). Корпус может быть коллекцией доступных ресурсов и текста, найденного в ряде web-сайтов издателя, например, web-сайтах 104 издателя и ресурсах 105 по Фиг. 1.

Система идентифицирует отвечающие запросу ресурсы (206). Отвечающими запросу ресурсами являются ресурсы, определенные отвечающими принятому поисковому запросу согласно по меньшей мере пороговой мере, например, первые 1000 ранжированных ресурсов. Например, в ответ на прием поискового запроса "burgers" идентифицированный набор отвечающих запросу ресурсов может включать в себя меню ресторанов, ресторанные обзоры и описания.

Система осуществляет глубинный анализ корпуса отвечающих запросу ресурсов, чтобы определить соответствующий набор ключевых слов (208). Каждое ключевое слово может включать в себя одно или несколько слов, чисел или символов. Например, при приеме поискового запроса "burgers", связанный набор ключевых слов, отысканных из отвечающего запросу набора ресурсов, может включать в себя несколько тысяч близких пищевых продуктов, доступных в меню блюд. В некоторых исполнениях обзоры, описания и другие метаданные могут быть отысканы, чтобы найти наиболее часто используемые ключевые слова в корпусе отвечающих запросу ресурсов.

Система формирует корпус ключевых слов на основе глубинного анализа (210). Корпус ключевых слов включает в себя ключевые слова, например, наиболее часто используемые ключевые слова в отвечающих запросу ресурсах 206, такие как ключевые слова, которые удовлетворяют пороговой величине повторяемости относительно значений повторяемости других ключевых слов в отвечающих запросу ресурсах.

Корпус ключевых слов может быть отфильтрован, чтобы сформировать набор потенциально подходящих ключевых слов согласно критериям (211) выбора потенциально подходящего кандидата. Критерии выбора потенциально подходящего кандидата могут включать в себя запросы, для которых ресурсы 206 являются отвечающими запросу. Например, для ресурсов, отвечающих запросу "burgers", журналы 114 регистрации запросов обрабатываются подсистемой 108 фильтрации, чтобы идентифицировать другие запросы, для которых один или нескольких ресурсов выбраны с, по меньшей мере, пороговой величиной. В примере выше, для запроса "burgers", ресурсы, на основе журнала 114 регистрации запросов, могут быть отвечающими другим запросам ʺguac burgersʺ, ʺbarbeque burger restaurantsʺ и т.д. Подобным образом, запросы, которые определены связанными с запросом "burgers", также могут использоваться. В еще дополнительных примерах критерии 211 выбора потенциально подходящего кандидата могут включать в себя дополнительные ключевые слова, соответствующие категорийным поисковым запросам, связанным с поисковым запросом, введенным пользователем 202.

Использование языковой модели 116, например, может содействовать установлению фактов сходства запросов. Сходства могут основываться на морфологическом поиске, синонимах и даже индикаторах поведения, таких как сходные шаблоны щелчков выбора для различных терминов. Например, термин ʺguacʺ может быть определен подобным ʺкалифорнийскому стилюʺ в контексте ресторанов.

Система 108 фильтрации может также осуществлять фильтрацию игнорируемых слов («стоп-слов»), чтобы удалить ключевые слова, которые не являются полезными или связанными с поисковым запросом, принятым пользователем, и/или запросами из ресурсов.

Ключевые слова этих запросов сравнивают с ключевыми словами в корпусе 210, чтобы определить, какие ключевые слова следует отбросить. Например, корпус может включать в себя термин ʺheart healthyʺ (полезное для сердца). Однако, это ключевое слово может не находиться в запросах или может находиться в запросах, но с весьма низкой повторяемостью относительно других ключевых слов. Соответственно, термин ʺполезное для сердцаʺ не будет выбран в качестве потенциально подходящего ключевого слова.

Система формирует корпус (212) потенциально подходящих ключевых слов. Корпус потенциально подходящих ключевых слов включает в себя набор ключевых слов, сформированных согласно критериям 211 бора потенциально подходящего кандидата. Корпус потенциально подходящих ключевых слов может быть отфильтрован, чтобы сформировать набор фильтрующих терминов согласно критериям (213) фильтрации. Например, корпус потенциально подходящих ключевых слов может реализовывать фильтр разнообразия для потенциально подходящих ключевых слов. Фильтр разнообразия дает возможность системе определить фильтрующие термины, которые имеют высокую степень разнообразия в наборах результатов поиска, которые они представляют. В других примерах корпус потенциально подходящих ключевых слов может реализовывать фильтр выделенности терминов, чтобы отфильтровывать и удалять потенциально подходящие ключевые слова, появляющиеся только в метаданных или в незначительных местоположениях в соответствующем отвечающем запросу ресурсе 206.

Система формирует корпус фильтрующих терминов, используя корпус (214) отфильтрованных потенциально подходящих ключевых слов. Фильтрующие термины, находящиеся в корпусе фильтрующих терминов, могут быть предоставлены на пользовательское устройство. Фильтрующие термины могут показываться на пользовательском устройстве в некотором пользовательском интерфейсе или интерактивном формате и использоваться, чтобы сузить поисковый запрос для того, чтобы подвести пользователя ближе к его конечной цели.

Фиг. 3 является блок-схемой 300 другого примерного процесса для предоставления фильтров запроса. Процесс 300 может быть осуществлен в устройстве обработки данных, которая используется для реализации системы 108 фильтрации.

Подсистема 108 фильтрации принимает данные, идентифицирующие набор ресурсов, которые определены отвечающими поисковому запросу (302). В некоторых исполнениях поисковый запрос может быть категорийным запросом. Набор ресурсов может включать в себя HTML-страницы, электронные документы, файлы изображений, файлы видео, файлы аудио и источники web-канала, которые могут заключать в себе вложенную информацию, например, метаинформацию и гиперссылки. Например, пользователь мог ввести запрос "burgers", и подсистема 108 фильтрации может в свою очередь принять данные, идентифицирующие набор HTML-страниц или электронных документов, включая обзоры, описания и другие метаданные, относящиеся к близким пищевым продуктам, доступным в меню блюд.

Подсистема 108 фильтрации извлекает первый набор ключевых слов из содержимого набора ресурсов (304). Ключевое слово может включать в себя одно или несколько слов, символов или чисел, которые связаны с поисковым запросом. Например, первый набор ключевых слов может охватывать набор слов, символов или чисел, которые встречаются чаще всего в содержимом набора ресурсов, которые определены отвечающими условиям поискового запроса.

Подсистема 108 фильтрации определяет набор потенциально подходящих фильтров из первого набора ключевых слов (306). Каждый потенциально подходящий фильтр выводится из одного или нескольких ключевых слов в первом наборе ключевых слов. Набор потенциально подходящих ключевых слов является надлежащим поднабором первого набора ключевых слов.

Например, в некоторых исполнениях, подсистема 108 фильтрации может определять набор потенциально подходящих фильтров из первого набора ключевых слов путем определения набора запросов из ресурсов в наборе ресурсов, где каждый запрос в наборе запросов является запросом, для которого по меньшей мере один из ресурсов был выбран пользователем. Например, ресурс высоко ранга может быть высоко релевантным для запросов ʺguac burgersʺ и ʺwhiskey barbeque burgersʺ. Таким образом, запросы ʺguac burgersʺ и ʺwhiskey barbeque burgersʺ могут использоваться в качестве критериев выбора предположений.

В других реализациях подсистема фильтрации может определять набор потенциально подходящих фильтров из первого набора ключевых слов путем определения набора запросов из первого запроса, где каждый запрос в наборе запросов является запросом, который определен являющимся связанным с первым запросом. Например, пользователь мог ввести поисковый запрос "burgers", и подсистема 108 фильтрации может определить, что поисковый запрос "hotdogs" (булочки с сосиской) связан с поисковым запросом "burgers" и включить поисковый запрос "hotdogs" в набор критериев выбора предположений. Обработка связанных запросов для идентификации потенциально подходящих кандидатов для фильтра описана более подробно ниже со ссылкой на Фиг. 4.

Потенциально подходящие фильтры определяют путем удаления, из первого набора ключевых слов, ключевых слов, которые определены не являющимися релевантными для потенциально подходящего набора запросов из ресурсов и/или запросов, связанных с принятым запросом. Ключевые слова могут быть определены являющимися релевантными для ключевых слов запроса на основе точного совпадения или на основе удовлетворения терминов запроса пороговой величине сходства. Например, ключевое слово ʺguacamoleʺ будет релевантным для ключевого слова "guac" запроса, поскольку оба ключевых слова определены являющимися сходными. Снова, как описано выше, использование языковой модели 116 может содействовать установлению фактов сходства запросов на основе морфологического поиска, синонимов, индикаторов поведения и других семантических и/или динамических данных, которые указывают сходство терминов или понятий.

Подсистема 108 фильтрации определяет набор фильтров запроса из набора потенциально подходящих фильтров (308). В некоторых исполнениях каждый фильтр запроса в наборе фильтров запроса удовлетворяет пороговой величине разнообразия, который является показателем отфильтрованного набора содержимого, получаемого в результате применения фильтра запроса к набору ресурсов, и отфильтрованного набора содержимого, получаемого в результате применения другого фильтра запроса к набору ресурсов, удовлетворяющих пороговой величине различимости. Например, набор потенциально подходящих фильтров может включать в себя ключевые слова ʺguacamoleʺ и "guac". Система может определить, что набор содержимого, получаемый в результате применения фильтра запроса ʺguacamoleʺ к набору ресурсов для поискового запроса "burgers", может быть сходным, если не идентичным набору содержимого, получаемому в результате применения фильтра запроса ʺguacʺ к набору ресурсов для поискового запроса "burgers". При определении, что отфильтрованные наборы содержимого, получаемые в результате применения фильтра запроса ʺguacamoleʺ и ʺguacʺ, не удовлетворяют пороговой величине различимости, набор фильтров запроса не будет включать оба фильтра запроса и ʺguacamoleʺ, и "guac".

Подсистема 108 фильтрации предоставляет набор фильтров запросов для отображения на пользовательском устройстве и вместе с результатами о содержимом, которые идентифицируют содержимое в наборе ресурсов, в ответ на первый запрос (310). Например, набор фильтров запроса может быть отображен на пользовательском интерфейсе, таком как пользовательский интерфейс 107a, описанный со ссылкой на Фиг. 1. Пользовательский интерфейс может быть представлен пользователям, в ответ на введенный пользователем запрос, в web-браузере или другом приложении, которое способно предоставлять пользователям функциональную возможность запроса, например, на страницах результатов поиска, предоставленных поисковой машиной, которая доступна пользователям через web-браузер. Пользовательский интерфейс включает в себя ввод запроса, один или несколько выбираемых пользователем фильтров запроса, например, фильтры F1 - F4, и перечень результатов о содержимом или результатов поиска, например, SR1 - SRN. Ввод запроса может быть текстовым полем, если вводятся текстовые запросы, или может быть выпадающим адресом местоположения, если вводится видеозапрос, или может быть каким-либо другим вводом, который поддерживает взаимодействие пользователя для данного носителя вводимых данных. В некоторых исполнениях каждый результат о содержимом в списке результатов о содержимом является результатом поиска, который идентифицирует соответствующий ресурс в наборе ресурсов. В других реализациях каждый результат о содержимом в списке результатов о содержимом является поднабором содержимого, включенного в ресурс в наборе ресурсов.

Подсистема 108 фильтрации принимает выбор из одного или нескольких фильтров запроса от пользовательского устройства (312). Например, подсистема 108 фильтрации может принимать информацию, идентифицирующую выбор фильтров F1 и F2, как описано со ссылкой на пользовательский интерфейс 107b по Фиг. 1.

Подсистема 108 фильтрации предоставляет отфильтрованный набор содержимого, который идентифицирует набор результатов о содержимом, который отличается от нефильтрованного набора результатов о содержимом, для отображения на пользовательском устройстве (314). Отфильтрованный набор содержимого, который идентифицирует набор результатов о содержимом, является надлежащим поднабором нефильтрованного набора результатов о содержимом. Например, как описано со ссылкой на Фиг. 1, (отфильтрованная?) подсистема фильтра может определить, что были выбраны фильтры F1 и F2 запросов, и в ответ на определение, что были выбраны фильтры F1 и F2 запросов, может предоставить другой перечень результатов о содержимом SR1' - SRM'.

В других реализациях пользовательское устройство 106 может фильтровать результаты локально на пользовательском устройстве. Например, пользовательское устройство может принимать набор из N результатов поиска, например, N имеет значение 100, и отображать поднабора из M результатов поиска, например, M имеет значение 10. Когда пользователь выбирает конкретный фильтр, могут использоваться N фильтров для фильтрации N результатов поиска, сохраненных в пользовательском устройстве, чтобы модифицировать отображенные результаты поиска.

Фиг. 4 является блок-схемой примерного процесса 400 для определения набора потенциально подходящих фильтров из набора ключевых слов. Процесс 400 может быть осуществлен в устройстве обработки данных, которая используется для реализации подсистемы 108 фильтрации.

Подсистема 108 фильтрации определяет набор запросов из ресурсов в наборе ресурсов, которые определены отвечающими первому поисковому запросу (402). Каждый запрос в наборе запросов является запросом, для которого по меньшей мере один из ресурсов был выбран пользователем.

Подсистема 108 фильтрации определяет игнорируемые термины запроса из набора запросов (404). Каждый игнорируемый термин запроса является термином в наборе запросов, имеющим повторяемость, которая удовлетворяет пороговой величине повторяемости игнорируемых терминов запроса. В некоторых исполнениях подсистема 108 фильтрации может использовать грамматику, обучаемую исходя из общих, родственных или специфических запросов, чтобы вычислять повторяемость игнорируемого термина запроса для каждого из набора запросов. Каждый запрос, который достигает или превышает предопределенную пороговую величину игнорируемого термина запроса, может считаться бесполезным для поиска запроса в этом домене и классифицироваться как игнорируемый термин запроса. Например, пользователь может ввести запрос "find me cheese and guac burgersʺ и подсистема фильтрации может извлечь ключевые слова "Find me", "cheese", "and", "guac". Ключевые слова "cheese" и ʺguacʺ могут встречаться в других связанных с пищей операциях поиска, тогда как ключевые слова ʺFind meʺ и "and", которые не идентифицируют какие-либо виды пищи, имеют более высокую повторяемость, например, во многих случаях, не связанных с поисками «пищи». Подсистема фильтрации может, следовательно, определить, что ключевые слова ʺFind meʺ и "and" являются игнорируемыми терминами запроса.

Подсистема 108 фильтрации исключает игнорируемые термины запроса из набора потенциально подходящих фильтров (406). Например, в продолжение вышеупомянутого примера, подсистема фильтрации может исключить термины "Find meʺ и "and" из набора потенциально подходящих фильтров.

Система определяет информационные термины из набора запросов (408). Каждый информационный термин является термином, имеющим в наборе запросов повторяемость, которая меньше или равна пороговой величине для информационного термина. Каждый запрос, который не достигает или превышает предварительно заданную пороговую величину для информационного термина, может считаться полезным для поиска запроса в этом домене и классифицироваться как информационный термин. Например, в продолжение примера выше, пользователь может ввести запрос "find me cheese and guac burgersʺ и подсистема фильтрации может извлечь ключевые слова, "find meʺ, ʺcheeseʺ, "and", "guac". Ключевые слова "cheese" и ʺguacʺ могут иметь более низкую частоту появления в других поисковых запросах, чем ключевые слова ʺFind meʺ и "and", которые не идентифицируют какие-либо виды пищи. Подсистема фильтрации может, следовательно, определить, что ключевые слова "cheese" и ʺguacʺ являются информационными терминами.

Система включает информационные термины в набор потенциально подходящих фильтров (410). Например, в продолжение вышеупомянутого примера, подсистема фильтрации может включить термины "cheese" и ʺguacʺ в набор потенциально подходящих фильтров.

Потенциально подходящие фильтры, найденные посредством процессов по Фиг. 3 и 4, могут факультативно оцениваться на основе повторяемости ключевых слов в корпусе 210 ключевых слов, и на основе выделенности терминов в ресурсах, и других критериев. Например, термин ʺGuacamoleʺ может часто появляться в корпусе и в разделах заголовка. Однако, термин "beef" (говядина), также при частом появлении, может появляться только в разделах основной части, подчиненных заголовкам. Таким образом, термин ʺGuacamoleʺ в качестве потенциально подходящего фильтра может быть оценен выше, чем термин "beef".

Фиг. 5 является блок-схемой примерного процесса 500 для определения набора фильтров запроса из набора потенциально подходящих фильтров. Процесс 500 может быть осуществлен в устройстве обработки данных, которая используется для реализации подсистемы 108 фильтрации.

Для каждого потенциально подходящего фильтра запроса в наборе потенциально подходящих фильтров, подсистема фильтрации применяет потенциально подходящий фильтр запроса к набору ресурсов, чтобы получить соответствующее отфильтрованный набор результатов о содержимом (502). Например, набор потенциально подходящих фильтров может включать в себя потенциально подходящие фильтры ʺguacamoleʺ и "guac" запроса, и подсистема фильтрации может применять и потенциально подходящий фильтр ʺguacamoleʺ запроса, и потенциально подходящий фильтр ʺguacʺ запроса, чтобы получить два соответствующих отфильтрованного набора результатов о содержимом.

Подсистема фильтрации группирует пару потенциально подходящих фильтров запроса, для которых соответственные отфильтрованные наборы результатов о содержимом удовлетворяют пороговой величине сходства, которая является показателем, что соответственные отфильтрованные наборы результатов о содержимом являются по существу сходными (504). Например, подсистема фильтрации может определить, что отфильтрованный набор результатов о содержимом, полученных в результате применения фильтра ʺguacamoleʺ запроса, соответствует пороговой величине или превышает пороговую величину сходства для отфильтрованного набора результатов о содержимом, полученных в результате применения фильтра "guac" запроса. Подсистема фильтрации может, следовательно, сгруппировать потенциально подходящие фильтры ʺguacamoleʺ и "guac" запроса. В некоторых исполнениях подсистема фильтрации может выбрать представительный потенциально подходящий фильтр запроса для группы потенциально подходящих фильтров запроса.

Подсистема фильтрации определяет оценки качества для потенциально подходящих фильтров запроса на основе местоположений потенциально подходящих фильтров запроса в ресурсах (506). Например, потенциально подходящему фильтру запроса, который появляется в выделяющейся позиции ресурса, например, в заголовке ресурса, можно присвоить более высокую оценку качества, чем другому потенциально подходящему фильтру запроса, который появляется в метаданных, ассоциированных с ресурсом.

Подсистема фильтрации определяет набор фильтров запроса из набора потенциально подходящих фильтров (508). Набор фильтров запроса выбирают из набора потенциально подходящих фильтров на основе определенных оценок качества и разнообразия для фильтра запроса. Как описано выше со ссылкой на этап 308 по Фиг. 3, каждый фильтр запроса в наборе фильтров запроса удовлетворяет пороговой величине разнообразия, когда соответственные отфильтрованные наборы содержимого, получаемые в результате применения соответственного фильтра запроса к набору ресурсов, являются существенно отличными друг от друга. Снова, набор потенциально подходящих фильтров может включать в себя ключевые слова ʺguacamoleʺ и "guac". Система может определить, что набор содержимого, получаемый в результате применения фильтра ʺguacamoleʺ запроса к набору ресурсов для поискового запроса "burgers", может быть сходным, если не идентичным набору содержимого, получаемому в результате применения фильтра запроса ʺguacʺ к набору ресурсов для поискового запроса "burgers". Таким образом, будет выбрано только одно из ключевых слов ʺguacamoleʺ и ʺguacʺ.

Дополнительные подробности осуществления

Варианты осуществления изобретения и операций, представленные в этом описании изобретения, могут быть реализованы в цифровой электронной схеме или в программном предоставлении, микропрограммном предоставлении или аппаратных средствах компьютера, включающих структуры, раскрытые в этом описании изобретения, и их структурные эквиваленты, или в виде комбинаций одного или нескольких из них. Варианты осуществления изобретения, представленного в этом описании изобретения, могут быть реализованы в виде одной или нескольких компьютерных программ, то есть, одного или нескольких модулей инструкций компьютерных программ, закодированных на носителе данных компьютера для исполнения посредством устройства обработки данных или для управления ее работой. Альтернативно или в дополнение, инструкции программы могут быть закодированы в искусственно-сформированном распространяемом сигнале, например, в сформированном машиной электрическом, оптическом или электромагнитном сигнале, который генерируют, чтобы закодировать информацию для передачи на подходящее приемное устройство для исполнения посредством устройства обработки данных. Носителем данных компьютера может являться, или его включают в, считываемое компьютером устройство хранения данных, считываемую компьютером подложку хранения данных, массив или устройство памяти с произвольным или последовательным доступом, или комбинацию одного или нескольких из них. Кроме того, хотя носитель данных компьютера не является распространяемым сигналом, носитель данных компьютера может быть источником или получателем инструкций компьютерной программы, закодированных в искусственно-сгенерированном распространяемом сигнале. Носителем данных компьютера также может являться, или его включают в, один или несколько отдельных физических компонентов или носителей (например, несколько компакт-дисков (CD), диски или другие устройства хранения данных).

Операции, представленные в этом описании изобретения, могут быть осуществлены в виде операций, выполняемых устройством обработки данных над данными, хранимыми в одном или нескольких считываемых компьютером устройствах хранения данных или принятыми от других источников.

Выражение ʺустройство обработки данныхʺ охватывает все виды средств, устройств и машин для обработки данных, включая в качестве примера, программируемый процессор, компьютер, систему на кристалле или множество таковых, или комбинации вышеуказанных. Устройство может включать в себя специализированную логическую схему, например, FPGA (базовый матричный кристалл) или ASIC (специализированная интегральная микросхема). Устройство может также включать в себя, в дополнение к аппаратным средствам, код, который создает среду исполнения для обсуждаемой компьютерной программы, например, код, который составляет микропрограммное предоставление процессора, стек протоколов, систему управления базой данных, операционную систему, межплатформенную среду реального времени, виртуальную машину или комбинацию одного или нескольких из них. Устройство и среда исполнения могут реализовывать различные инфраструктуры вычислительной модели, такие как инфраструктуры web-услуг, распределенных вычислений и "решетки" вычислений.

Компьютерная программа (также известная как программа, программное обеспечение, приложение, сценарий или код) может быть написана на языке программирования любой формы, включая компилируемые или интерпретируемые языки, декларативные или процедурные языки, и ее можно развертывать в любой форме, включая в форме автономной программы или в форме модуля, компонента, подпрограммы, объекта или другого модуля, подходящего для использования в вычислительной среде. Компьютерная программа может, но не обязательно, соответствовать файлу в файловой системе. Программа может сохраняться в порции файла, который хранит другие программы или данные (например, один или несколько сценариев, сохраненных в документе на языке разметки), в отдельном файле, выделенном рассматриваемой программе, или в нескольких скоординированных файлах (например, файлах, которые хранят один или несколько модулей, подпрограмм или порций кода). Компьютерная программа может быть развернута для исполнения на одном компьютере или на нескольких компьютерах, которые размещены на одном сайте или распределены по множеству сайтов и связаны сетью связи.

Процессы и логические последовательности операций, представленные в этом описании изобретения, могут выполняться одним или несколькими программируемыми процессорами, исполняющими одну или несколько компьютерных программ, чтобы выполнять действия посредством обработки входных данных и формирования выходных. Процессы и логические последовательности операций могут также выполняться посредством, и устройство также может быть реализовано в виде, специализированной логической схемы, например, FPGA (базовый матричный кристалл) или ASIC (специализированная интегральная схема).

Процессоры, подходящие для исполнения компьютерной программы, включают в себя, в качестве примера, и универсальные, и специализированные микропроцессоры, и любой один или несколько процессоров для любого вида цифрового компьютера. В целом, процессор будет принимать инструкции и данные из постоянной памяти или оперативной памяти или из обеих. Существенными компонентами компьютера являются процессор для выполнения действий в соответствии с инструкциями и одно или несколько устройств памяти для сохранения инструкций и данных. В целом, компьютер будет также включать в себя, или являться функционально связанным для приема данных от или для передачи данных на, или для обоего, одно или несколько устройств внешней памяти для сохранения данных, например, магнитные, магнето-оптические диски или оптические диски. Однако компьютеру не требуется иметь такие устройства. Кроме того, компьютер может быть встроенным в другое устройство, например, мобильный телефон, персональный цифровой ассистент (PDA), мобильный аудио- или видео-плеер, игровую приставку, приемник Глобальной системы определения местоположения (GPS) или портативное устройство хранения данных (например, флеш-накопитель с интерфейсом универсальной последовательной шины (USB)), к примеру. Устройства, подходящие для сохранения инструкций компьютерной программы и данных, включают в себя все формы энергонезависимой памяти, носителей и устройств памяти, включая в качестве примера устройства полупроводниковой памяти, например, EPROM (стираемое программируемое постоянное запоминающее устройство), EEPROM (электрически-стираемое программируемое ПЗУ) и устройства флэш-памяти; магнитные диски, например, внутренние накопители на жестких дисках или съемные диски; магнето-оптические диски; и CD-ROM (ПЗУ на компакт-дисках) и диски ROM DVD (ПЗУ на цифровых многофункциональных дисках). Процессор и память могут быть дополнены специализированной логической схемой или встроены в таковую.

Для предоставления взаимодействия с пользователем, варианты осуществления изобретения, представленного в этом описании изобретения, могут быть реализованы на компьютере, имеющем устройство отображения, например, монитор на основе CRT (электронно-лучевая трубка) или LCD (жидкокристаллический дисплей) для отображения информации пользователю, и клавиатуру и указательное устройство, например, мышь или шаровой манипулятор, посредством которых пользователь может предоставлять ввод в компьютер. Другие виды устройств также могут использоваться для предоставления взаимодействия с пользователем; например, обратная связь, предоставляемая пользователю, может быть любой формой сенсорной обратной связи, например, визуальной обратной связью, слуховой обратной связью или тактильной обратной связью; и ввод от пользователя может приниматься в любой форме, включая акустический, речевой или тактильный ввод. Кроме того, компьютер может взаимодействовать с пользователем путем посылки документов на устройство и приема документов от устройства, которое используется пользователем; например, путем посылки web-страниц на web-браузер на пользовательском устройстве пользователя в ответ на запросы, принятые от web-браузера.

Варианты осуществления изобретения, представленного в этом описании изобретения, могут быть реализованы в вычислительной системе, которая включает в себя компонент серверной части, например, в качестве сервера данных, или которая включает в себя компонент промежуточного ПО, например, сервер приложений, или которая включает в себя компонент клиентской части, например, пользовательский компьютер, имеющий графический пользовательский интерфейс или web-браузер, через посредство которого пользователь может взаимодействовать с реализацией изобретения, представленного в этом описании изобретения, или любую комбинацию из одного или нескольких таких компонентов серверной части, промежуточного ПО или клиентской части. Компоненты системы могут быть взаимосвязаны посредством любой формы или среды цифровой передачи данных, например, сети связи. Примеры сетей связи включают в себя локальную сеть ("LAN") и глобальную сеть ("WAN"), объединенную сеть (например, сеть Интернет), и одноранговые сети (например, специальные («ad hoc») одноранговые сети).

Вычислительная система может включать в себя пользователей и серверы. Пользователь и сервер являются обычно удаленными друг от друга и обычно взаимодействуют через сеть связи. Отношения пользователя и сервера возникают благодаря компьютерным программам, исполняющимся на соответственных компьютерах и имеющим отношение «клиент-сервер» друг к другу. В некоторых вариантах осуществления сервер передает данные (например, HTML страницу) на пользовательское устройство (например, с целями отображения данных пользователю и приема пользовательского ввода от пользователя, взаимодействующего с пользовательским устройством). Данные, сформированные на пользовательском устройстве (например, результат пользовательского взаимодействия), могут приниматься от пользовательского устройства на сервере.

Хотя это описание изобретения содержит много специфических для реализации подробностей, их следует рассматривать не ограничениями объема каких-либо изобретений или того, что может быть в заявке, а предпочтительнее описаниями признаков, специфических для конкретных исполнений конкретных изобретений. Некоторые признаки, которые представлены в этом описании изобретения в контексте отдельных исполнений, также могут быть реализованы в комбинации в одном исполнении. Напротив, различные признаки, которые описаны в контексте отдельного исполнения, могут также быть реализованы в нескольких исполнениях отдельно или в любой подходящей подкомбинации. Кроме того, хотя признаки могут быть описаны выше в качестве действующих в некоторых комбинациях и даже первоначально заявлены как таковые, один или несколько признаков из заявленной комбинации могут в некоторых случаях исключаться из комбинации, и заявленная комбинация может быть направлена на подкомбинацию или разновидность подкомбинации.

Подобным образом, хотя операции изображены на чертежах в конкретном порядке, это не следует понимать требованием, что такие операции подлежат выполнению в конкретном показанном порядке или в последовательном порядке, или что все иллюстрируемые операции подлежат выполнению, чтобы достичь желаемых результатов. При некоторых условиях могут быть полезными многозадачность и параллельная обработка. Кроме того, разделение различных системных компонентов в вариантах осуществления, описанных выше, не следует понимать требующим такого разделения во всех вариантах осуществления, и следует понимать, что описанные программные компоненты и системы могут быть в целом объединены вместе в единый программный продукт или скомплектованы (пакетно) в несколько программных продуктов.

Таким образом, были описаны конкретные варианты осуществления изобретения. Другие варианты осуществления находятся в рамках объема последующей формулы изобретения. В некоторых случаях, действия, изложенные в формуле изобретения, могут выполняться в другом порядке и все еще достигать требуемых результатов. Кроме того, процессы, изображенные на фигурах сопроводительных чертежей, не обязательно требуют конкретного показанного порядка или последовательного порядка для достижения требуемых результатов. В некоторых исполнениях могут быть полезными многозадачность и параллельная обработка.

Положение 1. Компьютерно-реализуемый способ, содержащий этапы, на которых:

принимают, для первого запроса, данные, идентифицирующие набор ресурсов, которые определены отвечающими первому запросу;

извлекают, из набора ресурсов, первый набор ключевых слов из содержимого ресурсов;

определяют, исходя из первого набора ключевых слов, набор потенциально подходящих фильтров из ключевых слов, причем каждый потенциально подходящий фильтр получен из одного или нескольких ключевых слов в наборе ключевых слов, и при этом набор потенциально подходящих фильтров является надлежащим поднабором первого набора ключевых слов;

определяют, из набора потенциально подходящих фильтров, набор фильтров запроса, причем каждый фильтр запроса в наборе фильтров запроса удовлетворяет пороговой величине разнообразия, которая является показателем отфильтрованного набора содержимого, получаемого в результате применения фильтра запроса к набору ресурсов, и отфильтрованного набора содержимого, получаемого в результате применения другого фильтра запроса к набору ресурсов, удовлетворяющих пороговой величине различимости; и

предоставляют, в ответ на первый запрос, для отображения на пользовательском устройстве и с результатами о содержимом, которые идентифицируют содержимое в наборе ресурсов, набор фильтров запроса для первого запроса.

Положение 2. Компьютерно-реализуемый способ согласно Положению 1, дополнительно содержащий этапы, на которых:

принимают, от пользовательского устройства, выбор одного из фильтров запроса; и

предоставляют, в ответ на выбор одного фильтра из фильтров запроса, для отображения на пользовательском устройстве, отфильтрованный набор содержимого, который идентифицирует набор результатов о содержимом, который отличается от нефильтрованного набора результатов о содержимом и который является надлежащим поднабором нефильтрованного набора результатов о содержимом.

Положение 3. Компьютерно-реализуемый способ согласно Положению 2, в котором каждый результат о содержимом является результатом поиска, который идентифицирует соответствующий ресурс в наборе ресурсов.

Положение 4. Компьютерно-реализуемый способ согласно Положению 2, в котором каждый результат о содержимом является поднабором содержимого, включенного в ресурс в наборе ресурсов.

Положение 5. Способ по любому из предшествующих Положений, в котором этап определения, исходя из первого набора ключевых слов, набора потенциально подходящих фильтров из ключевых слов содержит этап, на котором определяют, исходя из ресурсов в наборе ресурсов, набор запросов, причем каждый запрос в наборе запросов является запросом, для которого по меньшей мере один из ресурсов был выбран пользователем в ответ на запрос.

Положение 6. Способ согласно Положению 5, дополнительно содержащий этапы, на которых:

определяют, исходя из набора запросов, игнорируемые термины запроса, причем каждый игнорируемый термин запроса является термином, имеющим повторяемость в наборе запросов, которая удовлетворяет пороговой величине повторяемости игнорируемых терминов запроса; и

исключают игнорируемые термины запроса в первом наборе ключевых слов из набора потенциально подходящих фильтров.

Положение 7. Способ согласно Положению 5 или 6, дополнительно содержащий этапы, на которых:

определяют, исходя из набора запросов, информационные термины, причем каждый информационный термин является термином, имеющим в наборе запросов повторяемость, которая меньше или равна пороговой величине для информационного термина;

включают информационные термины в первом наборе ключевых слов в набор потенциально подходящих фильтров.

Положение 8. Способ по любому из Положений 1-4, в котором этап определения, исходя из первого набора ключевых слов, набора потенциально подходящих фильтров из ключевых слов содержит этап, на котором определяют, исходя из первого запроса, набор запросов, причем каждый запрос в наборе запросов является запросом, который определен являющимся связанным с первым запросом.

Положение 9. Способ по любому из предшествующих Положений, в котором этап определения, из набора потенциально подходящих фильтров, набора фильтров запроса, где каждый фильтр запроса в наборе фильтров запроса удовлетворяет пороговой величине разнообразия, содержит этапы, на которых:

для каждого потенциально подходящего фильтра запроса применяют потенциально подходящий фильтр запроса к набору ресурсов, чтобы получить соответствующий отфильтрованный набор результатов о содержимом; и

группируют, в один потенциально подходящий фильтр запроса, пару потенциально подходящих фильтров запроса, для которых соответственные отфильтрованные наборы результатов о содержимом удовлетворяют пороговой величине сходства, которая является показателем того, что соответственные отфильтрованные наборы результатов о содержимом являются, по существу, сходными.

Положение 10. Способ по любому из предшествующих Положений, в котором этап определения, из набора потенциально подходящих фильтров, набора фильтров запроса, где каждый фильтр запроса в наборе фильтров запроса удовлетворяет пороговой величине разнообразия, содержит этап, на котором определяют оценку качества для каждого потенциально подходящего фильтра запроса на основе местоположений потенциально подходящего фильтра запроса в ресурсах.

Положение 11. Система, содержащая:

устройство обработки данных; и

долговременный машиночитаемый носитель, хранящий инструкции, которые являются исполняемыми устройством обработки данных и которые при таком исполнении предписывают устройству обработки данных выполнять способ по любому из предшествующих пунктов.

Положение 12. Долговременный машиночитаемый носитель, хранящий инструкции, которые являются исполняемыми устройством обработки данных и которые при таком исполнении предписывают устройству обработки данных выполнять способ по любому из Положений 1-10.

Похожие патенты RU2719443C2

название год авторы номер документа
ФИЛЬТРЫ РЕЗУЛЬТАТОВ ПОИСКА ИЗ СОДЕРЖИМОГО РЕСУРСОВ 2016
  • Макджилливрэй Ян
  • Спитц Кейлин
  • Ян Селена Суньлин
  • Сингх Варун Джасджит
  • Перски Эмма С.
  • Эрез Йонатан
RU2691840C1
ВРЕМЕННОЕ РАНЖИРОВАНИЕ РЕЗУЛЬТАТОВ ПОИСКА 2007
  • Чандрасекар Раман
  • Слоусон Дин А.
  • Форни Майкл К.
RU2435213C2
ПОСТРОЕНИЕ И ПРИМЕНЕНИЕ ВЕБ-КАТАЛОГОВ ДЛЯ ФОКУСИРОВАННОГО ПОИСКА 2005
  • Брилл Эрик Д.
  • Чен Хэрр
  • Чандрасекар Раман
  • Корстон Саймон Х.
RU2382400C2
ОБЕСПЕЧЕНИЕ ВОЗМОЖНОСТИ РЕКЛАМОДАТЕЛЯМ ПРЕДЛАГАТЬ ЦЕНУ НА АБСТРАКТНЫЕ ОБЪЕКТЫ 2011
  • Рубинштейн Бенджамин
  • Чандра Ашок
  • Дабровски Оливер
  • Джеммелл Дэвид Джеймс
  • Ли Мин-Джон
RU2589872C2
ИДЕНТИФИКАЦИЯ СЕМАНТИЧЕСКИХ ВЗАИМООТНОШЕНИЙ В КОСВЕННОЙ РЕЧИ 2008
  • Крауч Ричард
  • Ван Ден Берг Мартин
  • Ан Дэвид
  • Гуревич Оля
  • Пелл Барни
  • Полани Ливия
  • Привост Скотт
  • Тионе Джованни Лоренцо
RU2488877C2
АВТОМАТИЗИРОВАННОЕ ИЗВЛЕЧЕНИЕ ИНФОРМАЦИИ 2016
  • Нигам Пиюш
RU2693193C1
ПОИСК ПРОИЗВОЛЬНОГО ТЕКСТА И ПОИСК ПО АТРИБУТАМ В ДАННЫХ ЭЛЕКТРОННОГО РУКОВОДСТВА ПО ПРОГРАММАМ 2004
  • Сандерс Скотт Д.
RU2365984C2
Способ и сервер для ранжирования цифровых документов в ответ на запрос 2020
  • Дормидонтов Сергей Игоревич
  • Тямгин Иван Анатольевич
RU2818279C2
СПОСОБ И СЕРВЕР ДЛЯ ПОВТОРНОГО ОБУЧЕНИЯ АЛГОРИТМА МАШИННОГО ОБУЧЕНИЯ 2019
  • Певцов Сергей Евгеньевич
  • Костин Михаил Юрьевич
  • Чигин Антон Олегович
  • Васильев Дмитрий Сергеевич
RU2743932C2
КЛИЕНТСКОЕ НАМЕРЕНИЕ В СРЕДЕ С КОМПЛЕКСНЫМ ПОИСКОМ 2014
  • Рафф Пол
  • Хуан Сяо
  • Цай Ичао
  • Ма Жуй
  • Крук С. Эйден
  • Янь Ань
RU2662410C2

Иллюстрации к изобретению RU 2 719 443 C2

Реферат патента 2020 года ФИЛЬТРЫ РЕЗУЛЬТАТОВ ПОИСКА ИЗ СОДЕРЖИМОГО РЕСУРСОВ

Изобретение относится к поисковым машинам. Технический результат заключается в возможности создания системы, долговременного машиночитаемого носителя и способа формирования фильтров результатов поиска. Такой результат достигается за счет того, что принимают для первого запроса данные, идентифицирующие набор ресурсов, которые определены отвечающими первому запросу; извлекают из набора ресурсов первый набор ключевых слов из содержимого ресурсов; определяют набор потенциально подходящих фильтров из ключевых слов; определяют из набора потенциально подходящих фильтров набор фильтров запроса для первого запроса, причем данное определение содержит этапы, на которых: для каждого потенциально подходящего фильтра определяют выделенность терминов для этого потенциально подходящего фильтра, для каждого потенциально подходящего фильтра, удовлетворяющего пороговой величине выделенности терминов, выбирают данный потенциально подходящий фильтр в качестве фильтра запроса для его включения в набор фильтров запроса для первого запроса; предоставляют набор фильтров запроса для первого запроса; принимают выбор конкретного фильтра запроса из набора фильтров запроса для первого запроса; и в ответ на данный прием предоставляют для отображения на пользовательском устройстве отфильтрованный набор содержимого, который идентифицирует набор результатов о содержимом для этого конкретного фильтра запроса, который отличается от нефильтрованного набора результатов. 3 н. и 12 з.п. ф-лы, 5 ил.

Формула изобретения RU 2 719 443 C2

1. Компьютерно-реализуемый способ формирования фильтров результатов поиска, содержащий этапы, на которых:

принимают для первого запроса данные, идентифицирующие набор ресурсов, которые определены отвечающими первому запросу;

извлекают из набора ресурсов первый набор ключевых слов из содержимого ресурсов, которые были идентифицированы как отвечающие первому запросу;

определяют, исходя из первого набора ключевых слов, набор потенциально подходящих фильтров из ключевых слов, причем каждый потенциально подходящий фильтр получен из одного или более ключевых слов в наборе ключевых слов, и при этом набор потенциально подходящих фильтров является надлежащим поднабором первого набора ключевых слов;

определяют из набора потенциально подходящих фильтров набор фильтров запроса для первого запроса, причем данное определение содержит этапы, на которых:

для каждого потенциально подходящего фильтра определяют выделенность терминов для этого потенциально подходящего фильтра, при этом выделенность терминов указывает позиции терминов данного потенциально подходящего фильтра в ресурсах по отношению к позициям других терминов в ресурсах,

для каждого потенциально подходящего фильтра, удовлетворяющего пороговой величине выделенности терминов, которая указывает, что позиции терминов этого потенциально подходящего фильтра в ресурсах являются выделяющимися по отношению к другим терминам в ресурсах, выбирают данный потенциально подходящий фильтр в качестве фильтра запроса для его включения в набор фильтров запроса для первого запроса;

предоставляют, в ответ на первый запрос, для отображения на пользовательском устройстве и с результатами о содержимом, которые идентифицируют содержимое в наборе ресурсов, набор фильтров запроса для первого запроса;

принимают выбор конкретного фильтра запроса из набора фильтров запроса для первого запроса; и

в ответ на данный прием выбора конкретного фильтра запроса из набора фильтров запроса предоставляют для отображения на пользовательском устройстве отфильтрованный набор содержимого, который идентифицирует набор результатов о содержимом для этого конкретного фильтра запроса, который отличается от нефильтрованного набора результатов о содержимом и который является надлежащим поднабором нефильтрованного набора результатов о содержимом.

2. Способ по п. 1, в котором каждый результат о содержимом является результатом поиска, который идентифицирует соответствующий ресурс в наборе ресурсов.

3. Способ по п. 1, в котором каждый результат о содержимом является поднабором содержимого, включенного в ресурс в наборе ресурсов.

4. Способ по п. 1, в котором этап определения, исходя из первого набора ключевых слов, набора потенциально подходящих фильтров из ключевых слов содержит этап, на котором определяют, исходя из ресурсов в наборе ресурсов, набор запросов, причем каждый запрос в наборе запросов является запросом, для которого по меньшей мере один из ресурсов был выбран пользователем в ответ на упомянутый запрос.

5. Способ по п. 4, дополнительно содержащий этапы, на которых:

определяют, исходя из набора запросов, игнорируемые термины запроса, причем каждый игнорируемый термин запроса является термином, имеющим повторяемость в наборе запросов, которая удовлетворяет пороговой величине повторяемости игнорируемых терминов запроса; и

исключают игнорируемые термины запроса в первом наборе ключевых слов из набора потенциально подходящих фильтров.

6. Способ по п. 1, в котором этап определения, исходя из первого набора ключевых слов, набора потенциально подходящих фильтров из ключевых слов содержит этап, на котором определяют, исходя из первого запроса, набор запросов, причем каждый запрос в наборе запросов является запросом, который определен являющимся связанным с первым запросом.

7. Способ по п. 1, в котором этап определения, из набора потенциально подходящих фильтров, набора фильтров запроса, где каждый фильтр запроса в наборе фильтров запроса удовлетворяет пороговой величине разнообразия, содержит этап, на котором определяют оценку качества для каждого потенциально подходящего фильтра запроса на основе местоположений потенциально подходящего фильтра запроса в ресурсах.

8. Система формирования фильтров результатов поиска, содержащая:

устройство обработки данных; и

долговременный машиночитаемый носитель, хранящий инструкции, которые являются исполняемыми устройством обработки данных и которые при таком исполнении предписывают устройству обработки данных выполнять операции, содержащие:

прием, для первого запроса, данных, идентифицирующих набор ресурсов, которые определены отвечающими первому запросу;

извлечение, из набора ресурсов, первого набора ключевых слов из содержимого ресурсов, которые были идентифицированы как отвечающие первому запросу;

определение, исходя из первого набора ключевых слов, набора потенциально подходящих фильтров из ключевых слов, причем каждый потенциально подходящий фильтр получен из одного или более ключевых слов в наборе ключевых слов, и при этом набор потенциально подходящих фильтров является надлежащим поднабором первого набора ключевых слов;

определение, из набора потенциально подходящих фильтров, набора фильтров запроса для первого запроса, причем данное определение содержит:

для каждого потенциально подходящего фильтра определение выделенности терминов для этого потенциально подходящего фильтра, при этом выделенность терминов указывает позиции терминов данного потенциально подходящего фильтра в ресурсах по отношению к позициям других терминов в ресурсах,

для каждого потенциально подходящего фильтра, удовлетворяющего пороговой величине выделенности терминов, которая указывает, что позиции терминов этого потенциально подходящего фильтра в ресурсах являются выделяющимися по отношению к другим терминам в ресурсах, выбор данного потенциально подходящего фильтра в качестве фильтра запроса для его включения в набор фильтров запроса для первого запроса;

предоставление, в ответ на первый запрос, для отображения на пользовательском устройстве и с результатами о содержимом, которые идентифицируют содержимое в наборе ресурсов, набора фильтров запроса для первого запроса;

прием выбора конкретного фильтра запроса из набора фильтров запроса для первого запроса; и

в ответ на данный прием выбора конкретного фильтра запроса из набора фильтров запроса, предоставление, для отображения на пользовательском устройстве, отфильтрованного набора содержимого, который идентифицирует набор результатов о содержимом для этого конкретного фильтра запроса, который отличается от нефильтрованного набора результатов о содержимом и который является надлежащим поднабором нефильтрованного набора результатов о содержимом.

9. Система по п. 8, при этом каждый результат о содержимом является результатом поиска, который идентифицирует соответствующий ресурс в наборе ресурсов.

10. Система по п. 8, при этом каждый результат о содержимом является поднабором содержимого, включенного в ресурс в наборе ресурсов.

11. Система по п. 8, в котором упомянутое определение, исходя из первого набора ключевых слов, набора потенциально подходящих фильтров из ключевых слов содержит определение, исходя из ресурсов в наборе ресурсов, набора запросов, причем каждый запрос в наборе запросов является запросом, для которого по меньшей мере один из ресурсов был выбран пользователем в ответ на упомянутый запрос.

12. Система по п. 11, в которой операции дополнительно содержат:

определение, исходя из набора запросов, игнорируемых терминов запроса, причем каждый игнорируемый термин запроса является термином, имеющим повторяемость в наборе запросов, которая удовлетворяет пороговой величине повторяемости игнорируемых терминов запроса; и

исключение игнорируемых терминов запроса в первом наборе ключевых слов из набора потенциально подходящих фильтров.

13. Система по п. 8, в которой упомянутое определение, исходя из первого набора ключевых слов, набора потенциально подходящих фильтров из ключевых слов содержит определение, исходя из первого запроса, набора запросов, причем каждый запрос в наборе запросов является запросом, который определен являющимся связанным с первым запросом.

14. Система по п. 8, в которой упомянутое определение, из набора потенциально подходящих фильтров, набора фильтров запроса, где каждый фильтр запроса в наборе фильтров запроса удовлетворяет пороговой величине разнообразия, содержит определение оценки качества для каждого потенциально подходящего фильтра запроса на основе местоположений потенциально подходящего фильтра запроса в ресурсах.

15. Долговременный машиночитаемый носитель, хранящий инструкции, которые являются исполняемыми устройством обработки данных и которые при таком исполнении предписывают устройству обработки данных выполнять операции, содержащие:

прием, для первого запроса, данных, идентифицирующих набор ресурсов, которые определены отвечающими первому запросу;

извлечение, из набора ресурсов, первого набора ключевых слов из содержимого ресурсов, которые были идентифицированы как отвечающие первому запросу;

определение, исходя из первого набора ключевых слов, набора потенциально подходящих фильтров из ключевых слов, причем каждый потенциально подходящий фильтр получен из одного или более ключевых слов в наборе ключевых слов, и при этом набор потенциально подходящих фильтров является надлежащим поднабором первого набора ключевых слов;

определение, из набора потенциально подходящих фильтров, набора фильтров запроса для первого запроса, причем данное определение содержит:

для каждого потенциально подходящего фильтра определение выделенности терминов для этого потенциально подходящего фильтра, при этом выделенность терминов указывает позиции терминов данного потенциально подходящего фильтра в ресурсах по отношению к позициям других терминов в ресурсах,

для каждого потенциально подходящего фильтра удовлетворяющего пороговой величине выделенности терминов, которая указывает, что позиции терминов этого потенциально подходящего фильтра в ресурсах являются выделяющимися по отношению к другим терминам в ресурсах, выбор данного потенциально подходящего фильтра в качестве фильтра запроса для его включения в набор фильтров запроса для первого запроса;

предоставление, в ответ на первый запрос, для отображения на пользовательском устройстве и с результатами о содержимом, которые идентифицируют содержимое в наборе ресурсов, набора фильтров запроса для первого запроса;

прием выбора конкретного фильтра запроса из набора фильтров запроса для первого запроса; и

в ответ на данный прием выбора конкретного фильтра запроса из набора фильтров запроса, предоставление, для отображения на пользовательском устройстве, отфильтрованного набора содержимого, который идентифицирует набор результатов о содержимом для этого конкретного фильтра запроса, который отличается от нефильтрованного набора результатов о содержимом и который является надлежащим поднабором нефильтрованного набора результатов о содержимом.

Документы, цитированные в отчете о поиске Патент 2020 года RU2719443C2

Топчак-трактор для канатной вспашки 1923
  • Берман С.Л.
SU2002A1
Способ приготовления лака 1924
  • Петров Г.С.
SU2011A1
Устройство для закрепления лыж на раме мотоциклов и велосипедов взамен переднего колеса 1924
  • Шапошников Н.П.
SU2015A1
Способ защиты переносных электрических установок от опасностей, связанных с заземлением одной из фаз 1924
  • Подольский Л.П.
SU2014A1
ИНДЕКСАЦИЯ И ПОИСК ДИНАМИЧЕСКИ ИЗМЕНЯЮЩИХСЯ ПОИСКОВЫХ КОРПУСОВ 2009
  • Топатан Кутлай
  • Ван Чжифэн
  • Митра Рудра Радж
  • Малиновски Михаль Мечислав
  • Чжан Вэйе
RU2542936C2
СПОСОБ КЛАССИФИКАЦИИ ВЕБ-СТРАНИЦ И ОРГАНИЗАЦИИ СООТВЕТСТВУЮЩЕГО ИНФОРМАЦИОННОГО НАПОЛНЕНИЯ 2007
  • Лотито Жанпьеро Джузеппе
  • Терони Мариучиа
RU2487404C2

RU 2 719 443 C2

Авторы

Макджилливрэй, Ян

Спитц, Кейлин

Ян, Селена Суньлин

Сингх, Варун Джасджит

Перски, Эмма С.

Эрез, Йонатан

Даты

2020-04-17Публикация

2016-07-14Подача