ССЫЛКА НА РОДСТВЕННУЮ ЗАЯВКУ
Настоящая заявка испрашивает приоритет предварительной заявки на выдачу патента США, поданной экспресс-почтой под № EV 330021427 US от 23 января 2004 года и озаглавленной «BUILDING SUBWEBS» («Построение веб-каталогов»), все содержание которой включено в настоящее описание посредством ссылки.
ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ
Настоящее изобретение в целом относится к осуществлению поиска в сети Интернет и/или сети интранет (локальной сети, использующей Интернет-технологии) и более конкретно к системам и способам, которые содействуют тематической категоризации или осуществлению настройки доменов и/или ветвей и которые дополнительно содействуют осуществлению поиска таких категоризации.
ПРЕДШЕСТВУЮЩИЙ УРОВЕНЬ ТЕХНИКИ
Эволюция компьютерных и сетевых технологий от высокозатратных низкопроизводительных систем обработки данных к недорогим высокопроизводительным системам связи, решения задач и развлечений, предусмотрела экономичное и времясберегающее средство уменьшения бремени исполнения повседневных задач, таких как переписка, оплата счетов, покупка товаров и сбор информации. Например, вычислительная система, взаимосвязанная с сетью Интернет посредством проводной или беспроводной технологии, может предоставлять пользователю информационный канал для почти мгновенного доступа к изобилию информации из хранилища web-сайтов (узлов собрания гипертекстовых документов сети Интернет) и серверов (обслуживающих устройств общего пользования), расположенных по всему миру, по нажатию кончиков пальцев пользователя.
Типично, что к информации, доступной посредством web-сайтов и серверов, осуществляют доступ посредством web-обозревателя (средства просмотра web-страниц в сети Интернет), выполняющегося на web-клиенте (к примеру, на вычислительном устройстве). Например, web-пользователь может развернуть web-обозреватель и осуществить доступ к web-сайту путем ввода унифицированного указателя ресурса (URL) web-сайта (например, web-адреса и/или адреса в сети Интернет и/или сети интранет) в адресную строку web-обозревателя и путем нажатия клавиши ввода на клавиатуре или выбора щелчком по кнопке мыши управляющего элемента интерфейса «начать», используя мышь. URL типично включает в себя четыре порции информации, которая содействует осуществлению доступа: протокол (язык вычислительных устройств для связи друг с другом), который содержит набор правил и стандартов для обмена информацией, расположение web-сайта, наименование организации, которая содержит в рабочем состоянии этот web-сайт, и, для web-адресации - суффикс (например, com, org, net, gov и edu), идентифицирующий тип организации.
В некоторых случаях пользователь заранее знает наименование сайта или сервера, и/или URL на сайт или сервер, к которым пользователь желает осуществить доступ. В таких ситуациях пользователь может осуществлять доступ к сайту, как описано выше, посредством ввода URL в адресную строку и соединения с сайтом. Однако в большинстве случаев пользователь не знает URL или наименование сайта. Взамен пользователь применяет поисковую функцию для облегчения определения местоположения конкретного сайта, основываясь на предусмотренных пользователем ключевых словах. В настоящее время на этом поприще существует два разнородных класса поисковых функций - отражающая специфику конкретного домена поисковая функция, чей поиск ограничен конкретным сетевым доменом или сайтом (например, www.domain.com), и функция расширенного (общего) поиска (например, машина общего поиска), которая отыскивает по всему собранию гипертекстовых документов сети Интернет (или сети интранет) сайты, имеющие отношение к введенным ключевым словам. Например, пользователь может пожелать локализовать (определить) сайт, который содержит информацию, касающуюся компьютерного вируса. В качестве первого варианта можно было бы начать прямо с конкретного (сетевого) домена (например, www.computervirus.com), который специализируется на информации, относящейся к компьютерным вирусам, и отыскивает документы (например, www.computervirus.com/virus1.htm) в рамках такого домена, содержащие существенную информацию. Более точно, пользователь будет вводить URL www.computervirus.com в адресную строку web-обозревателя и будет направлен на этот сайт. На этом сайте пользователь может вводить ключевые слова в диалоговое окно поиска, и поиск будет возвращать документы в пределах домена www.computervirus.com, которые пользователь может отбирать. Однако релевантная информация, которая лежит вне этого сетевого домена, не будет возвращена пользователю. Например, релевантная страница из домена www.compvirus.com не может быть возвращена, так как она не лежит в пределах сетевого домена www.computervirus.com. Таким образом, для того чтобы пользователю получить релевантные данные извне домена www.computervirus.com, он должен знать URL-адреса других доменов, которые содержат в своем составе информацию, и искать такие домены.
В качестве альтернативы, пользователь может вводить ключевые слова в машину расширенного поиска, которая будет осуществлять поиск во всем собрании гипертекстовых документов сети Интернет или другом наборе сайтов (например, интранет) и возвращать сайты, которые она определяет имеющими отношение к ключевым словам. Часто, однако, машина расширенного (общего) поиска будет возвращать значительное количество сайтов, которые являются полностью не имеющими отношение к конкретным интересам пользователя. Например, если пользователь осуществляет поиск, используя ключевое слово «вирус», кроме получения информации, относящейся только к компьютерным вирусам, он или она возможно принимают информацию, имеющую отношение к биологическим вирусам так же, как и к компьютерным вирусам. Пользователь после этого может просмотреть путем прокрутки множества возвращенных сайтов и попытаться определить, имеют ли они отношение к интересам пользователя. Просматривание путем прокрутки возвращенных результатов может быть чрезвычайно расходующим время и расстраивающим пользователя, так как машины расширенного (общего) поиска могут возвращать значительное количество сайтов при выполнении поиска. Пользователь может попытаться сузить поиск посредством употребления сочетания булевых операторов, но построить соответствующий булевый поиск, который будет в результате возвращать сайты, содержащие только релевантную информацию, может быть трудно. Более того, некоторые традиционные машины расширенного поиска пытаются делать вывод, что именно ищет пользователь, основываясь на ключевых словах. Например, если пользователь ввел термин «вирус» в машину расширенного поиска, поисковая машина может возвращать множество сайтов совместно с предложениями по сужению поиска. Более конкретно, поисковая машина может возвращать множество предложений, таких как «вы хотите отыскать компьютерный вирус?», «вы хотите отыскать биологический вирус?» и т. д. Для многих поисков (особенно для более детальных и точных поисков) этот традиционный способ требует осуществления отбора продолжающейся иерархии предлагаемых поисков, и возвращаемые сайты могут, тем не менее, испытывать недостаток релевантной информации. Кроме того, пользователь может пожелать локализовать сайт, который не будет вызван возвращаемыми предложениями поиска.
Таким образом, в данной области техники существует настоятельная необходимость в системе и/или методологии осуществления поиска, которые предусматривают фокусированные результаты, такие же, как могут быть найдены при осуществлении отражающего специфику конкретного домена поиска, без принесения в жертву выгод, имеющих отношение к поиску, проводимому посредством машины расширенного поиска.
СУЩНОСТЬ ИЗОБРЕТЕНИЯ
Нижеследующее представляет собой упрощенное краткое описание изобретения, для того чтобы предусмотреть фундаментальное понимание некоторых аспектов изобретения. Это краткое описание не является исчерпывающим обзором изобретения. Оно не сфокусировано на определении ключевых/критических признаков изобретения или на установление границ объема изобретения. Его единственной целью является предоставить некоторые общие представления об изобретении в упрощенной форме, в качестве вступления в более детализированное описание, которое представлено позднее.
Настоящее изобретение употребляет группирование подсовокупности доменов и/или ветвей (совместно указанных в последующем описании как просто «сайты»), которые имеют отношение к конкретному тематическому разделу, подмножеству индивидуумов, или любое другое группирование сайтов, для содействия удобствам в связи с осуществлением поиска по Интернет. Эти сайты в последующем описании содержат страницы документов, которые могут быть извлечены пользователем. Например, подсовокупность сайтов может быть отобрана и сгруппирована, основываясь на возрасте группы индивидуумов, которые типично просматривают такие сайты, политическом членстве индивидуумов, которые просматривают такие сайты, географическом местоположении индивидуумов, просматривающих такие сайты, религии индивидуумов, просматривающих такие сайты и т.д. Например, подсовокупность имеющих отношение сайтов может быть релевантной по отношению к конкретному тематическому разделу, который желает отыскать пользователь. Более конкретно, пользователи в возрасте от 10 до 20 лет возможно отыскивают разнородные сайты, по сравнению с пользователями в возрасте от 40 до 50 лет, и индивидуумы с первенствующим политическим членством типично отыскивают сайты, обособленные от индивидуумов с оппозиционным политическим членством. В другом примере, набор сайтов (например, Интернет) может быть концептуально рассмотрен как множество тематических разделов, в котором тематический раздел определен сайтами в пределах набора сайтов, имеющих отношение к этому тематическому разделу. При отыскивании информации, имеющей отношение к конкретному тематическому разделу, могло бы быть полезным располагать номенклатурой (списком) сайтов, уже найденных как существенные по отношению к тематическому разделу заранее, до выполнения поиска. Настоящее изобретение описывает систему и/или методологию для накопления номенклатуры сайтов, которые могут быть сгруппированы в соответствии с тематическим разделом, возрастом индивидуума, политической принадлежностью индивидуума, географическим местоположением индивидуума и т. д., и дополнительно раскрывает систему и/или методологию для назначения весов релевантности каждому из сайтов, занесенных в перечень. В целях читаемости, термин «тематический раздел» в последующем описании будет применяться по отношению не только к традиционному определению «тематический раздел», но также к другим группированиям имеющих отношение сайтов (например, сайтов, сгруппированных в соответствии с существенностью по отношению к конкретному возрастному диапазону, географическому местоположению,…). Этот набор взвешенных по релевантности сайтов, которые имеют отношение к конкретному тематическому разделу или группе, далее указаны как веб-каталог (подузел веб). Веб-каталоги могут быть модифицированы для сохранения текущими, когда видоизменена информация в Интернете, когда меняются пользовательские предпочтения, или по любым другим подходящим причинам. Более того, веб-каталоги могут быть сохранены (например, на жестком диске, компакт-диске (CD), цифровом многофункциональном диске (DVD), …), размножены и перемещены между пользователями.
В соответствии с одним из аспектов настоящего изобретения веб-каталог включает в себя перечень сайтов, имеющих отношение к тематическому разделу, который представлен веб-каталогом, и каждому сайту в пределах веб-каталога назначен настроенный вес в соответствии с релевантностью сайта по отношению к тематическому разделу. Таким образом, например, сайтам, определенным как высокорелевантные по отношению к тематическому разделу, представленному веб-каталогом, будет назначен больший вес релевантности, чем сайтам, определенным как менее релевантные по отношению к тематическому разделу. Впоследствии машина расширенного (общего) поиска может употреблять один или более тематически-специфичных веб-каталогов для содействия фокусированию поиска. Более конкретно, один или более веб-каталогов могут быть отобраны для уместного фокусирования поиска, и поисковый запрос может быть введен в машину расширенного (общего) поиска. Впоследствии результаты поиска могут быть определены, основываясь на системах ранжирования традиционной поисковой машины совместно с весом релевантности, назначенным сайтам, которые определяют веб-каталог. Например, сайты, возвращенные поисковой машиной, которая существует в пределах веб-каталога, будут принимать повышение в ранжировании, соответствующее назначенной взвешенной релевантности. В соответствии с другим аспектом настоящего изобретения множество сайтов, которые могут быть возвращены из машины расширенного (общего) поиска, отбрасываются, потому что они не содержатся в веб-каталоге, который был отобран для фокусирования поиска. Это изобретение может также быть использовано для представления пользователю возвращаемого классифицированного/кластеризованного возвращаемого результата поисковой машины, для того, чтобы для данного множества было накоплено большое количество подмножеств сайтов, которые соответственно являются частью конкретных разнородных веб-каталогов. Например, веб-каталог, имеющий отношение к здоровью и медицине, и веб-каталог, имеющий отношение к вычислительной технике, могут быть в наличии и применяться в связи с поисковой машиной. Если запрос «Вирус» введен в поисковую машину, результаты, имеющие отношение к медицине, и результаты, имеющие отношение к вычислительным устройствам, могут быть классифицированы и отображены для пользователя раздельно (например, сайты в пределах веб-каталога здоровья и медицины и сайты в пределах вычислительной техники могут быть сгруппированы соответственно).
В соответствии с одним из аспектов настоящего изобретения веб-каталоги могут быть созданы с использованием перечня запросных терминов, которые имеют отношение к конкретному тематическому разделу. Например, запросы из запросной записи, имеющие отношение к тематически-специфичному веб-сайту, могут быть применены как список запросных терминов. После этого для выполнения многократных поисков может быть использована машина расширенного поиска, в то время как применяется несколько разнородных тематически-специфичных запросных терминов. Так как запросные термины имеют отношение к конкретному тематическому разделу, веб-сайты, которые являются релевантными по отношению к тематическому разделу, будут возвращены многократно для разнородных запросных терминов (например, один и тот же веб-сайт будет возвращен при использовании разнородных запросных терминов). Более того, настоящее изобретение предусматривает осуществление обзора соседних сайтов (например, сайтов, которые привязаны входящей ссылкой и исходящей ссылкой к/из сайта, возвращенного в поиске) и определение их релевантности, касающейся тематического раздела интересов. Веса, которые являются указывающими на существенность конкретного сайта по отношению к тематическому разделу, назначают сайтам, возвращенным в пределах поиска. Веса вычисляют, по меньшей мере частично, на основе количества раз, которое сайт и/или соседние сайты были возвращены при использовании большого количества различных имеющих отношение к тематическому разделу поисковых терминов. Более того, веб-каталоги могут быть созданы, основываясь по меньшей мере частично, на свойствах пользователя. Например, если возраст/пол/местоположение/и т.д. в пользователе поисковой машины известны, веб-каталоги могут быть построены для таких характеристик возраста/пола/местоположения/и т.д. Более конкретно, может быть построен веб-каталог, который применяется 20-30-летними адресатами, которые в текущий момент находятся в Техасе. Кроме того, веса, соответствующие сайтам в пределах веб-каталога, могут быть основаны по меньшей мере частично на личном пользовательском предшествующем поиске или истории просмотра, содержащем страницы результатов, и т.д.
В соответствии с другими аспектами настоящего изобретения веб-навигатор (средство web-просмотра) может употреблять веб-каталоги в связи с определением того, какие именно страницы предназначены для посещения собрания гипертекстовых Интернет-документов. Например, веб-навигатор будет более часто посещать страницы в пределах популярного веб-каталога, по сравнению со страницами, которые находятся в пределах непопулярных веб-каталогов, или страницами, которые совсем не использованы в связи с веб-каталогом.
Для достижения вышеупомянутых и имеющих отношение целей, в настоящем описании изобретения описаны некоторые пояснительные аспекты изобретения совместно с последующим описанием и приложенными чертежами. Эти аспекты показывают, однако, только немногие различные направления, в которых принципы изобретения могут быть применены, и настоящее изобретение задумано, чтобы включить в себя все такие аспекты и их эквиваленты. Другие преимущества и оригинальные признаки изобретения очевидны из последующего подробного описания изобретения при рассмотрении совместно с чертежами.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
Фиг.1 - структурная схема системы, которая содействует улучшенному осуществлению поиска в соответствии с аспектом настоящего изобретения.
Фиг. 2 - еще одна структурная схема системы, которая содействует улучшенному осуществлению поиска в соответствии с аспектом настоящего изобретения.
Фиг. 3 - еще одна структурная схема системы, которая содействует улучшенному осуществлению поиска в соответствии с аспектом настоящего изобретения.
Фиг. 4 - еще одна структурная схема системы, которая содействует улучшенному осуществлению поиска в соответствии с аспектом настоящего изобретения.
Фиг. 5 - блок-схема способа для использования веб-каталогов для улучшения релевантности результатов поиска в связи с аспектом настоящего изобретения.
Фиг. 6 - блок-схема способа для модифицирования веб-каталогов в соответствии с аспектом настоящего изобретения.
Фиг. 7 - примерное разбиение Интернет на большое количество тематических разделов в соответствии с аспектом настоящего изобретения.
Фиг. 8 - примерное отображение поиска, которое может быть применено в связи с настоящим изобретением.
Фиг. 9 - структурная схема системы, которая содействует созданию веб-каталога в соответствии с аспектом настоящего изобретения.
Фиг. 10 - другая структурная схема системы, которая содействует созданию веб-каталога в соответствии с аспектом настоящего изобретения.
Фиг. 11 - блок-схема способа для создания веб-каталога в соответствии с аспектом настоящего изобретения.
Фиг. 12 - другая блок-схема способа для создания веб-каталога в соответствии с аспектом настоящего изобретения.
Фиг. 13 - иллюстрирует примерную запросную запись и примерный веб-каталог, выработанный, основываясь на запросной записи в соответствии с аспектом настоящего изобретения.
Фиг. 14 - структурная схема системы, которая содействует улучшенному осуществлению веб-навигации в соответствии с аспектом настоящего изобретения.
Фиг. 15 - иллюстрирует переносимость веб-каталогов в соответствии с аспектом настоящего изобретения.
Фиг. 16 - иллюстрирует результаты, возвращенные из разных поисковых машин, сравненные с результатами, возвращенными из фокусированного веб-каталогом поиска в соответствии с аспектом настоящего изобретения.
Фиг. 17 и 18 - иллюстрируют данные, которые показывают превосходство фокусированных веб-каталогом поисков в сравнении с традиционными поисками в соответствии с аспектом настоящего изобретения.
Фиг. 19 - иллюстрирует примерное операционное окружение, в котором настоящее изобретение может функционировать.
Фиг. 20 - иллюстрирует другое примерное операционное окружение, в котором настоящее изобретение может функционировать.
ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ
Настоящее изобретение описано ниже со ссылкой на чертежи, в которых подобные номера ссылок использованы, чтобы ссылаться на подобные элементы по всему описанию. В последующем описании в целях разъяснения многочисленные специфические детали помещены на передний план, для того чтобы предусмотреть исчерпывающее понимание настоящего изобретения. Может быть очевидным, однако, что настоящее изобретение может быть выполнено на практике без этих специфических деталей. В других примерах хорошо известные структуры и устройства показаны в виде структурной схемы, для того чтобы содействовать описанию настоящего изобретения.
Используемые в этой заявке термины «компонент», «обработчик», «модель», «система» и подобные задуманы, чтобы ссылаться на родственную вычислительному устройству сущность, выполненную либо в аппаратных средствах, либо в сочетании аппаратных средств и программного обеспечения, либо в программном обеспечении. Например, компоненты могут быть, но не в качестве ограничения, программным процессом, выполняющимся на устройстве обработки данных, устройством обработки данных, объектом, исполняемым файлом, потоком выполнения команд, программой и/или вычислительным устройством. В качестве иллюстрации оба приложения, запущенные на сервере (обслуживающем устройстве общего пользования), и сам сервер могут быть компонентами. Один или более компонентов могут находиться в пределах процесса и/или потока выполнения команд и компонент может быть локализован на одном вычислительном устройстве и/или распределен по двум или более вычислительным устройствам. Также, эти компоненты могут исполнять с разнообразного машиночитаемого носителя имеющиеся разнообразные структуры данных, хранящиеся на нем. Компоненты могут связываться посредством локальных и/или удаленных процессов, например, в соответствии с сигналом, имеющим один или более пакетов данных (например, данных из одного компонента, посредством сигнала, взаимодействующего с другим компонентом в локальной системе, распределенной системе, и/или через сеть, такую как Интернет, с другими системами).
На фиг. 1 проиллюстрирована система 100, которая содействует улучшенной точности и производительности во время выполнения поиска по набору сайтов. Система 100 использована применительно к осуществлению поиска в Интернете информации, имеющей отношение к пользовательскому запросу. Понятно, однако, что Интернет - это просто показанный в качестве примера набор сайтов, который может быть подвергнут поиску в соответствии с настоящим изобретением. Любой набор сайтов, находящихся в том числе, и не только в Интернет, интранет или где-то в другом месте, могут быть найдены, употребляя настоящее изобретение. Например, набор сайтов, сохраненный на жестком диске клиента, может быть подвергнут поиску в связи с настоящим изобретением. Настоящее изобретение улучшает традиционные поисковые технологии посредством концептуального разбиения множества доменов (например, www.domain.com), путей (например, www.domain.com/path), кластеров доменов и/или путей, и других подходящих сайтов, расположенных в Интернет, на соседство имеющих отношение сайтов или веб-каталогов 102-106, которые сохранены в пределах хранилища данных 108. Каждый из веб-каталогов 102-106 имеет отношение к конкретному тематическому разделу интересов для пользователя, и таким образом включает в себя большое количество сайтов (например, доменов, путей, кластеров доменов и/или путей, …), которые являются существенными в отношении такого тематического раздела. Например, веб-каталог 102 может иметь отношение к автомобилям; таким образом, каждый сайт, включенный в пределы веб-каталога 102, будет полностью релевантным по отношению к тематическому разделу автомобилей. Должно быть понятно, что Интернет (или любой другой набор сайтов) может быть рассмотрен как набор любого количества тематических разделов, и что два или более тематических разделов могут включать в себя имеющую отношение информацию. Следовательно, разнородные веб-каталоги, которые представляют имеющие отношение тематические разделы, могут включать в себя большое количество одних и тех же сайтов. Более того, один веб-каталог может полностью заключать в себе другой веб-каталог. Веб-каталоги 102-106 показаны как полностью раздельные один от другого только в иллюстрационных целях, и такая раздельность не должна быть интерпретирована в качестве ограничения объема настоящего изобретения. Более того, веб-каталоги могут быть созданы, основываясь, по меньшей мере, частично, на характеристиках пользователей поисковой машины. Например, может быть создан веб-каталог, содержащий сайты, типично отыскиваемые индивидуумами конкретного возрастного диапазона. Другие характеристики пользователя, такие как местоположение пользователя, пол пользователя, политическое членство пользователя, расовая принадлежность и т.д., могут быть также употреблены для создания веб-каталога, содержащего сайты, которые имеют отношение к таким характеристикам пользователя.
Сайты в пределах веб-каталогов 102-106 настроены весом в соответствии с их релевантностью по отношению к тематическим разделам и/или характеристикам пользователя, которые веб-каталоги 102-106 представляют. Например, веб-каталог 104 включает в себя N сайтов и N весов, где N - это целое число. Каждый сайт ассоциативно связан с весом, который, при рассмотрении совместно с другими весами в пределах веб-каталога 104, может иллюстрировать релевантность сайта по отношению к тематическому разделу веб-каталога 104. Более конкретно, в пределах веб-каталога 104 сайту 1 назначен вес со значением вес1, а сайту 2 назначен вес со значением вес2. Таким образом, может быть сделано определение относительно того, какой из двух сайтов имеет более высокую релевантность по отношению к тематическому разделу веб-каталога 104, посредством сравнения весов со значениями вес1 и вес2. Более того, веб-каталоги 102-106 могут быть сохранены в базе данных как части пользовательского профиля и/или как независимые объекты. Например, хранилище 108 данных может быть доступным посредством веб-сайта. После посещения веб-сайта и ввода идентифицирующей пользователя информации (например, имени пользователя и пароля) веб-каталоги 102-106 могут быть извлечены и применены в связи с поиском. Также, веб-каталоги 102-106 могут быть сохранены как объекты и переданы разнородным пользователям для их использования (например, веб-каталоги 102-106 могут быть прикреплены к электронному письму или использованы другим пользователем). Более того, веб-каталоги 102-106 могут быть настроены по индивидуальным требованиям большим количеством пользователей для удовлетворения специфических нужд.
Система 100 использует веб-каталоги 102-106 для фокусирования поиска по набору сайтов (например, Интернет), имеющих отношение к одному или более тематическим разделам. Так как сайты в пределах веб-каталогов 102-106 релевантны к конкретному тематическому разделу, но не ограниченны одним специфическим доменом, то пользователь может уверенно найти тематическую информацию без опасений быть «утопленным» в несущественной информации. Система 100 включает в себя селектор 110 веб-каталога, который отбирает один или более веб-каталогов для использования во время поиска. В соответствии с одним из аспектов настоящего изобретения селектор 110 веб-каталога может быть ассоциативно связан с интерфейсом пользователя (не показан), представленным пользователю на устройстве 112 отображения, на котором интерфейс пользователя предоставляет возможность пользователю отбирать желаемый(е) веб-каталог(и) для использования в связи с осуществлением поиска тематической информации. В соответствии с другим аспектом настоящего изобретения селектор 110 веб-каталога может автоматически отбирать один или более веб-каталогов для применения в связи с поиском информации, основываясь на точке входа на набор сайтов или текущий сайт (например, веб-сайт), находящийся в просмотре. Например, если пользователь в настоящее время находится на сайте, относящемся к покупке автомобилей, селектор 110 веб-каталога может автоматически отобрать один или более веб-каталогов с тематическими разделами, относящимися к автомобилям. Более того, селектор 110 веб-каталога может отобрать соответствующий веб-каталог(и), основываясь на запросных терминах, введенных в машину расширенного поиска, и/или пользовательской истории. Например, если пользователь имеет историю осуществления обозрения страниц компьютерной поддержки и вводит термин «вирус» в поисковую машину, селектор 110 веб-каталога может отбирать веб-каталог, относящийся к компьютерам, предпочтительнее, нежели осуществлять отбор веб-каталога, относящегося к биологическим болезням.
Селектор 110 веб-каталога работает в соединении с поисковым компонентом 114, который принимает поисковый запрос. Например, поисковый компонент 114 может быть машиной расширенного поиска, и запрос может порождаться пользователем, компьютерной программой или подобными. Селектор 110 веб-каталога может отобрать один или более веб-каталогов заранее до приема поискового запроса поисковым компонентом 114 или после того как поисковый компонент 114 принимает поисковый запрос. Например, если пользователь вручную отбирает один или более веб-каталогов для использования в связи с поиском, веб-каталоги будут отобраны заранее до приема поискового запроса. Однако, если селектор 110 веб-каталога использует поисковый запрос для определения того, какой именно веб-каталог(и) необходимо отобрать, такой отбор очевидно будет завершен не ранее чем после того как поисковый компонент 114 примет поисковый запрос.
После приема поискового запроса поисковый компонент 114 будет выполнять поиск информации в соответствии с таким запросом, и выбранный веб-каталог будет использован в связи с поиском. Веб-каталог 104 проиллюстрирован как выбранный веб-каталог, но должно быть понятно, что селектор веб-каталога может отобрать любой подходящий веб-каталог или комбинацию веб-каталогов для способствования осуществлению поиска. В соответствии с одним из аспектов настоящего изобретения поиск может быть выполнен только по тем сайтам, которые содержатся в отобранном веб-каталоге 106. Это позволяет машинам расширенного поиска использовать существующие поисковые алгоритмы, при этом возвращая только сайты, определенные как имеющие отношение к тематическому разделу, представленному веб-каталогом 106. Подобным образом, поисковый компонент 114 может отыскивать по всему Интернет (или другому подходящему набору сайтов) релевантную информацию, и возвращенные сайты, не существующие в веб-каталоге 104, могут быть удалены, до возврата результатов поиска пользователю. Результаты, локализованные (местоположение которых найдено) поисковым компонентом 114 и не удаленные, могут быть доставлены пользователю посредством устройства 112 отображения.
В соответствии с другим аспектом настоящего изобретения сайтам в пределах веб-каталога 104, локализованным поисковым компонентом 114, может дано предпочтение в соответствии с их назначенным весом. Более конкретно, поисковый компонент 114 может быть машиной расширенного поиска и локализовать/ранжировать сайты в традиционной манере, основываясь на поисковом запросе. Сайты, локализованные поисковым компонентом 114, которые существуют в пределах веб-каталога 104, могут впоследствии быть подняты в ранге в соответствии с их назначенным весом релевантности. Таким образом, традиционная система и/или методология ранжирования, употребленная поисковым компонентом 114, может быть интегрирована с взвешиванием сайтов в пределах веб-каталога 104. Следовательно, например, сайт в пределах веб-каталога 104, который мог бы быть записан четвертым при применении традиционных поисковых методологий, может быть поднят в ранге на позицию, показывающую большую релевантность в отношении к поисковому запросу. Таким образом, функция традиционной системы ранжирования и вес, назначенный сайтам, применяют, чтобы ранжировать результаты поиска. Ранжированные и локализованные результаты могут затем быть доставлены пользователю посредством устройства 112 отображения. Более того, в связи с предоставлением пользователю результатов поиска может быть применено сочетание ранжирования и фильтрации.
Далее со ссылкой на фиг.2 проиллюстрирована система 200, которая содействует фокусированному поиску по одной или нескольким тематическим областям заинтересованности. Система 200 также содействует (облегчает) фильтрованному осуществлению поиска в соответствии с пользовательскими характеристиками (например, полом, этнической принадлежностью, местоположению, возрасту, …). Система 200 осуществляет поиск по набору сайтов посредством употребления веб-каталога 202, который доступен пользователю в пределах хранилища 204 данных. Веб-каталог 202 включает в себя N сайтов, где N является целым числом. Сайты могут быть доменами, ветвями, кластерами сайтов или другими подобными сайтами. Каждый из N сайтов в пределах веб-каталога 202 включает в себя информацию, релевантную к тематическому разделу и/или характеристике пользователя, представленными веб-каталогом 202, и каждому из N сайтов назначен вес, показывающий его релевантность по отношению к тематическому разделу и/или характеристике пользователя. Более конкретно, сайту 1 назначен вес со значением вес1, сайту 2 назначен вес со значением вес2 и сайту N назначен вес со значением весN. Таким образом, рассмотрение веса со значением вес1 относительно веса со значением вес2 будет информативным в отношении того, является ли сайт 1 более релевантным, чем сайт 2, по отношению к тематическому разделу, представленному веб-каталогом 202.
Система 200 включает в себя селектор 206 веб-каталога, который отбирает один или более веб-каталогов для использования в связи с тематически настроенным и/или фильтрованным поиском. В то время как хранилище 204 данных проиллюстрировано как включающее в себя только веб-каталог 202, должно быть понятно, что любое подходящее количество веб-каталогов может быть сформировано и использовано при проведении фокусированного поиска. В этой примерной иллюстрации селектор 206 веб-каталога выбрал веб-каталог 202. Селектор 206 веб-каталога может передавать на отображающее устройство 208 информацию, по которой веб-каталог(и) был отобран. Система 200 дополнительно включает в себя поисковый компонент 210, который в ответ на запрос осуществляет поиск по меньшей мере по сайтам, содержащимся в пределах веб-каталога 202. В соответствии с одним из аспектов настоящего изобретения поисковый компонент 210 работает в традиционной манере и осуществляет поиск по всему набору сайтов (например, по всему Интернет), касающихся условий поиска из запроса. После этого, возвращенные сайты, не содержащиеся в пределах веб-каталога 202, могут быть удалены, или возвращенные сайты могут быть ранжированы в соответствии с традиционными способами ранжирования совместно с весами, назначенными сайтам в веб-каталоге 202. Таким образом, сайты, локализованные поисковым компонентом 210 и содержащиеся в пределах веб-каталога 202, будут принимать повышение в ранжировании, в то время как сайты, локализованные поисковым компонентом 210 и не содержащиеся в пределах веб-каталога 202, не будут принимать повышение. Таким образом, ранжирование сайтов может быть функцией методологий ранжирования традиционной поисковой машины, совместно с весами, назначенными сайтам в пределах веб-каталога 202. Ранжированные результаты могут затем быть переданы из поискового компонента 210 на устройство 208 отображения.
Система 200 может быть ассоциативно связана с компонентом 212 подстройки, который содействует изменению/настройке по индивидуальным требованиям веб-каталога 202 (например, до и/или после того как веб-каталог 202 был выбран селектором 206 веб-каталога). Например, компонент 212 подстройки может быть использован для добавления и/или удаления конкретных сайтов из веб-каталога 202 посредством пользовательского интерфейса 214. Это может быть полезным, когда подвергаются изменениям имена сетевых доменов и/или ветвей, добавляются или удаляются из Интернета сайты, изменяется содержимое сайтов и т.д. Таким образом, компонент 212 подстройки предусматривает механизм, который позволяет пользователю вручную изменять содержимое веб-каталога 202. В соответствии с другим аспектом настоящего изобретения компонент 212 подстройки может быть применен для автоматической поддержки веб-каталога 202 в рабочем состоянии. Например, компонент 212 подстройки может работать в соединении с навигатором (механизмом поиска) (не показан) для сохранения текущего (актуального) состояния сайтов в веб-каталоге 202. Более конкретно, навигатор (механизм поиска) может иметь доступ к списку веб-каталогов так же как и к сайтам, содержащимся в пределах веб-каталогов. После определения того, что сайт, который однажды располагался в пределах набора сайтов (например, Интернет, интранет, сервера, клиентского жесткого диска, …), больше не существует, навигатор может осуществлять поиск сайта в пределах веб-каталога и удалять такой сайт, если такая ситуация имеет место в пределах одного или более веб-каталогов. Подобным образом навигатор может локализовать вновь созданный сайт и информировать компонент 212 подстройки о таких новых сайтах. Компонент 212 подстройки может впоследствии определить, должен ли сайт быть включен в один или более веб-каталогов, основываясь на входящих ссылках, исходящих ссылках, наличии поисковых терминов в пределах сайта, является ли сайт частью релевантного домена или других подходящих признаках. Подобным образом, навигатор (механизм поиска) может определять, что сайт в пределах веб-каталога 202 был изменен, и компонент 212 подстройки путем осуществления поиска ключевых слов, обзора входящих ссылок и/или исходящих ссылок и т.д. может осуществлять обзор изменений, чтобы гарантировать, что сайт по прежнему является релевантным по отношению к тематическому разделу, представленному веб-каталогом 202. Компонент 212 подстройки может также использовать искусственный интеллект/алгоритмы обучения машины для поддержания в рабочем состоянии веб-каталога 202.
Компонент 212 подстройки также содействует настройке по индивидуальным требованиям значений весов, назначенных сайтам в пределах веб-каталога 202. Например, алгоритм, который автоматически назначает веса каждому сайту, может определять, что сайт 1 является более релевантным по отношению к тематическому разделу, представленному веб-каталогом 202, чем сайт 2. Основываясь на прошлом опыте и предпочтении, однако, пользователь может определить, что сайт 2 мог бы быть взвешен таким образом, что он более релевантный, чем сайт 1, по отношению к тематическому разделу и/или пользовательской характеристике(ам), представленным веб-каталогом 202. Таким образом, пользователь может применять пользовательский интерфейс 214 для модификации результатов взвешивания конкретных сайтов (например, бегунок, строку ввода текста, …). Пользователь может, таким образом, настроить по индивидуальным требованиям веб-каталог в соответствии с предпочтением и опытом. Веса также могут быть модифицированы искусственным интеллектом/алгоритмами машинного обучения.
Далее, обращаясь к фиг. 3, проиллюстрирована система 300, которая предусматривает улучшенное осуществление поиска, касающегося одного или более конкретных тематических разделов и/или характеристик(и) пользователя. Система 300, в которой веб-каталог представляет один конкретный тематический раздел и/или одну или несколько характеристик пользователя, используется в соединении с поиском по набору сайтов 302 (например, по Интернет, интранет, хранилищам данных из сайтов, …) информации, относящейся к одному или более конкретным тематическим разделам и/или одной или более характеристикам 304-308 пользователя, причем веб-каталог представляет один конкретный тематический раздел и/или одну или более характеристик пользователя. Веб-каталог включает в себя множество сайтов (например, сетевых доменов, ветвей, кластеров, …), которые являются релевантными к тематическому разделу и/или пользовательской характеристике(ам), представленных веб-каталогом, и сайты настроены весами в соответствии с их релевантностью. Таким образом, сайт, который является более релевантным по отношению к тематическому разделу и/или характеристикам пользователя, представленным веб-каталогом, будет принимать более высокое значение веса, чем сайт, который менее релевантен по отношению к тематическому разделу и/или характеристике(ам) пользователя, представленным веб-каталогом.
Селектор 310 веб-каталога выбирает один или более веб-каталогов для использования в связи с осуществлением поиска в наборе сайтов 302 информации, имеющей отношение к одному или более конкретным тематическим разделам и/или характеристикам 304-308 пользователя, которые представлены одним или более веб-каталогами. В соответствии с одним из аспектов настоящего изобретения селектор 310 веб-каталога может осуществить доступ к хранилищу 312 данных, которое включает в себя профиль 314 пользователя. Хранилище 312 данных может быть устройством хранения данных, таким как жесткий диск, оперативное запоминающее устройство, постоянное запоминающее устройство, съемный носитель и запоминающее устройство на компакт диске и подобным. Профиль 314 пользователя в свою очередь включает в себя один или более веб-каталогов 316, которые могут быть применены в связи с осуществлением поиска в наборе сайтов 302 тематической информации и/или информации, имеющей отношение к характеристикам конкретного пользователя. Например, хранилище 312 данных (и, таким образом, веб-каталог(и) 316) может быть доступно через сетевое соединение (например, хранилище 312 данных может быть оперативным (он-лайновым) хранилищем данных, доступным через веб-сайт). Впоследствии, к профилю 314 пользователя может быть осуществлен доступ, например, путем ввода имени и пароля пользователя на веб-сайте. Такой аспект позволяет пользователю сохранять один или более веб-каталогов 316 в пределах профиля 314 пользователя и осуществлять доступ к веб-каталогу(ам) 316 с любого терминала, который пользователь может применить для получения сетевого соединения. Таким образом, веб-каталог(и) 316 могут включать в себя веб-каталог, относящийся к одному или более тематическим разделам и/или характеристикам 304-308 пользователя, и такой веб-каталог(и) 316 может быть использован в связи с осуществлением поиска по набору сайтов 302 тематической информации, а также информации, относящейся к характеристикам такого пользователя.
Поисковый компонент 318 осуществляет поиск по набору сайтов 302, основываясь на поисковом запросе и выбранном веб-каталоге. Поисковый компонент 318 включает в себя компонент 320 ранжирования, который ранжирует сайты, локализованные посредством поискового компонента 318. Компонент 320 ранжирования может использовать алгоритмы традиционных поисковых машин совместно с весами, назначенными сайтам в пределах веб-каталога(ов) 316, для осуществления ранжирования локализованных сайтов. Например, сайт, локализованный поисковым компонентом 318, который содержится в веб-каталоге(ах) 316, будет содержать повышение в ранге согласно соответствующему весу сайта, в то время как сайт, локализованный поисковым компонентом 318, который не содержится в пределах веб-каталога(ов) 318, не будет принимать повышение. После локализации сайта поисковым компонентом 318 и ранжирования сайтов посредством ранжирующего компонента 320 результаты могут быть доставлены на отображающее устройство 322.
Поисковый компонент 318 также включает в себя компонент 324 обратной связи, который позволяет пользователю улучшать будущие поиски по набору сайтов. Компонент 324 обратной связи может предусматривать обзор или принятие комментариев от пользователя, относящихся к поиску, и пользователь может связываться с компонентом обратной связи посредством пользовательского интерфейса 326, который ассоциативно связан с системой 300. Например, пользователь может выдавать запрос поисковой компоненте 318, и использовать селектор 310 веб-каталога для выбора одного или более веб-каталогов 316 для фокусирования поиска, направленного на один из тематических разделов/пользовательских характеристик 304-308. Поисковый компонент 318 может возвращать сайты, которые локализованы в пределах выбранного веб-каталога(ов) 316, а также сайты, которые он находит релевантными согласно пользовательскому запросу, находящиеся вне веб-каталога(ов) 316. Компонент 320 ранжирования может затем осуществлять ранжирование возвращенных сайтов, предусматривая повышение ранга возвращенным сайтам в пределах отобранного веб-каталога(ов) 316, в соответствии с их весами. Если пользователю возвращен сайт, который он воспринимает несущественным по отношению к тематическому разделу, представленному веб-каталогом(ами) 316, пользователь может употребить компонент 324 обратной связи для исключения такого сайта из будущих поисков, которые используют отобранный(е) веб-каталог 316. Пользователь может также передавать более конкретную обратную связь компоненту 324 обратной связи посредством пользовательского интерфейса 326. Например, пользователь может информировать компонент 324 обратной связи, что он желает принимать конкретные сайты только по назначенным дням и/или в конкретное время при употреблении отобранного веб-каталога(ов) 316 в связи с поиском. В другом примере пользователь может информировать компонент 324 обратной связи, что он желательно принимает входящие и/или исходящие ссылки конкретных сайтов всякий раз, когда используют особый веб-каталог для совершения фокусированного поиска. Компонент 324 обратной связи может также собирать подразумеваемые данные обратной связи пользователя. Например, возвращенные сайты, которые пользователь посещает, могут быть использованы для повышения относительных весов в веб-каталоге(ах) 316. Таким образом, с течением времени пользователь может настраивать по индивидуальным требованиям процедуры поиска, касающиеся конкретных сайтов или тематических разделов, в соответствии с предпочтением.
Компонент 328 подстройки может также быть предусмотрен в связи с пользовательским интерфейсом 326 для модификации и настройки по индивидуальным требованиям одного или более веб-каталогов (например, одного или более веб-каталогов 316). Например, компонент 328 подстройки может быть применен для добавления и/или удаления конкретных сайтов в пределах веб-каталога, и также для модификации весов сайтов в веб-каталоге. Пользователь может использовать пользовательский интерфейс 326 для ручного добавления и/или удаления сайта, а также для модификации весов, соответствующих разнородным сайтам. В соответствии с другим аспектом настоящего изобретения компонент 328 подстройки может быть применен для автоматической поддержки (в рабочем состоянии) веб-каталога(ов) путем связывания с одним или более навигаторами (механизмами поиска) (не показаны). Например, навигатор может информировать компонент 328 подстройки, что один или более сайтов в пределах одного или более веб-каталогов были изменены или удалены. Подобным образом навигатор может информировать компонент 328 подстройки, когда один или более сайтов были добавлены к набору сайтов 302. Более конкретно, навигатор может быть веб-навигатором, который информирует компонент 328 подстройки, когда один или более сайтов были добавлены в Интернет или интранет.
Далее, на фиг. 4 проиллюстрирована система 400, которая содействует поиску набора сайтов, которые касаются одного или более тематических разделов и/или характеристик пользователя. Система 400, в которой один или более тематических разделов/пользовательских характеристик представлены одним или более веб-каталогами 402, сохраненными в пределах хранилища 404 данных, используется для поиска по набору сайтов (например, Интернету, интранету, …) информации, относящейся к одному или более тематическим разделам и/или характеристикам пользователя. Веб-каталог(и) 402 включает в себя множество сайтов, которые могут быть найдены в пределах набора сайтов, являющихся релевантными по отношению к тематическому разделу/характеристике пользователя, которые представлены веб-каталогом(ами) 402. Каждый сайт в пределах веб-каталога(ов) 402 взвешен в соответствии с его релевантностью по отношению к тематическому разделу/характеристике пользователя, представленным веб-каталогом(ами). Например, более релевантным сайтам даны более высокие веса.
Система 400 включает в себя селектор 406 веб-каталога, облегчающий отбор одного или более веб-каталогов, которые по желанию употребляются для фокусирования поиска. Селектор 406 веб-каталога может быть ассоциировано связан с пользовательским интерфейсом 408, который позволяет пользователю вручную отбирать конкретный веб-каталог(и) для использования в связи с фокусированным поиском. В соответствии с другим аспектом настоящего изобретения селектор 406 веб-каталога может определять веб-каталог для отбора, основываясь по меньшей мере частично, на точке входа в пределах набора сайтов (например, Интернет). Более того, селектор 406 веб-каталога может быть ассоциативно связан с компонентом 410 искусственного интеллекта, который может делать логический вывод, какой именно веб-каталог(и) выбирать, основываясь по меньшей мере частично, на запросе, пользовательской истории, положении пользователя и/или пользовательском контексте.
Используемый в настоящем описании термин «умозаключение» (логический вывод) ссылается в основном на процесс рассуждения о предполагаемых состояниях системы, оборудования и/или пользователя, происходящий из множества наблюдений, в качестве зафиксированных посредством событий и/или данных. Логический вывод может быть применен для идентификации специального контекста или действия, или может, например, вырабатывать вероятность распределения по состояниям. Логический вывод может быть вероятностным, то есть может быть вычислением распределения вероятности по состояниям в рамках интересов, основанным на анализе данных и событий. Логический вывод может также ссылаться на технику, применяемую для компоновки высокоуровневых событий из множества событий и/или данных. Результаты такого логического вывода в построении новых событий или действий из множества наблюдаемых событий и/или сохраненных данных о событиях, в любом случае - событий, коррелированны в непосредственной временной близости, и события или данные поступают либо из одного, либо из разных источников данных и событий. Разнообразные схемы и/или системы классификации (например, машины с поддержкой векторов, нейронные сети, экспертные системы, сети доверительной оценки Байеса, нечеткая логика, машины синтеза данных …) могут быть применены в связи с выполнением автоматических и/или по логическому выводу действий в связи с исследованием объекта.
Таким образом, компонент 410 искусственного интеллекта может наблюдать за пользователем и «изучить» во времени желания пользователя, обусловленные состоянием и контекстом конкретного пользователя. Например, пользователь типично может использовать конкретное подмножество веб-каталогов в связи с поиском по Интернет в конкретные моменты времени дня и/или когда пользователь занимает определенное местоположение. Компонент 410 искусственного интеллекта может принимать данные от разнообразных чувствительных элементов 412 (например, время дня, местоположение пользователя, …) и употреблять такие данные для выполнения соответствующих логических выводов. Более того, компонент искусственного интеллекта может использовать анализ соотношения цена/качество, касающийся информирования селектора 406 веб-каталога для выбора конкретного веб-каталога. Более конкретно, компонент искусственного интеллекта может уравновешивать выгоду от информирования селектора 406 веб-каталога для отбора одного или более правильных веб-каталогов, с ценой на информирование селектора 406 веб-каталога для отбора одного или более неправильных веб-каталогов или упущения желаемых веб-каталогов.
Поисковый компонент 414 принимает поисковый запрос и в связи с одним или более отобранными веб-каталогами локализует и ранжирует сайты, получаемые в виде результата из поискового запроса. Поисковый компонент 414 может применять системы и/или методологии ранжирования традиционных поисковых машин совместно с весами, назначенными сайтам в пределах одного или более отобранных веб-каталогов, для ранжирования результатов поиска. Такие результаты затем могут быть переданы пользователю посредством отображающего устройства 418. Поисковый компонент 414 может также быть связан с компонентом 410 искусственного интеллекта, чтобы предусмотреть более точный поиск. Например, предпочтение пользователя согласно конкретным сайтам в пределах подмножеств может быть изменено по мере изменений пользовательского контекста. Например, пользователь, отыскивающий информацию о погоде, может предпочесть первый сайт в Интернет, имеющий отношение к погоде, когда находится в первом географическом местоположении, и предпочесть второй сайт в Интернет, имеющий отношение к погоде, когда находится во втором географическом местоположении. Компонент искусственного интеллекта может наблюдать за пользователем и изучать, какие именно сайты в пределах одного или более веб-каталогов пользователь предпочитает по мере изменения пользовательского контекста. Чувствительные элементы 412 могут быть применены для извещения компонента 410 искусственного интеллекта об изменениях в пользовательском контексте.
Система 400 дополнительно включает в себя компонент 420 подстройки, который может быть применен для модификации одного или более веб-каталогов (например, веб-каталога 404). Например, пользователь может осуществлять доступ к веб-каталогу 402 посредством пользовательского интерфейса 408 и производить изменения в отношении сайтов в пределах веб-каталога (например, добавлять сайты, удалять сайты, изменять веса). Более того, компонент 420 подстройки может работать в связи с компонентом 410 искусственного интеллекта для автоматической подстройки веб-каталога 402. Например, веб-каталог 402 может в исходном положении включать в себя сайт с соответствующим весом, указывающим, что сайт высоко релевантен по отношению тематическому разделу, представленному веб-каталогом 402. При использовании веб-каталога 402 для выполнения поиска пользователь, однако, редко выбирает такой сайт, даже если он высоко ранжирован. Компонент 410 искусственного интеллекта может наблюдать за деятельностью пользователя в течение некоторого времени, касающейся состояния и контекста пользователя, и изучать, какие именно сайты пользователь предпочитает. Впоследствии компонент 410 искусственного интеллекта может информировать компонент 420 подстройки, что конкретные сайты в конкретном веб-каталоге должны быть подстроены. Компонент 410 искусственного интеллекта может определять вероятность применения правильного изменения к веб-каталогу 402 и измерять затраты на неправильное изменение веб-каталога 402 вместе с выгодой от правильного изменения, заданные такой вероятностью.
Далее со ссылкой на фиг. 5 проиллюстрирована методология 500 для выполнения тематического поиска посредством употребления одного или более веб-каталогов. Несмотря на то, что в целях упрощения разъяснения, способ 500 показан и описан как последовательность действий, должно быть понятно и очевидно, что настоящее изобретение не ограничено порядком действий, так как некоторые действия могут, в соответствии с настоящим изобретением, совершаться в различном порядке и/или одновременно с другими действиями, которые показаны и описаны в настоящем описании изобретения. Например, специалистам в данной области техники будет понятно и очевидно, что способ в качестве альтернативы может быть представлен в виде последовательности взаимосвязанных состояний или событий, такой как диаграмма состояний. Более того, не все проиллюстрированные действия могут быть востребованы для применения способа в соответствии с настоящим изобретением.
На этапе 502 предусмотрена поисковая машина, которая может искать информацию по значительным порциям набора документов (например, в Интернет, интранет, наборе сайтов на локальном жестком диске, …). Поисковая машина может включать в себя традиционные системы и/или способы для локализации и ранжирования результатов поиска, основанных на поисковом запросе. На этапе 504 выбирают, один или более веб-каталогов, которые представляют тематический раздел, интересный пользователю. В соответствии с одним из аспектов настоящего изобретения пользовательский интерфейс может быть предусмотрен для предоставления пользователю возможности вручную выбирать один или более желаемых веб-каталогов. Более того, один или более веб-каталогов могут быть выбраны по текущему запросу, последнему запросу, точке входа и другим признакам, которые могут быть информативными о тематическом разделе, по которому пользователь желает осуществить поиск. В соответствии с другим аспектом настоящего изобретения состояние и контекст использования могут быть управляемы, и один или более веб-каталогов могут быть выбраны, основываясь по меньшей мере частично на таком состоянии и контексте пользователя.
На этапе 506 поисковая машина принимает пользовательский запрос. Запрос может быть в булевой форме, которая является традиционной при применении поисковых машин или в любой другой подходящей форме, которая позволяет поисковой машине выполнять поиск по набору сайтов, в которых поиск основан по меньшей мере частично на запросе. На этапе 508 поиск выполняют, основываясь на запросе. В соответствии с одним из аспектов настоящего изобретения пользователь может принять решение выполнять ли поиск только по сайтам в пределах отобранных веб-каталогов заранее по отношению к выполнению поиска. В зависимости от реализации, это может дать возможность для предельно быстрого поиска, так как только малое количество сайтов может быть подвергнуто поиску. В качестве альтернативы пользователь может позволить поисковой машине выполнять традиционный поиск по значительной части набора сайтов (например, всему Интернету).
На этапе 510 делается определение, касающееся того, все ли порции сайтов, которые находятся вне отобранного веб-каталога(ов), отфильтрованы в соответствии с пожеланием. Если все или порция сайтов, которые находятся вне отобранных веб-каталогов, отфильтрованы как желательные, такие сайты фильтруют на этапе 512. Независимо от того, желательна или нет фильтрация, на этапе 514 делается определение относительно того, должны ли результаты быть переранжированы согласно весам, назначенным сайтам в пределах веб-каталогов. Если пользователь желает просто использовать технику ранжирования традиционной поисковой машины, тогда на этапе 516 результаты поиска возвращаются пользователю. Если, тем не менее, желательно принять во внимание веса, назначенные сайтам в пределах веб-каталогов совместно с ранжированием сайтов, являющихся результатом традиционного поиска, на этапе 518 результаты поиска реранжируются согласно весам сайтов. Например, сайт, возвращенный во время поиска, который был взвешен как высоко релевантный в веб-каталоге, будет принимать повышение и, возможно, будет перемещен на позицию в результатах поиска, которая показывает большую релевантность (например, с четвертой на первую). Сайты, возвращенные поисковой машиной, которые не локализованы в пределах веб-каталогов, не будут принимать повышение. После того, как результаты поиска были переранжированы согласно весам, назначенным сайтам в пределах веб-каталога(ов), результаты поиска, показывающие переранжирование, будут представлены пользователю на этапе 516.
Далее, со ссылкой на фиг. 6, проиллюстрирован способ 600, который облегчает модификацию одного или нескольких веб-каталогов. На этапе 602 поисковый запрос сформулирован и предоставлен поисковой машине. На этапе 604 один или более веб-каталогов используют для выполнения фокусированного поиска по коллекции сайтов. Например, если пользователь в соответствии с желанием осуществляет поиск информации, относящейся к тематическому разделу автомобилей, один или более веб-каталогов, содержащих сайты, относящиеся к автомобилям, могут быть применены для фокусирования поиска. Например, веб-каталог(и) может быть обычным, касающимся автомобилей, и/или может быть специальным и иметь отношение к конкретным производителям автомобилей, автомобильным аукционам, конкретным автомобильным стилям и т.д.
На этапе 606 результаты поиска и соответствующие веса сайтов, которые содержатся в пределах веб-каталогов, отображают для пользователя. Таким образом, пользователь может просматривать веса и определять уместность таких весов, обусловленную предшествующим опытом и настоящими предпочтениями. На этапе 608 выполняется определение, касающееся того, желает ли пользователь модифицировать один или более весов, назначенных сайтам в пределах веб-каталога(ов). Если пользователь не имеет такого желания, способ 600 далее заканчивается этапом 610. Если изменения весов все же желательны, на этапе 612 для пользователя предусмотрен интерфейс пользователя для выполнения таких модификаций. Например, средства с ползунком подстройки, таблицы данных с позицией для ввода данных и т.д. могут быть представлены пользователю для облегчения модификации весов. На этапе 614 пользователь выполняет желаемые модификации по отношению к весам сайтов, тем самым настраивая по индивидуальным требованиям будущие процедуры поиска согласно его предпочтению, касающемуся модифицируемых сайтов. После этого способ заканчивается на этапе 610.
Обращаясь вкратце к фиг. 7, проиллюстрировано примерное разделение Интернет 700 на множество разнородных тематических разделов. Несмотря на то, что набор сайтов проиллюстрирован на фиг. 7 как Интернет, понятно, что любой подходящий набор сайтов может быть разделен в значительной степени подобной манере. Интернет 700 может быть рассмотрен как набор информации, которая может распадаться на разнообразные разнородные тематические разделы. Таким образом, сам Интернет может быть рассмотрен как множество тематических разделов. Эти тематические разделы могут отличаться по объему, и два разнородных тематических раздела могут содержать в себе одни и те же сайты и/или информацию. Например, тематический раздел «спорт» может находиться в Интернет, также как тематический раздел «гольф». Информация, относящаяся к гольфу, будет очевидно отнесена к спорту вообще. Таким образом, веб-каталоги, относящиеся к тематическим разделам гольфа и спорту, соответственно будут содержать перекрывающиеся сайты. Более того, веб-каталог, относящийся к спорту, может целиком содержать в себе веб-каталог, относящийся к гольфу. Интранет (не показан) может быть разделен на множество тематических разделов подобным образом.
В этом примерном делении Интернет 700 некоторые разделы были идентифицированы. Например, проидентифицированы тематический раздел 702 экологически чистого земледелия, тематический раздел 704 классической музыки, тематический раздел 706 игры в гольф, тематический раздел 708 путешествий, автомобильный тематический раздел 710, тематический раздел 712 помощи и поддержки Майкрософт® и тематический раздел 714 технологий Microsoft.Net. Далее можно увидеть, что тематические разделы 710 автомобилей и тематический раздел 708 путешествий по меньшей мере частично перекрываются, также как тематические разделы 712 помощи и поддержки Майкрософт® и тематический раздел 714 технологий Microsoft.Net. Могут быть созданы веб-каталоги, которые представляют каждый из этих тематических разделов также как и существующие в Интернет 700 другие тематические разделы, которые могут быть определены.
На фиг. 8 проиллюстрирован примерный пользовательский интерфейс 800, который предоставляет возможность фокусированного поиска, касающегося конкретного тематического раздела и/или пользовательских характеристик(и), посредством использования одного или более веб-каталогов. Интерфейс 800 включает в себя позицию 802 ввода запроса, куда пользователь может ввести желаемый поисковый запрос. Позиция 804 селектора веб-каталога предоставляет пользователю возможность выбрать один или более веб-каталогов, которые будут использованы для фокусирования поиска вокруг тематического раздела/пользовательской характеристики, представленной веб-каталогами. Несмотря на то, что позиция 804 селектора веб-каталога и другие механизмы ввода данных представлены как ниспадающие меню, понятно, что любой подходящий механизм, который предоставляет возможность отбора одной или более сущностей, задуман настоящим изобретением и подразумевается подпадающим под объем формулы изобретения, прилагаемой к настоящему описанию. Например, позиция 804 селектора веб-каталога может быть последовательностью ссылок, в которой выбор каждой ссылки является результатом в отборе соответствующего веб-каталога для использования в связи с поиском. Подобным образом, позиция 804 селектора веб-каталога может быть перечнем возможных веб-каталогов с выделяемым полем, ассоциативно связанным с каждым из веб-каталогов. Таким образом, выделением такого поля пользователь осуществляет выбор веб-каталога для использования в связи с фокусированием поиска. Эти способы выбора конкретных сущностей (объектов) являются только примером и не предназначены для ограничения объема настоящего изобретения.
Позиция 806 настройки позволяет пользователю определять - должна ли поисковая машина ранжировать результаты поиска согласно традиционным системам и/или способам поиска или, в качестве альтернативы, представлять отчет по весам, ассоциативно связанным с сайтами, содержащимися в пределах веб-каталога(ов). Более того, позиция 806 настройки предоставляет для пользователя возможность удалять по меньшей мере один возвращенный сайт, который не существует в пределах отобранного веб-каталога(ов) (например, пользователь может выбирать уровень фильтрации по отношению к возвращенным сайтам, нерезидентным в пределах отобранных веб-каталогов). Селектор 808 размера множества результатов может быть использован для определения количества результатов, которые будут возвращены пользователю.
После ввода запроса в позицию 802 ввода запроса и осуществления выбора других желаемых параметров поиска посредством позиции 804 селектора веб-каталога, позиции 806 настройки и селектора 808 размера результата пользователь может выбрать кнопку 810 поиска для выполнения поиска, основанного на введенных параметрах. Позиция 812 отображения иллюстрирует результаты, возвращенные из поиска. На этом примерном чертеже отображено N результатов, где N - целое число. Каждый результат может содержать информацию, которая информирует пользователя о релевантности результата. Например, результаты могут включать в себя заголовок страницы и краткое описание содержания этой страницы, так как является традиционным при выполнении операций поиска. Результаты могут также включать в себя индикатор веб-каталога, который информирует пользователя, является ли результат сайтом, который локализован в пределах отобранного веб-каталога(ов). Например, результаты могут быть отображены в первом цвете, если они являются сайтами в пределах отобранных веб-каталога (ов), и во втором цвете, если результаты являются сайтами, нерезидентными в пределах отобранного веб-каталога(ов). Другие системы и/или способы отображения того, являются ли результаты сайтами в пределах отобранных веб-каталога(ов), охватываются настоящим изобретением и подразумеваются подпадающим под объем формулы изобретения, прилагаемой к настоящему описанию. Результаты на устройстве 812 отображения могут также включать в себя URL таких страниц для информирования пользователя о сетевом домене и/или ветви, по которым размещаются результаты. Более того, может быть отображен вес, который показывает релевантность сайта по отношению к тематическому разделу, представленному отобранным веб-каталогом(ами). Несмотря на то, что это не показано, изменение в ранжировании в результате взвешивания сайтов в пределах отобранного веб-каталога(ов) может быть отображено для пользователя. Например, традиционная поисковая машина может возвращать результат 3 (который представляет первый сайт) в качестве лучшего результата, если бы не вес, назначенный сайту, представленному результатом 1. Таким образом, для пользователя может быть отображено изменение в ранге согласно взвешиванию сайтов в пределах отобранного веб-каталога(ов).
Далее, на фиг.9 проиллюстрирована система 900, которая облегчает формирование тематически-специфичного и/или специфичного по характеристикам веб-каталога. Должно быть понятно, что система 900 легко используется пользователями вычислительных устройств, которые не являются в высокой степени постигшими вычислительную технику, тем самым не ограничивая положительные результаты предмета изобретения для специалистов в области вычислительной техники, программистов вычислительных устройств и т.п. Система 900 включает в себя модуль 902 определения местоположения тематических/характеристических сайтов, который локализует (определяет местоположение) в Интернете сайты, соответствующие конкретному тематическому разделу и/или характеристике пользователя. Например, машина расширенного поиска может быть применена совместно с модулем 902 определения местоположения тематического/с характеристиками сайта для локализации сайтов в коллекции сайтов (например, Интернет, интранет, …), отнесенных к тематическому разделу, который интересен пользователю. Например, пользователь может ввести путь www.golfaddict.com, если пользователь почувствовал, что такой сетевой домен является релевантным по отношению к тематическому разделу гольфа. Более того, сайты, имеющие отношение к пользователям, содержащие в себе конкретные характеристики, могут быть извлечены модулем 902 определения местоположения тематических/с характеристиками сайтов. В соответствии с одним из аспектов настоящего изобретения модуль 902 определения местоположения тематических/с характеристиками сайтов принимает множество поисковых терминов, отнесенных к конкретному тематическому разделу и/или характеристике пользователя, и выполняет расширенный поиск, используя каждый из этих терминов. Сайты, которые возвращены многократно, применяя разнородные поисковые термины, предположительно (но не обязательно) являются релевантными по отношению к тематическому разделу и/или характеристике пользователя.
Модуль определения местоположения 902 тематических/с характеристиками сайтов передает локализованные (найденные) сайты генератору 904 веб-каталога, который включает в себя блок 906 (назначения) веса. Блок 906 назначения веса назначает веса каждому сайту, локализованному модулем 902 определения местоположения тематического/с характеристиками сайта, в соответствии с подсчитанной релевантностью по отношению к интересующему тематическому разделу и/или характеристике пользователя. В соответствии с одним из аспектов настоящего изобретения модуль 902 определения местоположения тематических/с характеристиками сайтов использует многократные поиски, относящиеся к конкретному тематическому разделу/характеристики пользователя, на машине расширенного поиска. Например, набор поисковых терминов, относящихся к тематическому разделу/характеристике(ам) пользователя, введен в поисковую машину, и возвращенные результаты передаются в блок 906 назначения веса. Более конкретно, пользователь, заинтересованный в тематическом разделе гольфа, может ввести такой поисковый термин как «поляна», «зеленый», «твердый», «лес», «риск» и т.д. При индивидуальном поиске результаты, происходящие из этих поисковых терминов, будут включать в себя значительные объемы данных, не релевантных по отношению к тематическому разделу гольфа. Подмножество собранных результатов, однако, будет общим для двух или более поисковых терминов. Релевантность сайта, касающаяся тематического раздела, предположительно возрастает, также как возрастает количество случаев, в которых сайты возвращены относительно разнородных тематических запросов. Таким образом, блок 906 назначения веса назначает веса релевантности сайтам, основываясь по меньшей мере частично, на количестве случаев, в которых сайт возвращен при осуществлении расширенных поисков, когда выполнялись эти операции поиска посредством использования разнородных тематических/характерных для пользователя поисковых запросов. Генератор 904 веб-каталога также может отфильтровывать сайты, которым не назначены пороговые значения веса.
В соответствии с другим аспектом настоящего изобретения блок 906 назначения веса может назначать веса релевантности сайтам согласно предварительной пользовательской истории. Например, если пользователь часто посещает один конкретный веб-сайт и такой сайт найден модулем 902 определения местоположения тематического/с характеристиками сайта, то затем такой сайт может стать частично релевантным для пользователя (и по отношению к интересующему тематическому разделу и/или характеристике пользователя). После назначения весов сайтам, локализованным модулем 902 определения местоположения тематического/с характеристиками сайта и, при желании, фильтрования сайтов с низкими назначенными весами генератор 904 веб-каталога создает идентифицируемый веб-каталог 908. Веб-каталог 908 включает в себя множество сайтов, которые являются релевантными по отношению к тематическому разделу и/или пользовательской характеристике(ам). Впоследствии веб-каталог 908 может быть сохранен, размножен, передан различным пользователям и т.д. и применен в связи с выполнением фокусированного поиска, как описано выше.
На фиг. 10 проиллюстрирована система 1000, которая содействует созданию веб-каталога, который представляет конкретный тематический раздел. Система 1000 включает в себя модуль 1002 определения местоположения тематического/с характеристиками сайта, который определяет местоположение множества сайтов, являющихся релевантными по отношению к конкретному тематическому разделу и/или пользовательским характеристикам в рамках заинтересованности. Модуль 1002 определения местоположения тематического/с характеристиками сайта включает в себя большое количество тематических поисковых терминов 1004, которые будут введены в качестве поисковых запросов в машину 1006 расширенного поиска. В соответствии с одним из аспектов настоящего изобретения тематические термины 1004 запросов могут являться запросными записями тематически-специфического сайта. Например, www.golfaddict.com может быть сайтом, имеющим отношение конкретно к тематическому разделу гольфа, и запись поисковых запросов по такому сайту может быть предположительно иметь отношение к гольфу. Поисковые запросы, имеющие место в запросной записи тематического сайта, могут быть использованы в качестве поисковых запросов в машине расширенного поиска, в которой будут возвращены результаты из большого количества сетевых доменов. Результаты, полученные из этого большого количества операций поиска, могут быть получены и переданы генератору 1008 веб-каталога, который использует упомянутые результаты для создания веб-каталога, представляющего тематический раздел в рамках интересов. В соответствии с другим аспектом настоящего изобретения тематические запросные термины 1004 могут быть получены выделением ключевых слов из тематически-специфического сайта. Более того, пользователь может просто сформировать перечень поисковых терминов, которые считает релевантными по отношению к тематическому разделу в рамках интересов, и использовать такой перечень в качестве тематического запросного термина. В соответствии с другим аспектом настоящего изобретения множество начальных значений URL и/или ветвей могут быть применены, могут быть выделены и ключевые слова из этих веб-сайтов. Более того, подобные действия могут быть предприняты в связи с получением сайтов, имеющих отношение к конкретным характеристикам пользователя (например, возрасту, этнической принадлежности, полу, политическому членству, …).
Генератор 1008 веб-каталога принимает результаты (сайты) операций поиска и включает в себя блок 1010 назначения веса, который назначает настроенные веса релевантности локализованным (найденным) сайтам. Блок 1010 назначения веса ассоциативно связан с вычислителем 1012 распределения ветви, который вычисляет распределенные ветви по результатам. Более конкретно, вычислитель 1012 распределения ветви определяет, какие именно сайты были возвращены в качестве результатов разнородных запросов, и сводит в таблицы количество случаев, когда сайты были возвращены в качестве результатов. Вычислитель 1012 распределения ветви может дополнительно вычислять ранг, назначенный машиной расширенного поиска возвращенному сайту, а также входящим и исходящим ссылкам, имеющим отношение к такому сайту, при вычислении распределенных ветвей. Более конкретно, сайты, высокоранжированные машиной расширенного поиска, могут быть дополнительно взвешены при подсчете распределенных ветвей, и входящие и исходящие ссылки, ассоциативно связанные с этими сайтами, могут быть дополнительно взвешены при определении распределения сайтов, соседних к возвращенным сайтам. Вычислитель 1014 распределения ветвей соседства рассчитывает распределение сайтов, чьи соседние сайты возвращены в качестве результатов операций поиска. Например, вычислитель 1014 распределения ветвей соседства может определять распределение указателей URL (например, входящих ссылок), которые указывают на сайты, возвращенные в поиске, и указателей URL (например, исходящих ссылок), которые осуществляют ссылку из сайтов, возвращенных в поиске. Для гарантии достоверности вычислений распределения ветвей соседства может быть предусмотрено пороговое значение количества учитываемых входящих и исходящих ссылок.
Блок 1010 назначения веса дополнительно включает в себя вычислитель 1016 распределения сетевых ветвей, который определяет распределение сетевой ветви при помощи комбинирования результатов, полученных посредством вычислителя 1012 распределения ветви и вычислителя 1014 распределения ветвей соседства. В качестве вычисленного вычислителем 1016 распределения ветви, определяют распределение сетевой ветви добавлением распределения вероятности соседства ветви к распределению ветви. Для обеспечения оптимального распределения сетевой ветви может быть применено дифференциальное взвешивание. Для нормирования распределения сетевой ветви применяется нормализатор 1018. Нормализатор 1018 используют для уменьшения релевантности сайтов, которые имеют значительное количество ссылок и могут не относиться к интересующему тематическому разделу. В соответствии с одним из аспектов настоящего изобретения машина 1006 расширенного поиска использует большое количество случайных поисковых терминов для получения множества результатов. Затем, вычислитель 1012 распределения ветви вычисляет распределение ветвей по результатам поиска. Вычислитель 1014 распределения ветвей соседства затем вычисляет распределение ветвей и распределение вероятности соседства ветви. Вычислитель 1016 распределения сетевой ветви затем вычисляет распределение сетевой ветви как описано выше. Нормализатор 1018 затем рассчитывает распределение вероятности, относящееся к тематически-специфичным/характерных для пользователя поисковым терминам, и вычитает аналогичные значения из распределения вероятности, относящегося к случайным поисковым терминам. Нормализатор необходим, поскольку множество сайтов имеют значительное количество входящих и исходящих ссылок и могут не быть релевантными по отношению ни к одному конкретному тематическому разделу и/или характеристике пользователя.
Основываясь на этих вычислениях, назначают настроенное взвешивание каждому сайту посредством блока 1010 назначения веса. Если требуется, то возвращенные сайты, которые не имеют порогового значения веса, могут быть отброшены. Подобным образом может быть определено пороговое количество N сайтов в пределах web-каталога, и сайты со значением N наибольшей релевантности могут быть использованы в web-каталоге. Более того, генератор 1008 web-каталога может включать в себя перечень 1020 ограничения, который включает в себя список сайтов, определенных нерелевантными по отношению тематическому разделу и/или пользовательской характеристике в рамках интересов. Например, сайты, которые известны как априори нерелевантные по отношению к тематическому разделу и/или пользовательской характеристике в рамках интересов, будут автоматически исключены из web-каталога, который должен быть сформирован посредством генератора 1008 web-каталога. После назначения весов каждому неотфильтрованному сайту генератор 1008 web-каталога формирует web-каталог 1022, конкретно по отношению к интересующему тематическому разделу и/или пользовательской характеристике(ам). Затем web-каталог может быть сохранен, размножен, передан различным пользователям и т. д. и применен в связи с выполнением фильтрованного поиска, касающегося тематического раздела и/или характеристик пользователя, как описано выше. В соответствии с другим аспектом настоящего изобретения web-каталог 1022 может быть сформирован так, чтобы быть частью иерархии web-каталога. Таким образом, может быть последовательно сформирована более специфичная иерархия web-каталогов.
Далее, на фиг. 11 проиллюстрирован способ 1100, который облегчает формирование web-каталога, имеющего отношение к конкретному тематическому разделу и/или пользовательской характеристике. На этапе 1102 формируют тематически-специфичную/характерную для пользователя конкретную запросную запись. Это может быть произведено посредством получения запросной записи из тематически-специфичного веб-сайта, извлечения ключевых слов из тематически-специфичного текстового сайта, предоставления URL первоисточника и извлечения ключевых слов из такого первоисточника и ассоциативно связанных входящих/исходящих ссылок и т.д. Более того, пользователь может формировать тематически-специфичные и/или специфичные характеристики пользователя запросные записи посредством создания перечня поисковых терминов, который, основываясь на опыте и предпочтении, пользователь считает специфичными по отношению к тематическому разделу в рамках интересов.
На этапе 1104 машина расширенного поиска выполняет многократный поиск по набору сайтов (например, Интернету, интранету, …), используя запросные термины, имеющиеся в запросных записях. Множество результатов этих операций поиска сохраняются для дальнейшей вычислительной обработки и анализа. На этапе 1106 вычисляют распределение ветвей, существующих в пределах результатов поиска. Так как многократный поиск выполнен с использованием различающихся тематических / с характеристиками поисковых запросов, то неизбежно, что по меньшей мере часть множества результатов будет нерелевантной по отношению к интересующему тематическому разделу и/или характеристике пользователя. Однако, если идентичный сайт возвращен многократно с применением различных предметно-ориентированных поисковых запросов, такой сайт является предположительно релевантным по отношению к тематическому разделу интересов и/или характеристике пользователя.
На этапе 1108 рассчитывают распределение ветви сайтов, соседствующих с сайтами, по множеству результатов, поскольку сайты, соседствующие с возвращенным сайтам, могут быть релевантными по отношению к интересующему тематическому разделу/характеристике пользователя. Например, сайты, которые связаны входящей ссылкой с сайтами возвращаемого множества, и сайты, которые связаны исходящей ссылкой с сайтами возвращаемого множества, могут быть рассмотрены и использованы для вычисления распределения ветви соседствующих сайтов. На этапе 1110 распределение сетевой ветви определяют путем суммирования распределения вероятности соседства ветви к распределению ветвей, существующих в результатах поиска, с неким дифференциальным взвешиванием для гарантии создания оптимального веб-каталога. На этапе 1112 сайты в возвращаемом множестве, которые не являются релевантными по отношению к тематическому разделу, отфильтровывают и не включают в веб-каталог. Например, множество сайтов может быть отброшено, поскольку они могут содержать в себе значительное количество входящих и исходящих ссылок, и, таким образом не являются релевантными по отношению к интересам тематического раздела/характеристик пользователя (например, они являются крупными, общими сайтами, из которых/на которые ссылаются многие люди). Более того, сайты с низким весом в вычислении распределения сетевой ветви могут быть не включены в веб-каталог, так как они недостаточно конкретны по отношению к тематическому разделу и/или характеристике пользователя, которые веб-кагалог должен представлять.
Далее, на фиг.12 проиллюстрирован способ 1200 формирования веб-каталога вручную. На этапе 1202 для пользователя обеспечивают интерфейс пользователя. Интерфейс пользователя может иметь множество позиций ввода данных, тем самым предоставляя пользователю возможность вводить данные, требуемые для формирования веб-каталога. На этапе 1204 веб-каталогу, который должен быть создан, дают соответствующее наименование, тем самым позволяя этому пользователю и другим пользователям легко различать, какой именно тематический раздел и/или характеристику(и) пользователя представляет веб-каталог. На этапе 1206 сайты (например, сетевые домены, ветви, …), которые будут включены в веб-каталог, вводят в позицию ввода данных в интерфейсе пользователя. Пользователь может отбирать эти сайты, основываясь на настоящем предпочтении, прошлом опыте, произносимых словах, поисковой машине или другой подходящей манере отбора сайтов, предполагаемых имеющими отношение к конкретному тематическому разделу/пользовательской характеристике. На этапе 1208 пользователь может назначить веса сайтам, выбранным для определения веб-каталога. Веса могут также быть назначены, основываясь на пользовательском предпочтении, опыте и т.д. Более того, веса могут быть назначены после формирования веб-каталога, основываясь на пользовательской истории, контексте и т.д., и другой информации, имеющей отношение к конкретному пользователю. На этапе 1210 веб-каталог закрывают, и доопределяют введенными сайтами и весами, назначенными этим сайтам. Веб-каталог может после этого быть сохранен, размножен, модифицирован или подвергнут любому другому подходящему действию, которое может быть совершено над подобными объектами.
Далее, на фиг. 13 проиллюстрированы примерная запросная запись 1300 и результирующий веб-каталог 1302. Веб-каталог 1302 был создан по желанию для представления конкретного тематического раздела поддержки, связанной с применением вычислительной техники. Таким образом, запросная запись 1300 включает в себя множество поисковых терминов, которые являются релевантными тематическому разделу поддержки вычислительной техники. Например, термины «брандмауэр», «сетевое соединение», «DVD» и т.д. все имеют отношение к поддержке вычислительной техники. Каждый запрос в запросной записи 1300 был введен в машину расширенного поиска и были предусмотрены результаты для генератора веб-каталога 904 (фиг. 9). Результирующий веб-каталог 1302 включает в себя большое количество связанных с применением вычислительной техники сайтов со связанным взвешиванием релевантности. Например, сайту computer.com был назначен наибольший вес (например, 0,01), и он таким образом является предположительно наиболее релевантным сайтом при осуществлении ссылки на тематический раздел связанной с применением вычислительной техники поддержки. Веб-каталог 1302 теперь может быть применен для фокусирования поиска по набору сайтов в тематическом разделе поддержки, связанной с применением вычислительной техники, путем осуществления настройки результатов, основываясь по меньшей мере на весах сайта в веб-каталоге 1302.
Далее, на фиг.14, проиллюстрирована система 1400, которая использует навигатор (механизм поиска) 1402 для локализации (определения местоположения) новых и/или видоизмененных сайтов в наборе сайтов 1404 (например, «всемирной паутины»), который может быть локализован посредством поисковой машины 1406. Например, навигатор 1402 может быть веб-навигатором (например, программой, которая просматривает «всемирную паутину» в автоматическом и периодическом режиме). Должно быть понятно, что навигатор 1402, как описано далее, ссылается на любой компонент, который просматривает сайты в наборе сайтов. Такой набор сайтов может быть сохранен на сервере, локальном жестком диске или любом подходящем месте хранения данных. Навигаторы сохраняют копию всех страниц, посещаемых для последующей обработки, например, поисковой машиной. Навигаторы также используют эти страницы для содействия сужению поиска. Например, поисковые машины Интернета полагаются на веб-навигаторы для гарантии того, что сайты, которые возвращены во время операции поиска, по-прежнему являются существующими во всемирной паутине и являются актуальной (текущей) версией этих сайтов.
В соответствии с одним из аспектов настоящего изобретения навигатор 1402 осуществляет доступ к хранилищу 1408 данных, которое включает в себя большое количество веб-каталогов 1410. Каждый веб-каталог включает в себя сайты, имеющие отношение к конкретным тематическим разделам и/или характеристикам пользователя, представленным веб-каталогами, и соответствующие сайты 1412 существуют в пределах набора сайтов 1404. Тематические разделы могут быть как расширенными, так и суженными в соответствии с тем, как пожелает создатель веб-каталогов 1410 во время их создания. Поскольку навигатор 1402 имеет доступ к перечню сайтов, которые определяют веб-каталог 1410, он может гарантировать, что эти сайты 1412 проверяются более часто в наборе сайтов 1404 (например, «всемирной паутины»), чем сайты, не определяющие веб-каталог 1410. Таким образом, сайтам в веб-каталогах, которые используются для сужения поиска, могут быть заданы большие приоритеты, касающиеся осуществления навигации, чем сайтам, находящимся вне веб-каталога или сайтам веб-каталога, менее часто используемым в связи с поиском. Более того, навигатор 1402 может быть ассоциативно связан с обслуживающим компонентом 1414, который может выполнять основанный на вероятности анализ в связи с действиями, предпринятыми навигатором 1402. Например, обслуживающий компонент 1404 может определять, что существует конкретная вероятность того, что один или более сайтов в пределах веб-каталогов 1410 были видоизменены/удалены во время последнего случая, при котором веб-навигатор посещал эти сайты 1412 в наборе сайтов 1404.
Более того, обслуживающий компонент 1414 может определять вероятность того, что одна или более входящих ссылок и/или одна или более исходящих ссылок были добавлены к сайтам, определяющим веб-каталог, с тех пор как имел место последний случай, при котором навигатор 1402 посещал эти сайты 1412 в пределах набора сайтов 1404. В соответствии с другим аспектом настоящего изобретения обслуживающий компонент 1414 может выполнять анализ цены/выгоды в связи с посещением навигатором 1402 одного или более сайтов 1412 в пределах набора сайтов 1406, которые определяют веб-каталог 1410. Например, компонент 1414 обслуживающей программы может рассматривать цену развертывания навигатора 1402 для одного или более сайтов 1412 в пределах набора сайтов (например, замедление конструирования/появления сайта, захват ресурсов навигации для различных сайтов) в связи с преимуществами посещения сайтов (например, гарантирование того, что сайт с высоким трафиком остается действующим).
Далее, коротко ссылаясь на фиг. 15, проиллюстрировано примерное сетевое окружение 1500, иллюстрирующее одно или более преимуществ настоящего изобретения. Окружение включает в себя первое хранилище 1502 данных и второе хранилище 1504 данных, в котором первое хранилище 1502 данных включает в себя веб-каталог 1506, который представляет конкретный тематический раздел. Вместо того, чтобы формировать новый веб-каталог, направленный на в значительной степени схожий тематический раздел, пользователь второго хранилища 1504 данных желает получить дублированную копию веб-каталога 1502 и использовать такой веб-каталог 1502 для сужения поиска. Так как веб-каталоги могут быть задуманы как объекты, пользователь второго хранилища 1504 данных может получать дубликат веб-каталога 1506, существующего в первом хранилище 1502 данных. Дубликат веб-каталога 1506 может быть передан по сетевому соединению и принят вторым хранилищем данных. Более того, дубликат веб-каталога 1506 может быть модифицирован согласно предпочтениям пользователя, как только он станет резидентным в хранилище 1504 данных. Таким образом, веб-каталоги предусматривают персонализацию в связи с осуществлением поиска набора сайтов - это является важным преимуществом над традиционными поисковыми системами и технологиями.
Далее, на фиг. 16, операция поиска, использующего веб-каталоги для фокусирования поиска, сравнивается с операциями поиска, использующими традиционные поисковые машины. Более конкретно, показан интерфейс 1602, который предоставляет поиску возможность быть фокусированным, используя один или более веб-каталогов, в котором выбранный веб-каталог относится к компьютерной помощи и поддержке (HSC). Поисковый запрос используется как «Троянский конь», в котором пользователь желает извлечь информацию, относящуюся к злонамеренным компьютерным программам. Возвращаемые результаты, полученные посредством употребления веб-каталога для фокусирования таких возвращаемых результатов, в более высокой степени имеют отношение к машине 1604 расширенного поиска, а также к домен-ориентированной поисковой машине 1606 (например, которая осуществляет поиск только по сетевому домену Microsoft®). Машина 1604 расширенного поиска возвращает нерелевантные результаты, имеющие отношение к истории Троянской войны. Ориентированная на сетевой домен поисковая машина 1606 упускает результаты, которые в высокой степени имеют отношение к поиску.
На фиг. 17 и 18 проиллюстрированы примерные отличия между результатами, полученными посредством операций поиска с помощью веб-каталога, и результатами, полученными из двух традиционных поисковых машин. Для измерения релевантности результатов было построено образцовое множество релевантных результатов для данного множества запросов, и результаты, полученные операцией поиска при помощи веб-каталога и операциями поиска машины расширенного поиска, были сравнены с образцом. Веб-каталог, примененный для проиллюстрированного эксперимента, был построен из 450 предметно-ориентированных запросов, и нормализован на множестве из 1000 случайных запросов. Запросы, использованные для получения результатов, были извлечены из смеси пятисот наиболее часто встречающихся запросов конкретного сетевого домена и пятисот случайных запросов, использованных в этом же самом сетевом домене. Для каждого запроса были получены высшие результаты от каждого из этих представителей, слиты и из них удалены дубликаты. Эти результаты были затем случайным образом отсортированы и представлены независимым комментаторам. Множество запросов, использованных для построения веб-каталога, и множество запросов, использованных для получения результатов, данные комментаторам, были взаимоисключающими.
Комментаторы, использованные в связи с этим сравнением, были не осведомлены о происхождении результатов (то есть, они были не в состоянии определить, исходили ли полученные результаты от традиционной поисковой машины или фокусированного веб-каталогом поиска). Комментаторы оценивали результат, касающийся выбранного тематического раздела, как «хороший» (результат является непосредственно релевантным по отношению к запросу), «нормальный» (результат давал некоторое понимание, но не полностью отвечал на вопрос) или «плохой» (результат был не пригоден к использованию). Например, если бы желаемый тематический раздел был о компьютерных вирусах, то возвращенный результат, обсуждающий информацию об античном городе Троя при употреблении запроса «Троянский конь», мог бы быть нерелевантным (или «плохим») результатом. В качестве альтернативы, информация о том, как предотвратить компьютерные вирусы, могла бы быть оценена как релевантная. Во всех 17741 результатах (полученных из 510 запросов, отправленных машине фокусированного поиска веб-каталога, а также двум традиционным поисковым машинам) были прокомментированы, используя простой инструмент комментирования. Эти комментарии были собраны в стандарт (образец). Как только этот образец был получен, снова выполнялись запросы к машине фокусированного поиска веб-каталога и двум традиционным поисковым машинам. Фиг. 17 и 18 иллюстрируют результаты такого сравнения.
Особо ссылаясь на фиг. 17, сравнение 1700 иллюстрирует, что результаты фокусированного поиска веб-каталога имеют более высокий среднестатистический ранг при сравнении с результатами двух традиционных поисковых машин. Среднестатистический ранг описывает усредненную локализацию (местоположение) первого результата, который удовлетворяет пользовательским потребностям. Очевидно, что более высокий среднестатистический ранг является желаемым. Среднестатистический ранг, ассоциативно связанный с фокусированными веб-каталогом поисками, является почти удвоенным по сравнению с рангом, ассоциативно связанным с двумя традиционными поисковыми машинами. Отдельно обращаясь к фиг. 18, проиллюстрированы различные сопоставления 1800, относящиеся к результатам, полученным из фокусированного веб-каталогом поиска и традиционных поисков. Более конкретно, релевантность результатов, полученных в некоторых первых сайтах, подвергнута сопоставлению между фокусированным веб-каталогом поиском и традиционными поисками. Результаты фокусированного веб-каталогом поиска были равным образом более релевантными, чем результаты традиционных поисковых машин. Более конкретно, нижеследующая таблица иллюстрирует данные, использованные для создания сопоставления 1800.
Приведенная таблица иллюстрирует, что наибольшее значение возвращенного результата, использующего веб-каталог для фокусирования поиска, было прокомментировано либо как «хорошее», либо как «нормальное» для 51,18% операций поиска в сравнении с гораздо меньшим количеством результатов остальных традиционных поисковых машин. Подобным образом, наибольшие значения возвращенных результатов, применяющих веб-каталоги для фокусирования поиска, были прокомментированы как «хорошие» для 32,16% операций поиска. Усредненная средняя правильность (точность) по релевантным результатам (УСП) является «усреднением средних значений» уровней правильности (точности) релевантных результатов каждого списка результатов. Нерелевантные результаты не вносят вклад в среднюю правильность списка результатов. И для наибольших N значений правильности, и для MAP большее значение показывает лучшую релевантность. Как можно увидеть из фиг. 17 и 18, а также приведенной выше таблицы результаты фокусированного веб-каталогом поиска значительно превосходят результаты расширенного поиска.
Со ссылкой на фиг. 19, примерное окружение 1910 для применения различных аспектов изобретения включает в себя вычислительное устройство 1912. Вычислительное устройство 1912 может быть любым вычислительным устройством (например, карманным специализированным компьютером, дорожным переносным компьютером, сервером, настольным компьютером, …). Вычислительное устройство 1912 включает в себя устройство 1914 обработки данных, системную память 1916 и системную шину 1918. Системная шина 1918 соединяет системные компоненты, включая в себя, но не в качестве ограничения, системную память 1916 для устройства 1914 обработки данных. Устройство 1914 обработки данных может быть любым из множества доступных устройств обработки данных. Сдвоенные микропроцессоры и другие мультипроцессорные архитектуры также могут быть применены в качестве устройства 1914 обработки данных.
Системная шина 1918 может представлять собой некоторые типы шинных структур, включающие в себя шину памяти или контроллер памяти, периферийную или внешнюю шину и/или локальную шину, использующие любое разнообразие доступных шинных архитектур, включая в себя, но не в качестве ограничения, 8-битную шину, соответствующую промышленному стандарту архитектуру (ISA), микроканальную архитектуру (MСA), расширенную ISA (EISA), настраиваемый интерфейс накопителей (IDE), локальную шину стандарта VESA локальных видеошин для персональных компьютеров (VLB), периферийную шину взаимодействия компонентов (PCI), универсальную последовательную шину (USB), расширенный графический порт (AGP), шину стандарта международной ассоциации производителей плат памяти для персональных компьютеров (PCMCIA) и интерфейс малых компьютерных систем (SCSI).
Системная память 1916 включает в себя энергозависимую память 1920 и энергонезависимую память 1922. Базовая система ввода/вывода (BIOS), содержащая базовые процедуры для передачи информации между элементами в вычислительном устройстве 1912, например, как используемые при запуске, сохранена в энергонезависимой памяти 1922. С целью иллюстрации, но не для ограничения энергонезависимая память 1922 может включать в себя постоянное запоминающее устройство (ПЗУ), программируемое ПЗУ (PROM), электрически программируемое ПЗУ (EPROM), электрически стираемое ПЗУ (EEPROM) или флэш-память. Энергозависимая память 1920 включает в себя оперативное запоминающее устройство (ОЗУ), которое действует в качестве кэш-памяти. С целью иллюстрации, но не для ограничения ОЗУ имеется в наличии в любом виде, таком как синхронное ОЗУ (SRAM), динамическое ОЗУ (DRAM), синхронное динамическое ОЗУ (SDRAM), синхронное динамическое ОЗУ с удвоенной скоростью доступа к данным (DDR SDRAM), усовершенствованное синхронное динамическое ОЗУ (ESDRAM), динамическое ОЗУ с синхронным каналом и ОЗУ с шиной прямого доступа (DRRAM).
Вычислительное устройство 1912 также включает в себя съемный/несъемный, энергозависимый/энергонезависимый компьютерный носитель информации. Фиг. 19 иллюстрирует, например, дисковое запоминающее устройство 1924. Дисковое запоминающее устройство 1924 включает в себя, но не в качестве ограничения устройства, подобные накопителям на магнитных дисках, накопителям на гибких магнитных дисках, ленточный накопитель, jaz-накопитель, дисковод для zip-дисков, LS-100 накопитель, карту флэш-памяти или переносное миниатюрное запоминающее устройство. В дополнение, дисковое запоминающее устройство может включать в себя носитель информации отдельно или в сочетании с другими носителями информации, включая, но не в качестве ограничения накопитель на оптических дисках, такой как устройство ПЗУ на компакт-диске (CD-ROM), накопитель на записываемых компакт-дисках (дисковод CD-R), накопитель на перезаписываемых компакт-дисках (дисковод CD-RW) или накопитель на цифровых многофункциональных дисках (DVD-ROM). Для содействия соединению дисковых запоминающих устройств 1924 с системной шиной 1918 обычно используют съемный или несъемный интерфейс, такой как интерфейс 1926.
Очевидно, что фиг. 19 описывает программное обеспечение, которое действует в качестве посредника между пользователями и основными вычислительными ресурсами, описанными в подходящем операционном окружении 1910. Такое программное обеспечение включает в себя операционную систему 1928. Операционная система 1928, которая может быть сохранена в дисковом запоминающем устройстве 1924, действует для управления и распределения ресурсов системы 1912 вычислительного устройства. Системные приложения 1930 имеют преимущество управления ресурсами операционной системой 1928 через программные модули 1932 и программные данные 1934, хранимые либо в системной памяти 1916, либо на дисковом запоминающем устройстве 1924. Должно быть принято во внимание, что настоящее изобретение может быть применено с различными операционными системами или сочетаниями операционных систем.
Пользователь вводит команды и информацию в вычислительное устройство 1912 через устройства 1936 ввода. Устройства 1936 ввода включают в себя, но не в качестве ограничения, координатно-указательное устройство, такое как мышь, шаровой манипулятор, перо, сенсорная панель, клавиатура, микрофон, джойстик, игровая панель, спутниковая антенна, сканирующее устройство, плата селектора телевизионных каналов, цифровая фотокамера, цифровая видеокамера, веб-камера и подобные. Эти и другие устройства ввода подключаются к устройству 1914 обработки данных через системную шину 1918 посредством интерфейсных портов 1938. Интерфейсные порты 1938 включают в себя, например, последовательный порт, параллельный порт, игровой порт и универсальную последовательную шину (USB). Устройства 1940 вывода используют некоторые из тех же типов портов, что и устройства 1936 ввода. Таким образом, например, порт USB может быть использован для предоставления ввода в вычислительное устройство 1912 и для вывода информации из вычислительного устройства 1912 в устройство 1940 вывода. Выходной адаптер 1942 предусмотрен для иллюстрации того, что есть несколько устройств 1940 вывода, подобных устройствам отображения, звуковоспроизводящим устройствам и принтерам, среди других устройств 1940 вывода, которые требуют специализированных адаптеров. Выходные адаптеры 1942 включают в себя, в качестве иллюстрации, но не ограничения аудио- и видеоплаты, которые предусматривают средство подключения между устройством 1940 и системной шиной 1918. Необходимо заметить, что другие устройства и/или системы, такие как удаленное вычислительное устройство 1944, предусмотрены для возможности и ввода и вывода.
Вычислительное устройство 1912 может работать в сетевом окружении, используя логическое соединение с одним или более удаленных вычислительных устройств, таких как удаленное вычислительное устройство 1944. Удаленное вычислительное устройство 1944 может быть персональным вычислительным устройством, сервером, маршрутизатором, сетевым ПК, рабочей станцией, основанным на микропроцессоре устройством, одноранговым устройством или другим общим сетевым узлом и подобным и типично включает в себя многие или все элементы, описанные относящимися к вычислительному устройству 1912. В целях краткости, только запоминающее устройство 1946 проиллюстрировано в удаленном вычислительном устройстве 1944. Удаленное вычислительное устройство 1944 логически присоединено к вычислительному устройству 1912 через сетевой интерфейс 1948 и затем физически присоединено посредством соединения 1950 системы связи. Сетевой интерфейс 1948 реализует сети связи, такие как локальные вычислительные сети (LAN) и глобальные сети (WAN). Технологии LAN включают в себя распределенный интерфейс передачи данных по волоконно-оптическим каналам (FDDI), распределенный проводной интерфейс передачи данных (CDDI), сеть Ethernet/стандарта 802.3 IEEE (института инженеров по электротехнике и электронике), сеть Token Ring/стандарта 802.5 IEEE и подобные. Технологии WAN включают в себя, но не в качестве ограничения соединения типа «точка-точка», сети с переключением каналов, подобные цифровой сети связи с комплексными услугами (ISDN), и основанные на них разновидности, сети с коммутацией пакетов и цифровые абонентские линии (DSL).
Соединения 1950 системы связи относятся к аппаратному/программному обеспечению, применяемому для присоединения сетевого интерфейса 1948 к шине 1918. Несмотря на то, что соединение 1950 системы связи показано для иллюстративной ясности внутри вычислительного устройства 1912, оно также может быть внешним по отношению к вычислительному устройству 1912. Аппаратное/программное обеспечение, необходимые для присоединения к сетевому интерфейсу 1948, включают в себя, только в качестве примерного предложения, обычные модемы телефонного класса, кабельные модемы и модемы цифровых абонентских линий, ISDN-адаптеры и платы Ethernet.
Фиг. 20 представляет собой структурную схему примерного вычислительного окружения 2000, с которым может взаимодействовать настоящее изобретение. Система 2000 включает в себя одного или более клиентов 2010. Клиенты 2010 могут быть аппаратными устройствами и/или программным обеспечением (например, программными потоками, программными процессами, вычислительными устройствами). Система 2000 также включает в себя один или более серверов 2030. Серверы 2030 также могут быть аппаратными устройствами и/или программным обеспечением (например, программными потоками, программными процессами, вычислительными устройствами). Серверы 2030, например, могут содержать программные потоки для выполнения преобразований, применяющие настоящее изобретение. Одна из возможных связей между клиентом 2010 и сервером 2030 может быть в форме пакета данных, приспособленного для того, чтобы быть переданным между двумя или более процессами вычислительных устройств. Система 2000 включает в себя инфраструктуру 2050 связи, которая может быть применена для облегчения обмена информацией между клиентом 2010 и сервером 2030. Клиенты 2010 оперативно присоединены к одному или более хранилищам 2060 данных клиентов, которые могут быть применены для сохранения информации локально на клиентах 2010. Подобным образом, серверы 2030 оперативно присоединены к одному или более хранилищам 2040 данных серверов, которые могут быть применены для сохранения информации локально на серверах 2030.
Все что было описано ранее включает в себя примеры осуществления настоящего изобретения. Несомненно то, что невозможно описать каждое мыслимое сочетание компонентов или методологий в целях описания настоящего изобретения, но тот, кто специализируется в данной области техники, может осознать, что возможны дальнейшие комбинации и перестановки в настоящем изобретении. Таким образом, настоящее изобретение задумано для охвата всех таких видоизменений, модификаций и вариаций, которые попадают в пределы сущности и объема прилагаемой формулы изобретения. Более того, в объеме, в котором термин «включает в себя» использован либо в подробном описании, либо формуле изобретения, такой термин задуман, чтобы быть включенным в манере, подобной термину «содержащий», также как «содержащий» понимают, применяя в качестве переходного слова в формуле изобретения.
название | год | авторы | номер документа |
---|---|---|---|
ПРЕДЛОЖЕНИЯ ЗАПРОСА НА ОСНОВЕ ДАННЫХ ПОИСКА | 2014 |
|
RU2638728C2 |
СИСТЕМА, СПОСОБ И ИНТЕРФЕЙС ДЛЯ ОБЕСПЕЧЕНИЯ ПЕРСОНАЛИЗИРОВАННОГО ПОИСКА И ДОСТУПА К ИНФОРМАЦИИ | 2005 |
|
RU2419858C2 |
ОБЕСПЕЧЕНИЕ РУКОВОДСТВА ТЕМАТИЧЕСКИМ ПОИСКОМ | 2012 |
|
RU2628200C2 |
СБОР ДАННЫХ О ПОЛЬЗОВАТЕЛЬСКОМ ПОВЕДЕНИИ ПРИ ВЕБ-ПОИСКЕ ДЛЯ ПОВЫШЕНИЯ РЕЛЕВАНТНОСТИ ВЕБ-ПОИСКА | 2007 |
|
RU2435212C2 |
ПОКАЗ ДЕЙСТВИЙ И ПОСТАВЩИКОВ, АССОЦИИРОВАННЫХ С СУБЪЕКТАМИ | 2011 |
|
RU2611971C2 |
АВТОМАТИЗИРОВАННОЕ ИЗВЛЕЧЕНИЕ ИНФОРМАЦИИ | 2016 |
|
RU2693193C1 |
ПРОВЕРКА РЕЛЕВАНТНОСТИ МЕЖДУ КЛЮЧЕВЫМИ СЛОВАМИ И СОДЕРЖАНИЕМ ВЕБ-САЙТА | 2005 |
|
RU2375747C2 |
АССОЦИИРОВАНИЕ ИНФОРМАЦИИ С ЭЛЕКТРОННЫМ ДОКУМЕНТОМ | 2006 |
|
RU2406129C2 |
СПОСОБ И СИСТЕМА РАНЖИРОВАНИЯ ЭЛЕМЕНТОВ СЕТЕВОГО РЕСУРСА ДЛЯ ПОЛЬЗОВАТЕЛЯ | 2013 |
|
RU2605039C2 |
Способ и система определения параметра релевантность для элементов содержимого | 2018 |
|
RU2714594C1 |
Изобретение относится к системам и способам осуществления поиска в глобальных и локальных сетях. Техническим результатом является расширение функциональных возможностей. Система для фокусированного поиска содержит веб-каталог, который включает в себя множество доменов и/или сайтов, которые имеют отношение к тематическому разделу и/или характеристикам пользователя. Каждому из сайтов в пределах каталога назначен вес, который показывает релевантность сайта по отношению к тематическому разделу и/или характеристикам пользователя. Поисковая машина принимает запрос и использует веб-каталог для фокусирования поиска на коллекции сайтов. Результаты поиска возвращают пользователю. 4 н. и 38 з.п. ф-лы, 20 ил., 1 табл.
1. Система проведения поиска, содержащая
компонент отображения, который представляет множество веб-каталогов для поиска по набору элементов тематической информации, причем упомянутое множество веб-каталогов соответственно ассоциативно связаны с множеством поднаборов элементов тематической информации, при этом каждый из элементов тематической информации взвешен по релевантности и отображается в порядке, основанном по меньшей мере частично, на ветвях распределения, ассоциированных с каждым из упомянутых элементов тематической информации, и причем каждому из элементов тематической информации соответствующего веб-каталога из упомянутого множества веб-каталогов дается заданный приоритет на основании степени использования, и элемент тематической информации заданного уровня приоритета просматривается с большей частотой, чем элементы тематической информации с более низким уровнем приоритета, чем упомянутый заданный уровень приоритета, или элементы тематической информации, которые не связаны с веб-каталогом;
компонент поиска, который выполняет поиск по набору элементов тематической информации, на основании по меньшей мере частично, принятого поискового запроса, и ранжирует каждый элемент тематической информации из этого набора элементов тематической информации, возвращенных посредством поискового запроса,
компонент селектора веб-каталога, который выбирает по меньшей мере один веб-каталог из множества веб-каталогов, на основании, в частности, поискового запроса, принятого компонентом поиска, причем каждому элементу тематической информации, возвращенному посредством поискового запроса, назначают комбинированный ранг и соответственно упорядочивают среди других возвращенных элементов тематической информации, на основании, в частности, ранга, назначенного компонентом поиска, и веса релевантности, назначенного соответствующему элементу тематической информации, который основан, в частности, на ветвях распределениях, ассоциированных с соответствующим элементом тематической информации, при этом ветви распределения определены на основании, в частности, количества случаев, когда соответствующий элемент тематической информации был возвращен в результате несвязанных друг с другом поисковых запросов, и входящих ссылок и исходящих ссылок на соответствующий элемент тематической информации, и
компонент ввода, который принимает поисковый запрос, по меньшей мере, по одному из веб-каталогов.
2. Система по п.1, которая находится на сервере.
3. Система по п.1, которая находится на клиенте.
4. Система по п.1, в которой веб-каталоги персонализированы для пользователей системы.
5. Система по п.4, в которой система дополнительно содержит машинообучающийся компонент, который создает профили в связи с пользователями.
6. Система по п.1, дополнительно содержащая компонент контекста, который представляет множество веб-каталогов в качестве функций пользовательского контекста.
7. Система по п.5, в которой профили являются передаваемыми.
8. Система по п.1, дополнительно содержащая обслуживающий компонент, который выполняет вероятностно-ориентированный анализ в связи с осуществлением поиска.
9. Система по п.8, в которой обслуживающий компонент выполняет основанный на соотношении цена/выгода анализ в связи с осуществлением поиска.
10. Система, которая выполняет фокусированный поиск по набору сайтов, содержащая
веб-каталог, причем веб-каталог соответствует по меньшей мере одному из конкретного тематического раздела или пользовательской характеристике(ам), при этом веб-каталог содержит множество сайтов, относящихся по меньшей мере к одному из тематического раздела или пользовательской характеристике(ам), при этом каждому сайту из множества сайтов назначен вес релевантности, который показывает релевантность этого сайта по отношению к по меньшей мере одному из тематического раздела или пользовательской характеристике(ам), при этом вес релевантности определен на основании, в частности, ветвей распределения, ассоциированных с упомянутым сайтом, при этом ветви распределения определены на основании количества случаев, когда сайт был возвращен в результате несвязанных друг с другом поисковых запросов, и входящих ссылок и исходящих ссылок на соответствующий сайт; компонент просмотра, который просматривает множество сайтов упомянутого веб-каталога более часто, чем другие сайты из набора сайтов, которые не содержатся в упомянутом веб-каталоге, и
поисковый компонент, который принимает поисковый запрос, причем поисковый компонент использует веб-каталог для фокусирования поиска по набору сайтов, основываясь на поисковом запросе, при этом поисковый компонент возвращает поднабор сайтов в качестве результатов, основываясь по меньшей мере частично, на веб-каталоге и поисковом запросе, и соответственно ранжирует каждый возвращенный сайт, причем каждому возвращенному сайту назначают комбинированный ранг и соответственно упорядочивают среди других возвращенных сайтов на основании, в частности, соответствующего ранга, назначенного каждому возвращенному сайту компонентом поиска, и соответствующего веса релевантности, назначенного каждому возвращенному сайту компонентом поиска, и соответствующего веса, присвоенного каждому возвращенному сайту, и компонент селектора веб-каталога, который выбирает веб-каталог, на основании, в частности, поискового запроса.
11. Система по п.10, в которой селектор веб-каталога выбирает веб-каталог для использования в связи с поиском.
12. Система по п.11, в которой селектор веб-каталога выбирает веб-каталог, основываясь, по меньшей мере частично, на точке входа на набор сайтов.
13. Система по п.11, в которой селектор веб-каталога выбирает веб-каталог, основываясь, по меньшей мере частично, на одном из: запросе, состоянии пользователя, пользовательском контексте и пользовательской истории.
14. Система по п.13, в которой селектор веб-каталога выбирает веб-каталог, основываясь, по меньшей мере частично, на воспринятом местоположении пользователя.
15. Система по п.13, в которой селектор веб-каталога выбирает веб-каталог, основываясь, по меньшей мере частично, на одном или более из: времени дня и дня недели.
16. Система по п.11, в которой селектор веб-каталога ассоциативно связан с пользовательским интерфейсом, причем пользователь выбирает веб-каталог для использования в связи с поиском посредством этого интерфейса пользователя.
17. Система по п.10, дополнительно содержащая компонент подстройки, который облегчает одно из: добавления и удаления сайта из веб-каталога.
18. Система по п.10, дополнительно содержащая компонент подстройки, который изменяет назначенный вес релевантности одного или более из множества сайтов в веб-каталоге.
19. Система по п.18, в которой компонент подстройки ассоциативно связан с интерфейсом пользователя, причем пользователь изменяет назначенный вес релевантности для одного или более из множества сайтов в пределах веб-каталога посредством этого интерфейса пользователя.
20. Система по п.18, дополнительно содержащая компонент механизма поиска, который осуществляет поиск по сайтам в качестве функции веб-каталога, при этом компонент механизма поиска и компонент подстройки работают совместно, чтобы автоматически поддерживать в работоспособном состоянии веб-каталог.
21. Система по п.10, в которой веб-каталог доступен через веб-сайт.
22. Система по п.10, в которой веб-каталог ассоциативно связан с пользовательским профилем, причем пользовательский профиль является портативным.
23. Система по п.10, дополнительно содержащая компонент, который принимает обратную связь, относящуюся к результатам, причем обратная связь применяется, чтобы автоматически поддерживать в рабочем состоянии веб-каталог.
24. Система по п.10, в котором порядок результатов основывается на функции системы ранжирования машины расширенного поиска и назначенных весах множества сайтов в пределах веб-каталога.
25. Система по п.10, в которой по меньшей мере один из возвращенных результатов, который не совпадает с сайтом в пределах веб-каталога, удаляется из результатов.
26. Система по п.10, в которой характеристики пользователя имеют отношение к одному или более из: возраст, местоположение, пол, этническая принадлежность, политическое членство и религия.
27. Система по п.10, в которой множество веб-каталогов используется в связи с поиском и результаты, полученные из поиска, классифицированы в соответствии с результатами, относящимися к веб-каталогу.
28. Система по п.10, в которой набор сайтов является по меньшей мере одним из Интернет и интранет или их комбинации.
29. Способ выполнения фокусированного поиска, содержащий этапы, на которых:
предусматривают веб-каталог, который образован множеством сайтов с релевантностью по отношению к по меньшей мере одному из: тематическому разделу или характеристике(ам) пользователя, представленных этим веб-каталогом, причем каждому сайту из множества сайтов назначен вес релевантности, который показывает релевантность каждого сайта по отношению к по меньшей мере одному из: тематического раздела или характеристике(ам) пользователя, при этом вес релевантности определен на основании, в частности, ветвей распределения, соответственно ассоциированных с каждым сайтом, при этом ветви распределения определены, на основании в частности количества случаев, когда соответствующий сайт был возвращен в результате несвязанных поисковых запросов, и входящих ссылок и исходящих ссылок, относящихся к соответствующему сайту;
выбирают веб-каталог на основании, в частности, поискового запроса;
передают поисковый запрос, имеющий отношение к по меньшей мере одному из: тематического раздела и характеристике(ам) пользователя, представленных веб-каталогом, к поисковой машине;
отыскивают в наборе сайтов информацию, основываясь на поисковом запросе;
получают результаты поиска, содержащие поднабор сайтов, основываясь, по меньшей мере частично, на поисковом запросе;
назначают комбинированный ранг каждому сайту, полученному посредством поискового запроса, и соответственно упорядочивают каждый полученный сайт среди других полученных сайтов на основании, в частности, соответствующих рангов, назначенных поисковой машиной, и соответствующих весов релевантности, назначенных каждому полученному сайту, и
просматривают множество сайтов упомянутого веб-каталога с большей частотой, чем другие сайты из набора сайтов, которые не содержатся в упомянутом веб-каталоге.
30. Способ по п.29, дополнительно содержащий этап, на котором удаляют по меньшей мере один результат поиска, который ассоциативно не связан с сайтами, которые образуют веб-каталог.
31. Способ по п.29, дополнительно содержащий этап, на котором выбирают веб-каталог, основываясь, по меньшей мере частично, на по меньшей мере одном из: запросе, пользовательской истории, пользовательском контексте или состоянии пользователя или их комбинации.
32. Способ по п.29, в котором набор сайтов является по меньшей мере одним из сети Интернет и Интранет или их комбинации.
33. Способ по п.32, дополнительно содержащий этап, на котором выбирают веб-каталог, основываясь на точке входа в по меньшей мере одну из сетей Интернет и Интранет или их комбинации.
34. Способ по п.29, дополнительно содержащий этап, на котором применяют механизм поиска для автоматической поддержки в рабочем состоянии веб-каталога.
35. Способ по п.29, дополнительно содержащий этап, на котором изменяют по меньшей мере один вес релевантности, основываясь, по меньшей мере частично, на обратной связи пользователя в связи с результатами поиска.
36. Способ по п.29, дополнительно содержащий этап, на котором изменяют по меньшей мере один вес релевантности, основываясь, по меньшей мере частично, на одном или более из: запросе, пользовательской истории, состоянии пользователя и пользовательском контексте или их комбинации.
37. Система для осуществления поиска в наборе сайтов, содержащая
средство для выработки тематически-специфичного веб-каталога, причем тематически-специфичный веб-каталог содержит множество сайтов, относящихся к тематическому разделу, причем каждому из множества сайтов назначен вес в соответствии с релевантностью сайта к этому тематическому разделу, при этом вес релевантности основан, в частности, на ветвях распределения, соответственно ассоциированных с каждым сайтом, при этом ветви распределения определены на основании, в частности, количества случаев, когда каждый сайт был возвращен в результате несвязанных поисковых запросов, и входящих ссылок и исходящих ссылок на соответствующий сайт;
средство для использования веб-каталога с поисковой машиной для поиска набора сайтов;
средство для выбора веб-каталога на основании, в частности, поискового запроса;
средство для ранжирования каждого сайта, возвращенного в качестве результата поискового запроса, причем каждый сайт, возвращенный в качестве результата поискового запроса, имеет назначенный комбинированный ранг и соответственно упорядочен среди других возвращенных сайтов на основании, в частности, соответствующего ранга, назначенного поисковой машиной, и веса релевантности, назначенного соответствующему возвращенному сайту, и средство для просмотра набора сайтов, которое просматривает сайты в тематически-специфичном веб-каталоге с большей частотой, чем сайты, которые не содержатся в тематически-специфичном веб-каталоге, средство для определения вероятности изменения в по меньшей мере одном сайте, которое использует основанный на вероятности анализ для определения вероятности, что изменение было сделано в по меньшей мере одном сайте, причем упомянутое изменение есть по меньшей мере одно из: замены, удаления, добавления входящих и исходящих ссылок или их комбинацию, по отношению к по меньшей мере одному сайту.
38. Система по п.37, дополнительно содержащая средство для назначения весов сайтам в пределах веб-каталога.
39. Система по п.37, дополнительно содержащая средство для подстройки веб-каталога.
40. Система по п.37, дополнительно содержащая средство для осуществления выбора веб-каталога из множества подкаталогов.
41. Система по п.37, дополнительно содержащая средство для отображения результатов поиска, соответствующего веб-каталогу, которое поднимает ранг результатов.
42. Система по п.37, в которой набор сайтов, является по меньшей мере одним из Интернет и Интранет или их комбинации.
ПАРАЛЛЕЛЬНАЯ СИСТЕМА ИНФОРМАЦИОННОГО ПОИСКА | 2001 |
|
RU2195015C1 |
СПОСОБ ОБЕСПЕЧЕНИЯ СВЯЗИ ПОЛЬЗОВАТЕЛЕЙ ТЕЛЕКОММУНИКАЦИОННЫХ СЕТЕЙ | 2000 |
|
RU2159955C1 |
US 6636848 B1, 21.10.2003 | |||
Прибор, замыкающий сигнальную цепь при повышении температуры | 1918 |
|
SU99A1 |
Авторы
Даты
2010-02-20—Публикация
2005-01-21—Подача