Область техники, к которой относится изобретение
Настоящее изобретение относится в общем случае к компьютерным системам, а более конкретно, настоящее изобретение относится к автоматическому усовершенствованию и выбору запросов и/или результатов поиска в соответствии с персонализированной пользовательской моделью.
Уровень техники
Учитывая широкую популярность «Всемирной паутины» и Интернет, пользователи могут получать информацию, относящуюся почти к любой теме, из большого количества информационных источников. Для поиска информации пользователи в общем случае применяют различные поисковые машины (поисковые механизмы) к задаче поиска информации. Поисковые машины позволяют пользователям находить по Интернет веб-страницы, содержащие информацию или другой материал, которые содержат определенные слова или фразы. Например, если они хотят найти информацию о Джордже Вашингтоне, первом президенте Соединенных Штатов, то они могут напечатать «Джордж Вашингтон первый президент», нажать кнопку поиска, и поисковая машина возвратит список веб-страниц, которые содержат информацию об этом известном президенте. Однако, если бы проводился более обобщенный поиск, например, если просто напечатать термин «Вашингтон», то возвратилось бы намного больше результатов, таких как относящиеся к географическим регионам или учреждениям, связанным с тем же самым именем.
В Сети существует много поисковых машин. Например, AllTheWeb, AskJeeves, Google, HotBot, Lycos, MSN Search, Teoma, Yahoo - только некоторые из многих примеров. Большинство этих поисковых машин обеспечивают по меньшей мере два режима поиска информации, например, через их собственный каталог сайтов, которые организованы с помощью тем для просмотра пользователями, или с помощью выполнения поиска по ключевым словам, которые вводят через портал пользовательского интерфейса в браузер. В общем случае, поиск по ключевым словам найдет, при наилучшей способности компьютера, все веб-сайты, которые содержат любую информацию, относящуюся к любым ключевым словам и фразам, которые определены. Сайт поисковой машины имеет поле для ввода пользователями ключевых слов и кнопку, которую нужно нажать для запуска поиска. Многие поисковые машины имеют подсказки о том, как использовать ключевые слова для эффективного поиска. Подсказки обычно обеспечиваются для того, чтобы помочь пользователям более точно определять термины поиска, чтобы посторонняя или несвязанная информация не возвращалась и не мешала процессу поиска информации. Таким образом, ручное уточнение терминов сохраняет пользователям много времени, помогая уменьшить прием нескольких тысяч сайтов для сортировки при поиске конкретной информации.
Одной из проблем во всех методиках поиска является требование ручного определения или уточнения терминов поиска для генерации требуемых результатов за короткое время. Другая проблема состоит в том, что поисковые машины работают одинаково для всех пользователей, независимо от различных пользовательских потребностей и обстоятельств. Таким образом, если два пользователя вводят тот же самый запрос поиска, то они получают те же самые результаты, независимо от их интересов, хронологии предыдущего поиска, вычислительного контекста или окружающего контекста (например, расположения, используемой машины, времени дня, дня недели). К сожалению, современные процессы поиска предназначены для того, чтобы принимать явные команды для поиска вместо того, чтобы рассматривать эти другие персонализированные факторы, которые могут предложить понимание фактических или желаемых целей поиска информации пользователем.
Раскрытие изобретения
Далее представлена упрощенная сущность изобретения для обеспечения основного понимания некоторых аспектов изобретения. Эта сущность не является обширным обзором изобретения. Она не предназначена для идентификации ключевых/критических элементов изобретения или для определения объема изобретения. Задача состоит в том, чтобы представить некоторые концепции изобретения в упрощенной форме в качестве вводной части к более подробному описанию, которое представлено ниже.
Настоящее изобретение относится к системам и способам, которые расширяют способы поиска информации, используя пользовательские модели, которые облегчают персонализацию поиска информации в соответствии с характеристиками пользователя, учитывая, насколько информация имеет отношение или соответствует наилучшим образом соответствующим пользователям. Данные модели могут объединяться с традиционными алгоритмами поиска для модификации запросов поиска и/или модификации результатов поиска для автоматического фокусирования способов поиска информации на элементах или результатах, которые, более вероятно, будут соответствовать пользователю, принимая во внимание личные характеристики пользователя. Различные методики обеспечивают для персонализации поиска через данную модель с помощью учета таких аспектов, как информация пользователя (например, информация, хранящаяся на компьютере пользователя), интересы, опыт (квалификацию) и определенный контекст, в котором эта информация нужна (например, запрос на поиск, вычислительное событие) для улучшения опыта поиска пользователя. Это усовершенствование можно соблюдать с помощью предоставления пользователям более выборочного или фильтрованного поиска элементов, представляющих интерес, удаления несвязанных элементов и/или повторного ранжирования (упорядочивания) возвращаемых результатов поиска на основе персонализированных предпочтений пользователя.
Пользовательские модели могут быть получены из множества источников, включающих в себя каталоги с широкими возможностями, которые рассматривают прошлые пользовательские события, предыдущие обмены информацией клиента, регистрацию или хронологию поиска, параметры пользователя, демографические данные, и/или основываясь на подобии другим пользователям (например, совместная фильтрация). Кроме того, могут применяться другие методики, такие как машинное самообучение для контроля поведения пользователя в течение долгого времени, для определения и/или усовершенствования пользовательских моделей. Данные модели могут объединяться со способами автономного или сетевого поиска (или с их комбинациями) для модификации результатов поиска для создания результатов поиска информации, которые, наиболее вероятно, будут представлять интерес для соответствующего пользователя. Таким образом, пользовательские модели используют для автоматической и эффективной дифференциации персонализированного поиска от обобщенного поиска.
В одном конкретном примере обобщенный поиск может включать в себя термин «погода». Так как модель может определять, что пользователь находится в конкретном городе (например, из учетной записи электронной почты, сохраненных документов, имеющих адрес пользователя, или с помощью явного или неявного определения местоположения), может автоматически выполняться персонализированный поиск (например, через автоматическую модификацию запроса и/или результатов), который возвращает относящуюся к погоде информацию, которая относится к городу, в котором пользователь находится в настоящее время. В мобильной ситуации, контекст (ситуация) для поиска может отличаться, и таким образом запрос и/или результаты могут модифицироваться соответствующим образом (например, поиск, выполняемый с мобильного компьютера пользователя, когда из недавнего резервирования авиабилетов или из недавно переданного другу мгновенного сообщения обнаружено, что в настоящее время он находится вне города). Могут обеспечиваться пользовательские интерфейсы, которые возвращают персонализированные результаты и предоставляют возможность настройки алгоритмов персонализированного поиска от наиболее обобщенного поиска по всему спектру до более персонализированного поиска.
Для достижения описанных ранее и связанных с ними целей, конкретные иллюстративные аспекты изобретения описаны в связи с последующим описанием и прилагаемыми чертежами. Эти аспекты показывают различные способы, с помощью которых можно воплощать данное изобретение, все из которых охватывает настоящее изобретение. Другие преимущества и новые особенности изобретения будут очевидны из последующего подробного описания изобретения при рассмотрении его вместе с чертежами.
Краткое описание чертежей
Фиг.1 является схематической структурной схемой, показывающей архитектуру поиска информации в соответствии с одним из аспектов настоящего изобретения.
Фиг.2 - структурная схема, показывающая пользовательскую модель в соответствии с одним из аспектов настоящего изобретения.
Фиг.3 - последовательность операций, показывающая процесс поиска информации в соответствии с одним из аспектов настоящего изобретения.
Фиг.4-9 показывают примеры пользовательского интерфейса в соответствии с одним из аспектов настоящего изобретения.
Фиг.10-13 показывают примерный алгоритм персонализации в соответствии с одним из аспектов настоящего изобретения.
Фиг.14 - схематическая структурная схема, показывающая соответствующую конфигурацию в соответствии с одним из аспектов настоящего изобретения.
Фиг.15 - схематическая структурная схема типовой вычислительной конфигурации, с которой может взаимодействовать настоящее изобретение.
Осуществление изобретения
Настоящее изобретение относится к системам и способам, которые используют пользовательские модели для персонализации обобщенных запросов и/или результатов поиска согласно информации, которая имеет отношение к соответствующему пользователю. В одном из аспектов обеспечивают систему, которая облегчает генерацию персонализированного поиска информации. Данная система включает в себя пользовательскую модель для определения характеристик пользователя. Компонент персонализации автоматически модифицирует запросы и/или результаты поиска, принимая во внимание пользовательскую модель для персонализации поиска информации для пользователя. Компонент пользовательского интерфейса принимает запросы и отображает результаты поиска от одной или большего количества местных и/или удаленных поисковых машин, причем интерфейс может настраиваться в диапазоне от более персонализированного поиска до более обобщенного поиска.
В данной заявке термины «компонент», «услуга», «модель» и «система» относятся к связанному с применением компьютера объекту, или к аппаратным средствам, или к комбинации аппаратных средств и программного обеспечения, или к программному обеспечению, или к выполняемому программному обеспечению. Например, компонент может быть процессом, выполняющимся в процессоре, процессором, задачей, исполняемым кодом, потоком выполнения, программой и/или компьютером, но не ограничен ими. Для иллюстрации, и приложение, выполняющееся на сервере, и сервер могут быть компонентом. Один или большее количество компонентов могут находиться в пределах процесса и/или потока выполнения, и компонент может быть локализован на одном компьютере и/или распределен между двумя или большим количеством компьютеров. В данном описании термин «вывод» в общем случае относится к процессу принятия решения или определения состояний системы, среды и/или пользователя из ряда наблюдений, которые зафиксированы через события и/или данные. Вывод может использоваться для идентификации определенного контекста или действия, или, например, может генерировать распределение вероятности по состояниям.
Обращаясь сначала к фиг.1, система 100 показывает архитектуру поиска информации в соответствии с одним из аспектов настоящего изобретения. Система 100 изображает обобщенную схему персонализации результатов поиска. Компонент 110 персонализации включает в себя пользовательскую модель 120, а также компоненты обработки (например, алгоритмы поиска, модифицируемые в соответствии с пользовательской моделью) для использования модели для воздействия на результаты поиска с помощью модификации запроса 130 и/или модификации результатов 140, возвращенных из поиска. Пользовательский интерфейс 150 генерирует запрос 130 и принимает модифицированные или персонализированные результаты, которые основаны на модификации 170 запроса и/или модификации 160 результатов, которые обеспечивает компонент 110 персонализации. В данном описании термин «модификация запроса» относится и к изменению относительно терминов в запросе 130, и к изменениям в алгоритме, который соответствует запросу 130 к документам, для получения персонализированных результатов 140. Модифицированные запросы и/или результаты 140 возвращают из одной или большего количества местных и/или удаленных поисковых машин 180. Глобальная база 190 данных из пользовательских статистических данных может поддерживаться для облегчения обновления пользовательской модели 120.
В общем случае существуют по меньшей мере два подхода к настройке результатов поиска, основываясь на пользовательской модели 120. В одном из аспектов с помощью модификации запроса обрабатывают начальный входной запрос и модифицируют или повторно генерируют запрос (через пользовательскую модель) для получения персонализированных результатов. Описанная ниже обратная связь по релевантности (по важности) является разновидностью с двумя циклами этого процесса, причем запрос генерирует результаты, которые приводят к модификации запроса (используя явные или неявные выводы о начальном наборе результатов), который приводит к персонализированным результатам, которые персонализированы для краткосрочной модели, основываясь на наборе результатов и запросов. Долговременные пользовательские модели могут также использоваться в контексте обратной связи по релевантности. Дополнительно, как обсуждается выше, модификация запроса также относится к изменениям, которые делают в алгоритме(ах), используемом для сравнения запроса с документами. В другом аспекте при модификации результатов берут вводимую пользователем информацию «как есть» для генерации запроса, который приводит к результатам, которые затем модифицируют (через пользовательскую модель) для генерации персонализированных результатов. Следует отметить, что модификация результатов обычно включает в себя некоторую форму повторного ранжирования и/или выбора из большего набора альтернатив. Модификация результатов может также включать в себя различные типы накопления и суммирования всех или подмножества результатов.
Способы модификации результатов включают в себя сравнение статистического подобия (в котором интересы пользователей и их информация представлены как векторы и соответствуют элементам) и сравнение категорий (в котором интересы пользователей и их информация представляют и соответствуют элементам, используя меньший набор дискрипторов). Приведенные выше процессы модификации запроса или модификации результатов могут объединяться, или независимо, или в интегрированном процессе, когда вводят зависимость между двумя процессами и используют для достижения цели. Чтобы показать персонализированный поиск, приведены следующие примеры.
В одном из примеров пользователь, который ищет информацию, расположен в Сиэтле. Поиск информации о дорожном движении возвращает информацию, относящуюся к дорожному движению в Сиэтле, а не к дорожному движению вообще. Или поиск пиццы возвращает только рестораны пиццы в соответствующем районе города, который относится к пользователю.
В другом примере пользователь, который ищет информацию, предварительно искал термин «Порше». Поиск термина «Ягуар» возвращает результаты, относящиеся к автомобильному значению термина «Ягуар», в противоположность животному или компьютерной игре или часам; другие результаты могут также возвращаться, но предпочтение отдают тем, которые относятся к автомобильному значению.
В другом случае пользователь, который ищет информацию, ищет термин «Буш», и большинство результатов - о президенте. Однако этот человек ранее читал статьи Ванневара Буша и переписывался по электронной почте с Сьюзен Буш, таким образом результатам, соответствующим этим элементам, присваивают более высокий приоритет. Как можно оценить, поиск может модифицироваться множеством различных способов, учитывая данные, хранящиеся и обрабатываемые с помощью пользовательской модели 120, которая описана более подробно ниже относительно фиг.2.
Обращаясь к фиг.2, пользовательская модель 200 показана в соответствии с одним из аспектов настоящего изобретения. Пользовательскую модель 200 используют для дифференциации персонализированного поиска от обобщенного поиска. Один аспект в успешной персонализации предназначен для создания модели пользователя, которая точно отражает его интересы и проста для поддержания и настройки к изменениям относительно долгосрочных и краткосрочных интересов. Пользовательскую модель можно получать из разнообразия источников, которые включают в себя, но не ограничены ими:
1) Из расширенной истории 210 вычислительного контекста, которая может быть получена из местных, мобильных или удаленных источников (например, открытые приложения, содержимое этих приложений и подробная хронология такого обмена информацией, включающая в себя ее расположение).
2) Из расширенного каталога 220 информационных ресурсов, к которым ранее с которым обращались (например, документов, веб-страниц, сообщений электронной почты, мгновенных сообщений, заметок, назначенных в календаре мероприятиях и т.д.).
3) Из результатов отслеживания обмена 230 информацией клиента, включающих в себя недавние или частые контакты, интересующие темы, полученные из ключевых слов, взаимоотношения в структуре организации, назначенные мероприятия и т.д.
4) Из истории или журнала регистрации предыдущих посещений веб-страниц или местных/удаленных сайтов с данными, которые включают в себя историю предыдущих запросов 240 на поиск.
5) Из профиля интересов пользователя 250, который можно определять явно или неявно, получая через фоновый контроль.
6) Из демографической информации 260 (например, места жительства, пола, возраста, биографических данных, квалификации (места работы) и т.д.).
Из приведенных выше примеров можно понять, что пользовательская модель 200 может основываться на многих различных источниках информации. Например, модель 200 могут получать из истории или журнала регистрации местоположений, посещаемых пользователем в течение долгого времени, что можно контролировать с помощью таких устройств, как система глобального позиционирования (GPS). При контроле с помощью GPS, необработанная пространственная информация может преобразовываться в текстовые названия городов и почтовые индексы. Необработанная пространственная информация может преобразовываться в текстовые названия городов и почтовые индексы для мест, в которых пользователь останавливался или жил, или в которых, например, произошла потеря сигнала GPS. Местоположения, в которых пользователь останавливался или жил, или в которых произошла потеря сигнала GPS, могут идентифицироваться и преобразовываться в текстовые метки с помощью базы данных фирм и мест, представляющих интерес. Другие факторы включают в себя регистрацию времени дня или дня недели для определения местоположения и мест, представляющих интерес.
В других аспектах данного изобретения могут обеспечиваться компоненты для управления параметрами, которые предназначены для управления тем, как совокупность информации пользователя, назначенные мероприятия, обзоры документов или файлов, действия или местоположения могут группироваться в подмножества или им могут присваиваться весовые коэффициенты дифференцированно в процедурах сравнения для персонализации, основываясь на типе, возрасте или других комбинациях. Например, алгоритм поиска может ограничиваться теми аспектами совокупности информации пользователя, которые относятся к запросу (например, документы, которые содержат запрашиваемый термин). Точно также сообщения электронной почты могут анализироваться за предыдущий 1 месяц, тогда как обращения в Интернет - за предыдущие 3 дня, а информация пользователя, созданная в течение прошлого года. Может быть желательно, чтобы информация о местоположении GPS использовалась только за сегодняшний день или за другой период времени. Параметрами можно управлять автоматически для создания подмножеств (например, через процесс оптимизации, который изменяет параметры и проверяет ответ от пользователя или от системы), или пользователи могут изменять один или большее количество этих параметров через пользовательский интерфейс, причем такие параметры настройки могут быть функцией характера запроса, времени дня, дня недели или других контекстных наблюдений или наблюдений за деятельностью.
Модели можно получать для людей или групп людей 270, например, через методику совместной фильтрации (описанную ниже), которая разрабатывает профили с помощью анализа подобия среди людей или групп людей. Вычисление подобия может основываться на содержимом и/или использовании элементов. Следует отметить, что моделирование инфраструктуры и соответствующая обработка могут выполняться в клиенте, во множестве клиентов, в одном или большем количестве серверов или в комбинациях серверов и клиентов.
Методики машинного обучения 280 могут применяться для изучения характеристик и интересов пользователя в течение долгого времени. Модели обучения могут включать в себя, по существу, любой вид системы, например, статистические/математические модели и процессы для моделирования пользователей и определения персональных настроек и интересов, которые включают в себя использование байесовского обучения, которое может генерировать байесовские модели зависимости, такие как байесовские сети, простые байесовские классификаторы и/или другие методологии статистической классификации, которые включают в себя, например, машины поддерживающих векторов (SVM). Другие виды моделей или систем могут включать в себя нейронные сети и скрытые модели Маркова, например. Хотя могут использоваться сложные модели принятия решения в соответствии с настоящим изобретением, следует признать, что также могут использоваться другие подходы. Например, вместо более тщательного вероятностного подхода могут также использоваться детерминированные предположения (например, отсутствие нового поиска конкретного веб-сайта в течение времени X может подразумевать по установленным правилам, что пользователя больше не интересует соответствующая информация). Таким образом, в дополнение к принятию решений в состоянии неопределенности, логические решения могут также приниматься относительно состояния, расположения, контекста, интересов, устремлений и т.д. пользователей.
Модели обучения могут тренироваться с помощью хранилища данных пользовательских событий (не показано), которое собирает или объединяет данные из множества различных источников данных. Такие источники могут включать в себя различные компоненты сбора данных, которые записывают или регистрируют данные пользовательских событий (например, звонки по сотовому телефону, звуковую информацию, записанную с помощью микрофона, информацию системы глобального позиционирования (GPS), информацию из электронного календаря, информацию от контролирующего оборудования системы технического зрения, активность на «рабочем столе», взаимодействие с веб-сайтами и т.д.). Следует отметить, что система 100 может воплощаться, по существу, любым способом, который поддерживает персонализированную обработку запросов и результатов. Например, система может воплощаться как сервер, серверная ферма, в клиентских приложениях, или более обобщенно, включать в себя веб-службу(ы) или другое автоматизированное приложение(я), которые взаимодействуют с функциональными средствами поиска, такими как пользовательский интерфейс 150 и поисковая машина 180.
Перед продолжением методики совместной фильтрации, применяемые в позиции 270 для пользовательской модели 200, описаны более подробно. Эти методики могут включать в себя использование совместных фильтров для анализа данных и определения профилей для пользователя. Системы совместной фильтрации в общем случае используют централизованную базу данных о пользовательских предпочтениях для предсказания дополнительных тем, которые могут запрашивать пользователи. В соответствии с настоящим изобретением совместную фильтрацию применяют в пользовательской модели 200 для обработки предыдущих действий пользователя из группы пользователей, которые могут указывать предпочтения данного пользователя, которые предсказывают вероятные или возможные профили для новых пользователей системы. Могут использоваться несколько алгоритмов, включающих в себя методики, основанные на коэффициентах корреляции, вычислениях подобия на основе вектора и статистических байесовских способах.
Фиг.3 показывает методологию 300 поиска информации в соответствии с настоящим изобретением. Хотя в целях простоты объяснения, методология показана и описана как последовательность действий, следует понять и признать, что настоящее изобретение не ограничено данным порядком действий, поскольку некоторые действия, в соответствии с настоящим изобретением, могут происходить в другом порядке и/или одновременно с другими действиями, по сравнению с показанными и описанными действиями. Например, специалисты поймут и оценят, что методология может альтернативно быть представлена как последовательность взаимодействующих состояний или событий, таких, какие существуют в диаграмме состояний. Кроме того, не все показанные действия могут требоваться для воплощения методологии в соответствии с настоящим изобретением.
Явно или неявно собранная информация об интересах пользователя может использоваться различными способами и зависящим от запроса способом, причем могут применяться многочисленные классы алгоритмов. Многие из алгоритмов учитывают имеющуюся в наличии личную информацию пользователя и/или действия, и/или запрос, и/или результаты, которые возвращает поисковая машина, и учитывают результаты измерения или то, что заменяет результаты измерения для статистических зависимостей между такой информацией и глобальной информацией.
Процесс 300 изображает два основных способа, которые могут быть применяться, однако, как отмечено выше, комбинации модификаций на основе запроса или модификаций на основе результатов могут применяться для персонализации извлеченной информации. На этапе 310 определяют одну или большее количество пользовательских моделей, как предварительно описано выше относительно фиг.2. На этапе 320 пользовательский запрос модифицируют в соответствии с моделью, определенной на этапе 310. Это может включать в себя автоматическое усовершенствование или уточнение запроса, чтобы он содержал только термины, которые соотносятся с интересами пользователя, которые определяют с помощью модели. На этапе 330 выполняют поиск с помощью модифицированного запроса, передавая модифицированный запрос к одной или большему количеству поисковых машин, причем результаты для модифицированного запроса возвращают на этапе 340.
В другой ветви процесса 300 выполняют поиск, передавая запрос пользователя к одной или большему количеству поисковых машин на этапе 350. Возвращенные результаты затем модифицируют на этапе 360, принимая во внимание пользовательскую модель. Это может включать в себя фильтрацию или переупорядочение результатов, основываясь на вероятности того, что некоторые результаты больше соответствуют предпочтениям пользователя для поиска необходимой информации. На этапе 370 модифицированные результаты представляют пользователю через отображение пользовательского интерфейса.
Последующее обсуждение описывает один конкретный пример смоделированной системы персонализированного поиска. В этом случае пользовательская модель может включать в себя каталог всех элементов, которые пользователь ранее просматривал, которые включают в себя сообщения электронной почты, документы, веб-страницы, назначенные в календаре мероприятия, примечания, мгновенные сообщения, блоги (электронные дневники) и т.д. Элементы отмечают с помощью метаданных (например, времени доступа/создания/модификации, типа элемента, автора элемента и т.д.), которые могут использоваться для выборочного добавления/исключения элементов для разработки пользовательской модели. В данном случае пользовательская модель находится в клиентской машине, причем к пользовательской модели существует доступ от запоминающего устройства в пределах клиентской машины при использовании поисковой машины.
Так как пользовательская модель обычно выполняется на клиентской машине, если клиентская машина не имеет местный каталог совокупности информации, в которой выполняют поиск, то получение статистической информации по термину для всей совокупности для повторного ранжирования может быть трудной задачей или требовать много времени для вычисления. Поэтому в последующем примере статистические данные совокупности аппроксимируют при использовании набора результатов.
Запрос направляют к поисковой машине (в Интернет или к корпоративной сети), и она возвращает результаты. Результаты модифицируют через пользовательскую модель. Модификация также происходит на клиентской машине. Для каждого результата вычисляют подобие элемента с каталогом пользователя для идентификации результатов, которые представляют больше интереса для пользователя. Существуют несколько способов выполнения такого сравнения, например, такой как:
Уравнение персонализированного подобия psim =
Персонализированное подобие суммируют по всем интересующим терминам. Для каждого термина подобие результата пропорционально тому, как часто термин появляется в результате (tft), обратно пропорционально количеству документов в совокупностях, в которых выполняют поиск, в которых данный термин появляется (dft), и пропорционально тому, в скольких документах термин появляется в каталоге пользователя (pdft). Интересующие термины могут включать в себя термины в заголовке результата, термины в краткой сводке результата, термины в расширенной сводке результата, термины во всей веб-странице, или некоторое подмножество этих терминов. Количество документов в совокупностях, в которых появляется данный термин, можно аппроксимировать, используя количество документов в наборе результатов, в котором появляется данный термин, где документы представлены полным текстом документа или отрывком из набора результатов, описывающим документ.
В одном из воплощений идентифицирует термины в пределах интервала из двух слов для каждого термина запроса в краткой сводке результата или в заголовке. В общем случае, все элементы в каталоге независимо от типа или времени используются для вычисления значения персонализированного подобия для каждого результата. Стандартное подобие каждого элемента затем объединяют с персонализированным подобием для каждого элемента. В одном из воплощений использует линейную комбинацию положения элемента в исходном списке результатов с нормализованной версией оценки psim каждого элемента. Другое воплощение включает в себя объединение положений в исходном списке и в персонализированном списке или оценок из исходного и персонализированного списков.
Обращаясь к фиг.4-9, показаны примеры пользовательского интерфейса для персонализированного поиска в соответствии с одним из аспектов настоящего изобретения. Следует отметить, что соответствующие изображенные интерфейсы могут обеспечиваться в различных других отличающихся установках и контексте. Как пример, обсуждаемые приложения и/или модели могут быть связаны, например, с настольным инструментальным средством разработки, приложением электронной почты, приложением электронного календаря и/или веб-браузером, хотя могут использоваться приложения другого типа. Эти приложения могут быть связаны с графическим пользовательским интерфейсом (ГПИ, GUI), причем графический пользовательский интерфейс обеспечивает изображение, имеющее один или большее количество объектов отображения (не показаны), которые включают в себя такие аспекты, как конфигурируемые значки, кнопки, ползунки, поля для ввода информации, опции выбора, меню, вкладки и т.д., имеющие многочисленные конфигурируемые размеры, форму, цвет, текст, данные и звуки, для облегчения работы с приложениями и/или моделями. Кроме того, ГПИ и/или модели могут также включать в себя множество другой вводимой информации или средств управления для регулирования и конфигурирования одного или большего количества аспектов настоящего изобретения, которые будут описаны более подробно ниже. Они могут включать в себя прием команд пользователя от мыши, клавиатуры, устройств голосового ввода информации, веб-сайта, удаленной веб-службы и/или другого устройства, такого как фотокамера или устройство ввода видеоинформации, чтобы воздействовать или изменять операции описанных ГПИ и/или моделей.
Фиг.4 показывает интерфейс 400 для представления персонализированных результатов. В этом примере запросом является термин «Буш». Стандартные результаты поиска показывают с левой стороны в позиции 410, а персонализированные результаты показывают с правой стороны в позиции 400. Ползунок 430 используют для управления функцией, которая объединяет стандартные и персональные результаты в пределах от отсутствия персонализации до полной персонализации.
Фиг.5 показывает интерфейс 500, в котором результаты персонального интереса дополнительно выделяют с помощью увеличения их размера шрифта пропорционально их оценке psim; могут также использоваться цвет или другие выделения при представлении. Дополнительно, термины, которые вносят существенный вес в оценку psim, могут выделяться в пределах отдельных кратких сводок результата. Слева в позиции 510 показывают упорядоченные стандартные результаты с помощью увеличения размера шрифта. Интерфейс в позиции 500 показывает персонализированную комбинацию, в которой снова выделены с помощью увеличения размера шрифта элементы, представляющие персональный интерес.
Фиг.6 показывает процесс обеспечения персонализированных запросов с помощью интерфейса 600. В этом случае на этапе 610 учитывают N первых результатов, которые были возвращены от запроса. На этапе 620 вычисляют подобие в соответствии с пользовательской моделью и возвращенными результатами. На этапе 630 объединяют персонализированные и стандартные результаты, и эти результаты повторно упорядочивают на этапе 640, причем их отображают как персонализированные результаты в позиции 600.
Фиг.7-9 показывают влияние описанного выше управления персонализацией. Обращаясь к фиг.7, интерфейс 700 настраивают через управление 710 персонализацией, где используют термин поиска «Итон». Верхний результат для Итонского колледжа имеет положение 1/100 в позиции 720. Управление 710 персонализацией перемещают вправо, и в списке появляются некоторые персонализированные результаты. Результат, который появляется в позиции 32 в списке стандартных результатов, теперь показан в позиции 4. На фиг.8, управление 810 персонализацией перемещают немного вправо, указывая больше персонализации при поиске. В этом случае сгенерировано такое расположение результатов, где вверху находятся результаты, относящиеся к Итонской школе, причем Итонская школа связана с родственником пользователя. В этом случае предыдущее положение на фиг.7 было 32 из 100. На фиг.9 ползунок персонализации перемещен в крайнее правое положение в позиции 910, обеспечивая более персонализированное расположение результатов, относящихся к почтовому сообщению о школьной форме в Итонской школе на текущую дату.
Фиг.10-13 показывают примерный процесс, который может использоваться для персонализации запросов и/или результатов в соответствии с одним из аспектов настоящего изобретения. Фиг.10 показывает оси под позициями 1000-1020, которые показывают измерения стандартного поиска информации, которыми являются запрос, пользователь, выполняющий данный запрос, и документы, принятые от такого запроса. В соответствии с настоящим изобретением учитывают четвертое или персонализированное измерение 1030, которое основывается на пользовательской модели, для дополнительного усовершенствования, выделения или модификации запросов и/или результатов в соответствии с личными характеристиками или интересами пользователя.
Такая персонализированная информация может выбираться из метаданных, относящихся к множеству личной информации, которая может быть доступна пользователю, например, когда документ был создан, просматривался или был изменен, информация временной метки, информация, которая была сохранена или ранее просматривалась, используемые приложения, журнал регистрации деятельности относительно веб-сайтов (например, сайты или темы, представляющие интерес), контекстная информация, такая как информация о местоположении или недавних действиях, действия с электронной почтой, работа с календарем, обмен личной информацией, например через электронные средства связи, демографическая информация, биографическая информация, подобным образом расположенная пользовательская информация и т.д. Эти характеристики могут выбираться и получаться из пользовательских моделей, которые предварительно описаны.
Переходя к фиг.11, диаграмма Венна 1100 показывает пересечения элементов поиска, которые получены из стандартной модели с обратной связью по релевантности. Внешний круг 1110 изображает N - общее количество документов, в которых может выполняться поиск. Внутренний круг ni представляет количество документов, содержащих термины данного поиска. Внутренний круг R представляют документы, которые определяют с помощью обратной связи по релевантности, причем подсекция или перекрытие между ni и R представляет документы ri, имеющие характеристики требуемых результатов поиска и считаются релевантными с помощью данного алгоритма. В общем случае R определяют с помощью обеспечения пользователями выводов о различной степени релевантности (например, из назначенной пользователем оценки). Согласно настоящему изобретению, R определяют автоматически, анализируя ранее описанную пользовательскую модель для определения соответствующих областей, представляющих интерес для пользователя. Вместо того, чтобы представлять весь объем документов, и N, и R могут также представлять подмножество объема документов (например, подмножество документов, которые релевантны запросу, как обозначено с помощью присутствия терминов запроса). Дополнительно, статистическая информация о совокупности, N и ni, может аппроксимироваться, используя набор результатов, причем N является количеством документов в наборе результатов, и ni является количеством документов, содержащих термины данного поиска, причем документы представляют с помощью всего текста документов или отрывков из набора результатов, описывающих документы.
Последующие уравнения показывают оценочную функцию, которая назначает оценку данному документу, основываясь на сумме некоторого подмножества терминов документа, где частоту (tfi) появления i-го термина в документе умножают на определенный весовой коэффициент (wi), указывающий частоту появления данного термина. Данная оценочная функция может использоваться для персонализации результатов. В данном случае использовалась модель обратной связи по релевантности BM25, но следует признать, что, по существу, любой алгоритм поиска информации может настраиваться для персонализированной модификации запросов и/или результатов в соответствии с настоящим изобретением.
Оценка = ∑ tfi · wi
Переходя к фиг.12, информация персонализированных релевантных документов (R) показана отдельно от информации совокупности (N) на диаграмме Венна 1200. В этом случае термины N' и ni' вводят для облегчения разделения, причем N' = N + R и ni' = ni + ri' и wi вычисляют следующим образом:
.
Фиг.13 показывает персонализированный блок 1300 разделенных данных, причем и персонализированные элементы, и элементы, соответствующие теме поиска, показаны в позиции 1310. Например, круг 1320 может включать в себя все документы, существующие в сети, документы, представленные в позиции 1320, могут включать в себя документы, относящиеся к персональным данным (например, документы, относящиеся к интересу к автомобилям, полученному из пользовательской модели), и элементы в позиции 1310 являются теми личными документами, которые относятся к термину поиска. Как можно заметить, запросы и результаты можно изменять с помощью множества терминов или условий в зависимости от модели и интересующего запроса.
Обращаясь к фиг.14, примерная конфигурация 1410 для воплощения различных аспектов изобретения включает в себя компьютер 1412. Компьютер 1412 включает в себя процессор 1414, системную память 1416 и системную шину 1418. Системная шина 1418 соединяет компоненты системы, которые включают в себя системную память 1416, но не ограничены ею, с процессором 1414. Процессор 1414 может быть любым из различных доступных процессоров. Дуальные (сдвоенные) микропроцессоры и другая многопроцессорная архитектура также могут использоваться в качестве процессора 1414.
Системная шина 1418 может быть любой из нескольких видов шинных структур, которые включают в себя шину памяти или контроллер памяти, периферийную шинную или внешнюю шину, и/или локальную шину, используя любое разнообразие доступных шинных архитектур, которые включают в себя 11-разрядную шину, архитектуру, соответствующую промышленному стандарту (ISA), микроканальную архитектуру (MSA), расширенную ISA (EISA), интеллектуальный интерфейс дисков (IDE), локальную шину ассоциации по стандартам в области видеоэлектроники (VESA)(VLB), стандарт соединения периферийных устройств (PCI), универсальную последовательную шину (USB), расширенный графический порт (AGP), шину международной ассоциации производителей плат памяти для персональных компьютеров (PCMCIA), и интерфейс малых вычислительных систем (SCSI), но которые не ограничены ими.
Системная память 1416 включает в себя энергозависимую память 1420 и энергонезависимую память 1422. Базовая система ввода-вывода (BIOS), которая содержит основные подпрограммы для перемещения информации между элементами в пределах компьютера 1412, например, во время запуска, хранится в энергонезависимой памяти 1422. Для иллюстрации, а не в качестве ограничения, энергонезависимая память 1422 может включать в себя постоянное запоминающее устройство (ПЗУ), программируемое ПЗУ (ППЗУ), электрически программируемое ПЗУ (ЭППЗУ), электрически стираемое ПЗУ (ЭСПЗУ) или флэш-память. Энергозависимая память 1420 включает в себя оперативную память (ОП), которая работает как внешняя кэш-память. Для иллюстрации, а не в качестве ограничения, ОП доступна во многих формах, таких как синхронная ОП (SRAM), динамическая ОП (DRAM), синхронная динамическая ОП (SDRAM), синхронная динамическая ОП с двойной скоростью передачи данных (SDRAM DDR), расширенная синхронная динамическая ОП (ESDRAM), динамическая ОП консорциума Synchlink (SLDRAM) и прямая ОП корпорации Rambus (DRRAM).
Компьютер 1412 также включает в себя съемные/несъемные, энергозависимые/энергонезависимые компьютерные носители данных. Фиг.14 показывает, например, дисковое запоминающее устройство 1424. Дисковое запоминающее устройство 1424 включает в себя такие устройства, как запоминающее устройство на магнитных дисках, накопитель на гибких магнитных дисках, накопитель на магнитной ленте, дисковод Jaz, дисковод Zip, дисковод LS-100, плата флэш-памяти или карта памяти, но не ограничено ими. Кроме того, дисковое запоминающее устройство 1424 может включать в себя носители данных отдельно или в комбинации с другими носителями данных, которые включают в себя оптический дисковод, такой как привод компакт-диска только для считывания (CD-ROM), привод записываемых компакт-дисков (привод CD-R), привод перезаписываемых компакт-дисков (привод CD-RW) или привод цифрового универсального диска только для считывания (DVD-ROM), но не ограничены ими. Для облегчения связи дисковых запоминающих устройств 1424 с системной шиной 1418 обычно используют съемный или несъемный интерфейс (средство сопряжения), такой как интерфейс 1426.
Следует признать, что фиг.14 описывает программное обеспечение, которое работает в качестве посредника между пользователями и основными компьютерными ресурсами, описанными в соответствующей рабочей конфигурации 1410. Такое программное обеспечение включает в себя операционную систему 1428. Операционная система 1428, которая может храниться в дисковом запоминающем устройстве 1424, предназначена для управления и распределения ресурсов компьютерной системы 1412. Системные приложения 1430 управляют ресурсами операционной системой 1428 через модули 1432 программ и данные 1434 программ, хранящиеся или в системной памяти 1416, или в дисковом запоминающем устройстве 1424. Следует признать, что настоящее изобретение может воплощаться с помощью различных операционных систем или комбинаций операционных систем.
Пользователь вводит команды или информацию в компьютер 1412 через устройство(а) 1436 ввода данных. Устройства 1436 ввода данных включают в себя устройство позиционирования, такое как «мышь», шаровой манипулятор («трекбол»), перо, сенсорную панель, клавиатуру, микрофон, джойстик, игровой планшет, спутниковую антенну, сканер, плату телевизионного тюнера, цифровую камеру, цифровую видеокамеру, веб-камеру и т.п., но не ограничены ими. Эти и другие устройства ввода данных соединяют с процессором 1414 через системную шину 1418 через порт(ы) интерфейса 1438. Порт(ы) интерфейса 1438 включает в себя, например, последовательный порт, параллельный порт, игровой порт и универсальную последовательную шину (USB). Устройство(а) 1440 вывода данных используют часть портов того же самого вида, какие использует устройство(а) 1436 ввода данных. Таким образом, например, порт USB может использоваться для обеспечения ввода данных в компьютер 1412, и для вывода информации из компьютера 1412 на устройство 1440 вывода данных. Адаптер 1442 вывода данных обеспечивают для того, чтобы показать, что существуют некоторые устройства 1440 вывода данных, такие как мониторы, динамики и принтеры, среди других устройств 1440 вывода данных, которые требуют специальных адаптеров. Адаптер 1442 вывода данных включает в себя, в качестве иллюстрации, а не в качестве ограничения, видео и звуковые платы, которые обеспечивают средство сопряжения между устройством 1440 вывода данных и системной шиной 1418. Следует отметить, что другие устройства и/или системы устройств обеспечивают обе возможности ввода и вывода данных, например, с помощью удаленного компьютера(ов) 1444.
Компьютер 1412 может работать в сетевой среде, используя логические соединения с одним или большим количеством удаленных компьютеров, таких как удаленный компьютер(ы) 1444. Удаленный компьютер 1444 может быть персональным компьютером, сервером, маршрутизатором, сетевым ПК, рабочей станцией, прибором на основе микропроцессора, равноправным устройством сети или другим обычным сетевым узлом и т.п., и он обычно включает в себя многие или все элементы, описанные относительно компьютера 1412. Для краткости, только запоминающее устройство 1446 показано с удаленным компьютером 1444. Удаленный компьютер(ы) 1444 логически связан с компьютером 1412 через сетевой интерфейс 1448 и затем физически связан через коммуникационное соединение 1450. Сетевой интерфейс 1448 охватывает коммуникационные сети, такие как локальные сети (ЛС) и глобальные сети (ГС). Технологии ЛС включают в себя интерфейс передачи данных по оптоволокну (FDDI), распределенный интерфейс проводной передачи данных (CDDI), стандарт Ethernet (офисная сетевая система)/IEEE 802.3, стандарт «маркерное кольцо»/IEEE 802.5 и т.п. Технологии ГС включают в себя каналы связи двухточечного соединения, сети с коммутацией каналов, такие как цифровые сети с предоставлением комплексных услуг (ISDN) и их разновидности, сети с коммутацией пакетов и цифровые абонентские линии (DSL), но не ограничены ими.
Коммуникационное соединение(я) 1450 относится к аппаратным средствам/программному обеспечению, которые используют для подключения сетевого интерфейса 1448 к шине 1418. Хотя коммуникационное соединение 1450 показано для целей иллюстрации внутри компьютера 1412, оно может также быть внешним относительно компьютера 1412. Аппаратные средства/программное обеспечение, необходимые для соединения с сетевым интерфейсом 1448, включают в себя, только в качестве примера, внутренние и внешние устройства, такие как модемы, которые включают в себя обычные телефонные модемы, кабельные модемы и модемы DSL, адаптеры ISDN и платы стандарта Ethernet.
Фиг.15 - схематическая структурная схема (система) типовой вычислительной конфигурации 1500, с которой может взаимодействовать настоящее изобретение. Система 1500 включает в себя одного или большее количество клиентов 1510. Клиент(ы) 1510 может быть аппаратными средствами и/или программным обеспечением (например, потоками, процессами, вычислительными устройствами). Система 1500 также включает в себя один или большее количество серверов 1530. Сервер(ы) 1530 может также быть аппаратными средствами и/или программным обеспечением (например, потоками, процессами, вычислительными устройствами). Серверы 1530 могут помещать потоки для выполнения преобразований, например, используя настоящее изобретение. Одна из возможностей осуществления связи между клиентом 1510 и сервером 1530 может быть в форме пакетов данных, настроенных для передачи между двумя или большим количеством компьютерных процессов. Система 1500 включает в себя коммуникационную структуру 1550, которая может использоваться для облегчения связи между клиентом(ами) 1510 и сервером(ами) 1530. Клиент(ы) 1510 функционально связан с одним или большим количеством хранилищ 1560 данных клиента, которые могут использоваться для хранения локальной информации клиента(ов) 1510. Точно так же сервер(ы) 1530 функционально связан с одним или большим количеством хранилищ 1540 данных сервера, которые могут использоваться для хранения локальной информации для сервера 1530.
Выше описаны примеры настоящего изобретения. Конечно, невозможно описать каждую мыслимую комбинацию компонентов или методологий для описания всех возможных вариантов осуществления настоящего изобретения, но специалисты должны признать, что возможно множество дополнительных комбинаций и изменений настоящего изобретения. Соответственно, настоящее изобретение охватывает все такие изменения, модификации и разновидности, которые находятся в пределах объема, определенного прилагаемой формулой изобретения. Кроме того, до той степени, до которой термин «включает в себя» используется или в подробном описании, или в формуле изобретения, данный термин является «охватывающим», таким же образом, как термин «содержащий», когда термин «содержащий» интерпретируется при использовании в качестве переходного слова в формуле изобретения.
Изобретение относится к области автоматического усовершенствования и выбора запросов и/или результатов поиска в соответствии с персонализированной пользовательской моделью. Техническим результатом является расширение функциональных возможностей за счет использования персонализированной пользовательской модели при осуществлении поиска. Система выполняет формирование персонализированного поиска информации. Данная система включает в себя пользовательскую модель для определения характеристик пользователя. Пользовательская модель может создаваться автоматически через анализ информации пользователя, его действий и всего контекста. Компонент персонализации автоматически модифицирует запросы и/или результаты поиска, принимая во внимание пользовательскую модель для персонализации поиска информации для пользователя. Пользовательский интерфейс принимает запросы и отображает результаты поиска от одной или большего количества местных и/или удаленных поисковых машин, причем интерфейс может корректироваться в диапазоне от более персонализированного поиска до более обобщенного поиска. 3 н. и 12 з.п. ф-лы, 15 ил.
1. Компьютерная система для выполнения формирования персонализированного поиска информации, содержащая:
пользовательский интерфейс для приема запросов поиска и отображения результатов поиска;
компьютерный носитель данных, содержащий исполняемые компьютером команды, которые при исполнении реализуют:
пользовательскую модель для определения характеристик пользователя на основании множества факторов, причем каждый фактор указывает тип события, связанного с пользователем, в совокупности данных,
компонент персонализации, связанный с пользовательской моделью для получения информации в ответ на запрос пользователя на основании определенных характеристик пользователя, и
компонент параметров для управления совокупностью данных для пользовательской модели, при этом для каждого фактора из множества факторов события типа, связанного с фактором, включаются в совокупность данных, когда они происходят в течение интервала, длина которого различна для разных факторов из множества факторов.
2. Система по п.1, в которой совокупность данных относится к запланированным пользователем мероприятиям, просматриваемым пользователем документам, действиям пользователя или местоположению пользователя.
3. Система по п.1, в которой компонент параметров определяет подмножества для совокупности данных или определяет взвешенные разности в процедурах сравнения для персонализации данных, основываясь по меньшей мере частично на типе или возрасте.
4. Система по п.1, в которой компонент параметров изменяет один или большее количество параметров через процесс оптимизации или через команды, обеспеченные с помощью пользовательского интерфейса.
5. Система по п.4, в которой параметры зависят от характера запроса, времени дня, дня недели, контекстных наблюдений или наблюдений за деятельностью.
6. Способ формирования персонализированного поиска информации, содержащий этапы, на которых:
принимают запросы поиска с помощью пользовательского интерфейса;
определяют характеристики пользователя с помощью пользовательской модели на основании множества факторов, причем каждый фактор указывает тип события, связанного с пользователем, в совокупности данных;
получают информацию в ответ на запрос пользователя на основании определенных характеристик пользователя;
модифицируют совокупность данных для пользовательской модели, при этом для каждого фактора из множества факторов события типа, связанного с фактором, включаются в совокупность данных, когда они происходят в течение интервала, длина которого различна для разных факторов из множества факторов; и
отображают результаты поиска.
7. Способ по п.6, в котором совокупность данных относится к запланированным пользователем мероприятиям, просматриваемым пользователем документам, действиям пользователя или местоположению пользователя.
8. Способ по п.6, в котором определяют подмножества для совокупности данных или взвешенные разности в процедурах сравнения для персонализации данных, основываясь по меньшей мере частично на типе или возрасте.
9. Способ по п.6, в котором изменяют один или большее количество параметров через процесс оптимизации или через команды, обеспеченные с помощью пользовательского интерфейса.
10. Способ по п.9, в котором параметры зависят от характера запроса, времени дня, дня недели, контекстных наблюдений или наблюдений за деятельностью.
11. Компьютерный носитель данных, содержащий исполняемые компьютером команды, которые при исполнении компьютером реализуют способ формирования персонализированного поиска информации, содержащий этапы, на которых:
принимают запросы поиска с помощью пользовательского интерфейса;
определяют характеристики пользователя с помощью пользовательской модели на основании множества факторов, причем каждый фактор указывает тип события, связанного с пользователем, в совокупности данных;
получают информацию в ответ на запрос пользователя на основании определенных характеристик пользователя;
модифицируют совокупность данных для пользовательской модели, при этом для каждого фактора из множества факторов события типа, связанного с фактором, включаются в совокупность данных, когда они происходят в течение интервала, длина которого различна для разных факторов из множества факторов; и
отображают результаты поиска.
12. Компьютерный носитель данных по п.11, в котором совокупность данных относится к запланированным пользователем мероприятиям, просматриваемым пользователем документам, действиям пользователя или местоположению пользователя.
13. Компьютерный носитель данных по п.11, в котором определяют подмножества для совокупности данных или взвешенные разности в процедурах сравнения для персонализации данных, основываясь по меньшей мере частично на типе или возрасте.
14. Компьютерный носитель данных по п.11, в котором изменяют один или большее количество параметров через процесс оптимизации или через команды, обеспеченные с помощью пользовательского интерфейса.
15. Компьютерный носитель данных по п.14, в котором параметры зависят от характера запроса, времени дня, дня недели, контекстных наблюдений или наблюдений за деятельностью.
Способ сварки электрозаклепками листов с профильным прокатом | 1982 |
|
SU1050830A1 |
US 6473752 B1, 29.10.2002 | |||
WO 9967698 A2, 29.12.1999 | |||
US 6012053 A, 04.01.2000 | |||
WO 9810597 A2, 12.03.1998 | |||
СПОСОБ ПОИСКА И ВЫБОРКИ ИНФОРМАЦИИ С ПОВЫШЕННОЙ РЕЛЕВАНТНОСТЬЮ | 2003 |
|
RU2236699C1 |
Авторы
Даты
2011-05-27—Публикация
2005-09-01—Подача