СИСТЕМА И СПОСОБ ИСПОЛЬЗОВАНИЯ КОНТЕНТА ОНЛАЙНОВОГО РАЗГОВОРА ДЛЯ ВЫБОРА РЕКЛАМНОГО КОНТЕНТА И/ИЛИ ДРУГОЙ РЕЛЕВАНТНОЙ ИНФОРМАЦИИ ДЛЯ ОТОБРАЖЕНИЯ Российский патент 2011 года по МПК G06F17/30 G06F12/00 

Описание патента на изобретение RU2419863C2

Ссылки на родственные заявки

Нет.

Сведения об исследованиях или разработках, субсидируемых государством

Нет.

Область техники, к которой относится изобретение

Настоящее изобретение относится к вычислительным средам. В частности, варианты осуществления настоящего изобретения относятся к системам и способам анализа контента онлайновых разговоров (например, сеансов мгновенного обмена сообщениями) с использованием технологий информационной проходки. Кроме того, варианты осуществления настоящего изобретения относятся к использованию результатов реализации технологии информационной проходки для нахождения релевантного рекламного контента и/или другой релевантной информации (например, словарных определений, ссылок на дополнительную информацию и т.п.) для отображения.

Предшествующий уровень техники

Все большее количество людей использует инструменты онлайнового разговора, например мгновенный обмен сообщениями, для облегчения связи с семьей, друзьями и коллегами. Зачастую совместно с контентом онлайнового разговора отображается одна или несколько реклам. Однако поскольку отображаемые рекламы обычно не имеют отношения к пользователю, эти рекламы редко замечают и, даже когда замечают, на них часто не обращают внимание.

Кроме того, тема онлайновых разговоров часто принимает форму вопросов, касающихся конкретной темы или продукта, в котором пользователь может быть заинтересован. Даже, если контент онлайнового разговора указывает, что пользователь имеет конкретную заинтересованность в определенной теме, для нахождения информации по теме, пользователю приходится обращаться к общей машине поиска вне окна онлайнового разговора и пытаться найти релевантную информацию в обычно обширном списке ресурсов.

Соответственно, желательно иметь способ использования контента онлайнового разговора для динамического выбора контекстуального или релевантного рекламного контента для отображения. Кроме того, предпочтительно иметь способ использования контента онлайнового разговора для динамического выбора другой релевантной информации (например, словарных определений, ссылок на дополнительную информацию и т.п.) для отображения.

Сущность изобретения

Варианты осуществления настоящего изобретения предусматривают способы использования контента онлайновых разговоров (например, сеансов мгновенного обмена сообщениями) для выбора рекламного контента для отображения. В одном варианте осуществления способ может включать в себя этапы, на которых принимают контент онлайнового разговора, извлекают одно или несколько ключевых слов из контента онлайнового разговора и выбирают рекламный контент для отображения на основании одного или нескольких извлеченных ключевых слов. При желании, способ может дополнительно включать в себя этап, на котором отображают рекламный контент, выбранный совместно с онлайновым разговором.

В другом варианте осуществления способ может включать в себя этапы, на которых оценивают одно или несколько извлеченных ключевых слов, идентифицируют любые ключевые слова намерения пользователя из одного или нескольких оцененных ключевых слов и, если какие-либо ключевые слова намерения пользователя идентифицированы, повторно взвешивают одно или несколько оцененных ключевых слов в соответствии с идентифицированными ключевыми словами намерения пользователя.

В еще одном варианте осуществления способ может включать в себя этапы, на которых оценивают одно или несколько извлеченных ключевых слов, определяют, произошла ли смена темы, и, если определено, что смена темы произошла, повторно взвешивают одно или несколько оцененных ключевых слов на основании исторических данных.

Варианты осуществления настоящего изобретения дополнительно предусматривают способы использования контента онлайновых разговоров (например, сеансов мгновенного обмена сообщениями) для выбора релевантной информации (например, словарных определений, ссылок на дополнительную информацию и т.п.) для отображения. В одном варианте осуществления способ может включать в себя этапы, на которых принимают контент онлайнового разговора, извлекают одно или несколько ключевых слов из контента онлайнового разговора и выбирают релевантную информацию для отображения на основании одного или нескольких извлеченных ключевых слов. При желании, способ может дополнительно включать в себя этап, на котором отображают релевантную информацию, выбранную совместно с контентом онлайнового разговора.

В другом варианте осуществления способ может включать в себя этапы, на которых оценивают одно или несколько извлеченных ключевых слов, идентифицируют любые ключевые слова намерения пользователя из одного или нескольких оцененных ключевых слов и, если какие-либо ключевые слова намерения пользователя идентифицированы, повторно взвешивают одно или несколько оцененных ключевых слов в соответствии с идентифицированными ключевыми словами намерения пользователя.

В еще одном варианте осуществления способ может включать в себя этапы, на которых оценивают одно или несколько извлеченных ключевых слов, определяют, произошла ли смена темы, и, если определено, что смена темы произошла, повторно взвешивают одно или несколько оцененных ключевых слов на основании исторических данных.

Дополнительные варианты осуществления настоящего изобретения предусматривают компьютерно-считываемые носители, имеющие компьютерно-выполняемые команды для осуществления способа. В одном варианте осуществления способ может включать в себя этапы, на которых принимают контент онлайнового разговора (например, сеанс мгновенного обмена сообщениями), извлекают одно или несколько ключевых слов из контента онлайнового разговора и находят, по меньшей мере, одно из рекламного контента и другой релевантной информации для отображения на основании одного или нескольких извлеченных ключевых слов.

Предусмотрены также компьютеры, запрограммированные на осуществление раскрытых здесь способов.

Краткое описание чертежей

Настоящее изобретение подробно описано со ссылкой на прилагаемые чертежи, в которых:

фиг.1 - блок-схема иллюстративной вычислительной среды, которую можно использовать для реализации настоящего изобретения;

фиг.2 - схема иллюстративной архитектуры системы согласно варианту осуществления настоящего изобретения;

фиг.3A и 3B - логическая блок-схема способа анализа контента онлайновых разговоров (например, сеансов мгновенного обмена сообщениями) с использованием технологий информационной проходки и использования результатов такого анализа для нахождения релевантного рекламного контента и/или другой релевантной информации для отображения согласно варианту осуществления настоящего изобретения;

фиг.4 - логическая блок-схема способа повторного взвешивания ключевых слов на основании исторической информации и обнаружения смены темы согласно варианту осуществления настоящего изобретения; и

фиг.5 - иллюстративный снимок экрана пользовательского интерфейса для отображения рекламного контента и/или другой информации, относящейся к контенту онлайнового разговора совместно с таким контентом согласно варианту осуществления настоящего изобретения.

Подробное описание изобретения

Ниже приведено конкретное описание предмета настоящего изобретения в соответствии с установленными требованиями. Однако само по себе описание не призвано ограничивать объем этого патента. Напротив, авторы изобретения предусматривают, что заявленный предмет допускает различные реализации, включающие в себя различные этапы или комбинации этапов, аналогичные описанным в этом документе, в сочетании с другими современными или будущими технологиями. Кроме того, хотя термины “этап” и/или “блок” можно использовать здесь в связи с различными элементами используемых способов, эти термины не следует интерпретировать в отношении какого-либо определенного порядка между различными этапами, раскрытыми здесь, если порядок отдельных этапов не оговорен в явном виде.

Варианты осуществления настоящего изобретения предусматривают системы и способы анализа контента онлайновых разговоров (например, сеансов мгновенного обмена сообщениями) с использованием технологий информационной проходки. Варианты осуществления настоящего изобретения дополнительно предусматривают способы и системы использования результатов реализации технологии информационной проходки для нахождения релевантного рекламного контента и/или другой информации для отображения.

Таким образом, варианты осуществления настоящего изобретения предусматривают системы и способы выбора релевантного рекламного контента и/или другой релевантной информации для отображения совместно с текстом онлайнового разговора на основании автоматического анализа контента онлайновых разговоров и контента рекламы, каковой контент можно описывать ключевыми словами или рекламными словами, и/или контента другой релевантной информации, каковой контент можно описывать ключевыми словами и пр.

Описанные здесь системы и способы полностью автоматизированы и облегчают выбор контекстуального рекламного контента и/или другой релевантной информации в соответствии с конкретными темами, которые относятся к контенту онлайнового разговора пользователя. Ключевые слова извлекаются из текста онлайнового разговора с использованием технологий информационной проходки. Извлеченные ключевые слова представляют темы, которые являются приближением заинтересованности(ей) пользователя во время онлайнового разговора. Затем, с использованием извлеченных ключевых слов, релевантные рекламы и/или другая информация выявляются для текущего пользователя и отображаются совместно с контентом онлайнового разговора. При желании, при нахождении рекламного контента и/или другой релевантной информации можно также учитывать другие факторы, например вероятности обращения, значения монетизации для ключевых слов, пользовательские профили и/или информацию, касающуюся поведения пользователя.

Благодаря использованию описанных здесь систем и способов, рекламный контент, отображаемый совместно с контентом онлайнового разговора, с большой степенью вероятности будет релевантен пользователю, что повышает вероятность того, что пользователь выберет рекламный контент и, таким образом, обратится к связанной с ним дополнительной информации. Такое обращение повышает вероятность того, что пользователь совершит покупку рекламируемого товара и, таким образом, максимизирует доход рекламодателя. Дополнительно, отображение другой релевантной информации совместно с контентом онлайнового разговора расширяет онлайновые возможности пользователя и повышает вероятность того, что он в дальнейшем воспользуется онлайновой услугой. Кроме того, при наличии, информацию профиля и поведения пользователя можно использовать при выборе контента, дополнительной настройки рекламного контента и другой релевантной информации на интересы пользователя.

Описав в общих чертах настоящее изобретение, приступим к описанию иллюстративной рабочей среды настоящего изобретения.

На чертежах в целом, где используется сквозная система обозначений, и в частности и в первую очередь на фиг.1 иллюстративная рабочая среда для реализации настоящего изобретения показана и обозначена как целое в виде среды (оборудования) 100 вычислительной системы. Среда вычислительной системы является лишь одним примером подходящей вычислительной среды 100 и не призвана накладывать какие-либо ограничения на объем использования или функциональные возможности изобретения. Кроме того, вычислительную среду 100 не следует рассматривать как имеющую какую-либо зависимость или требование в отношении любого компонента, проиллюстрированного в иллюстративной рабочей среде 100 или их комбинации.

Изобретение применимо ко многим другим средам или конфигурациям вычислительных систем общего назначения или специального назначения. Примеры общеизвестных вычислительных систем, сред и/или конфигураций, пригодных для применения изобретения, включают в себя, но без ограничения, персональные компьютеры, компьютеры-серверы, карманные или портативные устройства, многопроцессорные системы, системы на основе микропроцессора, телевизионные приставки, программируемую бытовую электронику, сетевые ПК, миникомпьютеры, универсальные компьютеры, телефонные системы, распределенные вычислительные среды, которые включают в себя любые из вышеперечисленных систем или устройств, и т.п.

Изобретение можно описать в общем контексте компьютерно-выполняемых команд, например программных модулей, выполняемых компьютером. В общем случае программные модули включают в себя процедуры, программы, объекты, компоненты, структуры данных и т.д., которые выполняют определенные задачи или реализуют определенные абстрактные типы данных. Изобретение можно применять на практике в распределенных вычислительных средах, где задачи выполняются удаленными устройствами обработки, связанными друг с другом посредством сети передачи данных. В распределенной вычислительной среде программные модули размещаются как на локальных, так и на удаленных компьютерных носителях данных, включая запоминающие устройства.

Согласно фиг.1 иллюстративная система для реализации изобретения включает в себя вычислительное устройство общего назначения в виде компьютера 110. Компоненты компьютера 110 включают в себя, но без ограничения, процессор 120, системную память 130 и системную шину 121, которая подключает различные компоненты системы, в том числе системную память, к процессору 120. Системная шина 121 может относиться к любому из нескольких типов шинных структур, включая шину памяти или контроллер памяти, периферийную шину и локальную шину с использованием различных шинных архитектур. В порядке примера, но не ограничения, такие архитектуры включают в себя шину «архитектуры промышленного стандарта» (ISA), шину «микроканальной архитектуры» (MCA), шину расширенной ISA (EISA), локальную шину «ассоциации по стандартизации видеоэлектроники» (VESA) и шину «взаимосоединения периферийных компонентов» (PCI), также именуемую шиной расширения.

Компьютер 110 обычно включает в себя различные компьютерно-считываемые среды. Компьютерно-считываемые среды могут представлять собой любые имеющиеся среды, к которым компьютер 110 может осуществлять доступ, и включают в себя энергозависимые и энергонезависимые среды, сменные и стационарные среды. В порядке примера, но не ограничения, компьютерно-считываемые среды могут содержать компьютерные носители данных и среды передачи данных. Компьютерные носители данных включают в себя энергозависимые и энергонезависимые, сменные и стационарные носители, реализованные с помощью любого метода или технологии для хранения информации, например компьютерно-считываемых команд, структур данных, программных модулей или других данных. Компьютерные носители данных включает в себя, но без ограничения, ОЗУ, ПЗУ, ЭСППЗУ, флеш-память или другую технологию памяти, CD-ROM, цифровые универсальные диски (DVD) или другие оптические диски, магнитные кассеты, магнитную ленту, накопитель на магнитных дисках или другие магнитные запоминающие устройства или любой другой носитель, который можно использовать для хранения полезной информации и к которому компьютер 110 может осуществлять доступ. Среды передачи данных обычно реализуют компьютерно-считываемые команды, структуры данных, программные модули или другие данные в сигнале, модулированном данными, например несущей волне или другом транспортном механизме, и включают в себя любые среды доставки информации. Термин «сигнал, модулированный данными» означает сигнал, одна или несколько характеристик которого изменяется таким образом, чтобы кодировать информацию в сигнале. В порядке примера, но не ограничения, среды передачи данных включает в себя проводные среды, например проводную сеть или прямое проводное соединение, и беспроводные среды, например акустические, РЧ, инфракрасные и другие беспроводные среды. Комбинации любых вышеперечисленных сред также подлежат включению в понятие компьютерно-считываемых сред.

Системная память 130 включает в себя компьютерные носители данных в виде энергозависимой и/или энергонезависимой памяти, например постоянной памяти (ПЗУ) 131 и оперативной памяти (ОЗУ) 132. Базовая система ввода/вывода (BIOS) 133, содержащая основные процедуры, которые помогают переносить информацию между элементами компьютера 110, например, при запуске, обычно хранятся в ПЗУ 131. ОЗУ 132 обычно содержит данные и/или программные модули, к которым процессор 120 может непосредственно обращаться или которыми он в данный момент оперирует. В порядке примера, но не ограничения, на фиг.1 показаны операционная система 134, прикладные программы 135, другие программные модули 136 и программные данные 137.

Компьютер 110 также может включать в себя другие сменные/стационарные, энергозависимые/энергонезависимые компьютерные носители данных. Исключительно для примера, на фиг.1 показаны привод 141 жесткого диска, который считывает с или записывает на стационарный энергонезависимый магнитный носитель, привод 151 магнитного диска, который считывает с или записывает на сменный энергонезависимый магнитный диск 152, и привод 155 оптического диска, который считывает с или записывает на сменный энергонезависимый оптический диск 156, например CD-ROM или другой оптический носитель. Другие сменные/стационарные, энергозависимые/энергонезависимые компьютерные носители данных, которые можно использовать в иллюстративной рабочей среде, включают в себя, но без ограничения, кассеты с магнитной лентой, карты флеш-памяти, цифровые универсальные диски, цифровую видеоленту, полупроводниковое ОЗУ, полупроводниковое ПЗУ и т.д. Привод 141 жесткого диска обычно подключен к системной шине 121 через интерфейс стационарной памяти, например интерфейс 140, и привод 151 магнитного диска и привод 155 оптического диска обычно подключены к системной шине 121 посредством интерфейса сменной памяти, например интерфейса 150.

Приводы и соответствующие компьютерные носители данных, рассмотренные выше и показанные на фиг.1, обеспечивают хранение компьютерно-считываемых команд, структур данных, программных модулей и других данных для компьютера 110. Например, на фиг.1 показано, что в приводе 141 жесткого диска хранятся операционная система 144, прикладные программы 145, другие программные модули 146 и программные данные 147. Заметим, что эти компоненты могут совпадать с или отличаться от операционной системы 134, прикладных программ 135, других программных модулей 136 и программных данных 137. Операционная система 144, прикладные программы 145, другие программные модули 146 и программные данные 147 обозначены здесь другими позициями, чтобы подчеркнуть, что они являются как минимум разными копиями. Пользователь может вводить команды и информацию в компьютер 110 через устройства ввода, например клавиатуру 162 и указательное устройство 161, например мышь, шаровой манипулятор или сенсорную панель. Другие устройства ввода (не показаны) могут включать в себя джойстик, игровую панель, спутниковую антенну, сканер и т.п. Эти и другие устройства ввода часто подключены к процессору 120 через интерфейс 160 пользовательского ввода, который подключен к системной шине, но могут подключаться посредством других интерфейсов и шинных структур, например параллельного порта, игрового порта или универсальной последовательной шины (USB). Монитор 191 или устройство отображения другого типа также подключено к системной шине 121 через интерфейс, например видеоинтерфейс 190. Помимо монитора 191, компьютеры также могут включать в себя другие периферийные устройства вывода, например громкоговорители 197 и принтер 196, которые могут подключаться через интерфейс 195 выходной периферии.

Компьютер 110 может работать в сетевой среде с использованием логических соединений с одним или несколькими удаленными компьютерами, например удаленным компьютером 180. Удаленный компьютер 180 может представлять собой персональный компьютер, карманное устройство, сервер, маршрутизатор, сетевой ПК, равноправное устройство или другой общий сетевой узел и обычно включает в себя многие или все элементы, описанные выше применительно к компьютеру 110, хотя на фиг.1 показано только запоминающее устройство 181. Логические соединения, описанные на фиг.1, включают в себя локальную сеть (ЛС) 171 и глобальную сеть (ГС) 173, но также могут включать в себя другие сети. Такие сетевые среды обычно применяются в учреждениях, компьютерных сетях в масштабе предприятия, интрасетях и Интернете.

При использовании в сетевой среде ЛС, компьютер 110 подключен к ЛС 171 через сетевой интерфейс или адаптер 170. При использовании в сетевой среде ГС, компьютер 110 обычно включает в себя модем 172 или другое средство установления связи в ГС 173, например Интернете. Модем 172, который может быть внутренним или внешним, может быть подключен к системной шине 121 через сетевой интерфейс 170 или другой пригодный механизм. В сетевой среде программные модули, описанные применительно к компьютеру 110, или часть из них могут храниться в удаленном запоминающем устройстве. В порядке примера, но не ограничения, на фиг.1 показано, что удаленные прикладные программы 185 размещены на запоминающем устройстве 181. Заметим, что показанные сетевые соединения являются иллюстративными и можно использовать другие средства установления линии связи между компьютерами.

Хотя многие другие внутренние компоненты компьютера 110 не показаны, специалистам в данной области техники хорошо известны такие компоненты и их взаимосвязь. Соответственно, дополнительные детали, касающиеся внутренней конструкции компьютера 110, не нуждаются в раскрытии в связи с настоящим изобретением.

При включении или перезагрузке компьютера 110, BIOS 133, хранящийся в ПЗУ 131, предписывает процессору 120 загрузить операционную систему или необходимую ее часть с привода 141 жесткого диска в ОЗУ 132. Когда скопированная часть операционной системы, обозначенная как операционная система 144, загружена в ОЗУ 132, процессор 120 выполняет код операционной системы и обеспечивает отображение на мониторе 191 визуальных элементов, связанных с пользовательским интерфейсом операционной системы 134. Обычно, когда пользователь открывает прикладную программу 145, программный код и соответствующие данные считываются с привода 141 жесткого диска, и необходимые части копируются в ОЗУ 132, причем скопированная часть обозначается здесь как 135.

Как отмечено выше, варианты осуществления настоящего изобретения относятся к системам и способам анализа контента онлайновых разговоров (например, сеансов мгновенного обмена сообщениями) с использованием технологий информационной проходки и использования результатов такого анализа для нахождения релевантного рекламного контента и/или другой релевантной информации для отображения. На фиг.2 показана блок-схема, демонстрирующая общую архитектуру системы для анализа контента онлайнового разговора и нахождения рекламного контента и/или другой релевантной информации согласно варианту осуществления настоящего изобретения, причем общая архитектура системы в целом обозначена здесь позицией 200.

Система 200 включает в себя компонент 212 разделения слов для обнаружения промежутков между словами и использования этих промежутков для задания последовательности слов после получения потока исходного контента онлайнового разговора 210 (например, контента сеанса мгновенного обмена сообщениями). Компонент 212 разделения слов может быть особенно полезен в языках, формат которых предусматривает менее выраженные промежутки между словами, чем английский язык. Система 200 дополнительно включает в себя компонент морфологического анализа 214 для стандартизации слов из последовательности слов, т.е. для приведения слов к стандартному виду. Кроме того, система 200 включает в себя компонент 216 фильтрации игнорируемых слов для идентификации и фильтрации игнорируемых слов, т.е. слов, не относящихся к теме онлайнового разговора, из последовательности слов. В общем случае игнорируемые слова - это слова, которые, например, слишком часто используются в разговоре, чтобы надежно указывать заинтересованность пользователя в той или иной конкретной теме. Игнорируемые слова обычно обеспечиваются посредством заранее заданного списка и идентифицируются путем сравнения последовательности проанализированных слов с заранее заданным списком.

Система 200 дополнительно включает в себя компонент 218 извлечения ключевых слов разговора для извлечения ключевых слов из исходного онлайнового разговора и сравнения извлеченных ключевых слов с совокупностью списков для определения совпадений. Таким образом, компонент 218 извлечения ключевых слов разговора принимает ввод из рекламной базы данных 224, в которой может(ут) храниться список(и) рекламных ключевых слов для сравнения с извлеченными ключевыми словами, информационной базы данных 225, в которой может(ут) храниться список(ки) ключевых слов информации и список инициаторов намерения пользователя для сравнения с извлеченными ключевыми словами, а также вывод из компонента 216 фильтрации игнорируемых слов.

Компонент 218 извлечения ключевых слов разговора дополнительно классифицирует извлеченные ключевые слова по одной или более из трех категорий: ключевые слова 218A намерения пользователя, ключевые слова 218B выбора рекламы и ключевые слова 218C выбора релевантной информации. Ключевые слова 218A намерения пользователя - это ключевые слова, которые указывают конкретную заинтересованность пользователя конкретной темой и обычно следуют за заранее определенным инициирующим словом или сочетанием слов. Например, если пользователь вводит фразу “Я бы хотел купить Ягуар”, слово “ягуар” можно считать ключевым словом намерения пользователя, поскольку оно следует за сочетанием слов “Я бы хотел купить”. Слова или словосочетания, инициирующие ключевые слова 218A намерения пользователя, обычно обеспечиваются посредством заранее заданного списка ключевых слов 218A намерения пользователя и затем идентифицируются путем сравнения последовательности слов, введенных из компонента 216 фильтрации игнорируемых слов системы 200, с заранее заданным списком. Список инициаторов намерения пользователя может храниться в показанной информационной базе данных 225 или, при желании, может храниться в отдельной базе данных.

Ключевые слова 218A намерения пользователя также можно определять на основании информации 230 пользовательского профиля и/или информации 232 поведения пользователя, если эта информация доступна. Например, если в большом проценте онлайновых разговоров, которые пользователь провел за последние тридцать дней, он упоминал слово “ягуар”, это слово можно считать ключевым словом намерения пользователя. Ключевые слова 218A намерения пользователя призваны указывать список слов, в которых пользователь проявляет более чем нейтральную разговорную заинтересованность.

Ключевые слова 218B выбора рекламы - это ключевые слова, которые, при сравнении с одним или несколькими списками рекламных ключевых слов, хранящимися в рекламной базе данных 224, могут совпадать со словом в списке(ах). Заметим, что конкретное ключевое слово может представлять собой как ключевое слово 218A намерения пользователя, так и ключевое слово 218B выбора рекламы.

Ключевые слова 218C выбора релевантной информации - это ключевые слова, которые, при сравнении с одним или несколькими списками ключевых слов информации, хранящимися в информационной базе данных 225, могут совпадать со словом в списке(ах). Заметим, что конкретное ключевое слово может представлять собой ключевое слово 218A намерения пользователя и ключевое слово выбора 218C релевантной информации, может представлять собой ключевое слово 218B выбора рекламы и ключевое слово 218C выбора релевантной информации или может представлять собой ключевое слово 218A намерения пользователя, ключевое слово 218B выбора рекламы и ключевое слово 218C выбора релевантной информации. Обычно ключевые слова, извлеченные компонентом извлечения ключевых слов 218 разговора, можно отнести к более чем одной из этих категорий. В частности, ключевые слова 218A намерения пользователя обычно можно рассматривать как, по меньшей мере, одно из ключевого слова 218B выбора рекламы и ключевого слова 218C выбора релевантной информации.

Кроме того, система 200 включает в себя компонент 220 вычисления оценки частотности термина и обратной частотности документа (TF/IDF) для вычисления значений TF/IDF ключевых слов 218B выбора рекламы и/или ключевых слов 218C выбора релевантной информации, извлеченных компонентом 218 извлечения ключевых слов разговора. Затем это значение можно использовать для оценки ключевых слов относительно друг друга, чтобы те, которые имеют самые высокие оценки, можно было использовать при нахождении релевантного рекламного контента и/или другой релевантной информации, что более подробно описано ниже. (Специалистам в данной области техники очевидно, что TF/IDF - это стандартная техника, используемая при нахождении текстовой информации для ранжирования документов по релевантности.)

Кроме того, система 200 включает в себя компонент 222 повторного взвешивания намерения пользователя. Поскольку ключевые слова 218A намерения пользователя являются ключевыми словами, в которых пользователь проявляет более высокую заинтересованность, в других ключевых словах, которые он может использовать в нейтральном разговоре, ключевым словам 218A намерения пользователя присваивается больший вес при определении, на каких словах рекламный контент и/или полезная информация будет выбран(а) для отображения, что более подробно описано ниже. Компонент 222 повторного взвешивания намерения пользователя сравнивает список ключевых слов 218A намерения пользователя, извлеченных компонентом 218 извлечения ключевых слов разговора, с оцененными ключевыми словами выбора рекламы и релевантной информации, введенными из компонента 222 вычисления оценки TF/IDF, и обеспечивает дополнительный вес тем ключевым словам, которые выглядят, как ключевые слова 218A намерения пользователя и ключевые слова 218B выбора рекламы, и тем ключевым словам, которые одновременно выглядят, как ключевые слова 218A намерения пользователя и ключевые слова 218C выбора релевантной информации. В одном варианте осуществления ключевым словам 218A намерения пользователя присваиваются весовые коэффициенты свыше 1.0.

Кроме того, система 200 включает в себя компонент 226 обнаружения смены темы и повторного взвешивания для повторного взвешивания извлеченных ключевых слов на основании обнаруженных смен темы. Задачей компонента 226 обнаружения смены темы и повторного взвешивания является учет того факта, что поток 210 исходного контента онлайнового разговора может содержать множество тем.

Система 200 дополнительно содержит компонент 228 нахождения рекламного контента для нахождения рекламного контента (т.е. одной или нескольких реклам), который связан с рекламными ключевыми словами, имеющими наилучшее совпадение (или совпадения) с извлеченными и взвешенными ключевыми словами выбора рекламы. Компонент 228 нахождения рекламного контента получает ввод из рекламной базы данных 224 (в виде списка рекламных ключевых слов и/или статистики обращений, значений монетизации и т.п.), пользовательских профилей 230 и/или информации 232, касающейся поведения пользователя, если доступна, и вывод из компонента 226 обнаружения смены темы и повторного взвешивания.

Система 200 дополнительно включает в себя компонент 234 отображения рекламного контента, который отображает рекламный контент, найденный компонентом 228 нахождения рекламного контента, совместно с потоком исходного контента 210 онлайнового разговора, на соответствующем устройстве просмотра 236, например традиционном компьютерном мониторе и пр.

Кроме того, система 200 включает в себя компонент 238 нахождения релевантной информации для нахождения релевантной информации (например, словарных определений или ссылок на дополнительную информацию), которая связана с ключевыми словами выбора релевантной информации, имеющими наилучшее совпадение (или совпадения) с извлеченными и взвешенными ключевыми словами выбора релевантной информации. Компонент 238 нахождения релевантной информации принимает ввод из информационной базы данных 225 (в форме списка(ов) ключевых слов информации), а также вывод из компонента 226 обнаружения смены темы и повторного взвешивания.

Система 200 дополнительно включает в себя компонент 240 отображения релевантной информации, который отображает релевантную информацию, найденную компонентом 238 нахождения релевантной информации, совместно с потоком 210 исходного контента онлайнового разговора на соответствующем устройстве просмотра 236 (например, традиционном компьютерном мониторе и пр.).

Функции, осуществляемые каждым из этих компонентов системы, более подробно описаны ниже применительно к способу, показанному на фиг.3A и 3B.

Рекламный контент для отображения на соответствующем устройстве просмотра выбирается в соответствии с вариантами осуществления настоящего изобретения так, чтобы максимизировать доход поставщика рекламного контента (т.е. рекламодателя). Это непростая задача. С одной стороны, желательно выбирать рекламный контент, в котором пользователь больше всего заинтересован, чтобы увеличить вероятность того, что он обратится к контенту и, таким образом, получит дополнительную информацию и/или совершит покупку. С другой стороны, желателен рекламный контент, обеспечивающий наивысшее значение монетизации на основании рекламных ключевых слов. Эти две цели часто противоречат друг другу и достижение баланса между ними обеспечивает наиболее эффективную рекламу.

Следующая вероятностная формула интегрирует и естественным образом уравнивает эти факторы влияния для достижения максимальной прибыли в статистическом среднем и, таким образом, обеспечивает наиболее эффективную рекламу. Задача состоит в том, чтобы выбрать рекламный контент, который максимизирует значение монетизации в статистическом смысле (ожидаемое значение). Поскольку при онлайновых разговорах пользовательский ввод является динамическим и возрастающим, в определенные интервалы времени (например, каждые пятнадцать секунд) или для каждого предложения, одна или список реклам будет выбираться согласно вероятностной модели, которая призвана максимизировать среднее (ожидаемое) значение монетизации. Математически это можно выразить посредством следующей целевой функции:

где A представляет рекламу, W представляет рекламное слово, V представляет поток контента онлайнового разговора, U представляет пользователя, C представляет, обращается ли пользователь к отображаемой рекламе, и представляет значение монетизации для пары , в случае обращения к рекламе (C=TRUE, обращение), в противном случае (C=FALSE, впечатление).

Эту целевую функцию можно разложить следующим образом:

где I представляет, заинтересован ли пользователь в контенте рекламы, представляет, имеет ли отношение рекламное слово к потоку исходного онлайнового разговора, и представляет, имеет ли пользователь историческую заинтересованность в рекламном слове.

Вышеприведенное распределение суммарной вероятности можно разложить следующим образом:

где разные элементы представляют информацию из разных источников.

представляет вероятность того, что рекламное слово W имеет отношение к онлайновому разговору V и обеспечено компонентом 224 извлечения ключевых слов, показанным на фиг.2. Вместо строгой вероятности, можно использовать общие вероятностные меры релевантности, например TF/IDF.

представляет вероятность того, что пользователь имеет общую заинтересованность в ключевом слове (независимо от текущей заинтересованности). Эта информация доступна из пользовательского профиля 230 и/или пользовательского поведения 232 (фиг.2), если имеются. Специалистам в данной области техники очевидно, что, если информация пользовательского профиля и/или поведения недоступна, этот компонент можно удалить из распределения суммарной вероятности. Все подобные изменения отвечают его объему.

представляет вероятность того, что пользователь заинтересован в контенте рекламы. Смысл в том, чтобы объединить историческую заинтересованность пользователя () и мгновенную заинтересованность пользователя (представленную текущим онлайновым разговором, ).

представляет вероятность того, что пользователь будет обращаться к рекламе, с учетом того, заинтересован ли он в контенте рекламе. Эта информация доступна из статистики обращения к рекламам (хранящейся в рекламной базе данных 224, показанной на фиг.2) и информации пользовательского профиля 230 и/или поведения пользователя 232 (фиг.2). Это отражает тот факт, что даже пользователь, не заинтересованный в контенте рекламы, может обратиться к ней (например, в зависимости от привлекательности дизайна рекламы) и что пользователь, несмотря на свою заинтересованность, может не всегда обращаться к рекламе.

На фиг.3A и 3B способ анализа контента онлайновых разговоров (например, сеансов мгновенного обмена сообщениями) с использованием технологий информационной проходки и использования результатов такого анализа для нахождения релевантного рекламного контента и/или другой релевантной информации для отображения согласно варианту осуществления настоящего изобретения проиллюстрирован и в целом обозначен здесь позицией 300. Первоначально, как указано в блоке 310, поток исходного контента онлайнового разговора принимается и вводится в систему. Затем промежутки между словами в потоке контента онлайнового разговора выявляются и используются для задания последовательности слов, как указано в блоке 312. Затем последовательность слов стандартизируется, т.е. слова приводятся к стандартному виду. Это указано в блоке 314. Затем, как указано в блоке 316, игнорируемые слова, т.е. слова, не относящиеся к теме онлайнового разговора, фильтруются из последовательности слов.

Затем фильтрованная последовательность слов вводится в компонент извлечения ключевых слов разговора (218 на фиг.2), как указано в блоке 318. Затем ключевые слова, связанные с потоком исходного контента онлайнового разговора, извлекаются и классифицируются как одно или несколько ключевых слов намерения пользователя, ключевых слов выбора рекламы и/или ключевых слов выбора релевантной информации. Это указано в блоке 320.

Затем рекламные ключевые слова и ключевые слова полезной информации сравниваются с одним или несколькими списками ключевых слов, как указано в блоке 322. Согласно фиг.2 ключевые слова выбора рекламы сравниваются с одним или несколькими списками рекламных ключевых слов, хранящимися в рекламной базе данных 224, и ключевые слова выбора полезной информации сравниваются с одним или несколькими списками ключевых слов информации, хранящимися в информационной базе данных 225.

Компонент извлечения ключевых слов разговора (218 на фиг.2) не только извлекает и классифицирует ключевые слова и сравнивает извлеченные ключевые слова со списками ключевых слов, но и сопоставляет рекламные ключевые слова и ключевые слова релевантной информации с ключевыми словами, связанными с потоком исходного контента онлайнового разговора (210 на фиг.2). Это указано в блоке 324. Сопоставление ключевых слов можно производить по написанию или по произношению (фонетическое сопоставление). Затем ключевым словам присваивается оценка (т.е. оценка TF/IDF), как указано в блоке 326.

Затем ключевые слова повторно взвешиваются на основании намерения пользователя, как указано в блоке 328. Одновременно или последовательно ключевые слова повторно взвешиваются на основании обнаруженных изменений в теме и исторической информации, как указано в блоке 330. Это делается для учета того факта, что поток исходного контента онлайнового разговора (210 на фиг.2) может содержать множество тем.

Поскольку при онлайновых разговорах пользовательский ввод является динамическим и возрастающим, для поддержания релевантности отображаемых рекламного контента и/или другой релевантной информации рекламный контент и другая релевантная информация регулярно обновляются. Таким образом, предпочтительно, чтобы компонент извлечения ключевых слов извлекал ключевые слова периодически, например каждые пятнадцать секунд или в каждом предложении, а не ждал окончания темы. Таким образом, по сравнению с традиционными способами извлечения ключевых слов, способы настоящего изобретения предусматривают использование “исторической особенности”, в которой ключевые слова, извлеченные из предыдущих сегментов ввода, используются в помощь извлечению текущего сегмента ввода. Обнаружение смены темы и повторное взвешивание ключевого слова на ее основании более подробно описаны ниже со ссылкой на фиг.4.

На фиг.4 способ обнаружения смены темы и повторного взвешивания ключевого слова показан и в целом обозначен здесь позицией 400. Первоначально, как указано в блоке 410, принимается текущий вектор ключевых слов-кандидатов и вычисляется оценка релевантности текущей темы, как указано в блоке 412. С этой целью историческая информация используется для обнаружения смен темы. Векторы ключевых слов генерируются и сохраняются для нескольких предыдущих сегментов ввода, например четырех предыдущих сегментов ввода, в потоке онлайнового разговора. Затем эти исторические векторы ключевых слов отыскиваются, как указано в блоке 414, и суммируются с текущим вектором ключевых слов-кандидатов. Затем можно вычислить оценку релевантности смешанной темы между текущим сегментом ввода и предыдущими сегментами ввода, как указано в блоке 416.

Затем производится определение, подобен ли текущий сегмент ввода предыдущим сегментам ввода. Это указано в блоке 418. Если оценка релевантности смешанной темы между текущим сегментом ввода и предыдущими сегментами ввода превышает первый порог , например 0.0004, текущий сегмент ввода можно считать подобным предыдущему вводу. В этом сценарии исторические векторы ключевых слов старятся с текущими векторами ключевых слов-кандидатов с использованием первого весового коэффициента , например 0.9. Это указано в блоке 420. Смешанные, повторно взвешенные векторы ключевых слов затем используются для выбора ключевого слова и нахождения рекламы и/или другой релевантной информации, как указано в блоке 424 и более подробно описано ниже.

Если оценка релевантности смешанной темы между текущим сегментом ввода и предыдущими сегментами ввода меньше первого порога , но больше второго порога , например 0.0001, текущий сегмент ввода можно считать в чем-то схожим с предыдущим сегментом ввода. В этом сценарии исторические векторы ключевых слов старятся с текущими векторами ключевых слов-кандидатов с использованием второго весового коэффициента , например 0.5. Это указано в блоке 422. Смешанные векторы ключевых слов затем используются для выбора ключевого слова и нахождения рекламного контента и/или другой релевантной информации, как указано в блоке 424 и более подробно описано ниже.

Если оценка релевантности смешанной темы меньше второго порога , текущий сегмент ввода считается несхожим с предыдущим сегментом ввода, и исторический вектор ключевых слов можно повторно задать, как указано в блоке 426. В этом сценарии текущий вектор ключевых слов затем можно использовать для выбора ключевого слова и нахождения рекламного контента и/или другой релевантной информации, как указано в блоке 428 и более подробно описано ниже.

Затем, на основании текущего или повторно взвешенных векторов ключевых слов, в зависимости от того, какой из них подходит, ключевые слова можно выбирать для использования при нахождении рекламного контента и/или другой релевантной информации, что более подробно описано ниже. Это указано в блоке 430.

Согласно фиг.3B повторно взвешенный или текущий вектор ключевых слов, в зависимости от того, какой из них подходит, затем используется для генерации запроса компонента нахождения рекламного контента (228 на фиг.2). Это указано в блоке 332.

Для упрощения формы модифицированного описателя контента может оказаться желательно, например, допустить повторное использование существующих компонентов нахождения рекламного контента, предназначенных для платного поиска (в которые поступают запросы от пользователей машины поиска), или лучше интегрироваться с функциями ранжирования существующих компонентов. Три формы модифицированных описателей контента, отличающиеся уровнем детализации и упрощения, рассмотрены ниже.

Во-первых, модифицированный описатель контента может включать в себя множественные оцененные ключевые слова. Такое представление позволяет полностью реализовать рассмотренные выше критерии оптимизации. Однако традиционные компоненты нахождения рекламного контента нужно построить (перестроить) так, чтобы они не только принимали множественные гипотезы ключевого слова, но также правильно включали вероятности в свои существующие функции ранжирования. В этом представлении доступны множество рекламных слов и оценка для каждого W в множестве. Оптимальный рекламный контент описывается следующей формулой:

Во-вторых, модифицированный описатель контента может включать в себя множественные ключевые слова без оценок. В этой немного упрощенной форме на стадиях извлечения ключевых слов и обнаружения смены темы осуществляется жесткое принятие решения в отношении того, какие рекламные ключевые слова релевантны потоку онлайнового разговора, путем выбора слов с наивысшими рангами согласно с последующим квантованием до 1.0. Детальное взаимодействие с вероятностными членами, обрабатываемыми компонентом нахождения рекламного контента (228 на фиг.2), не учитывается, что приводит к менее оптимальным значениям монетизации, чем в случае, когда множественные ключевые слова снабжены оценками.

В третьем подходе модифицированный описатель контента может включать в себя только наилучшее ключевое слово. В этой дополнительно упрощенной форме обеспечивается только одно ключевое слово. Эта форма, в целом, совместима с традиционными компонентами нахождения рекламного контента, предназначенными для приложений платного поиска, но этот путь не приводит к оптимальному среднему значению монетизации.

Каждый из вышеописанных модифицированных описателей контента или любое их сочетание можно использовать для описанных здесь способов, и все подобные изменения отвечают объему настоящего изобретения.

Согласно фиг.3 релевантный рекламный контент затем выбирается и отыскивается на основании модифицированных описателей контента, как указано в блоке 334. Затем, как указано в блоке 336, найденный рекламный контент отображается совместно с потоком контента онлайнового разговора (210 на фиг.2).

Одновременно или последовательно по отношению к запрашиванию компонента нахождения рекламного контента (228 на фиг.2) запрашивается также компонент нахождения полезной информации (238 на фиг.2), как указано в блоке 338. Затем полезная информация (например, словарные определения, ссылки на дополнительную информацию, относящуюся к ключевым словам, и пр.) отыскивается в информационной базе данных (225 на фиг.2), как указано в блоке 340. Затем полезная информация отображается совместно с потоком онлайнового разговора, как указано в блоке 342. Поскольку отображение определения общих слов не очень помогает пользователю, эти слова предпочтительно отфильтровывать до запрашивания компонента нахождения полезной информации. Дополнительно, слова, в которых атрибут первой части поиска не является существительным, также предпочтительно отфильтровывать до запрашивания. В одном варианте осуществления найденная информация может отображаться в правой стороне окна онлайнового разговора. Этот вариант осуществления проиллюстрирован со ссылкой на фиг.5.

На фиг.5 показан иллюстративный снимок экрана пользовательского интерфейса для отображения рекламного контента и/или другой информации, относящейся к контенту онлайнового разговора совместно с таким контентом согласно варианту осуществления настоящего изобретения, причем пользовательский интерфейс в целом обозначен здесь позицией 500. Пользовательский интерфейс 500 включает в себя окно 510 онлайнового разговора, в котором отображается контент онлайнового разговора между Джоном Доу и Марком Смитом. Пользовательский интерфейс 500 дополнительно включает в себя область 512 отображения найденного контента в правой стороне окна 510 онлайнового разговора. Область 512 отображения найденного контента включает в себя участок 516 отображения релевантной информации, на котором словарное определение слова “вулкан” отображается в ответ на использование Марком Смитом слова “вулкан” в онлайновом разговоре. Область 512 найденного контента дополнительно включает в себя участок 514 отображения рекламного контента, в котором отображается ряд реклам, относящихся к вулканам и/или географии в целом. Таким образом, вся информация, отображаемая в области 512 найденного контента, предоставляется в соответствии с контентом онлайнового разговора между Джоном Доу и Марком Смитом.

Специалистам в данной области техники очевидно, что вышеописанный пользовательский интерфейс 500 показан исключительно для примера и что можно использовать любой пользовательский интерфейс, в котором рекламный контент и/или другая релевантная информация предоставляется в соответствии с контентом онлайнового разговора, согласующийся с объемом настоящего изобретения. Например, помимо отображения в правой части окна онлайнового разговора, найденный контент можно отображать в левой стороне окна онлайнового разговора, под окном онлайнового разговора или в любой комбинации.

Понятно, что настоящее изобретение предусматривает использование технологии информационной проходки для извлечения и суммирования контента онлайнового разговора и позволяет находить и отображать релевантный рекламный контент и/или полезную информацию согласно извлеченному контенту в реальном времени. Таким образом, изобретение позволяет сопоставлять контент онлайновых разговоров с контекстом реклам и/или полезной информации. Контент онлайновых разговоров генерируется с применением технологии текстовой проходки. Контент реклам генерируется либо таким же способом, либо посредством ключевых слов/контента, обеспечиваемых/ого рекламодателем. Его можно применять к тексту любого онлайнового разговора, например, сеансам мгновенного обмена сообщениями.

Настоящее изобретение было описано применительно к конкретным вариантам осуществления, которые во всех отношениях являются иллюстративными, но не ограничительными. Специалисты в данной области техники могут предложить альтернативные варианты осуществления настоящего изобретения, не выходя за рамки его объема.

Из вышеприведенного описания следует, что это изобретение позволяет добиться всех вышеозначенных задач, совместно с другими преимуществами, обеспечиваемыми системой и способом. Также следует понимать, что могут быть полезны определенные признаки и подкомбинации и их можно использовать безотносительно к другим признакам и подкомбинациям. Это отвечает объему формулы изобретения.

Похожие патенты RU2419863C2

название год авторы номер документа
ОБЕСПЕЧЕНИЕ ВОЗМОЖНОСТИ РЕКЛАМОДАТЕЛЯМ ПРЕДЛАГАТЬ ЦЕНУ НА АБСТРАКТНЫЕ ОБЪЕКТЫ 2011
  • Рубинштейн Бенджамин
  • Чандра Ашок
  • Дабровски Оливер
  • Джеммелл Дэвид Джеймс
  • Ли Мин-Джон
RU2589872C2
СИСТЕМА И СПОСОБ ДЛЯ ВЫБОРА ЗНАЧИМЫХ ЭЛЕМЕНТОВ СТРАНИЦЫ С НЕЯВНЫМ УКАЗАНИЕМ КООРДИНАТ ДЛЯ ИДЕНТИФИКАЦИИ И ПРОСМОТРА РЕЛЕВАНТНОЙ ИНФОРМАЦИИ 2015
  • Цыпляев Максим Викторович
  • Винокуров Никита Алексеевич
RU2708790C2
МЕТОД ОТОБРАЖЕНИЯ РЕЛЕВАНТНОЙ КОНТЕКСТНО-ЗАВИСИМОЙ ИНФОРМАЦИИ 2014
  • Цыпляев Максим Викторович
  • Винокуров Никита Алексеевич
RU2683482C2
РЕКЛАМИРОВАНИЕ, УЧИТЫВАЮЩЕЕ ВЗАИМОДЕЙСТВИЕ С ПОЛЬЗОВАТЕЛЕМ 2007
  • Миик Кристофер А.
  • Биггс Джоди Д.
  • Чикеринг Дэвид М.
RU2449383C2
ИСПОЛЬЗОВАНИЕ СОДЕРЖИМОГО СТРАНИЦЫ ДЛЯ РЕШЕНИЯ ЗАДАЧИ ТОЧНОГО ПОДБОРА РЕКЛАМЫ 2013
  • Цыпляев Максим Викторович
  • Вербицкий Андрей Владиславович
RU2630382C2
РАЗМЕЩЕНИЕ РЕКЛАМЫ С УЧЕТОМ ВИДЕОКОНТЕНТА 2010
  • Лю Сюй
  • Шань Ин
RU2542923C2
СИСТЕМА РАСПРОСТРАНЕНИЯ ИНФОРМАЦИИ В РЕАЛЬНОМ ВРЕМЕНИ НА ОСНОВЕ ЦИФРОВОЙ СТРОКИ С ИСПОЛЬЗОВАНИЕМ ИНТЕЛЛЕКТУАЛЬНОГО ТЕРМИНАЛА И СПОСОБ РАСПРОСТРАНЕНИЯ ИНФОРМАЦИИ 2016
  • Шин Йонг-Гиун
RU2714368C2
ОБНАРУЖЕНИЕ ОБЪЕКТОВ ИЗ ЗАПРОСОВ ВИЗУАЛЬНОГО ПОИСКА 2017
  • Мур Стефен Морис
  • Мюррей Ларри Патрик
  • Сханмугамани Раджалингаппаа
RU2729956C2
ИНТЕГРАЦИЯ РЕКЛАМЫ И РАСШИРЯЕМЫЕ ТЕМЫ ДЛЯ ОПЕРАЦИОННЫХ СИСТЕМ 2007
  • Флэйк Гари В.
  • Гоунарес Александер Дж.
  • Хорвиц Эрик Дж.
  • Гудмэн Джошуа Т.
  • Джаин Камал
  • Ченг Лили
  • Чикеринг Дэвид М.
  • Коннолли Майкл
  • Дани Нишант В.
  • Наджм Тарек
  • Хеммэн Джеффри Р.
  • Смит Леонард
  • Блинн Арнольд Н.
  • Брюэр Бретт Д.
  • Дикен Даррин
RU2473127C2
ПРЕДСТАВЛЕНИЕ РЕЗУЛЬТАТОВ ПОИСКА НА ОСНОВЕ НАМЕРЕНИЯ 2013
  • Рэмси Уилльям
  • Агравал Нитин
  • Дьюб Симант
  • Гулли Антонио
  • Джха Бинит Кумар
RU2653252C2

Иллюстрации к изобретению RU 2 419 863 C2

Реферат патента 2011 года СИСТЕМА И СПОСОБ ИСПОЛЬЗОВАНИЯ КОНТЕНТА ОНЛАЙНОВОГО РАЗГОВОРА ДЛЯ ВЫБОРА РЕКЛАМНОГО КОНТЕНТА И/ИЛИ ДРУГОЙ РЕЛЕВАНТНОЙ ИНФОРМАЦИИ ДЛЯ ОТОБРАЖЕНИЯ

Группа изобретений относится к средствам анализа контента онлайновых разговоров с использованием технологий информационной проходки. Техническим результатом является обеспечение динамического выбора контекстуального или релевантного рекламного контента для отображения. В системе и способе определяют, что ключевое слово выбора рекламы, которое было оценено, было также охарактеризовано как ключевое слово намерения пользователя, осуществляют повторное взвешивание ключевого слова выбора рекламы, которое также было охарактеризовано как ключевое слово намерения пользователя, чтобы назначить ему больший вес в алгоритме распределения суммарной вероятности, который используется для выбора контента рекламы, и используют результаты реализации технологии информационной проходки для нахождения релевантного рекламного контента и/или другой релевантной информации для отображения совместно с контентом онлайнового разговора. 3 н. и 9 з.п. ф-лы, 6 ил.

Формула изобретения RU 2 419 863 C2

1. Способ использования контента онлайнового разговора для выбора рекламного контента для отображения, способ содержит этапы, на которых принимают контент онлайнового разговора,
извлекают одно или несколько ключевых слов из контента онлайнового разговора, характеризуют одно или более ключевых слов, которые извлечены из контента онлайнового разговора в качестве одного или более ключевого слова выбора рекламы и ключевого слова намерения пользователя,
(1) причем ключевое слово выбора рекламы включает в себя ключевое слово, которое сопоставлено слову в списке ключевых слов выбора рекламы, и
(2) причем ключевое слово намерения пользователя указывает интерес пользователя к теме и включает в себя ключевое слово, которое близко одному или более из запускающих слов и запускающих фраз, которые идентифицированы в предварительно заданном списке;
оценивают ключевое слово, которое было охарактеризовано, как ключевое слово выбора рекламы, причем оценка содержит вычисление степени частоты ключевого слова выбора рекламы;
определяют, что ключевое слово выбора рекламы, которое было оценено, было также охарактеризовано, как ключевое слово намерения пользователя;
повторное взвешивание ключевого слова выбора рекламы, которое также было охарактеризовано, как ключевое слово намерения пользователя, чтобы назначить ему больший вес в алгоритме распределения суммарной вероятности, который используется для выбора контента рекламы;
выбирают рекламный контент для отображения на основании алгоритма суммарного распределения вероятности, который включает в себя ключевое слово выбора рекламы, которое было и оценено, и повторно взвешено; и выводят совместно с контентом контент рекламы, который выбран.

2. Способ по п.1, дополнительно содержащий этап, на котором отображают рекламный контент, выбранный совместно с контентом онлайнового разговора.

3. Способ по п.1, дополнительно содержащий этап, на котором принимают один или более из пользовательских профилей и информацию, касающуюся поведения пользователя, в котором этап, на котором выбирают рекламный контент для отображения, содержит этап, на котором выбирают рекламный контент для отображения на основании, по меньшей мере, одного из: одного или нескольких извлеченных ключевых слов, пользовательского профиля, информации, касающейся поведения пользователя, прошлого коэффициента обращаемости, и значения монетизации.

4. Способ по п.1, в котором алгоритм суммарного распределения вероятности представлен посредством:
P(C,I,RV,RU|A,W,V,U)=P(C|I,A,U)·P(I|RV,RU)·P(RU|W,U)·P(RV|W,V)
где P(RV|W,V) представляет вероятность, что случайное слово W релевантно для онлайнового разговора V и основано на ключевом слове выбора рекламы, которое было повторно взвешено;
причем P(RU|W,U) представляет вероятность, что пользователь имеет общий интерес в ключевом слове выбора рекламы, и основана на одном или более из профилей пользователя и прошлом поведении пользователя; и
причем P(I|RV,RU) представляет вероятность, что пользователь заинтересован в контенте рекламы, и основана на одном или более прошлых интересах RV пользователя и мгновенном интересе RU пользователя.

5. Способ по п.1, дополнительно содержащий этап, на котором
отыскивают информацию прошлого ключевого слова;
вычисляют оценку релевантности смешанной темы между ключевым словом выбора рекламы и информацией прошлого ключевого слова; и
сравнивают оценку релевантности смешанной темы с пороговым значением для определения, что произошла смена темы.

6. Способ по п.5, дополнительно содержащий этап, на котором повторно взвешивают ключевое слово выбора рекламы на основании прошлых данных.

7. Способ использования контента онлайнового разговора для выбора релевантной информации для отображения, способ содержит этапы, на которых принимают контент онлайнового разговора, причем онлайн разговор содержит сеанс мгновенных сообщений;
извлекают ключевое слово из контента онлайнового разговора, оценивают ключевое слово, которое было извлечено;
определяют, что ключевое слово включает в себя ключевое слово намерения пользователя, причем определение, что ключевое слово включает в себя ключевое слово намерения пользователя содержит сравнение последовательности слов контента с предварительно определенным списком запускающих слов, который предшествует ключевому слову намерения пользователя в контенте;
повторно взвешивают ключевое слово, чтобы назначить больший вес в алгоритме распределения суммарной вероятности, который может использоваться, чтобы выбирать контент рекламы;
выбирают релевантную информацию для отображения на основании ключевого слова, которое было подвергнуто повторному взвешиванию; и
отображают релевантную информацию, выбранную вместе с контентом онлайн разговора.

8. Способ по п.7, дополнительно содержащий этап, на котором принимают один или более пользовательских профилей и информацию, касающуюся поведения пользователя, в котором выбор релевантной информации для отображения содержит выбор релевантной информации для отображения на основании, по меньшей мере, одного из: ключевого слова, пользовательского профиля, и информации, касающейся поведения пользователя.

9. Способ по п.7, дополнительно содержащий этап, на котором сравнивают ключевое слово с одним или несколькими ключевыми словами выбора релевантной информации, в котором этап выбора релевантной информации для отображения содержит выбор релевантной информации для отображения на основании сравнения ключевого слова с одним или несколькими ключевыми словами выбора релевантной информации.

10. Способ по п.7, дополнительно содержащий этап, на котором определяют, произошла ли смена темы.

11. Способ по п.10, в котором, если определено, что смена темы произошла, способ дополнительно содержит этап, на котором повторно взвешивают одно или несколько оцененных ключевых слов на основании прошлых данных.

12. Компьютерно-считываемый носитель, хранящий компьютерно-выполняемые команды, которые при исполнении компьютером заставляют компьютер осуществлять способ по п.1, содержащий этапы, на которых принимают текущий контент онлайнового разговора, причем онлайновый разговор содержит сеанс мгновенных сообщений; извлекают одно или более из ключевых слов из текущего контента онлайнового разговора;
отыскивают информацию прошлого ключевого слова онлайнового разговора, информация прошлого ключевого слова обеспечивается пользователем до текущего контента;
вычисляют оценку релевантности смешанной темы между одним или более ключевыми словами из текущего контента и информацией прошлого ключевого слова, причем оценка релевантности смешанной темы используется для обнаружения изменения в теме между текущим контентом и информацией прошлого кодового слова;
определение того больше или меньше оценка релевантности смешанной темы, чем значение порога,
(1) причем, если оценка релевантности смешанной темы больше порогового значения, считается, что никакие изменения не произошли, и как одно или более ключевое слово из текущего контента, так и информация прошлого ключевого слова используются для выбора по меньшей мере одного из: контент рекламы и другая релевантная информация, и
(2) причем, если оценка релевантности смешанной темы меньше порогового значения, считается, что изменение произошло, и одно или более ключевых слов из текущего контента используются для выбора по меньшей мере одного из: контент рекламы и другая релевантная информация и информация, прошлого ключевого слова не используется;
отыскивают по меньшей мере одно из: контент рекламы и другую релевантную информацию для отображения на основе по меньшей мере одного из: одно или более ключевых слов из текущего контента и информация прошлого ключевого слова; и отображают отысканное по меньшей мере одно из: контент рекламы и другая релевантная информация.

Документы, цитированные в отчете о поиске Патент 2011 года RU2419863C2

Дорожная спиртовая кухня 1918
  • Кузнецов В.Я.
SU98A1
Способ антистатической обработки термопластичных полимеров 1979
  • Василенок Ю.И.
  • Лагунова В.Н.
  • Пожарский А.Ф.
  • Багрова О.М.
  • Юрчук Г.Г.
SU749081A1
JP 2002207918 A, 26.07.2002
Переносная печь для варки пищи и отопления в окопах, походных помещениях и т.п. 1921
  • Богач Б.И.
SU3A1
СПОСОБ РЕКЛАМИРОВАНИЯ И СИСТЕМА РЕКЛАМИРОВАНИЯ ДЛЯ ЕГО ОСУЩЕСТВЛЕНИЯ 2001
  • Леонтьев В.В.
  • Леонтьев С.В.
  • Головешкин А.И.
  • Гречушкин И.В.
  • Ковалев А.П.
  • Машкин И.А.
  • Машкин А.И.
  • Мареева Е.В.
RU2198433C2

RU 2 419 863 C2

Авторы

Ли Ин

Ли Ли

Наджм Тарек

Ван Сяньфан

Гао Хунбинь

Цзэн Хуа-Цзюнь

Чжан Бэньюй

Чэнь Чжэн

Даты

2011-05-27Публикация

2006-04-28Подача