Система сбора и обработки данных для поведенческого таргетинга Российский патент 2024 года по МПК G06F17/40 

Описание патента на изобретение RU2811670C2

Область техники, к которой относится изобретение.

Изобретение относится к области рекламы и вычислительной техники, в частности к способам демонстрации контекстных объявлений с учетом пользовательских интересов.

Уровень техники:

Известна полезная модель ТАРГЕТИРОВАННАЯ РЕКЛАМНАЯ СИСТЕМА (патент на полезную модель RU 132591 U1), характеризующаяся тем, что содержит сформированные на специальном сервере блок сбора и профилирования данных и связанный с ним шиной обмена данных блок управления рекламными материалами, к которому подключены интерфейс рекламодателя, интерфейс агентства, интерфейс рекламной площадки, административный интерфейс, интерфейс источника внешних данных о пользователях партнера и специальный интерфейс (API). Блок сбора и профилирования данных может содержать модуль сбора и предварительной обработки данных о пользователях, модуль сбора, обработки и хранения контекстной информации о площадках и модуль выстраивания профиля пользователей и его хранения, причем модуль сбора и предварительной обработки данных о пользователях и модуль сбора, обработки и хранения контекстной информации о площадках имеют входы для связи с внешними источниками данных, их выходы подключены к модулю выстраивания профиля пользователей и его хранения, выход которого подключен к блоку управления рекламными материалами, также как и выход модуля сбора, обработки и хранения контекстной информации о площадках.

Предлагаемой полезной моделью обеспечивается достижение технического результата в виде обеспечения показа различных видов рекламных сообщений интернет-пользователям на любых интернет-носителях и интернет-сайтах с учетом информации о социально-демографических данных о пользователей, его краткосрочных и долгосрочных интересах, географического местоположении пользователя, контексте страницы с рекламным местом, типе пользовательского устройства и других данных, характеризующих как интернет-пользователей, так и интернет-сайты, на которых размещается реклама.

Недостатком является то, что в полезной модели сбор данных, анализ интересов пользователя, а также временные промежутки и ключевые слова менее конкретизированы, что в свою очередь ведет к показам большому количеству нецелевых пользователей при показе рекламного контента, нацеленного на определенного пользователя.

Известно изобретение СИСТЕМЫ И МЕТОДЫ ДЛЯ АВТОМАТИЧЕСКОЙ ГЕНЕРАЦИИ КАМПАНИЙ С ИСПОЛЬЗОВАНИЕМ ИНФОРМАЦИИ О РЕКЛАМНОМ ТАРГЕТИНГЕ НА ОСНОВЕ ИНФОРМАЦИИ О АТФИНИИ, ПОЛУЧЕННОЙ ИЗ СОЦИАЛЬНОЙ ОНЛАЙН-СЕТИ (публикация US 2015127464 A1), где раскрыты системы и способы автоматического таргетирования рекламы в онлайновой социальной сети в соответствии с вариантами осуществления изобретения. Один вариант осуществления изобретения включает в себя обнаружение сходства между профилем участника и одним или несколькими ключевыми словами на основе данных, описывающих действия, связанные с профилем участника, создание базы данных, содержащей профили участника, и связывание обнаруженного сходства между профилями участника и ключевыми словами, идентификацию профилей участников, которые связанные с близостью по крайней мере к одному ключевому слову предложения и другим ключевым словам, для которых идентифицированные профили участников имеют связанную близость, взвешивание важности идентифицированных профилей участников в соответствии с рекламной стратегией, выбор набора ключевых слов таргетинга, для которых идентифицированный участник профили имеют связанную близость.

Недостатком является менее совершенная система таргетирования рекламы, основанная на сходстве профиля участника и идентификации его с помощью ключевых слов.

Известно изобретение СИСТЕМА И СПОСОБ РЕАЛИЗАЦИИ РЕКЛАМЫ В СОЦИАЛЬНОЙ СЕТИ ОНЛАЙН (публикация US 2008189169 A1), где описана система и метод интеграции данных аналитики профилей пользователей в социальной сети с таргетированными рекламными кампаниями. Система включает в себя систему таргетинга рекламы, которая получает аналитические данные профилей пользователей и использует данные для фильтрации профилей пользователей, чтобы выбрать желаемые профили пользователей для доставки рекламы, ориентированной на интересы и личность желаемых профилей пользователей. Использование аналитических данных включает создание социального рейтинга каждого профиля пользователя, соответствующего другим профилям пользователей в социальной сети. Рекламный рынок реализован для использования рекламными маркетологами для покупки прав на рекламу на веб-странице профиля пользователя, для фильтрации профилей пользователей в социальной сети для выбора профилей пользователей с желаемыми аналитическими данными.

Недостатком является использование аналитических данных о пользователе, включающих создание социального рейтинга каждого профиля пользователя, соответствующего другим профилям пользователей в социальной сети, что может приводить к показу рекламы нецелевым пользователям, обладающим относительно большим рейтингом.

Известно изобретение ПОМОЩЬ В НАСТРОЙКЕ РЕКЛАМНОЙ КАМПАНИИ (публикация СА 2857371 А1), где система публикации объявлений предоставляет рекламу рекламной кампании рекламодателя целевой группе, заданной исходными критериями таргетинга. Издательская система оценивает результаты рекламных метрик для различных сегментов целевой группы на основе реакции пользователей на первоначальное представление рекламы. На основе результатов рекламной метрики для различных сегментов издательская система предлагает рекламодателю модификацию рекламной кампании. Возможные модификации рекламной кампании включают сужение первоначальных критериев таргетинга, чтобы указать хотя бы один из сегментов в качестве целевой группы, указание другого объявления для малоэффективного сегмента и корректировку значения ставки для показа объявлений в кампания.

Недостатком является то, что система оценивает результаты рекламных метрик для различных сегментов целевой группы на основе реакции пользователей на первоначальное представление рекламы.

Наиболее близким решением является система таргетинга Facebook https://www.facebook.com/business/help/633474486707199, представляющая собой таргетинг на аудиторию с демонстрацией рекламы нужным людям. Есть два основных подхода к созданию целевой аудитории: конкретизированный и широкий. Выбор подхода зависит от целей и доступных ресурсов.

Конкретизированный таргетинг подразумевает, что при поиске людей, которым будет показываться реклама, будет использован достаточно строгий набор критериев. Широкий таргетинг подразумевает, что система показа сама будет искать людей, которым будет показываться реклама. Этот подход помогает охватить потенциальных клиентов. Его также удобно использовать, когда еще точно не известно, кто входит в целевую аудиторию.

Недостатком является низкая точность определения целевой аудитории и, как следствие, большое количество показов рекламы нецелевым пользователям.

Задачей настоящего изобретения является устранение недостатков предыдущего уровня техники и создание более совершенной системы по сравнению с аналогичными техническими решениями.

Осуществление изобретения

Система сбора и обработки данных для поведенческого таргетинга, базирующаяся на фокусировке рекламных объявлений по интересам, категориям и ключевым словам, состоит из сервера обработки и хранения данных, по меньшей мере одного компьютера или мобильного устройства пользователя, по меньшей мере одного средства отображения информации пользователю - цифрового дисплея и сети Интернет, при помощи которой осуществляется обмен данными между устройством пользователя и рекламным сервером, причем в качестве данных хранятся действия пользователя при посещении страниц: отказы, время, проведенное на сайте, глубина просмотра, постоянно обновляемые профили пользователей в матричном формате, информация о времени проявления интересов, а также формируемые после анализа контента контекстные профили, состоящие из интересов, привязанных к ключевым словам, при посещении пользователем страницы сайта на компьютере или мобильном устройстве пользователя идентификатор пользователя и действия на странице отправляют на сервер, при получении идентификатора пользователя из базы данных извлекают имеющийся актуальный профиль пользователя и на его основе генерируют информер, который демонстрируется с помощью средства отображения информации пользователю, данные, полученные из браузера компьютера или мобильного устройства пользователя, передают функционалу профилирования пользователей, который собирает сессии визитов, фильтрует, сортирует и обрабатывает собранные данные, рассчитывает после всех обработок и проверок актуальный на данный момент профиль интересов пользователя и обновляет его в базе данных, при этом в оперативной памяти компьютера или мобильного устройства пользователя хранятся и регулярно обновляются заранее сгенерированные подборки объявлений по каждому ключевому слову.

На первом этапе происходит сбор данных о пользователе с предварительной обработкой. Пользователи на основании собранных данных автоматически в режиме реального времени разделяются на определенные группы и подгруппы, различающиеся признаками в поведении, действиях, времени действий и проявления интересов. Таких групп в системе более десятка, группы разделены на подгруппы. Для каждой группы используется отдельная модель обработки и обновления данных, если пользователь относится к нескольким разнотипным группам, используются смешанные модели обработки. В качестве данных собираются действия пользователя при посещении страниц: отказы, время, проведенное на сайте, глубина просмотра. Действия на странице, такие как клики, вращение колесика мыши, характеризуют посещение сайтов, предпочтения, время, в которое пользователь наиболее активен, периодичность проявления интересов, степень активности пользователя в сети и другие.

На втором этапе часть данных собирается на протяжении определенного периода времени во время визита на страницу, после чего данные пользователя проходят предварительную обработку и группировку по интересам, анализируются и после всех обработок сгруппированный и подготовленный комплекс данных может быть использован для построения и обновления профиля пользователя. Самообучаемая система постоянно отслеживает поведение пользователей и их реакцию на демонстрируемые рекламные объявления и по определенному алгоритму вычисляет корректирующие коэффициенты, влияющие на отбор и ранжирование объявлений. Если показы не дают необходимого результата, изменяется ранжирование рекламных объявлений путем изменения динамических коэффициентов, тогда реклама может демонстрироваться на основании контекста страницы. Также в этом случае в данные о пользователе заносятся отметки о неэффективности тех или иных интересов, которые используются далее при очередном обновлении профиля пользователя, а на их основании пересчитываются веса интересов в профиле для демонстрации рекламы в следующий раз.

На третьем этапе профили пользователей сохраняются в течение 90 дней в базе данных, хранятся в матричном формате и постоянно обновляются, также хранится информация о времени проявления интересов, что позволяет точно определить хронологический порядок текущих и постоянных интересов и вычислить наиболее подходящие на данный момент интересы для формирования информеров. Весовые значения для каждого интереса рассчитываются алгоритмами в зависимости от действий пользователя на странице во время визита, вносятся дополнительные уточнения, основанные на поведении пользователя и реакции на демонстрируемую рекламу. Интересы не имеют четкого разделения на долгосрочные и краткосрочные. При обновлении профиля алгоритмы, используя собранные данные, обновляют профиль, после чего долгосрочный интерес может стать краткосрочным и наоборот. Вес интереса рассчитывается по тематике страницы: интересы, которые наиболее подходят к контенту, получают больший вес, которые менее подходят - меньший. Также контент учитывается при ранжировании непосредственно перед показом рекламы, если в профиле пользователя интерес имеет меньший вес. Такой подход позволяет исключить нерелевантную рекламу. Интересы разделены на группы по их назначению и способу определения. Часть интересов привязана к контексту страницы или его части, часть привязана к определенным сайтам или группам сайтов, часть интересов связана с тематикой просматриваемых сайтов, часть интересов - с доменами посещенных сайтов. Профили пользователей строятся в зависимости от интересов: их описание нужно для построения дальнейшей работы с ними при составлении и расчете профилей пользователей. Контекстные профили формируются после анализа контента и состоят из интересов, привязанных к ключевым словам. Так как контент на страницах со временем может быть изменен, периодически выполняется проверка, после которой профили формируются заново при необходимости.

На четвертом этапе при посещении пользователем страницы сайта идентификатор пользователя и действия на странице отправляются на сервер. Трекер, размещенный на странице, отправляет данные о действиях пользователя на сервер. При получении идентификатора пользователя из базы данных извлекается имеющийся актуальный профиль пользователя, и на его основе генерируется информер, который демонстрируется на странице. В оперативной памяти хранятся и регулярно обновляются заранее сгенерированные подборки объявлений по каждому ключевому слову. Это позволяет мгновенно составить выборку подходящих по тематике объявлений и ранжировать их в соответствии со степенью интереса и другими факторами, чтобы выбрать к показу наиболее релевантные материалы. Если профиля пользователя нет в базе данных, т.е. пользователь новый или же профиль пользователя не полный и не проходит проверок, тогда информер генерируется на основе контекстного профиля.

Далее данные, полученные из браузера, передаются функционалу профилирования пользователей, который собирает сессии визитов, фильтрует, сортирует и обрабатывает собранные данные, рассчитывает после всех обработок и проверок актуальный на данный момент профиль интересов пользователя и обновляет его в базе данных. Во время визита пользователя на веб-страницу функционал профилирования пользователей создает сессию для этого визита. Сессия имеет ограниченное время "жизни", несколько минут, которых достаточно для сбора всей необходимой информации. На протяжении сессии собираются действия пользователя на странице и время просмотра, формируются данные сессии. Когда время "жизни" сессии заканчивается, сессия закрывается.

На пятом этапе выполняется ряд проверок, позволяющих выявить "ботов" -программы, имитирующие действия пользователя на странице и не являющиеся реальными людьми. Как показали исследования, доля программных визитов достаточно весома и их обработка приводит к излишним нагрузкам, поэтому пользователи постоянно проверяются, фильтруются и обрабатываются для выявления реальных людей. Далее из базы данных извлекается контекстный профиль посещенной веб-страницы, который вместе с данными сессии передается на обработку алгоритмам расчета профиля. Расчет актуального профиля пользователя проводится лишь в том случае, если данные по всем интересам и данные сессии собраны в достаточном объеме, а их значения выше порогового, в противном случае профиль пользователя не изменяется. Для расчета нового профиля пользователя из базы данных используют старый профиль пользователя, все имеющиеся данные о пользователе, контекстный профиль посещенной страницы, данные сессии и на основании указанных данных создают новый актуальный профиль, который помещается в базу данных взамен старого профиля пользователя.

Описываемый функционал позволяет с высокой точностью определить актуальные на данный момент интересы пользователей в сети путем сбора информации о посещаемых сайтах и страницах, совершенных действиях, времени просмотра и т.д. для последующей демонстрации объявлений пользователям, которые действительно заинтересованы в рекламируемом товаре или услуге. Релевантная реклама с точки зрения интересов пользователя не рассматривается им как реклама, а воспринимается как полезная и нужная информация, что, в свою очередь, значительно повышает кликабельность баннеров. Особенностью заявляемого способа является также повышенное требование к поведенческим профилям при демонстрации рекламы, т.е. если в профиле недостаточно весомых интересов и данных, то будет показана реклама на основании контекста. Используя данный подход, исключается демонстрация неуместной рекламы.

В отличие от части известных решений в файлах cookie на стороне пользователя сохраняется только идентификатор пользователя без дополнительной информации и дополнительных обработок, что в свою очередь снижает нагрузку на стороне пользователя. Вся информация о пользователе хранится на серверах в базах данных, и обработка указанной информации выполняется только алгоритмами, работающими на серверах. Данные пользователей не являются статичными и постоянно обновляются для поддерживания актуальной информации на данный момент. Многоступенчатая обработка и подготовка данных о пользователе перед построением профиля пользователя с уникальными способами сбора, группировки и анализа данных с веб-страницы о предпочтениях и поведении пользователя позволяют получить актуальный профиль в режиме реального времени (при каждом визите, запросе от других модулей системы или плановом обновлении по расписанию).

В системе данные о поведении пользователей хранятся и анализируются за 90 дней, что позволяет более точно определять долгосрочные интересы и хронологию их проявления. Краткосрочные и долгосрочные интересы обновляются в режиме реального времени. Часть данных о пользователях и их интересы обновляются при посещении страницы в режиме реального времени, по запросу от других модулей системы (реакция на поведение, количество кликов и другие факторы), часть дополнительно обновляется с различной периодичностью (каждый день, раз в несколько дней), часть обновляется раз в неделю (профили неактивных пользователей).

Данные о пользователях и их поведении хранятся в нескольких связанных между собой матрицах, в т.ч. сведения о хронологии проявления интересов, весовые значения для каждого интереса, рассчитанные алгоритмами по поведению пользователя на странице во время визита, дополнительные уточнения, основанные на поведении пользователя и реакции на показанную рекламу, социально-демографические данные. Интересы не имеют четкого разделения на долгосрочные и краткосрочные, при обновлении профиля пользователя алгоритмы, используя имеющиеся данные, обновляют профиль, после чего долгосрочный интерес может стать краткосрочным и наоборот.

Весовые значения для каждого интереса включают:

- интерес по контенту, который рассчитывается по тематике страницы, где интересы, которые наиболее подходят к контенту, получают больший вес, менее подходящие - меньший вес. Тем самым учитывается контент при ранжировании непосредственно перед показом рекламы. Если в профиле пользователя интерес имеет меньший вес, но интерес найден в контекстном профиле посещенной страницы, тогда путем присвоения дополнительных коэффициентов профиль пользователя будет скорректирован или подготовлен к текущему показу;

- действия на странице, где вес рассчитывается во время визита, если действий мало - вес интереса снижается, если много - увеличивается. Для расчета берутся веса из контекстного профиля страницы;

- существующий для доменов и разделов сайта в системе общий профиль пользователя с интересами (обычно с широким охватом), который учитывается при формировании контекстных профилей страниц и поведенческих профилей пользователей. Также домены учитываются перед показом рекламы: приоритет отдается рекламным материалам того домена, который знаком пользователю, и он наиболее часто его посещает;

- социально-демографические данные, которые не являются при показе решающими и носят более рекомендательный характер. С использованием этих данных профиль пользователя только корректируется при помощи дополнительных динамических коэффициентов, т.е. если есть более выраженные интересы пользователя, то при расчете весов эти данные не окажут существенного влияния на актуальный профиль пользователя;

- реакцию на демонстрируемую рекламу. Если пользователь проявляет интерес (есть клики по рекламному объявлению определенной тематики), вес интереса в профиле кратковременно увеличивается, если нет кликов, вес интереса в профиле кратковременно уменьшается. Эти факторы не могут быть решающими, если интерес постоянно поддерживается и имеет большой вес, степень влияния на вес интереса определяется алгоритмами с учетом других имеющихся данных;

- срок давности последнего проявления интереса. Устаревшие интересы имеют низкий вес, недавние более высокий;

- группировку проявления или непроявления интереса. Если интерес поддерживался какое-то время, а после пропал - вес интереса значительно снижается в профиле, если через какое-то время интерес возобновился - вес значительно повышается, но при этом учитываются и другие данные;

- долгосрочную периодичность проявления интереса. Алгоритмами определяется указанная периодичность за большой промежуток времени (более недели), и если удается ее определить, тогда профиль пользователя непосредственно перед началом очередного периода обновляется и интерес с периодичным появлением получает краткосрочно больший вес, по окончании периода интереса - вес интереса уменьшается. Таким образом, определяются периодичные интересы в зависимости, например, от дня недели или числа месяца;

- краткосрочную периодичность интереса. Алгоритмами определяется указанная периодичность за небольшой промежуток времени (на протяжении недели), если ее удается определить, тогда профиль пользователя непосредственно перед началом очередного периода обновляется и интерес с периодичным появлением получает краткосрочно больший вес, по окончании периода интереса - вес интереса уменьшается. Таким образом, определяются рабочие (в рабочее время) интересы, личные (в нерабочее время) и другие, которые проявляются в определенный промежуток времени, также учитывается возможность потери периодичности на какое-то время (человек может пойти в отпуск и т.п.);

- степень заинтересованности по контексту страниц. Алгоритмами анализируются веса интереса в профилях просмотренных страниц за все время хранения данных о пользователе. Создаются динамические коэффициенты, основываясь на среднем весе интереса в контекстных профилях страниц, для корректировки веса интереса в профиле пользователя. Если средний вес интереса по контекстным профилям просмотренных страниц высокий, коэффициенты больше и, соответственно, вес интереса в профиле пользователя увеличивается. Если средний вес интереса по контекстным профилям просмотренных страниц низкий, коэффициенты меньше и, соответственно, вес интереса в профиле пользователя уменьшается;

- охват интереса (широкий, узкий). Степень охвата рассчитывается в зависимости от степени вложенности: интересы с меньшей степенью вложенности (с широким охватом) получают при расчете меньший вес, интересы с большей степенью вложенности (с узким охватом) получают при расчете больший вес. Таким образом достигается фокусировка профиля на самых узких интересах.

Краткое описание чертежей

Прилагаемые чертежи включены для обеспечения дальнейшего понимания изобретения и составляют часть описания, иллюстрируют варианты осуществления изобретения и вместе с описанием служат для объяснения принципов изобретения.

ФИГ. 1 иллюстрирует передачу данных с веб-страницы и генерацию информера. Когда пользователь заходит на страницу просмотра 100 идентификатор пользователя и его действия передается на рекламный сервер 200. Проводится предварительная обработка полученных данных 300, в результате которой идентификатор передается в функционал профилирования пользователей 400 для открытия сессии визита, проиллюстрированной на ФИГ. 2, также идентификатор передается для генерации информера (на фиг. 1 не указано). В блоке 800 выполняется запрос профиля пользователя из базы данных с профилями пользователей 850. Если при поиске профиля пользователя 900, он оказывается найден, то по профилю пользователя и другим имеющимся данным генерируется информер 1500. Если профиля пользователя нет в базе данных с профилями пользователей 850, из базы данных с контекстными профилями 1050 извлекается контекстный профиль страницы, по которому генерируется информер 1000. Сформированный информер 1500 или 1000 отображается на странице, которую просматривает пользователь, 2000, на этом работа с информером закончена 2500. Дальнейшие действия пользователя на странице просмотра 100 передаются на рекламный сервер 200, проходят предварительную обработку данных 300 путем анализа и передаются в функционал профилирования пользователей 400 для сбора данных сессии визита, проиллюстрированной на ФИГ. 2.

ФИГ. 2 иллюстрирует процесс создания сессии визита и проверку на "ботов". Полученные данные о пользователе с рекламного сервера 600 используются для создания сессии визита 410. По мере поступления данных они проверяются 420 на исключения и возможные ошибки. Если проверки 420 не пройдены, сессия закрывается с ошибкой и обработка визита прекращается 430. Если время сессии закончилось и в данных не обнаружены ошибки, сессия закрывается 440 в связи с окончанием времени, отведенного на сбор данных. Выполняется проверка сгруппированных данных сессии 450 на превышение пороговых значений. Если проверка не пройдена, обработка визита заканчивается 460 с ошибкой. Если проверка данных 450 пройдена, формируются данные сессии 470, которые проверяются на "ботов" 480. Если проверка на «ботов» 480 не пройдена, идентификатор пользователя помещается в "черный список" 490 и обработка визита заканчивается 500 с ошибкой. Визиты пользователей из "черного списка" не обрабатываются и фильтруются на этапе формирования сессии 410. Если проверка на «ботов» 480 успешно пройдена, из базы данных с контекстными профилями 1050 извлекается контекстный профиль посещенной страницы 510 и данные сессии с контекстным профилем передаются на дальнейшую обработку 520. ФИГ. 3 иллюстрирует создание профиля пользователя по имеющимся данным. При получении данных, собранных о пользователе во время последней активности, т.е. сессии и контекстного профиля, если он есть, 525 выполняется подключение дополнительных библиотек 530 с интересами и шаблонами обработки данных. Из базы данных с профилями пользователей 850 извлекается профиль пользователя 540. Если при проверке профиля пользователя 550, он найден, то происходит его обновление 610 с учетом имеющихся данных о последнем визите. Если при проверке 550 профиль пользователя не обнаружен, то создается новый профиль пользователя 560 по имеющимся данным о визите. Когда новый 560 или обновленный профиль 610 пользователя сформирован, он сохраняется 660 в базе данных с профилями пользователей 850.

ФИГ. 4 иллюстрирует создание нового профиля пользователя. Полученные данные для формирования нового профиля пользователя 570 проверяются на исключения 572: определение наличия контекстного профиля, без которого невозможно построение нового профиля пользователя, наличие необходимых действий и т.д. Если проверка 572 не пройдена и данных недостаточно для формирования нового профиля пользователя, профиль не создается и обработка заканчивается 574 с ошибкой. Если данных достаточно для формирования нового профиля пользователя, выполняется проверка пороговых значений 576 по действиям пользователя во время посещения страницы. Если проверка 576 не пройдена, новый профиль не создается и обработка заканчивается 578 с ошибкой. Если проверка пройдена, формируется новый профиль пользователя 580. При формировании нового профиля пользователя оцениваются действия пользователя во время визита и временные показатели по действиям, на основании этих данных рассчитываются корректирующие коэффициенты, которые используются для уточнения интересов контекстного профиля и интересов профиля пользователя. Таким образом, формируется минимальный профиль нового пользователя, рассчитанный по одному первому визиту. Такой профиль не может быть использован для создания информера в блоке 1500, так как интересы в профиле не имеют необходимой точности и полноты. Для формирования информера в блоке 1500 может быть использован профиль пользователя только после нескольких обновлений в течение определенного времени и достаточной активности пользователя.

ФИГ. 5 иллюстрирует обновление существующего профиля пользователя. Полученные данные для обновления профиля пользователя 620 проверяются на "ботов" 622. При проверке 622 анализируется существующий профиль пользователя совместно с данными сессии. Если проверка 622 не пройдена, идентификатор пользователя помещается в "черный список" 624 и обработка заканчивается 626 с ошибкой. Если проверка 622 пройдена успешно, выполняется уточнение существующего профиля пользователя на текущий момент 628 с корректировкой всех интересов профиля, учитывая время проявления интересов. При этом удаляются те интересы, которые пользователь долго не проявлял, у остальных интересов снижается весовое значение в профиле пользователя в зависимости от давности их проявления. Далее все имеющиеся данные проверяются на исключения 638: наличие контекстного профиля, интересов пользователя, действий на странице и существующего профиля пользователя. Если проверка 638 не пройдена, окончательный профиль пользователя формируется 658 только с использованием части имеющихся данных. Если проверка 638 пройдена успешно, проверяются пороговые значения 640. Так же, как и в предыдущей проверке, проверяются все данные. Если при проверке 640 какие-то показатели превышают допустимые значения, профиль пользователя формируется 658 только по части имеющихся данных. Если проверки 638 и 640 пройдены успешно, выполняется обновление профиля пользователя 642 с учетом данных сессии и контекстного профиля посещенной страницы. При обновлении профиля пользователя 642 учитываются действия пользователя во время визита, на основании действий и времени их выполнения рассчитываются корректирующие коэффициенты, с учетом которых пересчитываются интересы контекстного профиля и существующего профиля пользователя. Скорректированный контекстный профиль используется для расчета части интересов обновляемого профиля пользователя. После обновления профиля пользователя 638 формируется профиль 658 с учетом всех уточняющих коэффициентов и факторов, рассчитанных и собранных в процессе всей обработки последнего визита и обновления профиля. Таким образом, профиль проверяется на ошибки, которые не были выявлены на каждом этапе обработки, выполняются уточнения весового значения интересов, которые не было возможности рассчитать в процессе обработки из-за отсутствия каких-либо данных, которые были определены на следующих этапах обработки.

Пример 1. Пользователь месяц тому назад искал активно холодильник, после его купил и интерес к холодильникам прошел, а рекламная платформа все еще показывает рекламу холодильников.

Подобные ошибки в заявленном техническом решении устраняются путем использования алгоритмов, учитывающих давность проявления интересов, устаревшие интересы не используются для демонстрации даже в том случае, если пользователь не проявлял других весомых интересов после интереса к холодильникам или не проявлял активность вовсе. В системе высокие требования к качеству поведенческих профилей, поэтому в подобном случае (если в данных пользователя не найдено других весомых интересов) с большой долей вероятности будет показана реклама на основании контекстного профиля.

При этом временным прекращением интереса является тот факт, что пользователь перестал посещать сайты этой тематики, но это не может быть признаком полного прекращения интереса. Возможно, он просто не нашел подходящего холодильника по цене и отложил покупку до зарплаты, когда будет нужная сумма, а после зарплаты продолжил интересоваться холодильниками. В этом случае интерес становится не краткосрочным, а долгосрочным и получает более значимый вес в профиле пользователя при соблюдении всех условий.

Алгоритмами анализируется хронология проявления интересов, группировка по времени их проявления и отсутствие проявления интереса на протяжении определенного промежутка времени. В случае если интерес был краткосрочным (на протяжении определенного промежутка времени), а после прекратился - реклама по нему не показывается до следующего проявления этого интереса.

Пример 2. Пользователь неделю тому назад хотел купить ноутбук и посещал страницы с описанием ноутбуков, потом решил, что десктоп лучше и искал его, потом вспомнил, что есть еще планшеты, и вчера посмотрел информацию по ним. Сегодня пользователь окончательно определился, что ему нужен только ноутбук, и посетил магазин с ноутбуками. В данной ситуации одни платформы будут показывать рекламу планшетов, другие планшеты, ноутбуки и десктопы, что является нерелевантным интересам пользователя.

Заявляемый способ отработает алгоритмы ранжирования для демонстрации рекламы: имеющийся контекстный профиль страницы с ноутбуками будет проверен на интересы, имеющиеся в поведенческом профиле, будет рассчитана весовая доля по каждому пересечению интересов в профилях.

Пример 3 и 4. Очень часто показывают нерелевантную рекламу из-за недостаточной точности интересов при сборе данных о пользователе рекламными платформами. У пользователя сломался телевизор, и он решил его отремонтировать самостоятельно, соответственно, он посещает много тематических сайтов по ремонту телевизоров и обучается, в это время ему показывают рекламу о покупке нового телевизора, которая ему не интересна. Или пользователь решил купить новую стиральную машину, просматривает предложения и выбирает оптимальную модель. В это время ему показывают рекламу по всей бытовой технике: холодильники, посудомоечные машины, сушилки и т.п. Это происходит по причине недостаточной фокусировки и узости охвата интересов рекламной сети, что является очень неэффективным подходом.

Подобные ошибки в представленном решении исключаются наличием больших библиотек с интересами, их вложенностью и узостью, поэтому при реализации заявляемого способа подобные ошибки исключены.

Похожие патенты RU2811670C2

название год авторы номер документа
Способ сбора и обработки данных с измерением эффективности рекламных материалов и рекламных кампаний для автоматизированного подбора онлайн рекламных площадок с целью размещения рекламных материалов. 2021
  • Нетылько Сергей Владимирович
RU2774604C1
СИСТЕМА И СПОСОБ СОПОСТАВЛЕНИЯ И СБОРА ДАННЫХ ПОЛЬЗОВАТЕЛЯ И/ИЛИ ПОЛЬЗОВАТЕЛЬСКОГО УСТРОЙСТВА 2020
  • Волынкин Илья Александрович
  • Копицын Олег Сергеевич
  • Вахотин Сергей Александрович
RU2764159C1
СПОСОБ РАСПРОСТРАНЕНИЯ РЕКЛАМНЫХ И ИНФОРМАЦИОННЫХ СООБЩЕНИЙ В СЕТИ ИНТЕРНЕТ 2012
  • Дамиров Эльдар Джангирович
RU2520394C1
МЕТОД ОТОБРАЖЕНИЯ РЕЛЕВАНТНОЙ КОНТЕКСТНО-ЗАВИСИМОЙ ИНФОРМАЦИИ 2014
  • Цыпляев Максим Викторович
  • Винокуров Никита Алексеевич
RU2683482C2
СЕТЕВЫЕ ПРИБОРЫ ДЛЯ ЗАМЕНЫ ОДНИХ РЕКЛАМНЫХ ОБЪЯВЛЕНИЙ ДРУГИМИ 2008
  • Маттиз Майкл
  • Ченг Лебин
  • Феи Айгуо
RU2416127C2
УСТРОЙСТВО, А ТАКЖЕ СПОСОБ ВЫБОРА И РАЗМЕЩЕНИЯ ЦЕЛЕВЫХ СООБЩЕНИЙ НА СТРАНИЦЕ РЕЗУЛЬТАТОВ ПОИСКА 2014
  • Ворожцов Артем Викторович
RU2629449C2
СЕРВЕР И СПОСОБ АДРЕСНОЙ РЕКЛАМЫ 2009
  • Силваин Дани
RU2532731C2
СИСТЕМА И СПОСОБ ДЛЯ ВЫБОРА ЗНАЧИМЫХ ЭЛЕМЕНТОВ СТРАНИЦЫ С НЕЯВНЫМ УКАЗАНИЕМ КООРДИНАТ ДЛЯ ИДЕНТИФИКАЦИИ И ПРОСМОТРА РЕЛЕВАНТНОЙ ИНФОРМАЦИИ 2015
  • Цыпляев Максим Викторович
  • Винокуров Никита Алексеевич
RU2708790C2
Способ определения источника звонка и система коллтрекинга с использованием сотовых телефонов 2022
  • Орлов Денис Викторович
RU2791422C1
Способ для привлечения покупателей в офисы продаж товаров и услуг 2018
  • Алумов Сергей Маратович
  • Егоров Дмитрий Владимирович
RU2699059C1

Иллюстрации к изобретению RU 2 811 670 C2

Реферат патента 2024 года Система сбора и обработки данных для поведенческого таргетинга

Изобретение относится к области рекламы и вычислительной техники, в частности к технологиям показа контекстных объявлений с учетом пользовательских интересов. Техническим результатом является высокая точность определения актуальных на данный момент интересов пользователей в сети путем сбора информации о посещаемых страницах сайтов, совершенных действиях, времени просмотра для показа объявления пользователям, которые действительно заинтересованы в рекламируемом товаре или услуге. Система сбора и обработки данных для поведенческого таргетинга, базирующаяся на фокусировке рекламных объявлений по интересам, состоит из сервера обработки и хранения данных, по меньшей мере одного компьютера или мобильного устройства пользователя, по меньшей мере одного средства отображения информации пользователю - цифрового дисплея и сети Интернет, при помощи которой осуществляется обмен данными между устройством пользователя и рекламным сервером. В качестве данных хранятся действия пользователя при посещении страниц: отказы, время, проведенное на сайте, глубина просмотра, постоянно обновляемые профили пользователей в матричном формате, информация о времени проявления интересов, а также формируемые после анализа контента контекстные профили, состоящие из интересов, привязанных к ключевым словам, при посещении пользователем страницы сайта на компьютере или мобильном устройстве пользователя идентификатор пользователя и действия на странице отправляют на сервер, при получении идентификатора пользователя из базы данных извлекают имеющийся актуальный профиль пользователя и на его основе генерируют информер, который демонстрируется с помощью средства отображения информации пользователю. 5 ил.

Формула изобретения RU 2 811 670 C2

Система сбора и обработки данных для поведенческого таргетинга, базирующаяся на фокусировке рекламных объявлений по интересам, категориям и ключевым словам, состоящая из сервера обработки и хранения данных, по меньшей мере одного компьютера или мобильного устройства пользователя, по меньшей мере одного средства отображения информации пользователю - цифрового дисплея и сети Интернет, при помощи которой осуществляется обмен данными между устройством пользователя и рекламным сервером, отличающаяся тем, что в качестве данных хранятся действия пользователя при посещении страниц: отказы, время, проведенное на сайте, глубина просмотра, постоянно обновляемые профили пользователей в матричном формате, информация о времени проявления интересов, а также формируемые после анализа контента контекстные профили, состоящие из интересов, привязанных к ключевым словам, при посещении пользователем страницы сайта на компьютере или мобильном устройстве пользователя идентификатор пользователя и действия на странице отправляют на сервер, при получении идентификатора пользователя из базы данных извлекают имеющийся актуальный профиль пользователя и на его основе генерируют информер, который демонстрируется с помощью средства отображения информации пользователю, данные, полученные из браузера компьютера или мобильного устройства пользователя, передают функционалу профилирования пользователей, который собирает сессии визитов, фильтрует, сортирует и обрабатывает собранные данные, рассчитывает после всех обработок и проверок актуальный на данный момент профиль интересов пользователя и обновляет его в базе данных, при этом в оперативной памяти компьютера или мобильного устройства пользователя хранятся и регулярно обновляются заранее сгенерированные подборки объявлений по каждому ключевому слову.

Документы, цитированные в отчете о поиске Патент 2024 года RU2811670C2

US 20020069105 A1, 06.06.2002
US 20140033249 A1, 30.01.2012
US 20120030023 A1, 02.02.2012
CN 103179205 A, 26.06.2013.

RU 2 811 670 C2

Авторы

Клименков Виталий Геннадьевич

Щербаков Станислав Валерьевич

Барсуков Антон Андреевич

Даты

2024-01-15Публикация

2022-03-18Подача