Область техники:
[0001] Изобретение относится к области вычислительной техники, в частности, к системе мониторинга Интернет-трафика пользователя для присвоения пользовательскому устройству коэффициента классификации пользователя.
Уровень техники:
[0002] В настоящее время существует множество систем мониторинга Интернет-трафика. Одним из примеров таких решений является способ для мониторинга интернет-трафика третьими лицами, описанная в заявке на патент US 2009/0019148 A1. Известное решение раскрывает способ мониторинга интернет-трафика, который включает в себя анализ провайдером сетевых услуг HTTP-транзакции с участием клиента интернет-пользователя. Поставщик сетевых услуг отвечает на транзакцию HTTP, пересылая клиенту интернет-пользователя промежуточную веб-страницу, содержащую средство мониторинга. После пересылки промежуточной веб-страницы клиенту интернет-пользователя поставщик сетевых услуг пересылает веб-контент, изначально связанный с транзакцией HTTP, клиенту интернет-пользователя.
[0003] Однако известному решению присущи недостатки. Недостаток известного решения заключается в том, что оно имеет низкую точность классификации пользователя для дальнейшего предоставления ему рекламного контента. Данный недостаток обусловлен тем, что известное решение при классификации не предусматривает присвоение коэффициента классификации пользовательского устройства, а также не анализирует аппаратные средства вычислительного устройства пользователя, не учитывает параметры интернет соединения для предоставления медиа контента, а также не анализирует поведение пользователя в целом.
Раскрытие изобретения:
[0004] Задачей изобретения является устранение указанных выше недостатков.
[0005] Техническим результатом при этом является повышение точности классификации пользователя посредством расчета коэффициента классификации пользователя для его дальнейшего присвоения пользовательскому устройству.
[0006] Для достижения технического результата предложена система анализа Интернет-трафика пользователя для присвоения пользовательскому устройству коэффициента классификации пользователя, содержащая сервер, выполненный с возможностью: установки интернет соединения, по меньшей мере, с одним вычислительным устройством пользователя для анализа аппаратных средств вычислительного устройства пользователя с присвоением вычислительному устройству пользователя коэффициента аппаратных средств вычислительного устройства пользователя (коэффициент dq1), где анализ аппаратных средств включает идентификацию матрицы дисплея вычислительного устройства пользователя, идентификацию видеокарты вычислительного устройства пользователя, идентификацию оперативной памяти вычислительного устройства пользователя, идентификацию производителя вычислительного устройства пользователя и идентификацию вторичных характеристик вычислительного устройства пользователя; установки интернет соединения, по меньшей мере, с одним вычислительным устройством пользователя для анализа параметров интернет соединения с присвоением вычислительному устройству пользователя коэффициента интернет соединения вычислительного устройства пользователя (коэффициент iq1), где параметры интернет соединения включают скорость интернет соединения, тип подключения вычислительного устройства пользователя к сети Интернет, наименование интернет провайдера, характеристики DNS, наличие и тип прокси соединения, статистику активности использования данного сегмента сети; установки интернет соединения, по меньшей мере, с одним вычислительным устройством пользователя для анализа поведения пользователя в Интернет-сессии с присвоением вычислительному устройству пользователя поведенческого коэффициента пользователя (коэффициент pv1), где анализ поведения пользователя включает идентификацию интернет сайтов с наибольшей посещаемостью пользователем, идентификацию количества интернет соединений за заданный период времени с устройства пользователя, характеристики использования «горячих клавиш», характеристики скорости и полноты прочтения онлайн страницы, характеристики переключения между страницами, скорость печати; и расчета и присвоения пользовательскому устройству коэффициента классификации пользователя (коэффициент ei1), где расчет коэффициента ei1 выполняется как функция f от коэффициентов dq1, iq1, pv1: ei1= f(dq1, iq1, pv1).
[0007] Дополнительно вторичные характеристики вычислительного устройства пользователя включают, по меньшей мере, одну из: год выпуска модели вычислительного устройства пользователя, заводские характеристики камеры, версию интернет браузера или их комбинации.
[0008] Дополнительно тип подключения вычислительного устройства пользователя к сети Интернет включает, по меньшей мере, один из следующих подключений: Wi-Fi, 3G, 4G, LTE-A, или их комбинации.
[0009] Дополнительно расчет расчет коэффициента ei1 как функции f от коэффициентов dq1, iq1, pv1 выполняется посредством машинного обучения с использованием, по меньшей мере, одного из следующих алгоритмов: деревья решений, GLM/GLZ, градиентный бустинг.
[0010] Дополнительно сервер выполнен с возможностью установки интернет соединения, по меньшей мере, с одним вычислительным устройством пользователя для анализа программного обеспечения вычислительного устройства пользователя с присвоением вычислительному устройству пользователя коэффициента программного обеспечения вычислительного устройства пользователя (коэффициент pq1).
[0011] Дополнительно сервер выполнен с возможностью расчета и присвоения пользовательскому устройству коэффициента классификации пользователя (коэффициент ei1), где расчет коэффициента ei1 выполняется как функция f от коэффициентов dq1, iq1, pv1, pq1: ei1= f(dq1, iq1, pv1, pq1).
[0012] Очевидно, что как предыдущее общее описание, так и последующее подробное описание даны лишь для примера и пояснения и не являются ограничениями данного изобретения.
Краткое описание чертежей:
[0013] Фиг. 1 – схематичное изображение системы мониторинга Интернет-трафика пользователя для присвоения пользовательскому устройству коэффициента классификации пользователя в соответствии с воплощением настоящего изобретения.
Осуществление изобретения:
[0014] Схематическое изображение заявленной системы 100 мониторинга Интернет-трафика пользователя для присвоения пользовательскому устройству коэффициента классификации пользователя показано на фиг. 1. Система 100 содержит сервер 101 соединенный посредством сети 103 приема и передачи данных, по меньшей мере, с одним вычислительным устройством 102 пользователя.
[0015] Вычислительное устройство 102 пользователя содержит по меньшей мере, приемопередатчик 104, матрицу 105 дисплея, видеокарту 106 и оперативную память 107.
[0016] В контексте настоящего решения сеть 103 приема и передачи данных может являться, по меньшей мере, одной из следующих сетей: TCP/IP сетью, Интернет, Wi-Fi, GPRS, 3G, 4G, 5G, сетью на основе технологий LTE или LTE-A, спутниковой сетью передачи данных и других типов.
[0017] Сервер 101 в контексте настоящего решения выполнен с возможностью установки интернет соединения, по меньшей мере, с одним вычислительным устройством пользователя для анализа аппаратных средств вычислительного устройства пользователя с присвоением вычислительному устройству пользователя коэффициента аппаратных средств вычислительного устройства пользователя (коэффициент dq1), для анализа параметров интернет соединения с присвоением вычислительному устройству пользователя коэффициента интернет соединения вычислительного устройства пользователя (коэффициент iq1), для анализа поведения пользователя в Интернет-сессии с присвоением вычислительному устройству пользователя поведенческого коэффициента пользователя (коэффициент pv1) и расчета и присвоения пользовательскому устройству коэффициента классификации пользователя (коэффициент ei1).
[0018] Анализ аппаратных средств включает идентификацию матрицы дисплея вычислительного устройства пользователя, идентификацию видеокарты вычислительного устройства пользователя, идентификацию оперативной памяти вычислительного устройства пользователя, идентификацию производителя вычислительного устройства пользователя и идентификацию вторичных характеристик вычислительного устройства пользователя. Альтернативно вторичные характеристики вычислительного устройства пользователя могут включать, по меньшей мере, одну из следующих характеристик: год выпуска модели вычислительного устройства пользователя, заводские характеристики камеры, версию интернет браузера или их комбинации.
[0019] Параметры интернет соединения включают скорость интернет соединения, тип подключения вычислительного устройства пользователя к сети Интернет, наименование интернет провайдера.
[0020] Анализ поведения пользователя включает идентификацию интернет сайтов с наибольшей посещаемостью пользователем, идентификацию количества интернет соединений за заданный период времени, скорость прочтения страницы, скорость печати, характеристики использования буфера обмена данных и т.д.
[0021] Расчет коэффициента ei1 выполняется как функция f от коэффициентов dq1, iq1, pv1: ei1= f(dq1, iq1, pv1). Альтернативно расчет коэффициента ei1 как функции f от коэффициентов dq1, iq1, pv1 может выполняться посредством машинного обучения с использованием, по меньшей мере, одного из следующих алгоритмов: деревья решений, GLM/GLZ, градиентный бустинг.
[0022] Необходимо отметить, что настоящее решение обеспечивает высокую точность классификации пользователя посредством рассчитанного коэффициента классификации пользователя для дальнейшего предоставления рекламного контента или для оценки его платежеспособности. Оценка платежеспособности в дальнейшем может быть использована для предоставления пользователю банковских продуктов (денежных кредитов, ипотеки и т.д.). В контексте настоящего решения анализ параметров интернет соединения может быть использован для оценки канала пропуска данных. Оценка канала пропуска может быть использован для определения объема данных медиа контента, который может принять вычислительное устройство пользователя в целях предоставления рекламного контента. Также анализ параметров интернет соединения может быть использован для оценки уровня дохода пользователя (абоненты с высоким уровнем дохода подписаны на тарифные планы с высоким уровнем интернет соединения). В частности, для упомянутого анализа может использоваться как линейная регрессия, дерево решений, так более сложные, но в частном случае менее стабильные подходы, например, boosting trees, нейронные сети и т.д. Для анализа интернет соединения могут быть также использованы следующие параметры: плотность сети в регионе (в частности, в регионе, в котором находится вычислительное устройство пользователя), скорость Интернет-соединения (вычисляемая с использованием параметров в API браузеров), способ подключения (с использованием параметров в API браузеров или посредством уточнения по статическим словарям характеристик сегментов сети), время интернет сессии (интернет-сессии) по локальному времени пользователя, в частности время начала интернет сессии и вторичные характеристики Интернет-соединения, например, тип интернет соединения, тип точки входа в интернет (мобильный, Wi-Fi и т.д.). Каждый из приведенных выше показателей учитывается по модели наличия позитивного значения. Так, например, при получении (в частном случае, вычислении, определении) высокого значения производительности дисковой системы осуществляется добавление веса в соответствующую характеристику, а при невозможности определения - добавление не осуществляется. В частном случае присутствует два варианта или больше для определения характеристик, например, через значение в браузере или через нагрузочное тестирование.
[0023] Каждый из приведенных выше показателей может быть вычислен, как стандартными методами (GLM/GLZ, деревья решений и т.д.), так и более современными (нейронными сетями и негауссовскими инструментами и т.д.).
[0024] Так, например, определение предполагаемого дохода пользователя включает деление располагаемого дохода (ei) на децили ei -> ei1. Далее осуществляется вычисление устойчивых оценок (которые в частном случае являются ранговыми) для качества вычислительного устройства пользователя (dq1), от качества Интернет-соединения (iq1) и набора предикторов онлайн поведения (pv1). Для осуществления оценки ei1 как функции от dq1, iq1 и pv1, частности, ei1= f(dq1, iq1, pv1), могут быть использованы различные алгоритмы, например, деревья решений, GLM (от англ. generalized linear models), boosting trees (расширяемые деревья) и т.д. Одним из устойчивых вариантов решения является применение моделей GLM/GLZ в виде ei1=a1*dq1 + a2*iq1 + a3*py1 + a4, где коэффициенты a1-a4 получаются в результате обучения модели в рамках процесса машинного обучения.
[0025] Значение плотности сети в регионе может быть вычислено как отношение числа зарегистрированных ipv4-соединений, используемых вычислительными устройствами пользователей, на тысячу жителей в регионе или путем присвоения стабильного уровня/веса для региона, которые являются стабильными во времени и в частном случае не требуют корректировок в диапазоне шести-двенадцати месяцев, поскольку количество ipv4 ограничено и миграция пользователей изменяется не более чем на один-три процента в месяц от общего населения региона (оценки по динамике миграции ipv4 адресов приведены на основе данных за три последовательных года для более чем 20+ стран). Указанный стабильный уровень/вес выбирается исходя из оценки качества инфраструктуры, которая сильно скоррелирована с локальным валовым региональным продуктом (ВРП) на душу населения, что в свою очередь коррелирует с доходами в регионе. В частном случае отслеживается история пользователя, в частности, действий пользователя, например, история заказов, брони и т.д. Если у пользователя высокий доход, то он будет останавливаться в хороших отелях с качественным интернет соединением, где качество интернет соединения зависит от стоимости оказываемой услуги.
[0026] Анализ аппаратных средств вычислительного устройства пользователя может быть использован для определения продуктов отдельных производителей (например, NVIDIA, AMD, INTEL т.д.), чтобы в дальнейшем предоставлять рекламный контент от этих производителей. Также анализ аппаратных средств (анализ качества вычислительного устройства пользователя, т.е. анализ его стоимости) позволяет оценить уровень дохода пользователя для дальнейшего предоставления пользователю банковских продуктов (денежных кредитов, ипотеки и т.д.).
[0027] Каждый из показателей вычислительного устройства пользователя, приведенных в описании настоящего решения, может быть вычислен, как стандартными методами (GLM/GLZ, деревья решений), так и более современными (нейронными сетями и негауссовскими инструментами).
[0028] Ниже приведен пример сравнения первого показателя уровня дохода пользователя: Первое устройство (Устройство 1) - устройство Apple iPhone 12 (причем, тип, модель, характеристики вычислительного устройства могут быть вычислены по информации, содержащейся в поле «useragent» в веб-браузере) имеет разрешение 2532х 1170 пикселя и device_pixel_ratio равный трем («3»); Второе устройство (Устройство 2) - устройство HUAWEI P40 lite (тип, модель, характеристики вычислительного устройства могут быть вычислены по информации, содержащейся в поле «useragent» в веб-браузере) имеет разрешение 2310×1080 и device_pixel_ratio равный трем («3»).
[0029] В данном случае за счет бренда (Apple дороже HUAWEI) и большего размера экрана (и ряда других характеристик), первое устройство стоит значительно дороже второго устройства.
[0030] Анализ поведения пользователя в Интернет-сессии обеспечивает оценку интереса пользователя для дальнейшего предоставления рекламного контента на вычислительное устройство пользователя или для оценки его платежеспособности. Например, в случае, если пользователь в Интернет-сессии выполнял поиск недвижимости, то в таком случае поведенческий коэффициент пользователя (коэффициент pv1) указывает на интерес пользователя недвижимостью для дальнейшего предоставления рекламного контента для покупки недвижимости. С другой стороны, в таком случае коэффициент pv1 оценивает уровень дохода пользователя для дальнейшего предоставления пользователю банковских продуктов (денежных кредитов, ипотеки и т.д.).
[0031] После выполненного анализа выполняется расчет пользовательскому устройству коэффициента классификации пользователя, который включает деление коэффициента классификации пользователя (ei) на децили ei -> ei1.
[0032] Далее осуществляется вычисление устойчивых оценок (которые в частном случае являются ранговыми) для качества вычислительного устройства пользователя (dq1), от качества Интернет-соединения (iq1) и набора предикторов онлайн поведения (поведенческого коэффициента пользователя pv1). Для осуществления оценки ei1 как функции от dq1, iq1 и pv1, частности, ei1= f(dq1, iq1, pv1), могут быть использованы различные алгоритмы, например, деревья решений, GLM (от англ. generalized linear models), boosting trees (расширяемые деревья) и т.д. Одним из устойчивых вариантов решения является применение моделей GLM/GLZ в виде ei1=a1*dq1 + a2*iq1 + a3*py1 + a4, где коэффициенты a1-a4 получаются в результате обучения модели в рамках процесса машинного обучения. Машинное обучение используется в оценке, например, для построения архитектуры решения таким образом, чтобы со временем она самообучалась. В контексте настоящего решения могут использованы следующие способы машинного обучения: обучение с учителем, обучение без учителя, обучение с подкреплением, активное обучение, обучение с частичным привлечением учителя, трансдуктивное обучение, многозадачное обучение, многовариантное обучение, бустинг, байесовская сеть, и т.д.
[0033] Необходимо отметить, что настоящее решение анализирует онлайн данные, по которым невозможно однозначно идентифицировать пользователя. Т.е. данные, которые анализирует настоящее решение не являются следующими: Фамилия, имя, отчество; Год, месяц, дата и место рождения; Паспортные данные или данные любого другого удостоверяющего документа; E-mail, наименование аккаунта в соц. сети, в т.ч. Skype, WhatsApp, Telegram; Номер мобильного телефона; ИНН, пенсионное свидетельство, СНИЛС, свидетельство о рождении; Адрес постоянной, временной регистрации и проживания; Семейное, социальное, имущественное положение; Сведения об образовании, профессии, доходах, данные о трудоустройстве; Полные данные банковской банковской карты полный номер банковской карты, детали расчетного счета в банке; Детализированные квитанции платежей, включая маршрутные квитанции, списки заказов, заметки, покупки, комментарии; Сведения, которые характеризуют физиологические и биологические особенности человека, на основании которых можно установить его личность (биометрические персональные данные). Например, медицинская карта, данные медицинских анализов; Фотография человека; И любые другие прямые идентификаторы человека или линейные/обратимые хэш функции от этих идентификаторов. Иными словами, анализируемые онлайн данные не позволяют идентифицировать пользователя.
[0034] Хотя данное изобретение было показано и описано со ссылкой на определенные варианты его осуществления, специалистам в данной области техники будет понятно, что различные изменения и модификации могут быть сделаны в нем, не покидая фактический объем изобретения. Следовательно, описанные варианты осуществления имеют намерение охватывать все подобные преобразования, модификации и разновидности, которые попадают под сущность и объем прилагаемой формулы изобретения.
Изобретение относится к вычислительной технике. Технический результат заключается в повышении точности классификации пользователя. Система анализа Интернет-трафика пользователя для присвоения пользовательскому устройству коэффициента классификации пользователя содержит сервер, выполненный с возможностью: установки интернет-соединения с вычислительным устройством пользователя для анализа аппаратных средств вычислительного устройства пользователя с присвоением вычислительному устройству пользователя коэффициента аппаратных средств вычислительного устройства пользователя; установки интернет-соединения с вычислительным устройством пользователя для анализа параметров интернет-соединения с присвоением вычислительному устройству пользователя коэффициента интернет-соединения вычислительного устройства пользователя; установки интернет-соединения с вычислительным устройством пользователя для анализа поведения пользователя в Интернет-сессии с присвоением вычислительному устройству пользователя поведенческого коэффициента пользователя; расчета и присвоения пользовательскому устройству коэффициента классификации пользователя. 5 з.п. ф-лы, 1 ил.
1. Система анализа Интернет-трафика пользователя для присвоения пользовательскому устройству коэффициента классификации пользователя, содержащая сервер, выполненный с возможностью:
- установки интернет-соединения по меньшей мере с одним вычислительным устройством пользователя для анализа аппаратных средств вычислительного устройства пользователя с присвоением вычислительному устройству пользователя коэффициента аппаратных средств вычислительного устройства пользователя (коэффициент dq1), где анализ аппаратных средств включает идентификацию матрицы дисплея вычислительного устройства пользователя, идентификацию видеокарты вычислительного устройства пользователя, идентификацию оперативной памяти вычислительного устройства пользователя, идентификацию производителя вычислительного устройства пользователя и идентификацию вторичных характеристик вычислительного устройства пользователя;
- установки интернет-соединения по меньшей мере с одним вычислительным устройством пользователя для анализа параметров интернет-соединения с присвоением вычислительному устройству пользователя коэффициента интернет-соединения вычислительного устройства пользователя (коэффициент iq1), где параметры интернет-соединения включают скорость интернет-соединения, тип подключения вычислительного устройства пользователя к сети Интернет, наименование интернет-провайдера, характеристики DNS, наличие и тип прокси соединения, статистику активности использования данного сегмента сети;
- установки интернет соединения по меньшей мере с одним вычислительным устройством пользователя для анализа поведения пользователя в Интернет-сессии с присвоением вычислительному устройству пользователя поведенческого коэффициента пользователя (коэффициент pv1), где анализ поведения пользователя включает идентификацию интернет-сайтов с наибольшей посещаемостью пользователем, идентификацию количества интернет-соединений за заданный период времени с устройства пользователя, характеристики использования «горячих клавиш», характеристики скорости и полноты прочтения онлайн страницы, характеристики переключения между страницами, скорость печати; и
- расчета и присвоения пользовательскому устройству коэффициента классификации пользователя (коэффициент ei1), где расчет коэффициента ei1 выполняется как функция f от коэффициентов dq1, iq1, pv1: ei1=f(dq1, iq1, pv1).
2. Система по п. 1, отличающаяся тем, что вторичные характеристики вычислительного устройства пользователя включают по меньшей мере одну из: год выпуска модели вычислительного устройства пользователя, заводские характеристики камеры, версия интернет-браузера или их комбинации.
3. Система по п. 1, отличающаяся тем, что тип подключения вычислительного устройства пользователя к сети Интернет включает по меньшей мере один из следующих подключений: Wi-Fi, 3G, 4G, LTE-A или их комбинации.
4. Система по п. 1, отличающаяся тем, что расчет коэффициента ei1 как функции f от коэффициентов dq1, iq1, pv1 выполняется посредством машинного обучения с использованием по меньшей мере одного из следующих алгоритмов: деревья решений, GLM/GLZ, градиентный бустинг.
5. Система по п. 1, отличающаяся тем, что сервер выполнен с дополнительной возможностью установки интернет-соединения по меньшей мере с одним вычислительным устройством пользователя для анализа программного обеспечения вычислительного устройства пользователя с присвоением вычислительному устройству пользователя коэффициента программного обеспечения вычислительного устройства пользователя (коэффициент pq1).
6. Система по п. 5, отличающаяся тем, что сервер выполнен с дополнительной возможностью расчета и присвоения пользовательскому устройству коэффициента классификации пользователя (коэффициент ei1), где расчет коэффициента ei1 выполняется как функция f от коэффициентов dq1, iq1, pv1, pq1: ei1=f(dq1, iq1, pv1, pq1).
Токарный резец | 1924 |
|
SU2016A1 |
Способ и приспособление для нагревания хлебопекарных камер | 1923 |
|
SU2003A1 |
US 7120790 B1, 10.10.2006 | |||
Многоступенчатая активно-реактивная турбина | 1924 |
|
SU2013A1 |
Система классификации трафика | 2018 |
|
RU2697648C2 |
Авторы
Даты
2023-05-05—Публикация
2022-10-19—Подача