СПОСОБ И УСТРОЙСТВО ДЛЯ СОЗДАНИЯ РЕКОМЕНДАЦИЙ СОДЕРЖИМОГО В СИСТЕМЕ РЕКОМЕНДАЦИЙ Российский патент 2017 года по МПК G06F17/30 G06F15/18 H04L29/02 

Описание патента на изобретение RU2632132C1

Область техники

[001] Настоящее техническое решение относится к системе рекомендаций в общем смысле и, в частности, - к способу и устройству для создания рекомендаций содержимого в системе рекомендаций.

Уровень техники

[002] Различные глобальные или локальные сети связи (Интернет, Всемирная Паутина, локальные сети и подобные им) предлагают пользователю большой объем информации. Информация включает в себя контекстуальные разделы, такие как, среди прочего, новости и текущие события, карты, информация о компаниях, финансовая информация и ресурсы, информация о траффике, игры и информация развлекательного характера. Пользователи используют множество клиентских устройств (настольный компьютер, портативный компьютер, ноутбук, смартфон, планшеты и подобные им) для получения доступа к богатому информационному контенту (например, изображениям, аудио- и видеофайлам, анимированным изображениям и прочему мультимедийному контенту подобных сетей).

[003] Объем доступной информации на различных интернет-ресурсах экспоненциально вырос за последние несколько лет. Были разработаны различные решения, которые позволяют обычному пользователю находить информацию, которую он(а) ищет. Примером такого решения является поисковая система. Примеры поисковых систем включают в себя такие поисковые системы, как GOOGLE™, YANDEX™, YAHOO!™ и другие. Пользователь может получить доступ к интерфейсу поисковой системы и подтвердить поисковый запрос, связанный с информацией, которую пользователь хочет найти в Интернете. В ответ на поисковый запрос, поисковые системы предоставляют ранжированный список результатов поиска. Ранжированный список результатов поиска создается на основе различных алгоритмов ранжирования, которые реализованы в конкретной поисковой системе и которые используются пользователем, производящим поиск. Общей целью таких алгоритмов ранжирования является представление наиболее релевантных результатов вверху ранжированного списка, а менее релевантных результатов - на менее высоких позициях ранжированного списка результатов поиска (а наименее релевантные результаты поиска будут расположены внизу ранжированного списка результатов поиска).

[004] Поисковые системы обычно являются хорошим поисковым инструментом в том случае, когда пользователю заранее известно, что именно он(а) хочет найти. Другими словами, если пользователь заинтересован в получении информации о наиболее популярных местах в Италии (т.е. поисковая тема известна), пользователь может ввести поисковый запрос: «Наиболее популярные места в Италии». Поисковая система предоставит ранжированный список интернет-ресурсов, которые потенциально являются релевантными по отношению к поисковому запросу. Пользователь далее может просматривать ранжированный список результатов поиска для того, чтобы получить информацию, в которой он заинтересован, в данном случае - о посещаемых местах в Италии. Если пользователь по какой-либо причине не удовлетворен представленными результатами, пользователь может произвести вторичный поиск, уточнив запрос, например, «наиболее популярные места в Италии летом», «наиболее популярные места на юге Италии», «Наиболее популярные места в Италии для романтичного отдыха».

[005] Существует и другой подход, в котором пользователю предоставляется возможность обнаруживать содержимое и, конкретнее, позволяется отображать и/или рекомендовать содержимое, в поиске которого пользователь не был явно заинтересован. В некотором смысле, подобные системы рекомендуют пользователю содержимое без отдельного поискового запроса, на основе явных или неявных интересов пользователя.

[006] Примерами таких систем являются система рекомендаций FLIPBOARD, которая агрегирует и рекомендует содержимое из различных социальных сетей. Система рекомендаций FLIPBOARD предоставляет содержимое в «журнальном формате», где пользователь может «пролистывать» страницы с рекомендуемым/агрегированным содержимым. Системы рекомендаций собирают содержимое из социальных медиа и других веб-сайтах, представляют его в журнальном формате и позволяют пользователям «пролистывать» ленты социальных новостей и ленты веб-сайтов, которые поддерживают партнерские отношения с компанией, что позволяет эффективно «рекомендовать» содержимое пользователю, даже если пользователь явно не выражал свой интерес в конкретном содержимом.

[007] Для создания ранжированных результатов поиска в поисковой системе или списка рекомендуемых ресурсов в обычной системе рекомендаций, соответствующие системы используют алгоритмы машинного обучения для выбора результатов поиска и/или рекомендаций содержимого. Существуют различные алгоритмы машинного обучения, известные в данной области техники, и использующиеся в поисковых системах и системах рекомендаций. Как известно, обычные алгоритмы машинного обучения сначала «обучаются» с помощью обучающей выборки (которая является помеченной или не помеченной) для создания формулы алгоритма машинного обучения, которая далее применяется для определения во время работы выходных данных на основе входных данных системы.

[008] В обычной системе рекомендаций, алгоритм машинного обучения системы рекомендаций выбирает набор потенциальных рекомендуемых элементов из набора потенциальных ресурсов для рекомендуемых элементов. Обычно, алгоритм машинного обучения, который связан с подобной системой рекомендаций, получает (в течение некоторого времени) знания о различных потенциальных ресурсах элементов содержимого, предыдущие взаимодействия пользователя с различными потенциальными ресурсами элементов содержимого (а также созданные рекомендации), и использует это знание для создания рекомендации для конкретного пользователя системы рекомендаций.

Раскрытие

[009] Задачей предлагаемого технического решения является устранение по меньшей мере некоторых недостатков, присущих известному уровню техники.

[0010] Варианты осуществления настоящего технического решения были разработаны на основе предположения изобретателей о том, что алгоритмы машинного обучения, используемые для выбора рекомендаций содержимого, потребляют очень много вычислительных ресурсов компьютера. Тем не менее, система рекомендаций требует, чтобы рекомендации содержимого выводились достаточно быстро, когда пользователь системы рекомендаций запрашивает рекомендации содержимого. Другими словами, разработчики настоящего технического решения обратили внимание, что может быть, желательно, переместить конкретные задачи системы рекомендаций из реального времени в оффлайн, т.е. выполнять их до того, как пользователь системы рекомендаций запросил рекомендуемое содержимое.

[0011] Далее, разработчики настоящего технического решения полагают, что объем потенциальных рекомендуемых источников содержимого достаточно велик. Анализ всех потенциальных рекомендуемых источников содержимого может занимать достаточно много времени и требовать значительных вычислительных ресурсов. Таким образом, разработчики настоящего технического решения старались разработать способ и систему, которая заранее классифицирует потенциальные источники рекомендаций содержимого. Технический эффект от подобной предварительной классификации может быть двухсторонним. С одной стороны, предварительная классификация потенциальных источников может выполняться оффлайн. С другой стороны, данные о профиле источника содержимого могут быть использованы в новых областях, что потребует предварительной классификации большого числа потенциальных рекомендуемых источников содержимого. Варианты осуществления настоящего технического решения основаны на предположении разработчиков о том, что некоторые сетевые источники лучше подходят в качестве источников рекомендации. Не ограничиваясь какой-либо конкретной теорией, разработчики настоящего технического решения разработали системы и способы, которые предварительно классифицируют сетевые ресурсы как «потенциальные источники содержимого» (на основе профиля сетевого ресурса), система использует алгоритм машинного обучения, который присваивает больший весовой коэффициент тем сетевым ресурсам, которые обладают «быстрым» содержимым, т.е. содержимым, которое часто обновляется. Сетевые ресурсы могут быть (без установления ограничений) новостными агрегаторами, агрегаторами СМИ и так далее.

[0012] Другие варианты осуществления настоящего технического решения нацелены на разработку рекомендуемых источников содержимого для данного пользователя системы рекомендаций. Эти варианты осуществления настоящего технического решения анализируют конкретные для пользователя связанные с пользователем источники рекомендаций содержимого (т.е. источники, с которыми данный пользователь взаимодействовал в прошлом) и обогащает их источниками содержимого, с которыми пользователь мог не взаимодействовать в прошлом. Таким образом, некоторые варианты осуществления настоящего технического решения позволяют системе рекомендаций смешивать рекомендованное содержимое из известных данному пользователю источников и неизвестных источников, что позволяет системе рекомендаций «открывать» новые источники рекомендованного содержимого для данного пользователя.

[0013] Первым объектом настоящего технического решения является способ выбора сетевого ресурса в качестве источника элемента содержимого, элемент содержимого будет проанализирован системой рекомендаций как часть множества элементов содержимого для создания набора рекомендуемых элементов содержимого в качестве рекомендации для данного пользователя системы рекомендации. Система рекомендаций выполняется на сервере, который соединен с сетью передачи данных. Способ включает в себя: получение сервером указания на сетевой ресурс; получение сервером множества характеристик, связанных с сетевым ресурсом; создание сервером профиля данного сетевого ресурса для сетевого ресурса, профиль данного сетевого ресурса основан на множестве характеристик; выполнение сервером алгоритма машинного обучения для того чтобы, на основании профиля данного сетевого ресурса, определить параметр пригодности источника для сетевого ресурса, параметр пригодности источника указывает на чувствительность сетевого ресурса к публикации элемента содержимого, который может быть обработан системой рекомендаций, выбор по меньшей мере одного элемента содержимого с сетевого ресурса, если параметр пригодности источника определен как превышающий заранее определенный порог, по меньшей мере один элемент содержимого вводится в систему рекомендаций для обработки.

[0014] В некоторых вариантах осуществления способа, алгоритм машинного обучения был обучен, до упомянутого этапа получения, для определения параметра пригодности источника на основе профилей обучающего веб-сайта, созданных в связи со множеством обучающих характеристик, причем по меньшей некоторые из них относятся к той же категории, что и множество характеристик.

[0015] В некоторых вариантах осуществления способа, множество характеристик включает в себя по меньшей мере абсолютную характеристику и относительную характеристику.

[0016] В некоторых вариантах осуществления способа, абсолютная характеристика и относительная характеристика являются базовыми характеристиками, и способ дополнительно включает в себя:

[0017] создание по меньшей мере одной производной характеристики на основе по меньшей мере абсолютной характеристики и относительной характеристики; и

[0018] при этом профиль данного веб-сайта дополнительно основан по меньшей мере на одной производной характеристике.

[0019] В некоторых вариантах осуществления способа, множество характеристик включает в себя указание на долю посещенных ресурсов по отношению к сетевому ресурсу.

[0020] В некоторых вариантах осуществления способа, множество характеристик включает в себя по меньшей мере одну относительную характеристику, выбранную из следующего:

[0021] количество хитов за визит (HPV);

[0022] количество сессий за визит (SPV);

[0023] количество датированных страниц за визит (DPV);

[0024] количество домашних страниц за визит (MPV);

[0025] время, проведенное на сетевом ресурсе (MTIME);

[0026] последний домен за сессию (LPS);

[0027] первый домен за сессию (FPS);

[0028] количество хитов за сессию (HPS);

[0029] количество визитов на пользователя (VPU);

[0030] количество хитов на пользователя (HPU);

[0031] количество сессий на пользователя (SPU);

[0032] количество датированных страниц за хит (DPH);

[0033] количество домашних страниц за хит (МРН); и

[0034] указание на источник визита, который является одним из:

[0035] визитом пользователя на сайт напрямую (TT_GR);

[0036] визитом пользователя на сайт через поисковую систему (TT_SE);

[0037] визитом пользователя на сайт через социальную сеть (TT_SN);

[0038] визитом пользователя на сайт через электронное сообщение (TT_IM);

[0039] визитом пользователя на сайт, совершенным с помощью сервиса сокращения ссылок (TT_US); и

[0040] визитом пользователя на сайт, совершенным с помощью рекламной платформы (TT_AD).

[0041] В некоторых вариантах осуществления способа, множество характеристик включает в себя по меньшей одно из: число пользователей, которые посещают сетевой ресурс за период времени, число визитов за период времени, число переходов к различным веб-страницам в рамках сетевого ресурса за период времени, и число уникальных сессий с сетевым ресурсом за период времени.

[0042] В некоторых вариантах осуществления способа, множество характеристик является подмножеством всех возможных характеристик, способ дополнительно включает в себя выполнение выбора характеристики для определения подмножества.

[0043] В некоторых вариантах осуществления способа, подмножество всех возможных характеристик состоит из:

[0044] по меньшей мере одного из: доли целевой страницы среди визитов сетевого ресурса в рамках первоначального перехода к сетевому ресурсу в рамках сессии и доли визитов целевой страницы за время переходов внутри сетевого ресурса;

[0045] по меньшей мере одного из: доли веб-страницы, связанной с URL, который содержит дату, когда первая страница была посещена за первый переход на сетевой ресурс, и доли веб-страниц в сетевом ресурсе, посещенном за время сессии, веб-страницы связаны с URL, который содержит дату;

[0046] долевой профиль источников визита для сетевого ресурса, источники визита выбираются из: поисковой системы/социальных сетей/электронной почты и приложения мессенджера/сервиса сокращения ссылок /прямых визитов;

[0047] доля сессии, где сетевой ресурс был последним в сессии.

[0048] В некоторых вариантах осуществления способа, параметр пригодности источника может быть пригодным или непригодным.

[0049] В некоторых вариантах осуществления способа, параметр пригодности источника может определяться с помощью по меньшей мере одного из:

[0050] логистического регрессионного анализа;

[0051] упрощенного алгоритма Байеса;

[0052] алгоритма k-ближайших соседей;

[0053] алгоритма случайного леса; и

[0054] алгоритма невзвешенного голосования.

[0055] В некоторых вариантах осуществления способа, упомянутый этап выбора выполняется в ответ на запрос рекомендации от данного пользователя.

[0056] Еще одним объектом настоящего технического решения является сервер. Сервер включает в себя:

[0057] носитель данных;

[0058] сетевой интерфейс, выполненный с возможностью соединения по сети передачи данных;

[0059] процессор, функционально соединенный с носителем данных и сетевым интерфейсом, процессор выполнен с возможностью осуществлять:

[0060] получение указания на сетевой ресурс, сетевой ресурс будет обработан для определения его пригодности в качестве источника элемента содержимого, элемент содержимого будет проанализирован системой рекомендаций как часть множества элементов содержимого для создания набора рекомендуемых элементов содержимого в качестве рекомендации для данного пользователя системы рекомендации;

[0061] получение множества характеристик, связанных с сетевым ресурсом;

[0062] создание профиля данного сетевого ресурса для сетевого ресурса, профиль данного сетевого ресурса основан на множестве характеристик;

[0063] выполнение сервером алгоритма машинного обучения для того чтобы, на основании профиля данного сетевого ресурса, определить параметр пригодности источника для сетевого ресурса, параметр пригодности источника указывает на чувствительность сетевого ресурса к публикации элемента содержимого, который может быть обработан системой рекомендаций,

[0064] выбор по меньшей мере одного элемента содержимого с сетевого ресурса, если параметр пригодности источника определен как превышающий заранее определенный порог, по меньшей мере один элемент содержимого вводится в систему рекомендаций для обработки.

[0065] В некоторых вариантах осуществления сервера, алгоритм машинного обучения был обучен, до упомянутого этапа получения, для определения параметра пригодности источника на основе профилей обучающего веб-сайта, созданных в связи со множеством обучающих характеристик, причем по меньшей некоторые из них относятся к той же категории, что и множество характеристик.

[0066] В некоторых вариантах осуществления сервера, множество характеристик включает в себя по меньшей мере абсолютную характеристику и относительную характеристику.

[0067] В некоторых вариантах осуществления сервера, абсолютная характеристика и относительная характеристика являются базовыми характеристиками, и процессор выполнен с возможностью осуществлять:

[0068] создание по меньшей мере одной производной характеристики на основе по меньшей мере абсолютной характеристики и относительной характеристики; и

[0069] при этом профиль данного веб-сайта дополнительно основан по меньшей мере на одной производной характеристике.

[0070] В некоторых вариантах осуществления сервера, множество характеристик включает в себя указание на долю посещенных ресурсов по отношению к сетевому ресурсу.

[0071] В некоторых вариантах осуществления сервера, множество характеристик включает в себя по меньшей мере одну относительную характеристику, выбранную из следующего:

[0072] количество хитов за визит (HPV);

[0073] количество сессий за визит (SPV);

[0074] количество датированных страниц за визит (DPV);

[0075] количество домашних страниц за визит (MPV);

[0076] время, проведенное на сетевом ресурсе (MTIME);

[0077] последний домен за сессию (LPS);

[0078] первый домен за сессию (FPS);

[0079] количество хитов за сессию (HPS);

[0080] количество визитов на пользователя (VPU);

[0081] количество хитов на пользователя (HPU);

[0082] количество сессий на пользователя (SPU);

[0083] количество датированных страниц за хит (DPH);

[0084] количество домашних страниц за хит (МРН); и

[0085] указание на источник визита, который является одним из:

[0086] визитом пользователя на сайт напрямую (TT_GR);

[0087] визитом пользователя на сайт через поисковую систему (TT_SE);

[0088] визитом пользователя на сайт через социальную сеть (TT_SN);

[0089] визитом пользователя на сайт через электронное сообщение (TT_IM);

[0090] визитом пользователя на сайт, совершенным с помощью сервиса сокращения ссылок (TT_US); и

[0091] визитом пользователя на сайт, совершенным с помощью рекламной платформы (TT_AD).

[0092] В некоторых вариантах осуществления сервера, множество характеристик включает в себя по меньшей одно из: число пользователей, которые посещают сетевой ресурс за период времени, число визитов за период времени, число переходов к различным веб-страницам в рамках сетевого ресурса за период времени и число уникальных сессий с сетевым ресурсом за период времени.

[0093] В некоторых вариантах осуществления сервера, множество характеристик является подмножеством всех возможных характеристик, способ дополнительно включает в себя выполнение выбора характеристики для определения подмножества.

[0094] В некоторых вариантах осуществления сервера, подмножество всех возможных характеристик состоит из:

[0095] по меньшей мере одного из: доли целевой страницы среди визитов сетевого ресурса в рамках первоначального перехода к сетевому ресурсу в рамках сессии и доли визитов целевой страницы за время переходов внутри сетевого ресурса;

[0096] по меньшей мере одного из: доли веб-страницы, связанной с URL, который содержит дату, когда первая страница была посещена за первый переход на сетевой ресурс, и доли веб-страниц в сетевом ресурсе, посещенном за время сессии, веб-страницы связаны с URL, который содержит дату;

[0097] долевой профиль источников визита для сетевого ресурса, источники визита выбираются из: поисковой системы/социальных сетей/электронной почты и приложения мессенжера/URL/прямых визитов;

[0098] доля сессии, где сетевой ресурс был последним в сессии.

[0099] В некоторых вариантах осуществления сервера, параметр пригодности источника может быть пригодным или непригодным.

[00100] В некоторых вариантах осуществления сервера, параметр пригодности источника может определяться с помощью по меньшей мере одного из:

[00101] логистического регрессионного анализа;

[00102] упрощенного алгоритма Байеса;

[00103] алгоритма k-ближайших соседей;

[00104] алгоритма случайного леса; и

[00105] алгоритма невзвешенного голосования.

[00106] В некоторых вариантах осуществления сервера, процессор выполнен с возможностью выполнить осуществление выбора в ответ на запрос рекомендации от данного пользователя.

[00107] Еще одним объектом настоящего изобретения является исполняемый на компьютере способ создания рекомендаций содержимого для пользователя электронного устройства. Способ выполняется на рекомендательном сервере, который доступен электронному устройству через сеть передачи данных, рекомендации содержимого связаны с элементом содержимого, доступном на одном из множества сетевых ресурсов, которые доступны через сеть передачи данных. Способ включает в себя: получение от электронного устройства запроса на рекомендацию содержимого, рекомендация содержимого включает в себя по меньшей мере один рекомендуемый элемент содержимого; выполнение модуля первого алгоритма машинного обучения для определения подмножества рекомендуемых источников содержимого из множества возможных источников содержимого, определение подмножества рекомендуемых источников содержимого, включая: получение указания на предыдущие взаимодействия пользователя по меньшей мере с одним из: (i) системой рекомендаций и (ii) по меньшей мере некоторыми из множества сетевых ресурсов; на основе предыдущих взаимодействий пользователя, определение первого подмножества связанных с пользователем источников содержимого; на основе (i) обученной формулы алгоритма машинного обучения других взаимодействий пользователя по меньшей мере с некоторыми другими из множества сетевых ресурсов и по меньшей мере одним из: (ii) первого подмножества конкретных для пользователя источников содержимого; и (iii) вектора пользовательского профиля, созданного на основе предыдущих взаимодействий пользователя, создание второго подмножества не связанных с пользователем источников содержимого; обработка первого подмножества связанных с пользователем источников содержимого и второго подмножества не связанных с пользователем источников содержимого для создания подмножества рекомендуемых источников содержимого; анализ подмножества рекомендуемых источников содержимого для выбора множества элементов потенциально рекомендуемого содержимого; выполнение модуля второго алгоритма машинного обучения для выбора, из множества элементов потенциально рекомендуемого содержимого, по меньшей мере одного элемента рекомендаций содержимого; выбор производится на основе вектора пользовательского профиля.

[00108] В некоторых вариантах осуществления способа, определение второго подмножества не связанных с пользователем источников содержимого включает в себя применение алгоритма сингулярного разложения (SVD).

[00109] В некоторых вариантах осуществления способа, определение второго подмножества не связанных с пользователем источников содержимого основано на:

[00110] (i) обученной формуле алгоритма машинного обучения других взаимодействий пользователя по меньшей мере с некоторыми другими из множества сетевых ресурсов; и

[00111] (ii) векторе пользовательского профиля созданном на основе предыдущих взаимодействий пользователя.

[00112] В некоторых вариантах осуществления способа, способ дополнительно включает в себя, до получения запроса на рекомендацию содержимого, создание алгоритмом сингулярного разложения матрицы событий и пользователей сетевых ресурсов.

[00113] В некоторых вариантах осуществления способа, определение второго подмножества не связанных с пользователем источников содержимого включает в себя применение алгоритма точечной взаимной информации (PMI).

[00114] В некоторых вариантах осуществления способа, определение второго подмножества не связанных с пользователем источников содержимого основано на:

[00115] (i) обученной формуле алгоритма машинного обучения других взаимодействий пользователя по меньшей мере с некоторыми другими из множества сетевых ресурсов; и

[00116] (ii) первом подмножестве связанных с пользователем источников содержимого.

[00117] В некоторых вариантах осуществления способа, выбор из подмножества рекомендуемых источников содержимого множества потенциально рекомендуемых элементов содержимого включает в себя определение заранее определенного числа самых новых элементов содержимого.

[00118] В некоторых вариантах осуществления способа, выбор из подмножества рекомендуемых источников содержимого множества потенциально рекомендуемых элементов содержимого включает в себя определение заранее определенного числа самых популярных элементов содержимого.

[00119] В некоторых вариантах осуществления способа, выбор из подмножества рекомендуемых источников содержимого конкретен для географической области, где был выполнен запрос на рекомендуемое содержимое.

[00120] В некоторых вариантах осуществления способа, способ дополнительно включает в себя фильтрацию выбранных потенциально рекомендуемых элементов содержимого.

[00121] В некоторых вариантах осуществления способа, фильтрация основана на языковых настройках электронного устройства и языковых настройках элемента содержимого.

[00122] Еще одним объектом настоящего технического решения является сервер. Сервер включает в себя: носитель данных; сетевой интерфейс, выполненный с возможностью передачи данных по сети передачи данных; процессор, функционально подключенный к носителю данных и сетевому интерфейсу, процессор выполнен с возможностью осуществлять: получение от электронного устройства запроса на рекомендацию содержимого, рекомендация содержимого включает в себя по меньшей мере один рекомендуемый элемент содержимого; рекомендации содержимого связаны с элементом содержимого, доступном на одном из множества сетевых ресурсов, которые доступны через сеть передачи данных; выполнение модуля первого алгоритма машинного обучения для определения подмножества рекомендуемых источников содержимого из множества возможных источников содержимого, определение подмножества рекомендуемых источников содержимого, включая: получение указания на предыдущие взаимодействия пользователя по меньшей мере с одним из: (i) системой рекомендаций и (ii) по меньшей мере некоторыми из множества сетевых ресурсов; на основе предыдущих взаимодействий пользователя, определение первого подмножества связанных с пользователем источников содержимого; на основе (i) обученной формулы алгоритма машинного обучения других взаимодействий пользователя по меньшей мере с некоторыми другими из множества сетевых ресурсов и по меньшей мере одним из: (ii) первого подмножества связанных с пользователем источников содержимого; и (iii) вектора пользовательского профиля, созданного на основе предыдущих взаимодействий пользователя, создание второго подмножества не связанных с пользователем источников содержимого; обработка первого подмножества связанных с пользователем источников содержимого и второго подмножества не связанных с пользователем источников содержимого для создания подмножества рекомендуемых источников содержимого; анализ подмножества рекомендуемых источников содержимого для выбора множества элементов потенциально рекомендуемого содержимого; выполнение модуля второго алгоритма машинного обучения для выбора, из множества элементов потенциально рекомендуемого содержимого, по меньшей мере одного элемента рекомендаций содержимого; выбор производится на основе вектора пользовательского профиля.

[00123] В некоторых вариантах осуществления сервера, для определения второго подмножества связанных с пользователем источников содержимого, процессор выполнен с возможностью применять алгоритм сингулярного разложения (SVD).

[00124] В некоторых вариантах осуществления сервера, определение второго подмножества не связанных с пользователем источников содержимого основано на:

[00125] (i) обученной формуле алгоритма машинного обучения других взаимодействий пользователя по меньшей мере с некоторыми другими из множества сетевых ресурсов; и

[00126] (ii) векторе пользовательского профиля созданном на основе предыдущих взаимодействий пользователя.

[00127] В некоторых вариантах осуществления сервера, сервер дополнительно выполнен с возможностью, до этапа получения запроса на рекомендацию содержимого, осуществлять создание, с помощью алгоритма сингулярного разложения, матрицы событий и пользователей сетевых ресурсов.

[00128] В некоторых вариантах осуществления сервера, для определения второго подмножества не связанных с пользователем источников содержимого, процессор выполнен с возможностью применять алгоритм точечной взаимной информации (PMI).

[00129] В некоторых вариантах осуществления сервера, определение второго подмножества не связанных с пользователем источников содержимого основано на:

[00130] (i) обученной формуле алгоритма машинного обучения других взаимодействий пользователя по меньшей мере с некоторыми другими из множества сетевых ресурсов; и

[00131] (ii) первом подмножестве связанных с пользователя источников содержимого.

[00132] В некоторых вариантах осуществления сервера, выбор из подмножества рекомендуемых источников содержимого множества потенциально рекомендуемых элементов содержимого включает в себя определение заранее определенного числа самых новых элементов содержимого.

[00133] В некоторых вариантах осуществления сервера, выбор из подмножества рекомендуемых источников содержимого множества потенциально рекомендуемых элементов содержимого включает в себя определение заранее определенного числа самых популярных элементов содержимого.

[00134] В некоторых вариантах осуществления сервера, выбор из подмножества рекомендуемых источников содержимого конкретен для географической области, где был выполнен запрос на рекомендуемое содержимое.

[00135] В некоторых вариантах осуществления сервера, процессор дополнительно выполнен с возможностью осуществлять фильтрацию выбранных потенциально рекомендуемых элементов содержимого.

[00136] В некоторых вариантах осуществления сервера, фильтрация основана на языковых настройках электронного устройства и языковых настройках элемента содержимого.

[00137] В контексте настоящего описания «сервер» подразумевает под собой компьютерную программу, работающую на соответствующем оборудовании, которая способна получать запросы (например, от клиентских устройств) по сети и выполнять эти запросы или инициировать выполнение этих запросов. Оборудование может представлять собой один физический компьютер или одну физическую компьютерную систему, но ни то, ни другое не является обязательным для настоящего технического решения. В контексте настоящего технического решения использование выражения «сервер» не означает, что каждая задача (например, полученные команды или запросы) или какая-либо конкретная задача будет получена, выполнена или инициирована к выполнению одним и тем же сервером (то есть одним и тем же программным обеспечением и/или аппаратным обеспечением); это означает, что любое количество элементов программного обеспечения или аппаратных устройств может быть вовлечено в прием/передачу, выполнение или инициирование выполнения любого запроса или последствия любого запроса, связанного с клиентским устройством, и все это программное и аппаратное обеспечение может быть одним сервером или несколькими серверами, оба варианта включены в выражение «по меньшей мере один сервер».

[00138] В контексте настоящего описания «клиентское устройство» подразумевает под собой аппаратное устройство, способное работать с программным обеспечением, подходящим к решению соответствующей задачи. Таким образом, примерами клиентских устройств (среди прочего) могут служить персональные компьютеры (настольные компьютеры, ноутбуки, нетбуки и т.п.) смартфоны, планшеты, а также сетевое оборудование, такое как маршрутизаторы, коммутаторы и шлюзы. Следует иметь в виду, что устройство, ведущее себя как клиентское устройство в настоящем контексте, может вести себя как сервер по отношению к другим клиентским устройствам. Использование выражения «клиентское устройство» не исключает возможности использования множества клиентских устройств для получения/отправки, выполнения или инициирования выполнения любой задачи или запроса, или же последствий любой задачи или запроса, или же этапов любого вышеописанного способа.

[00139] В контексте настоящего описания «база данных» подразумевает под собой любой структурированный набор данных, не зависящий от конкретной структуры, программного обеспечения по управлению базой данных, аппаратного обеспечения компьютера, на котором данные хранятся, используются или иным образом оказываются доступны для использования. База данных может находиться на том же оборудовании, выполняющем процесс, который сохраняет или использует информацию, хранящуюся в базе данных, или же она может находиться на отдельном оборудовании, например, выделенном сервере или множестве серверов.

[00140] В контексте настоящего описания «информация» включает в себя любую информацию, которая может храниться в базе данных. Таким образом, информация включает в себя, среди прочего, аудиовизуальные произведения (изображения, видео, звукозаписи, презентации и т.д.), данные (данные о местоположении, цифровые данные и т.д.), текст (мнения, комментарии, вопросы, сообщения и т.д.), документы, таблицы, списки слов и т.д.

[00141] В контексте настоящего описания «компонент» подразумевает под собой программное обеспечение (соответствующее конкретному аппаратному контексту), которое является необходимым и достаточным для выполнения конкретной(ых) указанной(ых) функции(й).

[00142] В контексте настоящего описания «используемый компьютером носитель компьютерной информации» подразумевает под собой носитель абсолютно любого типа и характера, включая ОЗУ, ПЗУ, диски (компакт диски, DVD-диски, дискеты, жесткие диски и т.д.), USB флеш-накопители, твердотельные накопители, накопители на магнитной ленте и т.д.

[00143] В контексте настоящего описания слова «первый», «второй», «третий» и т.д. используются в виде прилагательных исключительно для того, чтобы отличать существительные, к которым они относятся, друг от друга, а не для целей описания какой-либо конкретной взаимосвязи между этими существительными. Так, например, следует иметь в виду, что использование терминов «первый сервер» и «третий сервер» не подразумевает какого-либо порядка, отнесения к определенному типу, хронологии, иерархии или ранжирования (например) серверов/между серверами, равно как и их использование (само по себе) не предполагает, что некий "второй сервер" обязательно должен существовать в той или иной ситуации. В дальнейшем, как указано здесь в других контекстах, упоминание «первого» элемента и «второго» элемента не исключает возможности того, что это один и тот же фактический реальный элемент. Так, например, в некоторых случаях, «первый» сервер и «второй» сервер могут являться одним и тем же программным и/или аппаратным обеспечением, а в других случаях они могут являться разным программным и/или аппаратным обеспечением.

[00144] Каждый вариант осуществления настоящего технического решения преследует по меньшей мере одну из вышеупомянутых целей и/или объектов. Следует иметь в виду, что некоторые объекты настоящего технического решения, полученные в результате попыток достичь вышеупомянутой цели, могут удовлетворять другим целям, отдельно не указанным здесь.

[00145] Дополнительные и/или альтернативные характеристики, аспекты и преимущества вариантов осуществления настоящего технического решения станут очевидными из последующего описания, прилагаемых чертежей и прилагаемой формулы изобретения.

Краткое описание чертежей

[00146] Для лучшего понимания настоящего технического решения, а также других его аспектов и характерных черт сделана ссылка на следующее описание, которое должно использоваться в сочетании с прилагаемыми чертежами, где:

[00147] На Фиг. 1 представлена система, подходящая для реализации неограничивающих вариантов осуществления настоящего технического решения.

[00148] На Фиг. 2 представлен снимок экрана с рекомендательным интерфейсом, выполненным в соответствии с неограничивающим вариантом осуществления настоящего технического решения, рекомендательный интерфейс представлен на экране электронного устройства системы, показанной на Фиг. 1, электронное устройство выполнено в виде смартфона.

[00149] На Фиг. 3 представлен другой вариант осуществления системы, реализованной в соответствии с еще одним неограничивающим вариантом осуществления настоящего технического решения.

[00150] На Фиг. 4 представлена блок-схема способа, реализованного в соответствии с неограничивающими вариантами осуществления настоящего технического решения, и выполняемого в рамках системы, представленной на Фиг. 1.

[00151] На Фиг. 5 представлена блок-схема способа 800, реализованного в соответствии с другим неограничивающим вариантом осуществления настоящего технического решения и выполняемого в рамках системы 300, представленной на Фиг. 3.

Осуществление

[00152] На Фиг. 1 представлена принципиальная схема системы 100, выполненной в соответствии с вариантами осуществления настоящего технического решения, не ограничивающими его объем. Важно иметь в виду, что нижеследующее описание системы 100 представляет собой описание показательных вариантов осуществления настоящего технического решения. Таким образом, все последующее описание представлено только как описание иллюстративного примера настоящего технического решения. Это описание не предназначено для определения объема или установления границ настоящего технического решения. Некоторые полезные примеры модификаций системы 100 также могут быть охвачены нижеследующим описанием. Целью этого является также исключительно помощь в понимании, а не определение объема и границ настоящего технического решения. Эти модификации не представляют собой исчерпывающий список, и специалистам в данной области техники будет понятно, что возможны и другие модификации. Кроме того, это не должно интерпретироваться так, что там, где не были изложены примеры модификаций, никакие модификации невозможны, и/или что то, что описано, является единственным вариантом осуществления этого элемента настоящего технического решения. Как будет понятно специалисту в данной области техники, это, скорее всего, не так. Кроме того, следует иметь в виду, что система 100 представляет собой в некоторых конкретных проявлениях достаточно простой вариант осуществления настоящего технического решения, и в подобных случаях представлен здесь с целью облегчения понимания. Как будет понятно специалисту в данной области техники, многие варианты осуществления настоящего технического решения будут обладать гораздо большей сложностью.

[00153] В общем случае, система 100 выполнена с возможностью предоставлять рекомендации содержимого пользователю 102 системы 100. Пользователь 102 может являться подписчиком сервиса рекомендаций, который предоставляет система 100. Однако, подписка не обязана быть оплачиваемой или явной. Например, пользователь 102 может стать подписчиком путем скачивания рекомендательного предложения из системы 100, путем регистрации и предоставления сочетания логина/пароля, путем регистрации и предоставления предпочтений пользователя и так далее. Поэтому любой вариант системы, выполненный с возможностью создавать рекомендации содержимого для данного пользователя, может быть адаптирован специалистом для выполнения вариантов осуществления настоящего технического решения после того, как специалистом было прочитано настоящее описание. Кроме того, система 100 может быть описана с помощью примера системы 100, которая является системой рекомендаций (следовательно, система 100 может упоминаться как «система 100 рекомендаций» или «система 100 предсказаний» или «система 100 обучения»). Тем не менее, варианты осуществления настоящего технического решения могут также применяться к другим типам систем 100, как будет более подробно описано далее.

[00154] Система 100 содержит электронное устройство 104, электронное устройство 104 связано с пользователем 102. Таким образом, электронное устройство 104 может иногда упоминаться как «клиентское устройство», «устройство конечного пользователя» или «клиентское электронное устройство». Следует отметить, что тот факт, что электронное устройство 104 связано с пользователем 102, не подразумевает какого-либо конкретного режима работы, равно как и необходимости входа в систему, быть зарегистрированным, или чего-либо подобного.

[00155] Варианты осуществления электронного устройства 104 конкретно не ограничены, но в качестве примера электронного устройства 104 могут использоваться персональные компьютеры (настольные компьютеры, ноутбуки, нетбуки и т.п.), устройства беспроводной связи (смартфоны, мобильные телефоны, планшеты и т.п.), а также сетевое оборудование (маршрутизаторы, коммутаторы или шлюзы). Электронное устройство 104 содержит аппаратное и/или прикладное программное, и/или системное программное обеспечение (или их комбинацию), как известно в области техники, чтобы выполнять рекомендательное приложение 106. В общем случае, задачей рекомендательного приложения 106 является позволить пользователю получать (или каким-либо иным способом иметь доступ) к рекомендациям содержимого, которые предоставлены системой 100, как будет более подробно описано далее.

[00156] Реализация рекомендательного приложения 106 никак конкретно не ограничена. Одним из примеров выполнения рекомендательного приложения 106 является доступ пользователем на веб-сайт, соответствующий системе рекомендаций, для получения доступа к рекомендательному приложению 106. Например, рекомендательное приложение 106 может быть вызвано путем ввода (или копирования-вставки или выбора ссылки) URL, связанного с сервисом рекомендаций. Альтернативно, рекомендательное приложение 106 может являться приложением, скачанным из так называемого магазина приложений, например, APPSTORE™ или GOOGLEPLAY™, и установленным/используемым на электронном устройстве 104. Важно иметь в виду, что рекомендательное приложение 106 может быть вызвано с помощью любых других средств.

[00157] В общем случае, рекомендательное приложение 106 включает в себя рекомендательный интерфейс 108, причем рекомендательный интерфейс 108 отображается на экране (отдельно не пронумерован) электронного устройства 104. На Фиг. 2 представлен снимок экрана с рекомендательным интерфейсом 108, реализованным в соответствии с неограничивающим вариантом осуществления настоящего технического решения (пример рекомендательного интерфейса 108 представлен на экране электронного устройства 104, который реализован в виде смартфона).

[00158] В некоторых вариантах осуществления настоящего технического решения, рекомендательный интерфейс 108 отображается, когда пользователь 102 электронного устройства 104 активирует (т.е. запускает, использует, запускает в фоновом режиме и так далее) рекомендательное приложение 106. Альтернативно, рекомендательный интерфейс 108 может быть представлен, когда пользователь 102 открывает новое окно браузера и/или активирует новую вкладку в браузерном приложении. Например, в некоторых вариантах осуществления настоящего технического решения, рекомендательный интерфейс 108 может активировать «домашний экран» в браузерном приложении.

[00159] Рекомендательный интерфейс 108 включает в себя поисковый интерфейс 202. Поисковый интерфейс 202 включает в себя интерфейс 204 поискового запроса. Интерфейс 204 поискового запроса может быть реализован как «омнибокс», что позволяет вводить поисковый запрос для проведения поиска или сетевой адрес (например, Единый Указатель Ресурсов (URL)) для идентификации ресурса (например, веб-сайта), который будет вызван. Тем не менее, интерфейс 204 поискового запроса может быть реализован для получения одного или обоих из: записи поискового запроса на выполнение поиска или сетевого адреса (например, Единый Указатель Ресурсов (URL)) для идентификации ресурса (например, веб-сайта), который будет вызван.

[00160] Рекомендательный интерфейс 108 дополнительно включает в себя интерфейс 206 ссылок. Интерфейс 206 ссылок включает в себя множество фрагментов 208 - восемь из которых представлены на Фиг. 2 - только два пронумерованы на Фиг. 2 - первый фрагмент 210 и второй фрагмент 212.

[00161] Используя, например, первый фрагмент 210 и второй фрагмент 212 - каждый из множества фрагментов 208 включает в себя (или действует как) ссылку на (i) веб-сайт, отмеченный как «избранное» или как-либо иначе отмеченный пользователем 102, (ii) ранее посещенный веб-сайт или (iii) тому подобное. Множество фрагментов 208 в представленном варианте осуществления визуально представлено пользователю 102 в виде квадратных кнопок с логотипом и/или названием представленного ресурса, логотип и название позволяют пользователю 102 идентифицировать, на какой ресурс ведет каждый из множества фрагментов (отдельно не пронумеровано). Тем не менее, важно иметь в виду, что визуальное представление некоторых или всех из множества фрагментов 208 может быть иным. Таким образом, некоторые или все из множества фрагментов 208 могут быть реализованы как кнопки других форм, как список гиперссылок и так далее.

[00162] Например, первый фрагмент 210 включает в себя ссылку на веб-сайт TRAVELZOO™, а второй фрагмент 212 включает в себя ссылку на веб-сайт персонального живого журнала. Излишне говорить, что число и содержимое индивидуальных фрагментов из множества фрагментов 208 никак конкретно не ограничено.

[00163] Например, число фрагментов во множестве фрагментов 208 может быть выбрано заранее поставщиком рекомендательного приложения 106. В некоторых вариантах осуществления настоящего технического решения, число фрагментов во множестве фрагментов 208 выбирается заранее на основе размера и/или разрешения экрана электронного устройства 104, которое выполняет рекомендательное приложение 106. Например, первое число фрагментов может быть выбрано заранее для электронного устройства 104, которое реализовано как смартфон, второе число фрагментов может быть выбрано заранее для электронного устройства 104, которое реализовано как планшет, и третье число фрагментов может быть выбрано заранее для электронного устройства 104, которое реализовано как ноутбук или настольный компьютер.

[00164] Рекомендательный интерфейс 108 дополнительно включает в себя набор 214 рекомендованного содержимого. Набор 214 рекомендованного содержимого включает в себя один или несколько элементов рекомендаций содержимого, например, первый элемент 216 рекомендаций содержимого и второй элемент 218 рекомендаций содержимого (второй элемент 218 рекомендаций содержимого только частично виден на Фиг. 2). Естественно, набор 214 рекомендаций содержимого может обладать большим числом элементов рекомендаций содержимого. В рамках варианта осуществления, представленного на Фиг. 2, и тех вариантов осуществления настоящего технического решения, где присутствует более одного элемента рекомендованного содержимого, пользователь 102 может прокручивать через набор 214 рекомендованного содержимого. Прокрутка может осуществляться любыми подходящими способами. Например, пользователь 102 может прокручивать содержимое набора 214 рекомендованного содержимого путем активации мыши (не показано), клавиши клавиатуры (не показано) или взаимодействия с сенсорным экраном (не показано) соответствующего электронного устройства 104.

[00165] Пример, приведенный на Фиг. 2 является одним возможным вариантом осуществления рекомендательного интерфейса 108.

[00166] То, как именно создается набор 214 рекомендованного содержимого, будет более подробно описано далее.

[00167] Возвращаясь к описанию Фиг. 1, электронное устройство 104 функционально соединено с сетью 110 передачи данных для получения доступа к рекомендательному серверу 112. В некоторых вариантах осуществления настоящего технического решения, не ограничивающих его объем, сеть 110 передачи данных может представлять собой Интернет. В других вариантах осуществления настоящего технического решения, сеть 110 передачи данных может быть реализована иначе - в виде глобальной сети передачи данных, локальной сети передачи данных, частной сети передачи данных и т.п. Линия передачи данных (отдельно не пронумерована) между электронным устройством 104 и сетью 110 передачи данных реализована таким образом, что она будет зависеть, среди прочего, от того, как реализовано электронное устройство 104. В качестве примера, но не ограничения, в данных вариантах осуществления настоящего технического решения в случаях, когда электронное устройство 104 представляет собой беспроводное устройство связи (например, смартфон), линия передачи данных представляет собой беспроводную сеть передачи данных (например, среди прочего, линия передачи данных 3G, линия передачи данных 4G, беспроводной интернет Wireless Fidelity или коротко WiFi®, Bluetooth® и т.п.). В тех примерах, где электронное устройство 104 представляет собой портативный компьютер, линия связи может быть как беспроводной (беспроводной интернет Wireless Fidelity или коротко WiFi®, Bluetooth® и т.п.), так и проводной (соединение на основе сети Ethernet).

[00168] Рекомендательный сервер 112 может представлять собой обычный компьютерный сервер. В примере варианта осуществления настоящего технического решения, рекомендательный сервер 112 может представлять собой сервер Dell™ PowerEdge™, на котором используется операционная система Microsoft™ Windows Server™. Излишне говорить, что рекомендательный сервер 112 может представлять собой любое другое подходящее аппаратное, прикладное программное, и/или системное программное обеспечение или их комбинацию. В представленном варианте осуществления настоящего технического решения, не ограничивающем его объем, рекомендательный сервер 112 является одиночным сервером. В других вариантах осуществления настоящего технического решения, не ограничивающих его объем, функциональность рекомендательного сервера 112 изображения может быть разделена, и может выполняться с помощью нескольких серверов.

[00169] Рекомендательный сервер 112 включает в себя модуль 114 обработки. Модуль 114 обработки соединен или иным образом имеет доступ к модулю 116 выбора источника содержимого. Модуль 116 выбора источника содержимого имеет доступ к устройству 118 хранения данных. Модуль 114 обработки дополнительно связан с модулем 115 выбора рекомендаций содержимого. Работа рекомендательного сервера 112 и его компонентов будет более подробно описана далее.

[00170] Также с сетью 110 передачи данных соединено множество сетевых ресурсов, включая первый сетевой ресурс 124, второй сетевой ресурс 126 и множество дополнительных сетевых ресурсов 128. Первый сетевой ресурс 124, второй сетевой ресурс 126 и множество дополнительных сетевых ресурсов 128 являются сетевыми ресурсами, доступными электронному устройству 104 (а также другим электронным устройствам, потенциально присутствующим в системе 100) через сеть 110 передачи данных. Соответствующее содержимое первого сетевого ресурса 124, второго сетевого ресурса 126 и множества дополнительных сетевых ресурсов 128 никак конкретно не ограничено. Данный один сетевой ресурс из первого сетевого ресурса 124, второго сетевого ресурса 126 и множества дополнительных сетевых ресурсов 128 может содержать (или, другими словами, включать в себя) цифровое содержимое, например: аудио содержимое для потоковой передачи, видео содержимое для потоковой передачи, новости, блоги, информацию о различных государственных институтах, информацию о точках интереса, тематически кластеризованное содержимое (например, содержимое, релевантное для тех, кто интересуется кикбоксингом) и так далее.

[00171] Содержимое потенциально «доступно» для электронного устройства 104 различными способами. Например, пользователь 102 электронного устройства 104 может использовать браузерное приложение (не показано) и ввести Универсальный Указатель Ресурса (URL), связанный с одним из первого сетевого ресурса 124, второго сетевого ресурса 126 и множества дополнительных сетевых ресурсов 128. Альтернативно, пользователь 102 электронного устройства 104 может выполнить поиск с помощью поисковой системы (не показано), чтобы изучить содержимое одного или нескольких из первого сетевого ресурса 124, второго сетевого ресурса 126 и множества дополнительных сетевых ресурсов 128. Как было упомянуто ранее, это удобно в том случае, если пользователь 102 заранее знает, в каком именно содержимом пользователь 102 заинтересован.

[00172] В соответствии с вариантами осуществления настоящего технического решения, рекомендательное приложение 106 может рекомендовать элементы содержимого, доступные с одного из первого сетевого ресурса 124, второго сетевого ресурса 126 и множества дополнительных сетевых ресурсов 128, пользователю 102, элементы содержимого, о которых пользователь 102 может заранее не знать. Рекомендательный сервер 112 выполнен с возможностью осуществлять выбор содержимого для одного или нескольких рекомендуемых элементов, которые будут представлены пользователю 102 через рекомендательное приложение 106. Конкретнее, модуль 114 обработки выполнен с возможностью (i) получать от электронного устройства 104 запрос на рекомендации 150 содержимого и (ii) в ответ на запрос, создавать сообщение 152 рекомендаций содержимого, специально настроенное для пользователя 102, связанного с электронным устройством 104. Модуль 114 обработки может дополнительно координировать выполнение различных процессов, описанных здесь как выполняемые одним из первого сетевого ресурса 124, второго сетевого ресурса 126 и множества дополнительных сетевых ресурсов 128, и модулем 116 выбора источника, например.

[00173] В некоторых вариантах осуществления настоящего технического решения, запрос на рекомендации 150 содержимого может быть создан в ответ на предоставление пользователем 102 явного указания на его/ее желание получать рекомендации содержимого. Например, рекомендательный интерфейс 108 может предоставлять кнопку (или другой активируемый элемент), который позволит пользователю 102 выражать свое желание получить новые или обновленные рекомендации содержимого. В качестве неограничивающего примера, рекомендательный интерфейс 108 может предоставить активируемую кнопку, на которой написано «запросить рекомендации содержимого». В рамках этих вариантов осуществления настоящего технического решения, запрос на рекомендации 150 содержимого может считаться «явным запросом» в том смысле, что пользователь 102 явно выражает запрос на рекомендации содержимого.

[00174] В других вариантах осуществления настоящего технического решения, запрос на рекомендации 150 содержимого может быть создан в ответ на явное указание от пользователя 102 на желание пользователя получить рекомендации содержимого. В некоторых вариантах осуществления настоящего технического решения, запрос на рекомендации 150 содержимого может быть создан в ответ на то, что пользователь 102 запускает рекомендательное приложение 106.

[00175] Альтернативно, в тех вариантах осуществления настоящего технического решения, где рекомендательное приложение 106 реализовано в виде браузера (например, браузер GOOGLE™, браузер YANDEX™, a YAHOO!™ браузер или любое другое собственное или коммерчески доступное браузерное приложение), запрос на рекомендации 150 содержимого может быть создан в ответ на то, что пользователь 102 открывает браузерное приложение и может быть создано, например, без выполнения пользователем 102 каких-либо действий, кроме активации браузерного приложения. В качестве другого примера, запрос на рекомендации 150 содержимого может быть создан в ответ на открытие пользователем 102 новой вкладки в уже открытом браузерном приложении, и могут быть созданы, например, без выполнения пользователем 102 каких-либо действий, кроме активации новой вкладки браузера. Другими словами, запрос на рекомендации 150 содержимого может быть создан даже без знания пользователя 102 о том, что он может быть заинтересован в получении рекомендации содержимого.

[00176] В качестве другого примера, запрос на рекомендацию 150 содержимого может быть создан в ответ на выбор пользователем 102 конкретного элемента браузерного приложения, и могут быть созданы, например, без выполнения пользователем 102 каких-либо действий, кроме активации/выбора конкретного элемента браузерного приложения.

[00177] Примеры конкретного элемента браузерного приложения включают в себя, без установления ограничений:

Адресную строку строки браузерного приложения;

Поисковую строку браузерного приложения и/или поисковую строку веб-сайта поисковой системы, доступного в браузерном приложении;

Омнибокс (связанные адрес и поисковая строка браузерного приложения)

Панель избранных или недавно посещенных сетевых ресурсов;

Любую другую заранее определенную область интерфейса браузерного приложения или сетевого ресурса, отображенного в браузерном приложении.

[00178] В некоторых вариантах осуществления настоящего технического решения, каждый из модуля 115 выбора рекомендаций содержимого и модуля 116 выбора источника содержимого может быть выполнен с возможностью выполнять их соответствующие один или несколько алгоритмов машинного обучения. В некоторых вариантах осуществления настоящего технического решения, один или несколько алгоритмов машинного обучения могут представлять собой любой подходящий алгоритм машинного обучения с учителем или полуконтролируемого обучения, такой как, например:

Искусственная нейронная сеть;

Байесовская статистика;

Гауссовский процесс регрессии;

Деревья решений;

И так далее.

[00179] Следует отметить, что соответствующий один или несколько алгоритмов машинного обучения, выполняемых модулем 115 выбора рекомендаций содержимого и модулем 116 выбора источника содержимого, не обязаны быть одинаковыми.

[00180] Несмотря на то, что модуль 115 выбора рекомендаций содержимого и модуль 116 выбора источника содержимого были описаны как отдельные элементы, каждый из которых выполняет соответствующий один или несколько алгоритмов машинного обучения, в других вариантах осуществления настоящего технического решения, один или несколько алгоритмов машинного обучения, соответственно выполняемых модулем 115 выбора рекомендаций содержимого и модулем 116 выбора источника содержимого, могут выполняться одним элементом (например, модулем 114 обработки). Альтернативно, один или несколько алгоритмов машинного обучения, соответственно выполняемых модулем 115 выбора рекомендаций содержимого и модулем 116 выбора источника содержимого, могут быть распределены между большим числом модулей, чем те, что показаны на Фиг. 1, и могут выполняться как часть нескольких экземпляров рекомендательного сервера 112.

[00181] Кроме того, каждый из модуля 115 выбора рекомендаций содержимого и модуля 116 выбора источника содержимого может выполнять дополнительные функции (т.е. отличные от соответствующего одного или нескольких алгоритмов машинного обучения).

[00182] Например, модуль 116 выбора источника содержимого может выполнять «функцию просмотра», которая может быть в широком смысле описана как функция просмотра новых сетевых ресурсов и/или нового содержимого, опубликованного на первом сетевом ресурсе 124, втором сетевом ресурсе 126 и дополнительных сетевых ресурсах 128. С этой целью, модуль 116 выбора источника содержимого выполнен с возможностью реализовать «поискового робота», который «посещает» различные сетевые ресурсы, доступные через сеть 110 передачи данных (включая первый сетевой ресурс 124, второй сетевой ресурс 126 и дополнительные сетевые ресурсы) для обнаружения и каталогизации новых доступных ресурсов (например, первого сетевого ресурса 124, второго сетевого ресурса 126 и дополнительных сетевых ресурсов) или нового опубликованного содержимого, доступного на первом сетевом ресурсе 124, втором сетевом ресурсе 126 и дополнительных сетевых ресурсах 128.

[00183] Как часть функции просмотра, модуль выбора источника содержимого выполнен с возможностью содержать (на устройстве 118 сохранения данных) информацию, представляющую новые найденные сетевые ресурсы и/или новое найденное доступное содержимое, доступное на них. В некоторых вариантах осуществления настоящего технического решения, модуль 116 выбора источника содержимого может быть выполнен с возможностью поддерживать инвертированный индекс на устройстве 118 хранения данных, но модуль 116 выбора источника содержимого может организовать информацию, представляющую новые найденные сетевые ресурсы и/или новое найденное содержимое, доступное на них, в структуру данных, отличную от инвертированного индекса.

[00184] Модуль 116 выбора источника содержимого может также собирать и поддерживать дополнительную информацию о доступных сетевых ресурсах и/или содержимом, доступном на этих сетевых ресурсах, например, первом сетевом ресурсе 124, втором сетевом ресурсе 126 и дополнительных сетевых ресурсах 128). Дополнительная информация может быть в общем случае связана с визитом (т.е. браузерной активностью данного пользователя с конкретным сетевым ресурсом), хитом (т.е. переходом данного пользователя на конкретный сетевой ресурс, с конкретного сетевого ресурса и между различными веб-страницами конкретного сетевого ресурса) или сессией (т.е. браузерной сессией конкретного пользователя, которая может включать в себя визиты на один или несколько сетевых ресурсов).

[00185] Некоторые примеры дополнительной информации, собранной о доступных ресурсах и/или доступном содержимом этих ресурсов, включают в себя (без установления ограничений):

количество хитов за визит (HPV) - сколько страниц в рамках данного сетевого ресурса посетил данный пользователь за время просмотра данного сетевого ресурса;

количество сессий за визит (SPV) - сколько сессий содержалось в визитах на конкретный сетевой ресурс;

количество датированных страниц за визит (DPV) - сколько страниц данного сетевого ресурса с датой в URL страницы данный пользователь посетил за время данного визита на данный сетевой ресурс;

количество домашних страниц за визит (MPV) - сколько раз за время данного визита данный пользователь посетил домашнюю страницу данного сетевого ресурса;

время, проведенное на сетевом ресурсе (MTIME) - сколько времени данный пользователь провел, просматривая данный сетевой ресурс;

последний домен за сессию (LPS) - является ли данный сетевой ресурс последним сетевым ресурсом в данной сессии веб-просмотра данного пользователя;

первый домен за сессию (FPS) - является ли данный сетевой ресурс первым сетевым ресурсом в данной сессии веб-просмотра данного пользователя;

количество хитов за сессию (HPS) - сколько страниц любых сетевых ресурсов данный пользователь посетил за данную сессию просмотра (т.е. сколько переходов было сделано за данную сессию);

количество визитов пользователя (VPU) - среднее число визитов на данный сетевой ресурс;

количество хитов на пользователя (HPU) - среднее число переходов между различными страницами данного сетевого ресурса (или, альтернативно, всех сетевых ресурсов);

количество сессий на пользователя (SPU) - среднее число сессий, которые включают в себя визиты на данный сетевой ресурс;

количество датированных страниц за хит (DPH) - сколько страниц данного сетевого ресурса с датой в URL страницы данный пользователь посетил за время данного визита на данный сетевой ресурс;

количество домашних страниц за хит (МРН) - сколько раз данный пользователь переходил на домашнюю страницу данного сетевого ресурса за визит на данный сетевой ресурс;

указание на источник перехода к данному сетевому ресурсу является одним из:

a) визитом пользователя на сайт напрямую (TT_GR);

b) визитом пользователя на сайт через поисковую систему (TT_SE);

c) визитом пользователя на сайт через социальную сеть (TT_SN);

d) визитом пользователя на сайт через электронное сообщение (ТТ_IM);

e) визитом пользователя на сайт, совершенным с помощью сервиса сокращения ссылок (TT_US);

f) визитом пользователя на сайт, совершенным с помощью рекламной платформы (TT_AD).

[00186] То, как модуль 116 выбора источника содержимого собирает дополнительную информацию, никак конкретно не ограничено. Например, некоторые источники дополнительной информации включают в себя (без установления ограничений): журналы

поисковой системы, журналы браузерного приложения, виджеты для отслеживания сетевого ресурса и так далее.

[00187] Например, модуль 116 выбора источника содержимого имеет доступ к журналу поисковой системы и получает информацию о том, получил ли данный пользователь доступ к данному сетевому ресурсу от поисковой системы. В другом примере, модуль 116 выбора источника содержимого может обладать доступом к журналам браузерного приложения, выполняемого на электронном устройстве 104, и получать указание (которое может быть анонимным с целью защиты конфиденциальности пользователя) в отношении данного пользователя 102: переход к данному сетевому ресурсу, переходы данного пользователя между различными страницами данного сетевого ресурса, информация о веб-страницах данного посещенного сетевого ресурса (например, URL, даты URL и так далее), проведенное время на различных веб-страницах данного сетевого ресурса, браузерные сессии пользователя и различные сетевые ресурсы, посещенные во время браузерной сессии, и так далее.

[00188] В качестве другого примера, множество доступных сетевых ресурсов устанавливает виджеты отслеживания ресурса (например, Google™ Анатлитика, Yandex™ Метрика и так далее). Естественно, модуль 116 выбора источника содержимого может получать дополнительную информацию от дополнительных источников различными дополнительными путями.

[00189] Таким образом, в соответствии с неограничивающими вариантами осуществления настоящего технического решения, рекомендательный сервер 112 выполнен с возможностью выполнять двухэтапный подход к выбору рекомендаций (т.е. рекомендуемых элементов) для включения в сообщение 152 рекомендаций содержимого в ответ на запрос рекомендаций 150 содержимого.

[00190] Двухэтапный подход особенно полезен (без установления ограничений) в тех случаях, когда сервис рекомендаций содержимого, предоставляемый рекомендательным сервером 112, предоставляется на новой территории - например, в стране, в области страны, в новом городе и так далее. Конкретный технический эффект от использования вариантов осуществления настоящего технического решения заключается в возможности «заранее квалифицировать» потенциальные источники рекомендаций содержимого в режиме «оффлайн» («оффлайн» подразумевает обработку до получения запроса на рекомендацию 150 содержимого).

[00191] Варианты осуществления настоящего технического решения основаны на предположении о том, что не все сетевые ресурсы (т.е. первый сетевой ресурс 124, второй сетевой ресурс 126 и множество дополнительных сетевых ресурсов 128) содержат потенциальный элемент содержимого, подходящий для обработки и рекомендации для рекомендательного сервера 112. Например, некоторые сетевые ресурсы (т.е. первый сетевой ресурс 124, второй сетевой ресурс 126 и множество дополнительных сетевых ресурсов 128) могут содержать элемент содержимого, который не будет интересен подписчикам сервиса рекомендаций, предоставляемого рекомендательным сервером 112.

[00192] Варианты осуществления настоящего технического решения также основаны на предположении о том, что содержимое некоторых сетевых ресурсов (т.е. первого сетевого ресурса 124, второго сетевого ресурса 126 и множества дополнительных сетевых ресурсов 128) является более подходящим для обработки и рекомендации для рекомендательного сервера 112. Например, если один из сетевых ресурсов (т.е. первого сетевого ресурса 124, второго сетевого ресурса 126 и множества дополнительных сетевых ресурсов 128) является новостным агрегатором, более вероятно, что он будет содержать элементы содержимого, подходящие для обработки и рекомендации рекомендательным сервером 112. Подобный сетевой ресурс с большей вероятностью будет обладать часто обновляемыми элементами содержимого (т.е. новыми опубликованными новостями, статьями и т.д.), а также содержать элементы содержимого, которые потенциально заинтересуют широкую аудиторию.

[00193] С другой стороны, некоторые другие сетевые ресурсы (т.е. первый сетевой ресурс 124, второй сетевой ресурс 126 и множество дополнительных сетевых ресурсов 128) содержат элементы содержимого, которые менее подвержены обработке и рекомендациям, предоставляемым рекомендательным сервером 112. Например, персональный веб-сайт любителя кошек из Виннипег, который публикует фотографии своих любимцев, с меньшей вероятностью предоставляет потенциальные элементы содержимого для обработки и рекомендаций рекомендательных сервером 112. Это связано с тем фактом, что содержимое такого сетевого ресурса обновляется редко и связано с достаточно узкой сферой интереса.

[00194] В общем случае, двухэтапный подход нацелен на:

[00195] На первом этапе:

Выбор из множества сетевых ресурсов (т.е. первого сетевого ресурса 124, второго сетевого ресурса 126 и множества дополнительных сетевых ресурсов 128) тех, которые содержат потенциальные элементы содержимого для рекомендации - конкретнее, рекомендательный сервер 112 определяет параметр пригодности источника для сетевого ресурса, параметр пригодности источника указывает на то, что сетевой ресурс восприимчив к публикации элемента содержимого, который может быть обработан рекомендательным сервером 112;

[00196] На втором этапе:

Из выбранных таким образом сетевых ресурсов, рекомендательный сервер 112 выбирает по меньшей мере один элемент содержимого, по меньшей мере один элемент содержимого для ввода в модуль 115 выбора рекомендаций содержимого - для обработки и выбора персонализированных рекомендаций элемента содержимого пользователя 102, в ответ на получение запроса на рекомендацию 150 содержимого.

[00197] В широком смысле, в некоторых вариантах осуществления настоящего технического решения, двухэтапный подход может быть реализован следующим образом:

[00198] Обучение алгоритма машинного обучения

[00199] До этапа выполнения процесса двухэтапного выбора, рекомендательный сервер 112 (или, конкретнее, модуль 114 обработки) выполняет обучение алгоритма машинного обучения, который модуль 116 выбора источника содержимого использует для выбора источников содержимого. В общем случае, алгоритм машинного обучения обучается для определения параметра пригодности источника данного сетевого ресурса (т.е. первого сетевого ресурса 124, второго сетевого ресурса 126 и множества дополнительных сетевых ресурсов 128) на основе обучающего набора сетевых ресурсов и связанных отметок, назначенных экспертами. Отметка может представлять собой, например, «низкое значение параметра пригодности источника», «среднее значение параметра пригодности источника» и «высокое значение параметра пригодности источника». Альтернативно, отметка может представлять собой, например, «пригодный» и «непригодный».

[00200] Во время обучения, алгоритм машинного обучения модуля 116 выбора источника содержимого представлен с обучающим набором сетевых ресурсов и связанными оценками, чтобы обработать различные характеристики, связанные с веб-страницами сетевых ресурсов - чтобы разработать профиль данного сетевого ресурса и соотнести таким образом созданный профиль сетевого ресурса со связанными оценками, чтобы создать «формулу алгоритма машинного обучения», которая позволяет алгоритму машинного обучения модуля 116 выбора источника содержимого (i) быть представленным с неизвестным сетевым ресурсом (например, новый или первый сетевой ресурс 124, второй сетевой ресурс 126 и множество дополнительных сетевых ресурсов 128), (ii) анализировать характеристики данной веб-страницы или всего сетевого ресурса (т.е. первого сетевого ресурса 124, второго сетевого ресурса 126 и множества дополнительных сетевых ресурсов 128) для создания профиля соответствующего сетевого ресурса; и (iii) определять, на основе таким образом созданного профиля сетевого ресурса, параметр пригодности источника, связанный с ним.

[00201] В некоторых вариантах осуществления настоящего технического решения, множество характеристик, используемых алгоритмом машинного обучения, включает в себя по меньшей мере одну абсолютную характеристику (например, общее число посещений на сетевой ресурс) и относительную характеристику (например, среднее число посещений за данный период времени или число хитов пользователя). В некоторых вариантах осуществления настоящего технического решения, алгоритм машинного обучения использует абсолютную характеристику и относительную характеристику в качестве базовых характеристик, и, дополнительно, создает по меньшей мере одну производную характеристику на основе по меньшей мере одной из абсолютной характеристики и относительной характеристики для использования в создании профиля сетевого ресурса.

[00202] В некоторых вариантах осуществления настоящего технического решения, производные характеристики создаются с помощью одного или нескольких из: логарифмической формулы, сигмоидной функции, функции квадратного корня. В некоторых вариантах осуществления настоящего технического решения, алгоритм машинного обучения нормализует характеристики сетевого ресурса. В некоторых вариантах осуществления настоящего технического решения, характеристики нормализуются к среднему = 0, стандартное отклонение = 1 (mean=0, stddev=1).

[00203] В соответствии с некоторыми вариантами осуществления настоящего технического решения, как часть обучения алгоритма машинного обучения модуля 116 выбора источника содержимого, алгоритм машинного обучения выполнен с возможностью определять все возможные характеристики сетевого ресурса в подмножество характеристик, которые лучше соотносятся с параметром пригодности источника.

[00204] В конкретном неограничивающем варианте осуществления настоящего технического решения, из всех возможных характеристик, связанных с сетевым ресурсом, алгоритм машинного обучения модуля 116 выбора источника содержимого может выбирать подмножество характеристик, которое состоит из:

по меньшей мере одного из: доли целевой страницы среди визитов сетевого ресурса в рамках первоначального перехода к сетевому ресурсу в рамках сессии и доли визитов целевой страницы за время переходов внутри сетевого ресурса;

по меньшей мере одного из: доли веб-страницы, связанной с URL, который содержит дату, когда первая страница была посещена за первый переход на сетевой ресурс, и доли веб-страниц в сетевом ресурсе, посещенном за время сессии, веб-страницы связаны с URL, который содержит дату;

долевой профиль источников визита для сетевого ресурса, источники визита выбираются из: поисковой системы/социальных сетей/электронной почты и приложения мессенджера/URL/прямых визитов;

доля сессии, где сетевой ресурс был последним в сессии.

[00205] Естественно, в альтернативных вариантах осуществления настоящего технического решения, другое подмножество всех характеристик, связанных с сетевым ресурсом, может быть использовано алгоритмом машинного обучения.

[00206] Примеры характеристик включают в себя, без установления ограничений:

количество хитов за визит (HPV) - сколько страниц в рамках данного сетевого ресурса посетил данный пользователь за время просмотра данного сетевого ресурса;

количество сессий за визит (SPV) - сколько сессий содержалось в визитах на конкретный сетевой ресурс;

количество датированных страниц за визит (DPV) - сколько страниц данного сетевого ресурса с датой в URL страниц данный пользователь посетил за время данного визита на данный сетевой ресурс;

количество домашних страниц за визит (MPV) - сколько раз за время данного визита данный пользователь посетил домашнюю страницу данного сетевого ресурса;

время, проведенное на сетевом ресурсе (MTIME) - сколько времени данный пользователь провел, просматривая данный сетевой ресурс;

последний домен за сессию (LPS) - является ли данный сетевой ресурс последним сетевым ресурсом в данной сессии веб-просмотра данного пользователя;

первый домен за сессию (FPS) - является ли данный сетевой ресурс первым сетевым ресурсом в данной сессии веб-просмотра данного пользователя;

хиты за сессию (HPS) - сколько страниц любых сетевых ресурсов данный пользователь посетил за данные сессии просмотра (т.е. сколько переходов было сделано за данную сессию);

количество визитов на пользователя (VPU) - среднее число визитов на данный сетевой ресурс;

количество хитов на пользователя (HPU) - среднее число переходов между различными страницами данного сетевого ресурса (или, альтернативно, всех сетевых ресурсов);

количество сессий на пользователя (SPU) - среднее число сессий, которые включают визиты на данный сетевой ресурс;

количество датированных страниц за хит (DPH) - сколько страниц данного сетевого ресурса с датой в URL страниц данный пользователь посетил за время данного визита на данный сетевой ресурс;

количество домашних страниц за хит (МРН) - сколько раз данный пользователь переходил на домашнюю страницу данного сетевого ресурса за визит на данный сетевой ресурс;

указание на источник перехода к данному сетевому ресурсу является одним из следующего:

визитом пользователя на сайт напрямую (TT_GR);

визитом пользователя на сайт через поисковую систему (TT_SE);

визитом пользователя на сайт через социальную сеть (TT_SN);

визитом пользователя на сайт через электронное сообщение (TT_IM);

визитом пользователя на сайт, совершенным с помощью сервиса сокращения ссылок (TT_US); и

визитом пользователя на сайт, совершенным с помощью рекламной платформы (TT_AD).

[00207] Следует отметить, что когда подобным образом обученный алгоритм машинного обучения обучается и используется для определения параметра пригодности источника для неизвестного сетевого ресурса, алгоритм машинного обучения использует по меньшей мере некоторые (или все) характеристики, на которых он был обучен (или по меньшей мере характеристики из той же категории, на которой он был обучен).

[00208] В некоторых вариантах осуществления настоящего технического решения, алгоритм машинного обучения обучается для определения параметра пригодности источника с помощью логистического регрессионного анализа. В альтернативных вариантах осуществления настоящего технического решения, алгоритм машинного обучения для определения параметра пригодности источника с помощью одного или нескольких из: логистического регрессионного анализа; упрощенного алгоритма Байеса; алгоритма k-ближайших соседей; алгоритма случайного леса; и алгоритма невзвешенного голосования.

[00209] В некоторых вариантах осуществления настоящего технического решения, для данного сетевого ресурса (т.е. первого сетевого ресурса 124, второго сетевого ресурса 126 и множества дополнительных сетевых ресурсов 128) характеристики сгруппированы на основе их географического положения. Например, если данный сетевой ресурс является онлайн ресурсом «New York Times», одна характеристика может быть основана на посетителях сетевого ресурса из Соединенных штатов, а другая характеристика основана на посетителях сетевого ресурса из Соединенного королевства.

[00210] Первый этап - выбор рекомендуемого источника содержимого

[00211] На первом этапе модуль 116 выбора источника содержимого получает указание на один или несколько сетевых ресурсов (т.е. первый сетевой ресурс 124, второй сетевой ресурс 126 и множество дополнительных сетевых ресурсов 128). В некоторых вариантах осуществления настоящего технического решения, полученное указание является указанием на новый сетевой ресурс, который не был ранее просмотрен. В других вариантах осуществления настоящего технического решения, полученное указание является указанием на обновленный сетевой ресурс, который ранее был просмотрен, но не был обновлен новым содержимым. В некоторых вариантах осуществления настоящего технического решения, модуль 116 выбора источника содержимого получает указание на один или несколько сетевых ресурсов (т.е. первый сетевой ресурс 124, второй сетевой ресурс 126 и множество дополнительных сетевых ресурсов 128) от устройства 118 хранения данных.

[00212] Модуль 116 выбора источника содержимого далее выполняет обученный алгоритм машинного обучения для определения параметра пригодности источника, связанного с рассматриваемым сетевым ресурсом (т.е. первым сетевым ресурсом 124, вторым сетевым ресурсом 126 и множеством сетевых ресурсов 128).

[00213] В некоторых вариантах осуществления настоящего технического решения, модуль 116 выбора источника содержимого создает профиль сетевого ресурса для всего сетевого ресурса (т.е. первого сетевого ресурса 124, второго сетевого ресурса 126 и множества дополнительных сетевых ресурсов 128) путем анализа характеристик одной или нескольких веб-страниц всего сетевого ресурса (т.е. первого сетевого ресурса 124, второго сетевого ресурса 126 и множества дополнительных сетевых ресурсов 128).

[00214] В других вариантах осуществления настоящего технического решения, модуль 116 выбора источника содержимого создает соответствующий профиль сетевого ресурса для подмножества веб-страниц сетевого ресурса (т.е. первого сетевого ресурса 124, второго сетевого ресурса 126 и множества дополнительных сетевых ресурсов 128)

путем анализа характеристик одной или нескольких веб-страниц из подмножества сетевого ресурса (т.е. первого сетевого ресурса 124, второго сетевого ресурса 126 и множества дополнительных сетевых ресурсов 128).

[00215] В еще одних других вариантах осуществления настоящего технического решения, модуль 116 выбора источника содержимого может создавать соответствующий профиль каждой веб-страницы сетевого ресурса (т.е. первого сетевого ресурса 124, второго сетевого ресурса 126 и множества дополнительных сетевых ресурсов 128) путем анализа характеристик каждой веб-страницы сетевого ресурса (т.е. первого сетевого ресурса 124, второго сетевого ресурса 126 и множества дополнительных сетевых ресурсов 128).

[00216] Далее, на основе подобным образом созданного профиля (индивидуальной веб-страницы, подмножества веб-страниц данного сетевого ресурса или всего данного сетевого ресурса), модуль 116 выбора источника содержимого определяет параметр пригодности источника содержимого. Модуль 116 выбора источника содержимого создает параметр пригодности источника содержимого на основе формулы алгоритма машинного обучения, созданной во время фазы обучения.

[00217] Модуль 116 выбора источника содержимого определяет, является ли данный сетевой ресурс (подмножество веб-страниц или индивидуальные веб-страницы - в зависимости от обстоятельств) потенциальным источником элементов содержимого для рекомендации. В некоторых вариантах осуществления настоящего технического решения, модуль 116 выбора источника содержимого сравнивают таким образом определенный параметр пригодности источника с заранее определенным порогом - в ответ на то, что параметр пригодности источника находится выше заранее определенного порога, модуль 116 выбора источника содержимого определяет, что данный сетевой ресурс (подмножество его веб-страниц или его индивидуальные веб-страницы) является потенциальным источником элементов рекомендаций. Следует отметить, что заранее определенный порог может быть определен алгоритмом машинного обучения как часть фазы обучения.

[00218] Второй этап - выбор рекомендаций содержимого из выбранных источников содержимого

[00219] Далее, модуль 116 выбора источника содержимого выбирает из каждого сетевого ресурса, который был определен как потенциальный источник элементов

содержимого, один или несколько элементов содержимого вводится в систему рекомендаций (т.е. модуль 115 выбора рекомендаций содержимого).

[00220] В некоторых вариантах осуществления настоящего технического решения, выбор элементов содержимого из таким образом выбранных источников содержимого выполняется «онлайн», т.е. в ответ на получение запроса на рекомендацию 150 содержимого. В других вариантах осуществления настоящего технического решения, выбор элементов содержимого из таким образом выбранных источников содержимого может выполняться «оффлайн», т.е. до получения запроса на рекомендации 150 содержимого (например, такой выбор может выполняться регулярно, например, каждый день, каждые 7 дней, каждый месяц и так далее, на основе того, насколько быстро теряют актуальность элементы содержимого).

[00221] Выбор элементов содержимого из таким образом выбранных источников содержимого может выполняться с помощью одного или нескольких эвристических правил. Например, модуль 116 выбора источника содержимого выбирает заранее определенное число элементов содержимого (например, 2 элемента содержимого, 5 элементов содержимого, 10 элементов содержимого и так далее), которые связаны с одним или несколькими из: (i) самой свежей датой публикации, (ii) большее число визитов за время последних X дней, (iii) с конкретным разделом данного сетевого ресурса (например, «самое новое», «популярное» и так далее).

[00222] Обработка системой рекомендаций

[00223] После того, как модуль 116 выбора источника содержимого выбирает кандидаты-элементы содержимого из одного или нескольких источников идентифицированного содержимого, и таким образом выбранные кандидаты вводятся в модуль 115 выбора рекомендаций содержимого. Модуль 115 выбора рекомендаций содержимого выполняет свой алгоритм машинного обучения, который обучен и выполнен с возможностью выбирать из кандидатов-элементов содержимого, введенных в него, подмножество элементов содержимого для данного пользователя 102 в ответ на получение запроса на рекомендации 150 содержимого.

[00224] То, как реализован модуль 115 выбора рекомендаций содержимого, никак конкретно не ограничено.

[00225] После того как модуль 115 выбора рекомендаций содержимого создает подмножество элементов содержимого для данного пользователя 102, модуль 115 выбора рекомендаций содержимого создает сообщение 152 рекомендаций содержимого и передает его электронному устройству 104. Когда электронное устройство 104 получает сообщение 152 рекомендаций содержимого, рекомендательное приложение 106 обрабатывает его содержимое и отображает элементы рекомендаций содержимого на интерфейсе 108 рекомендаций. То, как именно реализован интерфейс 108 рекомендаций, никак конкретно не ограничено - может быть использован интерфейс 108 рекомендаций, представленный на Фиг. 2.

[00226] С учетом архитектуры и приведенных выше примеров можно выполнять способ выбора сетевого ресурса в качестве источника элемента содержимого, элемент содержимого будет проанализирован системой рекомендаций (т.е. модулем 115 выбора рекомендаций содержимого) как часть множества элементов содержимого для создания набора рекомендуемых элементов содержимого в качестве рекомендации для данного пользователя 102 системы 100.

[00227] На Фиг. 4 представлена блок-схема способа 400, реализованного в соответствии с неограничивающими вариантами осуществления настоящего технического решения. Способ 400 может выполняться на рекомендательном сервере 112 и, конкретнее, с помощью модуля 116 выбора источника содержимого. Для целей представленного далее описания, предполагается, что алгоритм машинного обучения, который будет использоваться модулем 116 выбора источника содержимого был обучен определять параметр пригодности источника на основе обучающих профилей веб-сайтов, созданных с соответствующим множеством обучающих характеристик, по меньшей мере часть из которых относятся к той же категории, что и множество характеристик, которые будут использованы на этапе выполнения способа 400.

[00228] Этап 402 - получение сервером указания на сетевой ресурс

[00229] Способ 400 начинается на этапе 402, на котором модуль 116 выбора источника содержимого получает указание на сетевой ресурс.

[00230] Как было упомянуто ранее, модуль 116 выбора источника содержимого может выполнять «функцию просмотра», которая может быть в широком смысле описана как функция просмотра новых сетевых ресурсов и/или нового содержимого, опубликованного на первом сетевом ресурсе 124, втором сетевом ресурсе 126 и дополнительных сетевых ресурсах 128. С этой целью модуль 116 выбора источника содержимого выполнен с возможностью реализовать «поискового робота», который «посещает» различные сетевые ресурсы, доступные через сеть 110 передачи данных (включая первый сетевой ресурс 124, второй сетевой ресурс 126 и дополнительные сетевые ресурсы) для обнаружения и каталогизации новых доступных ресурсов (например, первого сетевого ресурса 124, второго сетевого ресурса 126 и дополнительных сетевых ресурсов 128) или нового опубликованного содержимого, доступного на первом сетевом ресурсе 124, втором сетевом ресурсе 126 и дополнительных сетевых ресурсах 128.

[00231] Как часть функции просмотра, модуль выбора источника содержимого выполнен с возможностью содержать (на устройстве 118 сохранения данных) информацию, представляющую новые открытые сетевые ресурсы и/или новое открытое доступное содержимое, доступное на них. В некоторых вариантах осуществления настоящего технического решения, модуль 116 выбора источника содержимого может быть выполнен с возможностью поддерживать инвертированный индекс на устройстве 118 хранения данных, но модуль 116 выбора источника содержимого может организовать информацию, представляющую новые открытые сетевые ресурсы и/или новое открытое содержимое, доступное на них, в структуру данных, отличную от инвертированного индекса.

[00232] Таким образом, в некоторых вариантах осуществления настоящего технического решения, модуль 116 выбора источника содержимого может получать указание на сетевой ресурс, который будет обработан, от устройства 118 хранения данных.

[00233] Этап 404 - получение сервером множества характеристик, связанных с сетевым ресурсом

[00234] На этапе 404, модуль 116 выбора источника содержимого получает множество характеристик, связанных с сетевым ресурсом. Например, модуль 116 выбора источника содержимого может получать характеристики, связанные с сетевым ресурсом от устройства 118 хранения данных.

[00235] Как будет упомянуто, алгоритм машинного обучения выполняется модулем 116 выбора источника содержимого был обучен на конкретных характеристиках из обучающего набора сетевых ресурсов и, таким образом, алгоритм машинного обучения, выполняемый модулем 116 выбора источника содержимого, получает характеристики, связанные с сетевым ресурсом, которые были обучены для обработки.

[00236] В некоторых вариантах осуществления способа 400, алгоритм машинного обучения был обучен, до упомянутого этапа получения, для определения параметра пригодности источника на основе профилей обучающего веб-сайта, созданных в связи со множеством обучающих характеристик, причем по меньшей некоторые из них относятся к той же категории, что и множество характеристик.

[00237] В некоторых вариантах осуществления способа 400, множество характеристик включает в себя по меньшей мере абсолютную характеристику и относительную характеристику.

[00238] В некоторых вариантах осуществления способа 400, абсолютная характеристика и относительная характеристика являются базовыми характеристиками, и способ 400 дополнительно включает в себя: создание по меньшей мере одной производной характеристики на основе по меньшей мере одной абсолютной характеристики и относительной характеристики; и причем данный профиль веб-сайта дополнительно основан по меньшей мере на одной производной характеристики.

[00239] В некоторых вариантах осуществления способа 400, множество характеристик включает в себя указание на долю посещенных ресурсов по отношению к сетевому ресурсу.

[00240] В некоторых вариантах осуществления способа 400, множество характеристик включает в себя по меньшей мере одну относительную характеристику, выбранную из следующего:

количество хитов за визит (HPV);

количество сессий за визит (SPV);

количество датированных страниц за визит (DPV);

количество домашних страниц за визит (MPV);

время, проведенное на сетевом ресурсе (MTIME);

последний домен за сессию (LPS);

первый домен за сессию (FPS);

количество хитов за сессию (HPS);

количество визитов на пользователя (VPU);

количество хитов на пользователя (HPU);

количество сессий на пользователя (SPU);

количество датированных страниц за хит (DPH);

количество домашних страниц за хит (МРН); и

указание на источник визита, который является одним из:

визитом пользователя на сайт напрямую (TT_GR);

визитом пользователя на сайт через поисковую систему (TT_SE);

визитом пользователя на сайт через социальную сеть (TT_SN);

визитом пользователя на сайт через электронное сообщение (ТТ_IM);

визитом пользователя на сайт, совершенным с помощью сервиса сокращения ссылок (TT_US); и

визитом пользователя на сайт, совершенным с помощью рекламной платформы (TT_AD).

[00241] В некоторых вариантах осуществления способа 400, множество характеристик включает в себя по меньшей одно из: число пользователей, которые посещают сетевой ресурс за период времени, число визитов за период времени, число переходов к различным веб-страницам в рамках сетевого ресурса за период времени, и число уникальных сессий с сетевым ресурсом за период времени.

[00242] В некоторых вариантах осуществления способа 400, множество характеристик является подмножеством всех возможных характеристик, способ дополнительно включает в себя выполнение выбора характеристики для определения подмножества.

[00243] В некоторых вариантах осуществления способа 400, подмножество всех возможных характеристик состоит из:

по меньшей мере одного из: доли целевой страницы среди визитов сетевого ресурса в рамках первоначального перехода к сетевому ресурсу в рамках сессии и доли визитов целевой страницы за время переходов внутри сетевого ресурса;

по меньшей мере одного из: доли веб-страницы, связанной с URL, который содержит данные, представляющие собой первую страницу, которая была посещена за первый переход на сетевой ресурс, и доли веб-страниц в сетевом ресурсе, посещенном за время сессии, веб-страницы связаны с URL, который содержит данные;

долевой профиль источников визита для сетевого ресурса, источники визита выбираются из: поисковой системы/социальных сетей/электронной почты и приложения мессенжера/URL/прямых визитов;

доля сессии, где сетевой ресурс был последним в сессии.

[00244] Этап 406 - создание сервером профиля данного сетевого ресурса для сетевого ресурса, профиль данного сетевого ресурса основан на множестве характеристик

[00245] На этапе 406 модуль 116 выбора источника содержимого создает профиль данного сетевого ресурса для сетевого ресурса, профиль данного сетевого ресурса основан на множестве характеристик.

[00246] В некоторых вариантах осуществления настоящего технического решения, модуль 116 выбора источника содержимого создает вектор, представляющий профиль данного сетевого ресурса на основе некоторых или всех из следующего:

количество хитов за визит (HPV);

количество сессий за визит (SPV);

количество датированных страниц за визит (DPV);

количество домашних страниц за визит (MPV);

время, проведенное на сетевом ресурсе (MTIME);

последний домен за сессию (LPS);

первый домен за сессию (FPS);

количество хитов за сессию (HPS);

количество визитов на пользователя (VPU);

количество хитов на пользователя (HPU);

количество сессий на пользователя (SPU);

количество датированных страниц за хит (DPH);

количество домашних страниц за хит (МРН); и

указание на источник визита, который является одним из:

визитом пользователя на сайт напрямую (TT_GR);

визитом пользователя на сайт через поисковую систему (TT_SE);

визитом пользователя на сайт через социальную сеть (TT_SN);

визитом пользователя на сайт через электронное сообщение (TT_IM);

визитом пользователя на сайт, совершенным с помощью сервиса сокращения ссылок (TT_US); и

визитом пользователя на сайт, совершенным с помощью рекламной платформы (TT_AD).

[00247] В некоторых вариантах осуществления настоящего технического решения, модуль 116 выбора источника содержимого выполняет процедуру выбора характеристик и, таким образом, вектор, представляющий собой профиль данного сетевого ресурса, может быть основан на заранее выбранном наборе характеристик сетевого ресурса.

[00248] Этап 408 - выполнение сервером алгоритма машинного обучения для того, чтобы на основании профиля данного сетевого ресурса, определить параметр пригодности источника для сетевого ресурса, параметр пригодности источника указывает на чувствительность сетевого ресурса к публикации элемента содержимого, который может быть обработан системой рекомендаций.

[00249] На этапе 408 модуль 116 выбора источника содержимого выполняет алгоритм машинного обучения для того чтобы, на основании профиля данного сетевого ресурса, определить параметр пригодности источника для сетевого ресурса, параметр пригодности источника указывает на чувствительность сетевого ресурса к публикации элемента содержимого, который может быть обработан системой рекомендаций.

[00250] В некоторых вариантах осуществления способа 400, параметр пригодности источника может быть пригодным или непригодным. Параметр пригодности источника может быть определен с помощью по меньшей мере одного из:

логистического регрессионного анализа;

упрощенного алгоритма Байеса;

алгоритма k-ближайших соседей;

алгоритма случайного леса; и

алгоритма невзвешенного голосования.

[00251] Этап 410 - выбор по меньшей мере одного элемента содержимого с сетевого ресурса, если параметр пригодности источника определен как превышающий заранее определенный порог, по меньшей мере один элемент содержимого вводится в систему рекомендаций для обработки

[00252] На этапе 410 модуль 116 выбора источника содержимого осуществляет выбор по меньшей мере одного элемента содержимого с сетевого ресурса, если параметр пригодности источника определен как превышающий заранее определенный порог, по меньшей мере один элемент содержимого вводится в систему рекомендаций для обработки (т.е. модуль 115 выбора рекомендаций содержимого).

[00253] В некоторых вариантах осуществления настоящего технического решения, этап 410 выполняется в ответ на запрос от данного пользователя 102 на рекомендацию (т.е. в ответ на получение запроса на рекомендацию 150 содержимого).

[00254] Способ 400 далее может завершаться или возвращается на этап 402 и ожидает другого запроса на рекомендацию 150 содержимого.

[00255] На Фиг. 3 представлен другой вариант осуществления системы 300, реализованной в соответствии с другим вариантом осуществления настоящего технического решения, не ограничивающим его объем. Система 300 включает в себя конкретные компоненты, которые реализованы по существу аналогично компонентам системы 100. Эти компоненты отмечены под теми же номерами, что и компоненты системы 100. С этой целью система 300 содержит: пользователя 102, электронное устройство 104 (с приложением 106 рекомендаций, выполняемым на нем, приложение 106 рекомендаций обладает интерфейсом 108 рекомендаций) и сеть 110 передачи данных. Также соединен с сетью первый сетевой ресурс 124, второй сетевой ресурс 126 и множество дополнительных сетевых ресурсов 128, которые являются сетевыми ресурсами, доступными электронному устройству 104 (а также другим электронным устройствам, потенциально присутствующим в системе 300) через сеть 110 передачи данных.

[00256] Соответствующее содержимое первого сетевого ресурса 124, второго сетевого ресурса 126 и множества дополнительных сетевых ресурсов 128 никак конкретно не ограничено. Таким образом, данный один сетевой ресурс из первого сетевого ресурса 124, второго сетевого ресурса 126 и множества дополнительных сетевых ресурсов 128 может содержать (или, другими словами, включать в себя) цифровое содержимое, например: аудио содержимое для потоковой передачи, видео содержимое для потоковой передачи, новости, блоги, информацию о различных государственных институтах, информацию о точках интереса, тематически кластеризованное содержимое (например, содержимое, релевантное для тех, кто заинтересован в кикбоксинге) и так далее.

[00257] В соответствии с неограничивающим вариантом осуществления настоящего технического решения, показанным на Фиг. 3, система 300 также включает в себя рекомендательный сервер 312. Рекомендательный сервер 312 может представлять собой обычный компьютерный сервер. В примере варианта осуществления настоящего технического решения, рекомендательный сервер 312 может представлять собой сервер Dell™ PowerEdge™, на котором используется операционная система Microsoft™ Windows Server™. Излишне говорить, что рекомендательный сервер 312 может представлять собой любое другое подходящее аппаратное, прикладное программное, и/или системное программное обеспечение или их комбинацию. В представленном варианте осуществления настоящего технического решения, не ограничивающем его объем, рекомендательный сервер 312 является одиночным сервером. В других вариантах осуществления настоящего технического решения, не ограничивающих его объем, функциональность рекомендательного сервера 312 изображения может быть разделена, и может выполняться с помощью нескольких серверов.

[00258] Рекомендательный сервер 312 включает в себя модуль 314 обработки Модуль 314 обработки связан с модулем 316 определения источника содержимого. Модуль 316 определения источника содержимого выполнен с возможностью определять из множества потенциальных источников содержимого (т.е. первого сетевого ресурса 124, второго сетевого ресурса 126 и множества дополнительных сетевых ресурсов 128) подмножество источников содержимого.

[00259] В некоторых вариантах осуществления настоящего технического решения, модуль 316 определения источника содержимого выполнен с возможностью осуществлять первый алгоритм машинного обучения для определения подмножества рекомендуемых источников содержимого из множества источников возможного содержимого (т.е. первого сетевого ресурса 124, второго сетевого ресурса 126 и множества дополнительных сетевых ресурсов 128).

[00260] В некоторых вариантах осуществления настоящего технического решения, для определения подмножества рекомендуемых источников содержимого, модуль 316 определения источника содержимого выполнен с возможностью осуществлять:

получение указания на предыдущие взаимодействия пользователей по меньшей мере с одним из: (i) системой 100 и (ii) по меньшей мере некоторыми из множества сетевых ресурсов (например, первым сетевым ресурсом 124, вторым сетевым ресурсом 126 и множеством сетевых ресурсов 128);

на основе предыдущих взаимодействий пользователя, определение первого подмножества связанных с пользователем источников содержимого (т.е. некоторых из первого сетевого ресурса 124, второго сетевого ресурса 126 и множества дополнительных сетевых ресурсов 128);

на основе (i) обученной формулы алгоритма машинного обучения других взаимодействий пользователя по меньшей мере с некоторыми другими из множества сетевых ресурсов (т.е. первым сетевым ресурсом 124, вторым сетевым ресурсом 126 и множеством дополнительных сетевых ресурсов 128) и по меньшей мере одним из: (ii) первое подмножество связанных с пользователем источников содержимого; и (iii) вектор профиля пользователя создается на основе предыдущих взаимодействий пользователя для создания второго подмножества не связанных с пользователем источников содержимого;

обработку первого подмножества связанных с пользователем источников содержимого и второго подмножества не связанных с пользователем источников содержимого для создания подмножества рекомендуемых источников содержимого;

[00261] Конкретнее, функция модуля 316 определения источника содержимого может выполняться следующим образом, по меньшей мере в некоторых неограничивающих вариантах осуществления настоящего технического решения.

[00262] Создание вектора профиля пользователя

[00263] Модуль 316 определения источника содержимого может получать указание на предыдущие взаимодействия пользователя по меньшей мере с одним из: (i) системой 300 и (ii) по меньшей мере некоторыми из множества сетевых ресурсов (например, первым сетевым ресурсом 124, вторым сетевым ресурсом 126 и множеством дополнительных сетевых ресурсов 128).

[00264] В некоторых вариантах осуществления настоящего технического решения, модуль 316 определения источника содержимого получает указание на предыдущее взаимодействие пользователя с браузерным приложением, выполняемым на электронном устройстве 104. В других вариантах осуществления настоящего технического решения, модуль 316 определения источника содержимого получает указание на предыдущее взаимодействие пользователя из журналов поисковой системы. В других вариантах осуществления настоящего технического решения, модуль 316 определения источника содержимого получает указание на предыдущее взаимодействие пользователя из виджетов отслеживания, установленных на различных сетевых ресурсах (например, первого сетевого ресурса 124, второго сетевого ресурса 126 и множества дополнительных сетевых ресурсов 128).

[00265] Определение связанного с пользователем подмножества источников содержимого

[00266] На основе предыдущих взаимодействий пользователя, модуль 316 определения источника содержимого может осуществлять определение первого подмножества связанных с пользователем источников содержимого (т.е. некоторых из первого сетевого ресурса 124, второго сетевого ресурса 126 и множества дополнительных сетевых ресурсов 128). Конкретнее, модуль 316 определения источника содержимого определяет один или несколько потенциальных источников содержимого (т.е. некоторых из первого сетевого ресурса 124, второго сетевого ресурса 126 и множества дополнительных сетевых ресурсов 128), с которыми пользователь 102 взаимодействовал в прошлом -например, посредством просмотра одного или нескольких сетевых ресурсов, получение

и/или активация рекомендаций содержимого от одного или нескольких сетевых ресурсов и так далее. Другими словами, первое подмножество связанных с пользователем источников содержимого может считаться «конкретными для пользователя» или «конкретно понравившимися источниками содержимого» в значении того, что пользователь 102 конкретно взаимодействовал с этими сетевыми ресурсами, и может предполагаться, что пользователю понравилось их содержимое, на основе взаимодействия с ними.

[00267] Обогащение связанного с пользователем подмножества источников содержимого для создания не связанного с пользователем подмножества источников содержимого

[00268] Далее, модуль 316 определения источника содержимого обогащает связанное с пользователем подмножество источников содержимого с помощью источников содержимого, которые пользователь 102 мог ранее не видеть. Конкретнее, на основе (i) обученной формулы алгоритма машинного обучения других взаимодействий пользователя по меньшей мере с некоторыми другими из множества сетевых ресурсов (т.е. первым сетевым ресурсом 124, вторым сетевым ресурсом 126 и множеством дополнительных сетевых ресурсов 128) и по меньшей мере одним из: (ii) первое подмножество связанных с пользователем источников содержимого; и (iii) вектор профиля пользователя создается на основе предыдущих взаимодействий пользователя для создания второго подмножества не связанных с пользователем источников содержимого.

[00269] В некоторых вариантах осуществления настоящего технического решения, используемый алгоритм машинного обучения может представлять собой алгоритм сингулярного разложения (SVD). В рамках этих вариантов осуществления настоящего технического решения, алгоритм машинного обучения определяет не связанное с пользователем подмножество источников содержимого на основе вектора профиля пользователя, созданного на основе предыдущих взаимодействий пользователя. Конкретнее, алгоритм машинного обучения, реализованный как алгоритм сингулярного разложения (SVD), создает матрицу (i) событий сетевых ресурсов и (ii) пользователей (на основе информации о предыдущих взаимодействиях множества пользователей со множеством сетевых ресурсов, т.е. первого сетевого ресурса 124, второго сетевого ресурса 126 и множества дополнительных сетевых ресурсов 128).

[00270] Алгоритм машинного обучения далее применяет алгоритм сингулярного разложения (SVD) для разложения матрицы на векторы сетевых ресурсов и векторы пользователей. Далее, алгоритм сингулярного разложения (SVD) опускает векторы пользователей и сохраняет векторы сетевых ресурсов (например, сохраняет их в устройстве хранения данных, которое не представлено на Фиг. 3).

[00271] Когда модуль 316 определения источника содержимого получает вектор профиля пользователя, алгоритм сингулярного разложения (SVD) умножает таким образом полученный вектор профиля пользователя и сохраненные векторы сетевых ресурсов для создания заново матрицы сетевых ресурсов с их связанными рангами, конкретными для пользователя 102, который связан с вектором профиля пользователя. На основе ранжированных сетевых ресурсов, модуль 316 определения источника содержимого выбирает заранее определенное число наиболее высоко ранжированных сетевых ресурсов для создания не связанного с пользователем подмножества источников содержимого.

[00272] В некоторых вариантах осуществления настоящего технического решения, используемый алгоритм машинного обучения может представлять собой алгоритм точечной взаимной информации (PMI). В рамках этих вариантов осуществления настоящего технического решения, алгоритм машинного обучения определяет не связанное с пользователем подмножество источников содержимого на основе первого подмножества связанных с пользователем источников содержимого. Конкретнее, алгоритм машинного обучения определяет для каждого из сетевых ресурсов в первом подмножестве связанных с пользователем источников содержимого и каждого из просмотренных потенциальных источников содержимого: (i) как часто пара возникает вместе (были вместе просмотрены, возникли вместе как часть результатов поиска и так далее) в течение конкретного взаимодействия; и (ii) как часто взаимодействовали с соответствующим одним из сетевых ресурсов. Алгоритм машинного обучения далее вычисляет пропорцию числа совместных возникновений (как в случае (i)) для умножения индивидуальных значений возникновений соответствующих сетевых ресурсов (как в случае (ii)).

[00273] Для каждого из сетевых ресурсов в первом подмножестве связанных с пользователем источников содержимого, алгоритм машинного обучения выбирает заранее определенное число наиболее высоко ранжированных ресурсов, определенных алгоритмом точечной взаимной информации (PMI) для создания не связанного с пользователем подмножества источников содержимого.

[00274] Обработка связанного с пользователем и не связанного с пользователем подмножеств источников содержимого для создания подмножества рекомендуемых источников содержимого

[00275] Модуль 316 определения источника содержимого осуществляет обработку первого подмножества связанных с пользователем источников содержимого и второго подмножества не связанных с пользователем источников содержимого для создания подмножества рекомендуемых источников содержимого.

[00276] В некоторых вариантах осуществления настоящего технического решения, модуль 316 определения источника содержимого выбирает заранее определенное число источников содержимого из не связанного с пользователем подмножества источников содержимого. В других вариантах осуществления настоящего технического решения, модуль 316 определения источника содержимого выбирает заранее определенное число источников содержимого из не связанного с пользователем подмножества источников содержимого и заранее определенное число источников содержимого из первого подмножества связанных с пользователем источников содержимого. Модуль 316 определения источника содержимого может быть выполнен с возможностью определять соответствующее число заранее определенных источников содержимого, учитывая то, что чем больше количество выбранных из не связанного с пользователем подмножества источников содержимого, тем больше рекомендаций элементов содержимого из «новых» источников получит пользователь 102. И наоборот, чем больше число выбранных из первого подмножества связанных источников содержимого, тем больше рекомендаций элементов содержимого из «известных» (и, следовательно, более приемлемых) источников получит пользователь 102.

[00277] Рекомендательный сервер 312 также включает в себя модуль 318 выбора потенциально рекомендуемых элементов содержимого для анализа подмножества рекомендуемых источников содержимого для выбора множества потенциально рекомендуемых элементов содержимого.

[00278] Выбор элементов содержимого из таким образом выбранных источников содержимого может выполняться с помощью одной или нескольких эвристических правил. Например, модуль 116 выбора источника содержимого выбирает заранее определенное число элементов содержимого (например, 2 элемента содержимого, 5 элементов содержимого, 10 элементов содержимого и так далее), которые связаны с одним или несколькими из: (i) самой свежей датой публикации, (ii) большее число визитов за время последних X дней, (iii) с конкретным разделом данного сетевого ресурса (например, «самое свежее», «популярное» и так далее).

[00279] Рекомендательный сервер 312 также включает в себя модуль 320 выбора рекомендаций содержимого для выполнения второго алгоритма машинного обучения для выбора, из множества потенциально рекомендуемых элементов содержимого, по меньшей мере одного рекомендуемого элемента содержимого; выбор осуществляется на основе вектора профиля пользователя.

[00280] То, как реализован модуль 320 выбора рекомендаций содержимого, никак конкретно не ограничено.

[00281] После того как модуль 320 выбора рекомендаций содержимого создает подмножество элементов содержимого для данного пользователя 102, модуль 320 выбора рекомендаций содержимого создает сообщение 152 рекомендаций содержимого и передает его электронному устройству 104. Когда электронное устройство 104 получает сообщение 152 рекомендаций содержимого, рекомендательное приложение 106 обрабатывает его содержимое и отображает элементы рекомендаций содержимого на интерфейсе 108 рекомендаций. То, как именно реализован интерфейс 108 рекомендаций, никак конкретно не ограничено - может быть использован интерфейс 108 рекомендаций, представленный на Фиг. 2.

[00282] С учетом архитектуры и примеров, описанных выше, возможно использовать способ создания рекомендаций содержимого для пользователя 102 электронного устройства 104. На Фиг. 5 представлена блок-схема способа 500, реализованного в соответствии с неограничивающими вариантами осуществления настоящего технического решения. Способ 500 может выполняться на сервере 312 рекомендаций и, конкретнее, с помощью модуля 316 определения источника содержимого и модуля 318 выбора потенциально рекомендуемых элементов содержимого. Для целей представленного далее описания, предполагается, что алгоритм машинного обучения, который будет использоваться модулем 316 определения источника содержимого, который был обучен определять параметр пригодности источника на основе обучающих профилей веб-сайтов, созданных с соответствующим множеством обучающих характеристик, по меньшей мере часть из которых относятся к той же категории, что и множество характеристик, которые будут использованы на этапе выполнения способа 500.

[00283] Этап 502 - получение от электронного устройства запроса на рекомендацию содержимого, рекомендация содержимого включает в себя по меньшей мере один рекомендуемый элемент содержимого

[00284] Способ 500 начинается на этапе 502, где модуль 316 определения источника содержимого получает от электронного устройства 104 запрос на рекомендацию 150 содержимого, рекомендация содержимого включает в себя по меньшей мере один рекомендуемый элемент содержимого.

[00285] Этап 504 - выполнение модуля первого алгоритма машинного обучения для определения подмножества рекомендуемых источников содержимого из множества возможных источников содержимого, определение подмножества рекомендуемых источников содержимого, включая: получение указания на предыдущие взаимодействия пользователя по меньшей мере с одним из: (i) системой рекомендаций и (ii) по меньшей мере некоторыми из множества сетевых ресурсов; на основе предыдущих взаимодействий пользователя, определение первого подмножества связанных с пользователем источников содержимого; на основе (i) обученной формулы алгоритма машинного обучения других взаимодействий пользователя по меньшей мере с некоторыми другими из множества сетевых ресурсов и по меньшей мере одним из: (ii) первое подмножество связанных с пользователем источников содержимого; и (iii) вектор профиля пользователя создается на основе предыдущих взаимодействий пользователя для создания второго подмножества не связанных с пользователем источников содержимого.

[00286] На этапе 504 модуль 316 определения источника содержимого выполняет модуль первого алгоритма машинного обучения для определения подмножества рекомендуемых источников содержимого из множества возможных источников содержимого, определение подмножества рекомендуемых источников содержимого, включая:

получение указания на предыдущие взаимодействия пользователей по меньшей мере с одним из: (i) системой рекомендаций и (ii) по меньшей мере некоторыми из множества сетевых ресурсов;

на основе предыдущих взаимодействий пользователя, определение первого подмножества связанных с пользователем источников содержимого;

на основе

(i) обученной формулы алгоритма машинного обучения других взаимодействий пользователя по меньшей мере с некоторыми другими из множества сетевых ресурсов и по меньшей мере одним из:

(ii) первом подмножестве связанных с пользователем источников содержимого; и

(iii) векторе пользовательского профиля создается на основе предыдущих взаимодействий пользователя

создании второго подмножества не связанных с пользователем источников содержимого.

[00287] В некоторых вариантах осуществления способа 500, определение второго подмножества не связанных с пользователем источников содержимого включает в себя применение алгоритма сингулярного разложения (SVD). В рамках этих вариантов осуществления настоящего технического решения, определение второго подмножества не связанных с пользователем источников содержимого основано на: (i) обученной формуле алгоритма машинного обучения других взаимодействий пользователя по меньшей мере с некоторыми другими из множества сетевых ресурсов; и (ii) вектор профиля пользователя создается на основе предыдущих взаимодействий пользователя.

[00288] В рамках этих вариантов осуществления способа 500, способ 500 дополнительно включает в себя, до получения запроса на рекомендацию содержимого, создание алгоритмом сингулярного разложения матрицы событий и пользователей сетевых ресурсов.

[00289] В некоторых вариантах осуществления способа 500, определение второго подмножества не связанных с пользователем источников содержимого включает в себя применение алгоритма точечной взаимной информации (PMI). В этих вариантах осуществления способа 500, определение второго подмножества не связанных с пользователем источников содержимого основано на: (i) обученной формуле алгоритма машинного обучения других взаимодействий пользователя по меньшей мере с некоторыми другими из множества сетевых ресурсов; и (ii) первом подмножестве связанных с пользователем источников содержимого.

[00290] Этап 506 - обработка первого подмножества связанных с пользователем источников содержимого и второго подмножества не связанных с пользователем источников содержимого для создания подмножества рекомендуемых источников содержимого

[00291] На этапе 506 модуль 316 определения источника содержимого осуществляет обработку первого подмножества вязанных с пользователем источников содержимого и второго подмножества не связанных с пользователем источников содержимого для создания подмножества рекомендуемых источников содержимого.

[00292] Этап 508 - анализ подмножества рекомендуемых источников содержимого для выбора множества потенциально рекомендуемых элементов содержимого

[00293] На этапе 508 модуль 316 определения источника содержимого осуществляет анализ подмножества рекомендуемых источников содержимого для выбора множества потенциально рекомендуемых элементов содержимого.

[00294] Этап 510 - выполнение второго алгоритма машинного обучения для выбора, из множества потенциально рекомендуемых элементов содержимого, по меньшей мере одного рекомендуемого элемента содержимого; выбор осуществляется на основе вектора профиля пользователя

[00295] На этапе 510 модуль 318 выбора потенциально рекомендуемых элементов содержимого выполняет второй алгоритм для выбора, из множества потенциально рекомендуемых элементов содержимого, по меньшей мере одного рекомендуемого элемента содержимого; выбор осуществляется на основе вектора профиля пользователя.

[00296] В некоторых вариантах осуществления способа 500, выбор из подмножества рекомендуемых источников содержимого множества потенциально рекомендуемых элементов содержимого включает в себя определение заранее определенного числа самых новых элементов содержимого.

[00297] В других вариантах осуществления способа 500, выбор из подмножества рекомендуемых источников содержимого множества потенциально рекомендуемых элементов содержимого включает в себя определение заранее определенного числа самых популярных элементов содержимого.

[00298] В других вариантах осуществления способа 500, выбор из подмножества рекомендуемых источников содержимого конкретен для географической области, где выполняется запрос на рекомендуемое содержимое.

[00299] В других вариантах осуществления способа 500, способ 500 дополнительно включает в себя фильтрацию выбранных потенциально рекомендуемых элементов содержимого. В других вариантах осуществления способа 500, фильтрация основана на языковых настройках электронного устройства и языковых настройках элемента содержимого.

[00300] Некоторые варианты осуществления настоящего технического решения могут привести к конкретному техническому эффекту от использования вариантов осуществления настоящего технического решения заключается в возможности «заранее квалифицировать» потенциальные источники рекомендаций содержимого в режиме «оффлайн» («оффлайн» подразумевает обработку до получения запроса на рекомендацию 150 содержимого). В некоторых вариантах осуществления настоящего технического решения, технический эффект возникает в виде возможности заранее квалифицировать сетевые ресурсы как источники рекомендуемых элементов содержимого при входе на новую территорию.

[00301] Важно иметь в виду, что варианты осуществления настоящего технического решения могут быть выполнены с проявлением и других технических результатов.

[00302] Модификации и улучшения вышеописанных вариантов осуществления настоящего технического решения будут ясны специалистам в данной области техники. Предшествующее описание представлено только в качестве примера и не устанавливает никаких ограничений. Таким образом, объем настоящего технического решения ограничен только объемом прилагаемой формулы изобретения.

[00303] Варианты осуществления настоящего технического решения могут быть кратко изложены в пронумерованных пунктах.

[00304] ПЕРВЫЙ АСПЕКТ ОСУЩЕСТВЛЕНИЯ СПОСОБА/СИСТЕМЫ

[00305] ПУНКТ 1. Способ (400) выбора сетевого ресурса (124, 126, 128) как источника элемента (216, 218) содержимого, элемент содержимого будет проанализирован (216, 218) системой (100) рекомендаций как часть множества элементов (216, 218) содержимого для создания набора элементов (214) рекомендаций содержимого в качестве рекомендации для данного пользователя (102) системы рекомендаций, система рекомендаций выполняется на сервере (112), соединенном с сетью (110) передачи данных, способ включает в себя:

[00306] получение (402) сервером указания на сетевой ресурс;

[00307] получение (404) сервером множества характеристик, связанных с сетевым ресурсом;

[00308] создание (406) сервером профиля данного сетевого ресурса для сетевого ресурса, профиль данного сетевого ресурса основан на множестве характеристик;

[00309] выполнение (408) сервером алгоритма машинного обучения для того чтобы на основании профиля данного сетевого ресурса определить параметр пригодности источника для сетевого ресурса, параметр пригодности источника указывает на чувствительность сетевого ресурса к публикации элемента содержимого, который может быть обработан системой рекомендаций;

[00310] выбор (410) по меньшей мере одного элемента содержимого с сетевого ресурса, если параметр пригодности источника определен как превышающий заранее определенный порог, по меньшей мере один элемент содержимого вводится в систему рекомендаций для обработки.

[00311] ПУНКТ 2. Способ по п. 1, в котором:

[00312] алгоритм машинного обучения был обучен, до упомянутого этапа получения, для определения параметра пригодности источника на основе профилей обучающего вебсайта, созданных в связи со множеством обучающих характеристик, причем по меньшей некоторые из них относятся к той же категории, что и множество характеристик.

[00313] ПУНКТ 3. Способ по любому из пп. 1 - 2, в котором множество характеристик включает в себя по меньшей мере абсолютную характеристику и относительную характеристику.

[00314] ПУНКТ 4. Способ по п. 3, в котором абсолютная характеристика и относительная характеристика являются базовыми характеристиками, и способ дополнительно включает в себя:

[00315] создание по меньшей мере одной производной характеристики на основе по меньшей мере абсолютной характеристики и относительной характеристики; и

[00316] при этом профиль данного веб-сайта дополнительно основан по меньшей мере на одной производной характеристике.

[00317] ПУНКТ 5. Способ по любому из пп. 1-4, в котором множество характеристик включает в себя указание на долю посещенных ресурсов по отношению к сетевому ресурсу.

[00318] ПУНКТ 6. Способ по любому из пп. 1-4, в котором множество характеристик включает в себя по меньшей мере одну относительную характеристику, выбранную из следующего:

[00319] количество хитов за визит (HPV);

[00320] количество сессий за визит (SPV);

[00321] количество датированных страниц за визит (DPV);

[00322] количество домашних страниц за визит (MPV);

[00323] время, проведенное на сетевом ресурсе (MTIME);

[00324] последний домен за сессию (LPS);

[00325] первый домен за сессию (FPS);

[00326] количество хитов за сессию (HPS);

[00327] количество визитов на пользователя (VPU);

[00328] количество хитов на пользователя (HPU);

[00329] количество сессий на пользователя (SPU);

[00330] количество датированных страниц за хит (DPH);

[00331] количество домашних страниц за хит (МРН); и

[00332] указание на источник визита, который является одним из:

[00333] визитом пользователя на сайт напрямую (TT_GR);

[00334] визитом пользователя на сайт через поисковую систему (TT_SE);

[00335] визитом пользователя на сайт через социальную сеть (TT_SN);

[00336] визитом пользователя на сайт через электронное сообщение (TT_IM);

[00337] визитом пользователя на сайт, совершенным с помощью сервиса сокращения ссылок (TT_US); и

[00338] визитом пользователя на сайт, совершенным с помощью рекламной платформы (TT_AD).

[00339] ПУНКТ 7. Способ по любому из пп. 1-4, в котором множество характеристик включает в себя по меньшей одно из: число пользователей, которые посещают сетевой ресурс за период времени, число визитов за период времени, число переходов к различным веб-страницам в рамках сетевого ресурса за период времени, и число уникальных сессий с сетевым ресурсом за период времени.

[00340] ПУНКТ 8. Способ по любому из пп. 1-7, в котором множество характеристик является подмножеством всех возможных характеристик, способ дополнительно включает в себя выполнение выбора характеристики для определения подмножества.

[00341] ПУНКТ 9. Способ по п. 8, в котором подмножество всех возможных характеристик состоит из:

[00342] по меньшей мере одного из: доли целевой страницы среди визитов сетевого ресурса в рамках первоначального перехода к сетевому ресурсу в рамках сессии и доли визитов целевой страницы за время переходов внутри сетевого ресурса;

[00343] по меньшей мере одного из: доли веб-страницы, связанной с URL, который содержит дату, когда первая страница была посещена за первый переход на сетевой ресурс, и доли веб-страниц в сетевом ресурсе, посещенном за время сессии, веб-страницы связаны с URL, который содержит дату;

[00344] долевой профиль источников визита для сетевого ресурса, источники визита выбираются из: поисковой системы/социальных сетей/электронной почты и приложения мессенджера/URL/прямых визитов;

[00345] доля сессии, где сетевой ресурс был последним в сессии.

[00346] ПУНКТ 10. Способ по любому из пп. 1-9, в котором параметр пригодности источника может быть пригодным или непригодным.

[00347] ПУНКТ 11. Способ по п. 10, в котором параметр пригодности источника может определяться с помощью по меньшей мере одного из:

[00348] логистического регрессионного анализа;

[00349] упрощенного алгоритма Байеса;

[00350] алгоритма k-ближайших соседей;

[00351] алгоритма случайного леса; и

[00352] алгоритма невзвешенного голосования.

[00353] ПУНКТ 12. Способ по любому из пп. 1-11, в котором упомянутый этап выбора выполняется в ответ на запрос рекомендации от данного пользователя.

[00354] ПУНКТ 13. Сервер (112), включающий в себя:

[00355] носитель (118) данных;

[00356] сетевой интерфейс, выполненный с возможностью передачи данных по сети (110) передачи данных;

[00357] процессор (114), функционально соединенный с носителем данных и сетевым интерфейсом, процессор выполнен с возможностью осуществлять:

[00358] получение указания на сетевой ресурс (124, 126, 128), сетевой ресурс будет обработан для определения его пригодности в качестве источника элемента (216, 218) содержимого, элемент содержимого будет проанализирован системой (100) рекомендаций как часть множества элементов (216, 218) содержимого для создания набора

рекомендуемых элементов (214) содержимого в качестве рекомендации для данного пользователя системы рекомендации;

[00359] получение множества характеристик, связанных с сетевым ресурсом;

[00360] создание профиля данного сетевого ресурса для сетевого ресурса, профиль данного сетевого ресурса основан на множестве характеристик;

[00361] выполнение сервером алгоритма (116) машинного обучения для того чтобы, на основании профиля данного сетевого ресурса, определить параметр пригодности источника для сетевого ресурса, параметр пригодности источника указывает на чувствительность сетевого ресурса к публикации элемента содержимого, который может быть обработан системой рекомендаций;

[00362] выбор (115) по меньшей мере одного элемента содержимого с сетевого ресурса, если параметр пригодности источника определен как превышающий заранее определенный порог, по меньшей мере один элемент содержимого вводится в систему рекомендаций для обработки.

[00363] ПУНКТ 14. Сервер по п. 13, в котором:

[00364] алгоритм машинного обучения был обучен, до упомянутого этапа получения, для определения параметра пригодности источника на основе профилей обучающего вебсайта, созданных в связи со множеством обучающих характеристик, причем по меньшей некоторые из них относятся к той же категории, что и множество характеристик.

[00365] ПУНКТ 15. Сервер по любому из пп. 13-14, в котором множество характеристик включает в себя по меньшей мере абсолютную характеристику и относительную характеристику.

[00366] ПУНКТ 16. Сервер по п. 15, в котором абсолютная характеристика и относительная характеристика являются базовыми характеристиками, и процессор выполнен с возможностью осуществлять:

[00367] создание по меньшей мере одной производной характеристики на основе по меньшей мере абсолютной характеристики и относительной характеристики; и

[00368] при этом профиль данного веб-сайта дополнительно основан по меньшей мере на одной производной характеристике.

[00369] ПУНКТ 17. Сервер по п. 13, в котором множество характеристик включает в себя указание на долю посещенных ресурсов по отношению к сетевому ресурсу.

[00370] ПУНКТ 18. Сервер по п. 13, в котором множество характеристик включает в себя по меньшей мере одну относительную характеристику, выбранную из следующего:

[00371] количество хитов за визит (HPV);

[00372] количество сессий за визит (SPV);

[00373] количество датированных страниц за визит (DPV);

[00374] количество домашних страниц за визит (MPV);

[00375] время, проведенное на сетевом ресурсе (MTIME);

[00376] последний домен за сессию (LPS);

[00377] первый домен за сессию (FPS);

[00378] количество хитов за сессию (HPS);

[00379] количество визитов на пользователя (VPU);

[00380] количество хитов на пользователя (HPU);

[00381] количество сессий на пользователя (SPU);

[00382] количество датированных страниц за хит (DPH);

[00383] количество домашних страниц за хит (МРН); и

[00384] указание на источник визита, который является одним из:

[00385] визитом пользователя на сайт напрямую (TT_GR);

[00386] визитом пользователя на сайт через поисковую систему (TT_SE);

[00387] визитом пользователя на сайт через социальную сеть (TT_SN);

[00388] визитом пользователя на сайт через электронное сообщение (ТТ_IM);

[00389] визитом пользователя на сайт, совершенным с помощью сервиса сокращения ссылок (TT_US); и

[00390] визитом пользователя на сайт, совершенным с помощью рекламной платформы (TT_AD).

[00391] ПУНКТ 19. Сервер по любому из пп. 13-14, в котором множество характеристик включает в себя по меньшей одно из: число пользователей, которые посещают сетевой ресурс за период времени, число визитов за период времени, число переходов к различным веб-страницам в рамках сетевого ресурса за период времени, и число уникальных сессий с сетевым ресурсом за период времени.

[00392] ПУНКТ 20. Сервер по любому из пп. 13-19, в котором множество характеристик является подмножеством всех возможных характеристик, процессор дополнительно выполнен с возможностью осуществлять выполнение выбора характеристики для определения подмножества.

[00393] ПУНКТ 21. Сервер по п. 20, в котором подмножество всех возможных характеристик состоит из:

[00394] по меньшей мере одного из: доли целевой страницы среди визитов сетевого ресурса в рамках первоначального перехода к сетевому ресурсу в рамках сессии и доли визитов целевой страницы за время переходов внутри сетевого ресурса;

[00395] по меньшей мере одного из: доли веб-страницы, связанной с URL, который содержит дату, когда первая страница была посещена за первый переход на сетевой ресурс, и доли веб-страниц в сетевом ресурсе, посещенном за время сессии, веб-страницы связаны с URL, который содержит дату;

[00396] долевой профиль источников визита для сетевого ресурса, источники визита выбираются из: поисковой системы/социальных сетей/электронной почты и приложения мессенджера/URL/прямых визитов;

[00397] доля сессии, где сетевой ресурс был последним в сессии.

[00398] ПУНКТ 22. Сервер по любому из пп. 13-21, в котором параметр пригодности источника может быть пригодным или непригодным.

[00399] ПУНКТ 23. Сервер по п. 22, в котором параметр пригодности источника может определяться с помощью по меньшей мере одного из:

[00400] логистического регрессионного анализа;

[00401] упрощенного алгоритма Байеса;

[00402] алгоритма k-ближайших соседей;

[00403] алгоритма случайного леса; и

[00404] алгоритма невзвешенного голосования.

[00405] ПУНКТ 24. Сервер по любому из пп. 13-23, в котором процессор выполняет выбор в ответ на запрос рекомендации от данного пользователя.

[00407] ВТОРОЙ АСПЕКТ ОСУЩЕСТВЛЕНИЯ СПОСОБА/СИСТЕМЫ

[00408] ПУНКТ 1. Исполняемый на компьютере способ (500) создания рекомендаций (216, 218) содержимого для пользователя (102) электронного устройства (104), способ выполняется рекомендательным сервером (312), доступным электронному устройству через сеть (110) передачи данных, рекомендация содержимого связана с элементом содержимого, доступном на одном из множества сетевых ресурсов (124, 126, 128), доступных через сеть передачи данных, способ включает в себя:

[00409] получение (502) от электронного устройства запроса на рекомендацию (150) содержимого, рекомендация содержимого включает в себя по меньшей мере один рекомендуемый элемент содержимого;

[00410] выполнение (504) модуля (316) первого алгоритма машинного обучения для определения подмножества источников (124, 126, 128) рекомендаций содержимого из множества возможных источников (124,126,128) содержимого, определение подмножества рекомендуемых источников содержимого, включая:

[00411] получение (506) указания на предыдущие взаимодействия пользователей по меньшей мере с одним из: (i) системой рекомендаций и (ii) по меньшей мере некоторыми из множества сетевых ресурсов;

[00412] на основе предыдущих взаимодействий пользователя, определение (508) первого подмножества связанных с пользователем источников содержимого;

[00413] основанных на

[00414] (i) обученной формуле алгоритма машинного обучения других взаимодействий пользователя по меньшей мере с некоторыми другими из множества сетевых ресурсов

[00415] и по меньшей мере одного из:

[00416] (ii) первого подмножества связанных с пользователем источников содержимого; и

[00417] (iii) вектора пользовательского профиля, созданного на основе предыдущих взаимодействий пользователя,

[00418] создание второго подмножества не связанных с пользователем источников содержимого;

[00419] обработку первого подмножества связанных с пользователем источников содержимого и второго подмножества не связанных с пользователем источников содержимого для создания подмножества рекомендуемых источников содержимого;

[00420] анализ (508) подмножества рекомендуемых источников содержимого для выбора множества потенциально рекомендуемых элементов содержимого;

[00421] выполнение (510) второго алгоритма машинного обучения для выбора, из множества потенциально рекомендуемых элементов содержимого, по меньшей мере одного рекомендуемого элемента содержимого; выбор осуществляется на основе вектора профиля пользователя.

[00422] ПУНКТ 2. Способ по п. 1, в котором определение второго подмножества не связанных с пользователем источников содержимого включает в себя применение алгоритма сингулярного разложения (SVD).

[00423] ПУНКТ 3. Способ по п. 2, в котором определение второго подмножества не связанных с пользователем источников содержимого основано на:

[00424] (i) обученной формуле алгоритма машинного обучения других взаимодействий пользователя по меньшей мере с некоторыми другими из множества сетевых ресурсов; и

[00425] (ii) вектор пользовательского профиля создается на основе предыдущих взаимодействий пользователя.

[00426] ПУНКТ 4. Способ по п. 3, в котором способ дополнительно включает в себя, до получения запроса на рекомендацию содержимого, создание алгоритмом сингулярного разложения матрицы событий и пользователей сетевых ресурсов.

[00427] ПУНКТ 5. Способ по п. 1, в котором определение второго подмножества не связанных с пользователем источников содержимого включает в себя применение алгоритма точечной взаимной информации (PMI).

[00428] ПУНКТ 6. Способ по п. 5, в котором определение второго подмножества не связанных с пользователем источников содержимого основано на:

[00429] (i) обученной формуле алгоритма машинного обучения других взаимодействий пользователя по меньшей мере с некоторыми другими из множества сетевых ресурсов; и

[00430] (ii) первом подмножестве связанных с пользователем источников содержимого.

[00431] ПУНКТ 7. Способ по пп. 1-6, в котором выбор из подмножества рекомендуемых источников содержимого множества потенциально рекомендуемых элементов содержимого включает в себя определение заранее определенного числа самых новых элементов содержимого.

[00432] ПУНКТ 8. Способ по любому из пп. 1-6, в котором выбор из подмножества рекомендуемых источников содержимого множества потенциально рекомендуемых элементов содержимого включает в себя определение заранее определенного числа самых популярных элементов содержимого.

[00433] ПУНКТ 9. Способ по любому из пп. 1-6, в котором выбор из подмножества рекомендуемых источников содержимого конкретен для географической области, где выполняется запрос на рекомендуемое содержимое.

[00434] ПУНКТ 10. Способ по любому из пп. 1-9, дополнительно включающий в себя фильтрацию избранных потенциально рекомендуемых элементов содержимого.

[00435] ПУНКТ 11. Способ по п. 10, в котором фильтрация основана на языковых настройках электронного устройства и языковых настройках элемента содержимого.

[00436] ПУНКТ 12. Сервер (312), включающий в себя:

[00437] носитель (118) данных;

[00438] сетевой интерфейс, выполненный с возможностью передачи данных по сети (110) передачи данных;

[00439] процессор (314), функционально соединенный с носителем данных и сетевым интерфейсом, процессор выполнен с возможностью осуществлять:

[00440] получение от электронного устройства (102) запроса на рекомендацию (150) содержимого, рекомендация содержимого включает в себя по меньшей мере один элемент (216, 218) рекомендаций содержимого; рекомендация содержимого связана с элементом содержимого, доступном на множестве сетевых (124, 126, 128) ресурсов, которые доступны через сеть передачи данных:

[00441] выполнение модуля (316) первого алгоритма машинного обучения для определения подмножества источников (124, 126, 128) рекомендаций содержимого из множества возможных источников (124, 126, 128) содержимого, определение подмножества рекомендуемых источников содержимого, включая:

[00442] получение указания на предыдущие взаимодействия пользователей по меньшей мере с одним из: (i) системой рекомендаций и (ii) по меньшей мере некоторыми из множества сетевых ресурсов;

[00443] на основе предыдущих взаимодействий пользователя, определение первого подмножества связанных с пользователем источников содержимого;

[00444] на основе

[00445] (i) обученной формулы алгоритма машинного обучения других взаимодействий пользователя по меньшей мере с некоторыми другими из множества сетевых ресурсов

[00446] и по меньшей мере одного из:

[00447] (ii) первого подмножества связанных с пользователем источников содержимого; и

[00448] (iii) вектора пользовательского профиля, созданного на основе предыдущих взаимодействий пользователя,

[00449] создание второго подмножества не связанных с пользователем источников содержимого;

[00450] обработку первого подмножества связанных с пользователем источников содержимого и второго подмножества не связанных с пользователем источников содержимого для создания подмножества рекомендуемых источников содержимого;

[00451] анализ подмножества рекомендуемых источников содержимого для выбора множества потенциально рекомендуемых элементов содержимого;

[00452] выполнение модуля (318) второго алгоритма машинного обучения для выбора, из множества потенциально рекомендуемых элементов содержимого, по меньшей мере одного рекомендуемого элемента содержимого; выбор осуществляется на основе вектора профиля пользователя.

[00453] ПУНКТ 13. Сервер по п. 12, в котором для определения второго подмножества не связанных с пользователем источников содержимого, процессор выполнен с возможностью применять алгоритм сингулярного разложения (SVD).

[00454] ПУНКТ 14. Сервер по п. 13, в котором определение второго подмножества не связанных с пользователем источников содержимого основано на:

[00455] (i) обученной формуле алгоритма машинного обучения других взаимодействий пользователя по меньшей мере с некоторыми другими из множества сетевых ресурсов; и

[00456] (ii) вектор пользовательского профиля создается на основе предыдущих взаимодействий пользователя.

[00457] ПУНКТ 15. Сервер по п. 14, в котором сервер дополнительно выполнен с возможностью, до этапа получения запроса на рекомендацию содержимого, осуществлять создание, с помощью алгоритма сингулярного разложения, матрицы событий и пользователей сетевых ресурсов.

[00458] ПУНКТ 16. Сервер по п. 12, в котором для определения второго подмножества не связанных с пользователем источников содержимого, процессор выполнен с возможностью применять алгоритм точечной взаимной информации (PMI).

[00459] ПУНКТ 17. Сервер по п. 16, в котором определение второго подмножества не связанных с пользователем источников содержимого основано на:

[00460] (i) обученной формуле алгоритма машинного обучения других взаимодействий пользователя по меньшей мере с некоторыми другими из множества сетевых ресурсов; и

[00461] (ii) первом подмножестве связанных с пользователем источников содержимого.

[00462] ПУНКТ 18. Сервер по любому из пп. 12-17, в котором выбор из подмножества рекомендуемых источников содержимого множества потенциально рекомендуемых элементов содержимого включает в себя определение заранее определенного числа самых новых элементов содержимого.

[00463] ПУНКТ 19. Сервер по любому из пп. 12-17, в котором выбор из подмножеств рекомендуемых источников содержимого множества потенциально рекомендуемых элементов содержимого включает в себя определение заранее определенного числа самых популярных элементов содержимого.

[00464] ПУНКТ 20. Сервер по любому из пп. 12-17, в котором выбор из подмножества рекомендуемых источников содержимого конкретен для географической области, где выполняется запрос на рекомендуемое содержимое.

[00465] ПУНКТ 21. Сервер по любому из пп. 12-20, в котором процессор дополнительно выполнен с возможностью осуществлять фильтрацию выбранных потенциально рекомендуемых элементов содержимого.

[00466] ПУНКТ 22. Сервер по п. 21, в котором фильтрация основана на языковых настройках электронного устройства и языковых настройках элемента содержимого.

Похожие патенты RU2632132C1

название год авторы номер документа
СПОСОБ И УСТРОЙСТВО ДЛЯ ВЫБОРА СЕТЕВОГО РЕСУРСА В КАЧЕСТВЕ ИСТОЧНИКА СОДЕРЖИМОГО ДЛЯ СИСТЕМЫ РЕКОМЕНДАЦИЙ 2016
  • Ламбурт Виктор Григорьевич
  • Лифарь Игорь Игоревич
RU2636702C1
Способ и устройство для обучения алгоритма машинного обучения (MLA) по созданию рекомендаций содержимого в системе рекомендаций и способ и устройство для создания рекомендуемого содержимого с помощью алгоритма машинного обучения 2016
  • Лифарь Игорь Игоревич
  • Ламбурт Виктор Григорьевич
RU2731659C2
Способ и система для формирования рекомендаций цифрового контента 2018
  • Ламбурт Виктор Григорьевич
  • Ушанов Дмитрий Валерьевич
  • Иванычев Сергей Дмитриевич
RU2731335C2
СПОСОБ И СИСТЕМА ДЛЯ ОПРЕДЕЛЕНИЯ ЗАВИСЯЩИХ ОТ ПОЛЬЗОВАТЕЛЯ ПРОПОРЦИЙ СОДЕРЖИМОГО ДЛЯ РЕКОМЕНДАЦИИ 2018
  • Зимовнов Андрей Вадимович
  • Соколов Евгений Андреевич
RU2720899C2
СПОСОБ И СИСТЕМА ДЛЯ СОЗДАНИЯ РЕКОМЕНДАЦИИ ЦИФРОВОГО СОДЕРЖИМОГО 2018
  • Соколов Евгений Андреевич
  • Ламбурт Виктор Григорьевич
  • Шарчилев Борис Дмитриевич
  • Сендерович Никита Леонидович
RU2720952C2
СПОСОБ И СЕРВЕР ДЛЯ ВЫБОРА ЭЛЕМЕНТОВ РЕКОМЕНДАЦИЙ ДЛЯ ПОЛЬЗОВАТЕЛЯ 2017
  • Данильченко Андрей Петрович
  • Животворев Дмитрий Сергеевич
RU2693323C2
Способ и сервер создания рекомендуемого набора элементов для пользователя 2015
  • Ройзнер Михаил Александрович
  • Ламбурт Виктор Григорьевич
RU2629638C2
СПОСОБ И СЕРВЕР СОЗДАНИЯ РЕКОМЕНДОВАННОГО НАБОРА ЭЛЕМЕНТОВ 2015
  • Лифарь Игорь Игоревич
  • Ройзнер Михаил Александрович
RU2632100C2
СПОСОБ И УСТРОЙСТВО ДЛЯ СОЗДАНИЯ РЕКОМЕНДУЕМОГО СПИСКА СОДЕРЖИМОГО 2015
  • Ройзнер Михаил Александрович
RU2632131C2
Способ и система определения параметра релевантность для элементов содержимого 2018
  • Соколов Евгений Андреевич
  • Ламбурт Виктор Григорьевич
  • Шарчилев Борис Дмитриевич
  • Данильченко Андрей Петрович
RU2714594C1

Иллюстрации к изобретению RU 2 632 132 C1

Реферат патента 2017 года СПОСОБ И УСТРОЙСТВО ДЛЯ СОЗДАНИЯ РЕКОМЕНДАЦИЙ СОДЕРЖИМОГО В СИСТЕМЕ РЕКОМЕНДАЦИЙ

Изобретение относится к области компьютерной техники и сетевым технологиям и, в частности, к системам рекомендаций содержимого сетевых ресурсов. Технический результат заключается в повышении эффективности рекомендаций содержимого, доступного на сетевых ресурсах. Технический результат достигается за счет получения от электронного устройства запроса на рекомендацию содержимого, рекомендация содержимого включает в себя рекомендуемый элемент содержимого, выполнения модуля первого алгоритма машинного обучения для определения подмножества рекомендуемых источников содержимого из множества возможных источников содержимого, определения подмножества рекомендуемых источников содержимого, включая получение указания на предыдущие взаимодействия пользователей по меньшей мере с одним из: системой рекомендаций и по меньшей мере некоторыми из множества сетевых ресурсов, на основе предыдущих взаимодействий пользователя, определения первого подмножества связанных с пользователем источников содержимого, на основе обученной формулы алгоритма машинного обучения других взаимодействий пользователя с некоторыми другими из множества сетевых ресурсов, и анализа подмножества рекомендуемых источников содержимого для выбора множества потенциально рекомендуемых элементов содержимого. 2 н. и 20 з.п. ф-лы, 5 ил.

Формула изобретения RU 2 632 132 C1

1. Исполняемый на компьютере способ создания рекомендаций содержимого для пользователя электронного устройства, способ выполняется рекомендательным сервером, доступным электронному устройству через сеть передачи данных, рекомендация содержимого связана с элементом содержимого, доступном на одном из множества сетевых ресурсов, доступных через сеть передачи данных, способ включает в себя:

получение от электронного устройства запроса на рекомендацию содержимого, рекомендация содержимого включает в себя по меньшей мере один рекомендуемый элемент содержимого;

выполнение модуля первого алгоритма машинного обучения для определения подмножества рекомендуемых источников содержимого из множества возможных источников содержимого, определение подмножества рекомендуемых источников содержимого, включая:

получение указания на предыдущие взаимодействия пользователей по меньшей мере с одним из: системой рекомендаций и по меньшей мере некоторыми из множества сетевых ресурсов;

на основе предыдущих взаимодействий пользователя, определение первого подмножества связанных с пользователем источников содержимого;

на основе обученной формулы алгоритма машинного обучения других взаимодействий пользователя по меньшей мере с некоторыми другими из множества сетевых ресурсов

и по меньшей мере одного из:

первого подмножества связанных с пользователем источников содержимого; и

вектора пользовательского профиля, созданного на основе предыдущих взаимодействий пользователя,

создание второго подмножества не связанных с пользователем источников содержимого;

обработку первого подмножества связанных с пользователем источников содержимого и второго подмножества не связанных с пользователем источников содержимого для создания подмножества рекомендуемых источников содержимого;

анализ подмножества рекомендуемых источников содержимого для выбора множества потенциально рекомендуемых элементов содержимого;

выполнение модуля второго алгоритма машинного обучения для выбора, из множества потенциально рекомендуемых элементов содержимого, по меньшей мере одного рекомендуемого элемента содержимого; выбор осуществляется на основе вектора профиля пользователя.

2. Способ по п. 1, в котором определение второго подмножества связанных с пользователем источников содержимого включает в себя применение алгоритма сингулярного разложения (SVD).

3. Способ по п. 2, в котором определение второго подмножества не связанных с пользователем источников содержимого основано на:

обученной формуле алгоритма машинного обучения других взаимодействий пользователя по меньшей мере с некоторыми другими из множества сетевых ресурсов; и

вектор пользовательского профиля создается на основе предыдущих взаимодействий пользователя.

4. Способ по п. 3, в котором дополнительно выполняют, до получения запроса на рекомендацию содержимого, создание алгоритмом сингулярного разложения матрицы событий и пользователей сетевых ресурсов.

5. Способ по п. 1, в котором определение второго подмножества не связанных с пользователем источников содержимого включает в себя применение алгоритма точечной взаимной информации (PMI).

6. Способ по п. 5, в котором определение второго подмножества не связанных с пользователем источников содержимого основано на:

обученной формуле алгоритма машинного обучения других взаимодействий пользователя по меньшей мере с некоторыми другими из множества сетевых ресурсов; и

первом подмножестве связанных с пользователем источников содержимого.

7. Способ по п. 1, в котором выбор из подмножества рекомендуемых источников содержимого множества потенциально рекомендуемых элементов содержимого включает в себя определение заранее определенного числа самых новых элементов содержимого.

8. Способ по п. 1, в котором выбор из подмножества рекомендуемых источников содержимого множества потенциально рекомендуемых элементов содержимого включает в себя определение заранее определенного числа самых популярных элементов содержимого.

9. Способ по п. 1, в котором выбор из подмножества рекомендуемых источников содержимого конкретен для географической области, где выполняется запрос на рекомендуемое содержимое.

10. Способ по п. 1, в котором дополнительно выполняют фильтрацию выбранных потенциально рекомендуемых элементов содержимого.

11. Способ по п. 10, в котором фильтрация основана на языковых настройках электронного устройства и языковых настройках элемента содержимого.

12. Сервер для создания рекомендаций содержимого, включающий в себя:

носитель данных;

сетевой интерфейс, выполненный с возможностью соединения по сети передачи данных;

процессор, функционально соединенный с носителем данных и сетевым интерфейсом, процессор выполнен с возможностью осуществлять:

получение от электронного устройства запроса на рекомендацию содержимого, рекомендация содержимого включает в себя по меньшей мере один рекомендуемый элемент содержимого; рекомендация содержимого связана с элементом содержимого, доступном на множестве сетевых ресурсов, которые доступны через сеть передачи данных:

выполнение модуля первого алгоритма машинного обучения для определения подмножества рекомендуемых источников содержимого из множества возможных источников содержимого, определение подмножества рекомендуемых источников содержимого, включая:

получение указания на предыдущие взаимодействия пользователей по меньшей мере с одним из: системой рекомендаций и по меньшей мере некоторыми из множества сетевых ресурсов;

на основе предыдущих взаимодействий пользователя, определение первого подмножества связанных с пользователем источников содержимого;

на основе обученной формулы алгоритма машинного обучения других взаимодействий пользователя по меньшей мере с некоторыми другими из множества сетевых ресурсов

и по меньшей мере одного из:

первого подмножества связанных с пользователем источников содержимого; и

вектора пользовательского профиля, созданного на основе предыдущих взаимодействий пользователя,

создание второго подмножества не связанных с пользователем источников содержимого;

обработку первого подмножества связанных с пользователем источников содержимого и второго подмножества не связанных с пользователем источников содержимого для создания подмножества рекомендуемых источников содержимого;

анализ подмножества рекомендуемых источников содержимого для выбора множества потенциально рекомендуемых элементов содержимого;

выполнение модуля второго алгоритма машинного обучения для выбора, из множества потенциально рекомендуемых элементов содержимого, по меньшей мере одного рекомендуемого элемента содержимого; выбор осуществляется на основе вектора профиля пользователя.

13. Сервер по п. 12, в котором для определения второго подмножества не связанных с пользователем источников содержимого, процессор выполнен с возможностью применять алгоритм сингулярного разложения (SVD).

14. Сервер по п. 13, в котором процессор выполнен с возможностью осуществлять определение второго подмножества не связанных с пользователем источников содержимого на основе:

обученной формулы алгоритма машинного обучения других взаимодействий пользователя по меньшей мере с некоторыми другими из множества сетевых ресурсов; и

созданного вектора пользовательского профиля на основе предыдущих взаимодействий пользователя.

15. Сервер по п. 14, в котором процессор дополнительно выполнен с возможностью, до этапа получения запроса на рекомендацию содержимого, осуществлять создание, с помощью алгоритма сингулярного разложения, матрицы событий и пользователей сетевых ресурсов.

16. Сервер по п. 12, в котором для определения второго подмножества не связанных с пользователем источников содержимого, процессор выполнен с возможностью применять алгоритм точечной взаимной информации (PMI).

17. Сервер по п. 16, в котором процессор выполнен с возможностью осуществлять определение второго подмножества не связанных с пользователем источников содержимого на основе:

обученной формулы алгоритма машинного обучения других взаимодействий пользователя по меньшей мере с некоторыми другими из множества сетевых ресурсов; и

первом подмножестве связанных с пользователем источников содержимого.

18. Сервер по п. 12, в котором при выборе из подмножества рекомендуемых источников содержимого множества потенциально рекомендуемых элементов содержимого процессор выполнен с возможностью осуществлять определение заранее определенного числа самых новых элементов содержимого.

19. Сервер по п. 12, в котором при выборе из подмножества рекомендуемых источников содержимого множества потенциально рекомендуемых элементов содержимого процессор выполнен с возможностью осуществлять определение заранее определенного числа самых популярных элементов содержимого.

20. Сервер по п. 12, в котором процессор выполнен с возможностью осуществлять выбор из подмножества рекомендуемых источников содержимого конкретных для географической области, где выполняется запрос на рекомендуемое содержимое.

21. Сервер по п. 12, в котором процессор дополнительно выполнен с возможностью осуществлять фильтрацию выбранных потенциально рекомендуемых элементов содержимого.

22. Сервер по п. 21, в котором фильтрация основана на языковых настройках электронного устройства и языковых настройках элемента содержимого.

Документы, цитированные в отчете о поиске Патент 2017 года RU2632132C1

Токарный резец 1924
  • Г. Клопшток
SU2016A1
Устройство для закрепления лыж на раме мотоциклов и велосипедов взамен переднего колеса 1924
  • Шапошников Н.П.
SU2015A1
Устройство для закрепления лыж на раме мотоциклов и велосипедов взамен переднего колеса 1924
  • Шапошников Н.П.
SU2015A1
ПОИСК И ПРОСМОТР WEB-СТРАНИЦ, УЛУЧШЕННЫЙ ПОСРЕДСТВОМ ОБЛАЧНЫХ ВЫЧИСЛЕНИЙ 2012
  • Кхорасхади Бехрооз
  • Ресхади Мохаммад Х.
  • Дас Саумитра М.
RU2577193C2
СПОСОБ ОТБОРА ЭФФЕКТИВНЫХ ВАРИАНТОВ В ПОИСКОВЫХ И РЕКОМЕНДАТЕЛЬНЫХ СИСТЕМАХ (ВАРИАНТЫ) 2013
  • Алескеров Фуад Таги Оглы
  • Митичкин Евгений Олегович
  • Чистяков Вячеслав Васильевич
  • Швыдун Сергей Владимирович
  • Якуба Вячеслав Иванович
RU2543315C2

RU 2 632 132 C1

Авторы

Тихонов Алексей Викторович

Даты

2017-10-02Публикация

2016-07-07Подача