ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ
[001] Настоящая технология относится к системе рекомендаций в общем смысле и в частности к способу и устройству для выбора сетевого ресурса в качестве источника содержимого для системы рекомендаций.
УРОВЕНЬ ТЕХНИКИ
[002] Различные глобальные или локальные сети связи (интернет, всемирная паутина, локальные сети и подобные им) предлагают пользователю большой объем информации. Информация включает в себя контекстуальные разделы, такие как, среди прочего, новости и текущие события, карты, информация о компаниях, финансовая информация и ресурсы, информация о траффике, игры и информация развлекательного характера. Пользователи используют множество клиентских устройств (настольный компьютер, портативный компьютер, ноутбук, смартфон, планшеты и подобные им) для получения доступа к богатому информационному контенту (например, изображениям, аудио- и видеофайлам, анимированным изображениям и прочему мультимедийному контенту подобных сетей).
[003] Объем доступной информации на различных интернет-ресурсах экспоненциально вырос за последние несколько лет. Были разработаны различные решения, которые позволяют обычному пользователю находить информацию, которую он(а) ищет. Примером такого решения является поисковая система. Примеры поисковых систем включают в себя такие поисковые системы, как: GOOGLE™, YANDEX™, YAHOO!™ и другие. Пользователь может получить доступ к интерфейсу поисковой системы и подтвердить поисковый запрос, связанный с информацией, которую пользователь хочет найти в Интернете. В ответ на поисковый запрос поисковые системы предоставляют ранжированный список результатов поиска. Ранжированный список результатов поиска создается на основе различных алгоритмов ранжирования, которые реализованы в конкретной поисковой системе, и которые используются пользователем, производящим поиск. Общей целью таких алгоритмов ранжирования является представление наиболее релевантных результатов вверху ранжированного списка, а менее релевантных результатов - на менее высоких позициях ранжированного списка результатов поиска (а наименее релевантные результаты поиска будут расположены внизу ранжированного списка результатов поиска).
[004] Поисковые системы обычно являются хорошим поисковым инструментом в том случае, когда пользователю заранее известно, что именно он(а) хочет найти. Другими словами, если пользователь заинтересован в получении информации о наиболее популярных местах в Италии (т.е. поисковая тема известна), пользователь может ввести поисковый запрос: «Наиболее популярные места в Италии». Поисковая система предоставит ранжированный список интернет-ресурсов, которые потенциально являются релевантными по отношению к поисковому запросу. Пользователь далее может просматривать ранжированный список результатов поиска для того, чтобы получить информацию, в которой он заинтересован, в данном случае о посещаемых местах в Италии. Если пользователь по какой-либо причине не удовлетворен представленными результатами, пользователь может произвести вторичный поиск, уточнив запрос, например «Наиболее популярные места в Италии летом», «Наиболее популярные места на юге Италии», «Наиболее популярные места в Италии для романтичного отдыха».
[005] Существует и другой подход, в котором пользователю предоставляется возможность обнаруживать содержимое и, конкретнее, позволяется отображать и/или рекомендовать содержимое, в поиске которого пользователь не был явно заинтересован. В некоторым смысле подобные системы рекомендуют пользователю содержимое без отдельного поискового запроса, на основе явных или неявных интересов пользователя.
[006] Примерами таких систем являются система рекомендаций FLIPBOARD, которая агрегирует и рекомендует содержимое из различных социальных сетей. Система рекомендаций FLIPBOARD предоставляет содержимое в «журнальном формате», где пользователь может «пролистывать» страницы с рекомендуемым/агрегированным содержимым. Системы рекомендаций собирают содержимое из социальных медиа и других веб-сайтах, представляют его в журнальном формате и позволяют пользователям «пролистывать» ленты социальных новостей и ленты веб-сайтов, которые поддерживают партнерские отношения с компанией, что позволяет эффективно «рекомендовать» содержимое пользователю, даже если пользователь явно не выражал свой интерес в конкретном содержимом.
[007] Для создания ранжированных результатов поиска в поисковой системе или списка рекомендуемых ресурсов в обычной системе рекомендаций соответствующие системы используют алгоритмы машинного обучения для выбора результатов поиска и/или рекомендаций содержимого. Существуют различные алгоритмы машинного обучения, известные в данной области техники, и использующиеся в поисковых системах и системах рекомендаций. Как известно, обычные алгоритмы машинного обучения сначала «обучаются» с помощью обучающей выборки (которая является помеченной или непомеченной) для создания формулы алгоритма машинного обучения, которая далее применяется для определения во время работы выходных данных на основе входных данных системы.
[008] В обычной системе рекомендаций алгоритм машинного обучения системы рекомендаций выбирает набор потенциальных рекомендуемых элементов из набора потенциальных ресурсов для рекомендуемых элементов. Обычно алгоритм машинного обучения, который связан с подобной системой рекомендаций, получает (в течение некоторого времени) знания о различных потенциальных ресурсах элементов содержимого, предыдущие взаимодействия пользователя с различными потенциальными ресурсами элементов содержимого (а также созданные рекомендации), и использует это знание для создания рекомендации для конкретного пользователя системы рекомендаций.
РАСКРЫТИЕ
[009] Задачей предлагаемой технологии является устранение по меньшей мере некоторых недостатков, присущих известному уровню техники.
[0010] Варианты осуществления настоящей технологии были разработаны на предположении изобретателей о том, что алгоритмы машинного обучения, используемые для выбора рекомендаций содержимого, потребляют очень много вычислительных ресурсов компьютера. Тем не менее, система рекомендаций требует, чтобы рекомендации содержимого выводились достаточно быстро, когда пользователь системы рекомендаций запрашивает рекомендации содержимого. Другими словами, разработчики настоящей технологии обратили внимание, что может быть желательно переместить конкретные задачи системы рекомендаций из реального времени в оффлайн, т.е. выполнять их до того, как пользователь системы рекомендаций запросил рекомендуемое содержимое.
[0011] Далее, разработчики настоящей технологии полагают, что объем потенциальных источников рекомендаций содержимого достаточно велик. Анализ всех потенциальных источников рекомендаций содержимого может занимать достаточно много времени и требовать значительных вычислительных ресурсов. Таким образом, разработчики настоящей технологии старались разработать способ и систему, которая заранее классифицирует потенциальные источники рекомендаций содержимого. Технический эффект от подобной предварительной классификации может быть двухсторонним. С одной стороны, предварительная классификация потенциальных источников может выполняться оффлайн. С другой стороны, данные о профиле источника содержимого могут быть использованы в новых областях, что потребует предварительной классификации большого числа потенциальных источников рекомендаций содержимого. Варианты осуществления настоящей технологии основаны на предположении разработчиков о том, что некоторые сетевые источники лучше подходят в качестве источников рекомендации. Не ограничиваясь какой-либо конкретной теорией, разработчики настоящей технологии разработали системы и способы, которые предварительно классифицируют сетевые ресурсы как «потенциальные источники содержимого» (на основе профиля сетевого ресурса), система использует алгоритм машинного обучения, который присваивает больший весовой коэффициент тем сетевым ресурсам, которые обладают «быстрым» содержимым, т.е. содержимым, которое часто обновляется. Сетевые ресурсы могут могут быть (без установления ограничений) новостными агрегаторами, агрегаторами СМИ и так далее.
[0012] Другие варианты осуществления настоящей технологии нацелены на разработку источников рекомендаций содержимого для данного пользователя системы рекомендаций. Эти варианты осуществления технологии анализируют конкретные для пользователя источники рекомендаций содержимого (т.е. источники, с которыми данный пользователь взаимодействовал в прошлом) и обогащает их источниками содержимого, с которыми пользователь мог не взаимодействовать в прошлом. Таким образом, некоторые варианты осуществления настоящей технологии позволяют системе рекомендаций смешивать рекомендованное содержимое из известных данному пользователю источников и неизвестных источников, что позволяет системе рекомендаций «открывать» новые источники рекомендованного содержимого для данного пользователя.
[0013] Первым объектом настоящей технологии является способ выбора сетевого ресурса в качестве источника элемента содержимого, элемент содержимого будет проанализирован системой рекомендаций как часть множества элементов содержимого для создания набора рекомендуемых элементов содержимого в качестве рекомендации для данного пользователя системы рекомендации. Система рекомендаций выполняется на сервере, который соединен с сетью передачи данных. Способ включает в себя получение сервером указания на сетевой ресурс; получение сервером множества характеристик, связанных с сетевым ресурсом; создание сервером профиля данного сетевого ресурса для сетевого ресурса, профиль данного сетевого ресурса основан на множестве характеристик; выполнение сервером алгоритма машинного обучения для того, чтобы на основании профиля данного сетевого ресурса определить параметр пригодности источника для сетевого ресурса, параметр пригодности источника указывает на чувствительность сетевого ресурса к публикации элемента содержимого, который может быть обработан системой рекомендаций, выбор по меньшей мере одного элемента содержимого с сетевого ресурса, если параметр пригодности источника определен как превышающий заранее определенный порог, по меньшей мере один элемент содержимого вводится в систему рекомендаций для обработки.
[0014] В некоторых вариантах осуществления способа, алгоритм машинного обучения был обучен, до упомянутого этапа получения, для определения параметра пригодности источника на основе профилей обучающего веб-сайта, созданных в связи со множеством обучающих характеристик, причем по меньшей некоторые из них относятся к той же категории, что и множество характеристик.
[0015] В некоторых вариантах осуществления способа, множество характеристик включает в себя по меньшей мере абсолютную характеристику и относительную характеристику.
[0016] В некоторых вариантах осуществления способа, абсолютная характеристика и относительная характеристика являются базовыми характеристиками, и способ далее включает в себя:
[0017] создание по меньшей мере одной производной характеристики на основе по меньшей мере абсолютной характеристики и относительной характеристики; и
[0018] при этом профиль данного веб-сайта далее основан по меньшей мере на одной производной характеристике.
[0019] В некоторых вариантах осуществления способа, множество характеристик включает в себя указание на долю посещенных ресурсов по отношению в сетевому ресурсу.
[0020] В некоторых вариантах осуществления способа, множество характеристик включает в себя по меньшей мере одну относительную характеристику, выбранную из:
[0021] количество хитов за визит (HPV);
[0022] количество сессий за визит (SPV);
[0023] количество датированных страниц за визит (DPV);
[0024] количество домашних страниц за визит (MPV);
[0025] время, проведенное на сетевом ресурсе (MTIME);
[0026] последний домен за сессию (LPS);
[0027] первый домен за сессию (FPS);
[0028] количество хитов за сессию (HPS);
[0029] количество визитов пользователя (VPU);
[0030] количество хитов пользователя (HPU);
[0031] количество сессий пользователя (SPU);
[0032] количество датированных страниц за хит (DPH);
[0033] количество домашних страниц за хит (МРН); и
[0034] указание на источник визита, который является одним из:
[0035] визитом пользователя на сайт напрямую (TT_GR);
[0036] визитом пользователя на сайт через поисковую систему (TT_SE);
[0037] визитом пользователя на сайт через социальную сеть (TT_SN);
[0038] визитом пользователя на сайт через электронное сообщение (ТТ_IM);
[0039] визитом пользователя на сайт, совершенным с помощью сервиса сокращения ссылок (TT_US);
[0040] визитом пользователя на сайт, совершенным с помощью рекламной платформы (TT_AD).
[0041] В некоторых вариантах осуществления способа, множество характеристик включает в себя по меньшей одно из: число пользователей, которые посещают сетевой ресурс за период времени, число визитов за период времени, число переходов к различным веб-страницам в рамках сетевого ресурса за период времени, и число уникальных сессий с сетевым ресурсом за период времени.
[0042] В некоторых вариантах осуществления способа, множество характеристик в подмножестве всех возможных характеристик, способ далее включает в себя выполнение выбора характеристики для определения подмножества.
[0043] В некоторых вариантах осуществления способа, подмножество всех возможных характеристик состоит из:
[0044] по меньшей мере одного из: доли целевой страницы среди визитов сетевого ресурса в рамках первоначального перехода к сетевому ресурса в рамках сессии и доли визитов целевой страницы за время переходов внутри сетевого ресурса;
[0045] по меньшей мере одного из: доли веб-страницы, связанной с URL, который содержит данные, представляющие собой первую страницу, которая была посещена за первый переход на сетевой ресурс, и доли веб-страниц в сетевом ресурсе, посещенном за время сессии, веб-страницы связаны с URL, который содержит данные;
[0046] долевого профиля источников визита для сетевого ресурса, источники визита выбираются из: поисковой системы/социальных сетей/электронной почты и приложения мессенджера/сервиса сокращения ссылок /прямых визитов;
[0047] доли сессии, которую сетевой ресурс занимает в последней сессии.
[0048] В некоторых вариантах осуществления способа, параметр пригодности источника может быть пригодным или непригодным.
[0049] В некоторых вариантах осуществления способа, параметр пригодности источника может определяться с помощью по меньшей мере одного из:
[0050] логистического регрессионного анализа;
[0051] упрощенного алгоритма Байеса;
[0052] алгоритма k-ближайших соседей;
[0053] алгоритма случайного леса; и
[0054] алгоритма невзвешенного голосования.
[0055] В некоторых вариантах осуществления способа, упомянутый этап выбора выполняется в ответ на запрос рекомендации от данного пользователя.
[0056] Еще одним объектом настоящего технического решения является сервер. Сервер включает в себя:
[0057] носитель данных;
[0058] сетевой интерфейс, выполненный с возможностью соединения по сети передачи данных;
[0059] процессор, функционально соединенный с носителем данным и сетевым интерфейсом, процессор выполняется с возможностью осуществлять:
[0060] получение указания на сетевой ресурс, сетевой ресурс будет обработан для определения его пригодности в качестве источника элемента содержимого, элемент содержимого будет проанализирован системой рекомендаций как часть множества элементов содержимого для создания набора рекомендуемых элементов содержимого в качестве рекомендации для данного пользователя системы рекомендации;
[0061] получение множества характеристик, связанных с сетевым ресурсом;
[0062] создание профиля данного сетевого ресурса для сетевого ресурса, профиль данного сетевого ресурса основан на множестве характеристик;
[0063] выполнение сервером алгоритма машинного обучения для того, чтобы на основании профиля данного сетевого ресурса определить параметр пригодности источника для сетевого ресурса, параметр пригодности источника указывает на чувствительность сетевого ресурса к публикации элемента содержимого, который может быть обработан системой рекомендаций,
[0064] выбор по меньшей мере одного элемента содержимого с сетевого ресурса, если параметр пригодности источника определен как превышающий заранее определенный порог, по меньшей мере один элемент содержимого вводится в систему рекомендаций для обработки.
[0065] В некоторых вариантах осуществления сервера, алгоритм машинного обучения был обучен, до упомянутого этапа получения, для определения параметра пригодности источника на основе профилей обучающего веб-сайта, созданных в связи со множеством обучающих характеристик, причем по меньшей некоторые из них относятся к той же категории, что и множество характеристик.
[0066] В некоторых вариантах осуществления сервера, множество характеристик включает в себя по меньшей мере абсолютную характеристику и относительную характеристику.
[0067] В некоторых вариантах осуществления сервера, абсолютная характеристика и относительная характеристика являются базовыми характеристиками, и процессор выполнен с возможностью осуществлять:
[0068] создание по меньшей мере одной производной характеристики на основе по меньшей мере абсолютной характеристики и относительной характеристики; и
[0069] при этом профиль данного веб-сайта далее основан по меньшей мере на одной производной характеристике.
[0070] В некоторых вариантах осуществления сервера, множество характеристик включает в себя указание на долю посещенных ресурсов по отношению в сетевому ресурсу.
[0071] В некоторых вариантах осуществления сервера, множество характеристик включает в себя по меньшей мере одну относительную характеристику, выбранную из:
[0072] количество хитов за визит (HPV);
[0073] количество сессий за визит (SPV);
[0074] количество датированных страниц за визит (DPV);
[0075] количество домашних страниц за визит (MPV);
[0076] время, проведенное на сетевом ресурсе (MTIME);
[0077] последний домен за сессию (LPS);
[0078] первый домен за сессию (FPS);
[0079] количество хитов за сессию (HPS);
[0080] количество визитов пользователя (VPU);
[0081] количество хитов пользователя (HPU);
[0082] количество сессий пользователя (SPU);
[0083] количество датированных страниц за хит (DPH);
[0084] количество домашних страниц за хит (МРН); и
[0085] указание на источник визита, который является одним из:
[0086] визитом пользователя на сайт напрямую (TT GR);
[0087] визитом пользователя на сайт через поисковую систему (TT SE);
[0088] визитом пользователя на сайт через социальную сеть (TT_SN);
[0089] визитом пользователя на сайт через электронное сообщение (ТТ_IM);
[0090] визитом пользователя на сайт, совершенным с помощью сервиса сокращения ссылок (TT_US);
[0091] визитом пользователя на сайт, совершенным с помощью рекламной платформы (TTAD).
[0092] В некоторых вариантах осуществления сервера, множество характеристик включает в себя по меньшей одно из: число пользователей, которые посещают сетевой ресурс за период времени, число визитов за период времени, число переходов к различным веб-страницам в рамках сетевого ресурса за период времени и число уникальных сессий с сетевым ресурсом за период времени.
[0093] В некоторых вариантах осуществления сервера, множество характеристик в подмножестве всех возможных характеристик, способ далее включает в себя выполнение выбора характеристики для определения подмножества.
[0094] В некоторых вариантах осуществления сервера, подмножество всех возможных характеристик состоит из:
[0095] по меньшей мере одного из: доли целевой страницы среди визитов сетевого ресурса в рамках первоначального перехода к сетевому ресурса в рамках сессии и доли визитов целевой страницы за время переходов внутри сетевого ресурса;
[0096] по меньшей мере одного из: доли веб-страницы, связанной с URL, который содержит данные, представляющие собой первую страницу, которая была посещена за первый переход на сетевой ресурс, и доли веб-страниц в сетевом ресурсе, посещенном за время сессии, веб-страницы связаны с URL, который содержит данные;
[0097] долевой профиль источников визита для сетевого ресурса, источники визита выбираются из: поисковой системы/социальных сетей/электронной почты и приложения мессенджера/сервиса сокращения ссылок /прямых визитов;
[0098] доля сессии, которую сетевой ресурс занимает в последней сессии.
[0099] В некоторых вариантах осуществления сервера, параметр пригодности источника может быть пригодным или непригодным.
[00100] В некоторых вариантах осуществления сервера, параметр пригодности источника может определяться с помощью по меньшей мере одного из:
[00101] логистического регрессионного анализа;
[00102] упрощенного алгоритма Байеса;
[00103] алгоритма k-ближайших соседей;
[00104] алгоритма случайного леса; и
[00105] алгоритма невзвешенного голосования.
[00106] В некоторых вариантах осуществления сервера, процессор выполнен с возможностью выполнить осуществление выбора в ответ на запрос рекомендации от данного пользователя.
[00107] Еще одним объектом настоящего изобретения является исполняемый на компьютере способ создания рекомендаций содержимого для пользователя электронного устройства. Способ выполняется на рекомендательном сервере, который доступен электронному устройству через сеть передачи данных, рекомендации содержимого связаны с элементом содержимого, доступном на одном из множества сетевых ресурсов, которые доступны через сеть передачи данных. Способ включает в себя: получение от электронного устройства запроса запроса на рекомендацию содержимого, рекомендация содержимого включает в себя по меньшей мере один элемент рекомендации содержимого; выполнение модуля первого алгоритма машинного обучения для определения подмножества источников рекомендаций содержимого из множества возможных источников содержимого, определение подмножества источников рекомендаций содержимого, включая: получение указания на предыдущие взаимодействия пользователя по меньшей мере с одним из: (i) системой рекомендаций и (ii) по меньшей мере одним из множества сетевых ресурсов; на основе предыдущих взаимодействий пользователя определение первого подмножества конкретных для пользователя источников содержимого; на основе (i) обученной формулы алгоритма машинного обучения других взаимодействий пользователя по меньшей мере с некоторыми другими из множества сетевых ресурсов и по меньшей мере одним из: (ii) первого подмножества конкретных для пользователя источников содержимого; и (iii) вектора пользовательского профиля, созданного на основе предыдущих взаимодействий пользователя, создание второго подмножества неконкретных для пользователя источников содержимого; обработка первого подмножества конкретных для пользователя источников содержимого и второго подмножества неконкретных для пользователя источников содержимого для создания подмножества источников рекомендаций содержимого; анализ подмножества источников рекомендаций содержимого для выбора множества элементов потенциально рекомендуемого содержимого; выполнение модуля второго алгоритма машинного обучения для выбора из множества элементов потенциально рекомендуемого содержимого по меньшей мере одного элемента рекомендаций содержимого; выбор производится на основе вектора пользовательского профиля.
[00108] В некоторых вариантах осуществления способа, определение первого подмножества конкретных для пользователя источников содержимого включает в себя применение алгоритма сингулярного разложения (SVD).
[00109] В некоторых вариантах осуществления способа, определение первого подмножества конкретных для пользователя источников содержимого основано на:
[00110] (i) обученной формуле алгоритма машинного обучения других взаимодействий пользователя по меньшей мере с некоторыми другими из множества сетевых ресурсов; и
[00111] (ii) вектор пользовательского профиля создается на основе предыдущих взаимодействий пользователя.
[00112] В некоторых вариантах осуществления способа, способ дополнительно включает в себя, до получения запроса на рекомендацию содержимого, создание алгоритмом сингулярного разложения матрицы событий и пользователей сетевых ресурсов.
[00113] В некоторых вариантах осуществления способа, определение первого подмножества конкретных для пользователя источников содержимого включает в себя применение алгоритма точечной взаимной информации (PMI).
[00114] В некоторых вариантах осуществления способа, определение первого подмножества конкретных для пользователя источников содержимого основано на:
[00115] (i) обученной формуле алгоритма машинного обучения других взаимодействий пользователя по меньшей мере с некоторыми другими из множества сетевых ресурсов; и
[00116] (ii) первом подмножестве конкретных для пользователя источниках содержимого.
[00117] В некоторых вариантах осуществления способа, выбор из подмножества источников рекомендаций содержимого множества потенциально рекомендуемых элементов содержимого включает в себя определение заранее определенного числа самых новых элементов содержимого.
[00118] В некоторых вариантах осуществления способа, выбор из подмножества источников рекомендаций содержимого множества потенциально рекомендуемых элементов содержимого включает в себя определение заранее определенного числа самых популярных элементов содержимого.
[00119] В некоторых вариантах осуществления способа, выбор из подмножества источников рекомендаций содержимого конкретен для географической области, где выполняется запрос на рекомендуемое содержимое.
[00120] В некоторых вариантах осуществления способа, способ далее включает в себя фильтрацию выбранных потенциально рекомендуемых элементов содержимого.
[00121] В некоторых вариантах осуществления способа, фильтрация основана на языке электронного устройства и языке элемента содержимого.
[00122] Еще одним объектом настоящего технического решения является сервер. Сервер включает в себя: носитель данных; сетевой интерфейс, выполненный с возможностью передачи данных по сети передачи данных; процессор, функционально подключенный к носителю данных и сетевому интерфейсу, процессор выполнен с возможностью осуществлять: получение от электронного устройства запроса запроса на рекомендуемое содержимого, рекомендуемое содержимого включает в себя по меньшей мере один элемент рекомендации содержимого; рекомендации содержимого связаны с элементом содержимого, доступном на множестве сетевых ресурсов, которые доступны через сеть передачи данных; выполнение модуля первого алгоритма машинного обучения для определения подмножества источников рекомендаций содержимого из множества возможных источников содержимого, определение подмножества источников рекомендаций содержимого, включая: получение указания на предыдущие взаимодействия пользователя по меньшей мере с одним из: (i) системой рекомендаций и (ii) по меньшей мере одним из множества сетевых ресурсов; на основе предыдущих взаимодействий пользователя определение первого подмножества конкретных для пользователя источников содержимого; на основе (i) обученной формулы алгоритма машинного обучения других взаимодействий пользователя по меньшей мере с некоторыми другими из множества сетевых ресурсов и по меньшей мере одним из: (ii) первого подмножества конкретных для пользователя источников содержимого; и (iii) вектора пользовательского профиля, созданного на основе предыдущих взаимодействий пользователя, создание второго подмножества неконкретных для пользователя источников содержимого; обработку первого подмножества конкретных для пользователя источников содержимого и второго подмножества неконкретных для пользователя источников содержимого для создания подмножества источников рекомендаций содержимого; анализ подмножества источников рекомендаций содержимого для выбора множества элементов потенциально рекомендуемого содержимого; выполнение модуля второго алгоритма машинного обучения для выбора из множества элементов потенциально рекомендуемого содержимого, по меньшей мере одного элемента рекомендаций содержимого; выбор производится на основе вектора пользовательского профиля.
[00123] В некоторых вариантах осуществления сервера, для определения первого подмножества конкретных для пользователя источников содержимого процессор выполнен с возможностью применять алгоритм сингулярного разложения (SVD).
[00124] В некоторых вариантах осуществления сервера, определение первого подмножества конкретных для пользователя источников содержимого основано на:
[00125] (i) обученной формуле алгоритма машинного обучения других взаимодействий пользователя по меньшей мере с некоторыми другими из множества сетевых ресурсов; и
[00126] (ii) вектор пользовательского профиля создается на основе предыдущих взаимодействий пользователя.
[00127] В некоторых вариантах осуществления сервера, сервер дополнительно выполнен с возможностью, до этапа получения запроса на рекомендацию содержимого, осуществлять создание с помощью алгоритма сингулярного разложения матрицы событий и пользователей сетевых ресурсов.
[00128] В некоторых вариантах осуществления сервера, для определения первого подмножества конкретных для пользователя источников содержимого процессор выполнен с возможностью применять алгоритм точечной взаимной информации (PMI).
[00129] В некоторых вариантах осуществления сервера, определение первого подмножества конкретных для пользователя источников содержимого основано на:
[00130] (i) обученной формуле алгоритма машинного обучения других взаимодействий пользователя по меньшей мере с некоторыми другими из множества сетевых ресурсов; и
[00131] (ii) первом подмножестве конкретных для пользователя источниках содержимого.
[00132] В некоторых вариантах осуществления сервера, выбор из подмножества источников рекомендаций содержимого множества потенциально рекомендуемых элементов содержимого включает в себя определение заранее определенного числа самых новых элементов содержимого.
[00133] В некоторых вариантах осуществления сервера, выбор из подмножества источников рекомендаций содержимого множества потенциально рекомендуемых элементов содержимого включает в себя определение заранее определенного числа самых популярных элементов содержимого.
[00134] В некоторых вариантах осуществления сервера, выбор из подмножества источников рекомендаций содержимого конкретен для географической области, где выполняется запрос на рекомендуемое содержимое.
[00135] В некоторых вариантах осуществления сервера, процессор далее выполнен с возможностью осуществлять фильтрацию выбранных потенциально рекомендуемых элементов содержимого.
[00136] В некоторых вариантах осуществления сервера, фильтрация основана на языке электронного устройства и языке элемента содержимого.
[00137] В контексте настоящего описания «сервер» подразумевает под собой компьютерную программу, работающую на соответствующем оборудовании, которая способна получать запросы (например, от клиентских устройств) по сети и выполнять эти запросы или инициировать выполнение этих запросов. Оборудование может представлять собой один физический компьютер или одну физическую компьютерную систему, но ни то, ни другое не является обязательным для данной технологии. В контексте настоящей технологии использование выражения «сервер» не означает, что каждая задача (например, полученные команды или запросы) или какая-либо конкретная задача будет получена, выполнена или инициирована к выполнению одним и тем же сервером (то есть одним и тем же программным обеспечением и/или аппаратным обеспечением); это означает, что любое количество элементов программного обеспечения или аппаратных устройств может быть вовлечено в прием/передачу, выполнение или инициирование выполнения любого запроса или последствия любого запроса, связанного с клиентским устройством, и все это программное и аппаратное обеспечение может быть одним сервером или несколькими серверами, оба варианта включены в выражение «по меньшей мере один сервер».
[00138] В контексте настоящего описания «клиентское устройство» подразумевает под собой аппаратное устройство, способное работать с программным обеспечением, подходящим к решению соответствующей задачи. Таким образом, примерами клиентских устройств (среди прочего) могут служить персональные компьютеры (настольные компьютеры, ноутбуки, нетбуки и т.п.) смартфоны, планшеты, а также сетевое оборудование, такое как маршрутизаторы, коммутаторы и шлюзы. Следует иметь в виду, что устройство, ведущее себя как клиентское устройство в настоящем контексте, может вести себя как сервер по отношению к другим клиентским устройствам. Использование выражения «клиентское устройство» не исключает возможности использования множества клиентских устройств для получения/отправки, выполнения или инициирования выполнения любой задачи или запроса, или же последствий любой задачи или запроса, или же этапов любого вышеописанного способа.
[00139] В контексте настоящего описания «база данных» подразумевает под собой любой структурированный набор данных, не зависящий от конкретной структуры, программного обеспечения по управлению базой данных, аппаратного обеспечения компьютера, на котором данные хранятся, используются или иным образом оказываются доступны для использования. База данных может находиться на том же оборудовании, выполняющем процесс, который сохраняет или использует информацию, хранящуюся в базе данных, или же она может находиться на отдельном оборудовании, например выделенном сервере или множестве серверов.
[00140] В контексте настоящего описания «информация» включает в себя информацию любую информацию, которая может храниться в базе данных. Таким образом, информация включает в себя, среди прочего, аудиовизуальные произведения (изображения, видео, звукозаписи, презентации и т.д.), данные (данные о местоположении, цифровые данные и т.д.), текст (мнения, комментарии, вопросы, сообщения и т.д.), документы, таблицы, списки слов и т.д.
[00141] В контексте настоящего описания «компонент» подразумевает под собой программное обеспечение (соответствующее конкретному аппаратному контексту), которое является необходимым и достаточным для выполнения конкретной(ых) указанной(ых) функции(й).
[00142] В контексте настоящего описания «используемый компьютером носитель компьютерной информации» подразумевает под собой носитель абсолютно любого типа и характера, включая ОЗУ, ПЗУ, диски (компакт диски, DVD-диски, дискеты, жесткие диски и т.д.), USB флеш-накопители, твердотельные накопители, накопители на магнитной ленте и т.д.
[00143] В контексте настоящего описания слова «первый», «второй», «третий» и и т.д. используются в виде прилагательных исключительно для того, чтобы отличать существительные, к которым они относятся, друг от друга, а не для целей описания какой-либо конкретной взаимосвязи между этими существительными. Так, например, следует иметь в виду, что использование терминов «первый сервер» и «третий сервер» не подразумевает какого-либо порядка, отнесения к определенному типу, хронологии, иерархии или ранжирования (например) серверов/между серверами, равно как и их использование (само по себе) не предполагает, что некий "второй сервер" обязательно должен существовать в той или иной ситуации. В дальнейшем, как указано здесь в других контекстах, упоминание «первого» элемента и «второго» элемента не исключает возможности того, что это один и тот же фактический реальный элемент. Так, например, в некоторых случаях «первый» сервер и «второй» сервер могут являться одним и тем же программным и/или аппаратным обеспечением, а в других случаях они могут являться разным программным и/или аппаратным обеспечением.
[00144] Каждый вариант осуществления настоящей технологии преследует по меньшей мере одну из вышеупомянутых целей и/или объектов, но наличие всех не является обязательным. Следует иметь в виду, что некоторые объекты данной технологии, полученные в результате попыток достичь вышеупомянутой цели, могут не удовлетворять этой цели и/или могут удовлетворять другим целям, отдельно не указанным здесь.
[00145] Дополнительные и/или альтернативные характеристики, аспекты и преимущества вариантов осуществления настоящего технического решения станут очевидными из последующего описания, прилагаемых чертежей и прилагаемой формулы изобретения.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
[00146] Для лучшего понимания настоящей технологии, а также других ее аспектов и характерных черт сделана ссылка на следующее описание, которое должно использоваться в сочетании с прилагаемыми чертежами, где:
[00147] На Фиг. 1 представлена система, подходящая для реализации неограничивающих вариантов осуществления настоящей технологии.
[00148] На Фиг. 2 представлен снимок экрана с рекомендательным интерфейсом, выполненным в соответствии с неограничивающим вариантом осуществления настоящей технологии, рекомендательный интерфейс представлен на экране электронного устройства системы, показанной на Фиг. 1, электронное устройство выполнено в виде смартфона.
[00149] На Фиг. 3 представлен другой вариант осуществления системы, реализованной в соответствии с еще одним неограничивающим вариантом осуществления настоящей технологии.
[00150] На Фиг. 4 представлена блок-схема способа, реализованного в соответствии с неограничивающими вариантами осуществления настоящей технологии, и выполняемого в рамках системы, представленной на Фиг. 1.
[00151] На Фиг. 5 представлена блок-схема способа 800, реализованного в соответствии с другим неограничивающим вариантом осуществления настоящей технологии и выполняемого в рамках системы 300, представленной на Фиг. 3.
ОСУЩЕСТВЛЕНИЕ
[00152] На Фиг. 1 представлена принципиальная схема системы 100, выполненной в соответствии с вариантами осуществления настоящей технологии, не ограничивающими ее объем. Важно иметь в виду, что нижеследующее описание системы 100 представляет собой описание показательных вариантов осуществления настоящей технологии. Таким образом, все последующее описание представлено только как описание иллюстративного примера настоящей технологии. Это описание не предназначено для определения объема или установления границ настоящей технологии. Некоторые полезные примеры модификаций системы 100 также могут быть охвачены нижеследующим описанием. Целью этого является также исключительно помощь в понимании, а не определение объема и границ настоящей технологии. Эти модификации не представляют собой исчерпывающий список, и специалистам в данной области техники будет понятно, что возможны и другие модификации. Кроме того, это не должно интерпретироваться так, что там, где это еще не было сделано, т.е. там, где не были изложены примеры модификаций, никакие модификации невозможны, и/или что то, что описано, является единственным вариантом осуществления этого элемента настоящего технического решения. Как будет понятно специалисту в данной области техники, это, скорее всего, не так. Кроме того, следует иметь в виду, что система 100 представляет собой в некоторых конкретных проявлениях достаточно простой вариант осуществления настоящей технологии, и в подобных случаях представлен здесь с целью облегчения понимания. Как будет понятно специалисту в данной области техники, многие варианты осуществления настоящей технологии будут обладать гораздо большей сложностью.
[00153] В общем случае, система 100 выполнена с возможностью предоставлять рекомендации содержимого пользователю 102 системы 100. Пользователь 102 может являться подписчиком сервиса рекомендаций, который предоставляет система 100. Однако подписка не обязана быть оплачиваемой или явной. Например, пользователь 102 может стать подписчиком путем скачивания рекомендательного предложения из система 100, путем регистрации и предоставления сочетания логина/пароля, путем регистрации и предоставления предпочтений пользователя и так далее. Поэтому любой вариант системы, выполненный с возможностью создавать рекомендации содержимого для данного пользователя, может быть адаптирован специалистом для выполнения вариантов осуществления настоящей технологии после того как специалистом было прочитано настоящее описание. Кроме того, система 100 может быть описана с помощью примера системы 100, которая является системой рекомендаций (следовательно, система 100 может упоминаться как «система 100 рекомендаций» или «система 100 предсказаний» или «система 100 обучения»). Тем не менее, варианты осуществления настоящей технологии могут также применяться к другим типам систем 100, как будет более подробно описано далее.
[00154] Система 100 содержит электронное устройство 104, электронное устройство 104 связано с пользователем 102. Таким образом, электронное устройство 104 может иногда упоминаться как «клиентское устройство», «устройство конечного пользователя» или «клиентское электронное устройство». Следует отметить, что тот факт, что электронное устройство 104 связано с пользователем 102, не подразумевает какого-либо конкретного режима работы, равно как и необходимости входа в систему, быть зарегистрированным, или чего-либо подобного.
[00155] Варианты электронного устройства 104 конкретно не ограничены, но в качестве примера электронного устройства 104 могут использоваться персональные компьютеры (настольные компьютеры, ноутбуки, нетбуки и т.п.), устройства беспроводной связи (смартфоны, мобильные телефоны, планшеты и т.п.), а также сетевое оборудование (маршрутизаторы, коммутаторы или шлюзы). Электронное устройство 104 содержит аппаратное и/или прикладное программное, и/или системное программное обеспечение (или их комбинацию), как известно в области техники, чтобы выполнять рекомендательное приложение 106. В общем случае, задачей рекомендательного приложения 106 является позволить пользователю получать (или каким-либо иным способом иметь доступ) к рекомендациям содержимого, которые предоставлены системой 100, как будет более подробно описано далее.
[00156] Реализация рекомендательного приложения 106 никак конкретно не ограничена. Одним из примеров выполнения рекомендательного приложения 106 является доступ пользователем на веб-сайт, соответствующий системе рекомендаций, для получения доступа к рекомендательному приложению 106. Например, рекомендательное приложение 106 может быть вызвано путем ввода (или копирования-вставки или выбора ссылки) URL, связанного с сервисом рекомендаций. Альтернативно рекомендательное приложение 106 может являться приложением, скачанным из так называемого магазина приложений, например APPSTORE™ или GOOGLEPLAY™, и установленным/используемым на электронном устройстве 104. Важно иметь в виду, что рекомендательное приложение 106 может быть вызвано с помощью любых других средств.
[00157] В общем случае, рекомендательное приложение 106 включает в себя рекомендательный интерфейс 108, причем рекомендательный интерфейс 108 отображается на экране (отдельно не пронумерован) электронного устройства 104. На Фиг. 2 представлен снимок экрана с рекомендательным интерфейсом 108, реализованным в соответствии с неограничивающим вариантом осуществления настоящей технологии (пример рекомендательного интерфейса 108 представлен на экране электронного устройства 104, который реализован в виде смартфона).
[00158] В некоторых вариантах осуществления настоящей технологии рекомендательный интерфейс 108 отображается, когда пользователь 102 электронного устройства 104 активирует (т.е. запускает, использует, запускает в фоновом режиме и так далее) рекомендательное приложение 106. Альтернативно рекомендательный интерфейс 108 может быть представлен, когда пользователь 102 открывает новое окно браузера и/или активирует новую вкладку в браузерном приложении. Например, в некоторых вариантах осуществления настоящей технологии рекомендательный интерфейс 108 может активировать «домашний экран» в браузерном приложении.
[00159] Рекомендательный интерфейс 108 включает в себя поисковый интерфейс 202. Поисковый интерфейс 202 включает в себя интерфейс 204 поискового запроса. Интерфейс 204 поискового запроса может быть реализован как «омнибокс», что позволяет вводить поисковый запрос для проведения поиска или сетевой адрес (например, Единый Указатель Ресурсов (URL)) для идентификации ресурса (например, веб-сайта), который будет вызван. Тем не менее, интерфейс 204 поискового запроса может быть реализован для получения одного или обоих из: записи поискового запроса на выполнение поиска или сетевого адреса (например, Единый Указатель Ресурсов (URL)) для идентификации ресурса (например, веб-сайта), который будет вызван.
[00160] Рекомендательный интерфейс 108 дополнительно включает в себя интерфейс 206 ссылок. Интерфейс 206 ссылок включает в себя множество фрагментов 208 - восемь из которых представлены на Фиг. 2 - только два пронумерованы на Фиг. 2 - первый фрагмент 210 и второй фрагмент 212.
[00161] Используя, например, первый фрагмент 210 и второй фрагмент 212, каждый из множества фрагментов 208 включает в себя (или действует как) ссылку на (i) веб-сайт, отмеченный как «избранное» или как-либо иначе отмеченный пользователем 102, (ii) ранее посещенный веб-сайт или (iii) тому подобное. Множество фрагментов 208 в представленном варианте осуществления визуально представлено пользователю 102 в виде квадратных кнопок с логотипом и/или названием представленного ресурса, логотип и название позволяют пользователю 102 идентифицировать, на какой ресурс ведет каждый из множества фрагментов (отдельно не пронумеровано). Тем не менее, важно иметь в виду, что визуальное представление некоторых или всех из множества фрагментов 208 может быть иным. Таким образом, некоторые или все из множества фрагментов 208 могут быть реализованы как кнопки других форм, как список гиперссылок и так далее.
[00162] Например, первый фрагмент 210 включает в себя ссылку на веб-сайт TRAVELZOO™, а второй фрагмент 212 включает в себя ссылку на веб-сайт персонального живого журнала. Излишне говорить, что число и содержимое индивидуальных фрагментов из множества фрагментов 208 никак конкретно не ограничено.
[00163] Например, число фрагментов во множестве фрагментов 208 может быть выбрано заранее поставщиком рекомендательного приложения 106. В некоторых вариантах осуществления настоящей технологии число фрагментов во множестве фрагментов 208 выбирается заранее на основе размера и/или разрешения экрана электронного устройства 104, которое выполняет рекомендательное приложение 106. Например, первое число фрагментов может быть выбрано заранее для электронного устройства 104, которое реализовано как смартфон, второе число фрагментов может быть выбрано заранее для электронного устройства 104, которое реализовано как планшет, и третье число фрагментов может быть выбрано заранее для электронного устройства 104, которое реализовано как ноутбук или настольный компьютер.
[00164] Рекомендательный интерфейс 108 дополнительно включает в себя набор 214 рекомендованного содержимого. Набор 214 рекомендованного содержимого включает в себя один или несколько элементов рекомендаций содержимого, например первый элемент 216 рекомендаций содержимого и второй элемент 218 рекомендаций содержимого (второй элемент 218 рекомендаций содержимого только частично виден на Фиг. 2). Естественно, набор 214 рекомендаций содержимого может обладать большим числом элементов рекомендаций содержимого. В рамках варианта осуществления, представленного на Фиг. 2, и тех вариантов осуществления технологии, где присутствует более одного элемента рекомендованного содержимого, пользователь 102 может прокручивать через набор 214 рекомендованного содержимого. Прокрутка может осуществляться любыми подходящими способами. Например, пользователь 102 может прокручивать содержимое набора 214 рекомендованного содержимого путем активации мыши (не показано), клавиши клавиатуры (не показано) или взаимодействия с сенсорным экраном (не показано) соответствующего электронного устройства 104.
[00165] Пример, приведенный на Фиг. 2, является одним возможным вариантом осуществления рекомендательного интерфейса 108. Другой вариант осуществления рекомендательного интерфейса 108, а также описание того, как пользователь 102 может взаимодействовать с рекомендательным интерфейсом 108, представлено в находящейся в совместном владении российской патентной заявке, озаглавленной «ИСПОЛНЯЕМЫЙ НА КОМПЬЮТЕРЕ СПОСОБ СОЗДАНИЯ РЕКОМЕНДАТЕЛЬНОГО ИНТЕРФЕЙСА СОДЕРЖИМОГО», поданной 12 мая 2016 под номером 2016118519; содержимое которой включено здесь полностью посредством ссылки.
[00166] То, как именно создается набор 214 рекомендованного содержимого, будет более подробно описано далее.
[00167] Возвращаясь к описанию Фиг. 1, электронное устройство 104 функционально соединено с сетью ПО передачи данных для получения доступа к рекомендательному серверу 112. В некоторых вариантах осуществления настоящей технологии, не ограничивающих ее объем, сеть ПО передачи данных может представлять собой Интернет. В других вариантах осуществления настоящего технического решения сеть 110 передачи данных может быть реализована иначе - в виде глобальной сети передачи данных, локальной сети передачи данных, частной сети передачи данных и т.п. Линия передачи данных (отдельно не пронумерована) между электронным устройством 104 и сетью ПО передачи данных реализована таким образом, что она будет зависеть, среди прочего, от того, как реализовано электронное устройство 104. В качестве примера, но не ограничения, в данных вариантах осуществления настоящей технологии в случаях, когда электронное устройство 104 представляет собой беспроводное устройство связи (например, смартфон), линия передачи данных представляет собой беспроводную сеть передачи данных (например, среди прочего, линия передачи данных 3G, линия передачи данных 4G, беспроводной интернет Wireless Fidelity или коротко WiFi®, Bluetooth® и т.п.). В тех примерах, где электронное устройство 104 представляет собой портативный компьютер, линия связи может быть как беспроводной (беспроводной интернет Wireless Fidelity или коротко WiFi®, Bluetooth® и т.п.), так и проводной (соединение на основе сети Ethernet).
[00168] Рекомендательный сервер 112 может представлять собой обычный компьютерный сервер. В примере варианта осуществления настоящего технического решения рекомендательный сервер 112 может представлять собой сервер Dell™ PowerEdge™, на котором используется операционная система Microsoft™ Windows Server™. Излишне говорить, что рекомендательный сервер 112 может представлять собой любое другое подходящее аппаратное, прикладное программное, и/или системное программное обеспечение или их комбинацию. В представленном варианте осуществления настоящей технологии, не ограничивающем ее объем, рекомендательный сервер 112 является одиночным сервером. В других вариантах осуществления настоящего технического решения, не ограничивающих ее объем, функциональность рекомендательного сервера 112 изображения может быть разделена и может выполняться с помощью нескольких серверов.
[00169] Рекомендательный сервер 112 включает в себя модуль 114 обработки Модуль 114 обработки соединен или иным образом имеет доступ к модулю 116 выбора источника содержимого. Модуль 116 выбора источника содержимого имеет доступ к устройству 118 хранения данных. Модуль 114 обработки дополнительно связан с модулем 115 выбора рекомендаций содержимого. Работа рекомендательного сервера 112 и его компонентов будет более подробно описана далее.
[00170] Также с сетью ПО передачи данных соединено множество сетевых ресурсов, включая первый сетевой ресурс 124, второй сетевой ресурс 126 и множество дополнительных сетевых ресурсов 128. Первый сетевой ресурс 124, второй сетевой ресурс 126 и множество дополнительных сетевых ресурсов 128 являются сетевыми ресурсами, доступными электронному устройству 104 (а также другим электронным устройствам, потенциально присутствующим в системе 100) через сеть ПО передачи данных. Соответствующее содержимое первого сетевого ресурса 124, второго сетевого ресурса 126 и множества дополнительных сетевых ресурсов 128 никак конкретно не ограничено. Данный один сетевой ресурс из первого сетевого ресурса 124, второго сетевого ресурса 126 и множества дополнительных сетевых ресурсов 128 может содержать (или, другими словами, включать в себя) цифровое содержимое, например: аудио содержимое для потоковой передачи, видео содержимое для потоковой передачи, новости, блоги, информацию о различных государственных институтах, информацию о точках интереса, тематически кластеризованное содержимое (например, содержимое, релевантное для тех, кто интересуется кикбоксингом) и так далее.
[00171] Содержимое потенциально «доступно» для электронного устройства 104 различными способами. Например, пользователь 102 электронного устройства 104 может использовать браузерное приложение (не показано) и ввести Универсальный Указатель Ресурса (URL), связанный с одним из первого сетевого ресурса 124, второго сетевого ресурса 126 и множества дополнительных сетевых ресурсов 128. Альтернативно пользователь 102 электронного устройства 104 может выполнить поиск с помощью поисковой системы (не показано), чтобы изучить содержимое одного или нескольких из первого сетевого ресурса 124, второго сетевого ресурса 126 и множества дополнительных сетевых ресурсов 128. Как было упомянуто ранее, это удобно в том случае, если пользователь 102 заранее знает, в каком именно содержимом пользователь 102 заинтересован.
[00172] В соответствии с вариантами осуществления настоящей технологии рекомендательное приложение 106 может рекомендовать элементы содержимого, доступные с одного из первого сетевого ресурса 124, второго сетевого ресурса 126 и множества дополнительных сетевых ресурсов 128, пользователю 102, элементы содержимого, о которых пользователь 102 может заранее не знать. Рекомендательный сервер 112 выполнен с возможностью осуществлять выбор содержимого для одного или нескольких рекомендуемых элементов, которые будут представлены пользователю 102 через рекомендательное приложение 106. Конкретнее, модуль 114 обработки выполнен с возможностью (i) получать от электронного устройства 104 запрос на рекомендации 150 содержимого и (ii) в ответ на запрос создавать сообщение 152 рекомендаций содержимого, специально настроенное для пользователя 102, связанного с электронным устройством 104. Модуль 114 обработки может дополнительно координировать выполнение различных процессов, описанных здесь как выполняемые одним из первого сетевого ресурса 124, второго сетевого ресурса 126 и множества дополнительных сетевых ресурсов 128, и модулем 116 выбора источника, например.
[00173] В некоторых вариантах осуществления настоящей технологии запрос на рекомендации 150 содержимого может быть создан в ответ на предоставление пользователем 102 явного указания на его/ее желание получать рекомендации содержимого. Например, рекомендательный интерфейс 108 может предоставлять кнопку (или другой активируемый элемент), который позволит пользователю 102 выражать свое желание получить новые или обновленные рекомендации содержимого. В качестве неограничивающего примера рекомендательный интерфейс 108 может предоставить активируемую кнопку, на которой написано «запросить рекомендации содержимого». В рамках этих вариантов осуществления технологии, запрос на рекомендации 150 содержимого может считаться «явным запросом» в том смысле, что пользователь 102 явно выражает запрос на рекомендации содержимого.
[00174] В других вариантах осуществления настоящей технологии, запрос на рекомендации 150 содержимого может быть создан в ответ на явное указание от пользователя 102 на желание пользователя получить рекомендации содержимого. В некоторых вариантах осуществления настоящей технологии запрос на рекомендации 150 содержимого может быть создан в ответ на то, что пользователь 102 запускает рекомендательное приложение 106.
[00175] Альтернативно, в тех вариантах осуществления настоящей технологии, где рекомендательное приложение 106 реализовано в виде браузера (например, браузер GOOGLE™, браузер YANDEX™, a YAHOO!™ браузер или любое другое собственное или коммерчески доступное браузерное приложение), запрос на рекомендации 150 содержимого может быть создан в ответ на то, что пользователь 102 открывает браузерное приложение и может быть создано, например, без выполнения пользователем 102 каких-либо действий, кроме активации браузерного приложения. В качестве другого примера запрос на рекомендации 150 содержимого может быть создан в ответ на открытие пользователем 102 новой вкладки в уже открытом браузерном приложении, и могут быть созданы, например, без выполнения пользователем 102 каких-либо действий, кроме активации новой вкладки браузера. Другими словами, запрос на рекомендации 150 содержимого может быть создан даже без знания пользователя 102 о том, что он может быть заинтересован в получении рекомендации содержимого.
[00176] В качестве другого примера запрос на рекомендацию 150 содержимого может быть создан в ответ на выбор пользователем 102 конкретного элемента браузерного приложения, и могут быть созданы, например, без выполнения пользователем 102 каких-либо действий, кроме активации/выбора конкретного элемента браузерного приложения.
[00177] Примеры конкретного элемента браузерного приложения включают в себя, без установления ограничений:
Адресную строку строки браузерного приложения
Поисковую строку браузерного приложения и/или поисковую строку веб-сайта поисковой системы, доступного в браузерном приложении
Омнибокс (связанные адрес и поисковая строка браузерного приложения)
Панель избранных или недавно посещенных сетевых ресурсов
Любую другую заранее определенную область интерфейса браузерного приложения или сетевого ресурса, отображенного в браузерном приложении
[00178] В некоторых вариантах осуществления настоящей технологии каждый из модуля 115 выбора рекомендаций содержимого и модуля 116 выбора источника содержимого может быть выполнен с возможностью выполнять их соответствующие один или несколько алгоритмов машинного обучения. В некоторых вариантах осуществления настоящей технологии один или несколько алгоритмов машинного обучения могут представлять собой любой подходящий алгоритм машинного обучения с учителем или полуконтролируемого обучения, такой как, например:
Искусственная нейронная сеть
Байесовская статистика
Гауссовский процесс регрессии
Деревья решений
И так далее
[00179] Следует отметить, что соответствующий один или несколько алгоритмов машинного обучения, выполняемых модулем 115 выбора рекомендаций содержимого и модулем 116 выбора источника содержимого, не обязаны быть одинаковыми.
[00180] Несмотря на то, что модуль 115 выбора рекомендаций содержимого и модуль 116 выбора источника содержимого были описаны как отдельные элементы, каждый из которых выполняет соответствующий один или несколько алгоритмов машинного обучения, в других вариантах осуществления настоящей технологии один или несколько алгоритмов машинного обучения, соответственно выполняемых модулем 115 выбора рекомендаций содержимого и модулем 116 выбора источника содержимого, могут выполняться одним элементом (например, модулем 114 обработки). Альтернативно один или несколько алгоритмов машинного обучения, соответственно выполняемых модулем 115 выбора рекомендаций содержимого и модулем 116 выбора источника содержимого, могут быть распределены между большим числом модулей, чем те, что показаны на Фиг. 1, и могут выполняться как часть нескольких экземпляров рекомендательного сервера 112.
[00181] Кроме того, каждый из модуля 115 выбора рекомендаций содержимого и модуля 116 выбора источника содержимого может выполнять дополнительные функции (т.е. отличные от соответствующего одного или нескольких алгоритмов машинного обучения).
[00182] Например, модуль 116 выбора источника содержимого может выполнять «функцию просмотра», которая может быть в широком смысле описана как функция просмотра новых сетевых ресурсов и/или нового содержимого, опубликованного на первом сетевом ресурсе 124, втором сетевом ресурсе 126 и дополнительных сетевых ресурсах 128. С этой целью модуль 116 выбора источника содержимого выполнен с возможностью реализовать «поискового робота», который «посещает» различные сетевые ресурсы, доступные через сеть 110 передачи данных (включая первый сетевой ресурс 124, второй сетевой ресурс 126 и дополнительные сетевые ресурсы) для обнаружения и каталогизации новых доступных ресурсов (например, первого сетевого ресурса 124, второго сетевого ресурса 126 и дополнительных сетевых ресурсов) или нового опубликованного содержимого, доступного на первом сетевом ресурсе 124, втором сетевом ресурсе 126 и дополнительных сетевых ресурсах 128.
[00183] Как часть функции просмотра, модуль выбора источника содержимого выполнен с возможностью содержать (на устройстве 118 сохранения данных) информацию, представляющую новые найденные сетевые ресурсы и/или новое найденное доступное содержимое, доступное на них. В некоторых вариантах осуществления настоящей технологии модуль 116 выбора источника содержимого может быть выполнен с возможностью поддерживать инвертированный индекс на устройстве 118 хранения данных, но модуль 116 выбора источника содержимого может организовать информацию, представляющую новые найденные сетевые ресурсы и/или новое найденное содержимое, доступное на них, в структуру данных, отличную от инвертированного индекса.
[00184] Модуль 116 выбора источника содержимого может далее собирать и поддерживать дополнительную информацию о доступных сетевых ресурсах и/или содержимом, доступном на этих сетевых ресурсах, например первом сетевом ресурсе 124, втором сетевом ресурсе 126 и дополнительных сетевых ресурсах 128). Дополнительная информация может быть в общем случае связана с визитом (т.е. браузерной активностью данного пользователя с конкретным сетевым ресурсом), хитом (т.е. переходом данного пользователя на конкретный сетевой ресурса, с конкретного сетевого ресурса и между различными веб-страницами конкретного сетевого ресурса) или сессией (т.е. браузерной сессией конкретного пользователя, которая может включать в себя визиты на один или несколько сетевых ресурсов).
[00185] Некоторые примеры дополнительной информации, собранной о доступных ресурсах и/или доступном содержимого этих ресурсов, включает в себя (без установления ограничений):
количество хитов за визит (HPV) - сколько страниц в рамках данного сетевого ресурса посетил данный пользователь за время просмотра данного сетевого ресурса
количество сессий за визит (SPV) - сколько сессий содержалось в визитах на конкретный сетевой ресурс
количество датированных страниц за визит (DPV) - сколько страниц данного сетевого ресурса с датой в URL страницы данный пользователь посетил за время данного визита на данный сетевой ресурс
количество домашних страниц за визит (MPV) - сколько раз за время данного визита данный пользователь посетил домашнюю страницу данного сетевого ресурса
время, проведенное на сетевом ресурсе (MTIME), - сколько времени данный пользователь провел, просматривая данный сетевой ресурс
последний домен за сессию (LPS) - является ли данный сетевой ресурс последним сетевым ресурсом в данной сессии веб-просмотра данного пользователя
первый домен за сессию (FPS) - является ли данный сетевой ресурс первым сетевым ресурсом в данной сессии веб-просмотра данного пользователя
хиты за сессию (HPS) - сколько страниц любых сетевых ресурсов данный пользователь посетил за данную сессию просмотра (т.е. сколько переходов было сделано за данную сессию)
количество визитов пользователя (VPU) - среднее число визитов на данный сетевой ресурс
количество хитов пользователя (HPU) - среднее число переходов между различными страницами данного сетевого ресурса (или альтернативно всех сетевых ресурсов)
количество сессий пользователя (SPU) - среднее число сессий, которые включают в себя визиты на данный сетевой ресурс
количество датированных страниц за хит (DPH) - сколько страниц данного сетевого ресурса с датой в URL страницы данный пользователь посетил за время данного визита на данный сетевой ресурс
количество домашних страниц за хит (МРН) - сколько раз данный пользователь переходил на домашнюю страницу данного сетевого ресурса за визит на данный сетевой ресурс
указание на источник перехода к данному сетевому ресурсу является одним из:
a. визитом пользователя на сайт напрямую (TT_GR);
b. визитом пользователя на сайт через поисковую систему (TT_SE);
c. визитом пользователя на сайт через социальную сеть (TT_SN);
d. визитом пользователя на сайт через электронное сообщение (ТТ_IM);
e. визитом пользователя на сайт, совершенным с помощью сервиса сокращения ссылок (TT US);
f. визитом пользователя на сайт, совершенным с помощью рекламной платформы (TT_AD).
[00186] То, как модуль 116 выбора источника содержимого собирает дополнительную информацию, никак конкретно не ограничено. Например, некоторые источники дополнительной информации включают в себя (без установления ограничений): журналы поисковой системы, журналы браузерного приложения, виджеты для отслеживания сетевого ресурса и так далее.
[00187] Например, модуль 116 выбор источника содержимого имеет доступ к журналу поисковой системы и получает информацию о том, получил ли данный пользователь доступ к данному сетевому ресурсу от поисковой системы. В другом примере модуль 116 выбора источника содержимого может обладать доступом к журналам браузерного приложения, выполняемого на электронном устройстве 104, и получать указание (которое может быть анонимным с целью защиты конфиденциальности пользователя) в отношении данного пользователя 102: переход к данному сетевому ресурсу, переходы данного пользователя между различными страницами данного сетевого ресурса, информация о веб-страницах данного посещенного сетевого ресурса (например, URL, даты URL и так далее), проведенное время на различных веб-страницах данного сетевого ресурса, браузерные сессии пользователя и различные сетевые ресурсы, посещенные во время браузерной сессии, и так далее.
[00188] В качестве другого примера множество доступных сетевых ресурсов устанавливает виджеты отслеживания ресурса (например, Google™ Анатлитика, Yandex™ Метрика и так далее). Естественно, модуль 116 выбора источника содержимого может получать дополнительную информацию от дополнительных источников различными дополнительными путями.
[00189] Таким образом, в соответствии с неограничивающими вариантами осуществления настоящей технологии рекомендательный сервер 112 выполнен с возможностью выполнять двухэтапный подход в выбору рекомендаций (т.е. рекомендуемых элементов) для включения в сообщение 152 рекомендаций содержимого в ответ на запрос рекомендаций 150 содержимого.
[00190] Двухэтапный подход особенно полезен (без установления ограничений) в тех случаях, когда сервис рекомендаций содержимого, предоставляемый рекомендательным сервером 112, предоставляется на новой территории, например в стране, в области страны, в новом городе и так далее. Конкретный технический эффект от использования вариантов осуществления настоящей технологии заключается в возможности «заранее квалифицировать» потенциальные источники рекомендаций содержимого в режиме «оффлайн» («оффлайн» подразумевает обработку до получения запроса на рекомендацию 150 содержимого).
[00191] Варианты осуществления настоящей технологии основаны на предположении о том, что не все сетевые ресурсы (т.е. первый сетевой ресурс 124, второй сетевой ресурс 126 и множество дополнительных сетевых ресурсов 128) содержат потенциальный элемент содержимого, подходящий для обработки и рекомендации для рекомендательного сервера 112. Например, некоторые сетевые ресурсы (т.е. первый сетевой ресурс 124, второй сетевой ресурс 126 и множество дополнительных сетевых ресурсов 128) могут содержать элемент содержимого, который не будет интересен подписчикам сервиса рекомендаций, предоставляемого рекомендательным сервером 112.
[00192] Варианты осуществления настоящей технологии далее основаны на предположении о том, что содержимое некоторых сетевых ресурсов (т.е. первого сетевого ресурса 124, второго сетевого ресурса 126 и множества дополнительных сетевых ресурсов 128) является более подходящим для обработки и рекомендации для рекомендательного сервера 112. Например, если один из сетевых ресурсов (т.е. первого сетевого ресурса 124, второго сетевого ресурса 126 и множества дополнительных сетевых ресурсов 128) является новостным агрегатором, более вероятно, что он будет содержать элементы содержимого, подходящие для обработки и рекомендации рекомендательным сервером 112. Подобный сетевой ресурс с большей вероятностью будет обладать часто обновляемыми элементами содержимого (т.е. новыми опубликованными новостями, статьями и т.д.), а также содержать элементы содержимого, которые потенциально заинтересуют широкую аудиторию.
[00193] С другой стороны, некоторые другие сетевые ресурсы (т.е. первый сетевой ресурс 124, второй сетевой ресурс 126 и множество дополнительных сетевых ресурсов 128) содержат элементы содержимого, которые менее подвержены обработке и рекомендациям, предоставляемым рекомендательным сервером 112. Например, персональный веб-сайт любителя кошек из Виннипег, который публикует фотографии своих любимцев, с меньшей вероятностью предоставляет потенциальные элементы содержимого для обработки и рекомендаций рекомендательных сервером 112. Это связано с тем фактом, что содержимое такого сетевого ресурса обновляется редко и связано с достаточно узкой сферой интереса.
[00194] В общем случае, двухэтапный подход нацелен на:
[00195] На первом этапе:
Выбор из множества сетевых ресурсов (т.е. первого сетевого ресурса 124, второго сетевого ресурса 126 и множества дополнительных сетевых ресурсов 128) тех, которые содержат потенциальные элементы содержимого для рекомендации, конкретнее рекомендательный сервер 112 определяет параметр пригодности источника для сетевого ресурса, параметр пригодности источника указывает на то, что сетевой ресурс восприимчив к публикации элемента содержимого, который может быть обработан рекомендательным сервером 112;
[00196] На втором этапе:
Из выбранных таким образом сетевых ресурсов рекомендательный сервер 112 выбирает по меньшей мере один элемент содержимого, по меньшей мере один элемент содержимого для ввода в модуль 115 выбора рекомендаций содержимого - для обработки и выбора персонализированных рекомендаций элемента содержимого пользователя 102 в ответ на получение запроса на рекомендацию 150 содержимого.
[00197] В широком смысле в некоторых вариант осуществления настоящей технологии двухэтапный подход может быть реализован следующим образом:
[00198] Обучение алгоритма машинного обучения
[00199] До этапа выполнения процесса двухэтапного выбора рекомендательный сервер 112 (или конкретнее модуль 114 обработки) выполняет обучение алгоритма машинного обучения, который модуль 116 выбора источника содержимого использует для выбора источников содержимого. В общем случае, алгоритм машинного обучения обучается для определения параметра пригодности источника данного сетевого ресурса (т.е. первого сетевого ресурса 124, второго сетевого ресурса 126 и множества дополнительных сетевых ресурсов 128) на основе обучающего набора сетевых ресурсов и связанных отметок, назначенных экспертами. Отметка может представлять собой, например, «низкое значение параметра пригодности источника», «среднее значение параметра пригодности источника» и «высокое значение параметра пригодности источника». Альтернативно отметка может представлять собой, например, «пригодный» и «непригодный».
[00200] Во время обучения алгоритм машинного обучения модуля 116 выбора источника содержимого представлен с обучающим набором сетевых ресурсов и связанными оценками, чтобы обработать различные характеристики, связанные с веб-страницами сетевых ресурсов, чтобы разработать профиль данного сетевого ресурса и соотнести таким образом созданный профиль сетевого ресурса со связанными оценками, чтобы создать «формулу алгоритма машинного обучения», которая позволяет алгоритму машинного обучения модуля 116 выбора источника содержимого (i) быть представленным с неизвестным сетевым ресурсом (например, новый или первый сетевой ресурс 124, второй сетевой ресурс 126 и множество дополнительных сетевых ресурсов 128), (ii) анализировать характеристики данной веб-страницы или всего сетевого ресурса (т.е. первого сетевого ресурса 124, второго сетевого ресурса 126 и множества дополнительных сетевых ресурсов 128) для создания профиля соответствующего сетевого ресурса; и (iii) определять на основе таким образом созданного профиля сетевого ресурса параметр пригодности источника, связанный с ним.
[00201] В некоторых вариантах осуществления настоящей технологии множество характеристик, используемых алгоритмом машинного обучения, включает в себя по меньшей мере одну абсолютную характеристику (например, общее число посещений на сетевой ресурс) и относительную характеристику (например, среднее число посещений за данный период времени или число хитов пользователя). В некоторых вариантах осуществления настоящей технологии алгоритм машинного обучения использует абсолютную характеристику и относительную характеристику в качестве базовых характеристик и дополнительно создает по меньшей мере одну производную характеристику на основе по меньшей мере одной из абсолютной характеристики и относительной характеристики для использования в создании профиля сетевого ресурса.
[00202] В некоторых вариантах осуществления настоящей технологии производные характеристики создаются с помощью одного или нескольких из: логарифмической формулы, сигмоидной функции, функции квадратного корня. В некоторых вариантах осуществления настоящей технологии алгоритм машинного обучения нормализует характеристики сетевого ресурса. В некоторых вариантах осуществления настоящей технологии характеристики нормализуются среднее = 0, стандартное отклонение = 1 (mean = 0, stddev = 1).
[00203] В соответствии с некоторыми вариантами осуществления настоящей технологии, как часть обучения алгоритма машинного обучения модуля 116 выбора источника содержимого, алгоритм машинного обучения выполнен с возможностью определять все возможные характеристики сетевого ресурса в подмножество характеристик, которые лучше соотносятся с параметром пригодности источника.
[00204] В конкретном неограничивающем варианте осуществления настоящей технологии из всех возможных характеристик, связанных с сетевым ресурсом, алгоритм машинного обучения модуля 116 выбора источника содержимого может выбирать подмножество характеристик, которое состоит из:
по меньшей мере одного из: доли целевой страницы среди визитов сетевого ресурса в рамках первоначального перехода к сетевому ресурса в рамках сессии и доли визитов целевой страницы за время переходов внутри сетевого ресурса;
по меньшей мере одного из: доли веб-страницы, связанной с URL, который содержит данные, представляющие собой первую страницу, которая была посещена за первый переход на сетевой ресурс, и доли веб-страниц в сетевом ресурсе, посещенном за время сессии, веб-страницы связаны с URL, который содержит данные;
долевого профиля источников визита для сетевого ресурса, источники визита выбираются из: поисковой системы/социальных сетей/электронной почты и приложения мессенджера/сервиса сокращения ссылок /прямых визитов;
доли сессии, которую сетевой ресурс занимает в последней сессии.
[00205] Естественно, в альтернативных вариантах осуществления настоящей технологии другое подмножество всех характеристик, связанных с сетевым ресурсом, может быть использовано алгоритмом машинного обучения.
[00206] Примеры характеристик включают в себя, без установления ограничений:
количество хитов за визит (HPV) - сколько страниц в рамках данного сетевого ресурса посетил данный пользователь за время просмотра данного сетевого ресурса
количество сессий за визит (SPV) - сколько сессий содержалось в визитах на конкретный сетевой ресурс
количество датированных страниц за визит (DPV) - сколько страниц данного сетевого ресурса с датой в URL страницы данный пользователь посетил за время данного визита на данный сетевой ресурс
количество домашних страниц за визит (MPV), - сколько раз за время данного визита данный пользователь посетил домашнюю страницу данного сетевого ресурса
время, проведенное на сетевом ресурсе (MTIME) - сколько времени данный пользователь провел, просматривая данный сетевой ресурс
последний домен за сессию (LPS) - является ли данный сетевой ресурс последним сетевым ресурсом в данной сессии веб-просмотра данного пользователя
первый домен за сессию (FPS) - является ли данный сетевой ресурс первым сетевым ресурсом в данной сессии веб-просмотра данного пользователя
хиты за сессию (HPS) - сколько страниц любых сетевых ресурсов данный пользователь посетил за данную сессию просмотра (т.е. сколько переходов было сделано за данную сессию)
количество визитов пользователя (VPU) - среднее число визитов на данный сетевой ресурс
количество хитов пользователя (HPU) - среднее число переходов между различными страницами данного сетевого ресурса (или, альтернативно, всех сетевых ресурсов)
количество сессий пользователя (SPU) - среднее число сессий, которые включают в себя визиты на данный сетевой ресурс
количество датированных страниц за хит (DPH) - сколько страниц данного сетевого ресурса с датой в URL страницы данный пользователь посетил за время данного визита на данный сетевой ресурс
количество домашних страниц за хит (МРН) - сколько раз данный пользователь переходил на домашнюю страницу данного сетевого ресурса за визит на данный сетевой ресурс
указание на источник перехода к данному сетевому ресурсу является одним из:
визитом пользователя на сайт напрямую (TT_GR);
визитом пользователя на сайт через поисковую систему (TT_SE);
визитом пользователя на сайт через социальную сеть (TT_SN);
визитом пользователя на сайт через электронное сообщение (ТТ_IM);
визитом пользователя на сайт, совершенным с помощью сервиса сокращения ссылок (TT_US);
визитом пользователя на сайт, совершенным с помощью рекламной платформы (TT_AD).
[00207] Следует отметить, что когда подобным образом обученный алгоритм машинного обучения обучается и используется для определения параметра пригодности источника для неизвестного сетевого ресурса, алгоритм машинного обучения использует по меньшей мере некоторые (или все) характеристики, на которых он был обучен (или по меньшей мере характеристики из той же категории, на которой он был обучен).
[00208] В некоторых вариантах осуществления настоящей технологии алгоритм машинного обучения обучается для определения параметра пригодности источника с помощью логистического регрессионного анализа. В альтернативных вариантах осуществления технологии алгоритм машинного обучения для определения параметра пригодности источника с помощью одного или нескольких из: логистического регрессионного анализа; упрощенного алгоритма Байеса; алгоритма k-ближайших соседей; алгоритма случайного леса; и алгоритма невзвешенного голосования.
[00209] В некоторых вариантах осуществления настоящей технологии для данного сетевого ресурса (т.е. первого сетевого ресурса 124, второго сетевого ресурса 126 и множества дополнительных сетевых ресурсов 128) характеристики сгруппированы на основе их географического положения. Например, если данный сетевой ресурс является онлайн ресурсом «New York Times», одна характеристика может быть основана на посетителях сетевого ресурса из Соединенных штатов, а другая характеристика основана на посетителях сетевого ресурса из Соединенного королевства.
[00210] Первый этап - выбор источника рекомендаций содержимого.
[00211] На первом этапе модуль 116 выбора источника содержимого получает указание на один или несколько сетевых ресурсов (т.е. первый сетевой ресурс 124, второй сетевой ресурс 126 и множество дополнительных сетевых ресурсов 128). В некоторых вариантах осуществления настоящей технологии полученное указание является указанием на новый сетевой ресурс, который не был ранее просмотрен. В других вариантах осуществления настоящей технологии полученное указание является указанием на обновленный сетевой ресурс, который ранее был просмотрен, но не был обновлен новым содержимым. В некоторых вариантах осуществления настоящей технологии модуль 116 выбора источника содержимого получает указание на один или несколько сетевых ресурсов (т.е. первый сетевой ресурс 124, второй сетевой ресурс 126 и множество дополнительных сетевых ресурсов 128) от устройства 118 хранения данных.
[00212] Модуль 116 выбора источника содержимого далее выполняет обученный алгоритм машинного обучения для определения параметра пригодности источника, связанного с рассматриваемым сетевым ресурсом (т.е. первым сетевым ресурсом 124, вторым сетевым ресурсом 126 и множеством сетевых ресурсов 128).
[00213] В некоторых вариантах осуществления настоящей технологии модуль 116 выбора источника содержимого создает профиль сетевого ресурса для всего сетевого ресурса (т.е. первого сетевого ресурса 124, второго сетевого ресурса 126 и множества дополнительных сетевых ресурсов 128) путем анализа характеристик одной или нескольких веб-страниц всего сетевого ресурса (т.е. первого сетевого ресурса 124, второго сетевого ресурса 126 и множества дополнительных сетевых ресурсов 128).
[00214] В других вариантах осуществления настоящей технологии модуль 116 выбора источника содержимого создает соответствующий профиль сетевого ресурса для подмножества веб-страниц сетевого ресурса (т.е. первого сетевого ресурса 124, второго сетевого ресурса 126 и множества дополнительных сетевых ресурсов 128) путем анализа характеристик одной или нескольких веб-страниц из подмножества сетевого ресурса (т.е. первого сетевого ресурса 124, второго сетевого ресурса 126 и множества дополнительных сетевых ресурсов 128).
[00215] В еще одних других вариантах осуществления настоящей технологии модуль 116 выбора источника содержимого может создавать соответствующий профиль каждой веб-страницы сетевого ресурса (т.е. первого сетевого ресурса 124, второго сетевого ресурса 126 и множества дополнительных сетевых ресурсов 128) путем анализа характеристик каждой веб-страницы сетевого ресурса (т.е. первого сетевого ресурса 124, второго сетевого ресурса 126 и множества дополнительных сетевых ресурсов 128).
[00216] Далее, на основе подобным образом созданного профиля (индивидуальной веб-страницы, подмножества веб-страниц данного сетевого ресурса или всего данного сетевого ресурса) модуль 116 выбора источника содержимого определяет параметр пригодности источника содержимого. Модуль 116 выбора источника содержимого создает параметр пригодности источника содержимого на основе формулы алгоритма машинного обучения, созданной во время фазы обучения.
[00217] Модуль 116 выбора источника содержимого определяет, является ли данный сетевой ресурс (подмножество веб-страниц или индивидуальные веб-страницы - в зависимости от обстоятельств) потенциальным источником элементов содержимого для рекомендации. В некоторых вариантах осуществления настоящей технологии модуль 116 выбора источника содержимого сравнивают таким образом определенный параметр пригодности источника с заранее определенным порогом в ответ на то, что параметр пригодности источника находится выше заранее определенного порога, модуль 116 выбора источника содержимого определяет, что данный сетевой ресурс (подмножество его веб-страниц или его индивидуальные веб-страницы) является потенциальным источником элементов рекомендаций. Следует отметить, что заранее определенный порог может быть определен алгоритмом машинного обучения как часть фазы обучения.
[00218] Второй этап - выбор рекомендаций содержимого из выбранных источников содержимого
[00219] Далее, модуль 116 выбора источника содержимого выбирает из каждого сетевого ресурса, который был определен как потенциальный источник элементов содержимого, один или несколько элементов содержимого вводится в систему рекомендаций (т.е. модуль 115 выбора рекомендаций содержимого).
[00220] В некоторых вариантах осуществления настоящей технологии выбор элементов содержимого из таким образом выбранных источников содержимого выполняется «онлайн», т.е. в ответ на получение запроса на рекомендацию 150 содержимого. В других вариант осуществления технологии, выбор элементов содержимого из таким образом выбранных источников содержимого может выполняться «оффлайн», т.е. до получения запроса на рекомендаций 150 содержимого (например, такой выбор может выполняться регулярно, например каждый день, каждые 7 дней, каждый месяц и так далее, на основе того, насколько быстро теряют актуальность элементы содержимого).
[00221] Выбор элементов содержимого из таким образом выбранных источников содержимого может выполняться с помощью одного или нескольких эвристических правил. Например, модуль 116 выбора источника содержимого выбирает заранее определенное число элементов содержимого (например, 2 элемента содержимого, 5 элементов содержимого, 10 элементов содержимого и так далее), которые связаны с одним или несколькими из: (i) самой свежей датой публикации, (ii) большее число визитов за время последних X дней, (Ш) с конкретным разделов данного сетевого ресурса (например, «самое новое», «популярное» и так далее).
[00222] Обработка системой рекомендаций
[00223] После того как модуль 116 выбора источника содержимого выбирает кандидаты-элементы содержимого из одного или нескольких источников идентифицированного содержимого, и таким образом выбранные кандидаты вводятся в модуль 115 выбора рекомендаций содержимого. Модуль 115 выбора рекомендаций содержимого выполняет свой алгоритм машинного обучения, который обучен и выполнен с возможностью выбирать из кандидатов-элементов содержимого, введенных в него, подмножество элементов содержимого для данного пользователя 102 в ответ на получение запроса на рекомендации 150 содержимого.
[00224] То, как реализован модуль 115 выбора рекомендаций содержимого, никак конкретно не ограничено. Пример алгоритма машинного обучения, который может быть использован модулем 115 выбора рекомендаций содержимого, описан в находящейся на рассмотрении российской патентной заявке, озаглавленной: «СПОСОБ И УСТРОЙСТВО СОЗДАНИЯ СПИСКА рекомендаций содержимого» (англ. "METHOD AND APPARATUS FOR GENERATING A RECOMMENDED CONTENT LIST") под номером 2015136684, поданной 22 августа 2015 года; содержимое которой включено здесь полностью посредством ссылки.
[00225] После того как модуль 115 выбора рекомендаций содержимого создает подмножество элементов содержимого для данного пользователя 102, модуль 115 выбора рекомендаций содержимого создает сообщение 152 рекомендаций содержимого и передает его электронному устройству 104. Когда электронное устройство 104 получает сообщение 152 рекомендаций содержимого, рекомендательное приложение 106 обрабатывает его содержимое и отображает элементы рекомендаций содержимого на интерфейсе 108 рекомендаций. То, как именно реализован интерфейс 108 рекомендаций, никак конкретно не ограничено - может быть использован интерфейс 108 рекомендаций, представленный на Фиг. 2. В другом примере интерфейс 108 рекомендаций может быть реализован как описанный в находящейся на рассмотрении российской патентной заявке, озаглавленной: «СПОСОБ И СИСТЕМА ВЗАИМОДЕЙСТВИЯ С ЭЛЕМЕНТОМ СОДЕРЖИМОГО ПОТОКА СОДЕРЖИМОГО» (англ."МЕТНОБ OF AND SYSTEM FOR INTERACTING WITH A CONTENT ELEMENT OF A CONTENT STREAM") под номером 2015141291, поданной 29 сентября 2015 года; содержимое которой включено здесь полностью посредством ссылки.
[00226] С учетом архитектуры и приведенных выше примеров возможно выполнять способ выбора сетевого ресурса в качестве источника элемента содержимого, элемент содержимого будет проанализирован системой рекомендаций (т.е. модулем 115 выбора рекомендаций содержимого) как часть множества элементов содержимого для создания набора рекомендуемых элементов содержимого в качестве рекомендации для данного пользователя 102 системы 100.
[00227] На Фиг. 4 представлена блок-схема способа 400, реализованного в соответствии с неограничивающими вариантами осуществления настоящей технологии. Способ 400 может выполняться на рекомендательном сервере 112 и, конкретнее, с помощью модуля 116 выбора источника содержимого. Для целей представленного далее описания предполагается, что алгоритм машинного обучения, который будет использоваться модулем 116 выбора источника содержимого был обучен определять параметр пригодности источника на основе обучающих профилей веб-сайтов, созданных с соответствующим множеством обучающих характеристик, по меньшей мере часть из которых относятся к той же категории, что и множество характеристик, которые будут использованы на этапе выполнения способа 200.
[00228] Этап 402 - получение сервером указания на сетевой ресурс
[00229] Способ 400 начинается на этапе 402, на котором модуль 116 выбора источника содержимого получает указание на сетевой ресурс.
[00230] Как было упомянуто ранее, модуль 116 выбора источника содержимого может выполнять «функцию просмотра», которая может быть в широком смысле описана как функция просмотра новых сетевых ресурсов и/или нового содержимого, опубликованного на первом сетевом ресурсе 124, втором сетевом ресурсе 126 и дополнительных сетевых ресурсах 128. С этой целью модуль 116 выбора источника содержимого выполнен с возможностью реализовать «поискового робота», который «посещает» различные сетевые ресурсы, доступные через сеть 110 передачи данных (включая первый сетевой ресурс 124, второй сетевой ресурс 126 и дополнительные сетевые ресурсы) для обнаружения и каталогизации новых доступных ресурсов (например, первого сетевого ресурса 124, второго сетевого ресурса 126 и дополнительных сетевых ресурсов) или нового опубликованного содержимого, доступного на первом сетевом ресурсе 124, втором сетевом ресурсе 126 и дополнительных сетевых ресурсах 128.
[00231] Как часть функции просмотра модуль выбора источника содержимого выполнен с возможностью содержать (на устройстве 118 сохранения данных) информацию, представляющую новые найденные сетевые ресурсы и/или новое найденное доступное содержимое, доступное на них. В некоторых вариантах осуществления настоящей технологии, модуль 116 выбора источника содержимого может быть выполнен с возможностью поддерживать инвертированный индекс на устройстве 118 хранения данных, но модуль 116 выбора источника содержимого может организовать информацию, представляющую новые найденные сетевые ресурсы и/или новое найденное содержимое, доступное на них, в структуру данных, отличную от инвертированного индекса.
[00232] Таким образом, в некоторых вариантах осуществления настоящей технологии, модуль 116 выбора источника содержимого может получать указание на сетевой ресурс, который будет обработан, от устройства 118 хранения данных.
[00233] Этап 404 - получение сервером множества характеристик, связанных с сетевым ресурсом
[00234] На этапе 404, модуль 116 выбора источника содержимого получает множество характеристик, связанных с сетевым ресурсом. Например, модуль 116 выбора источника содержимого может получать характеристики, связанные с сетевым ресурсом от устройства 118 хранения данных.
[00235] Как будет упомянуто, алгоритм машинного обучения выполняется модулем 116 выбора источника содержимого, был обучен на конкретных характеристиках из обучающего набора сетевых ресурсов и, таким образом, алгоритм машинного обучения, выполняемый модулем 116 выбора источника содержимого, получает характеристики, связанные с сетевым ресурсом, которые были обучены для обработки.
[00236] В некоторых вариантах осуществления способа 400, алгоритм машинного обучения был обучен, до упомянутого этапа получения, для определения параметра пригодности источника на основе профилей обучающего веб-сайта, созданных в связи со множеством обучающих характеристик, причем по меньшей некоторые из них относятся к той же категории, что и множество характеристик.
[00237] В некоторых вариантах осуществления способа 400, множество характеристик включает в себя по меньшей мере абсолютную характеристику и относительную характеристику.
[00238] В некоторых вариантах осуществления способа 400, абсолютная характеристика и относительная характеристика являются базовыми характеристиками, и способ 400 далее включает в себя: создание по меньшей мере одной производной характеристики на основе по меньшей мере одной абсолютной характеристики и относительной характеристики; и причем данный профиль веб-сайта далее основан по меньшей мере на одной производной характеристики.
[00239] В некоторых вариантах осуществления способа 400, множество характеристик включает в себя указание на долю посещенных ресурсов по отношению в сетевому ресурсу.
[00240] В некоторых вариантах осуществления способа 400, множество характеристик включает в себя по меньшей мере одну относительную характеристику, выбранную из:
количество хитов за визит (HPV);
количество сессий за визит (SPV);
количество датированных страниц за визит (DPV);
количество домашних страниц за визит (MPV);
время, проведенное на сетевом ресурсе (MTIME);
последний домен за сессию (LPS);
первый домен за сессию (FPS);
количество хитов за сессию (HPS);
количество визитов пользователя (VPU);
количество хитов пользователя (HPU);
количество сессий пользователя (SPU);
количество датированных страниц за хит (DPH);
количество домашних страниц за хит (МРН); и
указание на источник визита, который является одним из:
визитом пользователя на сайт напрямую (TT_GR);
визитом пользователя на сайт через поисковую систему (TT_SE);
визитом пользователя на сайт через социальную сеть (TT_SN);
визитом пользователя на сайт через электронное сообщение (ТТ_IM);
визитом пользователя на сайт, совершенным с помощью сервиса сокращения ссылок (TT_US);
визитом пользователя на сайт, совершенным с помощью рекламной платформы (TTAD).
[00241] В некоторых вариантах осуществления способа 400, множество характеристик включает в себя по меньшей одно из: число пользователей, которые посещают сетевой ресурс за период времени, число визитов за период времени, число переходов к различным веб-страницам в рамках сетевого ресурса за период времени и число уникальных сессий с сетевым ресурсом за период времени.
[00242] В некоторых вариантах осуществления способа 400, множество характеристик в подмножестве всех возможных характеристик, способ далее включает в себя выполнение выбора характеристики для определения подмножества.
[00243] В некоторых вариантах осуществления способа 400, подмножество всех возможных характеристик
по меньшей мере одного из: доли целевой страницы среди визитов сетевого ресурса в рамках первоначального перехода к сетевому ресурса в рамках сессии и доли визитов целевой страницы за время переходов внутри сетевого ресурса;
по меньшей мере одного из: доли веб-страницы, связанной с URL, который содержит данные, представляющие собой первую страницу, которая была посещена за первый переход на сетевой ресурс, и доли веб-страниц в сетевом ресурсе, посещенном за время сессии, веб-страницы связаны с URL, который содержит данные;
долевого профиля источников визита для сетевого ресурса, источники визита выбираются из: поисковой системы/социальных сетей/электронной почты и приложения мессенджера/сервиса сокращения ссылок /прямых визитов;
доли сессии, которую сетевой ресурс занимает в последней сессии.
[00244] Этап 406 - создание сервером профиля данного сетевого ресурса для сетевого ресурса, профиль данного сетевого ресурса основан на множестве характеристик
[00245] На этапе 406 модуль 116 выбора источника содержимого создает профиль данного сетевого ресурса для сетевого ресурса, профиль данного сетевого ресурса основан на множестве характеристик.
[00246] В некоторых вариантах осуществления настоящей технологии, модуль 116 выбора источника содержимого создает вектор, представляющий профиль данного сетевого ресурса на основе некоторых или всех из следующего:
количество хитов за визит (HPV);
количество сессий за визит (SPV);
количество датированных страниц за визит (DPV);
количество домашних страниц за визит (MPV);
время, проведенное на сетевом ресурсе (MTIME);
последний домен за сессию (LPS);
первый домен за сессию (FPS);
количество хитов за сессию (HPS);
количество визитов пользователя (VPU);
количество хитов пользователя (HPU);
количество сессий пользователя (SPU);
количество датированных страниц за хит (DPH);
количество домашних страниц за хит (МРН); и
указание на источник визита, который является одним из:
визитом пользователя на сайт напрямую (TT_GR);
визитом пользователя на сайт через поисковую систему (TT_SE);
визитом пользователя на сайт через социальную сеть (TT_SN);
визитом пользователя на сайт через электронное сообщение (ТТ_IM);
визитом пользователя на сайт, совершенным с помощью сервиса сокращения ссылок (TT_US);
визитом пользователя на сайт, совершенным с помощью рекламной платформы (TT_AD).
[00247] В некоторых вариантах осуществления настоящей технологии, модуль 116 выбора источника содержимого выполняется процедуру выбора характеристик и, таким образом, вектор, представляющий собой профиль данного сетевого ресурса, может быть основана заранее выбранном наборе характеристик сетевого ресурса.
[00248] Этап 408 - выполнение сервером алгоритма машинного обучения для того, чтобы на основании профиля данного сетевого ресурса, определить параметр пригодности источника для сетевого ресурса, параметр пригодности источника указывает на чувствительность сетевого ресурса к публикации элемента содержимого, который может быть обработан системой рекомендаций
[00249] На этапе 408 модуль 116 выбора источника содержимого выполняет алгоритм машинного обучения для того, чтобы на основании профиля данного сетевого ресурса, определить параметр пригодности источника для сетевого ресурса, параметр пригодности источника указывает на чувствительность сетевого ресурса к публикации элемента содержимого, который может быть обработан системой рекомендаций,
[00250] В некоторых вариантах осуществления способ 400, параметр пригодности источника может быть пригодным или непригодным. Параметр пригодности источника может быть определен с помощью по меньшей мере одного из:
логистического регрессионного анализа;
упрощенного алгоритма Байеса;
алгоритма k-ближайших соседей;
алгоритма случайного леса; и
алгоритма невзвешенного голосования.
[00251] Этап 410 - выбор по меньшей мере одного элемента содержимого с сетевого ресурса, если параметр пригодности источника определен как превышающий заранее определенный порог, по меньшей мере один элемент содержимого вводится в систему рекомендаций для обработки
[00252] На этапе 410 модуль 116 выбора источника содержимого осуществляет выбор по меньшей мере одного элемента содержимого с сетевого ресурса, если параметр пригодности источника определен как превышающий заранее определенный порог, по меньшей мере один элемент содержимого вводится в систему рекомендаций для обработки (т.е. модуль 115 выбора рекомендаций содержимого).
[00253] В некоторых вариантах осуществления настоящей технологии, этап 410 выполняется в ответ на запрос от данного пользователя 102 на рекомендацию (т.е. в ответ на получение запроса на рекомендацию 150 содержимого).
[00254] Способ 400 далее завершается или возвращается на этап 402 и ожидает другого запроса на рекомендацию 150 содержимого.
[00255] На Фиг. 3 представлен другой вариант осуществления системы 300, реализованной в соответствии с другим вариантом осуществления настоящей технологии, не ограничивающим ее объем. Система 300 включает в себя конкретные компоненты, которые реализованы по существу аналогично компонентам системы 100. Эти компоненты отмечены под теми же номерами, что и компоненты системы 100. С этой целью система 300 содержит: пользователя 102, электронное устройство 104 (с приложением 106 рекомендаций, выполняемым на нем, приложение 106 рекомендаций обладает интерфейсом 108 рекомендаций) и сеть 110 передачи данных. Также соединен с сетью первый сетевой ресурс 124, второй сетевой ресурс 126 и множество дополнительных сетевых ресурсов 128, которые являются сетевыми ресурсами, доступными электронному устройству 104 (а также другим электронным устройствам, потенциально присутствующим в системе 300) через сеть 110 передачи данных.
[00256] Соответствующее содержимое первого сетевого ресурса 124, второго сетевого ресурса 126 и множества дополнительных сетевых ресурсов 128 никак конкретно не ограничено. Таким образом, данный один сетевой ресурс из первого сетевого ресурса 124, второго сетевого ресурса 126 и множества дополнительных сетевых ресурсов 128 может содержать (или, другими словами, включать в себя) цифровое содержимое, например: аудиосодержимое для потоковой передачи, видеосодержимое для потоковой передачи, новости, блоги, информацию о различных государственных институтах, информацию о точках интереса, тематически кластеризованное содержимое (например, содержимое, релевантное для тех, кто заинтересован в кикбоксинге) и так далее.
[00257] В соответствии с неограничивающим вариантом осуществления технологии, показанным на Фиг. 3, система 300 далее включает в себя рекомендательный сервер 312. Рекомендательный сервер 312 может представлять собой обычный компьютерный сервер. В примере варианта осуществления настоящего технического решения, рекомендательный сервер 312 может представлять собой сервер Dell™ PowerEdge™, на котором используется операционная система Microsoft™ Windows Server™. Излишне говорить, что рекомендательный сервер 312 может представлять собой любое другое подходящее аппаратное, прикладное программное и/или системное программное обеспечение или их комбинацию. В представленном варианте осуществления настоящей технологии, не ограничивающем ее объем, рекомендательный сервер 312 является одиночным сервером. В других вариантах осуществления настоящего технического решения, не ограничивающих ее объем, функциональность рекомендательного сервера 312 изображения может быть разделена и может выполняться с помощью нескольких серверов.
[00258] Рекомендательный сервер 312 включает в себя модуль 314 обработки. Модуль 314 обработки связан с модулем 316 определения источника содержимого. Модуль 316 определения источника содержимого выполнен с возможностью определять из множества потенциальных источников содержимого (т.е. первого сетевого ресурса 124, второго сетевого ресурса 126 и множества дополнительных сетевых ресурсов 128) подмножество источников содержимого.
[00259] В некоторых вариантах осуществления настоящей технологии, модуль 316 определения источника содержимого выполнен с возможностью осуществлять первый алгоритм машинного обучения для определения подмножества источников рекомендаций содержимого из множества источников возможного содержимого (т.е. первого сетевого ресурса 124, второго сетевого ресурса 126 и множества дополнительных сетевых ресурсов 128).
[00260] В некоторых вариантах осуществления настоящей технологии, для определения подмножества источников рекомендаций содержимого, модуль 316 определения источника содержимого выполнен с возможностью осуществлять:
получение указания на предыдущие взаимодействия пользователей по меньшей мере с одним из: (i) системой 100 и (ii) по меньшей мере некоторыми из множества сетевых ресурсов (например, первым сетевым ресурсом 124, вторым сетевым ресурсом 126 и множеством сетевых ресурсов 128);
на основе предыдущих взаимодействий пользователя, определение первого подмножества конкретных для пользователя источников содержимого (т.е. некоторых из первого сетевого ресурса 124, второго сетевого ресурса 126 и множества дополнительных сетевых ресурсов 128);
на основе (i) обученной формулы алгоритма машинного обучения других взаимодействий пользователя по меньшей мере с некоторыми другими из множества сетевых ресурсов (т.е. первым сетевым ресурсом 124, вторым сетевым ресурсом 126 и множеством сетевых ресурсов 128) и по меньшей мере одним из: (ii) первое подмножество конкретных для пользователя источников содержимого; и (iii) вектор профиля пользователя создается на основе предыдущих взаимодействий пользователя для создания второго подмножества не конкретных для пользователя источников содержимого;
обработку первого подмножества конкретных для пользователя источников содержимого и второго подмножества не конкретных для пользователя для создания подмножества источников рекомендаций содержимого;
[00261] Конкретнее, функция модуля 316 определения источника содержимого может выполняться следующим образом, по меньшей мере в некоторых неограничивающих вариантах осуществления настоящей технологии.
[00262] Создание вектора профиля пользователя
[00263] Модуль 316 определения источника содержимого может получать указание на предыдущие взаимодействия пользователя по меньшей мере с одним из: (i) системой 300 и (ii) по меньшей мере некоторыми из множества сетевых ресурсов (например, первым сетевым ресурсом 124, вторым сетевым ресурсом 126 и множеством сетевых ресурсов 128);
[00264] В некоторых вариантах осуществления настоящей технологии, модуль 316 определения источника содержимого получает указание на предыдущее взаимодействие пользователя с браузерным приложением, выполняемым на электронном устройстве 104. В других вариантах осуществления настоящей технологии, модуль 316 определения источника содержимого получает указание на предыдущее взаимодействие пользователя из журналов поисковой системы. В других вариантах осуществления технологии, модуль 316 определения источника содержимого получает указание на предыдущее взаимодействие пользователя из виджетов отслеживания, установленных на различных сетевых ресурсах (например, первого сетевого ресурса 124, второго сетевого ресурса 126 и множества дополнительных сетевых ресурсов 128).
[00265] Определение конкретного для пользователя подмножества источников содержимого
[00266] На основе предыдущих взаимодействий пользователя, модуль 316 определения источника содержимого может осуществлять определение первого подмножества конкретных для пользователя источников содержимого (т.е. некоторых из первого сетевого ресурса 124, второго сетевого ресурса 126 и множества дополнительных сетевых ресурсов 128). Конкретнее, модуль 316 определения источника содержимого определяет один или несколько потенциальных источников содержимого (т.е. некоторых из первого сетевого ресурса 124, второго сетевого ресурса 126 и множества дополнительных сетевых ресурсов 128), с которыми пользователь 102 взаимодействовал в прошлом - например, посредством просмотра одного или нескольких сетевых ресурсов, получение и/или активация рекомендаций содержимого от одного или нескольких сетевых ресурсов и так далее. Другими словами, первое подмножество конкретных для пользователя источников содержимого может считаться «конкретными для пользователя» или «конкретно понравившимися источниками содержимого» в значении того, что пользователь 102 конкретно взаимодействовал с этими сетевыми ресурсами, и может предполагаться, что пользователю понравилось их содержимое, на основе взаимодействия с ними.
[00267] Обогащение конкретного для пользователя подмножества источников содержимого для создания не конкретного для пользователя подмножества источников содержимого
[00268] Далее, модуль 316 определения источника содержимого обогащает конкретное для пользователя подмножество источников содержимого с помощью источников содержимого, которые пользователь 102 мог ранее не видеть. Конкретнее, на основе (i) обученной формулы алгоритма машинного обучения других взаимодействий пользователя по меньшей мере с некоторыми другими из множества сетевых ресурсов (т.е. первым сетевым ресурсом 124, вторым сетевым ресурсом 126 и множеством сетевых ресурсов 128) и по меньшей мере одним из: (ii) первое подмножество конкретных для пользователя источников содержимого; и (iii) вектор профиля пользователя создается на основе предыдущих взаимодействий пользователя для создания второго подмножества не конкретных для пользователя источников содержимого.
[00269] В некоторых вариантах осуществления настоящей технологии, используемый алгоритм машинного обучения может представлять собой алгоритм сингулярного разложения (SVD). В рамках этих вариантов осуществления настоящей технологии, алгоритм машинного обучения определяет не конкретное для пользователя подмножество источников содержимого на основе вектора профиля пользователя, созданного на основе предыдущих взаимодействий пользователя. Конкретнее, алгоритм машинного обучения, реализованный как алгоритм сингулярного разложения (SVD), создает матрицу (i) событий сетевых ресурсов и (ii) пользователей (на основе информации о предыдущих взаимодействиях множества пользователей со множеством сетевых ресурсов, т.е. первого сетевого ресурса 124, второго сетевого ресурса 126 и множества дополнительных сетевых ресурсов 128).
[00270] Алгоритм машинного обучения далее применяет алгоритм сингулярного разложения (SVD) для разложения матрицы на векторы сетевых ресурсов и векторы пользователей. Далее, алгоритм сингулярного разложения (SVD) опускает векторы пользователей и сохраняет векторы сетевых ресурсов (например, сохраняет их в устройстве хранения данных, которое не представлено на Фиг. 3).
[00271] Когда модуль 316 определения источника содержимого получает вектор профиля пользователя, алгоритм сингулярного разложения (SVD) умножает таким образом полученный вектор профиля пользователя и сохраненные векторы сетевых ресурсов для создания заново матрицы сетевых ресурсов с их связанными рангами, конкретными для пользователя 102, который связан с вектором профиля пользователя. На основе ранжированных сетевых ресурсов, модуль 316 определения источника содержимого выбирает заранее определенное число наиболее высоко ранжированных сетевых ресурсов для создания не конкретного для пользователя подмножества источников содержимого.
[00272] В некоторых вариантах осуществления настоящей технологии, используемый алгоритм машинного обучения может представлять собой алгоритм точечной взаимной информации (PMI). В рамках этих вариантов осуществления настоящей технологии, алгоритм машинного обучения определяет не конкретное для пользователя подмножество источников содержимого на основе первого подмножества конкретных для пользователя источников содержимого. Конкретнее, алгоритм машинного обучения определяет для каждого из сетевых ресурсов в первом подмножестве конкретных для пользователя источников содержимого и каждого из просмотренных потенциальных источников содержимого: (i) как часто пара возникает вместе (были вместе просмотрены, возникли вместе как часть результатов поиска и так далее) в течение конкретного взаимодействия; и (ii) как часто взаимодействовали с соответствующим одним из сетевых ресурсов. Алгоритм машинного обучения далее вычисляет пропорцию числа совместных возникновений (как в случае (i)) для умножения индивидуальных значений возникновений соответствующих сетевых ресурсов (как в случае (ii)).
[00273] Для каждого из сетевых ресурсов в первом подмножестве конкретных для пользователя источников содержимого, алгоритм машинного обучения выбирает заранее определенное число наиболее высоко ранжированных ресурсов, определенных алгоритмом точечной взаимной информации (PMI) для создания не конкретного для пользователя подмножества источников содержимого.
[00274] Обработка конкретных для пользователя и не конкретных для пользователя подмножества источников содержимого для создания подмножества источников рекомендаций содержимого
[00275] Модуль 316 определения источника содержимого осуществляет обработку первого подмножества конкретных для пользователя источников содержимого и второго подмножества не конкретных для пользователя для создания подмножества источников рекомендаций содержимого.
[00276] В некоторых вариантах осуществления настоящей технологии, модуль 316 определения источника содержимого выбирает заранее определенное число источников содержимого из не конкретного для пользователя подмножества источников содержимого. В других вариантах осуществления настоящей технологии, модуль 316 определения источника содержимого выбирает заранее определенное число источников содержимого из не конкретного для пользователя подмножества источников содержимого и заранее определенное число источников содержимого из первого подмножества конкретных для пользователя источников содержимого. Модуль 316 определения источника содержимого может быть выполнен с возможностью определять соответствующее число заранее определенных источников содержимого, учитывая то, что чем больше числ выбранных из не конкретного для пользователя подмножества источников содержимого, тем больше рекомендаций элементов содержимого из «новых» источников получит пользователь пользователь 102. И наоборот, чем больше число выбранных из первого подмножества конкретных источников содержимого, тем больше рекомендаций элементов содержимого из «известных» (и, следовательно, более приемлемых) источников получит пользователь 102.
[00277] Рекомендательный сервер 312 далее включает в себя модуль 318 выбора потенциально рекомендуемых элементов содержимого для анализа подмножества источников рекомендаций содержимого для выбора множества потенциально рекомендуемых элементов содержимого.
[00278] Выбор элементов содержимого из таким образом выбранных источников содержимого может выполняться с помощью одного или нескольких эвристических правил. Например, модуль 116 выбора источника содержимого выбирает заранее определенное число элементов содержимого (например, 2 элемента содержимого, 5 элементов содержимого, 10 элементов содержимого и так далее), которые связаны с одним или несколькими из: (i) самой свежей датой публикации, (ii) большее число визитов за время последних X дней, (iii) с конкретным разделов данного сетевого ресурса (например, «самое новое», «популярное» и так далее).
[00279] Рекомендательный сервер 312 далее включает в себя модуль 320 выбора рекомендаций содержимого для выполнения второго алгоритма машинного обучения для выбора, из множества потенциально рекомендуемых элементов содержимого, по меньшей мере одного рекомендуемого элемента содержимого; выбор осуществляется на основе вектора профиля пользователя.
[00280] То, как реализован модуль 320 выбора рекомендаций содержимого, никак конкретно не ограничено. Пример алгоритма машинного обучения, который может быть использован модулем 320 выбора рекомендаций содержимого, описан в находящейся на рассмотрении российской патентной заявке, озаглавленной: «СПОСОБ И УСТРОЙСТВО СОЗДАНИЯ СПИСКА рекомендаций содержимого» (англ. "METHOD AND APPARATUS FOR GENERATING A RECOMMENDED CONTENT LIST") под номером 2015136684, поданной 22 августа 2015 года; содержимое которой включено здесь полностью посредством ссылки.
[00281] После того как модуль 320 выбора рекомендаций содержимого создает подмножество элементов содержимого для данного пользователя 102, модуль 320 выбора рекомендаций содержимого создает сообщение 152 рекомендаций содержимого и передает его электронному устройству 104. Когда электронное устройство 104 получает сообщение 152 рекомендаций содержимого, рекомендательное приложение 106 обрабатывает его содержимое и отображает элементы рекомендаций содержимого на интерфейсе 108 рекомендаций. То, как именно реализован интерфейс 108 рекомендаций, никак конкретно не ограничено - может быть использован интерфейс 108 рекомендаций, представленный на Фиг. 2. В другом примере, интерфейс 108 рекомендаций может быть реализован как описанный в находящейся на рассмотрении российской патентной заявке, озаглавленной: «СПОСОБ И СИСТЕМА ВЗАИМОДЕЙСТВИЯ С ЭЛЕМЕНТОМ СОДЕРЖИМОГО ПОТОКА СОДЕРЖИМОГО» (англ."МЕТЖЮ OF AND SYSTEM FOR INTERACTING WITH A CONTENT ELEMENT OF A CONTENT STREAM") под номером 2015141291, поданной 29 сентября 2015 года; содержимое которой включено здесь полностью посредством ссылки.
[00282] С учетом архитектуры и примеров, описанных выше, возможно использовать способ создания рекомендаций содержимого для пользователя 170 электронного устройства 104. На Фиг. 5 представлена блок-схема способа 500, реализованного в соответствии с неограничивающими вариантами осуществления настоящей технологии. Способ 500 может выполняться на сервере 312 рекомендаций и, конкретнее, с помощью модуля 316 определения источника содержимого и модуля 318 выбора потенциально рекомендуемых элементов содержимого. Для целей представленного далее описания, предполагается, что алгоритм машинного обучения, который будет использоваться модулем 116 выбора источника содержимого, был обучен определять параметр пригодности источника на основе обучающих профилей вебсайтов, созданных с соответствующим множеством обучающих характеристик, по меньшей мере часть из которых относится к той же категории, что и множество характеристик, которые будут использованы на этапе выполнения способа 200.
[00283] Этап 502 - получение от электронного устройства запроса на рекомендацию содержимого, рекомендация содержимого включает в себя по меньшей мере один элемент рекомендации содержимого
[00284] Способ 500 начинается на этапе 502, где модуль 116 выбора источника содержимого получает от электронного устройства 104 запрос на рекомендацию 150 содержимого, рекомендация содержимого включает в себя по меньшей мере один рекомендуемый элемент содержимого.
[00285] Этап 504 - выполнение модуля первого алгоритма машинного обучения для определения подмножества источников рекомендаций содержимого из множества возможных источников содержимого, определение подмножества источников рекомендаций содержимого, включая: получение указания на предыдущие взаимодействия пользователя по меньшей мере с одним из: (i) системой рекомендаций и (ii) по меньшей мере одним из множества сетевых ресурсов; на основе предыдущих взаимодействий пользователя, определение первого подмножества конкретных для пользователя источников содержимого; на основе (i) обученной формулы алгоритма машинного обучения других взаимодействий пользователя по меньшей мере с некоторыми другими из множества сетевых ресурсов и по меньшей мере одним из: (ii) первое подмножество конкретных для пользователя источников содержимого; и (iii) вектор профиля пользователя создается на основе предыдущих взаимодействий пользователя для создания второго подмножества не конкретных для пользователя источников содержимого;
[00286] На этапе 504 модуль 116 выбора источника содержимого выполняет модуль первого алгоритма машинного обучения для определения подмножества источников рекомендаций содержимого из множества возможных источников содержимого, определение подмножества источников рекомендаций содержимого, включая:
получение указания на предыдущие взаимодействия пользователей по меньшей мере с одним из: (i) системой рекомендаций и (ii) по меньшей мере одним из множества сетевых ресурсов;
на основе предыдущих взаимодействий пользователя определение первого подмножества конкретных для пользователя источников содержимого;
на основе
(i) обученной формулы алгоритма машинного обучения других взаимодействий пользователя по меньшей мере с некоторыми другими из множества сетевых ресурсов и по меньшей мере одним из:
(ii) первого подмножества конкретных для пользователя источниках содержимого; и
(iii) векторе пользовательского профиля создается на основе предыдущих взаимодействий пользователя
создании второго подмножества не конкретных для пользователя источников содержимого.
[00287] В некоторых вариантах осуществления способа 500, определение первого подмножества конкретных для пользователя источников содержимого включает в себя применение алгоритма сингулярного разложения (SVD). В рамках этих вариантов осуществления технологии, определение первого подмножества конкретных для пользователя источников содержимого основано на: (i) обученной формуле алгоритма машинного обучения других взаимодействий пользователя по меньшей мере с некоторыми другими из множества сетевых ресурсов; и (ii) вектор профиля пользователя создается на основе предыдущих взаимодействий пользователя.
[00288] В рамках этих вариантов осуществления способа 500, способ 500 дополнительно включает в себя, до получения запроса на рекомендацию содержимого, создание алгоритмом сингулярного разложения матрицы событий и пользователей сетевых ресурсов.
[00289] В некоторых вариантах осуществления способа 500, определение первого подмножества конкретных для пользователя источников содержимого включает в себя применение алгоритма точечной взаимной информации (PMI). В этих вариантах осуществления способа 500, определение первого подмножества конкретных для пользователя источников содержимого основано на: (i) обученной формуле алгоритма машинного обучения других взаимодействий пользователя по меньшей мере с некоторыми другими из множества сетевых ресурсов; и (ii) первом подмножестве конкретных для пользователя источниках содержимого.
[00290] Этап 506 - обработка первого подмножества конкретных для пользователя источников содержимого и второго подмножества не конкретных для пользователя для создания подмножества источников рекомендаций содержимого
[00291] На этапе 506, модуль 116 определения источника содержимого осуществляет обработку первого подмножества конкретных для пользователя источников содержимого и второго подмножества не конкретных для пользователя для создания подмножества источников рекомендаций содержимого.
[00292] Этап 508 - анализ подмножества рекомендуемых источников содержимого для выбора множества потенциально рекомендуемых элементов содержимого
[00293] На этапе 508 модуль 116 определения источника содержимого осуществляет анализ подмножества рекомендуемых источников содержимого для выбора множества потенциально рекомендуемых элементов содержимого
[00294] Этап 510 - выполнение второго алгоритма машинного обучения для выбора, из множества потенциально рекомендуемых элементов содержимого, по меньшей мере одного рекомендуемого элемента содержимого; выбор осуществляется на основе вектора профиля пользователя
[00295] На этапе 510, модуль 318 выбора потенциально рекомендуемых элементов содержимого выполняет второй алгоритм для выбора, из множества потенциально рекомендуемых элементов содержимого, по меньшей мере один рекомендуемый элемент содержимого; выбор осуществляется на основе вектора профиля пользователя.
[00296] В некоторых вариантах осуществления способа 500, выбор из подмножества источников рекомендаций содержимого множества потенциально рекомендуемых элементов содержимого включает в себя определение заранее определенного числа самых новых элементов содержимого.
[00297] В других вариантах осуществления способа 500, выбор из подмножества источников рекомендаций содержимого множества потенциально рекомендуемых элементов содержимого включает в себя определение заранее определенного числа самых популярных элементов содержимого.
[00298] В других вариантах осуществления способа 500, выбор из подмножества источников рекомендаций содержимого конкретен для географической области, где выполняется запрос на рекомендуемое содержимое.
[00299] В других вариантах осуществления способа 500, способ 500 далее включает в себя фильтрацию выбранных потенциально рекомендуемых элементов содержимого. В других вариантах осуществления способа 500, фильтрация основана на языке электронного устройства и языке элемента содержимого.
[00300] Некоторые варианты осуществления настоящей технологии могут привести к конкретному техническому эффекту от использования вариантов осуществления настоящей технологии, который заключается в возможности «заранее квалифицировать» потенциальные источники рекомендаций содержимого в режиме «оффлайн» («оффлайн» подразумевает обработку до получения запроса на рекомендацию 150 содержимого). В некоторых вариантах осуществления настоящей технологии, технический эффект возникает в виде возможности заранее квалифицировать сетевые ресурсы как источники рекомендуемых элементов содержимого при входе на новую территорию.
[00301] Важно иметь в виду, что не все упомянутые здесь технические результаты могут проявляться в каждом варианте осуществления настоящей технологии. Например, варианты осуществления настоящей технологии могут быть выполнены без проявления некоторых технических результатов, другие могут быть выполнены с проявлением других технических результатов или вовсе без них.
[00302] Модификации и улучшения вышеописанных вариантов осуществления настоящей технологии будут ясны специалистам в данной области техники. Предшествующее описание представлено только в качестве примера и не устанавливает никаких ограничений. Таким образом, объем настоящей технологии ограничен только объемом прилагаемой формулы изобретения.
[00303] Варианты осуществления настоящей технологии могут быть кратко изложены в пронумерованных пунктах.
[00304] ПЕРВЫЙ АСПЕКТ ОСУЩЕСТВЛЕНИЯ СПОСОБА/СИСТЕМЫ
[00305] ПУНКТ 1. Способ (400) выбора сетевого ресурса (124, 126, 128) как источника элемента (216, 218) содержимого, элемент содержимого будет проанализирован (216, 218) системой (100) рекомендаций как часть множества элементов (216, 218) содержимого для создания набора элементов (214) рекомендаций содержимого в качестве рекомендации для данного пользователя (102) системы рекомендаций, система рекомендаций выполняется на сервере (112), соединенном с сетью (110) передачи данных, способ включает в себя:
[00306] получение (402) сервером указания на сетевой ресурс;
[00307] получение (404) сервером множества характеристик, связанных с сетевым ресурсом;
[00308] создание (406) сервером профиля данного сетевого ресурса для сетевого ресурса, профиль данного сетевого ресурса основан на множестве характеристик;
[00309] выполнение (408) сервером алгоритма машинного обучения для того, чтобы на основании профиля данного сетевого ресурса определить параметр пригодности источника для сетевого ресурса, параметр пригодности источника указывает на чувствительность сетевого ресурса к публикации элемента содержимого, который может быть обработан системой рекомендаций;
[00310] выбор (410) по меньшей мере одного элемента содержимого с сетевого ресурса, если параметр пригодности источника определен как превышающий заранее определенный порог, по меньшей мере один элемент содержимого вводится в систему рекомендаций для обработки.
[00311] ПУНКТ 2. Способ по п. 1, в котором:
[00312] алгоритм машинного обучения был обучен, до упомянутого этапа получения, для определения параметра пригодности источника на основе профилей обучающего веб-сайта, созданных в связи со множеством обучающих характеристик, причем по меньшей мере некоторые из них относятся к той же категории, что и множество характеристик.
[00313] ПУНКТ 3. Способ по любому из пп. 1, 2, в котором множество характеристик включает в себя по меньшей мере абсолютную характеристику и относительную характеристику.
[00314] ПУНКТ 4. Способ по п. 3, в котором абсолютная характеристика и относительная характеристика являются базовыми характеристиками, и способ далее включает в себя:
[00315] создание по меньшей мере одной производной характеристики на основе по меньшей мере абсолютной характеристики и относительной характеристики; и
[00316] при этом профиль данного веб-сайта далее основан по меньшей мере на одной производной характеристике.
[00317] ПУНКТ 5. Способ по любому из пп. 1 - 4, в котором множество характеристик включает в себя указание на долю посещенных ресурсов по отношению в сетевому ресурсу.
[00318] ПУНКТ 6. Способ по любому из пп. 1 - 4, в котором множество характеристик включает в себя по меньшей мере одну относительную характеристику, выбранную из следующего:
[00319] количество хитов за визит (HPV);
[00320] количество сессий за визит (SPV);
[00321] количество датированных страниц за визит (DPV);
[00322] количество домашних страниц за визит (MPV);
[00323] время, проведенное на сетевом ресурсе (MTIME);
[00324] последний домен за сессию (LPS);
[00325] первый домен за сессию (FPS);
[00326] количество хитов за сессию (HPS);
[00327] количество визитов пользователя (VPU);
[00328] количество хитов пользователя (HPU);
[00329] количество сессий пользователя (SPU);
[00330] количество датированных страниц за хит (DPH);
[00331] количество домашних страниц за хит (МРН); и
[00332] указание на источник визита, который является одним из:
[00333] визитом пользователя на сайт напрямую (TT_GR);
[00334] визитом пользователя на сайт через поисковую систему (TT_SE);
[00335] визитом пользователя на сайт через социальную сеть (TT_SN);
[00336] визитом пользователя на сайт через электронное сообщение (ТТ_IM);
[00337] визитом пользователя на сайт, совершенным с помощью сервиса сокращения ссылок (TT_US);
[00338] визитом пользователя на сайт, совершенным с помощью рекламной платформы (TT_AD).
[00339] ПУНКТ 7. Способ по любому из пп. 1-4, в котором множество характеристик включает в себя по меньшей одно из: число пользователей, которые посещают сетевой ресурс за период времени, число визитов за период времени, число переходов к различным веб-страницам в рамках сетевого ресурса за период времени и число уникальных сессий с сетевым ресурсом за период времени.
[00340] ПУНКТ 8. Способ по любому из пп. 1-7, в котором множество характеристик в подмножестве всех возможных характеристик, способ далее включает в себя выполнение выбора характеристики для определения подмножества.
[00341] ПУНКТ 9. Способ по п. 8, в котором подмножество всех возможных характеристик состоит из:
[00342] по меньшей мере одного из: доли целевой страницы среди визитов сетевого ресурса в рамках первоначального перехода к сетевому ресурсу в рамках сессии и доли визитов целевой страницы за время переходов внутри сетевого ресурса;
[00343] по меньшей мере одного из: доли веб-страницы, связанной с URL, который содержит данные, представляющие собой первую страницу, которая была посещена за первый переход на сетевой ресурс, и доли веб-страниц в сетевом ресурсе, посещенном за время сессии, веб-страницы связаны с URL, который содержит данные;
[00344] долевого профиля источников визита для сетевого ресурса, источники визита выбираются из: поисковой системы/социальных сетей/электронной почты и приложения мессенджера/сервиса сокращения ссылок /прямых визитов;
[00345] доли сессии, которую сетевой ресурс занимает в последней сессии.
[00346] ПУНКТ 10. Способ по любому из пп. 1-9, в котором параметр пригодности источника может быть пригодным или непригодным.
[00347] ПУНКТ 11. Способ по п. 10, в котором параметр пригодности источника может определяться с помощью по меньшей мере одного из:
[00348] логистического регрессионного анализа;
[00349] упрощенного алгоритма Байеса;
[00350] алгоритма k-ближайших соседей;
[00351] алгоритма случайного леса; и
[00352] алгоритма невзвешенного голосования.
[00353] ПУНКТ 12. Способ по любому из пп. 1-11, в котором упомянутый этап выбора выполняется в ответ на запрос рекомендации от данного пользователя.
[00354] ПУНКТ 13. Сервер (112), включающий в себя:
[00355] носитель (118) данных;
[00356] сетевой интерфейс, выполненный с возможностью передачи данных по сети (110) передачи данных;
[00357] процессор (114), функционально соединенный с носителем данных и сетевым интерфейсом, процессор выполняется с возможностью осуществлять:
[00358] получение указания на сетевой ресурс (124, 126, 128), сетевой ресурс будет обработан для определения его пригодности в качестве источника элемента (216, 218) содержимого, элемент содержимого будет проанализирован системой (100) рекомендаций как часть множества элементов (216, 218) содержимого для создания набора рекомендуемых элементов (214) содержимого в качестве рекомендации для данного пользователя системы рекомендации;
[00359] получение множества характеристик, связанных с сетевым ресурсом;
[00360] создание профиля данного сетевого ресурса для сетевого ресурса, профиль данного сетевого ресурса основан на множестве характеристик;
[00361] выполнение сервером алгоритма (116) машинного обучения для того, чтобы на основании профиля данного сетевого ресурса определить параметр пригодности источника для сетевого ресурса, параметр пригодности источника указывает на чувствительность сетевого ресурса к публикации элемента содержимого, который может быть обработан системой рекомендаций,
[00362] выбор (115) по меньшей мере одного элемента содержимого с сетевого ресурса, если параметр пригодности источника определен как превышающий заранее определенный порог, по меньшей мере один элемент содержимого вводится в систему рекомендаций для обработки.
[00363] ПУНКТ 14. Сервер по п. 13, в котором:
[00364] алгоритм машинного обучения был обучен, до упомянутого этапа получения, для определения параметра пригодности источника на основе профилей обучающего веб-сайта, созданных в связи со множеством обучающих характеристик, причем по меньшей некоторые из них относятся к той же категории, что и множество характеристик.
[00365] ПУНКТ 15. Сервер по любому из пп. 13-14, в котором множество характеристик включает в себя по меньшей мере абсолютную характеристику и относительную характеристику.
[00366] ПУНКТ 16. Сервер по п. 15, в котором абсолютная характеристика и относительная характеристика являются базовыми характеристиками, и процессор выполнен с возможностью осуществлять:
[00367] создание по меньшей мере одной производной характеристики на основе по меньшей мере абсолютной характеристики и относительной характеристики; и
[00368] при этом профиль данного веб-сайта далее основан по меньшей мере на одной производной характеристике.
[00369] ПУНКТ 17. Сервер по п. 13, в котором множество характеристик включает в себя указание на долю посещенных ресурсов по отношению в сетевому ресурсу.
[00370] ПУНКТ 18. Сервер по п. 13, в котором множество характеристик включает в себя по меньшей мере одну относительную характеристику, выбранную из следующего:
[00371] количество хитов за визит (HPV);
[00372] количество сессий за визит (SPV);
[00373] количество датированных страниц за визит (DPV);
[00374] количество домашних страниц за визит (MPV);
[00375] время, проведенное на сетевом ресурсе (MTIME);
[00376] последний домен за сессию (LPS);
[00377] первый домен за сессию (FPS);
[00378] количество хитов за сессию (HPS);
[00379] количество визитов пользователя (VPU);
[00380] количество хитов пользователя (HPU);
[00381] количество сессий пользователя (SPU);
[00382] количество датированных страниц за хит (DPH);
[00383] количество домашних страниц за хит (МРН); и
[00384] указание на источник визита, который является одним из:
[00385] визитом пользователя на сайт напрямую (TT_GR);
[00386] визитом пользователя на сайт через поисковую систему (TT_SE);
[00387] визитом пользователя на сайт через социальную сеть (TT_SN);
[00388] визитом пользователя на сайт через электронное сообщение (ТТ_IM);
[00389] визитом пользователя на сайт, совершенным с помощью сервиса сокращения ссылок (TT_US);
[00390] визитом пользователя на сайт, совершенным с помощью рекламной платформы (TT_AD).
[00391] ПУНКТ 19. Сервер по любому из пп. 13-14, в котором множество характеристик включает в себя по меньшей одно из: число пользователей, которые посещают сетевой ресурс за период времени, число визитов за период времени, число переходов к различным веб-страницам в рамках сетевого ресурса за период времени и число уникальных сессий с сетевым ресурсом за период времени.
[00392] ПУНКТ 20. Сервер по любому из пп. 13-19, в котором множество характеристик в подмножестве всех возможных характеристик, способ далее включает в себя выполнение выбора характеристики для определения подмножества.
[00393] ПУНКТ 21. Сервер по п. 20, в котором подмножество всех возможных характеристик состоит из:
[00394] по меньшей мере одного из: доли целевой страницы среди визитов сетевого ресурса в рамках первоначального перехода к сетевому ресурса в рамках сессии и доли визитов целевой страницы за время переходов внутри сетевого ресурса;
[00395] по меньшей мере одного из: доли веб-страницы, связанной с URL, который содержит данные, представляющие собой первую страницу, которая была посещена за первый переход на сетевой ресурс, и доли веб-страниц в сетевом ресурсе, посещенном за время сессии, веб-страницы связаны с URL, который содержит данные;
[00396] долевого профиля источников визита для сетевого ресурса, источники визита выбираются из: поисковой системы/социальных сетей/электронной почты и приложения мессенджера/сервиса сокращения ссылок /прямых визитов;
[00397] доли сессии, которую сетевой ресурс занимает в последней сессии.
[00398] ПУНКТ 22. Сервер по любому из пп. 13-21, в котором параметр пригодности источника может быть пригодным или непригодным.
[00399] ПУНКТ 23. Сервер по п. 22, в котором параметр пригодности источника может определяться с помощью по меньшей мере одного из:
[00400] логистического регрессионного анализа;
[00401] упрощенного алгоритма Байеса;
[00402] алгоритма k-ближайших соседей;
[00403] алгоритма случайного леса; и
[00404] алгоритма невзвешенного голосования.
[00405] ПУНКТ 24. Сервер по любому из пп. 13-23, в котором процессор выполняет выбор в ответ на запрос рекомендации от данного пользователя.
[00407] ВТОРОЙ АСПЕКТ ОСУЩЕСТВЛЕНИЯ СПОСОБА/СИСТЕМЫ
[00408] ПУНКТ 1. Исполняемый на компьютере способ (500) создания рекомендаций (216, 218) содержимого для пользователя (102) электронного устройства (104), способ выполняется рекомендательным сервером (312), доступным электронному устройству через сеть (110) передачи данных, рекомендация содержимого связана с элементом содержимого, доступным на одном из множества сетевых ресурсов (124, 126, 128), доступных через сеть передачи данных, способ включает в себя:
[00409] получение (502) от электронного устройства запроса на рекомендацию (150) содержимого, рекомендация содержимого включает в себя по меньшей мере один элемент рекомендации содержимого;
[00410] выполнение (504) модуля (316) первого алгоритма машинного обучения для определения подмножества источников (124, 126, 128) рекомендаций содержимого из множества возможных источников (124, 126, 128) содержимого, определение подмножества источников рекомендаций содержимого, включая:
[00411] получение (506) указания на предыдущие взаимодействия пользователей по меньшей мере с одним из: (i) системой рекомендаций и (ii) по меньшей мере одним из множества сетевых ресурсов;
[00412] на основе предыдущих взаимодействий пользователя, определение (508) первого подмножества конкретных для пользователя источников содержимого;
[00413] на основе
[00414] (i) обученной формуле алгоритма машинного обучения других взаимодействий пользователя по меньшей мере с некоторыми другими из множества сетевых ресурсов
[00415] и по меньшей мере одного из:
[00416] (ii) первого подмножества конкретных для пользователя источниках содержимого; и
[00417] (iii) вектора пользовательского профиля, созданного на основе предыдущих взаимодействий пользователя,
[00418] создание второго подмножества не конкретных для пользователя источников содержимого;
[00419] обработку первого подмножества конкретных для пользователя источников содержимого и второго подмножества не конкретных для пользователя для создания подмножества источников рекомендаций содержимого;
[00420] анализ (508) подмножества рекомендуемых источников содержимого для выбора множества потенциально рекомендуемых элементов содержимого;
[00421] выполнение (510) второго алгоритма машинного обучения для выбора, из множества потенциально рекомендуемых элементов содержимого, по меньшей мере один рекомендуемый элемент содержимого; выбор осуществляется на основе вектора профиля пользователя.
[00422] ПУНКТ 2. Способ по п. 1, в котором определение первого подмножества конкретных для пользователя источников содержимого включает в себя применение алгоритма сингулярного разложения (SVD).
[00423] ПУНКТ 3. Способ по п. 2, в котором определение первого подмножества конкретных для пользователя источников содержимого основано на:
[00424] (i) обученной формуле алгоритма машинного обучения других взаимодействий пользователя по меньшей мере с некоторыми другими из множества сетевых ресурсов; и
[00425] (ii) вектор пользовательского профиля создается на основе предыдущих взаимодействий пользователя.
[00426] ПУНКТ 4. Способ по п. 3, в котором способ дополнительно включает в себя, до получения запроса на рекомендацию содержимого, создание алгоритмом сингулярного разложения матрицы событий и пользователей сетевых ресурсов.
[00427] ПУНКТ 5. Способ по п. 1, в котором определение первого подмножества конкретных для пользователя источников содержимого включает в себя применение алгоритма точечной взаимной информации (PMI).
[00428] ПУНКТ 6. Способ по п. 5, в котором определение первого подмножества конкретных для пользователя источников содержимого основано на:
[00429] (i) обученной формуле алгоритма машинного обучения других взаимодействий пользователя по меньшей мере с некоторыми другими из множества сетевых ресурсов; и
[00430] (ii) первом подмножестве конкретных для пользователя источниках содержимого.
[00431] ПУНКТ 7. Способ по пп. 1-6, в котором выбор из подмножества источников рекомендаций содержимого множества потенциально рекомендуемых элементов содержимого включает в себя определение заранее определенного числа самых новых элементов содержимого.
[00432] ПУНКТ 8. Способ по любому из пп. 1-6, в котором выбор из подмножества источников рекомендаций содержимого множества потенциально рекомендуемых элементов содержимого включает в себя определение заранее определенного числа самых популярных элементов содержимого.
[00433] ПУНКТ 9. Способ по любому из пп. 1-6, в котором выбор из подмножества источников рекомендаций содержимого конкретен для географической области, где выполняется запрос на рекомендуемое содержимое.
[00434] ПУНКТ 10. Способ по любому из пп. 1-9, дополнительно включающий в себя фильтрацию избранных потенциально рекомендуемых элементов содержимого.
[00435] ПУНКТ 11. Способ по п. 10, в котором фильтрация основана на языке электронного устройства и языке элемента содержимого.
[00436] ПУНКТ 12. Сервер (312), включающий в себя:
[00437] носитель (118) данных;
[00438] сетевой интерфейс, выполненный с возможностью передачи данных по сети (110) передачи данных;
[00439] процессор (314), функционально соединенный с носителем данным и сетевым интерфейсом, процессор выполняется с возможностью осуществлять:
[00440] получение от электронного устройства (102) запроса на рекомендацию (150) содержимого, рекомендация содержимого включает в себя по меньшей мере один элемент (216, 218) рекомендаций содержимого; рекомендация содержимого связана с элементом содержимого, доступном на множестве сетевых (124, 126, 128) ресурсов, которые доступны через сеть передачи данных:
[00441] выполнение модуля (316) первого алгоритма машинного обучения для определения подмножества источников (124, 126, 128) рекомендаций содержимого из множества возможных источников (124, 126, 128) содержимого, определение подмножества источников рекомендаций содержимого, включая:
[00442] получение указания на предыдущие взаимодействия пользователей по меньшей мере с одним из: (i) системой рекомендаций и (ii) по меньшей мере одним из множества сетевых ресурсов;
[00443] на основе предыдущих взаимодействий пользователя, определение первого подмножества конкретных для пользователя источников содержимого;
[00444] на основе
[00445] (i) обученной формуле алгоритма машинного обучения других взаимодействий пользователя по меньшей мере с некоторыми другими из множества сетевых ресурсов
[00446] и по меньшей мере одного из:
[00447] (ii) первого подмножества конкретных для пользователя источниках содержимого; и
[00448] (iii) вектора пользовательского профиля, созданного на основе предыдущих взаимодействий пользователя,
[00449] создание второго подмножества не конкретных для пользователя источников содержимого;
[00450] обработку первого подмножества конкретных для пользователя источников содержимого и второго подмножества не конкретных для пользователя для создания подмножества источников рекомендаций содержимого;
[00451] анализ подмножества рекомендуемых источников содержимого для выбора множества потенциально рекомендуемых элементов содержимого;
[00452] выполнение модуля (318) второго алгоритма машинного обучения для выбора, из множества потенциально рекомендуемых элементов содержимого, по меньшей мере один рекомендуемый элемент содержимого; выбор осуществляется на основе вектора профиля пользователя.
[00453] ПУНКТ 13. Сервер по п. 12, в котором для определения первого подмножества конкретных для пользователя источников содержимого, процессор выполнен с возможностью применять алгоритм сингулярного разложения (SVD).
[00454] ПУНКТ 14. Сервер по п. 13, в котором определение первого подмножества конкретных для пользователя источников содержимого основано на:
[00455] (i) обученной формуле алгоритма машинного обучения других взаимодействий пользователя по меньшей мере с некоторыми другими из множества сетевых ресурсов; и
[00456] (ii) вектор пользовательского профиля создается на основе предыдущих взаимодействий пользователя.
[00457] ПУНКТ 15. Сервер по п. 14, в котором сервер дополнительно выполнен с возможностью, до этапа получения запроса на рекомендацию содержимого, осуществлять создание, с помощью алгоритма сингулярного разложения, матрицы событий и пользователей сетевых ресурсов.
[00458] ПУНКТ 16. Сервер по п. 12, в котором для определения первого подмножества конкретных для пользователя источников содержимого процессор выполнен с возможностью применять алгоритм точечной взаимной информации (PMI).
[00459] ПУНКТ 17. Сервер по п. 16, в котором определение первого подмножества конкретных для пользователя источников содержимого основано на:
[00460] (i) обученной формуле алгоритма машинного обучения других взаимодействий пользователя по меньшей мере с некоторыми другими из множества сетевых ресурсов; и
[00461] (ii) первом подмножестве конкретных для пользователя источниках содержимого.
[00462] ПУНКТ 18. Сервер по любому из пп. 12-17, в котором выбор из подмножества источников рекомендаций содержимого множества потенциально рекомендуемых элементов содержимого включает в себя определение заранее определенного числа самых новых элементов содержимого.
[00463] ПУНКТ 19. Сервер по любому из пп. 12-17, в котором выбор из подмножества источников рекомендаций содержимого множества потенциально рекомендуемых элементов содержимого включает в себя определение заранее определенного числа самых популярных элементов содержимого.
[00464] ПУНКТ 20. Сервер по любому из пп. 12-17, в котором выбор из подмножества источников рекомендаций содержимого конкретен для географической области, где выполняется запрос на рекомендуемое содержимое.
[00465] ПУНКТ 21. Сервер по любому из пп. 12-20, в котором процессор дополнительно выполнен с возможностью осуществлять фильтрацию выбранных потенциально рекомендуемых элементов содержимого.
[00466] ПУНКТ 22. Сервер по п. 21, в котором фильтрация основана на языке электронного устройства и языке элемента содержимого.
Изобретение относится к выбору сетевого ресурса в качестве источника содержимого для системы рекомендаций. Технический результат – повышение эффективности выбора сетевого ресурса в качестве источника содержимого для системы рекомендаций. Способ для выбора сетевого ресурса в качестве источника элемента содержимого, элемент содержимого будет проанализирован системой рекомендаций как часть множества элементов содержимого для создания набора рекомендуемых элементов содержимого в качестве рекомендации для данного пользователя системы рекомендации, при этом способ включает в себя получение сервером по меньшей мере одной характеристики, связанной с сетевым ресурсом, по меньшей мере одна характеристика включает в себя указание на источник визита, создание сервером профиля данного сетевого ресурса для сетевого ресурса, профиль данного сетевого ресурса основан на по меньшей мере одной характеристике, выполнение сервером алгоритма машинного обучения для определения параметра пригодности источника для сетевого ресурса, выбор по меньшей мере одного элемента содержимого с сетевого ресурса, если параметр пригодности источника определен как превышающий заранее определенный порог. 2 н. и 22 з.п. ф-лы, 5 ил.
1. Способ выбора сетевого ресурса как источника элемента содержимого, элемент содержимого будет проанализирован системой рекомендаций как часть множества элементов содержимого для создания набора элементов рекомендаций содержимого в качестве рекомендации для данного пользователя системы рекомендаций, система рекомендаций выполняется на сервере, соединенном с сетью передачи данных, способ включает в себя:
получение сервером указания на сетевой ресурс;
получение сервером по меньшей мере одной характеристики, связанной с сетевым ресурсом, по меньшей мере одна характеристика включает в себя указание на источник визита;
создание сервером профиля данного сетевого ресурса для сетевого ресурса, профиль данного сетевого ресурса основан на по меньшей мере одной характеристике;
выполнение сервером алгоритма машинного обучения для того, чтобы на основании профиля данного сетевого ресурса определить параметр пригодности источника для сетевого ресурса, параметр пригодности источника указывает на возможность сетевого ресурса к публикации элемента содержимого, который может быть обработан системой рекомендаций;
выбор по меньшей мере одного элемента содержимого с сетевого ресурса, если параметр пригодности источника определен как превышающий заранее определенный порог, по меньшей мере один элемент содержимого вводится в систему рекомендаций для обработки.
2. Способ по п. 1, в котором:
алгоритм машинного обучения был обучен, до упомянутого этапа получения, для определения параметра пригодности источника на основе профилей обучающего веб-сайта, созданных в связи со множеством обучающих характеристик, причем по меньшей мере некоторые из них относятся к той же категории, что и по меньшей мере одна характеристика.
3. Способ по п. 1, в котором по меньшей мере одна характеристика дополнительно включает в себя по меньшей мере абсолютную характеристику и относительную характеристику.
4. Способ по п. 3, в котором абсолютная характеристика и относительная характеристика являются базовыми характеристиками, и способ дополнительно включает в себя:
создание по меньшей мере одной производной характеристики на основе по меньшей мере абсолютной характеристики и относительной характеристики,
при этом профиль данного веб-сайта дополнительно основан по меньшей мере на одной производной характеристике.
5. Способ по п. 1, в котором по меньшей мере одна характеристика дополнительно включает в себя указание на долю посещенных ресурсов по отношению к сетевому ресурсу.
6. Способ по п. 1, в котором по меньшей мере одна характеристика допольнительно включает в себя по меньшей мере одну относительную характеристику, выбранную из следующего:
количество хитов за визит (HPV);
количество сессий за визит (SPV);
количество датированных страниц за визит (DPV);
количество домашних страниц за визит (MPV);
время, проведенное на сетевом ресурсе (MTIME);
последний домен за сессию (LPS);
первый домен за сессию (FPS);
количество хитов за сессию (HPS);
количество визитов на пользователя (VPU);
количество хитов на пользователя (HPU);
количество сессий на пользователя (SPU);
количество датированных страниц за хит (DPH);
количество домашних страниц за хит (МРН); и
указание на источник визита, который является одним из:
визитом пользователя на сайт напрямую (TT_GR);
визитом пользователя на сайт через поисковую систему (TT_SE);
визитом пользователя на сайт через социальную сеть (TT_SN);
визитом пользователя на сайт через электронное сообщение (ТТ_IM);
визитом пользователя на сайт, совершенным с помощью сервиса сокращения ссылок (TT_US);
визитом пользователя на сайт, совершенным с помощью рекламной платформы (TT_AD).
7. Способ по п. 1, в котором по меньшей мере одна характеристика дополнительно включает в себя по меньшей одно из: число пользователей, которые посещают сетевой ресурс за период времени, число визитов за период времени, число переходов к различным веб-страницам в рамках сетевого ресурса за период времени и число уникальных сессий с сетевым ресурсом за период времени.
8. Способ по п. 1, в котором по меньшей мере одна характеристика является подмножеством всех возможных характеристик, способ дополнительно включает в себя выполнение выбора характеристики для определения подмножества.
9. Способ по п. 8, в котором подмножество всех возможных характеристик состоит из:
по меньшей мере одного из: доли целевой страницы среди визитов сетевого ресурса в рамках первоначального перехода к сетевому ресурсу в рамках сессии и доли визитов целевой страницы за время переходов внутри сетевого ресурса;
по меньшей мере одного из: доли веб-страницы, связанной с URL, который содержит дату, когда первая страница была посещена за первый переход на сетевой ресурс, и доли веб-страниц в сетевом ресурсе, посещенном за время сессии, веб-страницы связаны с URL, который содержит дату;
долевого профиля источников визита для сетевого ресурса, источники визита выбираются из: поисковой системы/социальных сетей/электронной почты и приложения мессенджера/сервиса сокращения ссылок/прямых визитов;
доли сессии, где сетевой ресурс был последним в сессии.
10. Способ по п. 1, в котором параметр пригодности источника может быть пригодным или непригодным.
11. Способ по п. 10, в котором параметр пригодности источника может определяться с помощью по меньшей мере одного из:
логистического регрессионного анализа;
упрощенного алгоритма Байеса;
алгоритма k-ближайших соседей;
алгоритма случайного леса; и
алгоритма невзвешенного голосования.
12. Способ по п. 1, в котором упомянутый этап выбора выполняется в ответ на запрос рекомендации от данного пользователя.
13. Сервер включает в себя:
носитель данных;
сетевой интерфейс, выполненный с возможностью соединения по сети передачи данных;
процессор, функционально соединенный с носителем данных и сетевым интерфейсом, процессор выполнен с возможностью осуществлять:
получение указания на сетевой ресурс, сетевой ресурс будет обработан для определения его пригодности в качестве источника элемента содержимого, элемент содержимого будет проанализирован системой рекомендаций как часть множества элементов содержимого для создания набора рекомендуемых элементов содержимого в качестве рекомендации для данного пользователя системы рекомендации;
получение по меньшей мере одной характеристики, связанной с сетевым ресурсом, по меньшей мере одна характеристика включает в себя указание на источник визита;
создание профиля данного сетевого ресурса для сетевого ресурса, профиль данного сетевого ресурса основан на по меньшей мере одной характеристике;
выполнение сервером алгоритма машинного обучения для того, чтобы на основании профиля данного сетевого ресурса определить параметр пригодности источника для сетевого ресурса, параметр пригодности источника указывает на возможность сетевого ресурса к публикации элемента содержимого, который может быть обработан системой рекомендаций,
выбор по меньшей мере одного элемента содержимого с сетевого ресурса, если параметр пригодности источника определен как превышающий заранее определенный порог, по меньшей мере один элемент содержимого вводится в систему рекомендаций для обработки.
14. Сервер по п. 13, в котором
алгоритм машинного обучения был обучен, до упомянутого этапа получения, для определения параметра пригодности источника на основе профилей обучающего веб-сайта, созданных в связи со множеством обучающих характеристик, причем по меньшей мере некоторые из них относятся к той же категории, что и по меньшей мере одна характеристика.
15. Сервер по п. 13, в котором по меньшей мере одна характеристика дополнительно включает в себя по меньшей мере абсолютную характеристику и относительную характеристику.
16. Сервер по п. 15, в котором абсолютная характеристика и относительная характеристика являются базовыми характеристиками и процессор выполнен с возможностью осуществлять:
создание по меньшей мере одной производной характеристики на основе по меньшей мере абсолютной характеристики и относительной характеристики,
при этом профиль данного веб-сайта дополнительно основан по меньшей мере на одной производной характеристике.
17. Сервер по п. 13, в котором по меньшей мере одна характеристика дополнительно включает в себя указание на долю посещенных ресурсов по отношению к сетевому ресурсу.
18. Сервер по п. 13, в котором по меньшей мере одна характеристика дополнительно включает в себя по меньшей мере одну относительную характеристику, выбранную из следующего:
количество хитов за визит (HPV);
количество сессий за визит (SPV);
количество датированных страниц за визит (DPV);
количество домашних страниц за визит (MPV);
время, проведенное на сетевом ресурсе (MTIME);
последний домен за сессию (LPS);
первый домен за сессию (FPS);
количество хитов за сессию (HPS);
количество визитов на пользователя (VPU);
количество хитов на пользователя (HPU);
количество сессий на пользователя (SPU);
количество датированных страниц за хит (DPH);
количество домашних страниц за хит (МРН); и
указание на источник визита, который является одним из:
визитом пользователя на сайт напрямую (TT_GR);
визитом пользователя на сайт через поисковую систему (TT_SE);
визитом пользователя на сайт через социальную сеть (TT_SN);
визитом пользователя на сайт через электронное сообщение (ТТ_IM);
визитом пользователя на сайт, совершенным с помощью сервиса сокращения ссылок (TT_US);
визитом пользователя на сайт, совершенным с помощью рекламной платформы (TT_AD).
19. Сервер по п. 13, в котором по меньшей мере одна характеристика дополнительно включает в себя по меньшей одно из: число пользователей, которые посещают сетевой ресурс за период времени, число визитов за период времени, число переходов к различным веб-страницам в рамках сетевого ресурса за период времени и число уникальных сессий с сетевым ресурсом за период времени.
20. Сервер по п. 13, в котором по меньшей мере одна характеристика является подмножеством всех возможных характеристик, процессор дополнительно выполнен с возможностью осуществлять выполнение выбора характеристики для определения подмножества.
21. Сервер по п. 20, в котором подмножество всех возможных характеристик состоит из:
по меньшей мере одного из: доли целевой страницы среди визитов сетевого ресурса в рамках первоначального перехода к сетевому ресурсу в рамках сессии и доли визитов целевой страницы за время переходов внутри сетевого ресурса;
по меньшей мере одного из: доли веб-страницы, связанной с URL, который содержит дату, когда первая страница была посещена за первый переход на сетевой ресурс, и доли веб-страниц в сетевом ресурсе, посещенном за время сессии, веб-страницы связаны с URL, который содержит дату;
долевого профиля источников визита для сетевого ресурса, источники визита выбираются из: поисковой системы/социальных сетей/электронной почты и приложения мессенджера/сервиса сокращения ссылок/прямых визитов;
доли сессии, где сетевой ресурс был последним в сессии.
22. Сервер по п. 13, в котором параметр пригодности источника может быть пригодным или непригодным.
23. Сервер по п. 22, в котором процессор выполнен с возможностью определять параметр пригодности источника с помощью по меньшей мере одного из:
логистического регрессионного анализа;
упрощенного алгоритма Байеса;
алгоритма k-ближайших соседей;
алгоритма случайного леса; и
алгоритма невзвешенного голосования.
24. Сервер по п. 13, в котором процессор выполнен с возможностью осуществлять выбор в ответ на запрос рекомендации от данного пользователя.
Способ защиты переносных электрических установок от опасностей, связанных с заземлением одной из фаз | 1924 |
|
SU2014A1 |
Устройство для закрепления лыж на раме мотоциклов и велосипедов взамен переднего колеса | 1924 |
|
SU2015A1 |
Способ приготовления лака | 1924 |
|
SU2011A1 |
RU 2013101601 A1, 20.07.2014. |
Авторы
Даты
2017-11-27—Публикация
2016-07-07—Подача