УСТРОЙСТВО И СПОСОБ ОПРЕДЕЛЕНИЯ ВРЕМЕНИ СОЗДАНИЯ ВЕБ-РЕСУРСА Российский патент 2016 года по МПК G06F17/00 H04H60/76 

Описание патента на изобретение RU2577479C2

Перекрестная ссылка

Отсутствует

Область техники

Настоящая технология относится к устройству и способу определения времени создания веб-ресурса.

Уровень техники

Сеть Интернет предоставляет доступ к огромному количеству информации. Доступная информация содержит различные типы содержимого, например фотографии, видео, аудио и тому подобное, и относится к различной тематике, например, помимо всего прочего, новости, погода, информация о дорожном движении, развлечения, финансы и тому подобное. Существующие веб-страницы постоянно обновляются для поддержания актуальности информации, кроме того, постоянно создаются новые страницы, содержащие новую информацию и с возможностью доступа к ним через Интернет.

Доступ к информации осуществляется с помощью широкого спектра электронных устройств, например стационарных компьютеров, переносных компьютеров, смартфонов, планшетов и тому подобных. Пользователь также может использовать навигацию на конкретном веб-сайте напрямую, используя адрес данного веб-ресурса, к которому он желает получить доступ. Например, когда пользователь желает получить доступ к онлайновым банковским операциям банка Royal Bank of Canada, пользователь понимает, что он должен получить доступ к веб-сайту . В другом случае, пользователь ищет информацию, не зная точно, на каком веб-ресурсе находится нужная информация, или не зная адреса этого ресурса, и по этой причине вынужден выполнять веб-поиск с использованием поисковой системы, например YANDEX, GOOGLE, YAHOO! и тому подобных. Как известно, пользователь вводит поисковый запрос и поисковая система предоставляет список веб-ресурсов, соответствующих поисковому запросу, известный как страница результатов работы поисковой системы, или сокращенно SERP.

Для быстрого и эффективного получения информации через Интернет важно знать, когда был создан веб-ресурс. Время создания веб-ресурса часто используется для решения многих задач, связанных с получением информации, например для планирования работы поискового робота, ранжирования результатов поиска, сортировки результатов поиска и тому подобного. В связи с этим, возникает потребность в устройстве и способе определения наиболее вероятного времени создания веб-ресурса.

Раскрытие изобретения

Таким образом, задачей предлагаемой технологии является устранение по меньшей мере некоторых недостатков, присущих известному уровню техники.

В соответствии с первым общим аспектом настоящей технологии, предоставлен способ определения времени создания целевой страницы, при этом способ выполняется на сервере, подключенном к коммуникационной сети. Способ содержит создание сети страниц, содержащей множество страниц, в том числе целевую страницу и множество ссылок. Каждая ссылка из множества ссылок имеет исходную страницу и страницу назначения. Каждая из исходных страниц и страниц назначения представляют собой одну из множества страниц. Каждая страница из множества страниц представляет собой одну исходную страницу и страницу назначения по меньшей мере для одной из множества ссылок. Для множества ссылок, вероятностное распределение сети страниц соответствует гипотетическому времени создания целевой страницы. Вероятностное распределение сети страниц основано на вероятностном распределении для каждой ссылки из множества ссылок. Вероятностное распределение для каждой ссылки основано на времени создания для исходной страницы из ссылки и времени создания для страницы назначения из ссылки. Значение гипотетического времени создания предоставляет наибольшее значение определенного вероятностного распределения сети страниц, значение гипотетического времени создания соответствует времени создания целевой страницы.

В другом аспекте, сервер коммуникативно подключен ко множеству узлов через коммуникационную сеть, при этом сервер содержит модуль обработки, сконфигурированный для создания сети страниц, содержащей множество страниц, в том числе целевую страницу и множество ссылок. Каждая ссылка из множества ссылок имеет исходную страницу и страницу назначения, каждая из исходных страниц и страниц назначения представляют собой одну из множества страниц. Каждая страница из множества страниц представляет собой одну исходную страницу и страницу назначения по меньшей мере для одной из множества ссылок. Модуль обработки дополнительно сконфигурирован для определения вероятностного распределения сети страниц для множества ссылок и соответствует гипотетическому времени создания целевой страницы. Вероятностное распределение сети страниц основано на вероятностном распределении для каждой ссылки из множества ссылок. Вероятностное распределение для каждой ссылки основано на времени создания для исходной страницы из ссылки и времени создания для страницы назначения из ссылки. Модуль обработки дополнительно сконфигурирован для определения гипотетического времени создания ресурса, принимая наибольшее значение вероятностного распределения сети страниц, значение предположительного времени соответствует времени создания целевой страницы.

В контексте настоящего описания, поскольку иное не предусмотрено, термин "сервер" представляет собой компьютерную программу, выполняемую на соответствующем оборудовании и способную принимать запросы (например, от клиентского устройства) через сеть и выполнять эти запросы или запускать механизм выполнения запросов. Оборудование может представлять собой один физический компьютер или одну физическую компьютерную систему, но ни то, ни другое не является обязательным для настоящей технологии. В контексте настоящей технологии использование выражения «сервер» не означает, что каждая задача (например, полученные инструкции или запросы) или какая-либо конкретная задача будет получена, выполнена или инициирована к выполнению одним и тем же сервером (то есть одним и тем же программным обеспечением и/или аппаратным обеспечением); это означает, что любое количество элементов программного обеспечения или аппаратных устройств может быть вовлечено в прием/передачу, выполнение или инициирование выполнения любого запроса или последствия любого запроса, связанного с клиентским устройством, и все это программное и аппаратное обеспечение может быть одним сервером или несколькими серверами, оба варианта включены в выражение «по меньшей мере один сервер».

В контексте настоящего описания, если не предусмотрено иное, термин "электронное устройство" означает любое компьютерное оборудование, на котором программное обеспечение способно выполнять поставленные задачи. Таким образом, примерами электронных устройств (среди прочего) могут служить персональные компьютеры (настольные компьютеры, ноутбуки, нетбуки и т.п.), смартфоны, планшеты, а также сетевое оборудование, такое как маршрутизаторы, коммутаторы и шлюзы. Следует иметь в виду, что устройство, ведущее себя как электронное устройство в настоящем контексте, может вести себя как сервер по отношению к другим электронным устройствам. Использование выражения «электронное устройство» не исключает возможности использования множества электронных устройств для получения/отправки, выполнения или инициирования выполнения любой задачи или запроса, или же последствий любой задачи или запроса, или же этапов любого вышеописанного способа.

В контексте настоящего описания термин "база данных" подразумевает под собой любой структурированный набор данных, не зависящий от конкретной структуры, программного обеспечения по управлению базой данных, аппаратного обеспечения компьютера, на котором данные хранятся, используются или иным образом оказываются доступны для использования. База данных может находиться на том же оборудовании, которое выполняет процесс, сохраняющий или использующий информацию, хранящуюся в базе данных, или же она может находиться на отдельном оборудовании, например выделенном сервере или множестве серверов.

В контексте настоящего описания термин "информация" содержит информацию любого рода или типа, которая может храниться в базе данных. Таким образом, информация содержит, среди прочего, аудиовизуальные произведения (изображения, видео, звукозаписи, презентации и т.д.), данные (данные о местоположении, цифровые данные и т.д.), текст (мнения, комментарии, вопросы, сообщения и т.д.), документы, таблицы и т.д.

В контексте настоящего описания слова "первый", "второй", "третий" и т.д. используются в виде прилагательных исключительно для того, чтобы отличать существительные, к которым они относятся, друг от друга, а не для целей описания какой-либо конкретной связи между этими существительными. Так, например, следует иметь в виду, что использование терминов "первый сервер" и "третий сервер" не подразумевает какого-либо порядка, отнесения к определенному типу, хронологии, иерархии или ранжирования (например) серверов/между серверами, равно как и их использование (само по себе) не предполагает, что некий "второй сервер" обязательно должен существовать в той или иной ситуации. Кроме того, как указано здесь в другом контексте, упоминание "первого" элемента и "второго" элемента не исключает возможности того, что это один и тот же фактический реальный элемент. Так, например, в некоторых случаях, "первый" сервер и "второй" сервер могут являться одним и тем же программным и/или аппаратным обеспечением, а в других случаях они могут являться разным программным и/или аппаратным обеспечением.

Каждый вариант осуществления настоящей технологии включает по меньшей мере одну из вышеупомянутых целей и/или объектов, но наличие всех их вместе не является обязательным. Следует иметь в виду, что некоторые объекты данной технологии, полученные в результате попыток достичь вышеупомянутой цели, могут не удовлетворять этой цели и/или могут удовлетворять другим целям, отдельно не указанным здесь.

Дополнительные и/или альтернативные характеристики, аспекты и преимущества вариантов осуществления настоящей технологии станут очевидными из последующего описания, прилагаемых чертежей и прилагаемой формулы изобретения.

Краткое описание чертежей

Для лучшего понимания настоящей технологии, а также других ее аспектов и характеристик сделана ссылка на следующее описание, которое должно использоваться в сочетании с прилагаемыми чертежами, где:

Фиг. 1 представляет собой схематическое изображение сетевой среды 100, выполненной в соответствии с вариантом реализации настоящей технологии;

Фиг. 2 представляет собой схематическое изображение примера сети страниц в соответствии с вариантом реализации настоящей технологии;

Фиг. 3 представляет собой график последовательности определения времени создания веб-страницы в соответствии с вариантом реализации настоящей технологии; и

Приложения А и В содержат дополнительную информацию, связанную с реализацией способа на Фиг. 3.

Осуществление изобретения

Ссылаясь на Фиг. 1, представлено схематическое изображение системы 100, выполненной в соответствии с вариантами осуществления настоящей технологии, не ограничивающими ее объем. Важно иметь в виду, что нижеследующее описание системы 100 представляет собой описание иллюстративных вариантов осуществления настоящей технологии. Таким образом, все последующее описание представлено только как описание иллюстративного примера настоящей технологии. Таким образом, нижеследующее их описание должно рассматриваться исключительно как описание иллюстративных примеров настоящей технологии.

В некоторых случаях, следует полагать, что полезные примеры модификаций системы 100 также могут быть охвачены нижеследующим описанием. Модификации описаны всего лишь для облегчения понимания, а не определения объема и границ настоящей технологии. Эти модификации представляют собой далеко не полный перечень, и специалистам в данной области будет понятно, что возможны и другие модификации. Кроме того, это не должно интерпретироваться так, что там, где это еще не было сделано, т.е. там, где не были изложены примеры модификаций, никакие модификации невозможны, и/или что то, что описано, является единственным вариантом осуществления этого элемента настоящей технологии. Как будет понятно специалисту в данной области техники, это, скорее всего, не так. Кроме того, следует иметь в виду, что сетевая среда 100 представляет собой в некоторых конкретных проявлениях достаточно простой вариант осуществления настоящей технологии и в подобных случаях представлена здесь с целью облегчения понимания. Как будет понятно специалисту в данной области техники, многие варианты осуществления настоящей технологии будут обладать гораздо большей сложностью.

Сетевая среда 100 содержит электронное устройство 102 и коммуникационную сеть 110. Электронное устройство 102 подключено к коммуникационной сети 110 через канал связи 103. Электронное устройство 102 обычно связано с пользователем (не показан) и по этой причине иногда называется "электронное устройство пользователя" или "клиентское устройство". В проиллюстрированном варианте реализации технологии, электронное устройство 102 представляет собой переносной компьютер. Реализация электронного устройства 102 не ограничивается реализацией в виде переносного компьютера 102. В качестве примера, электронное устройство 102 может быть реализовано в виде смартфона, персонального компьютера (настольного компьютера, переносного компьютера, нетбука и так далее), беспроводного электронного устройства (мобильного телефона, смартфона, планшета и тому подобных), а также сетевого оборудования (маршрутизатора, коммутатора или шлюза). Общий вариант осуществления электронного устройства 102 известен в области техники и поэтому не будет здесь подробно описан.

Несмотря на то что настоящее описание создано со ссылкой на сетевую среду 100, имеющую одно электронное устройство 102, следует понимать, что сетевая среда 100 способна содержать более одного электронного устройства 102.

Электронное устройство пользователя 102 содержит пользовательский интерфейс ввода (например, клавиатуру, мышь, сенсорную панель, сенсорный монитор, микрофон и тому подобное) для получения данных, вводимых пользователем. Электронное устройство 102 также содержит пользовательский интерфейс вывода (например, экран, динамики, принтер и тому подобное) для визуального, звукового или тактильного вывода данных пользователю. Электронное устройство пользователя 102 содержит интерфейс сетевого взаимодействия (например, модем, сетевую карту и тому подобное) для двустороннего обмена данными через коммуникационную сеть 110 с помощью канала связи 103. Электронное устройство 102 также содержит процессор, связанный с пользовательским интерфейсом ввода, пользовательским интерфейсом вывода и интерфейсом сетевого взаимодействия. Процессор сконфигурирован для выполнения различных способов, включая способы, описанные ниже в данном документе. С этой целью процессор может сохранять или иметь доступ к машиночитаемым командам, выполнение которых инициирует процессор выполнять различные описанные здесь процедуры. Как известно в данной области, электронное устройство пользователя 102 содержит аппаратное и/или программное обеспечение и/или встроенное программное обеспечение для запуска различных приложений. Некоторые приложения сконфигурированы для получения и передачи информации через коммуникационную сеть 110. Примерами таких приложений являются приложения браузера, поисковые приложения, приложения потоковой музыки, приложения для обмена фотографиями и тому подобные.

В проиллюстрированном варианте реализации настоящей технологии, коммуникационная сеть 110 представляет собой сеть Интернет. В других вариантах осуществления настоящей технологии, коммуникационная сеть 110 может быть реализована иначе - в виде глобальной коммуникационной сети, локальной коммуникационной сети, частной коммуникационной сети и тому подобной.

Канал связи 103 также имеет несколько вариантов реализации, не ограничивающих объема настоящей технологии, конкретный вариант реализации канала связи 103 для электронного устройства пользователя 102 зависит от реализации самого электронного устройства 102. На проиллюстрированном варианте реализации настоящей технологии, в котором электронное устройство пользователя 102 реализовано в виде переносного компьютера, канал связи 103 для первого электронного устройства 102 представляет собой либо беспроводной канал связи (например, Wireless Fidelity, или сокращенно WiFi®, Bluetooth® и тому подобный), либо проводной канал связи (например, универсальная последовательная шина или USB-подключение). Боле того, канал связи 103, подключающий электронное устройство 102 к коммуникационной сети 110, поддерживает более одного типа связи. Например, в данном варианте реализации технологии, приводимом в качестве примера, переносной компьютер 102 подключается к сети 110 с помощью беспроводного, а также проводного соединения.

Важно иметь в виду, что варианты осуществления реализации электронного устройства 102, канала связи 103 и коммуникационной сети 110 даны исключительно в иллюстрационных целях. Таким образом, специалисты в данной области техники смогут понять подробности других конкретных вариантов осуществления электронного устройства 102, 104 каналов связи 103, 105 и коммуникационной сети 110. По этой причине представленные здесь примеры не ограничивают объема настоящей технологии.

Электронное устройство 102 содержит аппаратное, и/или программное, и/или встроенное программное обеспечение (или их комбинацию), как известно в данной области техники, для выполнения поискового приложения 104. В общем случае, задачей поискового приложения 104 является предоставление пользователю (не показан) возможности выполнения поиска с использованием вышеупомянутого сервера поисковой системы 120.

Способ реализации поискового приложения 104 ничем не ограничен. Один из примеров поискового приложения 104 может быть реализован при доступе пользователя к веб-сайту, связанному с поисковой системой, для получения доступа к поисковому приложению 104. Например, доступ к поисковому приложению осуществляется путем ввода URL-адреса, связанного с поисковой системой, на сайте . Важно иметь в виду, что поисковое приложение 104 может быть вызвано с помощью любой другой коммерчески доступной или собственной поисковой системы. Таким образом, в данном варианте реализации технологии, поисковое приложение 104 выполняется с помощью браузера.

В общем случае, поисковое приложение 104 содержит интерфейс 106 запроса и интерфейс результатов 108 поиска. Основной задачей интерфейса запроса 106 является предоставление возможности пользователю (не показан) вводить свой запрос или «строку поиска». Основной задачей интерфейса результатов поиска 108 является предоставление результатов поиска, отвечающих запросу пользователя, который был введен в интерфейс 106 запроса. Обработка поискового запроса и предоставление результатов поиска будет описано более подробно ниже.

Также, к коммуникационной сети 110 подключен сервер поисковой системы 120 для выполнения процедуры поиска в ответ на поисковые запросы, принимаемые сервером поисковой системы 120. Сервер поисковой системы 120 подключен к электронному устройству 102 через коммуникационную сеть 110. Сервер поисковой системы 120 также подключен к другим серверам, например, помимо прочего, к серверам сетевой конфигурации, серверам сетевых ресурсов, серверам приложений и другим серверам сетевой конфигурации, через коммуникационную сеть 110.

Сервер поисковой системы 120 может представлять собой обычный компьютерный сервер. В примере варианта реализации настоящей технологии, сервер 120 поисковой системы может представлять собой сервер Dell™ PowerEdge™, на котором используется операционная система Microsoft™ Windows Server™. Сервер поисковой системы 120 может быть реализован в виде другого сетевого оборудования, например, помимо прочего, маршрутизатора, коммутатора или шлюза, базовой станции и тому подобного. Сервер поисковой системы 120 может представлять собой любое другое подходящее аппаратное, и/или прикладное программное, и/или системное программное обеспечение или их комбинацию. В представленном варианте осуществления настоящей технологии, не ограничивающем ее объем, сервер поисковой системы 120 является одиночным сервером. В других вариантах осуществления настоящей технологии, не ограничивающих ее объем, функциональность сервера поисковой системы 120 может быть распределена и может выполняться с помощью нескольких серверов. Механизм реализации сервера поисковой системы 120 является общеизвестным. Тем не менее, выражаясь кратко, сервер поисковой системы 120 содержит интерфейс сетевого взаимодействия (не показан), который структурирован и сконфигурирован для взаимодействия с электронным устройством 102 и другими устройствами, подключенными к коммуникационной сети 110. Сервер поисковой системы 120 дополнительно содержит по меньшей мере компьютерный процессор (не показан), функционально соединенный с интерфейсом связи и настроенный и сконфигурированный с возможностью выполнять различные процессы, описанные в данном документе. Как хорошо известно в данной области техники, сервер поисковой системы 120 может быть дополнительно подключен (или, в противном случае, иметь доступ) к одному или более модулю, например, помимо прочего, модулю поискового робота, модулю сортировки и модулю ранжирования.

Сервер поисковой системы 120 может быть сконфигурирован для выполнения поисковых веб-запросов. Функциональные особенности сервера поисковой системы 120 хорошо известны, тем не менее, выражаясь кратко, поисковая система 115 сконфигурирована для: (i) получения поискового запроса от электронного устройства 102; (ii) обработки поискового запроса (нормализации поискового запроса и так далее); (iii) выполнения поиска веб-ресурсов, соответствующих поисковому запросу, за счет доступа к индексам 122, индексы 118 содержат веб-ресурсы, обработанные поисковым роботом; и (iv) возврата на электронное устройство 102 списка результатов поиска, предоставляемых поисковому приложению для вывода пользователю SERP, содержащих ссылки на веб-ресурсы, соответствующие поисковому запросу.

Сервер поисковой системы 120 коммуникативно подключен (или, в противном случае, имеет доступ) к поисковому кластеру 122. Основной задачей поискового кластера 122 является выполнение поиска в ответ на запрос пользователя, введенный с помощью интерфейса 106 запроса, и вывод результатов поиска для представления их пользователю с помощью интерфейса 108 результатов поиска. Далее следует описание варианта осуществления поискового кластера 122, не ограничивающего объем технологии. Тем не менее, следует иметь в виду, что существуют другие варианты осуществления поискового кластера 122, не ограничивающие объем технологии. Важно также иметь в виду, что для упрощения нижеследующего описания конфигурация поискового кластера 122 была сильно упрощена. Считается, что специалисты в данной области техники смогут понять подробности реализации поискового кластера 122 и его компонентов, которые могли быть опущены в описании с целью упрощения.

В общем случае задачей поискового кластера 122 является (i) проведение поиска; (ii) проведение анализа результатов поиска и ранжирование результатов поиска; (iii) группировка результатов и компиляция страницы результатов поиска (SERP) для вывода на электронное устройство 102. Конфигурация поискового кластера 122 для выполнения поиска ничем не ограничена. Специалистам в данной области техники будут понятны некоторые способы и средства для выполнения поиска с помощью поискового кластера 122, и, соответственно, некоторые структурные компоненты поискового кластера 122 будут описаны только на поверхностном уровне.

В некоторых вариантах реализации настоящей технологии, не ограничивающих ее объем, поисковый кластер 122 содержит модуль обработки 124. Модуль обработки 124 способен выполнять несколько поисковых задач, содержащих, помимо прочего, общий поиск, вертикальный поиск, мета-поиск, многоуровневый поиск и тому подобный. Указанные варианты различных типов поиска не будут описаны в данном документе в качестве возможного ограничения для любого из типов поиска. Любые типы поиска, использование любых способов и средств, как будет понятно специалистам в данной области, могут использоваться для выполнения поисковых задач, описанных в данном документе. С этой целью модуль обработки 124 содержит (или, в противном случае, имеет доступ к) модуль поиска 126.

Модуль веб-поиска 126 имеет доступ к базе данных 128 для выполнения веб-поиска. Несмотря на то что база данных 128 схематически проиллюстрирована в виде единичной структуры, предполагается, что база данных 128 может быть реализована в виде распределенной структуры, например, база данных 128 может состоять из различных компонентов, каждый компонент может быть сконфигурирован для выполнения конкретного вида поиска. Следует также полагать, что модуль поиска 126 имеет доступ ко множеству баз данных 128. Несмотря на то что модуль поиска 126 показан в данном документе как подключенный к одиночной базе данных 128, настоящая технология не ограничена использованием одиночной базы данных 128.

Сетевая среда 100 также содержит первый узел веб-ресурса 130 и второй узел веб-ресурса 132. Первый узел веб-ресурса 130 содержит множество веб-ресурсов, доступ к которым осуществляется за счет подключения к первому узлу веб-ресурса 130 через коммуникационную сеть 110. Второй узел веб-ресурса 132 содержит множество веб-ресурсов, доступ к которым осуществляется за счет подключения ко второму узлу веб-ресурса 132 через коммуникационную сеть 110. Первый и второй узлы веб-ресурса 130, 132 также подключены друг к другу через коммуникационную сеть 110 или же напрямую.

В проиллюстрированном примере, каждый из узлов веб-ресурса 130, 132 выполнен в виде отдельного сервера. Так же, как и сервер поисковой системы 120, каждый из узлов веб-ресурсов 130, 132 может быть реализован как обычный компьютерный сервер. В примере варианта осуществления настоящей технологии, каждый узел сетевого ресурса 130, 132 может представлять собой сервер Dell™ PowerEdge™, на котором используется операционная система Microsoft™ Windows Server™. Каждый из узлов сетевых ресурсов 130, 132 также может быть реализован с помощью любого другого подходящего аппаратного обеспечения, и/или программного обеспечения, и/или встроенного программного обеспечения или их комбинации. В представленном варианте осуществления настоящей технологии, не ограничивающем ее объем, каждый узел веб-ресурса 130, 132 является одиночным сервером. В других вариантах осуществления настоящей технологии, не ограничивающих ее объем, функциональность каждого узла веб-ресурса 130, 132 может быть реализована с помощью нескольких серверов. Также следует рассматривать тот вариант, что узлы веб-ресурса 130, 132 могут быть реализованы в виде одного и того же сервера.

Следует понимать, что узлы веб-ресурса 130, 132 и размещенные на узлах 130, 132 веб-ресурсы представлены в этом документе в качестве примера. Сетевая среда 100 также содержит любое количество и тип серверов сетевых ресурсов, и каждый сервер сетевых ресурсов может содержать любое количество и тип сетевых ресурсов.

Каждый из узлов веб-ресурсов 130, 132 содержит множество веб-страниц, как упоминалось выше. Каждая веб страница создается в заданное время, называемое временем создания веб-страницы. Время создания веб-страницы определяется как время, за которое веб-страница выгружается на узел 130, 132 и становится доступной через коммуникационную сеть 110 для электронного устройства 102, расположенного удаленно от узла 130, 132.

Несмотря на то что веб-страница может обновиться уже после создания, для размещения обновленной информации, для целей способа 500, описанного ниже, время создания веб-страницы считается оригинальным временем создания, когда оригинальная версия веб-страницы впервые выгружена и доступ к ней возможен через коммуникационную сеть 110.

Часто информация о времени создания встроена в содержимое страницы или в исходный код ее создания. Например, веб-страница может иметь временную отметку в нижней части страницы, отображающую дату и время ее создания. В другом примере, используемый для создания веб-страницы HTML-код содержит теги, указывающие на время, когда веб-страницы была выгружена. Анализ веб-страницы может быть произведен различными способами для определения времени ее создания.

В общем случае, время создания данной веб-страницы может быть определено несколькими различными способами. Например, время создания страницы может быть извлечено за счет анализа URL-адреса (унифицированный указатель ресурса) веб-страницы для извлечения временных выражений. Время создания также может быть извлечено за счет анализа содержимого страницы, например текста, изображений и тому подобного. Заголовок документа, содержащийся в HTML-коде или в содержимом страницы, содержит информацию о времени создания. В другом примере, HTML-код создания веб-страницы может содержать теги, указывающие на время создания веб-страницы. Различные машинообучаемые алгоритмы, характеристические алгоритмы и тому подобные используются для извлечения информации о времени создания. Время создания определяется с использованием различных методов, например, описанных выше, которым, в определенных случаях отдается предпочтение. Например, информация о времени создания, содержащаяся в URL-адресе для данной страницы, может быть более точной и достоверной, чем информация о времени создания, полученная из заголовка или содержимого страницы. Если информация о времени создания, полученная за счет анализа времени и даты, содержащейся на веб-странице, а также, если информация, полученная за счет анализа части веб-страницы, не противоречит информации, полученной за счет анализа других частей веб-страницы, то считается, что время создания веб-страницы является известным и достоверным. Тем не менее, если информация о времени создания является ошибочной (например, анализ различных частей веб-страницы дает разное время создания), то считается, что время создания страницы не известно или не определено и требует уточнения.

Информация о времени создания веб-страницы может также приблизительно быть определена за счет использования входящих и исходящих ссылок на страницу. Например, для данной исходной страницы имеется множество исходящих ссылок на различные страницы назначения, время создания для исходной страницы может быть получено не ранее, чем самое последнее время создания страницы назначения исходящих ссылок. Аналогично, для данной страницы, имеющей входящие ссылки, время создания веб-страницы может быть определено не ранее, чем время создания исходной страницы для этих входящих ссылок. Если данная страница имеет больше одной входящей ссылки, тогда время создания страницы может быть получено не ранее, чем самое последнее время создания исходной страницы для входящих ссылок.

Следует также полагать, что эти ссылки от исходной страницы на страницу назначения имеют свое собственное время создания ссылок, которое отличается от времени создания исходной страницы. Например, исходная страница может быть обновлена позднее, чем время ее создания, для включения ссылок на страницу назначения. В этом случае, если время обновления (то есть время создания ссылки) может быть определено, например, из временной отметки обновления, содержащейся в содержимом страницы, время создания ссылки берется в качестве определения времени создания целевого документа. Тем не менее, информация о времени создания, полученная за счет использования более ранней входящей ссылки и более поздней исходящей ссылки, как описано выше, используется как наиболее подходящий диапазон времени создания. Для задач приложений, например планирования работы поискового робота, сортировки или ранжирования результатов поиска, такая информация является наиболее подходящей.

Способ 500 определения времени создания веб-страницы будет описан ниже со ссылкой на Фиг. 2. Способ 500 представляет собой способ, основанный на ссылках, использующий описанные выше способы, не выдает никакой информации, связанной временем создания страниц или информации, полученной за счет использования вышеупомянутых способов, предоставляющих раздробленную информацию, например месяц и год создания, без указания времени и дня создания.

Способ 500 запускается на сервере, например на сервере поисковой системы 120, подключенном к коммуникационной сети 110. Веб-страница с неизвестным временем создания именуется в данном документе как целевая страница. Несмотря на то что способ 500 описан ниже со ссылкой на одиночную целевую страницу, следует понимать, что сервер поисковой системы 120 совместим с более чем одной целевой страницей, имеющей неизвестное или неопределенное время создания.

На шаге 520, изображение сети страниц 300 сети страниц 200 содержит множество страниц и множество ссылок, созданных между ними. Изображение сети страниц 300 представляет собой отображение актуальной сети страниц 200, содержащих существующие страницы и существующие между ними ссылки.

Фиг. 3 отображает пример изображения сети страниц 300 примера сети страниц 200. Пример сети страниц 300 изображен в виде диаграммы с веб-страницами А, В, С, D, Ε и F, показанными в виде узлов (отмечены крестиками) и линий, обозначающих связи между соответствующими страницами. В этом изображенном примере 300, узлы (веб-страницы) А, В, С, D, Ε и F сети страниц 200 упорядочены последовательно по времени их создания, независимо от того, известно ли это точно или приблизительно. В этом изображенном примере сети страниц 300, узлы (веб-страницы) А, В, С, D, Ε и F расположены на равном расстоянии друг от друга, независимо от различий во времени их создания. Тем не менее, предполагается, что расстояние между идущими подряд узлами (веб-страницами) указывает на разницу во времени создания этих страниц. Следует также понимать, что изображение сети страниц 300 приводится только в качестве примера и иллюстрации. Изображение сети страниц 300 сети страниц 200 может быть представлено в других формах, например, помимо прочего, иллюстративной, векторной, матричной, графической и тому подобных.

Ссылаясь на Фиг. 3, способ 500 будет описан ниже с использованием примера сценария сети страниц 200, содержащих страницы А, В, С, D, Ε и F. Пример сети страниц 200, проиллюстрированный на Фиг. 3, также содержит ссылки LCA, LFA, LCB, LEB, LDC, LFA, LFC и LFE, соединяющие страницы А, В, С, D, Ε и F.

В описанном варианте реализации способа 500, не ограничивающем объем технологии, каждая из страниц А, В, С, D, Ε и F, содержащаяся в сети страниц 200, связана по меньшей мере с одной другой страницей А, В, С, D, Ε и F сети страниц 200 с помощью ссылки L. Таким образом, каждая страница А, В, С, D, Ε и F, содержащаяся в сети страниц, имеет по меньшей мере одну входящую или исходящую ссылку. Каждая из ссылок L, содержащаяся в сети страниц 200, начинается на одной странице сети страниц 200 и заканчивается на другой странице А, В, С, D, Ε и F сети страниц 200. Другими словами, для каждой ссылки L, содержащейся в сети страниц 200, созданной на шаге 520, обе страницы, как исходная, так и страница назначения, представляют собой страницы, содержащиеся в сети страниц. Таким образом, в этом варианте реализации технологии, не ограничивающем объем технологии, любые ссылки со страниц А, В, С, D, Ε и F сети страниц 200 на страницы, не содержащиеся в сети страниц 200, опущены. Также опущены ссылки, соотносящиеся сами с собой, то есть ссылки, начинающиеся и заканчивающиеся на одной и той же странице, даже если эта страница содержится в сети страниц 200. В дополнение, сеть страниц 200, созданная на шаге 520, содержит все ссылки между любой страницей А, В, С, D, Ε и F сети страниц 200 и любой другой страницей А, В, С, D, Ε и F сети страниц.

В варианте реализации технологии, не ограничивающем ее объем, все страницы А, В, С, D, Ε и F, содержащиеся в сети страниц 200, размещены на одном и том же узле, например на узле 130, 132. Тем не менее, следует полагать, что способ 500 реализован с использованием сети страниц 200, которая содержит страницы из более чем одного узла.

Каждая из страниц А, В, С, D, Ε и F имеет соответствующее время создания ТА, TB, TC, TD, ТЕ и TF. В этом примере сценария, время создания ТА, TB, TD, ТЕ и TF точно известно, тогда как время создания ТС для страницы С неизвестно. Например, год, месяц, день и время создания веб-страниц А, В, С, D, Ε и F точно известны за счет анализа исходного кода веб-страниц А, В, С, D, Ε и F. Более того, время создания ТС веб-страницы С не известно точно на основании анализа веб-страницы. Таким образом, в данном примере сценария, страница С представляет собой целевую страницу, для которой способ 500 определяет время ее создания.

Приблизительную оценку времени создания Тс можно выполнить по времени создания исходной страницы входящих ссылок на целевую страницу С и времени создания страницы назначения исходящих ссылок от целевой страницы С, как поясняется ниже.

В этом варианте сценария на Фиг. 3, целевая страница С имеет две исходящих ссылки, LCA и LCB - на страницы А и В соответственно, LDC и LFC, со страниц D и F соответственно. Ссылка, для которой целевая страница С является исходной (исходящая ссылка со страницы С), или ссылка, для которой целевая страница С является страницей назначения (входящая ссылка на целевую страницу С), называется далее для удобства ссылкой целевой страницы. В примере сценария на Фиг. 3, ссылки LCA, LCB, LFC и LDC являются ссылками целевой страницы.

Ссылаясь на Фиг. 3, в данном варианте сценария, изучая исходящие ссылки целевой страницы LCA и LCB, время создания ТС целевой страницы С может быть определено не ранее, чем время создания TB страницы В, которая создана позднее, как одна из страниц назначения для исходящей целевой ссылки LCA и LCB. Аналогично, страница D является ранее созданной страницей назначения для входящей целевой ссылки LDC и LFC. Таким образом, время создания TC целевой страницы С может быть определено не позднее, чем время создания TD страницы D. На основании вышеприведенного анализа, диапазон RC для времени создания ТС целевой страницы С находится между TB и TD.

Ссылаясь на Фиг. 3, сеть страниц 200 также имеет другие ссылки LBA со страницы В на страницу A, LEB со страницы Ε на страницу В, LFE со страницы F на страницу Е и LFA co страницы F на страницу А. Страницы с А по F могут иметь другие ссылки на или со страниц, не входящие в сеть страниц 200, тем не менее, как обсуждалось выше, эти ссылки на страницы, исключенные из сети страниц 200, не представлены в данном варианте реализации технологии, не ограничивающей ее объем, однако могут содержаться в других вариантах реализации технологии.

После создания сети страниц 200, способ 500 продолжает выполняться на шаге 540.

На шаге 540, вероятностное распределение сети страниц Рсети определено для экземпляра сети страниц 200. Вероятностное распределение сети страниц Рсети определено от соответствующего индивидуального вероятностного распределения ссылки для каждого экземпляра из ссылок в сети страниц 200. Таким образом, пример сети страниц 200, проиллюстрированный на Фиг. 3, имеет восемь ссылок LCA, LFA, LCB, LEB, LDC, LFA, LFC и LFE, вероятностное распределение сети страниц Рсети является результатом соответствующих восьми вероятностных распределений ссылок PCA, PFA, PCB, PEB, PDC, PFA, PFC и PFE.

В способе 500 вероятностное распределение ссылок от исходной страницы на страницу назначения принимается на основании различий во времени создания между исходной страницей и страницей назначения. Например, считая, что страница С создана позднее, чем страница В, вероятностное распределение PCB имеющихся ссылок со страницы С на страницу В основано на разнице во времени создания СВ между ними, где CB=(TB-TC).

В проиллюстрированном варианте реализации технологии, вероятностное распределение Ρ имеющихся ссылок от одной страницы на другую страницу представляет собой обратную экспоненциальную зависимость времени их создания. Таким образом, к примеру, вероятностное распределение PCB ссылок со страницы С на страницу В пропорционально е-(TB-TC)/τ. Другими словами, вероятностное распределение PCB ссылки со страницы С на страницу В уменьшается по экспоненциальной зависимости от различий во времени их создания (TB-TC). Константа τ представляет собой параметр затухания, который будет дополнительно более подробно описан ниже.

Пока время создания TC для целевой страницы неизвестно, гипотетическое значение устанавливается для времени создания TC для определения индивидуального и общего вероятностного распределения Рсети для сети страниц 200. Гипотетическое значение, присваиваемое времени создания Τ целевой страницы С, называется гипотетическим временем создания. Если значение гипотетического времени создания изменено, теоретическое вероятностное распределение ссылки для экземпляра каждой целевой страницы изменяется соответственно, как и вероятностное распределение сети страниц Рсети для экземпляра всех ссылок, содержащихся в сети страниц 200. Данная зависимость вероятностного распределения сети страниц Рсети от гипотетического времени создания целевой страницы С используется для определения актуального времени создания TC для целевой страницы С, как будет описано ниже.

На шаге 540, в созданном представлении сети страниц 300, сервер 120 устанавливает гипотетическое значение для времени создания целевой страницы С. Гипотетическое время создания может быть установлено на основании приблизительной оценки, к примеру, диапазона времени RC для времени создания ТС, как обсуждалось выше. Как обсуждалось выше, несмотря на то что способ 500 описан в данном документе, для удобства, с тем предположением, что сеть страниц 200 имеет только одну целевую страницу С с неизвестным временем создания TC, способ 500 не ограничивается данным предположением. Сеть страниц 200 может иметь более одной целевой страницы с неизвестным временем создания.

На шаге 560, актуальное время создания TC целевой страницы С определяется за счет измерения гипотетического времени создания, что повышает общее вероятностное распределение Рсети для экземпляра сети страниц 200.

В некоторых вариантах реализации технологии, не ограничивающих ее объем, используется метод градиентного спуска значения времени создания, для которого вероятностное распределение сети страниц Рсети является максимальным. Способ 500 не ограничивается любыми отдельными способами для нахождения максимума вероятностного распределения сети страниц как функции гипотетического времени создания для определения актуального времени создания целевой страницы.

В некоторых вариантах реализации технологии, гипотетическое время создания, увеличивающее до максимального значения вероятностное распределение сети страниц Рсети, определяется за счет присвоения множества различных гипотетических значений времени создания ТС, вычисления вероятностного распределения сети страниц Рсети для каждого присвоенного гипотетического времени создания и определения, какое из гипотетических значений времени создания предоставляет наибольшее значение для общего вероятностного распределения Рсети для сети страниц 200.

Множество присвоенных гипотетических значений времени создания основано на потенциальном времени создания или приблизительной оценки времени создания, рассчитанном за счет анализа веб-страниц, как описано выше. Например, семантический анализ содержимого целевой страницы С определят дату написания 07112013 как дату создания для целевой страницы С, который приводит к двум различным возможным датам: 11 июля 2013 года или 7 ноября 2013 года. Каждая из этих дат может быть присвоена в качестве гипотетического времени создания для целевой страницы, и общее вероятностное распределение Рсети вычисляется для каждой из двух дат. Затем дата, соответствующая наивысшему общему вероятностному распределению Рсети, определяется для актуального времени создания TC целевой страницы.

Параметр затухания (τ)

В общем смысле, параметр затухания τ указывает на то, как быстро страницы устаревают или с какой интенсивностью снижается их рейтинг. Чем больше значение параметра затухания для страницы, тем быстрее она устаревает. В общем смысле, каждая страница имеет собственные характеристики параметра затухания τ. В проиллюстрированном варианте реализации технологии, параметр затухания τ представляет собой характеристику узла. Все страницы, размещенные на отдельном узле, характеризуются одинаковым параметром затухания τ. В приведенном примере сценария на Фиг. 3, так как все страницы от А до F сети страниц 200 находятся на одном и том же узле, параметр затухания одинаков для всех страниц. Следует дополнительно полагать, что параметр затухания представляет собой характеристику группы узлов или отдельной сети страниц, например сети страниц 200.

Параметр затухания τ обычно определяется с использованием страниц с известным временем создания. В проиллюстрированном варианте реализации способа 500, даты сгруппированы следующим образом: для данного целого i, количество х ссылок между страницами, имеющими различие по времени между (i-1) и i дней, представлено в таблице. Затем, параметр затухания определяется углом наклона линии на логарифмическом графике (i, log xi) Тем не менее, следует полагать, что параметр затухания может быть определен с помощью других способов.

Параметр качества

В некоторых вариантах реализации технологии, каждая из страниц А, В, С, D, Ε и F имеет соответствующий параметр качества QA, QB, QC, QD, QE и QF.

В некоторых вариантах реализации технологии, не ограничивающих ее объем, вероятностное распределение ссылок Ρ для каждой ссылки L также основано на параметре качества Q страницы назначения ссылки L, в дополнение к разнице между временем создания исходной страницы и страницы назначения.

Параметр качества Q страницы указывает на их полезную функциональность или популярность. Страница, содержащая информацию о том, что она часто используется или интересна большому количеству пользователей, имеет более высокое значение параметра качества, чем страница, содержащая информацию о том, что она используется реже и интересна небольшому количеству пользователей. Таким образом, в общем случае, страница с большим значением параметра качества имеет большее количество входящих ссылок, чем страница с более низким значением параметра качества. В некоторых вариантах реализации настоящей технологии, не ограничивающих ее объем, значение параметра качества основано на количестве входящих ссылок на страницу.

Тем не менее, следует предполагать, что в дополнение к использованию количества входящих ссылок или вместо использования количества входящих ссылок параметр качества Q также может быть основан на других критериях, например, помимо прочего, количества просмотров страницы.

Например, страница, имеющая информацию, связанную с рок-группой Beatles, имеет более высокое значение параметра качества и большее количество входящих ссылок, чем страница, содержащая информацию, связанную с местными выборами в Венгрии.

Параметр качества для страницы также зависит от других факторов, например популярности узла, на котором размещена веб-страница.

В некоторых вариантах реализации технологии, не ограничивающих ее объем, вероятностное распределение ссылок Ρ для экземпляра ссылки с исходной страницы на страницу назначения обычно пропорционально фактору качества Q страницы назначения.

В некоторых вариантах реализации технологии, не ограничивающих ее объем, вероятностное распределение ссылок Ρ для экземпляра ссылки с исходной страницы на страницу назначения обычно пропорционально фактору качества Q страницы назначения, в дополнение к функции различия в возрасте создания между исходной страницей и страницей назначения. В некоторых дополнительных вариантах реализации технологии, вероятностное распределение ссылок L с исходной страницы на страницу назначения обычно пропорционально Q·e-a/τ.

Таким образом, вероятностное распределение сети страниц Рсети представляет собой функцию параметра качества для каждой страницы в сети страниц 200. Связи между вероятностным распределением сети страниц Ρ и параметром качества также используются для определения параметра для одной или более страниц сети страниц 200. В общем случае, актуальным параметром качества для страницы является тот, который увеличивает до максимума вероятностное распределение сети страниц Рсети.

Например, в некоторых вариантах реализации технологии, не ограничивающих ее объем, для каждой из страниц сети страниц 200 принимается гипотетическое значение параметра качества Q для параметра качества. Например, гипотетическое значение параметра качества для страницы изначально назначается на основании количества входящих ссылок на эту страницу. Следует полагать, что гипотетическое значение для параметра качества также присваивается на основании других критериев, отличных от количества входящих ссылок. Затем определяется общее вероятностное распределение сети страниц Рсети на основании параметра качества Q. Гипотетический параметр качества одной или более страниц устанавливает максимальное значение вероятностного распределения сети страниц Рсети. Актуальный параметр качества Q для страницы представляет собой параметр, который повышает до максимума вероятностное распределение сети страниц Рсети. Как обсуждалось выше, для определения времени создания значение параметра качества основано на максимуме функции вероятностного распределения сети страниц. Рсети определяется с использованием способа, такого как способ градиентного спуска. Тем не менее, способ 500 не ограничен каким-либо частным способом поиска значения параметра качества Q для одной или более страниц, увеличивающего до максимума вероятностное распределение сети страниц Рсети.

В вариантах реализации настоящей технологии, не ограничивающих ее объем, все неизвестные значения времени создания целевых страниц сети страниц 200 и параметров качества Q для каждой из страниц определяются одновременно. Тем не менее, следует полагать, что параметры качества Q для некоторых страниц могут быть определены отдельно от времени создания некоторых страниц.

Способ 500, описанный выше, может быть использован для одновременного определения времени создания для всех страниц в сети страниц 200, независимо от информации о времени создания, также определяемой на основании самостоятельного анализа веб-страницы. Более того, способ 500, описанный выше, может быть использован для одновременного определения времени создания и параметров качества для всех страниц в сети страниц 200.

Дополнительную информацию о способе 500 для определения времени создания одной или более страниц в сети страниц можно найти в приложении А и В.

Модификации и улучшения вышеописанных вариантов осуществления настоящей технологии будут ясны специалистам в данной области техники. Вышеизложенное описание предполагает пример вместо ограничений. Таким образом, объем настоящей технологии ограничен только объемом прилагаемой формулы изобретения.

Похожие патенты RU2577479C2

название год авторы номер документа
СПОСОБ И СИСТЕМА ОПРЕДЕЛЕНИЯ ВРЕМЕНИ СОЗДАНИЯ ВЕБ-РЕСУРСА 2015
  • Прохоренкова Людмила Александровна
  • Прохоренков Петр Владиславович
  • Самосват Егор Александрович
  • Сердюков Павел Викторович
RU2651424C2
СИСТЕМА И СПОСОБ ВЫПОЛНЕНИЯ ПОИСКА 2014
  • Гулин Андрей Владимирович
  • Киричун Алексей Александрович
RU2597476C2
СПОСОБ ОПРЕДЕЛЕНИЯ ПОСЛЕДОВАТЕЛЬНОСТИ ПРОСМОТРА ВЕБ-СТРАНИЦ И СЕРВЕР, ИСПОЛЬЗУЕМЫЙ В НЕМ 2014
  • Лефортье Дамьен Реймон Жан-Франсуа
  • Остроумова Людмила Александровна
  • Самосват Егор Александрович
  • Сердюков Павел Викторович
  • Богатый Иван Семеонович
  • Челноков Арсений Андреевич
RU2634218C2
СПОСОБ ФОРМИРОВАНИЯ ПЕРСОНАЛИЗИРОВАННОЙ МОДЕЛИ РАНЖИРОВАНИЯ, СПОСОБ ФОРМИРОВАНИЯ МОДЕЛИ РАНЖИРОВАНИЯ, ЭЛЕКТРОННОЕ УСТРОЙСТВО И СЕРВЕР 2014
  • Логачев Александр Александрович
RU2580516C2
Способ и сервер для передачи персонализированного сообщения на пользовательское электронное устройство 2017
  • Дьяченко Юрий Игоревич
  • Кузьмин Михаил Николаевич
  • Чернилевский Денис Александрович
  • Шаблинский Евгений Александрович
RU2739720C2
СПОСОБ И УСТРОЙСТВО ДЛЯ ВЫБОРА СЕТЕВОГО РЕСУРСА В КАЧЕСТВЕ ИСТОЧНИКА СОДЕРЖИМОГО ДЛЯ СИСТЕМЫ РЕКОМЕНДАЦИЙ 2016
  • Ламбурт Виктор Григорьевич
  • Лифарь Игорь Игоревич
RU2636702C1
СПОСОБ ОТОБРАЖЕНИЯ ВЕБ-РЕСУРСА ПОЛЬЗОВАТЕЛЮ (ВАРИАНТЫ) И ЭЛЕКТРОННОЕ УСТРОЙСТВО 2014
  • Плахов Андрей Григорьевич
  • Яремко Николай Анатольевич
  • Горский Константин Павлович
  • Иванов Роман Кириллович
  • Тарасов Андрей Дмитриевич
RU2595497C2
СПОСОБ СОЗДАНИЯ АННОТИРОВАННОГО ПОИСКОВОГО ИНДЕКСА И СЕРВЕР, ИСПОЛЬЗУЕМЫЙ В НЕМ 2015
  • Плошихин Виктор Витальевич
RU2606309C2
СЕРВЕР ДЛЯ ОПРЕДЕЛЕНИЯ ПОИСКОВОЙ ВЫДАЧИ НА ПОИСКОВЫЙ ЗАПРОС И ЭЛЕКТРОННОЕ УСТРОЙСТВО 2013
  • Карпович Павел Алексеевич
RU2583739C2
Система и способ управления браузерным приложением, постоянный машиночитаемый носитель и электронное устройство 2015
  • Тарасов Андрей Дмитриевич
  • Иванов Константин Николаевич
RU2633180C2

Иллюстрации к изобретению RU 2 577 479 C2

Реферат патента 2016 года УСТРОЙСТВО И СПОСОБ ОПРЕДЕЛЕНИЯ ВРЕМЕНИ СОЗДАНИЯ ВЕБ-РЕСУРСА

Изобретение относится к компьютерной технике, а именно к способу определения времени создания веб-ресурса. Технический результат заключается в определении наиболее вероятного времени создания веб-ресурса и достигается за счет применения способа определения времени создания целевой страницы, включающего создание сети страниц, имеющей множество страниц, содержащих целевую страницу и множество ссылок. Каждая из исходных страниц и страниц назначения представляют собой одну из множества страниц. Каждая страница является исходной страницей и страницей назначения по меньшей мере для одной ссылки. Вероятностное распределение сети страниц соответствует определению гипотетического времени создания целевой страницы. Вероятностное распределение сети страниц основано на вероятностном распределении ссылок для каждой ссылки из множества ссылок, вероятностное распределение ссылок основано на времени создания для исходной страницы и времени создания для страницы назначения соответственно. Значение гипотетического времени создания предоставляет наибольшее значение определенного вероятностного распределения сети страниц, значение гипотетического времени создания соответствует времени создания целевой страницы. 2 н. и 16 з.п. ф-лы, 3 ил., 2 прилож.

Формула изобретения RU 2 577 479 C2

1. Способ определения времени создания целевой страницы, выполняемый на сервере, подключенном к коммуникационной сети, включает:
создание сети страниц, содержащей множество страниц, в том числе целевую страницу и множество ссылок,
каждая ссылка из множества ссылок имеет исходную страницу и страницу назначения, каждая исходная страница и страница назначения являются одной страницей из множества страниц, каждая страница из множества страниц является одной из исходных страниц и одной из страниц назначения по меньшей мере для одной из множества ссылок;
определение вероятностного распределения сети страниц для множества ссылок, в соответствии с гипотетическим временем создания целевой страницы,
вероятностное распределение сети страниц основано на вероятностном распределении ссылок для каждой ссылки из множества ссылок, вероятностное распределение ссылок основано на времени создания для исходной страницы и времени создания для страницы назначения; и
определение значения гипотетического времени создания, которое предоставляет наибольшее значение определенного вероятностного распределения сети страниц, значение гипотетического времени создания соответствует времени создания целевой страницы.

2. Способ по п. 1, отличающийся тем, что дополнительно включает:
присвоение множества гипотетических значений времени создания для целевой страницы;
для каждого значения множества значений гипотетического времени создания:
определение вероятностного распределения ссылок для каждой ссылки;
и
определение вероятностного распределения сети страниц; и
определение времени создания целевой страницы на основании вероятностного распределения сети страниц, соответствующего каждому из множества значений гипотетического времени создания, время создания целевой страницы является одним из множества значений гипотетического времени создания, в соответствии с одним из наибольших значений вероятностного распределение сети страниц, определяемого для каждого значения из множества значений гипотетического времени создания.

3. Способ по п. 2, отличающийся тем, что дополнительно включает определение наибольшего значения вероятностного распределения сети страниц с использованием способа градиентного спуска.

4. Способ по п. 2, отличающийся тем, что множество значений гипотетического времени создания, присвоенного целевой странице, основано на по меньшей мере одном из следующих вариантов:
ссылка, для которой целевая страница представляет собой исходную страницу; и
ссылка, для которой целевая страница представляет собой страницу назначения.

5. Способ по п. 1, отличающийся тем, что:
множество ссылок содержит исходящую целевую ссылку, исходящая целевая ссылка представляет собой ссылку, для которой исходная страница является целевой страницей, исходящая ссылка имеет страницу назначения, определяющую время создания исходящей целевой ссылки; и
способ, отличающийся тем, что дополнительно включает:
назначение раннего значения из множества значений гипотетического времени создания для:
времени создания исходящей целевой ссылки; и
более позднего времени, чем время создания исходящей целевой ссылки.

6. Способ по п. 1, отличающийся тем, что:
множество ссылок содержит входящую целевую ссылку, входящая целевая ссылка представляет собой ссылку, для которой исходная страница является целевой страницей, входящая ссылка имеет страницу назначения, определяющую время создания входящей целевой ссылки,
способ, отличающийся тем, что дополнительно включает:
назначение позднего значения из множества значений гипотетического времени создания для:
времени создания входящей целевой ссылки; и
более раннего времени, чем время создания входящей целевой ссылки.

7. Способ по п. 1, отличающийся тем, что:
множество ссылок содержит:
исходящую целевую ссылку, исходящая целевая ссылка представляет собой ссылку, для которой исходная страница является целевой страницей, исходящая ссылка имеет страницу назначения, определяющую время создания исходящей целевой ссылки; и
входящую целевую ссылку, входящая целевая ссылка представляет собой ссылку, для которой исходная страница является целевой страницей, входящая ссылка имеет страницу назначения, определяющую время создания входящей целевой ссылки,
способ, отличающийся тем, что дополнительно включает:
определение множества значений гипотетического времени создания в качестве диапазона между временем создания исходящей целевой ссылки и временем создания входящей целевой ссылки включительно.

8. Способ по п. 1, отличающийся тем, что вероятностное распределение ссылок для каждой ссылки дополнительно основано на параметре качества для страницы назначений ссылки.

9. Способ по п. 8, отличающийся тем, что параметр качества для каждой ссылки присваивается на основании количества входящих ссылок на страницу.

10. Способ по п. 9, отличающийся тем, что параметр качества, присвоенный каждой странице, дополнительно указывает на параметр качества соответствующего узла, на котором размещена страница.

11. Способ по п. 8, отличающийся тем, что дополнительно включает:
определение параметра качества на основании вероятностного распределения сети страниц по меньшей мере для одной страницы из множества страниц.

12. Способ по п. 11, отличающийся тем, что определение параметра качества по меньшей мере для одной страницы, основанного на вероятностном распределении сети страниц включает:
присвоение множества гипотетических параметров качества для страницы, для каждого из множества гипотетических параметров качества выполняется:
определение вероятностного распределения ссылок для каждой ссылки;
и
определение вероятностного распределения сети страниц,
параметр качества по меньшей мере для одной страницы представляет собой один из множества гипотетических параметров качества, соответствующий наибольшему значению определения общего вероятностного распределения.

13. Способ по п. 12, отличающийся тем, что дополнительно включает определение наибольшего значения вероятностного распределения сети страниц с использованием способа градиентного спуска.

14. Способ по п. 12, отличающийся тем, что дополнительно включает:
определение времени создания для целевой страницы одновременно с определением параметра качества по меньшей мере для одной страницы.

15. Способ по п. 1, отличающийся тем, что дополнительно включает:
определение параметра затухания для множества страниц, при этом вероятностное распределение ссылок для каждой ссылки дополнительно основано на параметре затухания.

16. Способ по п. 1, отличающийся тем, что целевая страница представляет собой множество целевых страниц.

17. Способ по п. 1, отличающийся тем, что все множество страниц сети страниц размещено на узле.

18. Сервер, подключенный с помощью каналов передачи данных к электронному устройству и множеству узлов через коммуникационную сеть, содержит модуль обработки, сконфигурированный для:
создания сети страниц, содержащей множество страниц, содержащих целевую страницу и множество ссылок, каждая ссылка из множества ссылок имеет исходную страницу и страницу назначения, каждая из исходных страниц и страниц назначения представляет собой множество страниц, каждая страница из множества страниц представляет собой одну исходную страницу и страницу назначения по меньшей мере для одной из множества ссылок;
определения, для множества ссылок, вероятностного распределения сети страниц, соответствующих гипотетическому времени создания для целевой страницы, вероятностное распределение сети страниц основано на вероятностном распределении ссылок для каждой ссылки из множества ссылок, вероятностное распределение ссылок для каждой ссылки основано на времени создания исходной страницы ссылки и времени создания страницы назначения для ссылки; и
определения значения гипотетического времени создания, которое предоставляет наибольшее значение определенного вероятностного распределения сети страниц, значение гипотетического времени создания соответствует времени создания целевой страницы.

Документы, цитированные в отчете о поиске Патент 2016 года RU2577479C2

Аппарат для очищения воды при помощи химических реактивов 1917
  • Гордон И.Д.
SU2A1
US 6735694 B1, 11.05.2004
ИНФРАКРАСНЫЙ ЛЮМИНОФОР КОМПЛЕКСНОГО ПРИНЦИПА ДЕЙСТВИЯ НА ОСНОВЕ ОРТОФОСФАТА ИТТРИЯ, АКТИВИРОВАННЫЙ ИОНАМИ Yb3+ и Er3+ 2015
  • Манаширов Ошир Яизгилович
  • Зверева Екатерина Михайловна
  • Воробьев Виктор Андреевич
  • Синельников Борис Михайлович
RU2610767C2
CN 103257989 A, 21.08.2013
JP 2007328478 A, 20.12.2007.

RU 2 577 479 C2

Авторы

Остроумова Людмила Александровна

Самосват Егор Александрович

Прохоренков Петр Владиславович

Даты

2016-03-20Публикация

2014-07-04Подача