СПОСОБ ПРЕДСТАВЛЕНИЯ РЕЗУЛЬТАТОВ ПОИСКА В СООТВЕТСТВИИ С ПОИСКОВЫМ ЗАПРОСОМ В СЕТИ ИНТЕРНЕТ Российский патент 2016 года по МПК G06F17/30 

Описание патента на изобретение RU2598789C2

Перекрестная ссылка

Отсутствует.

Область техники

Настоящая технология относится к способу и системе представления результатов поиска в соответствии поисковым запросам в сети Интернет.

Уровень техники

Интернет предоставляет простое и недорогое решение для публикации различных типов документов и информации. Таким вариантам нет числа, от научных работ, правовых определений суда, предложений вакантных должностей до предложений товаров и услуг. Тем не менее, получение запрашиваемой информации не всегда происходит просто и эффективно.

Поиски в сети Интернет осуществляются с помощью использования поисковой системы. В поисковую систему пользователем вводятся ключевые слова, которые соответствуют запрашиваемой информации. Введенные ключевые слова используются как критерии поиска с помощью поисковой системы в качестве поискового запроса (также иногда называется "запрос на поиск"). Поисковая система идентифицирует из таблиц (таких, как, например, таблицы индексов, инвертированные таблицы, поисковые работы и т.д.) веб-страницы, соответствующие критериям поиска. Затем поисковая система делает моментальные снимки данных каждой веб-страницы (в иных случаях последней обработанной страницы), представляющей интерес. Представляющие интерес веб-страницы классифицируются поисковой системой на основе соответствия содержания и представляются пользователю в виде страницы (страниц) результатов работы поисковой системы (SERP) в порядке соответствия. SERP обычно содержит следующие поля для каждой веб-страницы или информацию, доступную на веб-странице, представляющей интерес: заголовок, унифицированный определитель местонахождения ресурса (URL-адрес), а также описание, которое может содержать фрагмент первого совпадения ключевых слов на веб-странице, или метаданные, опубликованные владельцем веб-страницы.

Несмотря на то что существующее представление идентифицированных интересующих веб-страниц является достаточным для отображения некоторых типов результатов поиска в сети Интернет, такая структура является неудобной для других пользователей. Например, для веб-сайтов, которые содержат много записей, представляющих интерес, таких как, например, сайты с рубричной рекламой, информация, отображаемая на SERP, является недостаточной для пользователя, чтобы определить, являются ли результаты поиска соответствующими запрашиваемой информации. По этой причине пользователь вынужден осуществлять доступ к веб-странице для того, чтобы оценить, насколько ее содержание представляет для него интерес.

Раскрытие изобретения

Целью настоящей технологии является устранение по меньшей мере некоторых недостатков, присущих известному уровню техники.

В соответствии с первым широким аспектом настоящей технологии предлагается способ создания страницы результатов работы поисковой системы, при этом способ выполняется на сервере, связанном с электронным устройством пользователя с помощью каналов связи через коммуникационную сеть. Способ включает получение поискового запроса от электронного устройства с помощью каналов связи через коммуникационную сеть, осуществление поиска в соответствии с поисковым запросом для получения результатов поиска, при этом результаты поиска содержат по меньшей мере одну веб-страницу, анализирование по меньшей мере одной веб-страницы для обнаружения шаблона повторяющегося набора информации, извлечение по меньшей мере одного неповторяющегося сегмента данных из по меньшей мере одной веб-страницы с использованием шаблона повторяющегося набора информации, формирование страницы результатов работы поисковой системы, причем страница результатов работы поисковой системы включает по меньшей мере один неповторяющийся сегмент данных, отправку управляющего сигнала на электронное устройство с помощью каналов связи через коммуникационную сеть, при этом управляющий сигнал вызывает выполнение и отображение на дисплее электронного устройства пользователя с помощью интерфейса пользователя электронного устройства (i) результатов поиска, содержащих ссылку для по меньшей мере одной веб-страницы и (ii) для по меньшей мере одной веб-страницы неповторяющегося сегмента данных в непосредственной близости от ссылки.

В некоторых вариантах реализации способа, упомянутое выше извлечение по меньшей мере одного неповторяющегося сегмента данных из по меньшей мере одной веб-страницы включает использование шаблона повторяющегося набора информации, извлечение множества неповторяющихся сегментов данных из по меньшей мере одной веб-страницы, при этом каждый из множества неповторяющихся сегментов данных по меньшей мере частично отличается от других сегментов из множества неповторяющихся сегментов данных.

В некоторых вариантах реализации способа, повторяющийся набор информации содержит повторяющуюся комбинацию из кодирующих элементов, определяющих шаблон кодирования.

В некоторых вариантах реализации способа, способ дополнительно включает хранение репрезентативной информации структуры шаблона кодирования в устройстве для хранения данных доступном на сервере.

В некоторых вариантах реализации способа, анализирование по меньшей мере одной веб-страницы на сервере для того, чтобы обнаружить повторяющийся набор информации в пределах по меньшей мере одной веб-страницы и сохранить репрезентативную информацию структуры шаблона кодирования в устройстве для хранения данных доступном на сервере, происходит до момента получения поискового запроса от электронного устройства с помощью каналов связи через коммуникационную сеть и формирования страницы результатов работы поисковой системы.

В некоторых вариантах реализации способа, управляющий сигнал далее вызывает отображение на дисплее электронного устройства пользователя результатов поиска, в соответствии с которыми неповторяющийся сегмент комбинации данных заменяет по меньшей мере часть описания по меньшей мере одной веб-страницы.

В некоторых вариантах реализации способа, формирование страницы результатов работы поисковой системы включает ранжирование результатов поиска с помощью алгоритма ранжирования, при этом алгоритм ранжирования присваивает более высокий рейтинг по меньшей мере для одной веб-страницы, связанной с обнаруженной повторяющейся комбинацией элементов.

В некоторых вариантах реализации способа, в которых неповторяющийся сегмент данных является неповторяющимися сегментами данных, способ дополнительно включает получение от электронного устройства запроса для фильтра с целью фильтрации неповторяющихся сегментов данных в соответствии с по меньшей мере частью неповторяющихся данных для по меньшей мере одной веб-страницы, имеющей обнаруженные повторяющиеся комбинации элементов, выполнение второго поиска в соответствии с поисковым запросом и фильтром для получения результатов второго поиска, при этом результаты второго поиска включают в себя только удовлетворяющие запрос для фильтра неповторяющиеся сегменты данных, а также формирование второй страницы результатов работы поисковой системы с помощью сервера и отправку второй страницы результатов работы поисковой системы на электронное устройство.

В некоторых вариантах реализации способа, для множества веб-страниц, имеющих обнаруженную повторяющуюся комбинацию элементов, при том, что множество веб-страниц содержат общий тип неповторяющихся сегментов данных, способ дополнительно включает получение запроса для фильтра от электронного устройства с целью фильтрации неповторяющихся сегментов данных в соответствии с по меньшей мере частью из неповторяющихся данных, выполнение второго поиска в соответствии с поисковым запросом и фильтром для получения результатов второго поиска с помощью сервера, при этом результаты второго поиска включают в себя только удовлетворяющие запросу для фильтра неповторяющиеся сегменты данных, а также формирование второй страницы результатов работы поисковой системы с помощью сервера и отправку второй страницы результатов работы поисковой системы на электронное устройство.

В некоторых вариантах реализации способа, неповторяющийся сегмент данных включает информацию о ценах.

В некоторых вариантах реализации способа, неповторяющийся сегмент данных включает изображения.

В некоторых вариантах реализации способа, способ дополнительно включает получение клиентского запроса на извлечение данных для неповторяющихся сегментов данных от электронного устройства с помощью каналов связи через коммуникационную сеть и отправку некоторых неповторяющихся сегментов данных из по меньшей мере одной веб-страницы на электронное устройство.

В соответствии с еще одним широким аспектом настоящей технологии предлагается способ создания страницы результатов работы поисковой системы для просмотра пользователем на дисплее электронного устройства, при этом способ выполняется на электронном устройстве, связанном с сервером с помощью каналов связи через коммуникационную сеть. Способ включает получение от пользователя с помощью интерфейса пользователя электронного устройства поискового запроса, отправку поискового запроса на сервер, получение от сервера страницы результатов работы поисковой системы, включающей в себя результаты поиска в соответствии с поисковым запросом, при этом результаты поиска включают в себя по меньшей мере одну веб-страницу, имеющую шаблон повторяющийся набора информации в этой веб-странице и по меньшей мере один неповторяющийся сегмент данных, извлеченный с помощью шаблона повторяющегося набора информации, и отображение на дисплее для пользователя с помощью интерфейса пользователя списка ссылок для по меньшей мере некоторых веб-страниц, являющихся частью результатов поиска, и для по меньшей мере одной веб-страницы, имеющей повторяющуюся комбинацию элементов, по меньшей мере одного неповторяющегося сегмента данных по меньшей мере одной веб-страницы в непосредственной близости от ссылки для по меньшей мере одной веб-страницы.

В некоторых вариантах реализации способа, упомянутое выше извлечение по меньшей мере одного неповторяющегося сегмента данных из по меньшей мере одной веб-страницы включает использование шаблона повторяющегося набора информации, извлечение множества неповторяющихся сегментов данных из по меньшей мере одной веб-страницы, при этом каждый из множества неповторяющихся сегментов данных по меньшей мере частично отличается от других сегментов из множества неповторяющихся сегментов данных.

В некоторых вариантах реализации способа, способ дополнительно включает получение от пользователя с помощью интерфейса пользователя запроса для фильтра с целью фильтрации неповторяющихся сегментов данных в соответствии с по меньшей мере частью неповторяющихся данных, отправку запроса для фильтра на сервер, получение от сервера второй страницы результатов работы поисковой системы, которая содержит неповторяющиеся сегменты данных, соответствующие запросу для фильтра, и отображение на дисплее для пользователя с помощью интерфейса пользователя второй страницы результатов работы поисковой системы.

В некоторых вариантах реализации способа, запрос для фильтра является применительным для множества веб-страниц, при этом каждая из этих множества веб-страниц содержит обнаруженную повторяющуюся комбинацию элементов и содержит неповторяющиеся сегменты данных, имеющие общий тип неповторяющихся данных, отправки запроса для фильтра на основной сервер, на котором размещается одна из нескольких веб-страниц, а также получения от основного сервера, на котором размещается одна из нескольких веб-страниц, неповторяющихся сегментов данных, соответствующих запросу для фильтра.

В некоторых вариантах реализации способа, неповторяющиеся данные включают в себя информацию о ценах.

В некоторых вариантах реализации способа, неповторяющиеся данные включают в себя изображения.

В некоторых вариантах реализации способа, способ дополнительно включает отправку на основной сервер, на котором размещается по меньшей мере одна веб-страница, клиентского запроса на извлечение по меньшей мере одного неповторяющегося сегмента данных, и получение от основного сервера, на котором размещается по меньшей мере одна веб-страница, по меньшей мере одного неповторяющегося сегмента данных из по меньшей мере одной веб-страницы.

В соответствии с еще одним широким аспектом настоящей технологии предлагается электронное устройство, содержащее: пользовательский интерфейс ввода для получения ввода пользователя; пользовательский интерфейс вывода для предоставления по меньшей мере одного из визуального или звукового выводов пользователю, интерфейс сетевой связи для двусторонней связи по сети передачи данных и процессор, соединенный с пользовательским интерфейсом ввода, пользовательским интерфейсом вывода и интерфейсом сетевой связи. Процессор выполнен с возможностью иметь доступ к машиночитаемым командам, которые обрабатываются с помощью процессора для: получения поискового запроса от пользователя с помощью пользовательского интерфейса ввода, отправки поискового запроса на сервер с помощью каналов связи через коммуникационную сеть, получения от сервера страницы результатов работы поисковой системы, содержащей результаты поиска в соответствии с поисковым запросом, при этом результаты поиска включают в себя по меньшей мере одну веб-страницу, имеющую шаблон повторяющийся набора информации в этой веб-странице и по меньшей мере один неповторяющийся сегмент данных, извлеченный с помощью шаблона повторяющегося набора информации, и отображения на дисплее для пользователя с помощью пользовательского интерфейса вывода списка ссылок для по меньшей мере некоторых веб-страниц, являющихся частью результатов поиска, и для по меньшей мере одной веб-страницы, имеющей повторяющуюся комбинацию элементов, по меньшей мере одного неповторяющегося сегмента данных по меньшей мере одной веб-страницы в непосредственной близости от ссылки для по меньшей мере одной веб-страницы.

В некоторых вариантах реализации устройства, процессор дополнительно выполнен с возможностью получения запроса для фильтра с целью фильтрации неповторяющихся сегментов данных в соответствии с по меньшей мере частью неповторяющихся данных от пользователя с помощью пользовательского интерфейса ввода, отправки запроса для фильтра на сервер, получения от сервера второй страницы результатов работы поисковой системы, которая содержит неповторяющиеся сегменты данных, соответствующие запросу для фильтра, и отображения на дисплее для пользователя с помощью пользовательского интерфейса вывода второй страницы результатов работы поисковой системы.

В некоторых вариантах реализации устройства, в которых запрос для фильтра является применительным для любого количества веб-страниц, при этом каждая из этих многочисленных веб-страниц содержит обнаруженную повторяющуюся комбинацию элементов и содержит неповторяющиеся сегменты данных, имеющие общий тип неповторяющихся данных, процессор дополнительно выполнен с возможностью: отправки запроса для фильтра на основной сервер, на котором размещается одна из нескольких веб-страниц, а также получения от основного сервера, на котором размещается одна из нескольких веб-страниц, неповторяющихся сегментов данных, соответствующих запросу для фильтра.

В некоторых вариантах реализации устройства, процессор дополнительно выполнен с возможностью отправки на основной сервер, на котором размещается по меньшей мере одна веб-страница, клиентского запроса на извлечение по меньшей мере одного неповторяющегося сегмента данных, и получения от основного сервера, на котором размещается по меньшей мере одна веб-страница, по меньшей мере одного неповторяющегося сегмента данных из по меньшей мере одной веб-страницы.

В соответствии с еще одним широким аспектом настоящего технологии, предлагается сервер, содержащий: интерфейс связи для связи с электронным устройством с помощью каналов связи через коммуникационную сеть и процессор, функционально соединенный с интерфейсом связи. Процессор выполнен с возможностью получения поискового запроса от электронного устройства с помощью каналов связи через коммуникационную сеть, осуществление поиска в соответствии с поисковым запросом для получения результатов поиска, при этом результаты поиска, содержат по меньшей мере одну веб-страницу, анализирования по меньшей мере одной веб-страницы для обнаружения шаблона повторяющегося набора информации, использования шаблона повторяющегося набора информации, извлечения по меньшей мере одного неповторяющегося сегмента данных из по меньшей мере одной веб-страницы, формирования страницы результатов работы поисковой системы, причем страница результатов работы поисковой системы содержит по меньшей мере один неповторяющийся сегмент данных, отправки управляющего сигнала на электронное устройство с помощью каналов связи через коммуникационную сеть, при этом управляющий сигнал вызывает выполнение и отображение на дисплее электронного устройства для пользователя с помощью пользовательского интерфейса вывода электронного устройства (i) результатов поиска, содержащих ссылку для по меньшей мере одной веб-страницы и (ii) для по меньшей мере одной веб-страницы неповторяющегося сегмента данных в непосредственной близости от ссылки.

В некоторых вариантах реализации сервера, повторяющийся набор информации содержит повторяющуюся комбинацию из кодирующих элементов, определяющих шаблон кодирования.

В некоторых вариантах реализации сервера, процессор дополнительно выполнен с возможностью хранения репрезентативной информации структуры шаблона кодирования в устройстве для хранения данных доступном на сервере.

В некоторых вариантах реализации сервера, процессор дополнительно сконфигурирован таким образом, чтобы анализировать по меньшей мере одну вебстраницу на сервере для того, чтобы обнаружить повторяющийся набор информациив пределах по меньшей мере одной веб-страницы и сохранить репрезентативную информацию структуры шаблона кодирования в устройстве для хранения данных доступном на сервере до момента получения поискового запроса от электронного устройства с помощью каналов связи через коммуникационную сеть и формирования страницы результатов работы поисковой системы.

В некоторых вариантах реализации сервера, в которых для формирования страницы результатов работы поисковой системы процессор выполнен с возможностью ранжирования результатов поиска с помощью алгоритма ранжирования, алгоритм ранжирования присваивает более высокий рейтинг по меньшей мере для одной веб-страницы, связанной с обнаруженной повторяющейся комбинацией элементов.

В некоторых вариантах реализации сервера, в которых неповторяющийся сегмент данных является неповторяющимися сегментами данных, сервер дополнительно сконфигурирован таким образом, чтобы получать от электронного устройства запрос для фильтра с целью фильтрации неповторяющихся сегментов данных в соответствии с по меньшей мере частью неповторяющихся данных для по меньшей мере одной веб-страницы, имеющей обнаруженные повторяющиеся комбинации элементов, выполнять второй поиск в соответствии с поисковым запросом и фильтром для получения результатов второго поиска, при этом результаты второго поиска включают в себя только удовлетворяющие запросу для фильтра неповторяющиеся сегменты данных, а также формировать вторую страницу результатов работы поисковой системы с помощью сервера и отправлять вторую страницу результатов работы поисковой системы на электронное устройство.

В некоторых вариантах реализации сервера, в которых множество веб-страниц содержат общий тип неповторяющихся сегментов данных, процессор дополнительно сконфигурирован таким образом, чтобы получать запрос для фильтра от электронного устройства с целью фильтрации неповторяющихся сегментов данных в соответствии с по меньшей мере частью из неповторяющихся данных для множества веб-страниц, имеющих обнаруженную повторяющуюся комбинацию элементов, выполнять второй поиск в соответствии с поисковым запросом и запросом для фильтра с целью получения результатов второго поиска с помощью сервера, при этом результаты второго поиска включают в себя только удовлетворяющие запросу для фильтра неповторяющиеся сегменты данных, а также формировать вторую страницу результатов работы поисковой системы с помощью сервера и отправлять вторую страницу результатов работы поисковой системы на электронное устройство.

В некоторых вариантах реализации сервера, процессор дополнительно сконфигурирован таким образом, чтобы получать клиентский запрос на извлечение данных для неповторяющихся сегментов данных от электронного устройства с помощью каналов связи через коммуникационную сеть и отправлять некоторые неповторяющиеся сегменты данных из по меньшей мере одной веб-страницы на электронное устройство.

В контексте настоящего подробного описания «сервер» подразумевает под собой компьютерную программу, работающую на соответствующем оборудовании, которая способна получать запросы (например, от клиентских устройств) по сети и выполнять эти запросы или инициировать выполнение этих запросов. Аппаратное обеспечение может представлять собой один отдельный физический компьютер или одну отдельную физическую компьютерную систему. В контексте настоящей технологии использование выражения «сервер» не означает, что каждая задача (например, полученные инструкции или запросы) или какая-либо конкретная задача будет получена, выполнена или инициирована к выполнению одним и тем же сервером (то есть одним и тем же программным обеспечением и/или аппаратным обеспечением); это означает, что любое количество элементов программного обеспечения или аппаратных устройств может быть вовлечено в получение/передачу, выполнение или инициирование выполнения любой задачи или запроса, или последствия любой задачи или запроса, связанного с клиентским устройством, и все это программное и аппаратное обеспечение может быть одним сервером или несколькими серверами, оба варианта включены в выражение «сервер поисковой системы».

В контексте настоящего описания, термин "клиентское устройство" или "электронное устройство" означает любое электронное устройство, на котором соответствующее программное обеспечение способно выполнять поставленные задачи. Таким образом, некоторыми примерами (не имеющими ограничительного характера) клиентских устройств могут служить персональные компьютеры (настольные компьютеры, ноутбуки, нетбуки и т.п.) смартфоны, планшеты, а также сетевое оборудование, такое как маршрутизаторы, коммутаторы и шлюзы. Следует иметь в виду, что электронное устройство, ведущее себя как клиентское устройство в настоящем контексте, может вести себя как сервер по отношению к другим клиентским устройствам. Использование выражения «клиентское устройство» не исключает возможности использования множества клиентских устройств для получения/отправки, выполнения или инициирования выполнения любой задачи или запроса, или же последствий любой задачи или запроса, или же этапов любого вышеописанного способа.

В контексте настоящего описания термин «база данных» подразумевает под собой любой структурированный набор данных, не зависящий от конкретной структуры, программного обеспечения по управлению базой данных, аппаратного обеспечения компьютера, на котором данные хранятся, используются или иным образом оказываются доступны для использования. База данных может находиться на том же оборудовании, которое выполняет процесс, который сохраняет или использует информацию, хранящуюся в базе данных, или же она может находиться на отдельном оборудовании, например, выделенном сервере или множестве серверов, банках памяти и тому подобном.

В контексте настоящего описания термин «информация» включает информацию любого рода или типа, которая может храниться в базе данных. Таким образом, информация включает, среди прочего, аудиовизуальные произведения (изображения, видео, звукозаписи, презентации и т.д.), данные (данные о местоположении, цифровые данные и т.д.), текст (мнения, комментарии, вопросы, сообщения и т.д.), документы, таблицы и т.д.

В контексте настоящего подробного описания термин «компонент» подразумевает под собой программное обеспечение (соответствующее конкретному аппаратному контексту) и аппаратное обеспечение выполнено с возможностью обработки команд программного обеспечения, которые являются необходимыми и достаточными для выполнения конкретной(ых) указанной(ых) функции(й).

В контексте настоящего описания термин «используемый компьютером носитель информации» подразумевает под собой носитель абсолютно любого типа и характера, включая ОЗУ, ПЗУ, диски (компакт диски, DVD-диски, дискеты, жесткие диски и т.д.), USB флеш-накопители, твердотельные накопители, накопители на магнитной ленте и т.д.

В контексте настоящего описания слова «первый», «второй», «третий» и т.д. используются в виде прилагательных исключительно для того, чтобы отличать существительные, к которым они относятся, друг от друга, а не для целей описания какой-либо конкретной связи между этими существительными. Так, например, следует иметь в виду, что использование терминов "первый сервер" и "третий сервер" не подразумевает какого-либо порядка, отнесения к определенному типу, хронологии, иерархии или ранжирования (например) серверов/между серверами, равно как и их использование (само по себе) не предполагает, что некий "второй сервер" обязательно должен существовать в той или иной ситуации. Дополнительно, как указано в настоящем документе, в других контекстах, упоминание "первого" элемента и "второго" элемента не исключает возможности того, что это один и тот же фактический реальный элемент. Так, например, в некоторых случаях, "первый" сервер и "второй" сервер могут являться одним и тем же программным и/или аппаратным обеспечением, а в других случаях они могут являться разным программным и/или аппаратным обеспечением.

Каждый вариант осуществления настоящей технологии включает по меньшей мере одну из вышеупомянутых целей и/или объектов, но наличие всех не является обязательным. Следует иметь в виду, что некоторые объекты данной технологии, полученные в результате попыток достичь вышеупомянутой цели, могут не удовлетворять этой цели и/или могут удовлетворять другим целям, отдельно не указанным здесь.

Дополнительные и/или альтернативные характеристики, аспекты и преимущества вариантов осуществления настоящей технологии станут очевидными из последующего описания, прилагаемых чертежей и прилагаемой формулы изобретения.

Краткое описание чертежей

Для лучшего понимания настоящей технологии, а также других его аспектов и характеристик сделана ссылка на следующее описание, которое должно использоваться в сочетании с прилагаемыми чертежами, где:

Фиг. 1 представляет упрощенное схематическое представление сети Интернет с клиентскими устройствами, серверами поисковой системы и основными серверами для размещения веб-страниц.

Фиг. 2 представляет упрощенную структурную схему функциональных компонентов сервера поисковой системы.

Фиг. 3 представляет схематическое представление последовательности сигналов согласно настоящему способу представления результатов поиска в соответствии поисковому запросу в сети Интернет.

Фиг. 4 представляет схему последовательности операций согласно аспекту настоящего способа представления результатов поиска в соответствии поисковому запросу в сети Интернет.

Фиг. 5 представляет схему последовательности операций согласно аспекту настоящего способа представления результатов поиска в соответствии поисковому запросу в сети Интернет.

Фиг. 6 представляет приводимое в качестве примера схематическое представление SERP в соответствии с настоящим способом и устройством.

Фиг. 7 представляет схему последовательности операций настоящего способа и фильтрации поисковым сервером результатов поиска, которые предоставлены в SERP.

Фиг. 8 представляет пример вывода данных одного варианта реализации настоящей технологии, в том случае когда SERP представляет результаты поиска котят для продажи с неповторяющимися сегментами данных, включающими в себя реализацию ценового фильтра.

Фиг. 9 представляет пример вывода данных другого варианта реализации настоящей технологии, в том случае когда SERP представляет результаты поиска шлемов для продажи в Москве, снова дополненной неповторяющимися сегментами данных, найденных с помощью распознанной повторяющейся комбинации данных, как описано в вариантах реализации настоящей технологии.

Осуществление изобретения

Настоящее подробное описание представлено только как описание иллюстративных примеров настоящей технологии. Это описание не предназначено для определения объема или установления границ настоящей технологии. В некоторых случаях, полезные примеры модификаций изложены в качестве помощи для понимания настоящего технологии, а не для определения объема или установления границ настоящей технологии. Эти модификации представляют собой далеко не полный перечень и специалистам в данной области будет понятно, что возможны и другие подобные модификации. Кроме того, это не должно интерпретироваться так, что там, где это еще не было сделано, т.е. там, где не были изложены примеры модификаций, никакие модификации невозможны, и/или что то, что описано, является единственным вариантом реализации этого конкретного аспекта настоящей технологии. Как будет понятно специалисту в данной области техники, это, скорее всего, не так. Кроме того, следует иметь в виду, что настоящее подробное описание представляет собой в некоторых конкретных проявлениях достаточно простой вариант реализации настоящей технологии, и в подобных случаях представлен здесь таким образом с целью облегчения понимания. Как будет понятно специалисту в данной области техники, многие варианты реализации настоящей технологии будут обладать гораздо большей сложностью.

Согласно Фиг. 1, представлено упрощенное схематическое представление сети Интернет 100. С целью упрощения, и ради настоящего описания, сеть Интернет 100 проиллюстрирована только с тремя категориями узлов, а именно клиентскими устройствами 110, серверами поисковой системы 120 и основными серверами для размещения веб-страниц 130, при этом клиентским устройством является электронное устройство, используемое пользователем устройства и способа, как описано выше. Тем не менее, специалистам в данной области техники будет понятно, что Интернет сеть 100 включает намного больше категорий узлов и этих категориях узлов могут быть использованы любое количество типов оборудования. Каждая категория узлов может обмениваться данными с другими категориями узлов в соответствии с установленными протоколами и стандартами.

В контексте настоящей технологии могут быть использованы различные типы клиентов или электронных устройств 110. Например, клиентское устройство 110 может представлять собой смартфон, планшет, ноутбук, компьютер, телевизор, игровую консоль, или любой другой тип клиентского устройства, которое приспособлено и выполнено с возможностью для доступа к сети Интернет 100. Клиентское устройство 110 может получить доступ к сети Интернет 100 непосредственно напрямую или за счет использования сервера доступа Экстранет, точки доступа Wi-Fi, поставщика услуг Интернет, оператора мобильной связи и т.д.

Для того, чтобы проводить поиск в сети Интернет пользователь клиентского устройства 110 открывает приложение веб-браузера и выбирает приложение поисковой системы. В некоторых вариантах реализации настоящей технологии, функциональность поисковой системы сконфигурирована таким образом, чтобы автоматически обеспечивать доступ к конкретному приложению поисковой системы, в то время как в других вариантах реализации настоящей технологии предоставляется список приложений поисковой системы или произвольно выбранное приложение поисковой системы. Затем пользователь клиента или электронного устройства 110 вводит ключевое слово(а), которое соответствует запрашиваемой информации. Ключевые слова могут быть дополнительно сгруппированы или разделены булевскими выражениями, распознанными приложением поисковой системы. Ключевое слово(а) и булевские выражения, если они используются, формируют поисковый запрос, который отправляется на сервер поисковой системы в качестве поискового запроса.

Поисковый запрос отправляется с помощью клиентского устройства 110 на сервер поисковой системы 120. Сервер поисковой системы 120 может состоять из одного или нескольких серверов, которые получают поисковые запросы, проводят поисковые запросы, а также представляют страницу результатов работы поисковой системы параллельно или в подгруппах для любого количества клиентских устройств.

Согласно Фиг. 2 представлена упрощенная структурная схема функциональных компонентов сервера поисковой системы 120. Функциональные компоненты сервера поисковой системы 120, проиллюстрированные на Фиг. 2, приведены только в иллюстративных целях и не отражают все функциональные компоненты сервера поисковой системы 120, а также не все варианты функциональных компонентов, которые могут быть упорядочены по-разному (подразделены, сгруппированы) и/или представлены во множестве экземпляров и т.д. По этой причине, ради настоящего описания, проиллюстрированы и описаны только основные функциональные компоненты сервера поисковой системы 120. Сервер поисковой системы 120 содержит устройство ввода/вывода 210, процессор(ы) 220, память 230, индексирующий поисковый движок 240, поисковый робот(ы) 250 и компонент правил ранжирования 260.

Блок ввода/вывода 210 обеспечивает обмен данными между сервером поисковой системы 120 и клиентским устройством 110, а также с основными серверами для размещения веб-страниц 130 (показаны на Фиг. 1) и другими сетевыми узлами и серверами (не показаны). Блок ввода/вывода 210 выполнен с возможностью обмениваться данными в соответствии с известными протоколами и стандартами и используется для обмена данными через сеть Интернет. Блок ввода/вывода 210 получает поисковые запросы и представляет поисковые запросы в процессор 220. Блок ввода/вывода 210 дополнительно выполнен с возможностью получения другие типов запросов и формирования других типов ответов, не связанных с настоящей технологией, и, в связи с этим, в настоящем документе не описан.

В качестве серверов поисковой системы 120, как правило, сетевые узлы выполнены с возможностью одновременно обрабатывать тысячи поисковых запросов от различных клиентских устройств, при этом, как правило, используется любое количество процессоров 220. Тем не менее, с целью упрощения, в нижеследующем описании будет использоваться выражение "процессор 220", которое предназначено для обозначения функциональности процессора и соответствующего аппаратного обеспечения сервера поисковой системы 120.

Процессор 220 имеет доступ к памяти 230, которая, как правило, состоит из больших групп блоков памяти. Несмотря на то, что это конкретно не проиллюстрировано на Фиг. 2, память 230 может быть использована одним сервером поисковой системы 120, или может быть совместно использована множеством групп и/или подгрупп серверов поисковой системы 120. Память 230 сохраняет моментальные снимки данных веб-страниц опубликованных в сети Интернет, а также моментальные снимки данных, которые были ранее получены сервером поисковой системы 120 как часть автоматизированного сбора данных поисковым роботом или в контексте выполнения предыдущего поиска в сети Интернет. Память 230 дополнительно содержит соответствующую веб-страницу в виде унифицированного определителя местонахождения ресурса (URL - адреса) для каждого моментального снимка данных вместе с указанием о том, когда был получен моментальный снимок данных. Память 230 дополнительно хранит другую информацию для каждой веб-страницы, такую как, например, метаданные и теги HTML, как известно в данной области техники.

Процессор 220 также имеет доступ к индексирующему поисковому движку 240. Индексирующий поисковый движок 240 собирает и индексирует информацию и веб-страницы из сети Интернет. Индексирующий поисковый движок 240 может быть расположен локально в сервере поисковой системы 120 или же удаленно. В качестве альтернативы, индексирующий поисковый движок 240 может быть предоставлен сервером поисковой системы 120 или же предоставлен другим сервером. Индексирующий поисковый движок 240 обеспечивает быстрый и точный поиск информации, хранящейся и доступной в сети Интернет. Индексирующим поисковым движком 240 могут быть использованы различные типы способов индексации, такие как, например, хорошо известная структура инвертированного индекса.

Процессор 220 также обменивается данными с одним или множеством поисковым роботом(ами) 250. Каждый поисковый робот 250 используется для посещения веб-сайтов и последующей отсылки каждого моментального снимка данных в память 230 и индексирующий поисковый движок 240. Перед выполнением поиска с помощью сервера поисковой системы 120 каждый поисковый робот 250 делает моментальный снимок данных (электронную копию) веб-страниц и индексирует посещенные веб-страницы, при этом моментальные снимки данных обрабатываются с помощью индексирующего поискового движка 240. Поисковый робот(ы) 250 также может быть использован для проверки URL-адреса, метаданных и HTML тегов посещенных веб-страниц. Индексация сайт выполняется до получения поискового запроса и сохраняется в индексирующем поисковом движке 240, а затем сервер поисковой системы 120 обращается за справкой к индексирующему поисковому движку 240 для того, чтобы получить результаты поиска, соответствующие поисковому запросу от пользователя.

Процессор 220 также взаимодействует с компонентом правил ранжирования 260. Компонент правил ранжирования 260 хранит и применяет правила для ранжирования точной релевантности каждой страницы, соответствующей полученному поисковому запросу. Компонент правил ранжирования 260 может учитывать множество факторов, таких как, например: доверие, ссылки из других страниц, релевантность, информацию текста ссылки, количество исходящих ссылок, контекст страницы, время создания домена, степень завершенности страницы, свежесть ссылки, расстояние от домашней страницы и т.д.

Согласно Фиг. 3, проиллюстрировано схематическое представление последовательности сигналов согласно настоящему способу отображения на дисплее результатов поиска в соответствии поисковому запросу в сети Интернет. Реализация способа начинается с ввода пользователем поискового запроса, как указано ссылочной позицией 310. Как правило, поисковый запрос включает ключевое слово(а), а иногда булевское выражение(я) между некоторыми из ключевых слов. Клиентское устройство 110 передает, как указано ссылочной позицией 320, поисковый запрос на сервер поисковой системы 120. Для того, чтобы сделать это, клиентское устройство 110 объединяет в пакет поисковый запрос в сообщении интернет-протокола и отправляет на сервер поисковой системы 120 через сеть Интернет в качестве поискового запроса. Сервер поисковой системы 120 получает сообщение интернет-протокола, как известно в данной области техники, и извлекает из него поисковый запрос. Затем сервер поисковой системы 120 осуществляет поиск в сети Интернет 330 для идентификации индексов веб-страницы, соответствующих поисковому запросу, как известно в данной области техники и кратко описано выше. Во время выполнения поиска 330 сервер поисковой системы 120 получает доступ, как указано ссылочными позициями 340а и 340b, к веб-страницам, размещенным на основных серверах 130а и 130b в указанном порядке. Несмотря на то, что на Фиг. 3 проиллюстрированы и описаны только две веб-страницы, размещенные на основных серверах, данная технология не ограничивается двумя веб-страницами, размещенными на основных серверах, а сервер поисковой системы 120 выполнен с возможностью доступа к многим вебстраницам, размещенным на основном сервере для того, чтобы выполнить поиск в сети Интернет в соответствии с требованиями полученного поискового запроса. Каждая из веб-страниц, доступ к которым обеспечивается основными серверами 130а и 130b, выдает, как указано ссылочными позициями 350а и 350b, индексы вебстраниц, размещенных таким образом, и соответствующих ключевым словам поискового запроса. Затем сервер поисковой системы 120 систематизирует, как указано ссылочной позицией 360, результаты поиска 360 для формирования страницы результатов работы поисковой системы (SERP) в ответ на поисковый запрос. Систематизирование результатов поиска 360 включает в себя ранжирование результатов поиска, извлечение из HTML информации и метаданных для названия веб-страницы и нахождения ключевых слов с целью формирования фрагмента информации и размещения его в SERP. Результаты поиска, отформатированные как SERP, отсылаются, как указано ссылочной позицией 370, на клиентское устройство для отображения на дисплее клиентского устройства 110.

Теперь рассматриваются одновременно Фиг. 3, 4 и 5, причем Фиг. 4 и 5 представляют собой схему последовательности операций аспектов настоящего технологии представления результатов поиска в сети Интернет. Согласно Фиг. 4, способ включает получение поискового запроса сервером поисковой системы 120 от клиентского устройства 110. Поисковый запрос включает поисковый запрос, введенный пользователем, который содержит ключевое слово(а), а также содержит булевские выражения, как уже рассматривалось ранее. Как известно в данной области, сообщение, которое инкапсулирует поисковый запрос, также содержит адрес источника и адрес назначения для того, чтобы обеспечить доставку сообщения поискового запроса на сервер поисковой системы 120 и наличие на сервере поисковой системы 120 адреса клиентского устройства 110 для выдачи результатов поиска.

После получения поискового запроса 420 сервер поисковой системы 120 выполняет поиск в сети Интернет 330. Веб-страницы, как правило, содержат различную информацию такую как, например: изображения, заголовки, основное содержание текста, навигацию, метаданные и/или микроформат, а также кредиты, которые будут проиндексированы с помощью поискового робота в более ранний момент времени. Сервер поисковой системы 120 выполняет поиск индексирующим поисковым движком 240 результатов, которые соответствуют запросу, находящемуся в поисковом запросе 420. Веб-страницы, определенные сервером поисковой системы 120, как соответствующие поисковому запросу, содержат ключевые слова, формирующие результаты поиска. Сервер поисковой системы 120 извлекает основную информацию из веб-страниц, которые являются результатами поиска, для формирования страницы результатов работы поисковой системы (SERP). Как правило, сервер поисковой системы 120 извлекает для каждой идентифицированной страницы информацию о ее URL-адресе, первом совпадении ключевых слов в странице, названии веб-страницы и домене, связанном с вебстраницей. Сервер поисковой системы 120 может дополнительно извлекать стандартизованные метаданные, которые будут отображаться на дисплее в виде фрагмента информации в SERP. По этой причине, выполнение поиска в Интернете 330 включает идентификацию веб-страницы, соответствующей поисковому запросу и ключевым словам, а также извлечение из нее информации для формирования полученной в результате SERP.

В варианте реализации настоящей технологии, проиллюстрированном на Фиг. 5, способ дополнительно реализует ранжирование 535 веб-страниц, идентифицированных в результатах поиска с помощью точной релевантности, как известно в данной области, прежде чем продолжить дальнейшие действия.

В настоящей технологии способ дополнительно включает идентификацию 440 одной или нескольких повторяющихся комбинаций информации в содержании по меньшей мере одной веб-страницы, идентифицированной в результатах поиска. Обнаружение повторяющихся комбинаций информации может встречаться до получения поискового запроса сервером поисковой системы 120. Альтернативно, обнаружение повторяющихся комбинаций информации может встречаться после получения поискового запроса сервером поисковой системы 120.

Повторяющиеся комбинации информации часто находятся на веб-страницах, которые соответствуют результатам поиска в базе данных, таких как, например, сайты с рубричной рекламой, SERP других поисковых систем, сайты розничной торговли и многие другие виды приложений. Например, когда сервер поисковой системы 120 выполняет поиск в сети Интернет, используя ключевые слова, которые присутствуют в рекламных объявлениях, веб-сайт с рубричной рекламой предоставляет на сервер поисковой системы 120 содержание веб-страницы, в рамках которого определяется список элементов, описывающий предметы для продажи (элементов для продажи) и которые соответствуют поисковому запросу или ключевым словам.

Эти элементы для продажи могут быть организованы или иным способом представлять повторяющийся набор информации. Повторяющийся набор информации может быть определен с помощью, например, HTML-тегов или кодирования, которое является структурированным для того, чтобы представить: изображение, описание, цены, текущее географическое местонахождение объекта, продавца и т.д. В связи с тем, что существует несколько элементов для продажи, которые могут быть представлены в любой веб-странице, несколько элементов для продажи могут быть организованы тем же (или практически тем же) способом, таким образом создавая повторяющийся набор информации.

Это должно быть четко понятно, что повторяющийся набор информации может присутствовать в различных форматах, в том числе любом типе формата HTML, или в таком типе как, например, в заголовках, элементе основной части, метаданных, а также в любом другом известном формате для формирования вебстраниц.

После идентификации одного или более типов повторяющихся наборов информации способ дополнительно производит выборку всех неповторяющихся сегментов данных, используя повторяющийся набор информации. Например, может быть обнаружена повторяющаяся комбинация кода для представления цены в рубричной рекламе, а неповторяющиеся сегменты данных, полученные посредством этого, будут представлять собой различные цены для различных продаваемых элементов.

Способ и поисковой сервер 120 может обнаружить другую повторяющуюся комбинацию или комбинации на различных веб-страницах. Повторяющийся набор информации для представления цены может быть найден на одном сайте, в то время как повторяющийся набор информации на другом сайте может состоять из HTML кодирования для представления изображений. В качестве альтернативы, способ и сервер поисковой системы 120 идентифицируют повторяющуюся комбинацию в содержании одной из страниц с высокой степенью ранжирования и выполняют поиск такой же повторяющейся комбинации в содержании других вебстраниц. Способ и процессор сервера поисковой системы 120 может быть дополнительно сконфигурирован для идентификации повторяющихся комбинаций только для некоторых конкретных доменных имен и/или URL адресов. В качестве альтернативы, способ и сервер поисковой системы 120 могут быть сконфигурированы для определения повторяющихся комбинаций только на идентифицированных веб-страницах с высокой степенью ранжирования.

В одном аспекте настоящего технологии, извлечение неповторяющихся сегментов данных происходит автоматически при введении первого поискового запроса в поисковый запрос 420 и представлено на первой SERP. В качестве альтернативы в другом аспекте, сервер поисковой системы 120 сконфигурирован для осуществления идентификации повторяющихся комбинаций идентифицированных веб-страниц только после того, как они сначала отображены на дисплее в SERP, а уже после этого происходит запрос для SERP, чтобы включить результаты, представляющие неповторяющиеся сегменты данных, которые были получены от пользователя. Запрос пользователя может быть получен в ответ на щелчок пользователем кнопкой мыши (или иным способом приведения в действие) по графическому элементу, связанному либо с SERP или же с браузером, отображенном в SERP на дисплее, при этом графический элемент указывает пользователю о наличии возможности для извлечения и представления на SERP неповторяющихся сегментов данных, связанных с одним или более результатами поиска, представленными на SERP.

Необязательно, способ и сервер поисковой системы 120 могут дополнительно идентифицировать тип(ы) неповторяющихся сегментов данных, которые будут извлечены из страницы, или идентифицировать страницы, содержащие повторяющиеся наборы достоверных данных. Например, при идентификации с помощью способа и/или сервера поисковой системы 120 повторяющейся комбинации в HTML содержании веб-страницы, соответствующей тематическому объявлению, неповторяющиеся сегменты данных, которые, как правило, будут извлечены оттуда, содержат изображение и цену.

Затем способ и сервер поисковой системы 120 анализируют другие вебстраницы, идентифицированные с помощью поиска в сети Интернет, для того, чтобы обнаружить неповторяющиеся типы сегментов данных, которые могут быть извлечены из шаблона повторяющегося набора информации имеющегося совпадения желаемых типов, таких как изображения и цены. В то же время, как неисчерпывающий список, приводимые в качестве примеров типы неповторяющихся сегментов данных, которые могут пожелать извлечь пользователи, содержат: рисунок, цену, местонахождение, описание, название, ключевое слово, рейтинг или информацию о продавце. Более того, способ и сервер поисковой системы 120 обнаруживают на различных веб-страницах, идентифицированных во время выполнения поиска в сети Интернет, повторяющиеся наборы достоверных данных, которые являются похожими, но не идентичными. Затем способ и сервер поисковой системы 120 ограничивают тип шаблона повторяющегося набора информации или тип неповторяющихся сегментов данных учтенных для всех идентифицированных веб-страниц на основе определенной общности.

В качестве альтернативы способ и сервер поисковой системы 120 ограничивают обнаружение и извлечение неповторяющихся сегментов данных для типа идентифицированной веб-страницы с самой высокой степенью ранжирования. Например, если веб-страница с самой высокой степенью ранжирования представляет собой страницу рубричной рекламы, отображающую неповторяющиеся сегменты данных типов цены и изображения, то неповторяющиеся сегменты данных, извлеченные из других результатах поиска будут также ограничены для типов цены и изображения.

Также могут быть использованы без отхода от существующей технологии другие способы и механизмы отображения унифицирования и/или извлечения полезной информации из повторяющихся наборов информации и неповторяющихся сегментов данных, найденных в содержании веб-страниц.

В некоторых вариантах реализации настоящей технологии способ дополнительно включает функцию обеспечения возможности фильтрации для информации, отображаемой в SERP. Один из вариантов реализации возможности функции фильтра использует технологию OpenSearch. Тем не менее, следует четко понимать, что могут быть использованы другие технологии для реализации возможности функции фильтра, описанного в настоящем документе.

Используя приводимую в качестве примера технологию OpenSearch только в качестве иллюстрации, способ проверяет, как указано ссылочной позицией 460, поддерживает ли одна из веб-страниц, идентифицированная при поиске в сети Интернет 330, технологию OpenSearch. Если ни одна из веб-страниц, идентифицированных при поиске в сети Интернет, не поддерживает технологию OpenSearch, способ переходит к формированию SERP 470. Если одна из идентифицированных веб-страниц поддерживает технологию OpenSearch, то способ продолжается или по варианту 1, или же по варианту 2. В варианте 1, способ отправляет программные инструкции OpenSearch 480, которые при выполнении процессором в клиентском устройстве, обеспечивают функцию фильтра. В варианте 2, способ сначала формирует SERP 470, в которой включен OpenSearch фильтр 490. Функционирование фильтра OpenSearch будет описано дополнительно.

Теперь рассматриваются одновременно Фиг. 2-6. Способ и сервер поисковой системы 120 формируют SERP 470. SERP, схематический пример которой представлен на Фиг. 6, содержит информацию о веб-страницах, идентифицированных в соответствии с поисковым запросом 420. Информация об идентифицированных веб-страницах содержит любой тип информации, известной в данной области, такую как, например: название веб-страницы, URL-адрес вебстраницы, доменное имя для веб-страницы, метаданные интереса и фрагмент информации, содержащий первое совпадение ключевых слов в поиске на вебстранице.

Данная SERP согласно Фиг. 6 дополнительно содержит представление нескольких неповторяющихся сегментов данных 610, в качестве извлеченных из обнаруженных повторяющихся наборов информации на веб-странице, определенной по ссылке 630а. На Фиг. 6 представлены случайно выбранные неповторяющиеся сегменты данных 610, такие как цены и изображения, которые извлечены с использованием повторяющейся комбинации элементов, при этом каждому элементу "Цена", соответствует различное изображение 620а…n.

В случае веб-страницы с рубричной рекламой, например, эти группировки цены и изображения неповторяющихся сегментов данных извлекаются из разных элементов для продажи. Различные группировки неповторяющихся сегментов данных 610 такие как, например, цены и изображения для различных элементов для продажи на странице рубричной рекламы, подлежат форматированию для отображения на дисплее клиентского устройства любым из следующих способов: вслед за соответствующей веб-страницей, как фрагмент информации из соответствующей веб-страницы или как сгруппированные с HTML кодированием в соответствии с типом сегмента неповторяющихся данных в разделе SERP.

Неповторяющийся сегмент данных группировок 610 также будет отформатирован для отображения на дисплее клиентского устройства в виде строки, столбца или сгруппирован в SERP (слева, справа, внизу, вверху). Неповторяющиеся сегменты данных 610 также отображаются в месте описания вебстраницы, а не в дополнении к этому описанию. SERP затем отсылается, как указано ссылочной позицией 490, на клиентское устройство для отображения на дисплее. В некоторых вариантах реализации настоящей технологии, извлечение неповторяющихся сегментов данных осуществляется автоматически во время выполнения первого поискового запроса. В некоторых вариантах реализации настоящей технологии, пользователь запрашивает обнаружение неповторяющихся сегментов данных путем отправки запроса на сервер.

При отображении неповторяющихся сегментов данных 610 в группировках, соответствующих их группе на веб-странице 630а…n (такие как, например, элементы для продажи), пользователь клиентского устройства быстро определяет представляющую интерес информацию. На Фиг. 6 проиллюстрирован один пример того, как неповторяющийся сегмент данных группировок 610 с различными "Цены" и изображениями 620а … 620п могут быть отображены на SERP. Предполагаются многие другие варианты графического расположения на дисплее неповторяющегося сегмента данных группировок 610: в одну или несколько линий, в один столбец или нескольких столбцов, в виде таблицы, расположенной слева от соответствующей информации на веб-странице или расположенной справа от соответствующей информации на веб-странице, представленный в виде фрагмента информации соответствующей веб-страницы, которая сгруппирована вместе в одном местоположении в SERP или в некоторой другой конфигурации.

Несмотря на то, что на Фиг. 6 проиллюстрирована определенная группировка неповторяющихся сегментов данных 610, таких как группировки, содержащие изображения 620а … 620n и соответствующие цены в качестве неповторяющихся сегментов данных, извлеченных с помощью шаблона повторяющегося набора информации, на дисплее может быть отображена любая комбинация типов неповторяющихся сегментов данных. Более того, тип неповторяющихся сегментов данных может быть различным для каждой веб-страницы 630а … 630n, отображающей на дисплее неповторяющиеся сегменты данных в SERP.

На Фиг. 6 дополнительно показан фильтр 640. Фильтр 640, представленный и отображенный в SERP, обеспечивает возможность пользователю, который получает SERP на клиентское устройство 110, выполнять дальнейшую фильтрацию результатов, представленных в SERP. Фильтрация может быть выполнена любым способом следующим образом: а) применение фильтра по неповторяющимся сегментам данных (например, фильтрация по цене или выведение только результатов, содержащих изображения);б) фильтрация отображаемых веб-страниц 630а … 630n; и/или в) выполнение нового поиска в сети Интернет веб-страниц, соответствующих поисковому запросу или ключевым словам, в то время как удовлетворяющий критерий фильтрации 650 предоставлен пользователем клиентского устройства на SERP.

Теперь рассматриваются одновременно Фигуры 6 и 7. Фильтрации SERP выполняется при вводе критерия 650 пользователем клиентского устройства. Критерий 650 может быть введен с помощью любого известного электронного устройства ввода, такого как, например, клавиатура, мышь, сенсорный дисплей, голосовая активация и т.д.

В некоторых вариантах реализации настоящей технологии, фильтр 640 включает меню с прокруткой вниз доступных полей для дополнительной фильтрации результатов SERP. В некоторых вариантах реализации настоящей технологии, возможности фильтра обеспечены с помощью технологии OpenSearch. Например, меню с прокруткой вниз создано с помощью полей OpenSearchable, идентифицированных в веб-страницах, включенных в SERP. В другом альтернативном варианте, меню с прокруткой вниз включает тип неповторяющегося сегмента данных желаемый пользователем для фильтрации в текущей SERP или в новом поиске. Меню с прокруткой вниз может альтернативно быть создано с использованием стандартных типов информации, которые содержат неповторяющиеся сегменты данных, такие как, например: цена и местонахождение. Фильтр, например фильтр OpenSearch 640, также представлен в виде фиксированного параметра, такого как, например цены или диапазон цен. Критерий 650 вводится как свободный текст или с помощью меню с прокруткой вниз.

В зависимости от варианта реализации данного фильтра 640 в SERP, способ продолжается фильтрацией 720 неповторяющихся сегментов данных 610, отображенных на текущей SERP с возможностью отображения только неповторяющихся сегментов данных, удовлетворяющих критерий 650. Поочередно и/или одновременно способ фильтрует 730 отображаемые в SERP веб-страницы для того, чтобы включить только те веб-страницы, которые соответствуют критерию 650.

Фильтрация 720 неповторяющихся сегментов данных и фильтрация 730 отображаемых веб-страниц осуществляется непосредственно в процессоре клиентского устройства. В качестве альтернативы, фильтрация 720 неповторяющихся сегментов данных и фильтрация 730 отображаемых веб-страниц выполняется с помощью сервера поисковой системы. В качестве альтернативы, способ выполняет новый поиск 740 для выборки веб-страниц и неповторяющихся сегментов данных, которые удовлетворяют критериям 650, введенным пользователем в фильтр, выполняя комбинированный поиск и фильтрацию.

На Фиг. 8 отображается на дисплее приводимый в качестве примера вывод одного из вариантов реализации настоящей технологии. Показан неполный моментальный снимок экрана 800 приводимой в качестве примера SERP, на которой поиск осуществляется в строке поиска 810 для поискового запроса в виде фразы 820 "купить котенка". Первый результат поиска отображенный в этом примере представляет собой результат в виде веб-страницы 830 и включает ссылку веб-страницы 835, а на месте описания веб-сайта или фрагмента представлены группировки 840а…n неповторяющегося сегмента данных. В то же время, как только отображается первый результат поиска 830, дополнительные результаты включают в себя ссылки веб-страниц с неповторяющимися сегментами данных либо одного типа или же в группах, как показано в первом результате поиска на Фиг. 8. Следует отметить, что другие результаты, представленные в SERP, могут включать в себя соответствующие неповторяющиеся сегменты данных или могут быть представлены с фрагментами, в URL или описаниях, как известно в данной области.

В этом примере, вариант реализации настоящей технологии обнаруживает повторяющийся набор информации, с помощью которого происходит извлечение неповторяющихся сегментов данных. Как показано ниже, ссылкой на полученной веб-странице 835, в данном случае с помощью шаблона повторяющегося набора информации были извлечены три типа неповторяющихся сегментов данных, в конкретном случае заголовок 842n, изображение 846n и цена 844n из каждой из групп, показанных для первого результата поиска. Например, если эти неповторяющихся сегменты данных были найдены на сайте рубричной рекламы, то SERP напрямую отображает названия и изображения из трех различных элементов для продажи, в данном случае котят для продажи, на этой веб-странице, связанных с веб-страницей посредством ссылки 835. Кроме того, для элементов 840b и 840n была найдена цена, несмотря на то, что для элемента 840а цена не была найдена.

Для примера нахождения неповторяющихся сегментов данных на сайте рубричной рекламы это означает, что один котенок для продажи была внесен в прейскурант без указания отпускной цены. На SERP неповторяющиеся сегменты данных, такие как название 842а…n, изображение 846а…n и цена 844b…n, определенные из шаблона повторяющегося набора информации, сгруппированы вместе таким образом, что неповторяющиеся данные каждого конкретного элемента на исходном сайте могут быть идентифицированы пользователем.

В рассматриваемом примере котенка для продажи в элементах 840b и 840n, пользователь может сравнивать относительную внешнюю привлекательность и цену котят не покидая SERP. Кроме того, пользователь может выделить данные из SERP, если результаты поиска 830, найденные сервером поисковой системы 120, представляют интерес для пользователя с целью дополнительного поиска при нажатии щелчком кнопкой мыши на ссылку веб-страницы 835. В некоторых вариантах реализации настоящей технологии, пользователь даже может удовлетворить потребность в поиске просто оценивая информацию в элементах 840b и 840n (и в других элементах результатов поиска 830), фактически без посещения соответствующего веб-сайта, связанного с результатом поиска 830.

В дополнение к результатам, выданным на SERP в этом примере, на SERP реализован фильтр 850 для того, чтобы позволить пользователю детализировать результаты поиска в соответствии с частью неповторяющихся сегментов данных. В этом примере пользователь может применить фильтр на диапазон цен котят для продажи. При активировании фильтра пользователем будет выдана обновленная SERP, при этом будут представлены только те элементы, которые соответствуют запросу для фильтра. В этом примере, при введении в фильтр 850 запроса для котят на продажу с ценой, находящейся в диапазоне фильтра, сразу же будет выдана обновленная SERP.

Ссылаясь теперь на Фигуру 9, на дисплее отображается приводимый в качестве примера вывод еще одного из вариантов реализации настоящей технологии. Показан неполный моментальный снимок экрана 900 SERP, созданной с помощью реализации настоящей технологии, на которой поиск осуществляется в строке поиска 910 для поискового запроса в виде фразы 920 "купить мотоциклетный шлем в Москве".

Первый результат поиска отображенный на дисплее в этом примере представляет собой результат в виде веб-страницы 930а и включает ссылку вебстраницы 935 и группировки неповторяющегося сегмента данных 940а…n, как извлеченные из идентифицированного шаблона повторяющегося набора информации. Группировки 940а…n отображены в данном случае вместо фрагмента веб-страницы или описания.

Для этого первого результата поиска 930а, в данном варианте реализации настоящей технологии, обнаружен повторяющийся набор информациии при его использовании извлечены неповторяющиеся сегменты данных таких типов, как заголовок 942n, изображение 946n и цены 944n. Для каждой группировки 940n три типа неповторяющихся сегментов данных снова отображены на дисплее вместе в соответствии их группировкам на веб-странице 930а. В этом случае, способ позволяет пользователю сравнивать различные шлемы для продажи в Москве, в том числе то, как каждый шлем выглядит, как этот шлем называется и сколько они стоят, не покидая SERP.

Дополнительные результаты поиска 930b вместе с 930n, представленные в этом примере включают в себя ссылки веб-страницы 966n и описание веб-страницы 968n. В настоящем документе отображены на дисплее только две ссылки веб-страниц, но на SERP могут быть отображены дополнительные ссылки, включающие в себя либо неповторяющиеся сегменты данных, как описано в настоящей технологии, или же ссылка веб-страницы и описание комбинации, как известно в данной области техники. В этом примере не был реализован никакой фильтр на SERP.

Модификации и улучшения вышеописанных вариантов реализации настоящей технологии будут ясны специалистам в данной области техники. Приведенное выше описание предназначено для того, чтобы быть приведенным в качестве примера, а не иметь ограничительный характер. В связи с этим объем настоящей технологии ограничен только объемом прилагаемой формулы изобретения.

Похожие патенты RU2598789C2

название год авторы номер документа
СИСТЕМА И СПОСОБ ВЫПОЛНЕНИЯ ПОИСКА 2014
  • Гулин Андрей Владимирович
  • Киричун Алексей Александрович
RU2597476C2
СПОСОБ И ПОИСКОВАЯ СИСТЕМА ПРЕДОСТАВЛЕНИЯ ПОИСКОВЫХ РЕЗУЛЬТАТОВ НА МНОЖЕСТВО КЛИЕНТСКИХ УСТРОЙСТВ 2015
  • Кураленок Игорь Евгеньевич
  • Агеев Михаил Сергеевич
RU2632423C2
СПОСОБ И СИСТЕМА ДЛЯ ФОРМИРОВАНИЯ ПОДСКАЗОК ПО РАСШИРЕНИЮ ПОИСКОВЫХ ЗАПРОСОВ В ПОИСКОВОЙ СИСТЕМЕ 2019
  • Шаграев Алексей Галимович
RU2744111C2
СПОСОБ И СИСТЕМА ДЛЯ СОЗДАНИЯ ОФФЛАЙН СТРАНИЦЫ РЕЗУЛЬТАТОВ ПОИСКА 2017
  • Халкечев Роман Владимирович
  • Плахов Андрей Григорьевич
  • Яников Иван Георгиевич
RU2666331C1
СПОСОБ И СЕРВЕР ДЛЯ ОБРАБОТКИ ПОИСКОВОГО ЗАПРОСА И МАШИНОЧИТАЕМЫЙ НОСИТЕЛЬ 2014
  • Филиппов Денис Сергеевич
  • Волков Евгений Михайлович
  • Мельников Илья Алексеевич
  • Ландо Татьяна Михайловна
RU2580431C2
РАНЖИРАТОР РЕЗУЛЬТАТОВ ПОИСКА 2014
  • Сердюков Павел Викторович
  • Устиновский Юрий Михайлович
  • Гусев Глеб Геннадьевич
RU2608886C2
СПОСОБ И СИСТЕМА ДЛЯ ОПРЕДЕЛЕНИЯ АНОМАЛЬНЫХ ПОСЕЩЕНИЙ ВЕБ-САЙТОВ 2019
  • Черкасов Дмитрий Александрович
  • Анисимов Александр Владимирович
  • Ганкин Григорий Михайлович
RU2775824C2
СПОСОБ ОБРАБОТКИ ПОИСКОВОГО ЗАПРОСА И СЕРВЕР 2014
  • Григорьева Светлана Александровна
  • Косарев Михаил Юрьевич
RU2586249C2
СПОСОБ ОБРАБОТКИ ПОИСКОВОГО ЗАПРОСА ПОЛЬЗОВАТЕЛЯ И СЕРВЕР, ИСПОЛЬЗУЕМЫЙ В НЕМ 2014
  • Григорьева Светлана Александровна
  • Косарев Михаил Юрьевич
RU2605001C2
СИСТЕМА И СПОСОБ РАНЖИРОВАНИЯ РЕЗУЛЬТАТОВ ПОИСКА 2015
  • Гусев Глеб Геннадьевич
  • Никулин Вадим Андреевич
  • Устиновский Юрий Михайлович
RU2632148C2

Иллюстрации к изобретению RU 2 598 789 C2

Реферат патента 2016 года СПОСОБ ПРЕДСТАВЛЕНИЯ РЕЗУЛЬТАТОВ ПОИСКА В СООТВЕТСТВИИ С ПОИСКОВЫМ ЗАПРОСОМ В СЕТИ ИНТЕРНЕТ

Изобретение относится к представлению результатов поиска в соответствии поисковым запросам в сети Интернет. Технический результат - эффективное представление результатов поиска в соответствии поисковым запросам в сети Интернет. Способ создания страницы результатов работы поисковой системы, который включает: получение от электронного устройства с помощью каналов связи через коммуникационную сеть поискового запроса, выполнение поиска в соответствии с поисковым запросом для получения результатов поиска, содержащих по меньшей мере одну веб-страницу, анализ по меньшей мере одной веб-страницы для обнаружения шаблона повторяющегося набора информации, извлечение с помощью шаблона повторяющегося набора информации, содержащего повторяющуюся комбинацию элементов по меньшей мере одного неповторяющегося сегмента данных из по меньшей мере одной веб-страницы, формирование страницы результатов работы поисковой системы, содержащей по меньшей мере один неповторяющийся сегмент данных, отправку управляющего сигнала на электронное устройство с помощью каналов связи через коммуникационную сеть, вызывающего отображение на дисплее электронного устройства пользователя с помощью пользовательского интерфейса вывода электронного устройства результатов поиска, содержащих ссылку для по меньшей мере одной веб-страницы и для по меньшей мере одной веб-страницы неповторяющегося сегмента данных в непосредственной близости от ссылки. 4 н. и 27 з.п. ф-лы, 9 ил.

Формула изобретения RU 2 598 789 C2

1. Способ создания страницы результатов работы поисковой системы, выполняемый на сервере, подключенном к электронному устройству пользователя с помощью каналов связи через коммуникационную сеть, который включает:
получение от электронного устройства с помощью каналов связи через коммуникационную сеть поискового запроса;
выполнение поиска в соответствии с поисковым запросом для получения результатов поиска, содержащих по меньшей мере одну веб-страницу;
анализ по меньшей мере одной веб-страницы для обнаружения шаблона повторяющегося набора информации;
извлечение с помощью шаблона повторяющегося набора информации, содержащего повторяющуюся комбинацию элементов, по меньшей мере одного неповторяющегося сегмента данных из по меньшей мере одной веб-страницы;
формирование страницы результатов работы поисковой системы, содержащей по меньшей мере один неповторяющийся сегмент данных;
отправку управляющего сигнала на электронное устройство с помощью каналов связи через коммуникационную сеть, вызывающего отображение на дисплее электронного устройства пользователя с помощью пользовательского интерфейса вывода электронного устройства (i) результатов поиска, содержащих ссылку для по меньшей мере одной веб-страницы и (ii) для по меньшей мере одной веб-страницы неповторяющегося сегмента данных в непосредственной близости от ссылки.

2. Способ по п. 1, отличающийся тем, что извлечение по меньшей мере одного неповторяющегося сегмента данных из по меньшей мере одной веб-страницы включает:
использование шаблона повторяющегося набора информации, извлечение множества неповторяющихся сегментов данных из по меньшей мере одной веб-страницы, при этом каждый из множества неповторяющихся сегментов данных по меньшей мере частично отличается от других сегментов из множества неповторяющихся сегментов данных.

3. Способ по п. 1, отличающийся тем, что повторяющийся набор информации содержит повторяющуюся комбинацию из кодирующих элементов, определяющих шаблон кодирования.

4. Способ по п. 3, дополнительно включающий сохранение репрезентативной информации структуры шаблона кодирования в устройстве для хранения данных, доступном на сервере.

5. Способ по п. 4, отличающийся тем, что:
анализ по меньшей мере одной веб-страницы с помощью сервера для обнаружения шаблона повторяющегося набора информации на по меньшей мере одной веб-странице и
сохранение репрезентативной информации структуры шаблона кодирования в устройстве для хранения данных, доступном на сервере, происходит до получения от электронного устройства с помощью каналов связи через коммуникационную сеть поискового запроса, и
формирование страницы результатов работы поисковой системы.

6. Способ по п. 1, отличающийся тем, что управляющий сигнал далее вызывает отображение на дисплее электронного устройства пользователя результатов поиска, в соответствии с которыми неповторяющийся сегмент комбинации данных заменяет по меньшей мере часть описания по меньшей мере одной веб-страницы.

7. Способ по п. 1, отличающийся тем, что формирование страницы результатов работы поисковой системы включает ранжирование результатов поиска с помощью алгоритма ранжирования, при этом алгоритм ранжирования присваивает более высокий рейтинг по меньшей мере одной веб-странице, связанной с обнаруженной повторяющейся комбинацией элементов.

8. Способ по п. 1, который дополнительно включает:
получение от электронного устройства запроса для фильтра с целью фильтрации неповторяющихся сегментов данных в соответствии с по меньшей мере частью неповторяющихся данных для по меньшей мере одной веб-страницы, имеющей обнаруженную повторяющуюся комбинацию элементов;
выполнение второго поиска в соответствии с поисковым запросом и фильтром для получения результатов второго поиска, содержащих только удовлетворяющие запросу для фильтра неповторяющиеся сегменты данных;
формирование второй страницы результатов работы поисковой системы с помощью сервера; и
отправку второй страницы результатов работы поисковой системы на электронное устройство.

9. Способ по п. 1, дополнительно включающий:
получение от электронного устройства запроса для фильтра с целью фильтрации неповторяющихся сегментов данных в соответствии с по меньшей мере частью неповторяющихся данных для множества веб-страниц, имеющих обнаруженную повторяющуюся комбинацию элементов, при том, что множество веб-страниц содержит общий тип неповторяющихся сегментов данных;
выполнение второго поиска в соответствии с поисковым запросом и фильтром для получения результатов второго поиска, содержащих только удовлетворяющие запросу для фильтра неповторяющиеся сегменты данных;
формирование второй страницы результатов работы поисковой системы с помощью сервера; и
отправку второй страницы результатов работы поисковой системы на электронное устройство.

10. Способ по любому из пп. 1-9, отличающийся тем, что неповторяющийся сегмент данных содержит информацию о ценах.

11. Способ по любому из пп. 1-9, отличающийся тем, что неповторяющийся сегмент данных содержит изображения.

12. Способ по любому из пп. 1-9, дополнительно включающий получение клиентского запроса на извлечение данных для неповторяющихся сегментов данных от электронного устройства с помощью каналов связи через коммуникационную сеть; и
отправку некоторых неповторяющихся сегментов данных из по меньшей мере одной веб-страницы на электронное устройство.

13. Способ создания страницы результатов работы поисковой системы для просмотра пользователем на дисплее электронного устройства, выполняющийся с помощью электронного устройства, связанного с сервером с помощью каналов связи через коммуникационную сеть, который включает:
получение поискового запроса от пользователя с помощью пользовательского интерфейса ввода электронного устройства;
отправку на сервер поискового запроса;
получение от сервера страницы результатов работы поисковой системы, содержащей результаты поиска в соответствии с поисковым запросом, содержащие по меньшей мере одну веб-страницу, имеющую шаблон повторяющегося набора информации, содержащий повторяющуюся комбинацию элементов, внутри этой веб-страницы и по меньшей мере один неповторяющийся сегмент данных, извлеченный с помощью шаблона повторяющегося набора информации; и
отображение на дисплее для пользователя с помощью пользовательского интерфейса вывода списка ссылок для по меньшей мере некоторых веб-страниц, являющихся частью результатов поиска, и для по меньшей мере одной веб-страницы, имеющей повторяющуюся комбинацию элементов, по меньшей мере одного неповторяющегося сегмента данных по меньшей мере одной веб-страницы в непосредственной близости от ссылки для по меньшей мере одной веб-страницы.

14. Способ по п. 13, отличающийся тем, что извлечение по меньшей мере одного неповторяющегося сегмента данных из по меньшей мере одной веб-страницы включает:
использование шаблона повторяющегося набора информации, извлечение множества неповторяющихся сегментов данных из по меньшей мере одной веб-страницы, при этом каждый из множества неповторяющихся сегментов данных по меньшей мере частично отличается от других сегментов из множества неповторяющихся сегментов данных.

15. Способ по п. 13, дополнительно включающий:
получение от пользователя с помощью пользовательского интерфейса ввода запроса для фильтра с целью фильтрации неповторяющихся сегментов данных в соответствии с по меньшей мере частью неповторяющихся данных;
отправку на сервер поискового запроса;
получение от сервера второй страницы результатов работы поисковой системы, содержащей неповторяющиеся сегменты данных, соответствующие запросу для фильтра; и
отображение на дисплее для пользователя с помощью пользовательского интерфейса вывода второй страницы результатов работы поисковой системы.

16. Способ по п. 15, отличающийся тем, что:
запрос для фильтра является применимым для множества веб-страниц, при этом каждая из множества веб-страниц содержит обнаруженную повторяющуюся комбинацию элементов и содержит неповторяющиеся сегменты данных, имеющие общий тип неповторяющихся данных;
отправка запроса для фильтра на основной сервер, на котором размещается одна из множества веб-страниц; и
получение от основного сервера, на котором размещается одна из множества веб-страниц, неповторяющихся сегментов данных, соответствующих запросу для фильтра.

17. Способ по любому из пп. 13-16, отличающийся тем, что неповторяющиеся данные содержат информацию о ценах.

18. Способ по любому из пп. 13-16, отличающийся тем, что неповторяющиеся данные содержат изображения.

19. Способ по любому из пп. 13-16, дополнительно включающий,
отправку клиентского запроса на извлечение данных для по меньшей мере
одного неповторяющегося сегмента данных на основной сервер, на котором размещена по меньшей мере одна веб-страница; и
получение от основного сервера, на котором размещена по меньшей мере одна веб-страница, по меньшей мере одного неповторяющегося сегмента данных из по меньшей мере одной веб-страницы.

20. Электронное устройство для представления результатов работы поисковой системы, которое содержит:
пользовательский интерфейс ввода для получения ввода пользователя;
пользовательский интерфейс вывода для обеспечения по меньшей мере одного визуального и звукового выводов данных для пользователя;
интерфейс сетевой связи для двусторонней связи по сети передачи данных и
процессор, соединенный с пользовательским интерфейсом ввода, пользовательским интерфейсом вывода и интерфейсом сетевой связи, при этом процессор выполнен с возможностью получать доступ к машиночитаемым командам, при выполнении которых процессором осуществляется:
получение поискового запроса от пользователя с помощью пользовательского интерфейса ввода,
отправка поискового запроса на сервер с помощью каналов связи через коммуникационную сеть,
получение от сервера страницы результатов работы поисковой системы, содержащей результаты поиска в соответствии с поисковым запросом, при этом результаты поиска содержат по меньшей мере одну веб-страницу, имеющую шаблон повторяющегося набора информации, содержащий повторяющуюся комбинацию элементов, в этой веб-странице и по меньшей мере один неповторяющийся сегмент данных, извлеченный с помощью шаблона повторяющегося набора информации; и
отображение на дисплее для пользователя с помощью пользовательского интерфейса вывода списка ссылок для по меньшей мере некоторых веб-страниц, являющихся частью результатов поиска, и для по меньшей мере одной веб-страницы, имеющей повторяющуюся комбинацию элементов, по меньшей мере одного неповторяющегося сегмента данных по меньшей мере одной веб-страницы в непосредственной близости от ссылки для по меньшей мере одной веб-страницы.

21. Электронное устройство по п. 20, в котором процессор дополнительно выполнен с возможностью:
получения от пользователя с помощью пользовательского интерфейса ввода запроса для фильтра с целью фильтрации неповторяющихся сегментов данных в соответствии с по меньшей мере частью неповторяющихся данных;
отправки на сервер запроса для фильтра;
получения от сервера второй страницы результатов работы поисковой системы, содержащей неповторяющиеся сегменты данных, соответствующие запросу для фильтра; и
отображения на дисплее для пользователя с помощью пользовательского интерфейса вывода второй страницы результатов работы поисковой системы.

22. Электронное устройство по п. 21, отличающееся тем, что запрос для фильтра является применительным для множества веб-страниц, при этом каждая из множества веб-страниц содержит обнаруженную повторяющуюся комбинацию элементов и содержит неповторяющиеся сегменты данных, имеющие общий тип неповторяющихся данных, причем процессор дополнительно выполнен с возможностью:
отправки запроса для фильтра на основной сервер, на котором размещается одна из множества веб-страниц; и
получения от основного сервера, на котором размещается одна из множества веб-страниц, неповторяющихся сегментов данных, соответствующих запросу для фильтра.

23. Электронное устройство по любому из пп. 20-22, в котором процессор дополнительно выполнен с возможностью:
отправки клиентского запроса на извлечение данных для по меньшей мере одного неповторяющегося сегмента данных на основной сервер, на котором размещена по меньшей мере одна веб-страница; и
получения от основного сервера, на котором размещена по меньшей мере одна веб-страница, по меньшей мере одного неповторяющегося сегмента данных из по меньшей мере одной веб-страницы.

24. Сервер для представления результатов работы поисковой системы, содержащий:
интерфейс сетевой связи для обмена данными с электронным устройством с помощью каналов связи через коммуникационную сеть; и
процессор, функционально соединенный с интерфейсом связи, выполненный с возможностью:
получать от электронного устройства с помощью каналов связи через коммуникационную сеть поисковый запрос;
выполнять поиск в соответствии с поисковым запросом для получения результатов поиска, при этом результаты поиска содержат по меньшей мере одну веб-страницу;
анализировать по меньшей мере одну веб-страницу для обнаружения шаблона повторяющегося набора информации;
извлекать с помощью шаблона повторяющегося набора информации, содержащего повторяющуюся комбинацию элементов, по меньшей мере один неповторяющийся сегмент данных из по меньшей мере одной веб-страницы;
формировать страницы результатов работы поисковой системы, при этом страница результатов работы поисковой системы содержит по меньшей мере один неповторяющийся сегмент данных;
отправлять управляющий сигнал на электронное устройство с помощью каналов связи через коммуникационную сеть, при этом управляющий сигнал заставляет электронное устройство выполнять; и
отображать на дисплее для пользователя с помощью пользовательского интерфейса вывода электронного устройства (i) результаты поиска, содержащие ссылку для по меньшей мере одной веб-страницы и (ii) для по меньшей мере одной веб-страницы неповторяющийся сегмент данных в непосредственной близости от ссылки.

25. Сервер по п. 24, отличающийся тем, что повторяющийся набор информации содержит повторяющуюся комбинацию из кодирующих элементов, определяющих шаблон кодирования.

26. Сервер по п. 25, в котором процессор дополнительно выполнен с возможностью хранения репрезентативной информации структуры шаблона кодирования в устройстве для хранения данных, доступном на сервере.

27. Сервер по п. 26, в котором процессор дополнительно сконфигурирован таким образом, чтобы выполнять:
анализирование по меньшей мере одной веб-страницы с помощью сервера для обнаружения шаблона повторяющегося набора информации в по меньшей мере одной веб-странице, и
сохранение репрезентативной информации структуры шаблона кодирования в устройстве для хранения данных, доступном на сервере, до получения от электронного устройства с помощью каналов связи через коммуникационную сеть поискового запроса и
формирование страницы результатов работы поисковой системы.

28. Сервер по п. 24, отличающийся тем, что для формирования страницы результатов работы поисковой системы процессор выполнен с возможностью ранжирования результатов поиска с помощью алгоритма ранжирования, при этом алгоритм ранжирования присваивает более высокий рейтинг по меньшей мере одной веб-странице, связанной с обнаруженной повторяющейся комбинацией элементов.

29. Сервер по п. 24, в котором неповторяющийся сегмент данных является неповторяющимися сегментами данных, причем процессор дополнительно выполнен с возможностью:
получения от электронного устройства запроса для фильтра с целью фильтрации неповторяющихся сегментов данных в соответствии с по меньшей мере частью неповторяющихся данных для по меньшей мере одной веб-страницы, имеющей обнаруженную повторяющуюся комбинацию элементов;
выполнения второго поиска в соответствии с поисковым запросом и фильтром для получения результатов второго поиска, содержащих только удовлетворяющие запросу для фильтра неповторяющиеся сегменты данных;
формирования второй страницы результатов работы поисковой системы с помощью сервера; и
отправки второй страницы результатов работы поисковой системы на электронное устройство.

30. Сервер по п. 24, в котором процессор дополнительно выполнен с возможностью:
получения от электронного устройства запроса для фильтра с целью фильтрации неповторяющихся сегментов данных в соответствии с по меньшей мере частью неповторяющихся данных для множества веб-страниц, имеющих обнаруженную повторяющуюся комбинацию элементов, при том, что множество веб-страниц содержит общий тип неповторяющихся сегментов данных;
выполнения второго поиска в соответствии с поисковым запросом и фильтром для получения результатов второго поиска, содержащих только удовлетворяющие запросу для фильтра неповторяющиеся сегменты данных;
формирования второй страницы результатов работы поисковой системы с помощью сервера; и
отправки второй страницы результатов работы поисковой системы на электронное устройство.

31. Сервер по любому из пп. 24-30, в котором процессор дополнительно выполнен с возможностью:
получения клиентского запроса на извлечение данных для неповторяющихся сегментов данных от электронного устройства с помощью каналов связи через коммуникационную сеть и
отправки некоторых неповторяющихся сегментов данных из по меньшей мере одной веб-страницы на электронное устройство.

Документы, цитированные в отчете о поиске Патент 2016 года RU2598789C2

Колосоуборка 1923
  • Беляков И.Д.
SU2009A1
М.С
АГЕЕВ и др
"Извлечение значимой информации из web-страниц для задач информационного поиска", опубл
Способ обработки целлюлозных материалов, с целью тонкого измельчения или переведения в коллоидальный раствор 1923
  • Петров Г.С.
SU2005A1
Способ изготовления электрических сопротивлений посредством осаждения слоя проводника на поверхности изолятора 1921
  • Андреев Н.Н.
  • Ландсберг Г.С.
SU19A1

RU 2 598 789 C2

Авторы

Воронцов Юрий Витальевич

Иванов Денис Олегович

Даты

2016-09-27Публикация

2014-06-30Подача