Способ интеллектуального информационного поиска и предоставления контекстуальной информации в распределенных хранилищах данных Российский патент 2020 года по МПК G06F16/33 

Описание патента на изобретение RU2727076C1

Изобретение относится к области информационного поиска, реализуемых в фактографических информационно-поисковых системах, позволяющим осуществлять поиск в распределенных хранилищах данных и отображать информацию, относящуюся к документу, в котором отражена суть задачи, и может быть использовано в информационно-управляющих системах.

Известны способы предоставления информации, реализуемые посредством систем поиска и отображения информации, таких как Google (www.google.com) или Яндекс (www.yandex.ru), которые обеспечивают для пользователя возможность получения информации по запросу. В результате реализации таких способов предоставляются результаты информационного поиска в виде контекстуальной информации или ранжированного списка ссылок на веб-страницы (документы), касающейся запроса, сформированного пользователем.

Недостатком таких способов является их низкая пертинентность (соответствие информационной потребности пользователя результатам выдачи информационно-поисковой системы), что связано с отсутствием или недостаточным объемом информации о пользователе и его информационных потребностях для решаемой задачи, а также низкая оперативность информационного поиска.

Известен способ кластеризации результатов поиска в зависимости от семантики (МПК G06F 17/30, G06F 17/27, патент на изобретение RU 2564629, дата публикации 10.10.2015 г., бюл. №28), заключающийся в получении запроса на поиск, включающий группу слов, после чего отображают список лексических значений для упомянутой группы слов. Пользователь выбирает лексические значения из списка, после чего проводится семантико-синтаксический анализ найденных фрагментов с определением лексических значений. Затем распределяют найденные фрагменты по кластерам лексических значений, а пользователю показывают результаты поиска, релевантные выбранному лексическому значению.

Недостатками этого способа являются низкая точность информационного поиска, и как следствие его низкая оперативность.

Известен способ, который реализуется системой интерактивного поиска и отображения информации (МПК G06F 17/30, патент на изобретение RU2576468, дата публикации 10.03.2016 г., бюл. №7), которая содержит сервер, включающий устройство хранения данных с последовательными запросами пользователей, устройство кэширования, обеспечивающее отображение результатов от разных запросов на одной странице, устройство обмена информацией с пользователем, блок выявления схожих последовательностей, базу данных, производные базы данных, устройство приема и обработки информации. База данных выполнена с возможностью заполнения посредством терминала оператора и фильтрации нежелательного контента. При этом блок выявления схожих последовательностей выполнен с возможностью создания производной базы данных, дополняющей исходный запрос и содержащей информацию по смежным тематикам, относящимся к запросу. Результаты выявления схожих последовательностей запросов отображаются на той же странице, на которой был произведен запрос. Пользователю обеспечивается возможность выбора дополнительных областей поиска, соответствующих тематикам. Производные базы данных представляют вероятный вариант развития поиска сопутствующего товара или услуги.

Недостатками этого способа являются низкая точность результатов поиска и его низкая оперативность.

Наиболее близким к предложенному является способ, описанный в изобретении «Способ и система предоставления контекстуальной информации» (патент на изобретение RU 2632126, дата публикации 02.10.2017 г., МПК G06F 17/30), заключающийся в предоставлении пользователю контекстуальной информации, относящейся к документу, отображенному на клиентском электронном устройстве за счет выполнения процессором электронного устройства способа, который включает в себя этапы: получение текстового документа, анализ текста документа для идентификации множества объектов в тексте, каждый объект из множества объектов включает в себя по меньшей мере одно слово; для каждого из множества объектов: осуществляется идентификация соответствующего значения, определяется соответствующее наиболее вероятное значение для каждого из множества объектов. Определяется, является ли данный объект значимым для документа, осуществляется получение результата контекстуального поиска, относящегося к наиболее вероятному значению данного объекта, причем, результат контекстуального поиска включает в себя контекстуальную информацию для данного объекта, осуществляется модификация данного объекта, осуществляется связывание результата контекстуального поиска с модифицированным данным объектом в документе, и при выборе пользователем на клиентском электронном устройстве модифицированного данного объекта, осуществляется отображение на клиентском электронном устройстве результата контекстуального поиска.

Недостатком данного способа является низкая точность результатов контекстуального поиска относительно реальных информационных потребностей и решаемой пользователем задачи, а также низкая оперативность информационного поиска.

Технической задачей изобретения является повышение полноты, точности и оперативности информационного поиска.

Технический результат изобретения состоит в сокращении времени поиска пертинентной информации и повышении быстродействия информационного поиска.

Это достигается способом интеллектуального информационного поиска и предоставления контекстуальной информации в распределенных хранилищах данных, заключающемся в том, что получают и анализируют текстовый документ, в котором отражена суть задачи, автоматически формируют поисковый запрос, осуществляют информационный поиск и получают его результат в виде информационно-справочного документа, при этом с помощью базы знаний, созданной и модифицированной при выполнении предыдущих операций поиска, после анализа текстового документа, в котором отражена суть задачи, из множества объектов текстового документа идентифицируют объект типа «задача», которую необходимо решить, ограничения, накладываемые на ее выполнение, атрибуты, а также экземпляры объектов и их атрибуты, семантически взаимосвязанные с задачей, для каждого идентифицированного объекта, атрибута, экземпляра объекта и его атрибута из множества объектов через базу знаний осуществляют определение объектов, их атрибутов, экземпляров объектов, а также семантически взаимосвязанных с ними объектов, их атрибутов, экземпляров объектов и их атрибутов, формируют в виде поискового запроса информацию об объектах, их атрибутах, экземплярах и ограничениях, а в ответ на сформированный поисковый запрос осуществляют информационный поиск, оценку качества, отождествление и агрегирование результатов поиска, оценку необходимости внесения изменений в базу знаний и инициации процесса модификации базы знаний, получение результата информационного поиска в виде информационно-справочного документа и отображение его на клиентском электронном устройстве.

Сущность изобретения поясняется чертежами, где на фиг. 1 представлена обобщенная структурная схема системы, реализующей способ интеллектуального информационного поиска и предоставления контекстуальной информации в распределенных хранилищах данных, на фиг. 2 представлена блок-схема системы, на фиг. 3 представлен способ интеллектуального информационного поиска и предоставления контекстуальной информации в распределенных хранилищах данных.

Способ интеллектуального информационного поиска и предоставления контекстуальной информации в распределенных хранилищах данных осуществляется следующим образом.

Способ включает в себя получение текстового документа, в котором отражена суть задачи, его анализ.

На основе результатов анализа текстового документа, заключающихся в идентификации множества объектов, осуществляется идентификация объекта типа «задача», которую необходимо решить пользователю, ограничения ее выполнения, например, пространственные и временные, экземпляров объектов и их атрибутов, семантически взаимосвязанных с задачей. Для каждого из этих объектов с помощью базы знаний производится определение объектов, их атрибутов, экземпляров объектов, а также семантически взаимосвязанных с ними объектов, их атрибутов, экземпляров объектов и их атрибутов. В отличие от аналога, база знаний выполнена на основе композиционной онтологической модели, которая представляет собой композицию из двух взаимосвязанных и согласованных онтологических моделей: задач и функционально-ориентированных информационных ресурсов под управлением интеллектуальных агентов, представляющих собой информационный профиль пользователя. Информация об объектах, их атрибутах, экземплярах и ограничениях, например, пространственных и временных, формируется в виде поискового запроса, на основе которого осуществляется информационный поиск в удаленных хранилищах данных, оценка качества найденной информации, отождествление и агрегирование результатов поиска. Полученные результаты информационного поиска отображаются на клиентском электронном устройстве в виде информационно-справочного документа.

Онтологические модели: задач и функционально-ориентированных информационных ресурсов, содержат информацию об объектах информационного поиска, имеющих характеризующие их свойства, представленные в виде атрибутов объектов, при этом объекты и атрибуты онтологических моделей объединены между собой семантическими отношениями: «часть-целое», «обуславливает», «влияет» и «соответствует». В онтологической модели задач классы и подклассы представляют собой задачи и подзадачи, решаемые пользователем, а атрибуты данных классов - информацию, необходимую для решения данных задач. Онтологическая модель функционально-ориентированных информационных ресурсов описывает предметную область, в которой пользователь осуществляет информационный поиск для решения задач, в соответствии с онтологической моделью задач.

При решении задач информационного поиска на основе онтологической модели задач формируется первоначальный поисковый запрос, с учетом задачи, суть которой содержалась в документе полученным пользователем. После чего на основе онтологической модели функционально-ориентированных информационных ресурсов поисковый запрос расширяется, за счет отношений «соответствия» между классами, подклассами и атрибутами композиционной онтологической модели. Таким образом, представление базы знаний в виде композиционной онтологической модели позволяет, формализовать информационную потребность пользователя, относительно решаемой им задачи на языке информационно-поисковой системы и расширить предметную область информационного поиска.

Если в результате информационного поиска будет идентифицирован хотя бы один объект, не соответствующий множеству объектов базы знаний, то процессором инициируется процесс модификации базы знаний, включающий в себя сопоставление атрибутов найденного объекта с атрибутами объектов из базы знаний и принятие решения о необходимости изменения существующих объектов или создания нового объекта. Если в результате информационного поиска будет идентифицирован хотя бы один атрибут, не соответствующий множеству атрибутов базы знаний, то процессором инициируется процесс модификации базы знаний, включающий в себя сопоставление найденного атрибута с атрибутами объектов базы знаний и принятие решения о необходимости добавлении нового атрибута (атрибутов), изменения или исключения атрибута (атрибутов) базы знаний.

Способ интеллектуального информационного поиска и предоставления контекстуальной информации в распределенных хранилищах данных может быть осуществлен с помощью системы 1 (см. фиг. 1). Система 1 включает в себя электронное устройство 2, сервер 3 и сеть 4 передачи данных. Электронное устройство 2 обменивается данными с сервером 3 через сеть 4 передачи данных. Система 1 может включать в себя более одного электронного устройства 2 и более одного сервера 3.

Сеть 4 передачи данных может быть представлена в виде глобальной, локальной, частной сети передачи данных. В сети 4 передачи данных обмен данными возникает по линиям передачи данных разного типа, например, по беспроводным или проводным линиям.

Электронное устройство 2 может быть выполнено как настольный компьютер, ноутбук, нетбук, мобильный телефон, смартфон, планшет и так далее.

Электронное устройство 2 включает в себя: процессор 5, устройство хранения 6 (память), содержащее базу знаний на основе композиционной онтологической модели, интерфейс 7 сетевой передачи данных (например, модем, сетевую карту и так далее) для двустороннего обмена данными по сети 4 передачи данных, пользовательское устройство 8 вывода в виде экрана (дисплея). Процессор выполнен с возможностью исполнять различные способы информационного поиска и предоставления контекстуальной информации в хранилищах данных и соединен с пользовательским устройством 8 вывода, интерфейсом сетевой передачи данных и устройством хранения 6, которое хранит машиночитаемые инструкции, инициирующие, при их исполнении, выполнение процессором 5 предлагаемого способа.

С сетью 4 передачи данных также соединен сервер 3, который может представлять собой обычный компьютерный сервер. Сервер 3 может быть реализован на любом подходящем аппаратном и/или прикладном программном, и/или системном программном обеспечении или их комбинации. В представленном примере осуществления настоящего технического решения сервер 3 может быть одиночным. Функциональность сервера 3 может быть также разделена и может выполняться с помощью нескольких серверов.

Сервер 3 включает в себя, по меньшей мере, один компьютерный процессор 9, аналогичный процессору 5 электронного устройства 2, соединенный с устройством хранения 10, аналогичным устройству 6 электронного устройства 2, и с интерфейсом 11 сетевой передачи данных, аналогичным интерфейсу 7 сетевой передачи данных электронного устройства 2, который обладает возможностью обмениваться данными с электронным устройством 2 и другими устройствами, соединенными с сетью 4 передачи данных. Процессор 9 сервера 3 настроен и реализован с возможностью выполнять способ интеллектуального информационного поиска и предоставления контекстуальной информации в распределенных хранилищах данных.

На фиг. 3 представлен способ интеллектуального информационного поиска и предоставления контекстуальной информации в распределенных хранилищах данных, относительно документа, в котором отражена суть задачи.

На этапе 12 с помощью интерфейса передачи данных 7 электронного устройства 2 осуществляется получение текстового документа, в котором отражена суть задачи и при необходимости отображение его экране 8 электронного устройства 2. После чего на этапе 13 процессором 5 с использованием устройства хранения 6, содержащего базу знаний, созданную на основе композиционной онтологической модели процесса принятия решения, осуществляется анализ полученного документа и идентификация объекта типа «задача», ограничений, накладываемых на ее выполнение, атрибутов, а также экземпляров объектов и их атрибутов, семантически взаимосвязанных с задачей. На этапе 14 процессором 5 с использованием устройства хранения 6 с помощью базы знаний осуществляется определение объектов, их атрибутов, экземпляров объектов, а также семантически взаимосвязанных с ними объектов, их атрибутов, экземпляров объектов и их атрибутов. Далее процессором 5 осуществляется формирование поискового запроса 15, представленного в виде множества объектов, атрибутов и экземпляров, полученных на этапах 13 и 14, а также ограничений, накладываемых на выполнение задачи, и с помощью интерфейса передачи данных 7 через сеть 4 отправка поискового запроса на сервер 3.

На этапах 16 и 17, после получения поискового запроса интерфейсом передачи данных 11, процессор 9 сервера 3, осуществляет: информационный поиск, заключающийся в отборе информации из удаленных хранилищ данных, относительно поискового запроса; оценку качества, отождествление и агрегирование результатов поиска в виде информационно-справочного документа.

На этапе 18 процессором 9 определяется необходимость внесения изменений в базу знаний и инициализации модификации базы знаний, хранящейся на устройствах хранения 6 и 10. Если в результате информационного поиска будет найден хотя бы один объект не соответствующий множеству объектов базы знаний, то процессором 9 инициируется процесс модификации базы знаний, включающий в себя сопоставление атрибутов найденного объекта с атрибутами объектов базы знаний и принятие решения о необходимости изменения существующих объектов или создания нового объекта. Если в результате информационного поиска будет идентифицирован хотя бы один атрибут не соответствующий множеству атрибутов базы знаний, то процессором 9 инициируется процесс модификации базы знаний, включающий в себя сопоставление найденного атрибута с атрибутами объектов базы знаний и принятие решения о необходимости добавлении нового атрибута (атрибутов), изменения или исключения атрибута (атрибутов) базы знаний.

На этапе 19 процессором 9, через сеть 4 интерфейс передачи данных 11 отправляет результаты поиска информации и информацию о внесении изменений в базу знаний, которые принимаются интерфейсом передачи данных 7, отображаются на экране 8 и сохраняются на устройстве хранения 6 электронного устройства 2.

Способ, за исключением этапа 19, может быть полностью выполнен на сервере 3 или отдельные этапы 12, 13, 14, 15, 19 могут быть выполнены на электронном устройстве 2, а остальные этапы - на сервере 3.

Повышение полноты, точности и оперативности информационного поиска достигается тем, что автоматическое формирование поискового запроса на языке базы знаний (языке информационно-поисковой системы) исключает многозначность, наличие ошибок и необходимость многократного уточнения поискового запроса; сокращается время на создание множества поисковых запросов относительно объектов, идентифицированных в документе, в котором отражена суть задачи и время на анализ результатов информационного поиска пользователем; полно и точно описывается информационная потребность пользователя, достигаемая с помощью представления базы знаний информационно-поисковой системы в виде композиционной онтологической модели, в которой в отличие от традиционных онтологических моделей, осуществляется декомпозиции процесса принятия решения на функциональную и информационную составляющую и их последующее объединение.

Применение способа интеллектуального информационного поиска и предоставления контекстуальной информации в распределенных хранилищах данных позволяет повысить полноту, оперативность и точность информационного поиска, обработки и анализа больших объемов информации.

Похожие патенты RU2727076C1

название год авторы номер документа
ИСЧЕРПЫВАЮЩАЯ АВТОМАТИЧЕСКАЯ ОБРАБОТКА ТЕКСТОВОЙ ИНФОРМАЦИИ 2014
  • Даниэлян Татьяна Владимировна
  • Старостин Анатолий Сергеевич
  • Зуев Константин Алексеевич
  • Анисимович Константин Владимирович
  • Селегей Владимир Павлович
RU2662699C2
СЕМАНТИЧЕСКАЯ НАВИГАЦИЯ ПО ВЕБ-КОНТЕНТУ И КОЛЛЕКЦИЯМ ДОКУМЕНТОВ 2007
  • Клинцов Виктор
  • Хорошевский Владимир Федорович
RU2442214C2
СПОСОБ И СИСТЕМА ДЛЯ ХРАНЕНИЯ И ПОИСКА ИНФОРМАЦИИ, ИЗВЛЕКАЕМОЙ ИЗ ТЕКСТОВЫХ ДОКУМЕНТОВ 2015
  • Мацкевич Степан Евгеньевич
RU2605077C2
СПОСОБ ПРЕОБРАЗОВАНИЯ ДАННЫХ ГЕОИНФОРМАЦИОННЫХ СИСТЕМ (ГИС), СИСТЕМА ДЛЯ ЕГО РЕАЛИЗАЦИИ И СПОСОБ ПОИСКА ПО СФОРМИРОВАННОЙ ЭТИМ СПОСОБОМ БАЗЕ ДАННЫХ 2017
  • Сысоев Александр Вадимович
RU2669143C1
СИСТЕМА И СПОСОБ ПОИСКА ДАННЫХ В БАЗЕ ДАННЫХ ГРАФОВ 2015
  • Волынский Петр Евгеньевич
  • Цыпляев Максим Викторович
RU2707708C2
Способ и система предоставления контекстуальной информации 2016
  • Сапожников Андрей Вениаминович
  • Чеканин Антон Игоревич
  • Антонов Егор Сергеевич
RU2632126C1
СПОСОБ И СИСТЕМА СЕМАНТИЧЕСКОЙ ОБРАБОТКИ ТЕКСТОВЫХ ДОКУМЕНТОВ 2016
  • Мительков Дмитрий Владимирович
  • Новиков Андрей Юрьевич
  • Сатин Борис Борисович
RU2630427C2
ПОДДЕРЖАНИЕ КОНТЕКСТНОЙ ИНФОРМАЦИИ МЕЖДУ ПОЛЬЗОВАТЕЛЬСКИМИ ВЗАИМОДЕЙСТВИЯМИ С ГОЛОСОВЫМ ПОМОЩНИКОМ 2015
  • Грубер Томас Роберт
  • Чейер Адам Джон
  • Киттлос Даг
  • Гудззони Дидье Рене
  • Бригем Кристофер Дин
RU2653250C2
Способ обработки поисковых запросов для нескольких реляционных баз данных произвольной структуры 2019
  • Большаков Дмитрий Николаевич
  • Кузин Роман Валерьевич
  • Гаврилова Ольга Анатольевна
  • Ховрич Мария Александровна
RU2730241C1
СИСТЕМА И СПОСОБ СОЗДАНИЯ И ИСПОЛЬЗОВАНИЯ ПОЛЬЗОВАТЕЛЬСКИХ ОНТОЛОГИЧЕСКИХ МОДЕЛЕЙ ДЛЯ ОБРАБОТКИ ПОЛЬЗОВАТЕЛЬСКОГО ТЕКСТА НА ЕСТЕСТВЕННОМ ЯЗЫКЕ 2015
  • Булгаков Илья Александрович
  • Яковлев Егор Николаевич
  • Старостин Анатолий Сергеевич
RU2596599C2

Иллюстрации к изобретению RU 2 727 076 C1

Реферат патента 2020 года Способ интеллектуального информационного поиска и предоставления контекстуальной информации в распределенных хранилищах данных

Изобретение относится к области вычислительной техники. Технический результат заключается в сокращении времени поиска пертинентной информации и повышении быстродействия информационного поиска. Раскрыт способ интеллектуального информационного поиска и предоставления контекстуальной информации в распределенных хранилищах данных, заключающийся в том, что получают и анализируют текстовый документ, в котором отражена суть задачи, автоматически формируют поисковый запрос, осуществляют информационный поиск и получают его результат в виде информационно-справочного документа, при этом с помощью базы знаний, созданной и модифицированной при выполнении предыдущих операций поиска, после анализа текстового документа, в котором отражена суть задачи, из множества объектов текстового документа идентифицируют объект типа «задача», которую необходимо решить, ограничения, накладываемые на ее выполнение, атрибуты, а также экземпляры объектов и их атрибуты, семантически взаимосвязанные с задачей, для каждого идентифицированного объекта, атрибута, экземпляра объекта и его атрибута, из множества объектов через базу знаний осуществляют определение объектов, их атрибутов, экземпляров объектов, а также семантически взаимосвязанных с ними объектов, их атрибутов, экземпляров объектов и их атрибутов, формируют в виде поискового запроса информацию об объектах, их атрибутах, экземплярах и ограничениях, а в ответ на сформированный поисковый запрос осуществляют информационный поиск, оценку качества, отождествление и агрегирование результатов поиска, оценку необходимости внесения изменений в базу знаний и инициации процесса модификации базы знаний, получение результата информационного поиска в виде информационно-справочного документа и отображение его на клиентском электронном устройстве. 3 ил.

Формула изобретения RU 2 727 076 C1

Способ интеллектуального информационного поиска и предоставления контекстуальной информации в распределенных хранилищах данных, заключающийся в том, что получают и анализируют текстовый документ, в котором отражена суть задачи, автоматически формируют поисковый запрос, осуществляют информационный поиск и получают его результат в виде информационно-справочного документа, отличающийся тем, что с помощью базы знаний, созданной и модифицированной при выполнении предыдущих операций поиска, после анализа текстового документа, в котором отражена суть задачи, из множества объектов текстового документа идентифицируют объект типа «задача», которую необходимо решить, ограничения, накладываемые на ее выполнение, атрибуты, а также экземпляры объектов и их атрибуты, семантически взаимосвязанные с задачей, для каждого идентифицированного объекта, атрибута, экземпляра объекта и его атрибута, из множества объектов через базу знаний осуществляют определение объектов, их атрибутов, экземпляров объектов, а также семантически взаимосвязанных с ними объектов, их атрибутов, экземпляров объектов и их атрибутов, формируют в виде поискового запроса информацию об объектах, их атрибутах, экземплярах и ограничениях, а в ответ на сформированный поисковый запрос осуществляют информационный поиск, оценку качества, отождествление и агрегирование результатов поиска, оценку необходимости внесения изменений в базу знаний и инициации процесса модификации базы знаний, получение результата информационного поиска в виде информационно-справочного документа и отображение его на клиентском электронном устройстве.

Документы, цитированные в отчете о поиске Патент 2020 года RU2727076C1

Способ и система предоставления контекстуальной информации 2016
  • Сапожников Андрей Вениаминович
  • Чеканин Антон Игоревич
  • Антонов Егор Сергеевич
RU2632126C1
СПОСОБ КЛАСТЕРИЗАЦИИ РЕЗУЛЬТАТОВ ПОИСКА В ЗАВИСИМОСТИ ОТ СЕМАНТИКИ 2014
  • Андреев Сергей Геннадьевич
RU2564629C1
US 10152535 B1, 11.12.2018
Станок для изготовления деревянных ниточных катушек из цилиндрических, снабженных осевым отверстием, заготовок 1923
  • Григорьев П.Н.
SU2008A1

RU 2 727 076 C1

Авторы

Борисов Вадим Владимирович

Котов Дмитрий Васильевич

Молявко Александр Александрович

Даты

2020-07-17Публикация

2019-12-18Подача