АВТОМАТИЗИРОВАННЫЙ СПОСОБ ПОИСКА ИНФОРМАЦИИ В КОМПЬЮТЕРНЫХ СЕТЯХ ПОСРЕДСТВОМ ПОСТРОЕНИЯ И/ИЛИ ПРЕОБРАЗОВАНИЯ ЭКВИВАЛЕНТНЫХ ИНФОРМАЦИИ ПОСЛЕДОВАТЕЛЬНОСТЕЙ КОМПЬЮТЕРНЫХ КОДОВ И АВТОМАТИЗИРОВАННЫЙ КОМПЛЕКС ДЛЯ ЕГО ОСУЩЕСТВЛЕНИЯ Российский патент 2009 года по МПК G06F17/30 

Описание патента на изобретение RU2370812C1

Изобретение относится к вычислительной технике и может быть использовано, например, в качестве автоматизированного способа поиска информации в компьютерных сетях посредством построения и/или преобразования эквивалентных информации последовательностей компьютерных кодов и автоматизированного комплекса для его осуществления.

Известны способы поиска информации в компьютерных сетях, включающие в себя: составление для каждого объекта поиска ограниченного набора информативных слов и определение адреса объекта с использованием универсальной классификации [патент РФ 2107942], использование индексных образов [заявка на патент РФ 98116879/09 А], этапы связывания компьютера с Интернетом [заявка на патент РФ 2001102321/09 А], оснащение пользовательского интерфейса расширением поисковых запросов [заявка на патент РФ 2006106176 А], использование поисковых указателей, представленных как минимум одним глаголом [заявка на патент РФ 2005110791 А], использование инвертора, заменяющего ключевые слова-глаголы, выражающие товарно-денежные отношения, на антонимы [заявка на патент РФ 2005110792 А].

Несовершенство известных способов заключается в недостаточно качественном автоматическом ранжировании предоставляемой пользователю информации при больших объемах представляющей интерес для пользователя информации.

Решаемой изобретением задачей является совершенствование способов поиска информации путем реранжирования с достижением технического результата в виде улучшения качества ранжирования предоставляемой пользователю информации, характеризуемого увеличением числового показателя адекватности рангов подмножеств информации показателям интересов пользователя к ним. Указанный технический результат достигается также с помощью автоматизированного комплекса для осуществления предложенного способа. Их использование при поиске и отображении информации, передаваемой в компьютерных сетях или другими способами, позволяет улучшить качество ранжирования предоставляемой пользователю информации.

Для удобства и однозначного понимания целесообразно привести расшифровки и определения используемых далее обозначений, символов и/или терминов.

Информация - совокупность всевозможных данных с возможностью преобразования и разбиения их на минимальные элементы, например да и/или нет.

Множество/подмножество информации - разновидности массивов информации.

Компьютерный код - электромагнитный сигнал, передаваемый по физическим каналам связи и/или сохраняемый на материальных носителях, эквивалентный минимальному элементу информации.

Последовательность и/или совокупность компьютерных кодов - набор электромагнитных сигналов, передаваемых по физическим каналам связи и/или сохраняемых на материальных носителях и эквивалентных массивам информации различных объемов.

Эквивалентность последовательности и/или совокупности компьютерных кодов массиву информации - их взаимно однозначное отображение, то есть техническая возможность их взаимно однозначного преобразования посредством соответствующего устройства.

Множество/подмножество последовательности компьютерных кодов - разновидности массивов последовательности компьютерных кодов с соответствующим им определенным ее объемом.

Объем множества/подмножества последовательности компьютерных кодов - количество компьютерных кодов, представляющих это множество/подмножество последовательности компьютерных кодов и/или эквивалентных ему, обычно измеряется в байтах.

Объем множества/подмножества информации - объем множества/подмножества последовательности компьютерных кодов, эквивалентных этому множеству/подмножеству информации.

Процесс преобразования последовательности компьютерных кодов - процесс замены ее подмножеств на другие подмножества.

Внутреннее хранилище информации - входящее в реализующую способ систему устройство или часть устройства, осуществляющие сохранение и выдачу по запросу информации в виде последовательностей эквивалентных ей компьютерных кодов.

Процесс анализа последовательности компьютерных кодов - процесс выделения из всего множества последовательности компьютерных кодов одного или нескольких подмножеств, обладающих представляющими интерес для обработки и/или использования свойствами, а также процесс вычисления различных характеристик множества последовательности компьютерных кодов и его подмножеств.

В дальнейшем, если это не оговорено особо, под операциями заявленного способа с информацией понимаются операции с последовательностями эквивалентных ей компьютерных кодов.

Сортировка подмножеств информации - процесс их перегруппировки в требуемом порядке.

Пользователь - автоматизированная система или человек, ориентированные использовать информацию, в том числе в виде эквивалентной ей совокупности компьютерных кодов, запрашивающие ее, анализирующие ее, и, возможно, производящие с ней какие-либо действия.

Интерес пользователя к подмножеству информации, в том числе в виде эквивалентной ей совокупности компьютерных кодов, - характеризуемая экспериментальным коэффициентом L вероятность того, что пользователь будет ориентирован после ознакомления с этим подмножеством произвести с ним какое-либо действие (например, сохранение, подачу запроса на получение дополнительной информации или переход к просмотру информации, место расположения которой в сети - ссылка - указано в данном подмножестве информации).

Интерес пользователя к множеству информации, в том числе в виде эквивалентной ей совокупности компьютерных кодов, - сумма интересов пользователя по непересекающимся его подмножествам, дающим в сумме это множество целиком.

Ключевое подмножество множества информации, в том числе в виде эквивалентной ей совокупности компьютерных кодов, - выделенный вид подмножества, обладающий какой-либо приоритетной особенностью по отношению ко всему множеству, например в котором, в отличие от других подмножеств всего множества, содержится указание на размещение в компьютерной сети связанной с данным подмножеством информации (ссылка на нее).

Запрос множества информации, в том числе в виде эквивалентной ей совокупности компьютерных кодов, - обращение к системе, реализующей способ, а также к источнику информации, при котором используют атрибуты и/или реквизиты запрашиваемой информации (например, название множества информации, индекс множества информации в хранилище, адрес источника в системе и т.п.).

Запрос множества последовательности компьютерных кодов - обращение к источнику последовательности компьютерных кодов, при котором используют атрибуты и/или реквизиты запрашиваемого множества (например, адрес секторов на диске, адрес источника в системе и т.п.).

Поисковый запрос информации, в том числе в виде эквивалентной ей совокупности компьютерных кодов, - обращение пользователя к системе, реализующей изобретение, при котором используют поисковый реквизит (например, в виде поисковой фразы), в том числе, представляемый в виде эквивалентной ему последовательности компьютерных кодов, а также, если это необходимо, атрибуты и/или реквизиты запрашиваемой информации (например, название множества информации, индекс множества информации в хранилище, адрес источника в системе, максимальное число базовых подмножеств и т.п.), в том числе представляемые в виде эквивалентных им последовательностей компьютерных кодов.

Поисковый реквизит - формируемое пользователем множество информации, отражающее его пожелание к содержанию итогового множества информации. Примером могут служить: поисковая фраза, параметры и названия и т.д.

Итоговое множество информации, в том числе в виде эквивалентной ей совокупности компьютерных кодов, - множество информации, в том числе в виде эквивалентной ей совокупности компьютерных кодов, которую система выдает пользователю в ответ на его запрос. Состоит из базовых подмножеств и вспомогательной информации.

Базовое множество информации, в том числе в виде эквивалентной ей совокупности компьютерных кодов, - множество информации, в том числе в виде эквивалентной ей совокупности компьютерных кодов, которое система создает или получает от источника информации и которое в результате реранжирования преобразует в итоговое множество информации. Состоит из базовых подмножеств и вспомогательной информации.

Вспомогательная информация - множество информации, равное базовому множеству информации после исключения из него базовых подмножеств, а также итоговому множеству информации после исключения из него базовых подмножеств. Примером вспомогательной информации являются указания на форму, порядок и оформление представления множества информации пользователю.

Идентифицирующая информация - информация, в том числе в виде эквивалентных ей последовательностей компьютерных кодов, которая однозначно определяет какой-либо массив информации путем указания его атрибутов, например адреса расположения в компьютерной сети и/или названия, и может содержать дополнительную информацию об этом множестве, например краткое описание этого множества или его оценку.

Структура базового множества информации и итогового множества информации одинакова, они состоят из вспомогательной информации и нуля или больше базовых подмножеств. Эти множества могут совпадать, и, если различаются, то только порядком расположения в них базовых подмножеств (рангом и пре-рангом).

Базовые подмножества информации, в том числе в виде эквивалентной ей совокупности компьютерных кодов, - подмножества базового множества информации, имеющие одинаковую структуру.

Пре-ранг базового подмножества информации - числовой показатель, обозначающий номер базового подмножества информации в базовом множестве информации. Получается системой, реализующей изобретение, в процессе построения базового множества с использованием известных ранее методов или получения его от внешнего источника данных.

Значимость базового подмножества информации - числовой показатель, обозначающий его соответствие запросу по результатам вычислений системы, реализующей изобретение, произведенных с учетом экспертных оценок, полученных от внешних источников информации или из внутреннего хранилища, если информация, отражающая эти оценки, была получена ранее и сохранена во внутреннем хранилище.

Ранг базового подмножества информации - числовой показатель, обозначающий номер базового подмножества информации в итоговом множестве информации. Находится в зависимости от значимости базового подмножества информации - чем больше значимость базового подмножества информации, тем меньше его ранг, таким образом, базовое подмножество информации с максимальной значимостью имеет ранг, равный единице.

Интерес-ранг базового подмножества информации - экспериментальный числовой показатель, обозначающий номер базового подмножества информации во множестве информации, состоящем из всех базовых подмножеств, находящийся в зависимости от интереса пользователя к этому базовому подмножеству информации - чем больше интерес пользователя к этому базовому подмножеству информации, тем меньше его интерес-ранг, таким образом, базовое подмножество информации с максимальным интересом пользователей к нему имеет интерес-ранг, равный единице.

Ранжирование - фиксированное расположение базовых подмножеств в базовом множестве информации или итоговом множестве информации, выражается в том, что каждому базовому подмножеству присвоен его пре-ранг или ранг.

Качество ранжирования - числовой показатель, характеризующий адекватность рангов подмножеств информации показателям интересам пользователя к ним.

Реранжирование - процесс преобразования базового множества информации, в том числе в виде эквивалентной ему последовательности компьютерных кодов, путем вычисления значимостей базовых подмножеств, последующего определения их рангов и построения на их основе итогового множества информации, в том числе в виде эквивалентной ему последовательности компьютерных кодов.

Источник информации - хранилище информации, в том числе в виде компьютерных кодов, или ее генератор, выдающее при поступлении к нему запроса на получение информации запрошенную информацию.

Эксперт - человек или машина, отражающие свою оценку какого-либо множества информации.

Оценка экспертом или экспертная оценка (в том числе автоматизированная) множества информации - отражение (множество информации), характеризующее отношение эксперта к объекту или объектам оценки: самому этому множеству информации, его ключевым подмножествам или к множеству информации, указание на размещение в компьютерной сети которого (ссылка на него) содержатся в рассматриваемом множестве информации.

Специализированное множество информации - множество информации, создаваемое путем размещения информации в нем более чем одним человеком или машиной, действующими в целях информирования других людей или машин на основе их запросов, заданного алгоритма или по собственной инициативе; может быть как единым множеством, так и подразделяться на подмножества, относящиеся к каждому из людей или машин или к их группам. Примерами специализированных множеств являются интернет-сайты, на страницах которых их посетители выражают свои мнения или на страницы которых заносят заметки о других сайтах.

Внешняя оценка базового подмножества информации - параметр, характеризующий это подмножество информации и определяемый на основании оценок экспертов.

Обозначения:

N - число базовых подмножеств.

Nmax - максимальное число базовых подмножеств, которое может входить в базовое множество; целый положительный числовой параметр, который может быть определен в поисковом запросе, а если он не определен в поисковом запросе, то его определяют для каждой конкретной реализации способа в зависимости от ее технических характеристик (например, скорости преобразования данных вычислительным устройством, доступного объема машинной памяти или скорости соединения с источником информации).

i - пре-ранг каждого из базовых подмножеств, целое число из диапазона от 1 до N, не может быть одинаковым у разных базовых подмножеств.

Vi - значимость i-го базового подмножества, числовой параметр.

Ri - ранг i-го базового подмножества, целое число из диапазона от 1 до N, не может быть одинаковьм у разных базовых подмножеств.

Li - интерес пользователя к i-му базовому подмножеству информации, числовой параметр, принадлежащий к диапазону от 0 до 1.

R11 - интерес-ранг i-го базового подмножества, целое число из диапазона от 1 до N, не может быть одинаковым у разных базовых подмножеств.

Оi - внешняя оценка i-гo базового подмножества, числовой параметр.

f (i, Оi) - функция вычисления значимости i-гo базового подмножества в зависимости от i и его внешней оценки, ее определяют для каждой конкретной реализации способа в зависимости от ее технических характеристик и характеристик внешней оценки.

Q - качество ранжирования, числовой параметр.

Qбаз - качество ранжирования базового множества информации.

Qитог - качество ранжирования итогового множества информации.

Res - показатель изменения качества ранжирования.

Res=Qитог-Qбаз

Соответственно, положительное значение Res означает, что имеет место улучшение качества ранжирования, те есть что реранжирование прошло успешно.

Для расчета качества ранжирования базового и итогового множеств информации используют формулы

и

Они отображают зависимость качества ранжирования от суммы разностей пре-ранга/ранга базового подмножества и интерес-ранга этого подмножества, пронормированных по сумме интерес-ранга базового подмножества и его положения в базовом/итоговом множестве (i/Ri). Нормировка отражает то, что чем ниже интерес пользователя к базовому подмножеству и ниже его положение в базовом/итоговом множестве, тем менее существенна ошибка в определении ранга этого подмножества.

В качестве кратких сведений, раскрывающих сущность изобретения, следует отметить, что достигаемый технический результат обеспечивают с помощью предложенного автоматизированного способа посредством построения и/или преобразования эквивалентных информации последовательностей компьютерных кодов, в котором используют экспертные оценки. В соответствии с поисковым запросом строят последовательности компьютерных кодов, эквивалентных базовому множеству информации либо получают базовое множество информации от внешнего источника данных, выделяют из него N≤Nmax упорядоченных подмножеств последовательности компьютерных кодов, эквивалентных базовым подмножествам информации, и последовательность компьютерных кодов, эквивалентную вспомогательной информации. Далее для каждого i-го базового подмножества от внешнего источника данных, а в случае, если необходимая информация была получена и сохранена ранее, из внутреннего хранилища информации, получают, в том числе в виде эквивалентных ей компьютерных кодов, информацию, отражающую экспертные оценки этого подмножества и/или его ключевых подмножеств и/или множеств информации, указание на размещение в компьютерной сети которого расположено в рассматриваемом базовом подмножестве информации. Путем преобразования этой информации вычисляют Оi - внешнюю оценку данного подмножества, при этом вид преобразования выбирают в зависимости от вида информации, отражающей оценки экспертов; на основе Oi с использованием функции f(i, Оi) для каждого i-го базового подмножества определяют его значимость Vi в виде числового показателя, обозначающего его соответствие запросу по результатам вычислений системы. Путем автоматической сортировки базовых подмножеств по убыванию Vi для каждого i-го базового подмножества получают его ранг Ri в обратной зависимости от значений Vi: чем больше значимость базового подмножества информации, тем меньше его ранг. Затем включают эквивалентные базовым подмножествам последовательности компьютерных кодов в соответствующем рангу порядке в последовательность компьютерных кодов, эквивалентную вспомогательной информации, и получают таким образом последовательность компьютерных кодов, эквивалентную итоговому множеству информации. То есть производят реранжирование.

Технический результат достигается также при использовании в вышеописанном способе в качестве оценок экспертов непосредственного, как в виде числового параметра, так и других, в том числе текстовых, представляемых в виде компьютерных кодов формах, оценивания экспертами: самого этого базового подмножества и/или его ключевых подмножеств и/или множества информации, указание на размещение в компьютерной сети которого расположено в рассматриваемом базовом подмножестве информации.

Технический результат достигается также при использовании в вышеописанном способе в качестве оценок экспертов внесения экспертами в специализированные множества идентифицирующей информации о: самом этом базовом подмножестве и/или его ключевых подмножествах и/или множестве информации, указание на размещение в компьютерной сети которого расположено в рассматриваемом базовом подмножестве информации; сам факт внесения идентифицирующей информации в этом случае принимают как отражение оценки эксперта.

Достигаемый технический результат обеспечивают с помощью автоматизированного комплекса поиска информации в компьютерных сетях посредством построения и/или преобразования эквивалентных информации последовательностей компьютерных кодов, составленного из взаимосвязанных между собой блоков: блока получения запросов от пользователя БПЗД; блока хранения данных, построения и ранжирования БХПР; блока отправки и получения данных в/из источника или источников информации БОПИИ; блока выдачи информации пользователю БВИП. При этом пользователь подключен к БПЗД посредством одного или нескольких физических носителей и к БВИП посредством одного или нескольких физических носителей. БПЗД и БВИП подключены к БХПР, который через двухсторонний канал взаимосвязан с БОПИИ, а БОПИИ взаимосвязан с одним или несколькими источниками информации посредством одного или нескольких физических носителей.

Достигается технический результат также с помощью варианта автоматизированного комплекса, в котором пользователь подключен к БПЗД посредством одного или нескольких физических носителей в виде устройства формирования компьютерных кодов из воспринимаемой пользователем информации, накопителя и/или передающего устройства для компьютерных кодов и к БВИП посредством одного или нескольких физических носителей в виде устройства формирования воспринимаемой пользователем информации из компьютерных кодов, накопителя и/или передающего устройства для компьютерных кодов.

При изложении сведений, подтверждающих возможность осуществления изобретения, целесообразно более детально описать предложенный способ. При описании способа нецелесообразно детально останавливаться на известных из опубликованных источников и имеющейся общеизвестной практики особенностях выполнения его операций, в частности построении базового множества информации, в том числе в виде эквивалентной ему совокупности компьютерных кодов, или получении базового множества информации от источников информации.

Детальное описание заявленных способа и устройства целесообразно пояснить с использованием чертежей, на которых схематически изображены:

Фиг.1. График зависимости значений Res от выбора Nmax.

Фиг.2. Конструктивная структурная схема автоматизированного комплекса, реализующего способ поиска информации в компьютерных сетях посредством построения и/или преобразования эквивалентных информации последовательностей компьютерных кодов.

Фиг.3. Схема функционирования автоматизированного комплекса, реализующего способ поиска информации в компьютерных сетях посредством построения и/или преобразования эквивалентных информации последовательностей компьютерных кодов.

График получен графическим отображением экспериментально полученных значений.

На Фиг.2 и Фиг.3 обозначены:

1. Пользователь.

2. Блок получения запросов и управляющих данных от пользователя БПЗД.

3. Физические носители информации.

4. Подключение пользователя к БПЗД посредством одного или нескольких физических носителей информации

5. Подключение БПЗД к БХПР.

6. Блок хранения данных, построения и ранжирования БХПР.

7. Взаимосвязь БХПР и БОПИИ.

8. Блок отправки и получения данных в/из источника/источников информации БОПИИ.

9. Взаимосвязь БОПИИ и источника информации.

10. Физические носители информации.

11. Источник или, если их несколько, источники информации.

12. Подключение БПЗД к БВИП.

13. Блок выдачи информации пользователю БВИП.

14. Подключение БВИП к пользователю.

15. Физические носители информации.

16. Направление передаваемого запроса на получение информации.

17. Направление передаваемой последовательности компьютерных кодов, эквивалентной запросу на получение информации.

18. Направление передаваемой последовательности компьютерных кодов, эквивалентной запросу на получение базового множества.

19. Направление передаваемого запроса к источнику или источникам информации на получение базового множества информации.

20. Направление передаваемого базового множества информации.

21. Направление передаваемой последовательности компьютерных кодов, эквивалентной базовому множеству информации.

22. Направление передаваемой последовательности компьютерных кодов, эквивалентной запросу на получение информации, необходимой для вычисления внешних оценок базовых подмножеств.

23. Направление передаваемого запроса на получение информации, необходимой для вычисления внешних оценок базовых подмножеств.

24. Направление передаваемой информации, необходимой для вычисления внешних оценок базовых подмножеств.

25. Направление передаваемой последовательности компьютерных кодов, эквивалентной информации, необходимой для вычисления внешних оценок базовых подмножеств.

26. Направление передаваемой последовательности компьютерных кодов, эквивалентной итоговому множеству информации.

27. Направление передаваемого итогового множества информации.

Детально целесообразно описать преимущественно отличительные существенные особенности осуществления операций предложенного способа, заключающиеся в том, что в автоматизированном способе в соответствии с поисковым запросом строят последовательности компьютерных кодов, эквивалентных базовому множеству информации либо получают базовое множество информации от внешнего источника данных, выделяют из него N≤Nmax упорядоченных подмножеств последовательности компьютерных кодов, эквивалентных базовым подмножествам информации, и последовательность компьютерных кодов, эквивалентную вспомогательной информации. Далее для каждого i-го базового подмножества от внешнего источника данных, а в случае, если необходимая информация была получена и сохранена ранее, из внутреннего хранилища информации, в том числе в виде эквивалентных ей компьютерных кодов, получают информацию, отражающую экспертные оценки этого подмножества и/или его ключевых подмножеств и/или множеств информации, указание на размещение в компьютерной сети которого расположено в рассматриваемом базовом подмножестве информации. Путем преобразования этой информации вычисляют Оi - внешнюю оценку данного подмножества, при этом вид преобразования выбирают в зависимости от вида информации, отражающей оценки экспертов; на основе Оi с использованием функции f (i,Оi) для каждого i-го базового подмножества определяют его значимость Vi в виде числового показателя, обозначающего его соответствие запросу по результатам вычислений системы. Путем автоматической сортировки базовых подмножеств по убыванию Vi для каждого i-го базового подмножества получают его ранг Ri в обратной зависимости от значений Vi: чем больше значимость базового подмножества информации, тем меньше его ранг. Затем включают эквивалентные базовым подмножествам последовательности компьютерных кодов в соответствующем рангу порядке в последовательность компьютерных кодов, эквивалентную вспомогательной информации, и получают таким образом последовательность компьютерных кодов, эквивалентную итоговому множеству информации. То есть производят реранжирование.

Технический результат достигается также при использовании в вышеописанном способе в качестве оценок экспертов непосредственного, как в виде числового параметра, так и других, в том числе текстовых, представляемых в виде компьютерных кодов формах, оценивания экспертами: самого этого базового подмножества и/или его ключевых подмножеств и/или множества информации, указание на размещение в компьютерной сети которого расположено в рассматриваемом базовом подмножестве информации.

Технический результат достигается также при использовании в вышеописанном способе в качестве оценок экспертов внесения экспертами в специализированные множества идентифицирующей информации о: самом этом базовом подмножестве и/или его ключевых подмножествах и/или множестве информации, указание на размещение в компьютерной сети которого расположено в рассматриваемом базовом подмножестве информации. Сам факт внесения идентифицирующей информации в этом случае принимают как отражение оценки эксперта - то есть внесением информации эксперт оценивает как заслуживающее внимания это базовое подмножество и/или его ключевое подмножество и/или множество информации, указание на размещение в компьютерной сети которого расположено в рассматриваемом базовом подмножестве информации.

Для наглядности целесообразно проиллюстрировать осуществление способа примерами.

В соответствии с поисковым запросом строят последовательности компьютерных кодов, эквивалентных базовому множеству информации либо, получают базовое множество информации (табл.1) от внешнего источника данных и формируют N≤Nmax упорядоченных подмножеств последовательности компьютерных кодов, эквивалентных базовым подмножествам информации (табл.2).

Далее система обрабатывает информацию в виде компьютерных кодов, а для простоты изложения примеров описывается информация, эквивалентная этим компьютерным кодам, если нет отдельных указаний.

Пример базового множества

ВСПОМ.ИНФОРМ. АБВУ ГДЕУ ЖЗИУ КЛМУ НОПУ РСТУ ВСПОМ. ИНФОРМ. табл. 1. Базовое множество

Пример совокупности базовых подмножеств

Базовое подмножество АБВУ ГДЕУ ЖЗИУ КЛМУ НОПУ РСТУ i 1 2 3 4 5 6 табл.2. Базовые подмножества, N=6

Далее для каждого i-го базового подмножества от внешнего источника данных или, в случае, если необходимая информация была получена и сохранена ранее, из внутреннего хранилища информации получают отражающую оценки экспертов информацию, в том числе в виде эквивалентных ей компьютерных кодов, и путем ее преобразования вычисляют Оi - внешнюю оценку данного подмножества. В качестве необходимой для получения внешней оценки информации в примере выступают числа внесения экспертами в специализированные множества идентифицирующей информации о ключевых подмножествах базовых подмножеств информации в специализированных множествах информации (табл.3). В данном примере в качестве ключевых подмножеств выбраны подмножества, присутствующие в одном и только в одном базовом подмножестве, а преобразование информации отсутствует, поскольку эта информация для каждого базового подмножества представляет собой числовой параметр.

Пример внешних оценок ключевых подмножеств

Ключевое подмножество базового подмножества АБВ ГДЕ ЖЗИ КЛМ НОП РСТ Оценки экспертов = Oi 7 5 4 11 2 0 табл.3. Внешние оценки ключевых подмножеств

На основе Оi с использованием функции f(i, Оi) для каждого i-го базового подмножества определяют его значимость Vi. Например, значение функции f(i,Оi) могут вычислять по формуле

f(i,Oi)=(N+1-i)x(1+Oi)

В этом случае таблица Vi примет вид, указанный в табл.4.

Пример таблицы значимостей

i 1 2 3 4 5 6 Vi 48 30 20 36 6 1 табл.4. Значения значимостей базовых подмножеств

Путем сортировки базовых подмножеств по убыванию Vi для каждого i-го базового подмножества получают его ранг Ri таким образом, что, чем больше значимость базового подмножества информации, тем меньше его ранг. Определив для каждого из базовых подмножеств его ранг (табл.5), получают последовательности компьютерных кодов, эквивалентных итоговому множеству информации и включают эквивалентные им последовательности компьютерных кодов в соответствующем рангу порядке в последовательность компьютерных кодов, эквивалентную вспомогательной информации. Таким образом, получают итоговое множество информации (табл.6), то есть производят реранжирование.

Пример таблицы рангов базовых подмножеств

Ri 1 2 3 4 5 6 i 1 4 2 3 5 6 табл.5. Ранги базовых подмножеств

Пример итогового множества информации

ВСПОМ.ИНФОРМ. АБВУ КЛМУ ГДЕУ ЖЗИУ НОПУ РСТУ ВСПОМ.ИНФОРМ. табл.6. Итоговое множество информации

В другом примере в качестве необходимой для получения внешней оценки информации выступают оценки экспертов базовых подмножеств информации.

В соответствии с поисковым запросом строят последовательности компьютерных кодов, эквивалентных базовому множеству информации, либо получают базовое множество информации (табл.7) от внешнего источника данных и формируют N≤Nmax упорядоченных подмножеств последовательности компьютерных кодов, эквивалентных базовым подмножествам информации (табл.8).

Пример базового множества

Полезность Лошадь Корова Овца Свинья Утка Курица Домашних животных табл.7. Базовое множество

Пример совокупности базовых подмножеств

Базовое подмножество Лошадь Корова Овца Свинья Утка Курица i 1 2 3 4 5 6 табл.8. Базовые подмножества, N=6

Далее для каждого i-го базового подмножества от внешнего источника данных или, в случае, если необходимая информация была получена и сохранена ранее, из внутреннего хранилища информации получают отражающую оценки экспертов этого подмножества информации, в том числе в виде эквивалентных ей компьютерных кодов, и путем ее преобразования вычисляют Oi - внешнюю оценку данного подмножества. В качестве необходимой для получения внешней оценки информации в примере выступают экспертные оценки базовых подмножеств информации, размещенные в специализированных множествах информации (табл.9).

Пример экспертных оценок базовых подмножеств

Базовое подмножество Лошадь Корова Овца Свинья Утка Курица Экспертные оценки Очень полезна Сверхполез-
на
Полезна Сверхполез-
на
Менее полезна Полезна
табл.9. Экспертные оценки базовых подмножеств

В данном примере, поскольку экспертная информация для каждого базового подмножества не является числовым параметром, требуется преобразование информации. Его проводят, например, определяя внешнюю оценку Оi в соответствии с табл.10.

Пример соответствия экспертных и внешних оценок

Оценки экспертов Сверхполез-
на
Очень полезна Полезна Менее полезна Почти бесполезна
Значение 0i 10 8 6 4 2 табл.10. Таблица соответствия экспертных оценок и внешних оценок

Таким образом, получают внешние оценки Оi для каждого i-го базового подмножества (табл.11).

Пример внешних оценок базовых подмножеств

Базовое подмножество Лошадь Корова Овца Свинья Утка Курица Значение Oi 8 10 6 10 4 6 табл.11. Внешние оценки базовых подмножеств

На основе Оi с использованием функции f(i, Оi) для каждого i-го базового подмножества определяют его значимость Vi. Например, значение функции f(i, Oi) могут вычислять по формуле

f(i, Oi)=(N+1-i)xOi

В этом случае таблица Vi примет вид, указанный в табл.12.

Пример таблицы значимостей

i 1 2 3 4 5 6 Vi 48 50 24 30 8 6 табл.12. Значения значимостей базовых подмножеств

Путем сортировки базовых подмножеств по убыванию Vi для каждого i-гo базового подмножества получают его ранг Ri таким образом, что, чем больше значимость базового подмножества информации, тем меньше его ранг. Определив для каждого из базовых подмножеств его ранг (табл.13), получают последовательности компьютерных кодов, эквивалентных итоговому множеству информации, и включают эквивалентные им последовательности компьютерных кодов в соответствующем рангу порядке в последовательность компьютерных кодов, эквивалентную вспомогательной информации. Таким образом, получают итоговое множество информации (табл.14), то есть производят реранжирование.

Пример таблицы рангов базовых подмножеств

Ri 1 2 3 4 5 6 i 2 1 4 3 5 6 табл.13. Ранги базовых подмножеств

Пример итогового множества информации

Полезность Корова Лошадь Свинья Овца Утка Курица Домашних животных табл.14. Итоговое множество информации

Еще одним примером осуществления способа является описание функционирования автоматизированного комплекса для его осуществления, детально изложенное ниже. Этих примеров достаточно для понимания сущности достижения технического результата с помощью заявленных объектов.

Использование взаимосвязанных совокупностей существенных признаков всех заявленных объектов для доказательства достижения технического результата подтверждено проведенными экспериментами.

Достижение технического результата было экспериментально доказано, в частности, установлением в процессе проведения экспериментов тех фактов, что при любых Nmax значение показателя изменения качества ранжирования Res=Qитог-Qбаз положительно, а также что на значение Res влияет выбор значения Nmax. График зависимости значений Res от выбора Nmax приведен на фиг.1.

Эксперименты проводились следующим образом: пользователям предлагали делать поисковые запросы и получали базовое множество информации; на основании реакции пользователей на базовые подмножества вычисляли значения Li - интересы пользователей к этим подмножествам, затем для каждого из базовых подмножеств рассчитывали интерес-ранг этого подмножества и вместе с параметром i подставляли в формулу вычисления Обаз. Затем производили реранжирование с применением в качестве информации для получения внешней оценки числа внесений экспертами в специализированные множества информации, идентифицирующей ключевые подмножества базовых множеств, без применения преобразований, и вычисляли значение Qитог и Res.

Значение Res при всех значениях Nmax было положительным, то есть реранжирование было успешным. Форма графика отражает то, что при низких количествах Nmax известные схемы формирования базового множества функционируют вполне удовлетворительно, а интерес пользователя к каждому базовому подмножеству высок. А с необходимостью ранжировать адекватно интересу пользователя традиционные методы построения базовых множеств справляются тем хуже, чем больше требуется отранжировать ключевых подмножеств.

Технический результат достигается также в процессе функционирования автоматизированного комплекса, реализующего предлагаемый способ, конструктивная структурная схема которого схематически изображена на фиг.2.

Комплекс составлен из взаимосвязанных между собой блоков: блока получения запросов от пользователя БПЗД; блока хранения данных, построения и ранжирования БХПР; блока отправки и получения данных в/из источника или источников информации БОПИИ; блока выдачи информации пользователю БВИП. При этом пользователь подключен к БПЗД посредством одного или нескольких физических носителей и к БВИП посредством одного или нескольких физических носителей; БПЗД и БВИП подключены к БХПР, который через двухсторонний канал взаимосвязан с БОПИИ. БОПИИ, в свою очередь, взаимосвязан с одним или несколькими источниками информации посредством одного или нескольких физических носителей.

Подключения и взаимосвязи могут быть осуществлены через различные каналы, такие как кабели, радиоканалы, каналы оптической передачи данных, а также посредством разных физических носителей, например дисплея, клавиатуры, дисковода и т.д.

Рассмотрим детальнее функционирование автоматизированного комплекса, реализующего предлагаемый способ поиска информации в компьютерных сетях; схема его функционирования изображена на фиг.3.

От пользователя 1 посредством одного или нескольких физических носителей, например таких как устройства формирования компьютерных кодов из воспринимаемой пользователем информации, накопителя и/или передающего устройства для компьютерных кодов 3, в БПЗД 2 принимают поисковый запрос 16 на получение информации, затем передают запрос 17 в виде последовательности компьютерных кодов БХПР 6, посредством которого, в зависимости от реализации, осуществляют построение последовательности компьютерных кодов, эквивалентной базовому множеству, или из которого передают запрос на получение базового множества информации 18 в виде последовательности компьютерных кодов в БОПИИ 8, далее посредством одного или нескольких физических носителей 10 передают запрос 19 источнику или источникам информации 11, получают от источника или источников информации базовое множество информации 20 и в виде эквивалентной ему последовательности компьютерных кодов 21 передают в БХПР 6. В БХПР 6 извлекают в виде последовательности компьютерных кодов из расположенного в его памяти хранилища информацию, отражающую экспертные оценки базовых подмножеств и/или их ключевых подмножеств и/или множеств информации, указание на размещение в компьютерной сети которого расположено в этих базовых подмножествах информации (если она была там сохранена ранее), либо передают запрос для ее получения 22 в виде последовательности компьютерных кодов в БОПИИ 8, из БОПИИ 8 посредством одного или нескольких физических носителей 10 передают запрос 23 источнику или источникам информации 11, получают от источника или источников информацию об экспертных оценках, необходимую для вычисления внешних оценок базовых подмножеств 24, и в виде эквивалентных ей последовательностей компьютерных кодов 25 передают ее в БХПР 6. Применяя БПХР 6, на основе полученной информации вычисляют внешние оценки Оi, затем на основе использования полученного базового множества, внешних оценок и с использованием функции f(i, Оi) для каждого i-го базового подмножества определяют его значимость Vi в виде числового показателя, обозначающего его соответствие запросу по результатам вычислений системы. Далее путем сортировки базовых подмножеств по убыванию Vi для каждого i-гo базового подмножества получают его ранг Ri в обратной зависимости от значений Vi, то есть таким образом, что чем больше значимость базового подмножества информации, тем меньше его ранг. Определив для каждого из базовых подмножеств его ранг, включают эквивалентные им последовательности компьютерных кодов в соответствующем рангу порядке в последовательность компьютерных кодов, эквивалентную вспомогательной информации. Таким образом, получают последовательность компьютерных кодов, эквивалентных итоговому множеству информации и передают эту последовательность 26 в БВИП 13, из которого посредством одного или нескольких физических носителей 15 передают итоговое множество 27 информации пользователю 1.

Практически полезна и эффективна также модификация описанного комплекса, в котором пользователь подключен к БПЗД посредством одного или нескольких физических носителей в виде устройства формирования компьютерных кодов из воспринимаемой пользователем информации, накопителя и/или передающего устройства для компьютерных кодов и к БВИП посредством одного или нескольких физических носителей в виде устройства формирования воспринимаемой пользователем информации из компьютерных кодов, накопителя и/или передающего устройства для компьютерных кодов. Примерами таких устройств могут выступать дисплей, клавиатура, компьютерная мышь и т.д.

Вышеизложенным наглядно показано, что реранжирование с достижением указанного технического результата может быть обеспечено только неразрывно взаимосвязанной совокупностью всех существенных признаков заявленных объектов, отраженных в формуле изобретения. Указанные в ней отличия дают основание сделать вывод о новизне данного технического решения, а совокупность испрашиваемых притязаний в связи с их неочевидностью - о его изобретательском уровне, что доказывается также вышеприведенным их детальным описанием. Соответствие критерию «промышленная применимость» предложенного способа доказывается как его реализацией, так и отсутствием в заявленных притязаниях каких-либо практически трудно реализуемых в промышленных масштабах признаков. Заявленные значения были получены на основе статистической обработки результатов экспериментальных исследований, анализа и обобщения их, а также с использованием изобретательской интуиции, исходя из условия достижения указанного технического результата.

Похожие патенты RU2370812C1

название год авторы номер документа
АВТОМАТИЗИРОВАННЫЙ СПОСОБ ПРЕОБРАЗОВАНИЯ ПОСЛЕДОВАТЕЛЬНОСТИ АДЕКВАТНЫХ ЗАПРОШЕННОЙ ПОЛЬЗОВАТЕЛЕМ ИНФОРМАЦИИ КОМПЬЮТЕРНЫХ КОДОВ И АВТОМАТИЗИРОВАННЫЙ КОМПЛЕКС ДЛЯ ЕГО ОСУЩЕСТВЛЕНИЯ 2006
RU2313825C1
АВТОМАТИЗИРОВАННЫЙ СПОСОБ ФОРМИРОВАНИЯ И ПРЕОБРАЗОВАНИЯ КОМПЬЮТЕРНЫХ КОДОВ, ЭКВИВАЛЕНТНЫХ ЦЕЛЕВОЙ ИНФОРМАЦИИ, ДЛЯ ПРЕДСТАВЛЕНИЯ ЕЕ ПОЛЬЗОВАТЕЛЮ В КОМПЬЮТЕРНЫХ СЕТЯХ (ВАРИАНТЫ) И АВТОМАТИЗИРОВАННЫЙ КОМПЛЕКС ДЛЯ ЕГО ОСУЩЕСТВЛЕНИЯ 2008
RU2370813C1
АВТОМАТИЗИРОВАННЫЙ СПОСОБ ПРЕДСТАВЛЕНИЯ ИНФОРМАЦИИ В ВИДЕ МУЛЬТИМЕДИЙНОГО ЗНАКА ПОСРЕДСТВОМ ПОСТРОЕНИЯ И/ИЛИ ПРЕОБРАЗОВАНИЯ ЭКВИВАЛЕНТНЫХ ИНФОРМАЦИИ КОМПЬЮТЕРНЫХ КОДОВ И АВТОМАТИЗИРОВАННЫЙ КОМПЛЕКС ДЛЯ ЕГО ОСУЩЕСТВЛЕНИЯ 2008
  • Малышев Павел Михайлович
RU2371761C1
АВТОМАТИЗИРОВАННЫЙ СПОСОБ ПОИСКА ПЕРЕВОЗОК И АВТОМАТИЗИРОВАННЫЙ КОМПЛЕКС ДЛЯ ЕГО ОСУЩЕСТВЛЕНИЯ 2014
  • Малышев Павел Михайлович
RU2600864C1
Способ назначения приоритетов запросам на проведение сеансов связи с космическими аппаратами научного и социально-экономического назначения 2017
  • Вороновский Владимир Викторович
  • Дудко Александр Николаевич
  • Кулик Марина Сергеевна
  • Кучеров Борис Алексеевич
  • Литвиненко Антон Олегович
  • Паздников Владимир Юрьевич
  • Соловьева Людмила Юрьевна
  • Сохранный Евгений Петрович
  • Усиков Сергей Борисович
  • Хроменков Алексей Сергеевич
RU2659773C1
СИСТЕМА УТОЧНЕНИЯ МЕДИЦИНСКИХ ЗАПРОСОВ 2011
  • Букур Анка Йоана Даньела
  • Вдовяк Ричард
  • Ван Леувен Яспер Йоханнес Адрианус
RU2598328C2
СПОСОБ ОТБОРА ЭФФЕКТИВНЫХ ВАРИАНТОВ В ПОИСКОВЫХ И РЕКОМЕНДАТЕЛЬНЫХ СИСТЕМАХ (ВАРИАНТЫ) 2013
  • Алескеров Фуад Таги Оглы
  • Митичкин Евгений Олегович
  • Чистяков Вячеслав Васильевич
  • Швыдун Сергей Владимирович
  • Якуба Вячеслав Иванович
RU2543315C2
АВТОМАТИЗИРОВАННЫЙ СПОСОБ ЦЕЛЕНАПРАВЛЕННОГО ПРЕОБРАЗОВАНИЯ КОМПЬЮТЕРНЫХ КОДОВ, АДЕКВАТНЫХ ЗАПРОСАМ ИНФОРМАЦИИ О ПОТРЕБНОСТИ В ТОВАРАХ ИЛИ УСЛУГАХ И ПРЕДЛАГАЕМЫМ НА НИХ ОТВЕТАМ, И ПРОГРАММНО-АППАРАТНАЯ СИСТЕМА ДЛЯ ЕГО ОСУЩЕСТВЛЕНИЯ 2011
  • Ожерельев Владимир Александрович
  • Корочков Александр Владимирович
RU2465648C1
СПОСОБ ОЦЕНКИ КОНКУРЕНТОСПОСОБНОСТИ ГИДРОАКУСТИЧЕСКОЙ РЫБОПОИСКОВОЙ АППАРАТУРЫ И ИНФОРМАЦИОННО-АНАЛИТИЧЕСКАЯ СИСТЕМА ДЛЯ ЕГО ОСУЩЕСТВЛЕНИЯ 1997
  • Кондратенко В.М.
  • Егоров В.М.
  • Коготков С.М.
RU2139554C1
КАЧЕСТВО ИЗОБРАЖЕНИЯ И ПРИЗНАКА, УЛУЧШЕНИЕ ИЗОБРАЖЕНИЯ И ВЫДЕЛЕНИЕ ПРИЗНАКОВ ДЛЯ РАСПОЗНАВАНИЯ ПО СОСУДАМ ГЛАЗА И ЛИЦАМ И ОБЪЕДИНЕНИЕ ИНФОРМАЦИИ О СОСУДАХ ГЛАЗА С ИНФОРМАЦИЕЙ О ЛИЦАХ И/ИЛИ ЧАСТЯХ ЛИЦ ДЛЯ БИОМЕТРИЧЕСКИХ СИСТЕМ 2016
  • Сарипалле, Саши, К.
  • Готтемуккула, Викас
  • Деракхшани, Реза, Р.
RU2711050C2

Иллюстрации к изобретению RU 2 370 812 C1

Реферат патента 2009 года АВТОМАТИЗИРОВАННЫЙ СПОСОБ ПОИСКА ИНФОРМАЦИИ В КОМПЬЮТЕРНЫХ СЕТЯХ ПОСРЕДСТВОМ ПОСТРОЕНИЯ И/ИЛИ ПРЕОБРАЗОВАНИЯ ЭКВИВАЛЕНТНЫХ ИНФОРМАЦИИ ПОСЛЕДОВАТЕЛЬНОСТЕЙ КОМПЬЮТЕРНЫХ КОДОВ И АВТОМАТИЗИРОВАННЫЙ КОМПЛЕКС ДЛЯ ЕГО ОСУЩЕСТВЛЕНИЯ

Изобретение относится к вычислительной технике и может быть использовано, например, в качестве автоматизированного способа поиска информации в компьютерных сетях. Технический результат - улучшение качества ранжирования предоставляемой пользователю информации. Это достигается с помощью автоматизированного способа поиска информации в компьютерных сетях посредством построения и/или преобразования эквивалентных информации последовательностей компьютерных кодов, в котором используют экспертные оценки и автоматически производят реранжирование первоначально полученного результата поиска. Автоматизированный комплекс содержит взаимосвязанные между собой блок получения запросов от пользователя, блок хранения данных, построения и ранжирования, блок отправки и получения данных в/из источника или источников информации и блок выдачи информации пользователю. 2 н. и 3 з.п. ф-лы, 3 ил., 14 табл.

Формула изобретения RU 2 370 812 C1

1. Автоматизированный способ поиска информации по запросу пользователя в компьютерных сетях посредством построения и/или преобразования эквивалентных информации последовательностей компьютерных кодов, включающий построение в соответствии с поисковым запросом последовательности компьютерных кодов, эквивалентных базовому множеству информации либо получение базового множества информации от внешнего источника данных, выделение из него упорядоченных подмножеств последовательности компьютерных кодов, эквивалентных базовым подмножествам информации, и последовательности компьютерных кодов, эквивалентных вспомогательной информации, для каждого базового подмножества от внешнего источника данных, а в случае, если необходимая информация была получена и сохранена ранее из внутреннего хранилища информации, получают, в том числе в виде эквивалентных ей компьютерных кодов, информацию, отражающую экспертные оценки этого подмножества, и/или его ключевых подмножеств, и/или множеств информации, указание на размещение в компьютерной сети которых расположено в рассматриваемом базовом подмножестве информации, путем преобразования этой информации вычисляют внешнюю оценку данного подмножества, при этом вид преобразования выбирают в зависимости от вида информации, отражающей экспертные оценки, на основе внешней оценки для каждого базового подмножества определяют его значимость в виде числового показателя, обозначающего его соответствие запросу пользователя, путем автоматической сортировки базовых подмножеств по убыванию их значимости для каждого базового подмножества получают его ранг в обратной зависимости от значений значимости, при этом чем больше значимость базового подмножества информации, тем меньше его ранг, включают эквивалентные им последовательности компьютерных кодов в соответствующем рангу порядке в последовательность компьютерных кодов, эквивалентную вспомогательной информации, и получают последовательность компьютерных кодов, эквивалентную итоговому множеству информации.

2. Способ по п.1, в котором в качестве экспертных оценок используют числовые параметры или тексты, полученные в результате оценивания экспертами самого этого базового подмножества, и/или его ключевых подмножеств, и/или множества информации, указание на размещение в компьютерной сети которого расположено в рассматриваемом базовом подмножестве информации.

3. Способ по п.1, в котором в качестве экспертных оценок используют внесения в специализированные множества идентифицирующей информации, полученной от экспертов, о самом этом базовом подмножестве, и/или его ключевых подмножествах, и/или множестве информации, указание на размещение в компьютерной сети которого расположено в рассматриваемом базовом подмножестве информации, при этом внесение идентифицирующей информации в этом случае принимают как экспертную оценку.

4. Автоматизированный комплекс поиска информации в компьютерных сетях посредством построения и/или преобразования эквивалентных информации последовательностей компьютерных кодов, включающий блок получения запросов от пользователя (БПЗД), блок хранения данных, построения и ранжирования (БХПР), блок отправки и получения данных в/из источника или источников информации (БОПИИ), блок выдачи информации пользователю (БВИП), при этом БПЗД и БВИП подключены к БХПР, который через двухсторонний канал взаимосвязан с БОПИИ, который взаимосвязан с одним или несколькими источниками информации посредством одного или нескольких физических носителей.

5. Комплекс по п.4, в котором БПЗД выполнен с возможностью подключения к нему посредством одного или нескольких физических носителей в виде устройства формирования компьютерных кодов из воспринимаемой пользователем информации, накопителя и/или передающего устройства для компьютерных кодов, а БВИП выполнен с возможностью подключения к нему посредством одного или нескольких физических носителей в виде устройства формирования воспринимаемой пользователем информации из компьютерных кодов, накопителя и/или передающего устройства для компьютерных кодов.

Документы, цитированные в отчете о поиске Патент 2009 года RU2370812C1

СИСТЕМА ПОИСКА ИНФОРМАЦИИ В КОМПЬЮТЕРНОЙ СЕТИ 1998
  • Серебренников О.А.
  • Ашманов И.С.
  • Иванов А.П.
  • Пашко Д.А.
RU2138076C1
СПОСОБ ПОИСКА ИНФОРМАЦИИ В ПОЛИТЕМАТИЧЕСКИХ МАССИВАХ НЕСТРУКТУРИРОВАННЫХ ТЕКСТОВ 2004
  • Попов С.В.
RU2266560C1
Дорожная спиртовая кухня 1918
  • Кузнецов В.Я.
SU98A1
US 5748954 A, 05.05.1998
US 5576954 A, 19.11.1996.

RU 2 370 812 C1

Даты

2009-10-20Публикация

2008-02-19Подача