Настоящее изобретение относится к способу уточнения результатов поиска в базе данных, содержащей набор объектов, каждый из которых ассоциирован с по меньшей мере одним дескриптором.
Развитие цифровых технологий в последние годы, сопровождавшееся совершенствованием сетей и Интернета, привело к чрезвычайно большому увеличению объема доступного цифрового контента.
Одним из особенно значимых примеров этого является развитие цифровой фотографии, в частности благодаря совершенствованию сайтов для публикации фотографий и сайтов обмена фотографиями. Так, один из ведущих сайтов этого типа в сентябре 2010 года превысил рубеж в пять миллиардов размещенных фотоснимков, и с тех пор добавление продолжалось по несколько тысяч снимков в день.
Эти цифровые объекты, как правило, вносятся в базу данных вместе с ключевыми словами и/или другими техническими дескрипторами (размером, разрешением и другими). Эти ключевые слова и дескрипторы позволяют осуществлять поиск в базе данных и возвращать объекты, ключевые слова которых соответствуют критерию поиска, введенному пользователем в поисковую строку.
Однако в настоящее время большую часть поисковых машин проектируют, в основном, таким образом, что они обеспечивают поиск текста внутри веб-страниц или файлов и, в частности, в соответствующих текстах описания.
В случае, когда хранящиеся объекты не являются объектами текстового характера, как например фотографии, большое значение приобретают соответствующие ключевые слова и дескрипторы, которые позволяют осуществлять эффективный поиск и возврат релевантного результата.
Существует множество поисковых машин для выполнения подобного поиска, а также разработаны многочисленные алгоритмы для оптимизации релевантности результатов поиска.
Несмотря на существование усовершенствованных алгоритмов поиск по ключевому слову имеет свои ограничения, в частности из-за наличия в естественном языке синонимов, омонимов, иерархии терминов и степени точности.
Учитывая эти ограничения, намерение пользователя осуществить точный поиск, выходящий за пределы исходных значений используемых ключевых слов, остается неизвестно поисковой машине.
Для устранения указанных ограничений большинство поисковых машин предоставляют пользователям возможность расширенного поиска, в частности посредством использования нескольких ключевых слов, которые комбинируются с помощью логических операторов.
Однако подобная методика поиска не слишком удобна для пользователя и может даже в некоторых поисковых машинах требовать навыков программирования для составления запроса, причем пользователь в то же время не может быть уверен в том, что этот запрос будет правильно интерпретирован поисковой машиной и приведет к искомому результату.
Таким образом, существует потребность в разработке способа, который позволил бы оптимизировать поиск объектов, содержащихся в базе данных, в частности устранить некоторые неоднозначности и неточности с целью более точного ответа на запрос пользователя.
Для этого в настоящем изобретении предложен способ уточнения результатов поиска объектов в по меньшей мере одной базе данных, содержащей по меньшей мере один набор объектов, каждый из которых ассоциирован с по меньшей мере одним дескриптором, причем данный способ содержит следующие этапы:
- представление пользователю всего или части набора объектов базы данных, причем каждый из по меньшей мере одной части представляемых объектов ассоциирован с по меньшей мере одним средством, позволяющим пользователю сигнализировать релевантность, и/или по меньшей мере одним средством, позволяющим пользователю сигнализировать нерелевантность упомянутого объекта по отношению к его поиску,
- присвоение, в зависимости от сигнализации пользователя, по меньшей мере одного веса всем или части дескрипторов объекта из упомянутого набора представленных объектов, которые пользователь считает релевантными и/или нерелевантными своему поиску,
- вычисление суммарного результата весов, ассоциированных с каждым дескриптором набора объектов-результатов,
- инициализация индекса релевантности для каждого объекта-результата,
- сопоставление каждого объекта-результата с упомянутым суммарным результатом, и увеличение или уменьшение индекса релевантности объекта для каждого дескриптора сопоставляемого объекта-результата в зависимости от веса этого дескриптора в упомянутом суммарном результате,
- представление пользователю всех или части объектов-результатов в порядке их вычисленного индекса релевантности.
Таким образом, предоставляя пользователю возможность напрямую сигнализировать, считает ли он результаты первоначального поиска релевантными или нерелевантными, можно добиться лучшего учета реального смысла его поиска и обеспечить более удовлетворительный результат. Кроме того, благодаря такой методике пользователь легко может выполнить сложный поиск, добавив или удалив дескрипторы и ключевые слова, причем это делается интуитивно и понятно.
Термин «объект» относится к любому цифровому объекту, который может храниться в базе данных. Как указано выше, это могут быть, в частности, фотографии, также как и другие типы файлов, включая аудио, видео, документы и другие.
Необходимо отметить, что, в соответствии с принципом работы базы данных, сами искомые объекты не обязательно должны содержаться непосредственно в записи базы данных, а вполне могут обозначаться, например, ссылкой на адрес их хранения или URL либо через посредство других косвенных средств.
Необходимо также отметить, что используемый здесь термин «дескриптор» не имеет ограничительного характера. Этот термин очевидным образом включает в себя дескрипторы типа ключевых слов, но речь может идти и о более технических дескрипторах, обозначающих текстуры, материалы, цветовые профили, разрешение и другие. Возможно также использование семантических дескрипторов, устанавливаемых на основе тезаурусов. Поскольку нет ограничения на тип дескрипторов, их можно подбирать в зависимости от типа объектов, упоминаемых в базе(ах) данных, и искомых объектов.
Кроме того, следует отметить, что разным дескрипторам можно присваивать разные веса, в частности в зависимости от их источника, контекста и положения по отношению ко всем другим дескрипторам. Так, например, дескрипторы, взятые из тезауруса, и, следовательно, имеющие нормализованный, равномерный и структурированный характер, могут иметь больший вес, чем дескрипторы типа ключевых слов, которые могли быть присвоены самими пользователями сайта обмена фотографиями.
Был выявлен ряд неожиданных и положительных эффектов. Выяснилось, в частности, что способ согласно изобретению позволяет пользователю обходиться в некоторой степени без языка используемых текстовых дескрипторов. Это объясняется тем, что, исходя из первоначального поиска на своем языке, пользователь, применяющий предлагаемый способ для уточнения результатов поиска, может также понятным образом присваивать вес ассоциированным с объектом дескрипторам и ключевым словам на иностранном языке. Таким образом, поиск быть может в конечном итоге уточнен на основе ключевых слов на иностранном языке или, по меньшей мере, с их учетом, причем пользователь не обязательно понимает этот иностранный язык и, соответственно, не должен был ввести его непосредственно в текстовую поисковую машину.
В соответствии с одним из предпочтительных вариантов осуществления набор первоначально представленных пользователю объектов соответствует всем или части объектов, являющихся результатом первоначального поиска в базе(ах) данных, в частности по ключевому слову. Совершенно очевидно, что возможны любые способы первоначального поиска, позволяющие генерировать первый набор объектов. Помимо традиционного поиска, когда используются текстовое поле и ввод слов пользователем, можно предусмотреть выбор объектов непосредственно на основе географических координат на карте или даже на основе первой фотографии, которая может быть проанализирована, например, с целью извлечения из нее параметров поиска, и т.д.
В зависимости от количества объектов, возвращенных упомянутым первоначальным поиском, можно выбрать представление пользователю лишь части результатов, например, десяти тысяч первых фотографий поиска по ключевым словам в базе данных фотографий.
Следует также отметить, что поиск в базе или базах данных может выполняться как во внутренней базе данных, так и во внешних базах данных, находящихся, например, на специальных удаленных сайтах.
Можно также выбрать вариант, в соответствии с которым первоначальный поиск не проводится, а пользователю представляют набор типовых объектов, характеризующих, например, крупные классы базы данных. При этом пользователь может легко осуществлять навигацию по базе данных, последовательно уточняя свои выборки с помощью способа, который является объектом настоящего изобретения.
Предпочтительно, объекты из набора объектов, первоначально представленных пользователю, представляют в порядке, определяемом при получении данного набора объектов, в частности в порядке релевантности по отношению к первоначальному поиску, причем эта релевантность может, в частности, быть определена алгоритмом поиска. Действительно, известные поисковые машины часто ассоциируют индекс релевантности с результатами их поиска.
В качестве альтернативы или дополнения, порядок релевантности и порядок первоначального представления могут быть определены ситуативно, чтобы, например, максимизировать количество различных первоначально представляемых объектов так, чтобы предоставить пользователю максимально широкий выбор для первой процедуры уточнения и в конечном счете для последующих.
В соответствии с одним из предпочтительных вариантов осуществления веса, присваиваемые дескрипторам объектов, сочтенных нерелевантными, и веса, присваиваемые дескрипторам объектов, сочтенных релевантными, имеют противоположные знаки, в частности отрицательный и положительный знаки, соответственно.
Очевидно, что данная оценочная шкала приводится лишь в качестве примера, при этом началом отсчета не обязательно является ноль. Вполне можно выбрать и другие начала отсчета, и это будет представлять собой лишь смещение шкалы. В этом случае выражения «противоположный знак», «положительный» и «отрицательный» следует рассматривать применительно к конкретному началу отсчета.
В соответствии с первым вариантом абсолютные значения весов, присваиваемых дескрипторам объектов, сочтенных релевантными и/или нерелевантными, равны.
В соответствии со вторым вариантом вес, присваиваемый дескрипторам объектов, сочтенных релевантными, имеет иное, в частности более высокое, абсолютное значение, чем вес, присваиваемый дескрипторам объектов, сочтенных нерелевантными.
Предпочтительно, чтобы значения весов, присваиваемых дескрипторам объектов, сочтенных релевантными и/или нерелевантными, могли быть разными для каждого сигнализированного объекта.
Еще предпочтительнее, значение весов, присваиваемых дескрипторам объектов, сочтенных релевантными и/или нерелевантными, зависит от их первоначального порядка приоритета. Можно, в частности, применить к стандартному значению веса некоторый коэффициент. Так, например, объекту, который поисковая машина, выполнившая первоначальный поиск, считает на 90% релевантным, можно присвоить 90% от номинального веса, если пользователь считает этот объект релевантным.
Однако если в отличие от поисковой машины пользователь сочтет его нерелевантным, то можно выбрать присвоение этому нерелевантному объекту только 10% номинальной величины нерелевантного веса.
В соответствии с одним из предпочтительных вариантов осуществления средство для сигнализации релевантности и/или нерелевантности представленного объекта содержит средство, выполненное с возможностью сигнализации разных степеней релевантности и/или нерелевантности и позволяющее, в частности, присваивать разные веса в соответствии с сигнализированной степенью релевантности и/или нерелевантности. Таким образом, можно, в частности, предусмотреть веб-страницу, имеющую кнопки, позволяющие сообщать о том, что данный объект является, например, «очень релевантным» (первая степень), «релевантным» (вторая степень), «отчасти релевантным» (третья степень), «нерелевантным» (четвертая степень) и «не по теме» (пятая степень).
Предпочтительно, чтобы объекты-результаты представлялись в виде эскизов, миниатюр и/или фрагментов.
В соответствии с одним из частных вариантов осуществления объекты, содержащиеся в базе данных, включают в себя фотографии, и/или видео-, и/или аудиообъекты. В ней также могут присутствовать документы других типов, текстовые файлы и прочие.
В соответствии с первым вариантом осуществления индекс релевантности инициализируют одинаковыми значениями для каждого объекта-результата, в частности нулем.
В соответствии со вторым вариантом осуществления индекс релевантности инициализируют разными значениями для всех или части объектов-результатов, в частности в зависимости от первоначального порядка представления и, при необходимости, от значения релевантности, возвращенного первоначальным поиском.
В соответствии с более усовершенствованным вариантом осуществления все или часть дескрипторов наиболее релевантных возвращенных объектов вводят в новый поиск в базе данных.
Сущность изобретения станет более понятной из нижеследующего подробного описания, которое приводится со ссылками на приложенные чертежи, где
- на фиг.1 представлен скриншот веб-сайта, на котором реализован способ согласно изобретению, в частности первый этап представления пользователю результатов первоначального поиска по ключевому слову;
- фиг.2 представляет собой скриншот веб-сайта с фиг.1, где пользователь сигнализировал фотографию, которую он считает релевантной своему поиску;
- фиг.3 представляет собой скриншот сайта с фиг.1, где пользователь сигнализировал фотографию, которую он считает нерелевантной своему поиску;
- фиг.4 представляет собой скриншот после запуска этапа уточнения поиска пользователем;
- фиг.5 представляет собой скриншот сайта с фиг.1, иллюстрирующий результат этапа уточнения, выполненного на основании сигналов пользователя, указывающих на релевантность и нерелевантность;
- фиг.6 представляет собой логическую блок-схему, схематически иллюстрирующую последовательность этапов способа, показанных на фиг.1-5.
Со ссылкой также на фиг.6 на фиг.1-5 показаны скриншоты веб-сайта, в котором реализован способ согласно изобретению для поиска фотоснимков автомобильных фар.
На фиг.1 показан первый этап 101, на котором пользователю представлен набор миниатюр фотографий Р1-Р14.
Этот набор фотографий Р1-Р14 получен посредством первоначального поиска по ключевому слову в одной или нескольких базах данных фотографий.
В данном случае для задания проводимого им поиска пользователь использовал ключевое французское слово «phare», которое он набрал в поле R поиска страницы.
Поле R поиска служит в качестве интерфейса с пользователем и вводит данные в поисковую машину, которая может быть внутренней или внешней по отношению к сайту, в базах данных фотографий. Такие базы данных содержат большое количество фотографий, при этом для облегчения последующих поисков с ними ассоциированы дескрипторы. В частности, эти дескрипторы содержат списки ключевых слов, но могут также являться специфическими параметрами фотографии (использованный фотоаппарат, технические данные, цветовой профиль и пр.).
Очевидно, что использование только одного ключевого слова «phare» естественным образом ведет к неоднозначности, так как оно имеет различные значения во французском языке, которые поисковая машина не может разделить.
Таким образом, поисковая машина возвращает результаты своего поискового алгоритма и представляет их пользователю в виде четырнадцати миниатюр фотографий Р1-Р14.
Следует заметить, что четырнадцать представленных пользователю фотографий не обязательно должны соответствовать всем результатам первоначального поиска, так что вполне может быть выбрано представление пользователю только части результатов, например, тысячи первых возвращенных фотографий.
Как видно на фиг.1, фотографии Р1, Р2, Р4, Р5, Р7, Р8, Р9, Р11, Р12 относятся к фотографиям навигационных береговых маяков.
В то время как фотографии Р3, Р6, Р10, Р13, Р14 относятся к фотографиям автомобильных фар.
Каждая фотография ассоциирована в своей или другой базе данных с одним или несколькими дескрипторами.
Для примера, будем считать, что фотографии Р1, Р2, Р4, Р5, Р7, Р8, Р9, Р11, Р12 ассоциированы с дескриптором, который представляет собой ключевое французское слово «phare», а каждая из фотографий Р3, Р6, Р10, Р13, Р14-ассоциирована с двумя французскими дескрипторами «phare» и «voiture» (машина).
В соответствии со способом согласно изобретению каждая из фотографий Р1-Р14 представлена пользователю вместе с активным изображением I1, которое представляет собой подтверждающую галочку, и активным изображением I2, которое представляет собой запрещающий крестик.
Эти активные изображения ассоциированы с вычислительными функциями, записывающими выбор пользователя и представляющими собой средства, позволяющие пользователю сигнализировать релевантность (галочка) и/или нерелевантность (крестик) каждой фотографии по отношению к его фактическому поиску.
Следует понимать, что изображения галочки и крестика приводятся здесь лишь в качестве примеров и что возможно любое иное аналогичное отображение, включая активный текст, информирующий пользователя о имеющемся выборе.
Далее на этапе 102 пользователь приступает к сигнализации фотографий, которые он считает релевантными и/или нерелевантными.
Фиг.2 представляет собой скриншот, где показано, что пользователь сигнализировал, что фотография Р14 релевантна его фактическому поиску. Сообщение М1 информирует пользователя о том, что его сигнализация надлежащим образом учтена сайтом или программными средствами.
Фиг.3 представляет собой скриншот, где показано, что пользователь сигнализировал, что фотография Р4 не релевантна его фактическому поиску, поскольку она изображает береговой маяк. Сообщение М2 информирует пользователя о том, что его сигнализация была надлежащим образом учтена сайтом или программными средствами.
В соответствии с рассматриваемым примером сообщения М1 и М2 выводятся в виде всплывающего окна (которое выводится поверх других окон). Следует понимать, что эти сообщения могут быть сигнализированы пользователю и в иных формах, в частности посредством группирования выбранных изображений, визуализации на боковом поле, создания виртуальных корзин для изображений, отобранных в качестве релевантных и нерелевантных, и т.д.
После того как пользователь завершил отбор фотографий, которые он считает релевантными и/или нерелевантными своему поиску, он активирует процедуру уточнения поиска, щелкая, например, на кнопку В. Один из примеров экрана обработки показан на фиг.4.
Совершенно очевидно, что процедура уточнения может происходить и в реальном времени в соответствии со взаимодействиями пользователя, однако это потребует больших вычислительных ресурсов и, в частности, поддержки удаленного сервера.
Этапы обработки являются понятными для пользователя.
На этапе 103 каждому дескриптору, ассоциированному с каждым изображением, сигнализированным пользователем, присваивают вес Р. Вес Р получает отрицательный знак, если изображение было сигнализировано как нерелевантное, и положительный знак, если изображение было сигнализировано как релевантное.
В рассматриваемом здесь примере фотография Р4, с которой ассоциирован дескриптор «phare», была сигнализирована как нерелевантная, а фотография Р14 с двумя дескрипторами «phare» и «voiture» была сигнализирована как релевантная.
Таким образом, дескриптору «phare» присваивают вес -Р вследствие нерелевантности, сигнализированной для фотографии Р4, и вес +Р вследствие релевантности, сигнализированной для фотографии Р14. Аналогично, дескриптору «voiture» также присваивают вес +Р вследствие релевантности, сигнализированной для фотографии Р14.
На этапе 104 вычисляется суммарный результат весов, присвоенных каждому дескриптору набора изображений Р1-Р14.
Таким образом, в данном случае дескриптор «phare» имеет нулевой суммарный вес, а дескриптор «voiture» - суммарный вес +Р.
Упомянутый суммарный результат представляет собой набор дескрипторов фотографий Р1-Р4, которым присвоены соответствующие веса, вычисленные ранее.
Перед тем как приступать к уточнению и сортировке представленных объектов, каждой фотографии Р1-Р14 присваивают индекс релевантности, который на этапе 105 инициализируют нулем.
Таким образом, все фотографии Р1-Р14 имеют одинаковые приоритет и релевантность.
На этапе 106 каждую из фотографий Р1-Р14 сопоставляют с упомянутым суммарным результатом весов дескрипторов.
Для этого каждый дескриптор фотографий Р1-Р14 сопоставляют с упомянутым суммарным результатом, после чего увеличивают или уменьшают индекс приоритета на вес этого дескриптора в упомянутом суммарном результате.
Таким образом, для фотографии Р1, на которой изображен береговой маяк и которая имеет только дескриптор «phare», индекс приоритета увеличивают или уменьшают на вес дескриптора «phare» в упомянутом суммарном результате, а именно на ноль, то есть его индекс приоритета остается нулевым.
То же самое справедливо для фотографии Р2.
Однако на фотографии Р3 изображены автомобильные фары. Как уже упоминалось выше, данная фотография ассоциирована с двумя дескрипторами - «phare» и «voiture». Что касается дескриптора «phare», то его индекс не меняется, поскольку вес этого дескриптора равен нулю. Однако что касается дескриптора «voiture», то его индекс приоритета увеличивается на вес дескриптора «voiture» в упомянутом суммарном результате, то есть на +Р. Таким образом, его индекс приоритета становится равным +Р.
Так же действуют с фотографиями Р4-Р14.
Итак, достаточно лишь переупорядочить фотографии Р1-Р14 в соответствии с их заново вычисленным индексом приоритета и на этапе 107 повторно вывести их на экран в порядке убывания их индекса релевантности с тем, чтобы сначала отображались фотографии автомобильных фар, а уже за ними следовали фотографии береговых маяков.
На фиг.5 приведен скриншот, на котором показано окончательное переупорядочивание, где надлежащим образом представлены только фотографии автомобильных фар.
Необходимо отметить, что на фиг.5 показаны также фотографии, которые отсутствовали на первоначальном представленном экране. Действительно, вполне можно выбрать набор первоначальных фотографий, состоящий из большего количества, чем четырнадцать представленных снимков, при этом некоторые из них будут скрыты для пользователя. Тем не менее, они присутствуют в первоначальной подборке и учитываются при реализации способа. Таким образом, они также получают некоторый индекс релевантности, который изменяет их порядок в подборке. В конечном итоге они могут оказаться среди четырнадцати первых фотографий и, следовательно, будут представлены пользователю.
Что касается первоначальных фотографий маяков, то они будут помещены после четырнадцатой и, соответственно, уже не будут отображаться.
Очевидно, пользователь может затем выполнить новое уточнение своего поиска, в частности, если ему будут представлены новые фотографии (этап 108), или прекратить свой поиск (109).
Хотя выше изобретение было описано применительно к конкретному примеру осуществления, подразумевается, что оно никоим образом не ограничивается им и охватывает всевозможные технические эквиваленты рассмотренных здесь средств, а также их комбинации, при условии, что они не выходят за рамки объема правовой охраны изобретения.
Так, например, можно предусмотреть дополнительные средства сигнализации, например, «нейтральную» кнопку вдобавок к другим средствам, используемым для сигнализации характеристик релевантности и/или нерелевантности.
Можно также предусмотреть средство повторной инициализации весов и индекса релевантности на случай ошибки пользователя или если он пожелает начать уточнение с использованием других критериев.
Кроме того, несмотря на то, что изобретение было описано применительно к фотографиями, подразумевается, что оно не ограничивается только ими и при его реализации можно использовать цифровые файлы любого другого типа, которым могут быть присвоены дескрипторы. Можно, в частности, точно также реализовать заявляемый способ применительно к аудиофайлам, которые будут, например, ассоциированы с дескрипторами, относящимися к их музыкальному стилю, характеру звучания, инструментам и другим свойствам, а также применительно к видеофайлам, анимированным изображениям, документам, текстовым файлам, в частности сканированным букинистическим книгам и другим объектам.
название | год | авторы | номер документа |
---|---|---|---|
СПОСОБ ПОИСКА В БАЗЕ ДАННЫХ | 2014 |
|
RU2698405C2 |
СПОСОБ ПОИСКА ИНФОРМАЦИИ В ПОЛИТЕМАТИЧЕСКИХ МАССИВАХ НЕСТРУКТУРИРОВАННЫХ ТЕКСТОВ | 2004 |
|
RU2266560C1 |
СИСТЕМА И СПОСОБ ДЛЯ ВЫБОРА ЗНАЧИМЫХ ЭЛЕМЕНТОВ СТРАНИЦЫ С НЕЯВНЫМ УКАЗАНИЕМ КООРДИНАТ ДЛЯ ИДЕНТИФИКАЦИИ И ПРОСМОТРА РЕЛЕВАНТНОЙ ИНФОРМАЦИИ | 2015 |
|
RU2708790C2 |
МЕТОД ОТОБРАЖЕНИЯ РЕЛЕВАНТНОЙ КОНТЕКСТНО-ЗАВИСИМОЙ ИНФОРМАЦИИ | 2014 |
|
RU2683482C2 |
СПОСОБ УСТАНОВЛЕНИЯ В ХРАНИЛИЩЕ МЕСТОПОЛОЖЕНИЯ ОБЪЕКТА ПО ПОИСКОВОМУ ТЕМАТИЧЕСКОМУ ПРИЗНАКУ | 1994 |
|
RU2107942C1 |
РАСПОЗНАВАНИЕ СОБЫТИЙ НА ФОТОГРАФИЯХ С АВТОМАТИЧЕСКИМ ВЫДЕЛЕНИЕМ АЛЬБОМОВ | 2020 |
|
RU2742602C1 |
СПОСОБ ПОИСКА WEB-СТРАНИЦ ПО КОМБИНИРОВАННОМУ ЗАПРОСУ | 2008 |
|
RU2393537C2 |
ИДЕНТИФИКАЦИЯ СЕМАНТИЧЕСКИХ ВЗАИМООТНОШЕНИЙ В КОСВЕННОЙ РЕЧИ | 2008 |
|
RU2488877C2 |
РАСШИРЕНИЕ ВОЗМОЖНОСТЕЙ ИНФОРМАЦИОННОГО ПОИСКА | 2015 |
|
RU2618375C2 |
ПРЕДОСТАВЛЕНИЕ УВЕДОМЛЕНИЙ НА ОСНОВЕ РЕЗУЛЬТАТОВ ПОИСКА ГЕОФЕНСИНГА | 2016 |
|
RU2696294C1 |
Изобретение относится к способу уточнения результатов поиска объектов в базе данных. Технический результат заключается в повышении точности поиска данных. В способе выполняют представление пользователю набора объектов базы данных, каждый из которых ассоциирован с одним средством, позволяющим пользователю сигнализировать релевантность, и с одним средством, позволяющим пользователю сигнализировать нерелевантность объекта по отношению к его поиску, присвоение, в зависимости от сигнализации пользователя, веса дескрипторам объекта из набора представленных объектов, которые пользователь считает релевантными или нерелевантными своему поиску, вычисление суммарного результата весов, ассоциированных с каждым дескриптором набора объектов-результатов, инициализация индекса релевантности для каждого объекта-результата, сопоставление каждого объекта-результата с суммарным результатом и увеличение или уменьшение индекса релевантности объекта для каждого дескриптора сопоставляемого объекта-результата в зависимости от веса этого дескриптора в суммарном результате, представление пользователю объектов-результатов в порядке их вычисленного индекса релевантности. 13 з.п. ф-лы, 6 ил.
1. Способ уточнения результатов поиска объектов в по меньшей мере одной базе данных, содержащей по меньшей мере один набор объектов, каждый из которых ассоциирован с по меньшей мере одним дескриптором, причем данный способ содержит следующие этапы:
- представление пользователю всего или части набора объектов базы данных, причем каждый из по меньшей мере одной части представляемых объектов ассоциирован с по меньшей мере одним средством, позволяющим пользователю сигнализировать релевантность, и/или по меньшей мере одним средством, позволяющим пользователю сигнализировать нерелевантность упомянутого объекта по отношению к его поиску,
- присвоение, в зависимости от сигнализации пользователя, по меньшей мере одного веса всем или части дескрипторов объекта из упомянутого набора представленных объектов, которые пользователь считает релевантными и/или нерелевантными своему поиску,
- вычисление суммарного результата весов, ассоциированных с каждым дескриптором набора объектов-результатов,
- инициализация индекса релевантности для каждого объекта-результата,
- сопоставление каждого объекта-результата с упомянутым суммарным результатом, и увеличение или уменьшение индекса релевантности объекта для каждого дескриптора сопоставляемого объекта-результата в зависимости от веса этого дескриптора в упомянутом суммарном результате,
- представление пользователю всех или части объектов-результатов в порядке их вычисленного индекса релевантности.
2. Способ по п.1, отличающийся тем, что набор объектов, первоначально представленных пользователю, соответствует всем или части объектов, являющихся результатом первоначального поиска в базе (ах) данных, в частности по ключевому слову.
3. Способ по любому из пп.1 или 2, отличающийся тем, что объекты из набора объектов, первоначально представленных пользователю, представляют в порядке, определенном при получении упомянутого набора объектов, в частности в порядке релевантности по отношению к первоначальному поиску, причем эта релевантность может, в частности, быть определена алгоритмом поиска.
4. Способ по любому из пп.1 или 2, отличающийся тем, что веса, присваиваемые дескрипторам объектов, сочтенных нерелевантными, и веса, присваиваемые дескрипторам объектов, сочтенных релевантными, имеют противоположные знаки, в частности, отрицательный и положительный знаки, соответственно.
5. Способ по любому из пп.1 или 2, отличающийся тем, что абсолютные значения весов, присваиваемых дескрипторам объектов, сочтенных релевантными и/или нерелевантными, равны.
6. Способ по любому из пп.1 или 2, отличающийся тем, что вес, присваиваемый дескрипторам объектов, сочтенных релевантными, имеет иное, в частности более высокое, абсолютное значение, чем вес, присваиваемый дескрипторам объектов, сочтенных нерелевантными.
7. Способ по любому из пп.1 или 2, отличающийся тем, что значения весов, присваиваемых дескрипторам объектов, сочтенных релевантными и/или нерелевантными, могут быть разными для каждого сигнализированного объекта.
8. Способ по п.7, отличающийся тем, что значение весов, присваиваемых дескрипторам объектов, сочтенных релевантными и/или нерелевантными, зависит от их первоначального порядка приоритета.
9. Способ по любому из пп.1, 2, 8, отличающийся тем, что средство для сигнализации релевантности и/или нерелевантности представленного объекта представляет собой средство, выполненное с возможностью сигнализации разных степеней релевантности и/или нерелевантности, что позволяет, в частности, осуществлять присвоение разного веса в соответствии с сигнализированной степенью релевантности и/или нерелевантности.
10. Способ по любому из пп.1, 2, 8, отличающийся тем, что представление объектов-результатов осуществляют в виде эскизов, миниатюр и/или фрагментов.
11. Способ по любому из пп.1, 2, 8, отличающийся тем, что объекты, содержащиеся в базе данных, включают в себя фотографии, и/или видео-, и/или аудиообъекты.
12. Способ по любому из пп.1, 2, 8, отличающийся тем, что инициализацию индекса релевантности осуществляют одинаковыми значениями для всех объектов-результатов, в частности нулем.
13. Способ по любому из пп.1, 2, 8, отличающийся тем, что инициализацию индекса релевантности осуществляют разными значениями для всех или части объектов-результатов, в частности, в зависимости от первоначального порядка представления и, при необходимости, в зависимости от значения релевантности, возвращенного первоначальным поиском.
14. Способ по любому из пп.1, 2, 8, отличающийся тем, что все или часть дескрипторов наиболее релевантных возвращенных объектов вводят в новый поиск в базе данных.
Способ обработки целлюлозных материалов, с целью тонкого измельчения или переведения в коллоидальный раствор | 1923 |
|
SU2005A1 |
US 5899999 A1, 04.05.1999 | |||
EP 1202187 A2, 02.05.2002 | |||
Станок для изготовления деревянных ниточных катушек из цилиндрических, снабженных осевым отверстием, заготовок | 1923 |
|
SU2008A1 |
УСТАНОВЛЕНИЕ СООТВЕТСТВИЯ ЗАПРОСА И ЗАПИСИ | 2005 |
|
RU2378693C2 |
СПОСОБ РАНЖИРОВАНИЯ РЕЗУЛЬТАТОВ ПОИСКА | 2009 |
|
RU2402062C1 |
Авторы
Даты
2017-03-14—Публикация
2012-03-19—Подача