Область техники, к которой относится изобретение
Настоящее изобретение относится к системе поиска информации, способной эффективно осуществлять поиск нужной информации в базе данных, хранящей информацию поддержки сервиса.
Уровень техники
Для поиска нужной информации из огромного объема информации поддержки сервиса пользователю необходимо ввести соответствующее ключевое слово в систему поиска информации. Однако поскольку для пользователей, не обладающих достаточными знаниями или не имеющих необходимого опыта, затруднительно ввести соответствующее ключевое слово, они могут столкнуться с проблемой, что они не могут найти никакую нужную информацию. В такой ситуации, Патентная литература 1 предлагает систему поиска информации, способную находить нужную информацию, даже когда введено несоответствующее ключевое слово, путем осуществления поиска с использованием подобных по значению слов в дополнение к введенного ключевому слову.
Список литературы
Патентная литература
Патентная литература 1: Выложенная заявка на выдачу патента Японии No. 2019-121392
Раскрытие сущности изобретения
Техническая проблема
Однако, поскольку система поиска информации согласно Патентной литературе 1 выполняет поиск с использованием введенного ключевого слова, равно как слов с подобными значениями, в зависимости от введенного ключевого слова, количество результатов поиска становится огромным. Вследствие этого, даже если в результаты поиска попадет какая-либо нужная информация, очень много времени потребует идентификация нужной информации путем проверки по разу каждого результата из огромного числа результатов поиска.
Настоящее изобретение разработано с учетом описанной выше проблемы, и целью настоящего изобретения является создание системы поиска информации, способной эффективно идентифицировать нужную информацию из огромного объема информации поддержки сервиса.
Решение проблемы
Система поиска информации согласно настоящему изобретению содержит: базу данных для сохранения информации поддержки сервиса; и устройство управления информацией для поиска заданной информации из информации поддержки сервиса, это устройство управления информацией содержит модуль приема запросов для приема вводимого запроса, содержащего ключевое слово, от пользователя, осуществляющего поиск, (далее - пользователя), модуль приема классификационной информации для ввода классификационной информации, которой принадлежит сужающее ключевое слово, модуль представления сужающего ключевого слова для представления сужающего ключевого слова, принадлежащего введенной классификационной информации и имеющего корреляционное отношение к ключевому слову, выбираемым способом, и поисковый модуль для выполнения процедуры поиска, этот поисковый модуль выполняет процедуру поиска в базе данных на основе введенного ключевого слова и выбранного сужающего ключевого слова.
Информация поддержки сервиса может представлять собой информацию поддержки обслуживания оборудования, сужающее ключевое слово, представленное модулем представления сужающего ключевого слова, может быть ключевым словом, имеющим корреляционное отношение к ключевому слову, введенному в модуль приема запросов в сервисе поддержки оборудования, и модуль представления сужающего ключевого слова может быть конфигурирован для представления двух или более сужающих ключевых слов вместе с соответствующими корреляциями.
Система поиска информации может далее содержать модуль хранения информации для сохранения информации о классификационных дефинициях, которые определяют, к какому сегменту классификационной информации принадлежит конкретное сужающее ключевое слово.
Преимущества изобретения
Согласно настоящему изобретению можно создать систему поиска информации, способную эффективно идентифицировать нужную информацию из огромного объема информации поддержки сервиса.
Краткое описание чертежей
Фиг. 1 представляет блок-схему, иллюстрирующую конфигурацию системы поиска информации, представляющей собой один из вариантов настоящего изобретения.
Фиг. 2 представляет упрощенную схему, иллюстрирующую один пример правил для названий папок и имен файлов.
Фиг. 3A представляет упрощенную схему, иллюстрирующую один пример классификационной информации, сохраняемой в модуле хранения информации о классификационных дефинициях.
Фиг. 3B представляет упрощенную схему, иллюстрирующую один пример системы (дефиниции) для создания слов, принадлежащих классификации.
Фиг. 4A представляет упрощенную схему, иллюстрирующую один пример ключевых слов, определяющих тип информации, где эти слова сохраняются в словаре для определения типа информации.
Фиг. 4B представляет упрощенную схему, иллюстрирующую один пример ключевых слов, сохраняемых в словаре ключевых слов.
Фиг. 5 представляет логическую схему, иллюстрирующая последовательность процедуры поиска информации согласно одному из вариантов настоящего изобретения.
Фиг. 6A представляет упрощенную схему, иллюстрирующую один пример изображения первого экрана дисплея.
Фиг. 6B представляет упрощенную схему, иллюстрирующую один пример изображения второго экрана дисплея.
Фиг. 6C представляет упрощенную схему, иллюстрирующую один пример изображения третьего экрана дисплея.
Фиг. 6D представляет упрощенную схему, иллюстрирующую один пример изображения четвертого экрана дисплея.
Фиг. 6E представляет упрощенную схему, иллюстрирующую один пример изображения пятого экрана дисплея.
Фиг. 6F представляет упрощенную схему, иллюстрирующую один пример изображения шестого экрана дисплея.
Осуществление изобретения
Теперь будет описана система поиска информации согласно одному из вариантов настоящего изобретения. Ниже в качестве одного из примеров информации поддержки сервиса будет рассмотрена информация сервиса поддержки обслуживания оборудования. В приведенном ниже рассмотрении «информация сервиса поддержки оборудования» может иногда называться просто «информация» или «данные».
Конфигурация
Конфигурация системы поиска информации в одном из вариантов настоящего изобретения будет теперь рассмотрена со ссылками фиг. 1. На фиг. 1 представлена блок-схема, иллюстрирующая конфигурацию системы поиска информации согласно одному из вариантов настоящего изобретения. Как иллюстрировано на фиг. 1, система поиска информации согласно одному из вариантов настоящего изобретения содержит устройство 10 управления информацией, базу 12 данных, сохраняющую несколько сегментов информации сервиса поддержки оборудования, в которых нужно произвести поиск, несколько файловых серверов 14 и терминал 20 пользователя. Эти устройство 10 управления информацией, база 12 данных, файловые серверы 14 и терминал 20 пользователя соединены одно с другим через сеть 18 связи.
Сеть 18 представляет собой такую сеть связи, как локальная сеть связи (local area network (LAN)), управляемая организацией (компанией), к которой принадлежит пользователь. Однако эта сеть 18 связи может также представлять собой сеть связи общего пользования, такую как Интернет, либо сеть связи, частично содержащую общедоступную линию связи, такую как широкомасштабная сеть связи (wide area network (WAN)) или виртуальная частная сеть связи (virtual private network (VAN)).
Каждый объект - устройство 10 управления информацией и терминал 20 пользователя, реализован посредством компьютера и компьютерной программы. К примерам терминала 20 пользователя относится мобильный терминал, такой как смартфон, персональный компьютер и планшетный компьютер. С терминалом 20 пользователя соединены или интегрированы в этот терминал устройство 22 ввода, такое как клавиатура или мышь, и дисплейное устройство 24, такое как дисплей.
Документы, такие как отчеты и руководства, чертежи и фотографии, хранящиеся на каждом из файловых серверов 14, собирают и сохраняют в базе 12 данных. Такими документами могут быть не только документы, первоначально созданные путем ввода текста, но также документы, созданные посредством преобразования голоса в тексты с использованием механизма распознавания речи, и документы, созданные путем преобразования изображений текстов на бумажных носителях в текстовые данные с использованием оптического считывателя символов (optical character reader (OCR)). Когда сохранены чертежи и фотографии, эти чертежи и фотографии сохраняют в форме, позволяющей осуществлять поиск символов на чертежах и в именах файлов. В информацию, сохраняемую в базе 12 данных, входит такая информация, как рабочие стандарты и руководства, относящиеся к отказам и проблемам оборудования и т.п., а также к причинам и способам решения таких проблем. В рассматриваемом варианте, предполагается, что конкретное оборудование или объекты располагаются в нескольких регионах (например, в нескольких странах или префектурах) и что файловые серверы 14 развернуты в этих регионах.
Устройство 10 управления информацией содержит модуль 110 регистрации информации, модуль 120 поиска информации и разнообразные модули хранения информации (словарь 50 ключевых слов, модуль 52 хранения информации о классификационных дефинициях, модуль 54 хранения информации для поиска и словарь 56 для определения типа информации). В рассматриваемом варианте, для облегчения понимания, конфигурации для реализации функции регистрации и функции поиска будут пояснены в качестве раздельных функций - как модуль 110 регистрации информации и модуль 120 поиска информации, соответственно, но для осуществления этих двух функций может быть также использована единая конфигурация. Модуль 110 регистрации информации конфигурирован так, чтобы быть способным выполнять функцию регистрации, как отмечено выше, и более конкретно, процедуру сохранения информации, хранящейся на файловых серверах 14, в базе 12 данных. Модуль 110 регистрации информации содержит модуль 112 синхронизации информации, модуль 114 обработки информации и модуль 116 процессора сохранения информации.
Модуль 112 синхронизации информации автоматически выполняет синхронизацию информации, сохраняемой в базе 12 данных, с информацией, сохраняемой на файловых серверах 14, на регулярной или нерегулярной основе. Когда имеется новый сегмент 12, сохраненный на файловых серверах 14, но не сохраняемый в базе 12 данных, модуль 112 синхронизации информации получает этот новый сегмент данных по сети 18 связи. Модуль 114 обработки информации применяет заданную процедуру обработки данных к данным, получаемым модулем 112 синхронизации информации. В рассматриваемом варианте, в ходе обработки данных к этим данным добавляют информацию о типе обрабатываемой информации. Эта информация о типе обрабатываемой информации представляет собой информацию, обозначающую тип информации, к которому относится документ. Модуль 114 обработки информации идентифицирует тип информации на основе папки, в которой рассматриваемый документ сохранен на файловых серверах 14, и имени файла, в котором находятся данные, например. На фиг. 2 представлена упрощенная схема, иллюстрирующая один пример правил для определения названий папок, подготовленных на файловых серверах 14 и имен файлов данных, хранящихся в этих папках. Когда тип информации идентифицируют на основе папок, например, модуль 114 обработки информации идентифицирует, обращаясь к фиг. 2, тип информации данных, сохраняемых в папке «отчеты о неисправностях» ("failure reports"), как «случаи неисправностей» ("failure cases"); идентифицирует тип информации данных, сохраняемых в папках «рабочие стандарты» ("work standards"), «процедуры создания» ("creation procedures") и «документы по безопасности» ("safety documents") как «руководства» или «инструкции» ("manuals"); идентифицирует тип информации данных, сохраняемых в папке «ноу-хау по обслуживанию» ("maintenance know-hows"), как «ноу-хау по обслуживанию» ("maintenance know-hows"); идентифицирует тип информации данных, сохраняемых в папке «чертежи» ("drawings"), как «чертежи» ("drawings"); идентифицирует тип информации данных, сохраняемых в папке «журналы обслуживания» ("maintenance logs"), как «журнал обслуживания» ("maintenance log"); и идентифицирует тип информации данных, сохраняемых в папке «операционные стандарты» ("operation standards"), как «операционные стандарты» ("operation standards"). Когда тип информации идентифицируют на основе имен файлов, в результате того, что создатель данных формирует имя файла на основе правил создания файла, обозначенных на фиг. 2, модуль 114 обработки информации имеет возможность идентифицировать, что какой-то сегмент данных принадлежит к типу "failure cases", например, на основе имени файла, хотя поэтапное пояснение здесь опущено.
В ходе обработки данных, модуль 114 обработки информации также назначает классификационную информацию сегменту данных на основе классификационной информации, сохраненной в модуле 52 хранения информации о классификационных дефинициях. На фиг. 3A представлена упрощенная иллюстрация одного примера классификационной информации, сохраненной в модуле 52 хранения информации о классификационных дефинициях. Как показано на фиг. 3A, классификационную информацию определяют на основе правил, показанных на фиг. 3B, какой из классификационных категорий принадлежит конкретное слово. Фиг. 3A обозначает, что слово "abc" принадлежит классификационной категории «условия» ("conditions") и назначено классификационной информации "D51", например, и поэтому, когда сегмент полученных данных содержит слово "abc", классификационную информацию "D51", назначенную этому слову "abc", добавляют к рассматриваемому сегменту данных. Это назначение классификационной информации может быть опущено, но благодаря осуществлению этой процедуры, вычисления корреляции, производимые модулем 126 вычисления корреляции, могут быть выполнены эффективно.
Возвращаясь к фиг. 1, модуль 116 процессора сохранения информации сохраняет данные, полученные в результате обработки данных модулем 114 обработки информации, в базе 12 данных. Модуль 116 процессора сохранения информации разбивает сегменты данных по соответствующим типам информации и сохраняет эти данные в базе 12 данных (см. фиг. 1). Эти данные могут быть сохранены в базе 12 данных на регулярной или нерегулярной основе посредством модуля 110 регистрации информации, а также посредством регистратора через терминал 20 пользователя, например. Когда данные регистрируют посредством регистратора, правила, обозначенные на фиг. 2, представляют на экране оперируемого регистратором дисплея 24 или другого подобного устройства в терминале 20 пользователя. При таком подходе, регистратор может установить имя файла для данных прежде, чем эти данные будут сохранены в базе 12 данных.
Модуль 120 поиска информации осуществляет поиск и вызывает конкретный сегмент информации поддержки оборудования из базы 12 данных на основе инструкции поиска от терминала 20 пользователя. Модуль 120 поиска информации содержит модуль 121 приема запросов, модуль 122 лингвистической обработки, модуль 123 считывания поискового ключевого слова-кандидата, модуль 124 определения типа информации, модуль 125 приема классификационной информации, модуль 126 вычисления корреляции, модуль 127 представления сужающего ключевого слова и поисковый модуль 130.
Эти функциональные блоки в общем случае имеют функции, описываемые ниже. Модуль 121 приема запросов принимает запрос, введенный пользователем через устройство 22 ввода в терминале 20 пользователя, по сети 18 связи. Формат ввода запроса не ограничен каким-либо конкретным форматом, так что могут быть введены одно или несколько слов или текст, и может быть использован текст в формате естественного языка. Например, запрос содержит такой текст, как «Каким является решение проблемы неисправности оборудования BB на объекте AA?» ("What is the solution to a failure occurred in BB equipment in an AA facility?") или несколько слов, разделенных промежутками, например, вводят "AA equipment BB equipment" через терминал 20 пользователя.
Модуль 122 лингвистической обработки выделяет слово (независимое слово) путем применения обработки лингвистической информации, такой как известный морфологический анализ, к запросу, принятому модулем 121 приема запросов. В частности, модуль 122 лингвистической обработки выделяет введенные поисковые ключевые слова, которые должны быть использованы при последующем поиске, и ключевое слово, определяющее тип информации, для использования при определении типа информации, представляющего намерение (цель) поиска, из введенного запроса. Например, когда введен текст запроса "What is the solution to a failure occurred in BB equipment in an AA facility?", как в примере, приведенном выше, модуль 122 лингвистической обработки выделяет "AA facility" и "BB equipment" в качестве введенных поисковых ключевых слов. Модуль 122 лингвистической обработки также справляется со словарем 56 для определения типа информации (фиг. 4A), и выделяет слово, совпадающее с каким-либо словом, зарегистрированным в словаре 56 для определения типа информации, в качестве ключевого слова, определяющего тип информации. Другими словами, в приведенном выше примере, модуль 122 лингвистической обработки выделяет термины "failure" и "solution" в качестве ключевых слов, определяющих тип информации.
Далее, будут даны пояснения относительно модуля 123 считывания поискового ключевого слова-кандидата, но прежде этого будет дано пояснение словаря 50 ключевых слов. В этом словаре 50 ключевых слов, соответствующие ключевые слова зарегистрированы и сохранены заранее так, чтобы они были сопоставлены одни с другими. В рассматриваемом варианте, в словаре 50 ключевых слов, ключевые слова, имеющие одинаковое значение, также регистрируют таким образом, чтобы они были сопоставлены одни с другими. В словаре 50 ключевых слов, ключевые слова, имеющие сходные значения, также регистрируют таким образом, чтобы они были сопоставлены одни с другими. Однако в словаре 50 ключевых слов, могут быть зарегистрированы только ключевые слова, имеющие одинаковое значение, либо только ключевые слова, имеющие подобные значения. Вместо или в дополнение к этим ключевым словам могут быть заранее зарегистрированы ключевые слова, которые вероятно имеют сильную корреляцию одни с другими, таким образом, чтобы они были сопоставлены одни с другими. Слова, зарегистрированные в словаре 50 ключевых слов, могут быть добавлены в словарь или удалены из словаря по мере необходимости.
Фиг. 4B иллюстрирует один пример ключевых слов, зарегистрированных заранее в словаре 50 ключевых слов. Как показано на фиг. 4B, ключевые слова, принадлежащие одной и той же строке (горизонтальной строке), соотносятся одни с другими и сопоставлены одни с другими.
Каждый раз, когда модуль 122 лингвистической обработки выделяет входное поисковое кодовое слово, модуль 123 считывания поискового ключевого слова-кандидата справляется со словарем 50 ключевых слов и считывает кодовое слово, связанное с входным поисковым кодовым словом, в качестве поискового кодового слова-кандидата. В соответствии с приведенным выше примером, когда входным поисковым кодовым словом является "AA facility", модуль 123 считывания поискового ключевого слова-кандидата осуществляет поиск совпадения в словаре 50 ключевых слов, иллюстрируемом на фиг. 4B, и считывает все кодовые слова, принадлежащие строке, содержащей "AA facility" (первая строка на фиг. 4B), или когда было сделано назначение (например, только слова, имеющие одинаковые значения), считывает кодовые слова, совпадающие с назначением, в качестве поисковых кодовых слов-кандидатов. В этом примере, слова "OO facility", "A'A' facility" и "A"A"" считывают в качестве слов, имеющих такое же значение, как слово "AA facility", и слова "aaa" и "a'a'a'" считывают в качестве слов, имеющие значение, подобное слову "AA facility". Таким же образом, для слова "BB equipment" в примере, приведенном выше, модуль 123 считывания поискового ключевого слова-кандидата обращается ко второй строке на фиг. 4B, и считывает релевантные кодовые слова в качестве поисковых ключевых слов-кандидатов.
Модуль 54 хранения информации для поиска сохраняет поисковые кодовые слова-кандидаты, полученные описанным выше способом, и ключевые слова, определяющие тип информации, в качестве поисковых ключевых слов. Модуль 54 хранения информации для поиска сохраняет поисковые ключевые слова кумулятивно каждый раз, когда вводят дополнительный запрос, и когда выделяют дополнительные ключевые кодовые слова.
Модуль 124 определения типа информации определяет тип информации, которую пользователь желает найти, на основе ключевых слов, определяющих тип информации и выделенных из запросов. Модуль 124 определения типа информации справляется со словарем 56 для определения типа информации, иллюстрированным на фиг. 4A, и определяет тип информации, для которой будет происходить поиск, на основе ключевого слова, определяющего тип информации. В словаре 56 для определения типа информации, ключевое слово, определяющее тип информации, которое, как ожидается, будет выделено из запросов, и тип информации, соответствующий этому ключевому слову, зарегистрированы заранее таким образом, что они сопоставлены одни с другими. Например, в словаре 56 для определения типа информации, слово "failure cases" зарегистрировано в качестве типа информации для таких ключевых слов, определяющих тип информации, как "failure", "similar case" и "solution", а слово "manuals" зарегистрировано в качестве типа информации для ключевых слов, определяющих тип информации, "failure type" и "replacement procedure", таким образом, что они сопоставлены одни с другими. Хотя это не показано на фиг. 4A, для типов информации "maintenance know-hows", "drawings", "maintenance log" и "operation standards", описываемых выше со ссылками на фиг. 2, ключевые слова, определяющие тип информации, соответствующий им, сохранены в словаре 56 для определения типа информации.
Как описано выше, модуль 110 регистрации информации (модуль 116 процессора сохранения информации, описанный выше) классифицирует информацию, которая должна быть сохранена в базе 12 данных, заранее на несколько групп A, B, C, ... на основе соответствующих типов информации. Например, в примере, иллюстрируемом на фиг. 1, информацию, относящуюся к "failure cases", сохраняют в группе A, соответствующей первому типу информацию; информацию, относящуюся к "manuals", сохраняют в группе B, соответствующей второму типу информации; и информацию, относящуюся к "drawings", сохраняют в группе C, соответствующей третьему типу информации. В дальнейшем здесь, хотя это и не иллюстрировано, информацию, относящуюся к "maintenance know-hows", информацию, относящуюся к "maintenance log", и информацию, относящуюся к "operation standards", сохраняют в группе D, соответствующей четвертому типу информации, группе E, соответствующей пятому типу информации, и группе F, соответствующей шестому типу информации, соответственно. Когда тип информации, найденный модулем 124 определения типа информации, не соответствует намерениям пользователя, пользователь может изменить тип информации, произведя некоторую операцию. Например, в описываемом выше примере, группе A "failure cases" первоначально назначают ключевые слова, определяющие типы информации "failure" и "solution", однако изменив тип информации на "manuals", пользователь может осуществить поиск нужной информации среди информации, принадлежащей группе B. Когда из введенного запроса не выделено никакое ключевое слово, определяющее тип информации, группу A "failure cases" назначают в качестве первоначального типа информации, так что пользователь может изменить тип информации соответствующим образом.
Модуль 125 приема классификационной информации показывает на дисплее классификационную категорию, которой принадлежит сужающее ключевое слово, выбираемым способом. В приведенном выше примере, поиск будет осуществляться в информации, принадлежащей группе A "failure cases" с использованием слов "AA facility" и "BB equipment" (включая слова с таким же значением и слова с подобными значениями) в качестве поисковых ключевых слов, но число результатов поиска может оказаться огромным. Для уменьшения числа результатов поиска необходимо использовать дополнительные ключевые слова. Модуль 125 приема классификационной информации, модуль 126 вычисления корреляции и модуль дисплея для сужающего ключевого слова, который будет описан позднее, выполняют функцию помощи пользователю в добавлении сужающего ключевого слова.
Модуль 125 приема классификационной информации представляет на дисплее классификационные категории выбираемым способом. В рассматриваемом варианте одну из нескольких классификационных категорий, включая «линии» ("lines"), «объекты» ("facilities"), «оборудование» ("equipment"), «части» ("parts"), «условия» ("conditions") и «причины» ("causes") представляют на дисплее выбираемым способом, например, в ниспадающем меню (например, см. фиг. 6C). Число классификационных категорий конфигурируют так, что категории можно добавлять или изменять по мере необходимости.
Модуль 126 вычисления корреляции вычисляет корреляцию между поисковым ключевым словом и каждым словом, принадлежащим классификационной категории, выбранной пользователем посредством модуля 125 приема классификационной информации. В этом примере, корреляцию вычисляют на основе частот, с которыми поисковое ключевое слово и слово, принадлежащее той же классификационной категории, появляются одновременно в одном и том же отчете или в одном и том же руководстве, либо на основе числа раз, когда указанное поисковое ключевое слово и слово, принадлежащее той же классификационной категории, оказываются спарены в качестве поисковых ключевых слов, сохраняемых в модуле 54 хранения информации для поиска. Когда имеются несколько поисковых ключевых слов, корреляцию вычисляют для некоторых или всех поисковых кодовых слов на основе выбора сделанного пользователем.
Модуль 127 представления сужающего ключевого слова представляет на дисплее каждое слово, принадлежащее классификационной категории, выбранной пользователем в модуле 125 приема классификационной информации, вместе с корреляцией, вычисленной модулем 126 вычисления корреляции, пользователю выбираемым образом (например, см. фиг. 6D). Пользователь может тогда выбрать одно или несколько сужающих ключевых слов с учетом корреляций. Когда пользователь выберет конкретное сужающее ключевое слово, это выбранное сужающее ключевое слово сохраняют дополнительно в модуле 54 хранения информации для поиска в качестве поискового ключевого слова.
Поисковый модуль 130 осуществляет поиск совпадений на текстовой основе в пределах информации, сохраняемой в базе 12 данных, с использованием поисковых ключевых слов, сохраненных в модуле 54 хранения информации для поиска, (включая введенное поисковое ключевое слово, выделенное модулем 122 лингвистической обработки, и сужающее ключевое слово, выбранное пользователем в модуле 127 представления сужающего ключевого слова). В рассматриваемом варианте, поисковый модуль 130 осуществляет поиск совпадений на текстовой основе с поисковыми ключевыми словами, описываемыми выше, в пределах информации в группах A, B, C, ... в базе 12 данных, где конкретная группа поиска соответствует типу информации, найденному модулем 124 определения типа информации.
Процедура поиска информации
Далее операция системы поиска информации, в момент, когда модуль 120 поиска информации выполняет процедуру поиска информации, будет пояснена со ссылками на фиг. 5 и 6A - 6F. На фиг. 5 представлена логическая схема, иллюстрирующая последовательность процедуры поиска информации согласно одному из вариантов настоящего изобретения. На фиг. 6A - 6F приведены некоторые примеры экранов, представляемых на дисплее 24 терминала 20 пользователя, эти экраны являются примерами экранов приложений для использования системы поиска информации согласно настоящему изобретению. Операции согласно логической схеме, иллюстрированной на фиг. 5, начинаются, когда пользователь запускает указанное выше приложение на терминале 20 пользователя, например. На этапе S101, определяют, принял ли запрос модуль 121 приема запросов, и если запрос был принят (Y (Да) на этапе S101), управление системой переходит к этапу S102. Когда пользователь запускает работу приложения, на дисплее 24, например, появляется экран, иллюстрируемый на фиг. 6A. Затем пользователь может ввести запрос в пространство 200 поиска через устройство 22 ввода. Когда пользователь введет запрос в пространство 200 поиска и выберет (например, щелкнув мышкой) иконку 201 передачи, модуль 121 приема запросов примет этот запрос. В поясняемом сейчас примере модуль 121 приема запросов принимает текст запроса "What is the solution to a failure occurred in BB equipment in an AA facility?". Область 300 предыстории расположена в нижней части экрана дисплея и конфигурирована так, чтобы позволить копирование всех или некоторых запросов, введенных в пространство 200 поиска в прошлом, так что можно выбрать и скопировать некоторый диапазон из прошлых запросов и вставить его в пространство 200 поиска.
Модуль 122 лингвистической обработки затем выделяет слова (независимые слова) путем осуществления обработки лингвистической информации на естественном языке, такой как морфологический анализ текста запроса, принятого модулем 121 приема запросов (этап S102). В этом примере из текста запроса "What is the solution to a failure occurred in BB equipment in an AA facility?" выделены слова "AA facility", "BB equipment", "failure" и "solution",
Затем модуль 122 лингвистической обработки выделяет (выбирает) введенные поисковые ключевые слова и выделяет (выбирает) ключевое слово, определяющее тип информации, из совокупности слов, выделенных в результате обработки лингвистической информации (этап S103). В этом примере, модуль 122 лингвистической обработки выделяет слова "AA facility" и "BB equipment" в качестве введенных поисковых кодовых слов, обращается к словарю 56 для определения типа информации и выделяет (выбирает) слова "failure" и "solution", входящие в словарь 56 для определения типа информации, в качестве ключевых слов, определяющих тип информации.
Модуль 123 считывания поискового ключевого слова-кандидата затем обращается к словарю 50 ключевых слов и считывает кодовые слова, относящиеся к введенным поисковым ключевым словам, в качестве поисковых ключевых слов-кандидатов (этап S104). В этом примере, модуль 123 считывания поискового ключевого слова-кандидата обращается к словарю 50 ключевых слов, иллюстрированному на фиг. 4B, и считывает слова, имеющие такое же значение, и слова, имеющие подобные значения, из первой строки, к которой принадлежит слово "AA facility", являющееся введенным поисковым ключевым словом, выделенным на этапе S103, а также считывает слова, имеющие такое же значение, и слова, имеющие подобные значения, из второй строки, к которой принадлежит слово "BB equipment", в качестве поисковых ключевых слов-кандидатов.
Введенные поисковые ключевые слова и поисковые ключевые слова-кандидаты, полученные модулем 123 считывания поискового ключевого слова-кандидата, затем сохраняют в модуле 54 хранения информации для поиска (этап S105). В этом примере, слова "AA facility", "BB equipment" и слова с таким же значением, а также слова с подобными значениями в качестве ключевых слов сохраняют в модуле 54 хранения информации для поиска.
Модуль 124 определения типа информации затем определяет тип информации (намерения поиска) на основе ключевых слов, определяющих тип информации и выделенных на этапе S103, и словаря 56 для определения типа информации, иллюстрируемого на фиг. 4A (этап S106). В этом примере, слова "failure" и "solution" выделяют в качестве ключевых слов, определяющих тип информации, и поэтому модуль 124 определения типа информации обращается к словарю 56 для определения типа информации, и определяет тип "failure cases", с которым сопоставляются слова "failure" и "solution", в качестве типа информации.
Модуль 120 поиска информации затем представляет на дисплее классификационную информацию, равно как и период поиска, тип информации и введенные поисковые ключевые слова, выделенные и найденные на соответствующих этапах, описываемых выше, на экране дисплея, как это показано на фиг. 6B, например, через терминал 20 пользователя (этап S107). На экране дисплея 24, тип информации, введенные поисковые ключевые слова и классификационную информацию представляют таким образом, чтобы эти показатели можно было выбирать и удалять и тем самым позволить пользователю вносить изменения по мере необходимости. Например, когда тип информации нужно изменить, этот тип информации может быть изменен путем выбора другого типа с использованием устройства 22 ввода. В качестве периода поиска можно установить любой период, и если этот период не назначен, можно производить поиск по всему периоду. Поисковое ключевое слово можно исключить из совокупности слов, которые нужно использовать при поиске, путем удаления «галочки» из окошка, имеющегося перед этим ключевым словом. В области дисплея для поисковых ключевых слов представлена иконка 203 запроса слов таким образом, что ее можно выбирать, так что можно затребовать добавление другого ключевого слова, подобного ключевым словам, показанным в качестве поисковых ключевых слов, или удаление несоответствующего ключевого слова из совокупности слов, представленных на дисплее в качестве поисковых ключевых слов. Ключевое слово, для которого запрошено добавление или удаление, может быть добавлено или удалено, когда количество запросов для удаления или добавления достигнет заданного числа, либо может быть добавлено или удалено соответствующим образом системным администратором, получившим запрос добавления или удаления. Хотя для классификационной информации в первоначальном состоянии выбрано «не назначено» ("no designation"), например, как иллюстрировано на фиг. 6B, система конфигурирована для представления ниспадающего меню, так что можно выбрать нужную классификационную категорию, как это иллюстрировано на фиг. 6C, путем выполнения операции в этом разделе с использованием устройства 22 ввода. Далее здесь будет пояснен пример, в котором не вносят изменения в тип информации и в веденные поисковые ключевые слова, но классификационная информация изменяется от "no designation" (не назначено) к "conditions" (условия), как показано на фиг. 6B.
Когда классификационная информация изменяется от "no designation" к другой классификационной категории на этапе S107, иными словами, когда модуль 125 приема классификационной информации принимает классификационную категорию, отличную от "no designation" (Y (да) на этапе S108), управление системой переходит к этапу S109. Если классификационная информация показывает категорию "no designation" (N (Нет) на этапе S108), система управления переходит к этапу S113. На этапе S109, модуль 126 вычисления корреляции вычисляет корреляцию между поисковым ключевым словом, выбранным пользователем на этапе S107, и каждым из ключевых слов, принадлежащих классификационной категории, принятой модулем 125 приема классификационной информации. В этом примере, модуль 126 вычисления корреляции вычисляет корреляцию между обоими ключевыми словами "AA facility" и "BB equipment", и каждым из ключевых слов, принадлежащих классификационной категории "conditions".
Модуль 127 представления сужающего ключевого слова показывает величины корреляции, вычисленные на этапе S109, вместе с соответствующими словами, принадлежащими классификационной категории, принятой модулем 125 приема классификационной информации, в качестве сужающих ключевых слов, как это иллюстрировано на фиг. 6D, например, на экране дисплея 24 через терминал 20 пользователя (этап S110). Пользователь может добавить одно или несколько сужающих ключевых слов, которые будут сочтены подходящими, из совокупности слов, представленных на дисплее 24, к поисковым ключевым словам. В приведенном здесь пояснении, теперь предположим, что слово "abc", иллюстрированное на фиг. 6D, добавлено в качестве сужающего ключевого слова. Режим представления вычисленной корреляции на дисплее не ограничивается каким-то конкретным режимом, так что эти величины могут быть представлены в виде каких-то профилей (графиков), как это иллюстрировано на фиг. 6D, или в цифровом виде, в качестве примера другого режима дисплея.
На этапе S112, в зависимости от того, было ли добавлено сужающее ключевое слово на этапе S110 (этап S111), модуль 120 поиска информации показывает на дисплее тип информации, введенные поисковые ключевые слова и классификационную информацию, которые выделены, определены или выбраны пользователем на соответствующих этапах, описываемых выше, на экране дисплея 24 через терминал 20 пользователя. В частности, если одно или несколько сужающих ключевых слов добавлены к ключевым словам на этапе S110, на дисплее появляется экран, позволяющий распознавать добавленные сужающие ключевые слова, как это иллюстрировано на фиг. 6E, а если к ключевому слову не добавлено сужающее ключевое слово, на дисплее появляется экран, иллюстрированный на фиг. 6B.
В ответ на выбор иконки 202 поиска (см. фиг. 6B или 6E) на экране, представленном на дисплее 24, поисковый модуль 130 выполняет процедуру поиска в пределах информации, сохраняемой в базе 12 данных. В частности, поисковый модуль 130 выполняет процедуру поиска совпадений на текстовой основе в пределах информации, принадлежащей группе, соответствующей выбранному типу информации, из информации, сохраняемой в базе 12 данных, на основе введенного поискового ключевого слова из запроса, введенного пользователем, и также на основе сужающего ключевого слова, если имеется какое-либо сужающее ключевое слово, которое было добавлено (этап S113). В этот момент, когда типом информации является “drawings” («чертежи»), поисковый модуль 130 выполняет поиск в каком-либо одном или в обоих блоках - среди имен файлов, присвоенных чертежам, и среди текстовой информации, встроенной в виде текстовых данных в чертежи. Наконец, модуль 120 поиска информации представляет результаты поиска на дисплее 24 пользователя, как иллюстрировано на фиг. 6F (этап S114).
На экране результатов поиска, иллюстрированном на фиг. 6F, когда в результате поиска имеются совпадения с несколькими сегментами информации (документами), эти сегменты информации представляют на дисплее в соответствии с заданным правилом (например, начиная с тех, которые были сохранены в самые близкие к текущему моменту даты). Однако сегменты информации, к которым добавлена заданная рейтинговая информация, представляют на дисплее с более высокими приоритетами, несмотря на указанное заданное правило. В качестве примера такой заданной рейтинговой информации можно привести число звезд, присваиваемое информации, «полезной для решения проблем», и информации, «применимой к решению редких проблем». Эти рейтинговые звезды иллюстрированы на фиг. 6F. Эта рейтинговая информация может быть присвоена пользователем и может быть задана путем выбора числа в соответствующих степенях (на фиг. 6F, любое число звезд до пяти). В примере, показанном на фиг. 6F, "4" звезды присвоены степени «полезно для решения проблем», и "2" звезды присвоены степени «применимо к решению редких проблем», в информации, представленной выше на экране. В информации, представленной на втором месте сверху, "2" звезды присвоены степени «полезно для решения проблем» и "3" звезды присвоены степени «применимо к решению редких проблем». Когда число звезд больше, соответствующая информация имеет более высокий рейтинг, иными словами, эта информация является более полезной. В рассматриваемом варианте, хотя две степени («полезно для решения проблем» и «применимо к решению редких проблем») иллюстрированы в качестве рейтинговой информации, рейтинговая информация может представлять собой одно из этих двух степеней, либо может содержать три или более степени. Когда имеются несколько степеней рейтинговой информации, порядок представления информации на дисплее может быть определен на основе одной из степеней, включенных в рейтинговую информацию, или всех степеней, включенных в рейтинговую информацию (например, общего числа звезд, присвоенных этим степеням).
Согласно настоящему изобретению, поскольку введенное поисковое ключевое слово выделяют из запроса, введенного пользователем, и сужающее ключевое слово представляют на дисплее вместе с величиной корреляции на основе введенного поискового ключевого слова и классификационных категорий для сужающих ключевых слов, это позволяет работать с системой даже тем, кто не имеет достаточных знаний или неопытен в выборе подходящего ключевого слова в качестве сужающего ключевого слова. Тогда данные, требуемые пользователем, могут быть точно извлечены из базы данных на основе введенного поискового ключевого слова и сужающего ключевого слова, и таким образом, поиск может быть осуществлен эффективно. При таком подходе, когда происходит сбой или возникает проблема, пользователь может эффективно искать информацию, которая может быть использована для справки, как в прошлом случае, в базе данных, введя условие в виде текста. Поэтому пользователь может быстро осуществить операцию восстановления после отказа оборудования на основе найденной информации.
Пояснения для приведенного выше варианта представляют собой пример системы поиска информации, используемой в промышленности для поиска информация сервиса поддержки оборудования, однако настоящее изобретение этим не исчерпывается и может быть применено к поисковым системам типа «вопрос-ответ» (question-and-answer (Q&A)) в целом, например, таким как система поиска информации, указывающей лечение в зависимости от состояния болезни или названия заболевания, либо система поиска информации о названиях ошибок, представляемых на дисплее оборудования, такого как автомобиль, либо решения, подходящие для текущего состояния.
Приведенный выше вариант представляет собой пример, в котором данные сохраняют в группах, соответствующих типам информации в базе 12 данных, и поиск осуществляется на основе типа информации, равно как введенного поискового ключевого слова и сужающего ключевого слова, но также можно не группировать данные соответственно типам информации или не использовать тип информации в качестве ссылки для поиска. Согласно рассматриваемому варианту, как описано выше, можно использовать сужающее ключевое слово наравне с введенным поисковым ключевым словом, и поэтому, можно эффективно осуществлять поиск и извлечение нужной информации без выполнения поиска на основе типа информации.
На фиг. 6A, предполагается, что прошлые запросы, введенные пользователями, показаны в области 300 предыстории дисплея. Там представляют заданное число прошлых запросов в зависимости от размера области 300 предыстории. Поэтому запросы могут быть конфигурированы в качестве скачиваемых отдельно в форме регистрационного журнала, когда пользователь хочет идентифицировать прошлые запросы, которые не показаны в области 300 предыстории. Регистрационный журнал может быть скачиваемым, например, с заданного экрана настройки (например, экрана настройки для информации пользователя или другой подобной информации, что здесь не иллюстрировано), и пользователь может получить сегмент данных регистрационного журнала своего собственного поискового поведения (своего поведения и поведения других пользователей, когда этот пользователь является администратором с правами системного администратора) за некоторый период времени. Эти данные регистрационного журнала содержат различные операции, выполненные пользователем, иными словами, условия поиска (такие как запросы, периоды поиска и добавленные сужающие ключевые слова), информацию о просмотренных данных, информацию об операциях для присвоения рейтинга и т.п.
Выше был рассмотрен один из вариантов одного из приложений настоящего изобретения, предложенный авторами, однако настоящее изобретение не исчерпывается описаниями и чертежами, составляющими описание рассмотренного здесь варианта изобретения. Другими словами, и другие варианты, примеры и технологии работы и т.п., разработанные специалистами в рассматриваемой области на основе рассмотренного здесь варианта, все попадут в объем настоящего изобретения.
Применимость в промышленности
Согласно настоящему изобретению можно создать систему поиска информации, способную эффективно идентифицировать нужную информацию из огромного объема информации поддержки сервиса.
Список позиционных обозначений
10 устройство управления информацией
12 база данных
14 файловые серверы
18 сеть связи
20 терминал пользователя
22 устройство ввода
24 дисплей
50 словарь ключевых слов
52 модуль хранения информации о классификационных дефинициях
54 модуль хранения информации для поиска
56 словарь для определения типа информации
110 модуль регистрации информации
112 модуль синхронизации информации
114 модуль обработки информации
116 модуль процессора сохранения информации
120 модуль поиска информации
121 модуль приема запросов
122 модуль лингвистической обработки
123 модуль считывания поискового ключевого слова-кандидата
124 модуль определения типа информации
125 модуль приема классификационной информации
126 модуль вычисления корреляции
127 модуль представления сужающего ключевого слова
130 поисковый модуль.
название | год | авторы | номер документа |
---|---|---|---|
СПОСОБ И СИСТЕМА ФОРМИРОВАНИЯ РЕЗУЛЬТАТОВ ПОИСКОВОЙ ВЫДАЧИ | 2017 |
|
RU2643466C1 |
СПОСОБ ОБРАБОТКИ ЦЕЛЕВОГО СООБЩЕНИЯ, СПОСОБ ОБРАБОТКИ НОВОГО ЦЕЛЕВОГО СООБЩЕНИЯ И СЕРВЕР (ВАРИАНТЫ) | 2014 |
|
RU2589856C2 |
ОБНАРУЖЕНИЕ ОБЪЕКТОВ ИЗ ЗАПРОСОВ ВИЗУАЛЬНОГО ПОИСКА | 2017 |
|
RU2729956C2 |
СПОСОБ И СИСТЕМА СЕМАНТИЧЕСКОЙ ОБРАБОТКИ ТЕКСТОВЫХ ДОКУМЕНТОВ | 2016 |
|
RU2630427C2 |
СПОСОБ И СИСТЕМА СЕМАНТИЧЕСКОГО ПОИСКА ЭЛЕКТРОННЫХ ДОКУМЕНТОВ | 2011 |
|
RU2473119C1 |
СПОСОБ СИНТЕЗА САМООБУЧАЮЩЕЙСЯ СИСТЕМЫ ИЗВЛЕЧЕНИЯ ЗНАНИЙ ИЗ ТЕКСТОВЫХ ДОКУМЕНТОВ ДЛЯ ПОИСКОВЫХ СИСТЕМ | 2002 |
|
RU2273879C2 |
СПОСОБ СЕМАНТИЧЕСКОЙ ОБРАБОТКИ ЕСТЕСТВЕННОГО ЯЗЫКА С ИСПОЛЬЗОВАНИЕМ ГРАФИЧЕСКОГО ЯЗЫКА-ПОСРЕДНИКА | 2009 |
|
RU2509350C2 |
Автоматизированная система распределенной когнитивной поддержки принятия диагностических решений в медицине | 2015 |
|
RU2609737C1 |
РАЗРЕШЕНИЕ КОРЕФЕРЕНЦИИ В ЧУВСТВИТЕЛЬНОЙ К НЕОДНОЗНАЧНОСТИ СИСТЕМЕ ОБРАБОТКИ ЕСТЕСТВЕННОГО ЯЗЫКА | 2008 |
|
RU2480822C2 |
СИСТЕМА И СПОСОБ ПОИСКА ДАННЫХ В БАЗЕ ДАННЫХ ГРАФОВ | 2015 |
|
RU2707708C2 |
Изобретение относится к системам поиска информации. Технический результат заключается в возможности эффективно идентифицировать нужную информацию из большого объема информации поддержки сервиса. Система поиска информации согласно изобретению содержит базу данных, хранящую информацию поддержки сервиса, и устройство управления информацией, способное осуществлять поиск заданной информации в информации поддержки сервиса. Устройство управления информацией содержит модуль приема запросов, содержащих ключевое слово, модуль приема классификационной информации, которой принадлежит сужающее ключевое слово, модуль представления сужающего ключевого слова, принадлежащего введенной классификационной информации и имеющее корреляционное отношение с ключевым словом, и поисковый модуль, выполняющий процедуру поиска. Поисковый модуль выполняет процедуру поиска в базе данных на основе введенного ключевого слова и выбранного сужающего ключевого слова. Модуль представления сужающего ключевого слова выполнен с возможностью представления двух или более сужающих ключевых слов вместе с соответствующими величинами корреляции, представляющими собой частоту, с которой ключевое слово и сужающее ключевое слово появляются одновременно в одной и той же информации поддержки обслуживания оборудования или количество раз, когда ключевое слово и сужающее ключевое слово спарены в процессе осуществления поиска. 2 н. и 2 з.п. ф-лы, 13 ил.
1. Система поиска информации, содержащая:
базу данных для хранения информации поддержки сервиса; и
устройство управления информацией для поиска заданной информации в информации поддержки сервиса, причем указанное устройство управления информацией содержит:
модуль приема запросов для приема ввода запроса, содержащего ключевое слово, от пользователя, осуществляющего поиск,
модуль приема классификационной информации для приема ввода классификационной информации, к которой принадлежит сужающее ключевое слово,
модуль представления сужающего ключевого слова для представления сужающего ключевого слова, принадлежащего введенной классификационной информации и имеющего корреляционное отношение с ключевым словом, выбираемым образом, и
поисковый модуль для осуществления процедуры поиска, причем указанный поисковый модуль выполнен с возможностью осуществления процедуры поиска в базе данных на основе введенного ключевого слова и выбранного сужающего ключевого слова; причем
информация поддержки сервиса представляет собой информацию поддержки обслуживания оборудования, а
сужающее ключевое слово, представленное модулем представления сужающего ключевого слова, является ключевым словом, имеющим корреляционное отношение к ключевому слову, введенному в модуль приема запросов в сервисе поддержки оборудования, при этом
модуль представления сужающего ключевого слова выполнен с возможностью представления двух или более сужающих ключевых слов вместе с соответствующими величинами корреляции, а
корреляция представляет собой частоту, с которой ключевое слово и сужающее ключевое слово появляются одновременно в одной и той же информации поддержки обслуживания оборудования или количество раз, когда ключевое слово и сужающее ключевое слово спарены в процессе осуществления поиска.
2. Система поиска информации по п. 1, дополнительно содержащая модуль хранения информации, выполненный с возможностью хранения информации о классификационных дефинициях, определяющей, какому из сегментов классификационной информации принадлежит конкретное сужающее ключевое слово.
3. Система поиска информации, содержащая:
базу данных для хранения информации поддержки сервиса; и
устройство управления информацией для поиска заданной информации в информации поддержки сервиса, причем указанное устройство управления информацией содержит:
модуль приема запросов для приема ввода запроса, содержащего множество ключевых слов, от пользователя, осуществляющего поиск,
модуль приема классификационной информации для приема ввода классификационной информации, к которой принадлежит сужающее ключевое слово,
модуль представления сужающего ключевого слова для представления сужающего ключевого слова, принадлежащего введенной классификационной информации и имеющего корреляционное отношение со всеми из множества ключевых слов, выбираемым образом, и
поисковый модуль для осуществления процедуры поиска, причем указанный поисковый модуль выполнен с возможностью осуществления процедуры поиска в базе данных на основе введенного ключевого слова и выбранного сужающего ключевого слова.
4. Система поиска информации по п. 3, дополнительно содержащая модуль хранения информации, выполненный с возможностью хранения информации о классификационных дефинициях, определяющей, какому из множества сегментов классификационной информации принадлежит конкретное сужающее ключевое слово.
JP 2016021217 A, 04.02.2016 | |||
Способ защиты переносных электрических установок от опасностей, связанных с заземлением одной из фаз | 1924 |
|
SU2014A1 |
Электромеханический полосовой фильтр | 1957 |
|
SU110847A1 |
СПОСОБ ПОИСКА В БАЗЕ ДАННЫХ | 2014 |
|
RU2698405C2 |
US 20120179709 A1, 12.07.2012. |
Авторы
Даты
2023-05-31—Публикация
2020-09-08—Подача