Способ информационного поиска лингвистических моделей выражения деловых отношений в документах архивного фонда Российский патент 2018 года по МПК G06F17/30 

Описание патента на изобретение RU2656982C1

Настоящее изобретение относится к области информационного поиска и манипулирования данными, а именно к обработке языковых текстов, и может быть использовано для автоматизированного распознавания документов в архивном фонде, каталогизации структурно-содержательных параметров лингвистических моделей выражения деловых отношений.

Известен способ и система семантического поиска электронных документов [1], заключающийся в том, что включает индексную структуру электронного документа маркерами, занимающими одинаковый и фиксированный размер в компьютерной памяти, хранящими в зависимости от своего типа как метаинформацию электронных документов, так и информацию о вхождениях слов естественного языка в электронные документы, полученную с помощью лингвистического анализа.

Подобные системы информационного поиска предназначены для выявления в совокупности корпусе электронных документов таких номиналов, которые в наибольшей степени соответствуют информационной потребности пользователя, сформулированной в виде запроса к системе. С помощью данного способа выполняется отбор документов, метаинформация которых соответствует метаинформации, заданной в запросе, осуществляется ранжирование документов по близости к поисковому запросу на основе сопоставления информации о вхождениях слов в документах и поисковом запросе.

Тем не менее, данный способ не предлагает технического решения автоматизированного распознавания и каталогизации целевой информации в многоуровневой электронной библиотеке документов архивного фонда. Не получает воплощения система маркеров, фиксирующих табличную форму отражения данных и форму целостных неделимых документов, что снижает эффективность оптимизации режима фиксации, хранения и аналитической обработки документных массивов, значительно удлиняет процесс поиска и удорожает его. Полученную автоматически информацию приходится в течение длительного времени визуально-ручным методом досортировывать и пополнять для удовлетворения пользовательских запросов. Отсутствует вычисление релевантности обязательных и факультативных реквизитов, определяющих композиционно-содержательные признаки групп, подгрупп, видов и разновидностей документов. Обнаруживается недостаточная репрезентативность ключевых слов, фраз-лексикантов и их потенциальных комбинаций, отражающих иерархию деловых отношений по казусной и основной части документа, а также формуле заключения.

Предложен изобретенный способ установления адреса объекта по поисковому тематическому признаку [2], в котором для каждого объекта составляют ограниченный набор информативных слов и определяют адрес объекта. При этом наносят элементы этого набора в форме адреса объекта в соответствующие поля носителя информации, приспособленного для считывания с помощью соответствующего считывающего средства. При тематическом поиске составляют поисковый тематический запрос и наносят его в виде поискового тематического предписания на носитель информации, аналогичный носителю информации с полями адресов объектов. Создается возможность предварить поиск тематической подборки документов поиском оптимальной системы тематических поисков в результате того, что считывают поисковое тематическое предписание с носителя информации, сравнивают слова считанного поискового тематического предписания с нанесенными на носители информации названиями полей и определяют адрес объекта по результатам этих сравнений.

Однако данный аналог предполагает манипулирование неполными данными для упорядочения идентификаторов адресатности объекта в зависимости от принадлежности к уровням информационной библиотеки документов или процедуры, подвергаемой учету. Поиск источников по запросу при неполных поисковых тематических признаках объекта может являться причиной прямого искажения смыслов документов и приводить при автоматическом поиске к выдаче нерелевантных, не содержащим точных названий, под которыми объекты значатся и по которым работники хранилища находят эти объекты при помощи поисковых систем, содержащих адреса объектов, несоответствующих теме запроса лингвистических моделей выражения деловых отношений документов. Фиксированный набор информативных слов в предметной, или унитермной, организации тематического поиска может ограничивать лингвистические поля ключевых слов, дескрипторов, необходимых для обработки служебной информации, заключенной в документе, и возможности распознавания последовательности наполнения элементов реквизитов (именования и расположения адресата, соотношения с адресантом и т.д.), определения статусной характеристики адреса объекта (должностного или сословного, официального или частного и т.д.), маркирования устойчивых моделей выражения деловых отношений в документах архивного фонда и вариативных способов представления данных.

Наиболее близким способом того же назначения к заявляемому изобретению по максимальному количеству сходных признаков является программный комплекс по описанию документов Царицынского городового магистрата конца XVIII века как информационная база реконструкции архивного фонда [3], обеспечивающий распознавание текста и классификацию материала. Главной задачей данного программного комплекса является комплектование и последующее электронное хранение копий оригинальных текстов, отложившихся в архиве и имеющих отношение к Царицынскому магистрату. С точки зрения способа организации программный комплекс создан на основе файл-серверной архитектуры под названием «Электронный магистрат» с открывающимися вкладками, позволяющими загружать как текстовые элементы формуляра, так и графическую часть документов. В программном комплексе представлена база данных и интерфейс приложения, что принято за прототип.

Существенные недостатки данного программного комплекса обнаруживаются в выборе подходов к решению задачи рассмотрения разнородных атрибутивных характеристик документов. Подход, связанный с проецированием вида документа на таблицу, предполагает избыточность и повторяемость операций в процессе разработки и использования приложения. Подход на основе эмулирования связи «Ключ-Значение» в реляционной модели имеет недостатком сложность запросов на выборку и последующую их обработку, что сказывается на производительности программы в целом и возникновении проблемы ее масштабирования. Использование документно-ориентированной базы данных как наиболее перспективный подход, централизующий управление доступом входит в противоречие с предъявляемыми требованиями к приложению: подобная архитектура чаще рассчитана на небольшие объемы информации и применение в однопользовательском режиме. Несовершенным является процесс обработки естественно-языковых запросов, сформулированных в виде описания деловой ситуации или модели, ключевые параметры которых близки по структурно-композиционным и содержательным характеристикам уже известным документам, но могут менять степень своей устойчивости как обязательные элементы формуляра документа в зависимости от региональной специфики делопроизводства. Отсутствуют классификационные основания для распознавания в коллекции источников разновидностей как разновидностей документов.

Предлагаемый способ информационного поиска лингвистических моделей выражения деловых отношений в документах архивного фонда в значительной мере устраняет названные выше недостатки при обеспечении пользовательских запросов.

В основу изобретения положена задача создания способа информационного поиска лингвистических моделей выражения деловых отношений в документах архивного фонда. Предложено техническое решение автоматизированного распознавания и каталогизации целевой информации, что позволит проводить обработку текстов по структурно-содержательным параметрам, повысить эффективность хранения архивных документов, оптимизировать режим фиксации, комплектования и хранения документных массивов для удовлетворения пользовательских запросов при просмотре внесенных документов с целью анализа на основе различных реквизитов, редактирования, добавления или удаления документов в многоуровневой автоматизированной библиотеке.

Поставленная задача достигается тем, что способ информационного поиска лингвистических моделей выражения деловых отношений в документах архивного фонда, включает распознавание текста и классификацию материала, при этом в качестве обеспечения автоматизированного распознавания текста и классификации материала используют каталогизацию структурных и содержательных параметров лингвистических моделей, целевой информации и ее обработку. Документы архивного фонда помещают в разноуровневую информационную библиотеку. В первый уровень включают книги и реестры, протокольную документацию, раздельные документы. Второй уровень содержит подгруппы. Третий уровень включает виды и разновидности документов. Группа первого уровня книги и реестры, выделяемая по форме представления информации, содержит подгруппы учетные книги, регистрационные документы, предназначенные для фиксации целевого назначения информации о поступающей и исходящей корреспонденции. Группа протокольная документация содержит подгруппы информационно справочные и распорядительные документы. Группа раздельные документы включает подгруппы распорядительные, отчетные, договорные, информационно-справочные и просительные документы, акты принятия на себя каких-либо обязательств, записи показаний судебного и несудебного характера, удостоверительные и учетные документы. Кроме того, при поступлении запроса содержимое документов обрабатывают до принадлежности к уровням. Происходит поисковый запрос, по результатам которого вычисляют релевантность обязательных и факультативных реквизитов документов, входящих в разноуровневую информационную библиотеку. Как результат поиска маркируют модели выражения деловых отношений, определяют виды документов архивного фонда по содержанию и функции и разновидности документов по тематическим признакам.

Сущность изобретения поясняется таблицами, на которых изображено:

В схеме 1 дана классификация документов архивного фонда.

В схеме 2 показаны основные этапы автоматизированной обработки документов архивного фонда.

В табл. 1 представлены формуляр и композиция документов в составе группы «Книги и реестры».

В табл. 2 представлены формуляр и композиция документов в составе группы «Раздельные документы».

В табл. 3 показан порядок следования реквизитов в корреспонденции.

В табл.4 представлены формуляр и композиция документов в составе группы «Протокольные документы».

Способ информационного поиска лингвистических моделей выражения деловых отношений в документах архивного комплекса осуществляют следующим образом.

В данном способе информационного поиска лингвистических моделей выражения деловых отношений в документах архивного комплекса выделяют обязательные и факультативные элементы реквизитов, элементы композиционной части. Форма отражения данных, получающая воплощение в документах, позволяет рассматривать единицы хранения как целостные неделимые документы.

Классификация документов архивного фонда (схема 1) по форме предполагает как внешние характеристики документа - формат материального носителя, его физические свойства, способ фиксации данных, так и внутреннюю структуру. Помимо формуляра (совокупности реквизитов) в документах выделяется композиционная структура (композиция), то есть схема организации и структурной упорядоченности текста документа. Группа «Книги и реестры» образуют целые дела; источники в «Раздельных документах» характеризуются меньшим объемом (один или несколько листов); «Протокольные документы» представлены в виде многотомных изданий, объединяющих решительные определения и протоколы журналов; встречаются, кроме того, отдельные копии решений, посылаемые в качестве приложения к делам. Все основные сведения в книгах я реестрах включены с постоянными и переменными данными; форму сплошного текста, как правило, имеют раздельные документы (кроме ведомостей и описей); в протокольных документах решительные определения являются целостными текстами, журналы фиксируют информацию в текстовой и графической форме. В зависимости от тематических признаков, то есть отражения каких-либо фактических данных в текстах, в группах книги и реестры и раздельные документы выделены разновидности документов. Например, сведения об объектах и содержании регистрации оказывают влияние на различие деловых записей; это дает возможность разграничить верющие письма, явочные прошения, особые протоколы и др. (схема 1). Предмет учета лежит в основе деления на книги прихода пошлинных денег и книги прихода денежных сборов с купцов города Царицына. Информация о процедуре, подвергаемой документированию, позволяет говорить о разновидностях рапортов (например, связанных с получением указа или предложения), о письменных формах допроса (очная ставка, вопросные пункты) и т.д. В ряде случаев важную роль в классификации деловых бумаг играет авторский номинал, или «самоназвание», который не выделяется в отдельный реквизит и имеет уточняющий характер.

Основные этапы автоматизированной обработки документов архивного фонда (схема 2) соответствуют классификации документов архивного фонда (схема 1). С помощью команды на панели инструментов можно выбрать группу памятников, далее в открывающихся вкладках подгруппу, вид и разновидность (при ее наличии) документа. Открывающиеся окна позволяют обрабатывать текст по форме представления информации - по группе; по целевому назначению информации - по подгруппе; по содержанию и функции - по виду; по тематическим признакам - по разновидности документов.

Большинство реквизитов формуляра и композиция документов в составе группы «Книги и реестры» (табл. 1) соответствуют наименованиям граф таблицы. К обязательным элементам формуляра относят порядковый номер записи, дату, объект регистрации, который прописывают в реестрах, количественные данные, приводимые не во всех книгах регистрации. В учетных документах (книгах прихода и расхода) в качестве обязательных фиксируют порядковый номер, дату (которая может быть не отмечена в книгах прихода денежных сборов), объект и предмет учета, количественные данные Факультативную роль в названной группе выполняют такие реквизиты, как отметки о копии или исполнении документов, скрепы составителей.

По композиции тексты в рамках группы «Книги и реестры» представляют собой упорядоченный перечень сведений о регистрируемой бумаге или процедуре, подвергаемой учету. Реестры входящих указов и предложений, книги регистрации в качестве необходимых идентификаторов включают: адресант/адресат, краткое изложение содержания документа, регистрационный номер. Книги записи представляют собой перечень целостных текстов, полностью переписанных с оригинальных документов, с обязательным указанием их даты и подписи. Каждую такую запись рассматривают как самостоятельный документ. В записях кредитных, верющих писем, контрактов, векселей, протестов по векселям отмечено наличие устойчивых формул заверительной надписи, посредством которой утверждают факт регистрации чего-либо в судебной инстанции. Книги учета содержат данные о факте учета прихода или расхода чего-либо с указанием суммарного итога собранных либо отправленных средств.

Формуляр и композиция документов в составе группы «Раздельные документы» (табл. 2) среди обязательных реквизитов содержит номинал как наиболее последовательно представленный реквизит, а также реквизиты, автор/адресант, адресат, дату, подписи автора (доверенного лица). При этом внутренней документации (копиям с журналов, выпискам из дел, сказкам и др.) и некоторым бумагам частных лиц (подпискам, договорам, «пашпортам») не свойственно обозначение адресанта и адресата. Учетные документы, как правило, не имеют даты и адресанта, что обусловлено их вспомогательной ролью, приложением к основным делам; отсутствие номинала, наблюдаемое в ряде сообщений, связано с непоследовательным его отражением в данном виде документов. Подписи свидетелей являются важным реквизитом при юридическом подтверждении чего-либо третьими лицами (заключения сделки, предъявления паспорта и др.). К факультативным элементам документов в рамках рассматриваемой группы относят скрепы составителя (или духовного наставника), а также различные отметки, например резолюция, проставляемая тогда, когда необходимо принять какое-либо решение на основании полученных сведений. Тексты фиксируют устойчивые способы оформления тех или иных реквизитов, что свидетельствует об общепринятых правилах реализации этих способов. Так, в роли адресанта (который часто совпадает с автором) и адресата могут выступать конкретные должностные или частные лица, тогда обозначается должностное или сословное положение автора, его имя и фамилия (иногда только фамилия). Если адресантом или адресатом является учреждение, то приводится только наименование данной организации. В документах установленную форму имеет реквизит дат, для чего принято два способа, различающихся по расположению составляющих элементов: число, месяц, год и месяц, число, год. На факт придания документу юридической силы указывает порядок следования реквизитов в корреспонденции (табл. 3), наличие подписи авторов (доверенных лиц) в конце текста или после него. К факультативным элементам документов в рамках рассматриваемой группы относят скрепы составителя (или духовного наставника), печать, отметки о получении документа, о копии, резолюция, проставляемая тогда, когда необходимо принять какое-либо решение на основании полученных сведений. На поступающей корреспонденции проставляют отметку о получении документа. Эту отметку оформляют с помощью даты и краткого причастия со значением передачи объекта. Использование названных языковых единиц различают в зависимости от того, передавалась ли бумага самим автором или доставлялась с курьером по почте. Деловые тексты регистрируют принятые способы обозначения приложения к основному документу.

По композиции текст раздельного документа начинают с казусной части: в отчетных документах, в информационно-справочных документах, распорядительных документах с указания на факт проведения юридической процедуры, что отмечено в договорных документах, актах принятия обязательств, записях показаний и удостоверительных текстах. Основная часть как композиционный параметр присутствует во всех раздельных документах, кроме учетных документов. Формулы заключения зафиксированы в подписках, сказках, в расписках, в сообщениях, доношениях, рапортах и документах других видов. Учетные бумаги содержат перечень данных о предметах и лицах.

Рассмотрим структурные особенности документов в рамках некоторых подгрупп.

Распорядительные, отчетные и информационно-справочные документы. Для указов, приказов, наставлений и предложений характерно наличие казусной и основной частей. В рамках казусной части обозначен инициирующий документ - распорядительный акт магистрата или высших органов власти, прошения и доношения частных лиц, определенный вопрос, по которому принимается соответствующее распоряжение. После казусной части в распорядительных текстах приводят суть принятого решения с помощью глаголов принуждения «приказали», глагола речевого сообщения «предлагаю» и др. В конце текста или после него в обязательном порядке проставляют дату, что соответствует правилам делопроизводства указанного периода. Иногда после изложения сути распоряжения могут употребляться различного рода формулы заключения.

Отчетные документы составляют рапорты, в которых излагают суть конкретных поручений подведомственным службам или лицам, поэтому здесь фиксируют казусную часть, содержащую сведения об официальных распоряжениях начальства, а также факт исполнения поручения этими службами и лицами в основной части. Заключительный композиционный отрезок содержит обобщение всех содержащихся сведений посредством использования устойчивой формулы со значением речевого сообщения. Отчетные органы (лица) кроме отчета считают необходимым запросить информацию о принятом вышестоящими службами решении по конкретным вопросам на основании фактов, изложенных в данных текстах.

Информационно-справочные документы включают корреспонденцию (сообщения, доношения, объявления) и создаваемые для внутренних целей бумаги (выписки из дел, копии с журналов).

Входящие и исходящие бумаги указанных функциональных подгрупп отражают иерархию служебной информации в формуляре и композиции документов в составе группы «Протокольные документы» (табл. 4). В таблице показано, что в документах, направляемых в органы власти, равные или низшие по рангу, вначале указывают адресант, то есть место, откуда бумагу посылают. Далее следуют обозначения адресата (либо наименование организации, либо указание должности, имени и фамилии лица) и название документа. В протокольных документах порядок расположения адресанта и адресата разнится в зависимости от того, кем представлен адресант - должностным или частным лицом. Так, в сообщениях сначала указывают «от кого», затем «кому», в объявлениях частных лиц наблюдается обратная ситуация. Данные три реквизита выделяются из текста, название пишется справа. Общим признаком в оформлении отчетных и информационных документов считается частотное использование в их заключительной части этикетных формул с обобщающим значением, выражающим интенцию автора (в сообщениях) и другие. Специфика содержания выписок из дел, копий с журналов заключается в обобщении каких-либо данных о ходе рассмотрения определенного дела, используемых в справочных целях.

Договорные документы. Договорам свойственно закрепление факта совершения сделки, делегирования определенных прав. Важную роль играет факт освидетельствования третьей стороной заключенной сделки в купчих, контрактах, верющих письмах.

Просительные документы. Исходя из состава документов исследуемого фонда, можно заключить, что такой вид, как прошение, имеет различные способы представления данных. Первый из них позволяет достичь сходства по структуре с входящей документацией других видов: из текста выделены адресант и адресат, номинал. Второй способ расположения данных представлен законодательно регламентированной рубрикой документного текста на пункты, свойственные челобитным, входившим в делопроизводственную практику. Обязательным компонентом выступает краткое страдательное причастие от глагола волеизъявления «повелеть» со связочным глаголом прошедшего времени «было». В рамках приведенной фразы, подчеркивающей абсолютную власть императора над всеми уровнями власти, не допускается варьирования.

Основная задача составителя - удовлетворение просьбы - выражают в обозначении даты написания в рамках устойчивого оборота со стержневым компонентом - глаголом «просить» в форме настоящего времени 1-го лица, ед. ч., если автором являлся один человек, или мн. ч., если речь идет о нескольких просителях.

Тексты показывают, что сосуществование в пределах архивного фонда документов с одним и тем же номиналом, различно оформленных, свидетельствует о новизне в развитии делопроизводственной документации, постепенной замене старых формуляров новыми.

Записи показаний допрашиваемых лиц включают такие виды документов, как объяснения, сказки, допросы. Объединить их в одну подгруппу позволил тот факт, что все они так или иначе представляют собой принудительные пояснения лиц по ранее известным фактам, выражающие мнение того лица, которого спрашивают о произошедших событиях посредством принуждения к подробному пересказу всех обстоятельств дела.

Общие черты в форме сказок и допросов. Определяя сказки как письменные показания по определенному вопросу, подававшиеся по разным поводам, когда администрации нужны сведения по какому-либо делу, выделяют их отличительную черту - несудебный характер включаемых в них сведений. Напротив, допросы представляют собой записи показаний свидетелей при расследовании противоправных действий. Однако эти документы объединяют особенности содержания; пересказ каких-либо сведений обусловливает тождественность формы данных деловых бумаг с тем отличием, что в допросах может проставляться подпись свидетеля - духовного наставника или понятых, присутствовавших при даче показаний. Подписи присутствовавших свидетелей являются способом подтверждения третьим лицом факта должного проведения следственной процедуры по правилам, принятым в юридической практике.

Тексты сказок и допросов характеризуются высокой степенью устойчивости композиционной структуры. Документы представлены в форме текста, разделенного на вводную часть (факт проведения юридической процедуры) и основное содержание (показания одного или нескольких лиц). В первой части, не выделяя из текста, обозначают реквизиты: автора документа, место создания. При этом обязательно указывают дату. Факт опроса (допроса) передан в сказках кратким причастием от глагола общения, а в допросах - от глагола речевого воздействия. Сказки и допросы могут подписываться самими авторами либо заверяются рукоприкладством доверенных лиц, что говорит иногда о неграмотности сообщающего и допрашиваемого лица. К свидетелям может добавляться скрепа духовного наставника в виде автографа священнослужителя (сана, имени и фамилии).

В рамках допросов выделены разновидности: очная ставка и вопросные пункты. Первые представляют собой запись показаний нескольких лиц, полученных в результате проведения такой следственной процедуры, как очная ставка, необходимость которой возникает в случае разночтения в данных, полученных от свидетелей и подозреваемых в преступлении. При этом приводится информация сразу обо всех авторах, далее следуют их показания, под каждым из которых проставляется подпись допрашиваемого. Вопросные пункты приближены к современным протоколам допросов. Для этой разновидности характерно включение содержания в таблицу, в которой написаны ряд вопросов, задаваемых следственными органами, и получаемые на них ответы; каждый вопрос (в левой части листа) и ответ (в правой части листа) нумеруются. Из таблицы выделена только вводная часть с указанием автора и места создания документа.

Формуляр и композиция документов в составе группы «Протокольные документы» подвергают строгой регламентации, вследствие чего обязательны все реквизиты текстовой и графической частей формуляра. В рамках названной группы по видовой принадлежности распорядительные документы (подгруппа) являются решительными определениями, информационно-справочные (подгруппа) - протоколами журналов. Решительные определения представляют сплошной текст с указанием даты, места проведения заседания; отдельно расположены регистрационный номер, подписи присутствовавших заседателей и гербовая печать. Специфика оформления журналов связана с комбинированным способом представления документной информации. Основные сведения, посвященные фиксированию процесса заседания членов присутствия, имеют текстовую форму, а по правому краю листа документа приведена таблица. В текстовой части журналов зафиксированы дата, день, место проведения заседания, время его начала и окончания, состав заседателей и их подписи; в графической части (таблице) журналов в целях контроля приводятся сведения о дате скрепления и исполнения решения. По композиции решительные определения включают повестку дня: конкретное дело, его суть, резолюцию, то есть принятое решение по делу.

В журналах в повестке дня представлены несколько вопросов и приведены решения по каждому из них. Для этих документов характерна временная и персональная детализация заседания.

Исследуемые тексты отражают влияние процесса стандартизации в делопроизводстве, что проявляется в использовании образцовых документов, реализации набора обязательных и факультативных реквизитов формуляра, в употреблении устойчивых элементов композиции, утверждении новых документных форм.

Материалом описания являются архивные документы, в составе которых выделено и проанализировано около 1000 реквизитов и более 3000 употреблений лексических единиц (всего рассмотрено 116 документов).

Таким образом, предложенный способ информационного поиска лингвистических моделей выражения деловых отношений в документах архивного фонда обладает следующими новыми свойствами: автоматизирует распознавание документов в архивном фонде и каталогизирует целевую информацию при обработке текстов по структурно-содержательным параметрам; повышает эффективность хранения архивных документов; извлекает информацию из языковых текстов; оптимизирует режим фиксации и хранения документных массивов для удовлетворения пользовательских запросов; имеет малую стоимость, высокую скорость и низкие затраты на поддержание информационного поиска при многопользовательском режиме работы архивного фонда, позволяя просматривать внесенные документы, добавлять, редактировать и удалять их, осуществлять выборку на основе различных реквизитов.

Источники информации

1. Осипов Г.С., Тихомиров И.А., Соченков И.В. Способ и система семантического поиска электронных документов. Патент на изобретение RU №2473119. МПК G06F 17/30 (2006.01). (20.01.2013).

2. Шпаков А.А. Способ установления в хранилище местоположения объекта по поисковому тематическому признаку. Патент на изобретение RU №2107942. МПК G06F 17/30 (27.03.1998).

3. Туликова Н.А., Преферансов С.А., Вуйлов Д.А.,. Цельник Г.Л. Программный комплекс по описанию документов Царицынского городового магистрата конца XVIII века как информационная база реконструкции архивного фонда // Информационные технологии и письменное наследие. Петрозаводск; Ижевск, 2012. С. 263-267 (прототип).

Похожие патенты RU2656982C1

название год авторы номер документа
Способ структурирования результатов поиска по текстам, содержащим информацию о научной и исследовательской деятельности 2017
  • Лапшин Сергей Владимирович
  • Лапшина Дарья Игоревна
RU2656469C1
СПРАВОЧНАЯ ПРАВОВАЯ СИСТЕМА ХРАНЕНИЯ И ПОИСКА ДАННЫХ 2001
  • Першеев Д.В.
RU2223537C2
ПРОГРАММНО-АППАРАТНЫЙ КОМПЛЕКС ИНФОРМАЦИОННОГО ОБЕСПЕЧЕНИЯ И СОПРОВОЖДЕНИЯ ПРОЦЕССА КОМПЛЕКТОВАНИЯ БИБЛИОТЕК ПО СВОДНОМУ ТЕМАТИЧЕСКОМУ ПЛАНУ ИЗДАНИЯ КНИГ 2002
  • Дегтярев М.В.
  • Иванов В.С.
RU2216775C2
СИСТЕМА АНАЛИТИЧЕСКОГО ВЫЯВЛЕНИЯ ПРОБЛЕМНЫХ ВОПРОСОВ В НОРМАХ ПРАВОВОГО РЕГУЛИРОВАНИЯ 2011
  • Дюков Андрей Владимирович
  • Зыков Андрей Александрович
  • Ищенко Татьяна Юрьевна
  • Ковалев Дмитрий Александрович
  • Романов Дмитрий Александрович
  • Цибульский Валентин Васильевич
  • Черников Валерий Васильевич
RU2479017C1
СПОСОБ УСТАНОВЛЕНИЯ В ХРАНИЛИЩЕ МЕСТОПОЛОЖЕНИЯ ОБЪЕКТА ПО ПОИСКОВОМУ ТЕМАТИЧЕСКОМУ ПРИЗНАКУ 1994
  • Шпаков Александр Андреевич
RU2107942C1
АРХИТЕКТУРА МЕТА-ПОИСКА НА ОСНОВЕ WEB-УСЛУГ ДЛЯ РАВНОПРАВНОЙ СОВМЕСТНОЙ РАБОТЫ И ПЕРЕДАЧА ГОЛОСА ПО IP-ПРОТОКОЛУ 2004
  • Лот Ив
  • Гуз Стюарт
RU2338246C2
СПОСОБ ПРЕОБРАЗОВАНИЯ СЛАБОФОРМАЛИЗУЕМЫХ ДОКУМЕНТОВ ДЛЯ МИНИМИЗАЦИИ ИХ ОБЪЕМА ПРИ ХРАНЕНИИ 2009
  • Черников Борис Васильевич
RU2413985C2
СПОСОБ СОЗДАНИЯ И ИСПОЛЬЗОВАНИЯ РЕКУРСИВНОГО ИНДЕКСА ПОИСКОВЫХ МАШИН 2011
  • Серебренников Олег Александрович
RU2459242C1
СПОСОБ И СИСТЕМА СЕМАНТИЧЕСКОЙ ОБРАБОТКИ ТЕКСТОВЫХ ДОКУМЕНТОВ 2016
  • Мительков Дмитрий Владимирович
  • Новиков Андрей Юрьевич
  • Сатин Борис Борисович
RU2630427C2
Система автоматического определения тематики текстовых документов на основе объяснимых методов искусственного интеллекта 2023
  • Соченков Илья Владимирович
  • Жебель Владимир Викторович
  • Зубарев Денис Владимирович
  • Девяткин Дмитрий Алексеевич
  • Ядринцев Василий Владимирович
RU2823436C1

Иллюстрации к изобретению RU 2 656 982 C1

Реферат патента 2018 года Способ информационного поиска лингвистических моделей выражения деловых отношений в документах архивного фонда

Изобретение относится к области информационного поиска и манипулирования данными. Техническими результатами являются повышение скорости автоматизированного распознавания документов, обеспечение возможности обработки текстов по структурно-содержательным параметрам и обеспечение возможности осуществлять выборку на основе различных реквизитов. В способе информационного поиска лингвистических моделей выражения деловых отношений в документах архивного фонда распознают текст и выполняют классификацию материала путем каталогизации структурных и содержательных параметров лингвистических моделей и целевой информации и обработки целевой информации. Документы архивного фонда помещают в разноуровневую информационную библиотеку. При поступлении запроса содержимое документов обрабатывают по принадлежности к уровням. Выполняют поисковый запрос, по результатам которого вычисляют релевантность обязательных и факультативных реквизитов документов, входящих в разноуровневую информационную библиотеку. Как результат поиска маркируют модели выражения деловых отношений, определяют виды документов архивного фонда по содержанию, функции и разновидности документов по тематическим признакам. 2 ил., 4 табл.

Формула изобретения RU 2 656 982 C1

Способ информационного поиска лингвистических моделей выражения деловых отношений в документах архивного фонда, включающий распознавание текста и классификацию материала, отличающийся тем, что в качестве обеспечения автоматизированного распознавания текста и классификации материала используют каталогизацию структурных и содержательных параметров лингвистических моделей, целевой информации и ее обработку, при этом документы архивного фонда помещают в разноуровневую информационную библиотеку, в первый уровень включают книги и реестры, протокольную документацию, раздельные документы, второй уровень содержит подгруппы, третий уровень включает виды и разновидности документов, группа первого уровня книги и реестры, выделяемая по форме представления информации, содержит подгруппы учетные книги, регистрационные документы, предназначенные для фиксации целевого назначения информации о поступающей и исходящей корреспонденции, группа протокольная документация содержит подгруппы информационно-справочные и распорядительные документы, группа раздельные документы включает подгруппы распорядительные, отчетные, договорные, информационно-справочные и просительные документы, акты принятия на себя каких-либо обязательств, записи показаний судебного и несудебного характера, удостоверительные и учетные документы, кроме того, при поступлении запроса содержимое документов обрабатывают по принадлежности к уровням, то есть происходит поисковый запрос, по результатам которого вычисляют релевантность обязательных и факультативных реквизитов документов, входящих в разноуровневую информационную библиотеку, и как результат поиска маркируют модели выражения деловых отношений, определяют виды документов архивного фонда по содержанию и функции и разновидности документов по тематическим признакам.

Документы, цитированные в отчете о поиске Патент 2018 года RU2656982C1

СПОСОБ УСТАНОВЛЕНИЯ В ХРАНИЛИЩЕ МЕСТОПОЛОЖЕНИЯ ОБЪЕКТА ПО ПОИСКОВОМУ ТЕМАТИЧЕСКОМУ ПРИЗНАКУ 1994
  • Шпаков Александр Андреевич
RU2107942C1
СПОСОБ И СИСТЕМА СЕМАНТИЧЕСКОГО ПОИСКА ЭЛЕКТРОННЫХ ДОКУМЕНТОВ 2011
  • Осипов Геннадий Семенович
  • Тихомиров Илья Александрович
  • Соченков Илья Владимирович
  • Смирнов Иван Валентинович
RU2473119C1
ПОСТРОЕНИЕ И ПРИМЕНЕНИЕ ВЕБ-КАТАЛОГОВ ДЛЯ ФОКУСИРОВАННОГО ПОИСКА 2005
  • Брилл Эрик Д.
  • Чен Хэрр
  • Чандрасекар Раман
  • Корстон Саймон Х.
RU2382400C2
ПРОВЕРКА РЕЛЕВАНТНОСТИ МЕЖДУ КЛЮЧЕВЫМИ СЛОВАМИ И СОДЕРЖАНИЕМ ВЕБ-САЙТА 2005
  • Чжан Бэньюй
  • Цзэн Хуа-Цзюнь
  • Ли Ли
  • Наджм Тарек
  • Ма Вэй-Ин
  • Ли Ин
  • Чэнь Чжэн
RU2375747C2
US 6654742 B1, 25.11.2003.

RU 2 656 982 C1

Авторы

Тупикова Наталия Алексеевна

Цельник Галина Львовна

Преферансов Сергей Александрович

Даты

2018-06-07Публикация

2017-03-27Подача