ОБЛАСТЬ ТЕХНИКИ
Изобретение относится к аппаратно-программным средствам многопользовательского взаимодействия, более конкретно к средствам обеспечения межсетевого взаимодействия пользователей для оцифровывания документов на бумаге или любом ином твердом носителе. Изобретение позволяет выполнять разделение конфиденциального документа на составляющие фрагментов, каждый из которых не позволяет судить о содержании исходного документа. При этом, после оцифровывания составляющих фрагментов, сведения оцифровывания объединяются для формирования распознанного конфиденциального документа.
УРОВЕНЬ ТЕХНИКИ
Известно техническое решение по патенту RU 2355043 С2 от 20.02.2014, МПК G09F 15/16, «МНОГОПОЛЬЗОВАТЕЛЬСКОЕ СЕТЕВОЕ СОТРУДНИЧЕСТВО». Изобретение относится к области многопользовательского сетевого сотрудничества. Техническим результатом является повышение эффективности обработки документов. Раскрыты способы, которые позволяют пользователям дистанционно сотрудничать по поводу документов с использованием соответствующих браузеров. Эти способы предусматривают передачу представлений фрагментов данного документа браузерам и связывание фрагментов документа с конкретными пользователями. Браузеры могут принимать представления команд, обеспеченные пользователями, и могут определять, выполнять ли команды на браузере.
Достоинством способа является эффективная обработка документов.
Недостатком является недопустимость использования известного решения для работы с конфиденциальными документами, т.к. при обращении с конфиденциальными или секретными документами необходимо следовать дополнительным мерам, обеспечивающим режим секретности.
Предлагаемые система и способ имеют преимущество по сравнению с известным аналогом, поскольку не содержат указанных недостатков.
РАСКРЫТИЕ ИЗОБРЕТЕНИЯ
Технический результат изобретения заключается в выполнении оцифровывания документов с соблюдением требований по обеспечению режима работы с документами.
Поставленная задача достигается следующим образом.
Способ реализуется при помощи сервера оцифровывания конфиденциальных документов и автоматизированных рабочих мест пользователя (АРМ). Сервер оцифровывания конфиденциальных документов осуществляет выделение в исходном отсканированном конфиденциальном документе элементарных составляющих фрагментов, таких как одно слово или словосочетание, каждый из которых не способен передать смысловое значение исходного документа. Составляющие фрагменты передают на АРМ пользователя для распознавания человеком. Посредством интерфейса пользователя принимают ввод пользователя в ответ на отображение составляющего фрагмента. Посредством вычислительной сети ввод пользователя передают на сервер распознавания конфиденциальных документов. Каждому составляющему фрагменту документа соответствует идентификатор, например, случайное число, или хэш-сумма от составляющего фрагмента. Идентификатор составляющего фрагмента обеспечивает дополнительную защиту конфиденциального документа от неправомерных попыток восстановления исходного документа путем сбора всех составляющих фрагментов на множестве автоматизированных рабочих мест пользователей.
В одном из вариантов реализации изобретения идентификатор составляющего документа вместе с вводом пользователя принимают в сервере распознавания конфиденциальных документов. По идентификатору составляющего фрагмента документа сервер распознавания конфиденциальных документов запрашивает в базе данных местоположений составляющих фрагментов данные об исходном конфиденциальном документе, в которому относится каждый конкретный фрагмент. Когда все составляющие фрагменты исходного документа распознаны, выполняют сборку распознанной версии исходного конфиденциального документа.
Предложенное решение обеспечивает обработку документов ограниченного доступа с использованием большого количества внешних операторов без риска нежелательного или несанкционированного доступа к информации. При этом исключается необходимость найма и подготовки штатных операторов для обработки информации, и обеспечивается необходимый уровень ограниченного доступа к конфиденциальным документам за счет обработки операторами «обезличенной» и «фрагментированной» информации и привлечения к обработке информации «внешних» профессиональных операторов и организаций без реализации комплекса мер по защите информации.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
Фиг. 1 схематически отображает информационное взаимодействие между основными узлами системы.
Фиг. 2 представляет примерный вариант графического интерфейса создания шаблонов.
Фиг. 3 схематически отображает этапы способа обработки конфиденциального документа.
Фиг. 4 отображает базу данных, содержащую обезличенные фрагменты с присвоенными кодированными идентификаторами.
ОСУЩЕСТВЛЕНИЕ ИЗОБРЕТЕНИЯ
Нижеследующее описание описывает технологии взаимодействия некоторого количества пользователей для решения одной задачи. При этом для обеспечения взаимодействия аппаратно-программных средств применяют прикладные программы в компьютерных системах. Программные модули под управлением операционной системы побуждают аппаратные средства выполнять этапы способа поточной обработки конфиденциальны документов. Программные модули включают в себя процедуры, программы, компоненты, структуры данных и другие типы структур, которые выполняют конкретные задачи или реализуют те или иные абстрактные типы данных. Кроме того, специалистам в данной области техники очевидно, что описанное здесь изобретение можно осуществлять на практике в других конфигурациях компьютерной системы, включая карманные устройства, многопроцессорные системы, микропроцессорные или программируемые бытовые электронные приборы, миникомпьютеры, универсальные компьютеры.
Далее разобраны примеры реализации изобретения со ссылками на фигуры чертежей для пояснения основных принципов предлагаемого решения.
В соответствии с Фиг. 1 система условно может быть разделена на открытую зону 101 и зону ограниченного доступа 121, при этом взаимодействие основных элементов системы электронного архива фрагментов 131 обеспечивает разделение скан-образов документов 124 на фрагменты 103, не имеющие смысловой нагрузки, но достаточные для ввода данных операторами внешней системы 102. Такая разрезка скан-образов документов 124 на отдельные обезличенные части 123 снимает ограничения конфиденциальности и открывает возможность эффективного перевода конфиденциальных сведений из скан-образов документов 124 в формат базы данных (БД) 122, в том числе с привлечением внешнего исполнителя 102. При этом полностью исключается утечка информации из-за того, что оператор внешней системы 102 производит обработку конфиденциальной информации, но не будет понимать ее смысловое значение.
Аппаратно-программный комплекс поточной обработки конфиденциальных документов обеспечивает различные способы обработки электронных образов документов:
Реализованы механизмы выделения фрагментов для индексирования 132 любых структурированных документов с помощью создания графических шаблонов, указывающих области присутствия сведений на документе;
Для слабоструктурированных документов реализованы механизмы фрагментирования путем выделения необходимых слов, словосочетаний и смысловых сущностей в тексте, например, ФИО, адрес, наименование и т.п.;
Обеспечивается обезличивание фрагментов по ключу кодирования, то есть превращение электронного образа документа в набор частичных изображений, связанных друг с другом только по ключу заказчика (база ключей кодирования остается на территории заказчика) и отправка в закодированном виде 133.
Полученные фрагменты документов могут обрабатываться любым удобным способом: аппаратно-программно, вручную, внутри организации или на внешней территории, с привлечением любого количества собственных сотрудников или заказом услуг подрядчиков. Возможно, как распознавание документов с верификацией, так и полностью ручной ввод силами операторов внешней системы 102. При обработке электронным архивом фрагментов 131 обеспечивается контроль обработки и получение результатов 134.
В соответствии с Фиг. 2, на котором представлен примерный вариант графического интерфейса создания шаблонов, может быть выполнена разрезка скан-образов формализованных документов с помощью шаблонов, доступ к котором предоставляется через интерфейс аппаратно-программных средств электронного архива фрагментов 201.
На Фиг. 2 представлен вид готового шаблона «Паспорт» 211 для одного из распространенных типов формализованных документов. Графический интерфейс пользователя позволяет осуществлять быстрое создание шаблона; производить выделение областей документа 202, в том числе произвольной формы (например, нажатием комбинации клавиш Ctrl+); назначение имен и создание групп извлекаемых данных 212. Созданный или измененный шаблон 211 может быть сохранен, экспортирован, импортирован.
Графический механизм создания шаблонов позволяет быстро с помощью мышки настроить правила выделения фрагментов 202 в формализованных документах, назначить имена и типы данных 212, которые должны быть извлечены с каждого фрагмента.
Интеллектуальное выделение фрагментов неформализованных документов с заданными сущностями (отдельные фрагменты на ФИО, наименования, адреса, ИНН, …) на основе анализа распознанного текста.
Предусмотрены варианты использования шаблонов. Использование готовых настроек позволяет отметить из уже сохраненных или входящих в стандартную поставку шаблонов требуемые сущности. Встроенная OCR система распознавания позволяет динамически формировать новые шаблоны при обработке документа. Так же предусмотрен гибридный метод для повышения качества, который предусматривает автоматическое выделение нужной сущности в заданном районе документа.
Система электронного архива фрагментов предусматривает кодирование и выгрузку; обезличивание фрагментов путем присвоения кодированных ID-имен; выгрузку на носители; передачу онлайн или оффлайн во внешние системы индексирования.
В соответствии с Фиг. 3, на котором представлены этапы одного из вариантов способа обработки конфиденциального документа, предусмотрено выполнение аппаратно-программными средствами электронного архива фрагментов следующих этапов в автоматическом режиме.
После подготовки аппаратно-программного комплекса электронного архива фрагментов 300, принимают документы с различными уровнями секретности для обработки 305. Электронный архив фрагментов принимает отсканированные документы в любом известном графическом формате 310. Модуль формирования фрагментов выполняет разделение исходного документа на множество составляющих фрагментов 315. В базу данных (БД) кодирования помещают сформированные фрагменты, каждому фрагменту ставится в соответствие идентификатор, т.е. ключ кодирования 320. В БД кодирования создают кодировочную таблицу исходного документа 325, в которую сохраняют соответствующий идентификатор фрагмента - ключ кодирования и указание о том, к какому документу относится каждый фрагмент.
Каждый сформированный фрагмент отправляют на автоматизированное рабочее место оператора внешней системы для обработки 330. При этом, если отправленный фрагмент не обработан оператором за отведенное время, то тот же самый фрагмент отправляют на одно из других АРМ оператора, и так до тех пор, пока фрагмент не будет успешно распознан. В одном из вариантов реализации один фрагмент может быть отправлен на несколько АРМ операторов для целей контроля качества распознавания фрагментов разными операторами. Один и тот же фрагмент могут отправлять одному оператору несколько раз для проверки добросовестности выполнения распознавания исходя из анализа стабильности результата распознавания на одних и тех же распознаваемых фрагментах.
Результаты обработки фрагментов принимают в XML-формате на этапе 335. На этапе 340, при условии обработки всех составляющих исходный документ фрагментов, выполняют автоматическую сборку возвращенных результатов обработки фрагментов в единую запись (карточку документа) с помощью кодировочной таблицы в БД.
Результаты распознавания исходного документа сохраняют в средстве хранения, соединенном с сервером оцифровывания документов.
В одном из вариантов работы уполномоченный сотрудник вносит правки в настройки аппаратно-программных средств для корректировки и для эффективной работы системы.
Фиг. 4 отображает базу данных, содержащую обезличенные фрагменты 401 с присвоенными кодированными идентификаторами 405, и принятые результаты обработки в XML-формате 410.
Аппаратно-программное обеспечение, воплощающее настоящее изобретение содержит вычислительные системы, объединенные вычислительными сетями, каждая из которых работает под управлением операционной системы и дополнительного специализированного программного обеспечения. Эти системы включают в себя одну или несколько серверных систем, причем допустимо использование любого количества внешних и/или внутренних дополнительных серверов и сервисов для повышения качества работы системы и реализуемых сервисов. Серверы включают в себя один или несколько процессоров. Процессоры подключают к одной или нескольким шинным системам, выбранным для совместимости с процессорами.
Серверы включают в себя один или несколько машиночитаемых носителей данных, которые подключены к шинным системам. Системные шины обеспечивают считывание процессором машиноисполняемых инструкций и данных с машиночитаемых носителей. Машиночитаемый носитель представляет элементы хранения, выполненные по любой известной технологии хранения данных, например, реализованные с применением полупроводников, магнитных материалов, и д.р. К системной шине подключены по меньшей мере такие машиночитаемые носители как ОЗУ, ПЗУ, флэш или другие типы, и также предусмотрена возможность подключения жестких дисков, съемных носителей.
Носители данных могут включать в себя один или несколько модулей инструкций, которые, при загрузке в процессор и выполнении, предписывают серверу осуществлять этапы способа оцифровывания документов, к работе с которыми предъявляют дополнительные требования конфиденциальности. В частности, носители данных включают в инструкции, которые реализуют серверные функции системы электронного архива фрагментов или клиентские функции АРМ оператора.
Носители данных содержат хранилище исходных документов, фрагментов документов, баз данных и др. Хранилище документов содержит документы, которые предназначены для распознавания, подготовлены к отправке на АРМ операторов, или полученных результатов распознавания от АРМ операторов. Хотя хранилище документов и программное обеспечение для серверных и клиентских служб могут быть расположены на одном носителе данных, но так же для целей обеспечения качества предоставляемого сервиса указанные данные и программное обеспечение может быть сохранено в распределенном хранилище, например, на некотором количестве вычислительных узлов в сети, или в облачном хранилище информации. Хранилище документов и коллективные клиентские службы могут располагаться на разных узлах сети и в отдельных системах или физических устройствах.
В одном из примеров реализации серверная система является централизованной вычислительной системой, которая взаимодействует с одной или более АРМ оператора. АРМ операторов могут быть персональными компьютерами, переносными или мобильными вычислительными системами, смартфонами, карманными персональными компьютерами с возможностью беспроводной связи (КПК) или другие пригодные системы. Однако описанное здесь изобретение предусматривает и другие формы серверных и клиентских систем.
В одном из вариантов реализации изобретения электронный архив содержит аппаратно-программные средства сервера оцифровывания документов, которые посредством вычислительной сети соединены с, одним или более, автоматизированным рабочим местом (АРМ) оператора, при этом сервер оцифровывания документов содержит: модуль приема документов для обработки; модуль формирования фрагментов, выполненный с возможностью разделять исходный документ на множество составляющих фрагментов; базу данных (БД) кодирования, выполненную с возможностью хранения сформированных фрагментов и каждому фрагменту ставят в соответствие идентификатор фрагмента; БД кодирования выполнена с возможностью хранения кодировочной таблицы исходного документа, в которой сохраняют соответствующий идентификатор фрагмента и указание о том, к какому документу относится каждый фрагмент, при этом таблицу кодирования создают командой из сервера оцифровывания документов; модуль отправки фрагментов, выполненный с возможностью отправки каждого фрагмента на АРМ оператора внешней системы для обработки; модуль приема результатов обработки в XML-формате; модуль автоматической сборки возвращенных результатов обработки фрагментов в единую запись с применением кодировочной таблицы в БД; модуль записи результатов автоматической сборки обработки фрагментов в виде распознанного документа в средстве хранения, которое соединено с сервером оцифровывания документов.
Оцифровка конфиденциальных документов - всегда сложный процесс, особенно в случае большого объема и сжатых сроков. Основной риск связан с тем, что для извлечения данных доступ к документам необходимо дать большому количеству временных сотрудников, операторов ввода, на территории заказчика. Причем необходимость проверки данных операторами остается даже в случае автоматического распознавания текстов. Электронный архив фрагментов позволяет минимизировать риски неправомерного доступа к конфиденциальной информации при обработке документов.
Ввиду вышеизложенного, заявленное изобретение имеет существенные отличия по сравнению с упомянутыми аналогами, оно является значительно более совершенным технологически, так как все технические решения, положенные в его основу, предусматривают максимальный уровень автоматизации процесса функционирования системы, минимизируют участие «человеческого фактора» и связанные с ним неизбежные ошибки в процессе функционирования системы.
В заключение следует отметить, что приведенные в описании сведения являются примерами, которые не ограничивают объем настоящего изобретения, определенный формулой. Специалисту в данной области должно быть ясно, что существуют альтернативные варианты осуществления изобретения, соответствующие сущности настоящего изобретения. В силу чего прилагаемая формула изобретения, содержащая совокупность признаков, характеризующих изобретение, не должна трактоваться в узком смысле раскрытых в описании примеров реализации, но в то же время раскрывает объем правовой охраны, предоставляемой патенту на изобретение.
название | год | авторы | номер документа |
---|---|---|---|
СОГЛАСОВАНИЕ И ПРОМЕЖУТОЧНАЯ ОБРАБОТКА ПРИ ИСПОЛЬЗОВАНИИ АРХИВОВ ИНФОРМАЦИОННОГО ОБМЕНА | 2009 |
|
RU2507580C2 |
СПОСОБ И СИСТЕМА ВЫЯВЛЕНИЯ ВРЕДОНОСНЫХ ФАЙЛОВ С ПОМОЩЬЮ ГЕНЕРИРОВАНИЯ ОБЪЯВЛЕНИЙ НА ТОРГОВЫХ ОНЛАЙН ПЛАТФОРМАХ | 2019 |
|
RU2727932C1 |
СПОСОБ РЕАЛИЗАЦИИ СЕТЕВОЙ ПЕЧАТИ | 2014 |
|
RU2575994C2 |
СИСТЕМА ПОСТАНОВКИ МЕТКИ КОНФИДЕНЦИАЛЬНОСТИ В ЭЛЕКТРОННОМ ДОКУМЕНТЕ, УЧЕТА И КОНТРОЛЯ РАБОТЫ С КОНФИДЕНЦИАЛЬНЫМИ ЭЛЕКТРОННЫМИ ДОКУМЕНТАМИ | 2017 |
|
RU2647643C1 |
СИСТЕМА И СПОСОБ ЗАЩИТЫ ЭЛЕКТРОННЫХ ДОКУМЕНТОВ, СОДЕРЖАЩИХ КОНФИДЕНЦИАЛЬНУЮ ИНФОРМАЦИЮ, ОТ НЕСАНКЦИОНИРОВАННОГО ДОСТУПА | 2020 |
|
RU2759210C1 |
КОМПЛЕКС АВТОМАТИЗИРОВАННОГО УЧЕТА ВАГОНООБОРОТА | 2011 |
|
RU2500562C2 |
СИНХРОНИЗАЦИЯ СТРУКТУРИРОВАННОГО СОДЕРЖИМОГО ВЕБ-УЗЛОВ | 2007 |
|
RU2432608C2 |
СИСТЕМА АВТОМАТИЗАЦИИ ОБМЕНА КОДАМИ МАРКИРОВКИ | 2021 |
|
RU2773429C1 |
СИСТЕМА И СПОСОБ АВТОМАТИЗАЦИИ ОБРАБОТКИ ГОЛОСОВЫХ ОБРАЩЕНИЙ КЛИЕНТОВ В СЕРВИСНЫЕ СЛУЖБЫ КОМПАНИИ | 2020 |
|
RU2763691C1 |
СИСТЕМА И СПОСОБ ОБЕСПЕЧЕНИЯ СТЕГАНОГРАФИЧЕСКОГО КОДИРОВАНИЯ ТЕКСТА | 2020 |
|
RU2741067C1 |
Изобретение относится к способу оцифровывания документов, электронному архиву и машиночитаемому носителю. Технический результат заключается в обеспечении оцифровывания документов, к которым предъявляют дополнительные требования конфиденциальности. Способ состоит из этапов: в сервере оцифровывания документов принимают документы для обработки, модуль формирования фрагментов выполняет разделение исходного документа на множество составляющих фрагментов, в базу данных (БД) кодирования помещают сформированные фрагменты, каждому фрагменту ставят в соответствие идентификатор фрагмента, создают в БД кодирования кодировочную таблицу исходного документа, в которой сохраняют соответствующий идентификатор фрагмента и указание о том, к какому документу относится каждый фрагмент, отправляют каждый фрагмент на автоматизированное рабочее место (АРМ) оператора внешней системы для обработки, результаты обработки фрагментов принимают в XML-формате, при условии обработки всех составляющих исходный документ фрагментов выполняют автоматическую сборку возвращенных результатов обработки фрагментов в единую запись с помощью кодировочной таблицы в БД. 3 н. и 20 з.п. ф-лы, 4 ил.
1. Способ оцифровывания документов, к работе с которыми предъявляют дополнительные требования конфиденциальности, который состоит из этапов:
в сервере оцифровывания документов принимают документы для обработки;
модуль формирования фрагментов выполняет разделение исходного документа на множество составляющих фрагментов;
в базу данных (БД) кодирования помещают сформированные фрагменты, каждому фрагменту ставят в соответствие идентификатор фрагмента;
создают в БД кодирования кодировочную таблицу исходного документа, в которую сохраняют соответствующий идентификатор фрагмента и указание о том, к какому документу относится каждый фрагмент;
отправляют каждый фрагмент на автоматизированное рабочее место (АРМ) оператора внешней системы для обработки;
результаты обработки фрагментов принимают в XML-формате;
при условии обработки всех составляющих исходный документ фрагментов, выполняют автоматическую сборку возвращенных результатов обработки фрагментов в единую запись с помощью кодировочной таблицы в БД.
2. Способ по п. 1, в котором результаты распознавания исходного документа сохраняют в средстве хранения, которое соединено с сервером оцифровывания документов.
3. Способ по п. 1, в котором уполномоченный сотрудник вносит правки в настройки аппаратно-программных средств для корректировки и для эффективной работы системы.
4. Способ по п. 1, в котором прием документов выполняют средствами сервера оцифровывания документов, при этом принимают отсканированные документы в любом известном графическом формате.
5. Способ по п. 1, в котором если отправленный фрагмент не обработан оператором за отведенное время, то тот же самый фрагмент отправляют на одно из других АРМ оператора.
6. Способ по п. 5, в котором повторяют отправку на АРМ оператора до тех пор, пока фрагмент не будет успешно распознан.
7. Способ по п. 1, в котором один фрагмент может быть отправлен на несколько АРМ операторов для целей контроля качества распознавания фрагментов разными операторами.
8. Способ по п. 1, в котором один и тот же фрагмент могут отправлять одному оператору несколько раз для проверки добросовестности выполнения распознавания исходя из анализа стабильности результата распознавания на одних и тех же распознаваемых фрагментах.
9. Электронный архив содержит аппаратно-программные средства сервера оцифровывания документов, которые посредством вычислительной сети соединены с, одним или более, автоматизированным рабочим местом (АРМ) оператора, при этом сервер оцифровывания документов содержит:
модуль приема документов для обработки;
модуль формирования фрагментов, выполненный с возможностью разделять исходный документ на множество составляющих фрагментов;
базу данных (БД) кодирования, выполненную с возможностью хранения сформированных фрагментов и каждому фрагменту ставят в соответствие идентификатор фрагмента;
БД кодирования выполнена с возможностью хранения кодировочной таблицы исходного документа, в которой сохраняют соответствующий идентификатор фрагмента и указание о том, к какому документу относится каждый фрагмент, при этом таблицу кодирования создают командой из сервера оцифровывания документов;
модуль отправки фрагментов, выполненный с возможностью отправки каждого фрагмента на АРМ оператора внешней системы для обработки;
модуль приема результатов обработки в XML- формате;
модуль автоматической сборки возвращенных результатов обработки фрагментов в единую запись с применением кодировочной таблицы в БД;
модуль записи результатов автоматической сборки обработки фрагментов в виде распознанного документа в средстве хранения, которое соединено с сервером оцифровывания документов.
10. Электронный архив п. 9, в котором уполномоченный сотрудник вносит правки в настройки аппаратно-программных средств для корректировки и для эффективной работы системы.
11. Электронный архив п. 9, в котором прием документов выполняют средствами сервера оцифровывания документов, при этом принимают отсканированные документы в любом известном графическом формате.
12. Электронный архив п. 9, в котором если отправленный фрагмент не обработан оператором за отведенное время, то тот же самый фрагмент отправляют на одно из других АРМ оператора.
13. Электронный архив п. 12, в котором повторяют отправку на АРМ оператора до тех пор, пока фрагмент не будет успешно распознан.
14. Электронный архив п. 9, в котором один фрагмент может быть отправлен на несколько АРМ операторов для целей контроля качества распознавания фрагментов разными операторами.
15. Электронный архив п. 9, в котором один и тот же фрагмент могут отправлять одному оператору несколько раз для проверки добросовестности выполнения распознавания исходя из анализа стабильности результата распознавания на одних и тех же распознаваемых фрагментах.
16. Машиночитаемый носитель, содержащий машиноисполняемые инструкции, которые при исполнении инструкций процессором побуждают процессор выполнять этапы способа оцифровывания документов, к работе с которыми предъявляют дополнительные требования конфиденциальности, указанные инструкции обеспечивают выполнение этапов, на которых:
в сервере оцифровывания документов принимают документы для обработки;
модуль формирования фрагментов выполняет разделение исходного документа на множество составляющих фрагментов;
в базу данных (БД) кодирования помещают сформированные фрагменты, каждому фрагменту ставят в соответствие идентификатор фрагмента;
создают в БД кодирования кодировочную таблицу исходного документа, в которую сохраняют соответствующий идентификатор фрагмента и указание о том, к какому документу относится каждый фрагмент;
отправляют каждый фрагмент на автоматизированное рабочее место (АРМ) оператора внешней системы для обработки;
результаты обработки фрагментов принимают в XML-формате;
при условии обработки всех составляющих исходный документ фрагментов, выполняют автоматическую сборку возвращенных результатов обработки фрагментов в единую запись с помощью кодировочной таблицы в БД.
17. Машиночитаемый носитель по п. 16, в котором результаты распознавания исходного документа сохраняют в средстве хранения, которое соединено с сервером оцифровывания документов.
18. Машиночитаемый носитель по п. 16, в котором уполномоченный сотрудник вносит правки в настройки аппаратно-программных средств для корректировки и для эффективной работы системы.
19. Машиночитаемый носитель по п. 16, в котором прием документов выполняют средствами сервера оцифровывания документов, при этом принимают отсканированные документы в любом известном графическом формате.
20. Машиночитаемый носитель по п. 16, в котором если отправленный фрагмент не обработан оператором за отведенное время, то тот же самый фрагмент отправляют на одно из других АРМ оператора.
21. Машиночитаемый носитель по п. 20, в котором повторяют отправку на АРМ оператора до тех пор, пока фрагмент не будет успешно распознан.
22. Машиночитаемый носитель по п. 16, в котором один фрагмент может быть отправлен на несколько АРМ операторов для целей контроля качества распознавания фрагментов разными операторами.
23. Машиночитаемый носитель по п. 16, в котором один и тот же фрагмент могут отправлять одному оператору несколько раз для проверки добросовестности выполнения распознавания исходя из анализа стабильности результата распознавания на одних и тех же распознаваемых фрагментах.
Устройство для закрепления лыж на раме мотоциклов и велосипедов взамен переднего колеса | 1924 |
|
SU2015A1 |
МНОГОПОЛЬЗОВАТЕЛЬСКОЕ СЕТЕВОЕ СОТРУДНИЧЕСТВО | 2009 |
|
RU2507567C2 |
US 9652445 B2, 16.05.2017 | |||
Многоступенчатая активно-реактивная турбина | 1924 |
|
SU2013A1 |
Способ приготовления лака | 1924 |
|
SU2011A1 |
Колосоуборка | 1923 |
|
SU2009A1 |
Авторы
Даты
2018-07-13—Публикация
2017-10-04—Подача