Изобретение относится к способу модификации копий документов и их идентификации для защиты документов от несанкционированного распространения.
Проблема защиты информации от ее несанкционированного разглашения является одной из важных во многих коммерческих и государственных организациях. Несанкционированное разглашение информации может приводить как к репутационным издержкам (иски, потери клиентов и партнеров), так и к прямым убыткам (потеря рынка за счет более раннего выхода конкурентов). В современных условиях информация в организациях существует в цифровом виде, однако некоторые конфиденциальные документы на бумажных носителях используются во внутреннем или внешнем документообороте. Конфиденциальная информация на любых носителях требует защиты от несанкционированного доступа и разглашения. На фоне роста цифровых технологий по передаче данных развиваются и механизмы защиты информации от несанкционированного доступа и разглашения. При этом каких-либо инноваций в области защиты информации от несанкционированного разглашения по материально-вещественным каналам связи не наблюдается. Использование копий конфиденциальных документов с бумажных оригиналов является основным каналом утечки информации в связи с невозможностью отслеживания злоумышленника.
Известен способ распознавания оригинальных печатных документов и печатных документов, скопированных с них с помощью узоров. В известном способе узоры представляют собой разновидность видимых аутентификационных узоров, которые образуют определенный фон. Узоры формируются с применением ключа псевдослучайным способом. Для распознавания и измерения степени расхождения между ними сравнивают захваченное изображение аналогового узора с исходным цифровым представлением узора. Вследствие искажения изображения при копировании более высока степень расхождения такого захваченного изображения узора, которое не было получено с использованием исходного аналогового узора. Для того чтобы псевдослучайное изображение содержало информацию, его разрезают на блоки, а цвета пикселей каждого блока, представляющего одно из двоичных значений, инвертируют, оставляя неизменными пиксели каждого блока, представляющего другое двоичное значение. Кроме того, может быть использовано другое кодирование двоичного значения блока. На практике блоки должны быть достаточно большими, с тем чтобы указанное двоичное значение надежно считывалось, так что количество информации, которую несет изображение, ограничено. (Описание к патенту РФ №2458395, МПК G06K 9/00, опубл. 10.08.2012, стр. 7, строки 25-45)
Известный способ имеет недостатки. В частности, считывающее устройство должно воспроизводить и сохранять в памяти узор для распознавания копии на этапе сравнения изображений, что одновременно является дорогостоящей и потенциально опасной операцией, поскольку злоумышленник может "считать" память, что позволит ему точно воспроизвести узор для распознавания копии.
Известен способ для защиты и аутентификации документов, заключающийся в том, что определяют физические характеристики ячеек одной конфигурации в соответствии с указанными условиями печати, в которых доля ячеек, напечатанных с ошибкой печати, возникающей исключительно вследствие непредвиденных переменных, больше, чем заданное первое значение, и меньше, чем заданное второе значение, предоставляют единицу информации путем изменения внешнего вида ячеек, представляющих указанные физические характеристики, печатают указанную конфигурацию с использованием указанных условий печати, причем указанная конфигурация выполнена с обеспечением возможности распознавания копии, модифицирующей внешний вид множества указанных ячеек. (Патент РФ №2458395, МПК G06K 9/00, опубл. 10.08.2012)
Недостатком известного способа является необходимость использования устройства для считывания штрих-кода, а так же возможность замены или сокрытия штрих-кода с документа с сохранением оставшейся информации. Кроме того, недостатком известного способа является отсутствие возможности проведения расследования, направленного на выявление лиц, участвовавших в несанкционированном распространении документа.
Известен способ обеспечения безопасности документов, в котором создают изображения, наносят маркировку на множество документов с формированием на каждом документе указанного изображения, содержащего отклонения, уникальные для каждого документа, причем большинство изображений, нанесенных на указанные документы, обладает некоторой физической характеристикой, обеспечивающей защиту от копирования и отвечающей заранее заданному критерию, а указанная характеристика большинства копий этих изображений, которые могут быть изготовлены, не отвечает указанному критерию, получают для каждого указанного документа характеристики указанных отклонений для получения уникального образа нанесенной маркировки и запоминают указанный уникальный образ. (Патент РФ №2477522, МПК G06K 9/00, опубл. 10.03.2013)
Недостатком известного способа является отсутствие возможности проведения расследования, направленного на выявление лиц, участвовавших в несанкционированном распространении документа.
Наиболее близким по технической сущности к заявляемому способу является способ идентификации печатной формы документа, включающий следующие этапы: этап печати по меньшей мере одного документа упомянутой печатной формой; этап захвата с высоким разрешением по меньшей мере одного изображения по меньшей мере одной части указанного документа; этап извлечения геометрической характеристики по меньшей мере из одного захваченного изображения; этап сохранения извлеченной геометрической характеристики. В процессе идентификации определяют, использовалась ли упомянутая печатная форма для печати документа-кандидата, при этом осуществляют этап захвата с высоким разрешением изображения части упомянутого документа-кандидата, соответствующей части документа, геометрическая характеристика которой была сохранена. Затем осуществляют этап извлечения из изображения упомянутого документа-кандидата геометрической характеристики, соответствующей сохраненной геометрической характеристике, и этап определения того, превосходит ли мера корреляции геометрической характеристики упомянутого документа-кандидата и сохраненной геометрической характеристики заранее заданного предельного значения. (Патент РФ №2511616, МПК G07D 7/20, G06K 9/52, опубл. 10.04.02014 - прототип.
В известном способе для идентификации печатной формы дополнительный узор наносят на изображение, добавляя дополнительную информацию на документ, а не изменяя геометрию составных элементов самого документа. Для осуществления известного способа требуется сложное специальное оборудование и материалы для печати копий. Данный способ является ненадежным способом маркировки, так как нанесенные на изображение специальные знаки могут быть удалены при копировании, и идентификация копии будет невозможна. Кроме того, известный способ не позволяет определить канал несанкционированного распространения документа.
Техническая задача, на решение которой направлено заявляемое изобретение, состоит в обеспечении защиты документа от несанкционированного распространения и одновременно идентификация лиц, участвующих в распространении документа.
Поставленная техническая задача решается тем, что способ модификации и идентификации копии документа путем создания изображения документа, его модификации и идентификации копии документа, согласно заявляемого изобретения, характеризуется тем, что на этапе создания изображения формируют структуру цифровой копии оригинала документа, для этого документ переводят в графическое представление в виде набора растровых изображений для каждой страницы в упорядоченном виде и формируют структуру защищенного документа в виде набора прямоугольных блоков с координатами верхнего левого угла и параметрами ширины и высоты блока, на этапе модификации изображения документа формируют, по меньшей мере, одну персонализированную электронную копию документа с уникальным набором геометрических характеристик графических объектов измененной копии изображения, регистрируют параметры уникального набора геометрических характеристик графических объектов персонализированной электронной копии документа и регистрируют информации о пользователе, запросившем к ней доступ, на этапе идентификации копии документа для установления факта создания и несанкционированного распространения копии документа распознают структуру исследуемой копии документа, из базы данных загружают изображение в виде цифровой копии оригинала документа и его структуру, дополнительно из базы данных загружают все копии оригинального документа со всеми преобразованиями, сгенерированными для данного документа, формируют и сохраняют калибровочную копию документа, сравнивают калибровочную копию документа исследуемую копию документа и все копии оригинального документа со всеми преобразованиями, сгенерированными для данного документа путем наложения изображения образца на изображение калибровочной копии подборки размеров исследуемого образца под размеры калибровочной копии по разнице расстояний между прямоугольными блоками, далее определяют количество совпадающих пикселей калибровочной копии и исследуемого образца путем расчета процента совпадения из соотношения:
где Сробр - количество черных пикселей образца;
Срориг - количество черных пикселей оригинала;
Срсовп - количество совпадающих пикселей,
и на основании вычисленного значения Р осуществляют сортировку результатов, по максимальному значению процентов совпадения пикселей созданной ранее персонализированной электронной копии документа и исследуемого образа документа выносят суждение о факте создания и несанкционированного распространения копии документа.
Кроме того, формируют базу данных электронных копий документов.
Кроме того, цифровую копию оригинала документа используют в качестве эталонного документа.
Кроме того, на этапе создания персонализированной электронной копии документа загружают оригинал изображения документа и структуру защищенного документа, далее формируют последовательность псевдослучайных преобразований для каждого блока структуры страницы документа в виде сдвигов по вертикали и горизонтали заданным образом, на оригинале выделяют блоки изображения, которые были сформированы на этапе защиты документа и к этим блокам применяют сформированную последовательность псевдослучайных преобразований.
Кроме того, геометрические характеристики объектов включают координаты прямоугольного блока над объектом относительно всего изображения в виде значений координат двух противоположных углов прямоугольного блока.
Кроме того, геометрические характеристики объектов включают координаты прямоугольного блока над объектом относительно всего изображения в виде значений координат любого угла и значений размеров прямоугольного блока.
Технический результат, достижение которого обеспечивается реализацией заявляемой совокупности существенных признаков, заключается в повышении защиты документа от несанкционированного распространения за счет обеспечения возможности идентификации пользователя, допустившего распространение документа.
Сущность заявляемого способа поясняется чертежами, где
на фиг. 1 представлена схема, поясняющая осуществление заявляемого способа;
на фиг. 2 представлена структура защищенного документа, которая содержит следующие позиции:
N - количество страниц в документе,
М - количество блоков текста на конкретной странице,
S - количество строк в конкретном блоке текста,
W - количество слов в конкретной строке текста;
на фиг. 3 представлена блок-схема алгоритма вычисления структуры документа;
на фиг. 4 приведен в виде блок-схемы алгоритма пример расследования и выявления канала несанкционированного распространения копии документа.
Заявляемый способ включает следующие этапы.
Этап 1 формирования структуры цифровой копии оригинала документа
Этап 2 модификации изображения документа при помощи афинных преобразований
Этап включает операции формирования по меньшей мере одной персонализированной электронной копии документа с уникальным набором геометрических характеристик графических объектов, регистрации параметров уникального набора геометрических характеристик графических объектов документа-копии и регистрации информации о пользователе, запросившем доступ к документу (субъекта доступа).
Этап 3 идентификации копии документа для установления факта несанкционированного распространения конфиденциального документа
Для осуществления заявляемого способа используется оригинальное программное обеспечение. Программа для ЭВМ «Модуль маркировки печатных копий конфиденциальных документов», свидетельство о государственной регистрации №2014661621, опубл. 20.12.2014 г. Программа для ЭВМ «Модуль выявления совпадающих печатных копий конфиденциальных документов», свидетельство о государственной регистрации №2014661621, опубл. 20.12.2014 г. Программа для ЭВМ «Программный комплекс для маркировки и выявления совпадающих печатных копий конфиденциальных документов», свидетельство о государственной регистрации №2016661798, опубл. 20.11.2016 г.
На этапе 1 формирования структуры цифровой копии оригинала документа предварительно формируют цифровую копию оригинала документа и загружают в защищенное хранилище документов и используют его в качестве эталонного документа.
Формирование структуры цифровой копии документа осуществляют следующим образом.
Предварительно оригинал документа сканируют. При сканировании документа происходит захват (перевод в цифровой вид) маркируемого оригинала документа с разрешением не менее 150 точек на дюйм при помощи сканера документов и загрузка оригинала документа в хранилище. В цифровом виде документ представляет собой последовательность растровых изображений. При этом выполняется приведение документа к стандартному виду, разбиение документа на страницы и обработка каждой страницы документа.
Далее осуществляют формирование структуры документа (фиг. 3), который состоит из следующих шагов.
Шаг 1. Преобразование в бинарное изображение
Для этого последовательно выполняется приведение формата изображения к градациям серого, т.е. осуществляется удаление информации о цвете конкретного пикселя изображения, и формирование бинарного представления изображения. В этом формате каждый пиксель изображения представлен одним битом.
В изображении бинарного формата каждый пиксель представлен один битом. Для вычисления значения каждого бита (пикселя) вычисляется его значение яркости:
где L - итоговая яркость пикселя;
R - значение красной компоненты пикселя;
G - значение зеленой компоненты пикселя;
В - значение синей компоненты пикселя.
Каждому компоненту пикселя присваивается вычисленное значение яркости.
После приведения изображения к оттенкам серого производится преобразование изображения к бинарному виду.
Для повышения качества бинарного изображения используется адаптивный алгоритм преобразования, который учитывает значения соседних пикселей.
Для примера рассмотрим изображение в оттенках серого, где для значения каждого пикселя с координатами (х,у) определено его значение l(x,у)∈[0,255). Тогда значение пикселя бинарного изображения определяется по следующей формуле:
где t - пороговое значение яркости пикселя, которое является константой и задается перед началом процесса бинаризации.
Адаптивный подход бинаризации изображения, разработанный Дж. Сауволой (J. Sauvola and М. Pietikainen, "Adaptive document image binarization" Pattern Recognition 33(2000) / Дж. Саувола, M. Петикайнен «Адаптивная бинаризация изображений документов» Распознавание образов 33(2000)), предлагает пороговое значение яркости t(x,y) вычислять на основе среднего значения m(x,y) и среднеквадратического отклонения d(x,y), определенного для пикселей в окне w×w, от центрованного относительно пикселя (х,у):
где R - это максимальное среднеквадратичное отклонение, для изображений в формате градаций серого - 128,
k - параметр, определенный в интервале [0.2,0.5]. В текущей реализации используется значение, по умолчанию равное k=0.2.
Для упрощения расчета среднего значения и среднеквадратичного отклонения используется интегральное изображение (Faisal Shafait, Daniel Keysers, Thomas M. Breuel, "Efficient Implementation of Local Adaptive Thresholding Techniques Using Integral Images", Proc. SPIE 6815, Document Recognition and Retrieval XV, 681510 (January 28, 2008) / Файсал Шафит, Даниэль Кейсерс, Томас М. Бреулэл «Эффективная реализация локальных адаптивных методов пороговой обработки с помощью интегрального изображения», Распознавание и поиск документов XV, 681510 (28 января 2008 г)). В таком изображении значение отдельного пикселя определяется суммой значений пикселей, координаты которых меньше либо равны координатам пикселя, для которого ведется расчет. Значение пикселя в интегральном изображении (I) определяется по следующей формуле:
Тогда для расчета среднего значения можно использовать следующую формулу:
Расчет квадрата значения пикселя осуществляется схожим образом: осуществляется расчет среднего значения, но используется интегральное изображение, построенное по квадратам значений пикселей изображения.
Шаг 2. Создание списка связанных компонентов
«Связанный компонент» в контексте анализа изображений - это компонент, определяемый набором пикселей таким образом, что для каждого пикселя из набора по отношению к соседним выполняется правило связности.
Для составления списка связанных компонентов используется восьмипиксельная связанность, при которой выполняется правило: связанные пиксели - это пиксели, у которых есть одна общая грань или общий угол (расположены по диагонали относительно друг друга). Математически связанные пиксели определяются следующими условиями: для пикселя с координатами (х,у), связанными являются пиксели, для которых выполняется условие четырех пиксельной связанности и пиксели с координатами: (x±1,у±1) и .
Для составления списка связанных компонентов используется классический двухпроходный алгоритм. В первом проходе осуществляется маркировка каждого черного пикселя. Если у пикселя отсутствуют соседние черные пиксели, то такому пикселю присваивает новый номер (ярлык). Если у пикселя присутствуют соседние пиксели, то все черные пиксели объединяются под одним номером. Во втором проходе создаются связанные компоненты из пикселей с одним и тем же номером. Связанный компонент определяется набором пикселей и двумя крайними точками, которые определяют прямоугольник, который охватывает все пиксели
Шаг 3. Формирование структуры слов и строк из связных компонентов посредством вычисления спектра документа
Спектр документа представляют в виде столбчатой диаграммы, где каждому пикселю высоты или ширины изображения формируется столбец, по высоте соответствующий количеству черных (или белых в инвертированном варианте) пикселей с совпадающей координатой высоты или ширины соответственно.
Формирование структуры документа осуществляется из списка связанных компонентов, определенных при создании списка связанных компонентов.
Для определения слов и строк в изображении используется алгоритм построения спектра документа (O'Gorman, L. "The document spectrum for page layout analysis" Pattern Analysis and Machine Intelligence, IEEE Transactions on (Volume: 15, Issue: 11), pp. 1162-1173, 1993. / О'Горман, «Спектр документов для анализа макета» Анализ Образов и Машинный Интеллект 1993).
Таким образом, при формировании структуры документа пользователь отправляет команду на защиту документа. Документ переводится в графическое представление (если документ не является скан-образом, а является цифровым документом, например, в форматах MS Office или PDF). Графическим представлением документа является набор растровых изображений для каждой страницы в упорядоченном виде. Формируется структура защищенного документа.
Структура защищенного документа показана на фиг. 2. Каждый блок, показанный на фиг. 2, является прямоугольником с координатами верхнего левого угла и параметрами ширины и высоты блока. Формируется база данных электронных копий документов. Далее выполняется автоматический перенос образа документа в защищенную область хранения базы данных, доступ к которой запрещен для всех пользователей корпоративной сети. Структура защищенного документа сохраняется в отдельном виде и связывается с образом документа-оригинала. Результатом является древовидная структура, содержащая список строк и слов в строках.
При запросе пользователя доступа к содержимому документа, для которого были выполнены процедуры преобразования в защищенный документ и сохранения его структуры в базе данных, осуществляется этап 2 способа, а именно происходит перехватывание обращения и осуществляется процесс формирования персонализированной электронной копии документа с уникальным набором геометрических характеристик графических объектов измененной копии изображения. В случае многостраничного документа процедура выполняется для каждой страницы параллельно или последовательно.
Основное преимущество заявляемого способа на данном этапе состоит в том, что перехватывание обращения и подмена исходного документа на модифицированный позволяет производить встраивание заявляемого решения в готовые системы документооборота прозрачным образом, т.е. пользователь не замечает разницы между процессами работы с участием нашей системы или без него.
Процедура создания персонализированной электронной копии конфиденциального документа выполняют следующим образом. В память загружают оригинал изображения и структуру документа, сформированную на этапе защиты документа. Далее формируется последовательность псевдослучайных преобразований для каждого блока структуры страницы документа, в виде сдвигов по вертикали и горизонтали определенным образом. На оригинале выделяются блоки изображения, которые были сформированы на этапе защиты документа. К этим блокам применяется сформированная последовательность псевдослучайных преобразований. Страницы документа сохраняются во временные файлы формата PNG. Из этих файлов формируется PDF-файл с установленной защитой от печати. Сформированный PDF-файл сохраняется в папке хранилища, доступной только тому пользователю, для которого была сформирована копия. Так же на этот документ накладывается маска прав доступа, запрещающая получение содержимого документа всем пользователям, за исключением владельца копии. Временные файлы с изображением страниц удаляются с файловой системы сервера.
В процессе постраничного извлечения и анализа изображения на изображении страницы документа выявляют геометрические характеристики графических объектов (символов и встроенных в страницу изображений), производится группировка объектов до уровня отдельных слов с группировкой по строкам и отдельных изображений в рамках страницы. Полученные геометрические характеристики множества выявленных объектов сохраняются в базе данных. Геометрические характеристики объектов содержат координаты описанного прямоугольника над объектом относительно всего изображения и могут быть представлены в следующих видах:
- координаты двух противоположных углов прямоугольника (например: верхний левый и правый нижний угол);
- координаты любого угла и размеры прямоугольника (например: верхний левый угол, высота и ширина).
Геометрические характеристики объектов могут иметь любые единицы измерения, например точки, дюймы, сантиметры и прочее.
При установлении факта обнародования конфиденциального документа сотрудником службы безопасности проводится расследование с целью выяснения канала несанкционированного распространения и личности владельца неправомерно обнародованной копии (фиг. 4). Для этих целей создается специализированная папка расследования. Сотрудник службы безопасности выбирает документ, по которому проводится расследование, диапазон дат, в котором могла быть получена копия, страницу документа, для которой есть образец.
Для идентификации копии документа для установления факта несанкционированного обнародования конфиденциального документа загружают изображение страницы копии документа, распознают структуру исследуемой страницы копии документа. Из защищенной базы данных загружается изображение оригинала документа и его структура. Из защищенной базы данных также загружаются все преобразования, сгенерированные для этого документа за определенный период. Формируется и сохраняется калибровочная копия документа. Для калибровки используется интерфейс, который позволяет выбирать соответствующие блоки на образце и на калибровочной копии.
Далее сравнивают калибровочную копию документа и образца исследуемой копии документа. Для этого осуществляют подборку размеров исследуемого образца под размеры калибровочной копии по разнице расстояний между блоками. Генерируют копии оригинального документа для всех преобразований, полученных за определенный период. Накладывают изображения образца на изображение калибровочной копии. Определяют количество совпадающих пикселей калибровочной копии и исследуемого образца путем расчета процента совпадения из соотношения:
где Сробр - количество черных пикселей образца;
Срориг - количество черных пикселей оригинала;
Срсовп - количество совпадающих пикселей.
На основании вычисленного значения Р осуществляют сортировку результатов и по максимальному значению процентов совпадения пикселей созданной ранее персонализированной электронной копии документа и исследуемого образа документа определяют факт создания и несанкционированного распространения копии документа.
По итогам проведения расследования результаты идентификации позволяют сотруднику службы безопасности получить информацию о пользователе, для которого была создана персонализированная электронная копия документа, о дате создания персонализированной электронной копии документа, проценте совпадения персонализированной электронной копии и образа документа.
Таким образом, использование заявляемого способа позволяет однозначно установить канал несанкционированного распространения, в частности пользователя, допустившего умышленно либо в следствии не соблюдения регламентов или правил обращения с конфиденциальными документами несанкционированное распространение конфиденциального документа.
название | год | авторы | номер документа |
---|---|---|---|
Способ обеспечения безопасного использования электронного документа | 2018 |
|
RU2699234C1 |
СПОСОБ И УСТРОЙСТВО ДЛЯ ЗАЩИТЫ И АУТЕНТИФИКАЦИИ ДОКУМЕНТОВ | 2007 |
|
RU2458395C2 |
СПОСОБ И УСТРОЙСТВО ДЛЯ ЗАЩИТЫ И АУТЕНТИФИКАЦИИ ДОКУМЕНТОВ | 2012 |
|
RU2606056C2 |
СПОСОБ ИДЕНТИФИКАЦИИ ПЕЧАТНОЙ ФОРМЫ ДОКУМЕНТА И УСТРОЙСТВО ДЛЯ ЭТОЙ ЦЕЛИ | 2009 |
|
RU2511616C2 |
СПОСОБ И УСТРОЙСТВО ДЛЯ ОБЕСПЕЧЕНИЯ ЗАЩИТЫ ДОКУМЕНТОВ | 2008 |
|
RU2452014C2 |
СПОСОБ ВНЕСЕНИЯ ЦИФРОВЫХ МЕТОК В ЦИФРОВОЕ ИЗОБРАЖЕНИЕ И УСТРОЙСТВО ДЛЯ ОСУЩЕСТВЛЕНИЯ СПОСОБА | 2019 |
|
RU2739936C1 |
СПОСОБ И УСТРОЙСТВО ДЛЯ ОБЕСПЕЧЕНИЯ БЕЗОПАСНОСТИ ДОКУМЕНТОВ | 2007 |
|
RU2477522C2 |
СПОСОБ И УСТРОЙСТВО ДЛЯ ОБЕСПЕЧЕНИЯ БЕЗОПАСНОСТИ ДОКУМЕНТОВ | 2012 |
|
RU2628119C2 |
СПОСОБ ИДЕНТИФИКАЦИИ ЦИФРОВОГО ИЗОБРАЖЕНИЯ, СОДЕРЖАЩЕГО ЦИФРОВОЙ ВОДЯНОЙ ЗНАК | 2006 |
|
RU2304306C1 |
СПОСОБ И СИСТЕМА ЗАЩИТЫ ЦИФРОВОЙ ИНФОРМАЦИИ, ОТОБРАЖАЕМОЙ НА ЭКРАНЕ ЭЛЕКТРОННЫХ УСТРОЙСТВ, С ПОМОЩЬЮ ДИНАМИЧЕСКИХ ЦИФРОВЫХ МЕТОК | 2021 |
|
RU2758666C1 |
Изобретение относится к способу модификации копий документов и их идентификации для защиты документов от несанкционированного распространения. Техническим результатом является повышение защиты документа от несанкционированного распространения за счет обеспечения возможности идентификации пользователя, допустившего распространение документа. Раскрыт способ модификации и идентификации копии документа путем создания изображения документа, его модификации и идентификации копии документа, в котором на этапе создания изображения формируют структуру цифровой копии оригинала документа, для этого документ переводят в графическое представление в виде набора растровых изображений для каждой страницы в упорядоченном виде и формируют структуру защищенного документа в виде набора прямоугольных блоков с координатами верхнего левого угла и параметрами ширины и высоты блока, на этапе модификации изображения документа формируют по меньшей мере одну персонализированную электронную копию документа с уникальным набором геометрических характеристик графических объектов измененной копии изображения, регистрируют параметры уникального набора геометрических характеристик графических объектов персонализированной электронной копии документа и регистрируют информацию о пользователе, запросившем к ней доступ, на этапе идентификации копии документа для установления факта создания и несанкционированного распространения копии документа распознают структуру исследуемой копии документа, из базы данных загружают изображение в виде цифровой копии оригинала документа и его структуру, дополнительно из базы данных загружают все копии оригинального документа со всеми преобразованиями, сгенерированными для данного документа, формируют и сохраняют калибровочную копию документа, сравнивают калибровочную копию документа, исследуемую копию документа и все копии оригинального документа со всеми преобразованиями, сгенерированными для данного документа, путем наложения изображения образца на изображение калибровочной копии, подборки размеров исследуемого образца под размеры калибровочной копии по разнице расстояний между прямоугольными блоками, далее определяют количество совпадающих пикселей калибровочной копии и исследуемого образца путем расчета процента совпадения и на основании вычисленного значения осуществляют сортировку результатов, по максимальному значению процентов совпадения пикселей созданной ранее персонализированной электронной копии документа и исследуемого образа документа выносят суждение о факте создания и несанкционированного распространения копии документа. 5 з.п. ф-лы, 4 ил.
1. Способ модификации и идентификации копии документа путем создания изображения документа, его модификации и идентификации копии документа, отличающийся тем, что на этапе создания изображения формируют структуру цифровой копии оригинала документа, для этого документ переводят в графическое представление в виде набора растровых изображений для каждой страницы в упорядоченном виде и формируют структуру защищенного документа в виде набора прямоугольных блоков с координатами верхнего левого угла и параметрами ширины и высоты блока, на этапе модификации изображения документа формируют по меньшей мере одну персонализированную электронную копию документа с уникальным набором геометрических характеристик графических объектов измененной копии изображения, регистрируют параметры уникального набора геометрических характеристик графических объектов персонализированной электронной копии документа и регистрируют информацию о пользователе, запросившем к ней доступ, на этапе идентификации копии документа для установления факта создания и несанкционированного распространения копии документа распознают структуру исследуемой копии документа, из базы данных загружают изображение в виде цифровой копии оригинала документа и его структуру, дополнительно из базы данных загружают все копии оригинального документа со всеми преобразованиями, сгенерированными для данного документа, формируют и сохраняют калибровочную копию документа, сравнивают калибровочную копию документа, исследуемую копию документа и все копии оригинального документа со всеми преобразованиями, сгенерированными для данного документа, путем наложения изображения образца на изображение калибровочной копии, подборки размеров исследуемого образца под размеры калибровочной копии по разнице расстояний между прямоугольными блоками, далее определяют количество совпадающих пикселей калибровочной копии и исследуемого образца путем расчета процента совпадения из соотношения:
где: Сpобр - количество черных пикселей образца;
Сpориг - количество черных пикселей оригинала;
Сpсовп - количество совпадающих пикселей,
и на основании вычисленного значения P осуществляют сортировку результатов, по максимальному значению процентов совпадения пикселей созданной ранее персонализированной электронной копии документа и исследуемого образа документа выносят суждение о факте создания и несанкционированного распространения копии документа.
2. Способ по п. 1, отличающийся тем, что формируют базу данных электронных копий документов.
3. Способ по п. 1, отличающийся тем, что цифровую копию оригинала документа используют в качестве эталонного документа.
4. Способ по п. 1, отличающийся тем, что на этапе создания персонализированной электронной копии документа загружают оригинал изображения документа и структуру защищенного документа, далее формируют последовательность псевдослучайных преобразований для каждого блока структуры страницы документа в виде сдвигов по вертикали и горизонтали заданным образом, на оригинале выделяют блоки изображения, которые были сформированы на этапе защиты документа, и к этим блокам применяют сформированную последовательность псевдослучайных преобразований.
5. Способ по п. 1, отличающийся тем, что геометрические характеристики объектов включают координаты прямоугольного блока над объектом относительно всего изображения в виде значений координат двух противоположных углов прямоугольного блока.
6. Способ по п. 1, отличающийся тем, что геометрические характеристики объектов включают координаты прямоугольного блока над объектом относительно всего изображения в виде значений координат любого угла и значений размеров прямоугольного блока.
СПОСОБ ИДЕНТИФИКАЦИИ ПЕЧАТНОЙ ФОРМЫ ДОКУМЕНТА И УСТРОЙСТВО ДЛЯ ЭТОЙ ЦЕЛИ | 2009 |
|
RU2511616C2 |
СПОСОБ И УСТРОЙСТВО ДЛЯ ЗАЩИТЫ И АУТЕНТИФИКАЦИИ ДОКУМЕНТОВ | 2007 |
|
RU2458395C2 |
СПОСОБ И УСТРОЙСТВО ДЛЯ ОБЕСПЕЧЕНИЯ БЕЗОПАСНОСТИ ДОКУМЕНТОВ | 2007 |
|
RU2477522C2 |
US 5568550 A, 22.10.1996 | |||
US 7461778 B2, 09.12.2008. |
Авторы
Даты
2018-03-02—Публикация
2016-12-12—Подача