Способ автоматизированного анализа растровых изображений Российский патент 2017 года по МПК G06K9/64 G06T7/136 G06F17/30 

Описание патента на изобретение RU2633159C1

Область техники, к которой относится изобретение

Настоящее изобретение относится к автоматизированному анализу растровых изображений и может быть использовано при разработке новых и совершенствовании существующих систем проверки растровых изображений на совпадение с эталонными изображениями.

Уровень техники

В настоящее время весьма остро стоит проблема так называемого перехвата данных. Такая проблема может встретиться в случае отслеживания различных документов, в т.ч. содержащих изображения, проходящих по сети компании, на предмет наличия в них конфиденциальной информации.

В настоящее время известно несколько систем или способов, позволяющих решить эту проблему.

Например, в патенте России №2420800 (приоритет от 30.06.2009, опубликовано 10.06.2011) раскрыт способ поиска похожих по смысловому содержимому электронных документов, в котором задают правила формирования уникальных слов, взвешиваются уникальные слова и связи между ними, строят на основе этого семантическую сеть и сравнивают семантические сети документов. Этот способ достаточно трудоемок и пригоден лишь в ограниченной области.

Известен способ индексации и поиска цифровых изображений (патент на изобретение РФ №2510935, приоритет от 23.09.2011, опубликовано 10.04.2014). Способ, описанный в данном патенте, подходит для поиска изображений определенной категории, в том числе цветовой, но при этом не подходит для задачи поиска конкретного изображения в обширной базе данных, где может присутствовать много изображений с одинаковыми преобладающими цветами. Так как автор патента ставил задачу поиска изображений, подходящих под некоторое описание, он сам указал в качестве недостатка некоторых других методов тот факт, что они могут классифицировать изображения с похожими преобладающими цветами как совершенно различные. В то же время заявленное изобретение решает задачу поиска конкретного изображения с поправкой на искажения, возникающие при его сохранении в разных форматах и разных масштабах. При такой постановке задачи недостатком становится именно невозможность различить изображения с похожими характеристиками.

Раскрытие изобретения

Таким образом, существует потребность в расширении арсенала технических средств за счет создания сравнительно быстрого и универсального способа, который позволил бы выявлять в потоке данных растровые изображения, схожие с эталонными и который бы преодолевал недостатки известных решений.

Для решения этой задачи и получения указанного технического результата в настоящем изобретении предложен способ автоматизированного анализа растровых изображений, заключающийся в следующем.

1. Создают специализированную базу данных эталонных изображений, специализация которой заключается в том, что данные из эталонных изображений хранятся специальным образом. Каждое эталонное изображение описывается тремя параметрами: растр (набор пикселей), порог срабатывания (R, задается в процентах от 1 до 100), размер диапазона допустимых интенсивностей пикселя (L). Первый параметр используется как эталонные данные, второй и третий влияют на качество поиска. Для создания такой базы данных выполняют следующие шаги:

1) каждому эталонному изображению присваивают уникальный идентификатор;

2) все электронные файлы эталонных растровых изображений преобразуют в заранее заданный формат (bmp);

3) каждое эталонное изображение переводят в градации серого, где 1 пиксель кодируется 1 байтом, диапазон интенсивностей от 0 до 255;

4) каждое эталонное изображение ужимают до размера 20 на 20 пикселей;

5) для каждого пикселя строится допустимый диапазон интенсивностей, для этого строится массив допустимых интенсивностей размера L, каждый элемент которого представляет собой значение интенсивности, высчитываемое по формуле

,

где k[i] - элемент массива допустимых интенсивностей,

l - интенсивность в текущем пикселе,

L/2 - половина размера диапазона допустимых интенсивностей,

i - номер текущего элемента массива допустимых интенсивностей, принимает

значения от 0 до L. В граничных ситуациях, когда, например, разность интенсивности и L/2 меньше 0, отрицательные значения интенсивности отбрасывают. Также поступают с верхней границей - значения интенсивности больше 255 также отбрасывают. В этих случаях размер массива допустимых интенсивностей может быть меньше L.

6) создают трехмерный массив, первое измерение которого отражает все возможные значения интенсивности цвета (256 элементов), второе измерение отражает все пиксели изображения (400 элементов, при целевом размере изображения 20 на 20 пикселей), третье измерение будет содержать идентификаторы эталонов (размер заранее неизвестен, зависит от количества эталонных изображений).

7) каждое подготовленное изображение раскладывают по массиву из п. 6 следующим образом:

a) обходят все пиксели текущего эталона, позиция пикселя в изображении - это индекс второго измерения в массиве из п. 1.6;

b) для текущего пикселя обходят все допустимые значения интенсивности, интенсивность - индекс первого измерения в массиве из п. 1.6;

c) в массив из п. 6 по индексу соответствующей интенсивности (п. 1.7.b) и по позиции пикселя на изображении (п. 1.7.а) добавляется идентификатор эталонного документа.

8) создают вспомогательный массив, в котором ключом является уникальный идентификатор эталонного изображения, а значениями - счетчик найденных пикселей (инициализируется 0) и порог срабатывания эталона R.

2. Когда на анализ поступает файл, содержащий растровое изображение, то производят следующие действия:

1) изображение преобразуют в заранее заданный формат (bmp);

2) изображение переводят в градации серого, где 1 пиксель кодируется 1 байтом, диапазон интенсивностей от 0 до 255;

3) изображение ужимают до размера 20 на 20 пикселей;

4) для каждого пикселя анализируемого изображения:

a) по интенсивности, которая является индексом первого измерения массива из п. 1.6 получают массив позиций, в которые входит пиксель с такой интенсивностью;

b) по позиции пикселя в анализируемом изображении, которая является индексом в массиве, полученном в п. 2.4.а, получают список идентификаторов эталонов.

с) в вспомогательном массиве из п. 1.8 увеличивают счетчики найденных пикселей для эталонов, полученных в п. 2.4.b.

5) обходят вспомогательный массив:

a) счетчики найденных пикселей делят на размеры изображения (400) и умножают на 100, таким образом получают процент соответствия анализируемого изображения данному эталону;

b) сравнивают процент соответствия с соответствующими порогами;

c) если порог превышен, помещают идентификатор эталонного документа в список найденных эталонов;

d) обнуляют счетчики найденных пикселей;

6) возвращают массив найденных идентификаторов эталонных документов.

Настоящее изобретение может быть реализовано в любой вычислительной системе, например в персональном компьютере, на сервере и т.п.

Способ автоматизированного анализа растровых изображений по настоящему изобретению предназначен для осуществления так называемого копирайтного анализа (английский аналог - fingerprint detection), задачей которого является установление схожести растровых изображений с изображениями, переданным ранее в базу данных (библиотеку) в качестве эталонных.

Особенностью данного алгоритма является то, что параметрами R и L можно влиять на показатели полноты и качества алгоритма. Например, увеличивая значение L, можно повышать устойчивость к шуму и артефактам ценой повышенного риска ложноположительных срабатываний. Параметр R отвечает за степень похожести изображений в рамках алгоритма.

Похожие патенты RU2633159C1

название год авторы номер документа
Способ автоматизированного анализа векторных изображений 2016
  • Рябов Сергей Сергеевич
  • Никифоров Анатолий Сергеевич
  • Коробов Дмитрий Александрович
RU2633156C1
СПОСОБ АВТОМАТИЗИРОВАННОГО АНАЛИЗА ТЕКСТОВЫХ ДОКУМЕНТОВ 2011
  • Лапшин Владимир Анатольевич
  • Пшехотская Екатерина Александровна
  • Перов Дмитрий Всеволодович
RU2474870C1
СПОСОБ ИДЕНТИФИКАЦИИ МАССИВОВ БИНАРНЫХ ДАННЫХ 2015
  • Рябоконь Владимир Владимирович
  • Лебеденко Евгений Викторович
RU2601191C1
СПОСОБ ИНДЕКСАЦИИ И ПОИСКА ЦИФРОВЫХ ИЗОБРАЖЕНИЙ 2011
  • Игнатов Артем Константинович
RU2510935C2
СПОСОБ ДЕТЕКТИРОВАНИЯ АНОМАЛЬНОГО РАЗВИТИЯ АГРОФИТОЦЕНОЗОВ В ПРЕДЕЛАХ СЕЛЬСКОХОЗЯЙСТВЕННОГО ПОЛИГОНА 2019
  • Салмин Андрей Сергеевич
  • Ананьев Александр Андреевич
  • Железова Софья Владиславовна
RU2785225C2
СПОСОБ АВТОМАТИЗИРОВАННОГО АНАЛИЗА ЭТАЛОННЫХ ФОРМ 2013
  • Пшехотская Екатерина Александровна
  • Рябов Сергей Сергеевич
RU2581766C2
СПОСОБ АВТОМАТИЗИРОВАННОГО ПОИСКА ЭТАЛОННЫХ ПЕЧАТЕЙ 2013
  • Чепарухин Александр Александрович
  • Пшехотская Екатерина Александровна
  • Рябов Сергей Сергеевич
RU2556461C2
СПОСОБ АВТОМАТИЧЕСКОГО РЕТУШИРОВАНИЯ СНИМКОВ 2012
  • Калиниченко Анатолий Петрович
  • Лыков Вячеслав Владимирович
  • Шойко Сергей Михайлович
  • Давыдов Вячеслав Фёдорович
  • Корольков Анатолий Владимирович
RU2504840C1
СПОСОБ АВТОМАТИЗИРОВАННОГО АНАЛИЗА ВЫГРУЗОК ИЗ БАЗ ДАННЫХ 2013
  • Пшехотская Екатерина Александровна
  • Рябов Сергей Сергеевич
RU2546583C2
СПОСОБ ИЗВЛЕЧЕНИЯ ПОЛЕЗНОГО КОНТЕНТА ИЗ УСТАНОВОЧНЫХ ФАЙЛОВ МОБИЛЬНЫХ ПРИЛОЖЕНИЙ ДЛЯ ДАЛЬНЕЙШЕЙ МАШИННОЙ ОБРАБОТКИ ДАННЫХ, В ЧАСТНОСТИ ПОИСКА 2014
  • Нагорный Алексей Сергеевич
RU2568276C2

Реферат патента 2017 года Способ автоматизированного анализа растровых изображений

Изобретение относится к автоматизированному анализу растровых изображений. Техническим результатом является расширение арсенала технических средств по выявлению в растровых изображениях схожих с эталоном пикселей растровых изображений. Предложен способ автоматизированного анализа растровых изображений. Согласно способу преобразуют в заранее заданный формат все электронные файлы эталонных растровых изображений, переводя цвета в градации серого и сжимая до квадрата малой площади порядка 20×20 пикселей. Далее, согласно способу сохраняют преобразованные электронные файлы эталонных растровых изображений в специализированной базе данных. Преобразуют каждый электронный файл анализируемого растрового изображения в заранее заданный формат, идентичный эталонному. Осуществляют поиск каждого пикселя изображения в специализированной базе данных и извлекают из нее информацию о том, в каких эталонных изображениях на данном месте встречается схожий пиксель. При этом специализированная база данных содержит эталонные изображения, при этом каждому эталонному изображению присваивают идентификатор.

Формула изобретения RU 2 633 159 C1

Способ автоматизированного анализа растровых изображений, заключающийся в том, что

преобразуют в заранее заданный формат все электронные файлы эталонных растровых изображений, переводя цвета в градации серого и сжимая до квадрата малой площади порядка 20×20 пикселей;

сохраняют преобразованные электронные файлы эталонных растровых изображений в специализированной базе данных;

преобразуют каждый электронный файл анализируемого растрового изображения в заранее заданный формат, идентичный эталонному;

осуществляют поиск каждого пикселя изображения в специализированной базе данных и извлекают из нее информацию о том, в каких эталонных изображениях на данном месте встречается схожий пиксель;

специализированная база данных содержит эталонные изображения, при этом каждому эталонному изображению присваивают идентификатор;

эталонные изображения описываются тремя параметрами: растр - набор пикселей, используемый как эталонные данные, R - порог срабатывания, заданный в пределах от 1 до 100%, L - размер диапазона допустимых интенсивностей пикселя;

анализ каждого пикселя анализируемого растрового изображения осуществляется посредством создания списка идентификаторов эталонов по позиции пикселя в анализируемом изображении, который является индексом в массиве позиций, определения процента соответствия эталону посредством деления счетчиков найденных пикселей на размеры изображений и умножения на 100, сравнения процента соответствия с заданным порогом, если порог превышен, помещают идентификатор эталонного документа в список найденных эталонов.

Документы, цитированные в отчете о поиске Патент 2017 года RU2633159C1

US 6418430 B1, 09.07.2002
US 5915250 A, 22.06.1999
Станок для изготовления деревянных ниточных катушек из цилиндрических, снабженных осевым отверстием, заготовок 1923
  • Григорьев П.Н.
SU2008A1
Способ защиты переносных электрических установок от опасностей, связанных с заземлением одной из фаз 1924
  • Подольский Л.П.
SU2014A1
Многоступенчатая активно-реактивная турбина 1924
  • Ф. Лезель
SU2013A1
CПОСОБ АВТОМАТИЧЕСКОГО РАСПОЗНАВАНИЯ ОБЪЕКТОВ НА ИЗОБРАЖЕНИИ 2013
  • Ефремов Владимир Анатольевич
  • Тупиков Владимир Алексеевич
  • Московченко Леонид Васильевич
  • Павлова Валерия Анатольевна
  • Кудрин Михаил Иванович
  • Мананников Владимир Васильевич
  • Созинова Мария Владимировна
  • Крюков Сергей Николаевич
RU2528140C1
СПОСОБ ПОИСКА ПОХОЖИХ ПО СМЫСЛОВОМУ СОДЕРЖИМОМУ ЭЛЕКТРОННЫХ ДОКУМЕНТОВ, РАЗМЕЩЕННЫХ НА УСТРОЙСТВАХ ХРАНЕНИЯ ДАННЫХ 2009
  • Бородащенко Антон Юрьевич
  • Бочков Сергей Максимович
  • Васинев Дмитрий Александрович
  • Салбиев Артем Леонидович
RU2420800C2
СПОСОБ ИНДЕКСАЦИИ И ПОИСКА ЦИФРОВЫХ ИЗОБРАЖЕНИЙ 2011
  • Игнатов Артем Константинович
RU2510935C2

RU 2 633 159 C1

Авторы

Рябов Сергей Сергеевич

Степанов Виктор Сергеевич

Даты

2017-10-11Публикация

2016-08-26Подача