СПОСОБ АВТОМАТИЗИРОВАННОГО ПОИСКА ЭТАЛОННЫХ ПЕЧАТЕЙ Российский патент 2015 года по МПК G06T1/20 G06K9/50 G06K9/66 

Описание патента на изобретение RU2556461C2

Изобретение относится к области обработки данных, а в частности к способам распознавания данных, в том числе считывания знаков, изображений, образов.

Из уровня техники известны способы распознавания и поиска данных, в том числе изображений. Например, заявка на изобретение РФ №2012110605, система добавления метаданных, способ и устройство поиска изображения и способ добавления жеста для этого, 27.09.2013, которая включает в том числе и способ поиска изображения, содержащего извлечение по меньшей мере одних метаданных относительно изображения посредством анализа изображения; добавление метаданных к изображению и сохранение изображения с добавленными метаданными во внешнем устройстве и поиск по меньшей мере одного изображения из изображений, сохраненных во внешнем устройстве, на основе метаданных.

Недостатком известного способа является то, что для поиска изображения используются метаданные и не используется информация непосредственно из изображения, в данном случае при отсутствии таких метаданных изображение будет невозможно найти.

Наиболее близким техническим решением к предлагаемому изобретению является способ обнаружения лиц на изображении с применением каскада классификаторов (патент на изобретение РФ №2427911, опубликовано 27.08.2011).

Недостатком указанного способа является ограниченная возможность по поиску изображений только в виде лиц.

Технический результат, на решение которого направлено заявленное изобретение, заключается в создании быстрого, качественного и универсального способа, который позволил бы выявлять в любом документе заданную эталонную круглую печать.

Особенность способа по настоящему изобретению состоит в том, что если достаточно определить только наличие круглой печати, эталонные печати задавать не требуется.

Данный технический результат достигается посредством того, что в способе, включающем в себя использование каскадных класификаторов, предусматривается выполнение следующих операций:

- сбор коллекции различных изображений как содержащих круглые печати, так и не содержащих круглые печати;

- обучение каскадных классификаторов на собранных коллекциях изображений;

- преобразование в заранее заданный формат всех изображений эталонных печатей, заданных пользователем;

- сохранение преобразованных изображений печатей на запоминающем устройстве;

- выявление областей в электронном файле анализируемого документа, где предположительно может располагаться печать;

- сравнение найденных областей с заранее заданными эталонами;

- формирование результата, состоящего из эталонов, найденных в анализируемом документе.

Способ автоматизированного поиска эталонных печатей осуществляют следующим образом.

Используемый алгоритм состоит из двух ступеней:

1. На изображении ищутся области (заданные окнами - ограничивающими квадратами), похожие на круглую печать.

2. Найденные «подозрительные» области сравниваются с загруженными пользователем эталонами печатей.

Такая схема позволила достигнуть приемлемого качества и скорости работы.

Первая ступень настроена так, чтобы баланс ошибок был смещен в сторону ложноположительных срабатываний: практически все изображения печатей пропускаются до второй ступени, но вместе с ними могут попадаться и объекты, не являющиеся печатями.

На вторую ступень попадает небольшое количество подозрительных окон, что значительно сокращает пространство поиска и соответственно время работы детектора.

Для нахождения областей, похожих на круглую печать, был применен каскадный классификатор Виолы-Джонса. Указанный детектор представляет собой каскад очень простых классификаторов (принцип бустинга), основанных на признаках Хаара. Это позволяет отсекать большую часть окон на ранних стадиях, не прогоняя их через весь каскад. За счет этого достигается высокая скорость работы - детектор Виолы-Джонса широко используется для детектирования лиц (например, WO 2008064395 (PCT/AU 2007/001169)), в том числе в портативных устройствах в режиме real-time.

Общий принцип многих детекторов: изображение обрабатывается скользящим окном; для каждого окна решается независимо задача бинарной классификации: есть ли объект на изображении или нет. Если ответ положительный, то в данной позиции найден искомый объект. Размер скользящего окна варьируется от минимального до максимального с заданным множителем.

В способе используется реализация каскадного классификатора из OpenCV. Для обучения использовалась компьютерная программа «Traincascade».

Примеры реализации.

В компании ЗАО «ИнфоВотч» прошли испытания предложенного способа, а именно была создана большая коллекция круглых печатей, а также не-печатей (отрицательных примеров), состоящая примерно из 10.000 изображений. За основу были взяты различные изображения печатей и не-печатей (в частности, выкачанные автоматически из сети Интернет по разным запросам к Google Images), а также внутренняя коллекция документов с печатями компании.

Со всех изображений печати вырезались с помощью детектора окружностей Хафа, а затем с помощью отдельной компьютерной программы из каждого такого изображения создавалось еще несколько путем применения различных операций: поворота на случайный угол и изменения яркости на случайную величину (в пределах некоторого диапазона).

Отобранные каскадным классификатором окна сравниваются с эталонами, загруженными пользователем.

Однако сравнивать их напрямую нельзя, поскольку печать может быть повернута, а также слегка смещена и отмасштабирована относительно эталона. Поэтому используется преобразование Фурье-Меллина:

- К исходным изображениям применяется преобразование Фурье.

- Затем они переводятся в log-полярные координаты.

- Вычисляется фазовая корреляция, которая характеризует близость изображений.

После первых двух преобразований поворот и масштабирование представляются в виде линейных смещений.

Во время вычисления фазовой корреляции снова применяется преобразование Фурье, затем результаты перемножаются и выполняется обратное преобразование Фурье. Значения в ячейках полученной матрицы соответствуют близости изображений, полученных смещением исходных на величину, соответствующую данной ячейке.

Таким образом, благодаря выполненным преобразованиям достигается инвариантность относительно поворота, а также (в определенных пределах) смещения и масштабирования.

Мерой сходства изображения считается максимальное значение в сглаженной матрице фазовой корреляции. Если она превышает заданный порог, то детектор срабатывает.

Способ может работать только с круглыми печатями, поскольку именно на этом классе объектов был обучен каскадный классификатор.

Благодаря описанным взаимосвязанным действиям при использовании указанного способа значительно увеличивается скорость работы и повышается ее качество.

Анализ заявленного технического решения на соответствие условиям патентоспособности показал, что указанные в независимом пункте формулы признаки являются существенными и взаимосвязаны между собой с образованием устойчивой совокупности неизвестной на дату приоритета из уровня техники необходимых признаков, достаточной для получения требуемого синергетического (сверхсуммарного) технического результата.

Свойства, регламентированные в заявленном способе отдельными признаками, общеизвестны из уровня техники и не требуют дополнительных пояснений.

Таким образом, вышеизложенные сведения свидетельствуют о выполнении при использовании заявленного технического решения следующей совокупности условий:

- объект, воплощающий заявленное техническое решение, при его осуществлении предназначен для использования в области, касающейся обнаружения изображений, и может быть использован при обнаружении круглых печатей;

- для заявленного объекта в том виде, как он охарактеризован в независимом пункте формулы изобретения, подтверждена возможность его осуществления с помощью вышеописанных в материалах заявки известных из уровня техники на дату приоритета средств и методов;

- объект, воплощающий заявленное техническое решение, при его осуществлении способен обеспечить достижение усматриваемого заявителем технического результата.

Похожие патенты RU2556461C2

название год авторы номер документа
Способ оценки действительности документа при помощи оптического распознавания текста на изображении круглого оттиска печати/штампа на цифровом изображении документа 2020
  • Алиев Михаил Александрович
  • Арлазаров Владимир Викторович
  • Маталов Даниил Павлович
  • Николаев Дмитрий Петрович
  • Полевой Дмитрий Валерьевич
  • Усилин Сергей Александрович
RU2750395C1
СПОСОБ ИДЕНТИФИКАЦИИ ПЕЧАТИ НА ЦИФРОВОМ ИЗОБРАЖЕНИИ 2014
  • Шишкин Николай Викторович
  • Битков Евгений Николаевич
  • Битков Алексей Николаевич
  • Радаев Сергей Владимирович
  • Пронкин Алексей Александрович
  • Романишин Геннадий Валерьевич
  • Субботенко Александр Владимирович
  • Дамм Дмитрий Викторович
RU2560789C1
СПОСОБ АВТОМАТИЧЕСКОЙ КЛАССИФИКАЦИИ ФОРМАЛИЗОВАННЫХ ТЕКСТОВЫХ ДОКУМЕНТОВ И АВТОРИЗОВАННЫХ ПОЛЬЗОВАТЕЛЕЙ СИСТЕМЫ ЭЛЕКТРОННОГО ДОКУМЕНТООБОРОТА 2017
  • Поддубный Максим Игоревич
  • Королев Игорь Дмитриевич
  • Носенко Сергей Владимирович
  • Мезенцев Александр Сергеевич
RU2692043C2
СПОСОБ АВТОМАТИЧЕСКОЙ КЛАССИФИКАЦИИ ФОРМАЛИЗОВАННЫХ ЭЛЕКТРОННЫХ ГРАФИЧЕСКИХ И ТЕКСТОВЫХ ДОКУМЕНТОВ В СИСТЕМЕ ЭЛЕКТРОННОГО ДОКУМЕНТООБОРОТА С АВТОМАТИЧЕСКИМ ФОРМИРОВАНИЕМ ЭЛЕКТРОННЫХ ДЕЛ 2020
  • Королев Игорь Дмитриевич
  • Филиппов Максим Юрьевич
  • Назинцев Вадим Сергеевич
RU2759887C1
СПОСОБ И СИСТЕМА ВЫЯВЛЕНИЯ ВРЕДОНОСНЫХ ФАЙЛОВ В НЕИЗОЛИРОВАННОЙ СРЕДЕ 2020
  • Прудковский Николай Сергеевич
RU2722692C1
Устройство для семантической классификации и поиска в архивах оцифрованных киноматериалов 2016
  • Подлесный Сергей Юрьевич
  • Кучеренко Алексей Валентинович
RU2628192C2
Способ обучения классификатора, предназначенного для определения категории документа 2017
  • Дорогой Дмитрий Сергеевич
  • Шаров Александр Валерьевич
  • Тузовский Александр Александрович
  • Терещенко Илья Анатольевич
RU2672395C1
ОБНАРУЖЕНИЕ БЛИКА В КАДРЕ ДАННЫХ ИЗОБРАЖЕНИЯ 2014
  • Бочаров Константин Юрьевич
  • Костюков Михаил Валерьевич
RU2653461C2
СПОСОБ ОБНАРУЖЕНИЯ ЛИЦ НА ИЗОБРАЖЕНИИ С ПРИМЕНЕНИЕМ КАСКАДА КЛАССИФИКАТОРОВ 2010
  • Ирматов Анвар Адхамович
  • Буряк Дмитрий Юрьевич
  • Чердаков Дмитрий Владимирович
  • Лии Донгсунг
RU2427911C1
УСТРОЙСТВО АВТОМАТИЗИРОВАННОГО РАСПОЗНАВАНИЯ ЛИЦ ПРИ ОБРАБОТКЕ ГРУППОВОЙ ФОТОГРАФИИ 2013
  • Марчук Владимир Иванович
  • Шерстобитов Александр Иванович
  • Воронин Вячеслав Владимирович
  • Семенищев Евгений Александрович
  • Приходченко Владислав Александрович
  • Тимофеев Дмитрий Витальевич
  • Гапон Николай Валерьевич
RU2541918C2

Реферат патента 2015 года СПОСОБ АВТОМАТИЗИРОВАННОГО ПОИСКА ЭТАЛОННЫХ ПЕЧАТЕЙ

Изобретение относится к области обработки данных, а в частности к способам распознавания данных, в том числе считывания знаков, изображений, образов. Техническим результатом является повышение быстродействия при выявлении в любом документе заранее заданной эталонной круглой печати. Предложен способ автоматизированного поиска заранее заданных эталонных круглых печатей. Способ включает в себя этап, на котором осуществляют сбор коллекции различных заранее заданных изображений как содержащих круглые печати, так и не содержащих круглые печати. Далее согласно способу осуществляют обучение каскадных классификаторов на собранных коллекциях изображений и преобразование в заранее заданный формат всех изображений эталонных печатей, заданных пользователем. А также выявляют области в электронном файле анализируемого документа, где предположительно может располагаться печать, и осуществляют сравнение найденных областей с заранее заданными эталонами.

Формула изобретения RU 2 556 461 C2

Способ автоматизированного поиска заранее заданных эталонных круглых печатей, включающий в себя использование каскадных классификаторов, отличающийся тем, что предусматривает выполнение следующих операций:
сбор коллекции различных заранее заданных изображений как содержащих круглые печати, так и не содержащих круглые печати;
обучение каскадных классификаторов на собранных коллекциях изображений;
преобразование в заранее заданный формат всех изображений эталонных печатей, заданных пользователем;
сохранение преобразованных изображений печатей на запоминающем устройстве;
выявление областей в электронном файле анализируемого документа, где предположительно может располагаться печать;
сравнение найденных областей с заранее заданными эталонами;
формирование результата, состоящего из эталонов, найденных в анализируемом документе.

Документы, цитированные в отчете о поиске Патент 2015 года RU2556461C2

САРАЕВ А.А
и др
"Выделение графических примитивов для анализа структуры документа на примере локализации печатей", опубликовано по данным сайта <URL: http://www.web.archive.org> 05.09.2012, 6 стр
Способ защиты переносных электрических установок от опасностей, связанных с заземлением одной из фаз 1924
  • Подольский Л.П.
SU2014A1
CN 101162506 A, 16.04.2008
WO

RU 2 556 461 C2

Авторы

Чепарухин Александр Александрович

Пшехотская Екатерина Александровна

Рябов Сергей Сергеевич

Даты

2015-07-10Публикация

2013-11-18Подача