СПОСОБ РАСПОЗНАВАНИЯ СЛОЖНОГО ГРАФИЧЕСКОГО ОБЪЕКТА Российский патент 2007 года по МПК G06K9/62 

Описание патента на изобретение RU2297039C2

Изобретение относится к автоматике и вычислительной технике и, в частности, к системам искусственного интеллекта, предназначено для идентификации сложных объектов на изображении и может быть использовано в системах электронного документооборота (Фиг.1).

Известен способ компьютерного распознавания объектов (см. патент RU 2191431 С2, кл. МПК G 06 K 9/68, от 03.12.1999), при котором на экран монитора выводится изображение распознаваемого объекта, преобразованное в изображение, выполненное в градациях - различных степенях яркости одного цвета, и на него последовательно, поочередно накладываются изображения хранящихся в памяти компьютера шаблонов, выполненных, например, в градациях зеленого, что позволяет увидеть в зоне перекрытия изображений изображение другого, отличного от первых двух цвета, которое и фиксируется как распознанное в случае тождественных, идентичных, а значит, имеющих одинаковый контур изображений распознаваемого объекта и шаблона.

Недостатком данного способа является ограничение класса изображений только двухуровневыми изображениями.

Известен способ компьютерного распознавания объектов (см. патент RU 2234127 С2, кл. МПК G 06 K 9/68, от 05.06.2002), при котором программа распознавания объектов пошагово совмещает нормализованные изображения, центрированные и вписанные в одинаковых размеров ячейки таблицы распознаваемых объектов, и изображения шаблонов, центрированные и вписанные в аналогичные ячейки таблицы шаблонов, с шагом, равным высоте строки с ячейками или ширине столбца ячеек таблиц.

Недостатком данного способа является необходимость обеспечения центрирования и нормализации изображений. Кроме того, при пошаговом совмещении изображений даже небольшие различия в структуре изображений приводят к резкому увеличению ошибки распознавания.

Наиболее близким по своей технической сущности к заявляемому способу (прототипом) является способ распознавания заданного эталонного изображения на предъявляемой сцене (см. патент США №6775411, кл. МПК G 06 K 9/62, от 13.01.2005), который заключается во фрактальном кодировании анализируемой сцены, при котором сцена разбивается на ранговые блоки, эталонное изображение разбивается на доменные блоки, производится итеративный поиск наилучшего доменно-рангового сопоставления и подсчитывается число успешных сопоставлений. Затем общее число успешных сопоставлений делится на общее число ранговых блоков в сцене для вычисления относительного числа успешных сопоставлений. Решение о присутствии заданного эталона в сцене принимается посредством анализа значения относительного числа успешных сопоставлений.

Однако этот способ также имеет недостаток, заключающийся в недостаточной достоверности распознавания за счет использования низкоинформативного признака.

Задача, решаемая изобретением, заключается в повышении достоверности распознавания за счет извлечения из анализируемых изображений признака, способного эффективно описывать изображения сколь угодно сложной структуры и инвариантного к искажениям изображения в допустимых пределах.

Сущность изобретения заключается в том, что изображения всех эталонных объектов разбивают на пересекающиеся доменные блоки, а изображение анализируемого объекта разбивают на непересекающиеся ранговые блоки, размер которых меньше доменных блоков. Затем производят поиск наилучшего сопоставления всех ранговых блоков анализируемого изображения и доменных блоков всех эталонных изображений с использованием сжимающих аффинных преобразований. Для каждого эталона вектор расстояния между сопоставленными ранговым и доменным блоками записывают в таблицу. Далее таблицу подают на классификатор. Данные с классификатора поступают на блок принятия решения о принадлежности анализируемого объекта к одному из эталонных объектов, где и принимают решение.

Пример реализации данного способа поясняется чертежами, на которых на Фиг.1 показана схема реализации способа, на Фиг.2 - блок-схема операций предлагаемого способа, на Фиг.3 - результат разбиения изображений на блоки и отображение доменного блока в ранговый, на Фиг.4 - результат применения сжимающего аффинного преобразования, на Фиг.5 - вектор расстояния между подобными доменным и ранговым блоком, на фиг.6 - пример формирования таблицы векторов расстояний, на Фиг.7-9 - схема алгоритма предлагаемого способа.

Выполнение предлагаемого способа осуществляется в несколько этапов, как изображено на Фиг.2. Первоначально, на этапе предобработки, на изображениях всех эталонных объектов формируются доменные блоки (блок 5, Фиг.2), представляющие собой области изображения размером 8×8 пикселей. Затем в изображении анализируемого объекта формируются ранговые блоки (блок 6, Фиг.2), представляющие собой области изображения размером 4×4 пикселей. Таким образом, ранговые блоки в два раза меньше доменных блоков. Указанная разница в размере необходима для того, чтобы аффинное преобразование было сжимающим. Результат формирования доменных и ранговых блоков показан на Фиг.3.

Далее, с использованием аффинных преобразований, реализуют итерационный алгоритм поиска для каждого рангового блока подобного ему доменного блока (блок 7, Фиг.2). Блоки считаются подобными, если значение средней пиксельной ошибки PSNR, определяемое по формуле (1), меньше некоторого порогового значения [4]:

где k, w - сравниваемые изображения, Mgravlavel - число уровней изображения, Nrows, Ncols - число строк и столбцов изображения, kij, wij - значения пикселя в i ряду j столбце соответствующего изображения. Пороговое значение выбирается исходя из требуемой точности распознавания и априорно известного уровня искажений.

Сжимающее аффинное преобразование определяется формулой (2):

где хn, уn и xn+1, yn+1 входные и выходные координаты пикселя в декартовой системе, a, b, c, d - коэффициенты, отвечающие за масштабирование и поворот, e, f - коэффициенты, отвечающие за перенос [4]. Результаты сжимающих аффинных преобразований представлены на Фиг.4.

Для тех ранговых и доменных блоков, значение PSNR между которыми меньше порогового, в блоке 8 (Фиг.2) отдельно для каждого эталона формируется таблица векторов расстояний между центами блоков (Фиг.5), ячейки которой получают приращения при записи (блок 9, Фиг.2) в таблицу вектора расстояния, значение которого удовлетворяет диапазону ячейки. В качестве меры расстояния выбрано Евклидово расстояние. Пример формирования таблицы показан на Фиг.6.

После завершения итерационного поиска подобных доменных и ранговых блоков сформированные таблицы каждого эталона поступают на классификатор (блок 10, Фиг.2) по методу наименьших квадратов (3) [5]:

где d - расстояние между объектами k и w, si - iый признак объекта k, gi - iый признак объекта w.

Полученное расстояние между объектами поступает на блок 11 (Фиг.2) принятия решения о принадлежности анализируемого изображения к одному из эталонных. Анализируемое изображение соответствует тому объекту, расстояние до которого является наименьшим. Схема алгоритма предлагаемого способа изображена на Фиг.7-9.

Введение нового признакового пространства, формируемого путем дополнительного учета вектора расстояния между подобными ранговыми и доменными блоками, позволяет с использованием статистической теории распознавания [5] повысить вероятность распознавания анализируемого объекта. Кроме того, извлечение нового признака не повышает вычислительную сложность способа, т.к. для этого используется сжимающее аффинное преобразование, как и в прототипе. Следовательно, предлагаемый метод обеспечивает лучшую степень распознавания по сравнению с прототипом.

Предлагаемый способ реализован в среде программирования C++Builder 6.0 с использованием графического интерфейса GUI и рассчитан на выполнение в среде Windows на ПЭВМ класса Pentium, CPU 200 Мгц, 64 RAM и выше.

Описание элементов фигур

Фигура 1:

1 - Анализируемая сцена;

2 - Сканирующее устройство;

3 - ЭВМ;

4 - Эталонные изображения.

Фигура 2:

5 - Блок формирования доменных блоков в изображениях всех эталонных объектов;

6 - Блок формирования ранговых блоков в изображении анализируемого объекта;

7 - Блок поиска наилучшего доменно-рангового сопоставления;

8 - Блок формирование векторов расстояний;

9 - Блок записи векторов в таблицу;

10 - Блок классификатора;

11 - Блок принятия решения.

Фигура 3:

12 - Эталонное изображение;

13 - Доменный блок;

14 - Ранговый блок;

15 - Анализируемое изображение.

Фигура 5:

16 - Доменный блок;

17 - Эталонное изображение;

18 - Проекция доменного блока;

19 - Анализируемое изображение;

20 - Ранговый блок;

21 - Вектор расстояния между доменным и ранговым блоком.

Источники информации

1. Патент RU 2191431 С2, кл. МПК G 06 K 9/68, от 03.12.1999.

2. Патент RU 2234127 С2, кл. МПК G 06 K 9/68, от 05.06.2002.

3. Патент США №6775411, кл. МПК G 06 K 9/62, от 13.01.2005.

4. Уэлстид С. Фракталы и вейвлеты для сжатия изображений в действии / Перевод с англ. - М.: Триумф, 2001.

5. Фукунага К. Введение в статистическую теорию распознавания образов / Перевод с англ. - М.: Наука, 1979.

Похожие патенты RU2297039C2

название год авторы номер документа
СПОСОБ ИДЕНТИФИКАЦИИ ПЕЧАТИ НА ЦИФРОВОМ ИЗОБРАЖЕНИИ 2014
  • Шишкин Николай Викторович
  • Битков Евгений Николаевич
  • Битков Алексей Николаевич
  • Радаев Сергей Владимирович
  • Пронкин Алексей Александрович
  • Романишин Геннадий Валерьевич
  • Субботенко Александр Владимирович
  • Дамм Дмитрий Викторович
RU2560789C1
СПОСОБ ИДЕНТИФИКАЦИИ ПРОТЯЖЕННЫХ ОБЪЕКТОВ ЗЕМНОЙ ПОВЕРХНОСТИ 2015
  • Акперов Имран Гурру Оглы
  • Крамаров Сергей Олегович
  • Храмов Владимир Викторович
  • Митясова Ольга Юрьевна
  • Повх Виктор Иванович
RU2640331C2
СПОСОБ РАСПОЗНАВАНИЯ И КЛАССИФИКАЦИИ ФОРМЫ ОБЪЕКТОВ В ЛАБИРИНТНЫХ ДОМЕННЫХ СТРУКТУРАХ 2012
  • Брагин Анатолий Валерьевич
  • Логунов Михаил Владимирович
  • Никитов Сергей Аполлонович
  • Пьянзин Денис Васильевич
  • Трифонов Андрей Александрович
RU2522869C2
СПОСОБ И УСТРОЙСТВО ДЛЯ РАСПОЗНАВАНИЯ ИЗОБРАЖЕНИЙ ОБЪЕКТОВ 2007
  • Коростелев Сергей Иванович
  • Титов Виталий Семенович
  • Панищев Владимир Славиевич
RU2361273C2
СПОСОБ ИДЕНТИФИКАЦИИ ЛИЧНОСТИ ЧЕЛОВЕКА ПО ЦИФРОВОМУ ИЗОБРАЖЕНИЮ ЛИЦА 2014
  • Хомяков Юрий Николаевич
RU2613852C2
СПОСОБ РАСПОЗНАВАНИЯ СЛОЖНОГО ГРАФИЧЕСКОГО ОБЪЕКТА 2006
  • Миняев Андрей Александрович
  • Яковлев Вадим Лаврович
RU2321058C1
УСТРОЙСТВО ПОИСКА ДУБЛИКАТОВ ИЗОБРАЖЕНИЙ 2013
  • Марчук Владимир Иванович
  • Воронин Вячеслав Владимирович
  • Письменскова Марина Михайловна
  • Морозова Татьяна Владимировна
RU2538319C1
СПОСОБ РАСПОЗНАВАНИЯ ОБРАЗОВ НА ЦИФРОВОМ ИЗОБРАЖЕНИИ 2013
  • Босов Юрий Олегович
  • Зегжда Дмитрий Петрович
  • Москвин Дмитрий Андреевич
RU2536677C2
СПОСОБ ПЕРЕДАЧИ ДОПОЛНИТЕЛЬНОЙ ИНФОРМАЦИИ ПРИ СОВМЕСТНОМ ИСПОЛЬЗОВАНИИ ВЕКТОРНОГО КВАНТОВАНИЯ И ФРАКТАЛЬНОГО КОДИРОВАНИЯ ИЗОБРАЖЕНИЙ С УЧЕТОМ КЛАССИФИКАЦИИ ДОМЕНОВ И БЛОКОВ ИЗ КОДОВОЙ КНИГИ 2006
  • Тезин Александр Васильевич
  • Шмойлов Александр Витальевич
RU2327301C2
УСТРОЙСТВО АВТОМАТИЗИРОВАННОГО РАСПОЗНАВАНИЯ ЛИЦ ПРИ ОБРАБОТКЕ ГРУППОВОЙ ФОТОГРАФИИ 2013
  • Марчук Владимир Иванович
  • Шерстобитов Александр Иванович
  • Воронин Вячеслав Владимирович
  • Семенищев Евгений Александрович
  • Приходченко Владислав Александрович
  • Тимофеев Дмитрий Витальевич
  • Гапон Николай Валерьевич
RU2541918C2

Иллюстрации к изобретению RU 2 297 039 C2

Реферат патента 2007 года СПОСОБ РАСПОЗНАВАНИЯ СЛОЖНОГО ГРАФИЧЕСКОГО ОБЪЕКТА

Изобретение относится к автоматике и вычислительной технике и, в частности, к системам искусственного интеллекта и предназначено для идентификации сложных объектов на изображении. Технический результат заключается в повышении достоверности распознавания за счет извлечения из анализируемых изображений признака, способного эффективно описывать изображения сколь угодно сложной структуры и инвариантного к искажениям изображения в допустимых приделах. Результат достигается за счет того, что изображения всех эталонных объектов разбивают на пересекающиеся доменные блоки, а изображение анализируемого объекта разбивают на непересекающиеся ранговые блоки, размер которых меньше доменных блоков. Затем производят поиск наилучшего сопоставления всех ранговых блоков анализируемого изображения и доменных блоков всех эталонных изображений с использованием сжимающих аффинных преобразований. После этого формируют вектора расстояний между геометрическими центрами сопоставленных доменных для эталонного объекта и ранговых для анализируемого объекта блоков. 6 ил.

Формула изобретения RU 2 297 039 C2

Способ распознавания сложных графических объектов, заключающийся в том, что изображения всех эталонных объектов разбивают на пересекающиеся доменные блоки, представляющие собой часть изображения в виде квадрата, а изображение анализируемого объекта разбивают на непересекающиеся ранговые блоки, размер которых меньше доменных блоков, и производят поиск наилучшего сопоставления всех ранговых блоков анализируемого изображения и доменных блоков всех эталонных изображений с использованием сжимающих аффинных преобразований, результат подают на классификатор, а затем принимают решение о совпадении изображений анализируемого объекта с эталонным, отличающийся тем, что одновременно с поиском доменно-ранговых сопоставлений для каждого эталонного объекта формируют векторы расстояний между геометрическими центрами сопоставленных доменных для эталонного объекта и ранговых для анализируемого объекта блоков, записывают их в виде таблицы, после завершения сопоставления таблицу подают на классификатор, а решение о совпадении анализируемого изображения с одним из эталонных принимают по наименьшему расстоянию между анализируемым и эталонным изображениями, полученными от классификатора.

Документы, цитированные в отчете о поиске Патент 2007 года RU2297039C2

УСТРОЙСТВО ДЛЯ ОБРАБОТКИ ОПТИЧЕСКОЙ ИНФОРМАЦИИ 1993
  • Злотников Константин Аркадьевич
  • Суворин Егор Иванович
  • Первухин Дмитрий Анатольевич
  • Романов Петр Сергеевич
  • Шабанов Алексей Борисович
  • Захаров Сергей Васильевич
RU2072556C1
US 6775411 A1, 22.04.2004
WO 2004091222 A1, 21.10.2004
JP 6076105, 18.03.1994.

RU 2 297 039 C2

Авторы

Меняев Андрей Александрович

Полков Андрей Анатольевич

Яковлев Вадим Лаврович

Иванов Владимир Алексеевич

Даты

2007-04-10Публикация

2005-04-18Подача