СПОСОБ РАСПОЗНАВАНИЯ ГРАФИЧЕСКИХ ОБЪЕКТОВ С ИСПОЛЬЗОВАНИЕМ ПРИНЦИПА ЦЕЛОСТНОСТИ Российский патент 2005 года по МПК G06K9/00 

Описание патента на изобретение RU2259592C2

Изобретение относится к распознаванию графических образов, в частности к распознаванию нетекстовых объектов и/или текста на изображении документа в электронном виде.

Указанные способы применяют в том числе, но не только при распознавании форм ввода данных, сочетающих типографский и рукописный тексты, и набор специальных ориентиров для осуществления навигации по документу. Это такие документы как опросные листы, анкеты, банковские счета - жесткой или свободной формы расположения полей.

Возможно применение указанных способов для распознавания объектов заданного вида из графического образа в электронной форме.

Из уровня техники известны способы распознавания образов из графического изображения путем сравнения полученного образа объекта как совокупности единичных элементов изображения - точек - с эталонным образом всего объекта или набором разных воплощений объекта, имеющимся в специальном справочнике-классификаторе.

Известен способ распознавания текстовой информации, при котором растровое изображение разбивается на области (блоки), предположительно содержащие изображения печатных символов текста с последующим сопоставлением изображения в блоках с эталонным описанием изображения, содержащимся в одном или нескольких специальных признаковых или растровых классификаторах.

Такой способ реализуется, например, в способе распознавания информации по патенту США № 5680479 (October 21, 1997, Wang, et al.).

Известен аналогичный способ, раскрытый в патенте США № 5684891 (November 4, 1997, Tanaka, et al.). В документе описан способ выполнения сегментации всего изображения для выделения изображения отдельного символа, который по мнению автора позволяет достичь большей достоверности и производительности процесса. Изображение символа, как совокупность точек, сравнивают с эталоном, имеющимся в классификаторе.

Недостатком способа следует считать применение сравнения изображения целого символа с полноразмерным шаблоном.

Технический результат состоит в увеличении точности и помехозащищенности распознавания объектов изображения.

Указанный технический результат достигается предварительным назначением надежно распознаваемых графических конструкций ограниченного числа разновидностей - типовых элементов (типовых графических конструкций) - в качестве элементов, из которых могут состоять распознаваемые объекты.

Указанные типовые элементы состоят из более чем одного наименьшего символа изображения.

Каждый распознаваемый объект описывают, как состоящий из одного или более заранее назначенных типовых элементов, как из частей с указанием их взаимных пространственно-параметрических соотношений. Причем в одном распознаваемом объекте могут присутствовать типовые элементы одного или (более) нескольких видов. Они могут отличаться относительным пространственным расположением, размерами и другими параметрами.

В качестве распознаваемых объектов могут быть графические элементы на изображении, элементы оформления документа, специальные графические элементы, используемые как реперы для навигации по документу, текстовые элементы, в том числе буквы печатного и/или рукописного шрифта.

Сущность изобретения состоит в следующем.

Предварительно назначают элементы одной или более разновидностей, встречающиеся на изображении, - типовые элементы, из которых могут состоять распознаваемые объекты. Например, отрезок прямой, окружность, овал, дуга и др.

Эти типовые элементы отличаются большей надежностью идентификации и распознавания на изображении, вследствие геометрической простоты.

Типовые элементы могут отличаться пространственно-параметрическими соотношениями. Например, для отрезка прямой это может быть длина, угол наклона, толщина линии (относительная или абсолютная); для дуги - это угол, радиус кривизны, ориентация и др.

Типовые элементы могут включать в себя части белого цвета или бесцветные области без черного или цветного изображения.

На фиг.1 показаны примеры простых типовых элементов.

В классификатор (словарь), используемый для распознавания объектов изображения (букв, реперов, др. элементов), заносят описание объекта в виде перечня типовых элементов, из которых состоит объект, их взаимного расположения и пространственно параметрических соотношений.

В классификатор также заносят все возможные варианты реализации изображения распознаваемого объекта, описанные как совокупность типовых элементов вместе с их взаимным расположением и относительными и/или абсолютными размерами. В указанном описании совокупности типовых элементов могут отличаться как составом типовых элементов, так и их пространственно-параметрическими соотношениями. Некоторые из возможных вариантов представления распознаваемого объекта изображения в виде наборов стандартных элементов на примере буквы "В" показаны на фиг.2.

Затем на изображении идентифицируют и распознают типовые элементы.

Выбирают группы типовых элементов. Для каждой группы типовых элементов выдвигают и проверяют гипотезу о принадлежности всех элементов группы в целом к одному предполагаемому объекту, описанному в классификаторе.

При недостаточно надежном результате проверки гипотезы выдвигают и проверяют гипотезу о принадлежности элементов группы в целом к другому предполагаемому объекту, описанному в классификаторе.

После проверки всех гипотез выбирают наиболее вероятный вариант распознаваемого объекта. В случае многозначного результата проверки гипотез используют дополнительную информацию или применяют дополнительные способы распознавания.

Типовые элементы могут образовывать более сложные типовые элементы путем объединения в различные сочетания разных и/или одинаковых элементов с разным взаимным расположением и разными размерами, например крест, - объединение горизонтального и вертикального прямых отрезков.

Примеры сложных типовых элементов показаны на фиг.3.

Описание распознаваемого объекта может быть задано в виде альтернативы, как по составу типовых элементов, так и по их взаимным пространственно-параметрическим соотношениям.

Описание распознаваемого объекта может быть задано в виде интервала для одного или нескольких взаимных пространственно-параметрических соотношений.

Описание распознаваемого объекта может быть задано в виде совокупности типовых элементов, связанных отношениями математической логики, в том числе типа "И", типа "ИЛИ", типа "НЕ".

Взаимосвязи стандартных элементов в распознаваемом объекте могут быть выражены в виде более чем одноуровневой структуры.

Типовые элементы могут содержать элементы белого цвета, а также без цвета.

Изобретение промышленно применимо, поскольку использует для реализации широко известные приемы и математический аппарат.

Похожие патенты RU2259592C2

название год авторы номер документа
СПОСОБ АНАЛИЗА РАСТРОВОГО ИЗОБРАЖЕНИЯ 2002
  • Анисимович К.В.
  • Терещенко В.В.
  • Рыбкин В.Ю.
  • Внучков Д.Н.
RU2251151C2
СПОСОБ РАСПОЗНАВАНИЯ ТЕКСТОВОЙ ИНФОРМАЦИИ ИЗ ВЕКТОРНО-РАСТРОВОГО ИЗОБРАЖЕНИЯ 2005
  • Дерягин Дмитрий Георгиевич
  • Сапроненко Вячеслав Михайлович
RU2309456C2
СПОСОБ АВТОМАТИЧЕСКОГО ОПРЕДЕЛЕНИЯ ЯЗЫКА РАСПОЗНАВАЕМОГО ТЕКСТА ПРИ МНОГОЯЗЫЧНОМ РАСПОЗНАВАНИИ 2002
  • Анисимович К.В.
  • Терещенко В.В.
  • Рыбкин В.Ю.
RU2251737C2
СПОСОБ РАСПОЗНАВАНИЯ ТЕКСТОВОЙ ИНФОРМАЦИИ ИЗ ГРАФИЧЕСКОГО ФАЙЛА С ИСПОЛЬЗОВАНИЕМ СЛОВАРЕЙ И ДОПОЛНИТЕЛЬНЫХ ДАННЫХ 2005
  • Анисимович Константин Владимирович
  • Рыбкин Владимир Юрьевич
  • Шамис Александр Львович
RU2295154C1
УСТРОЙСТВО И СПОСОБ ПОИСКА РАЗЛИЧИЙ В ДОКУМЕНТАХ 2013
  • Панферов Василий Владимирович
  • Исаев Андрей Анатольевич
  • Боброва Екатерина Юрьевна
  • Жуковская Ольга Анатольевна
RU2571378C2
ВЫЯВЛЕНИЕ КИТАЙСКОЙ, ЯПОНСКОЙ И КОРЕЙСКОЙ ПИСЬМЕННОСТИ 2013
  • Атрощенко Михаил Юрьевич
  • Дерягин Дмитрий Георгиевич
  • Чулинин Юрий Георгиевич
RU2613847C2
СПОСОБ ИДЕНТИФИКАЦИИ ПОЛЬЗОВАТЕЛЯ КОМПЬЮТЕРА "ЧЕЛОВЕК ИЛИ ИНТЕРНЕТ-РОБОТ" 2017
  • Архипов Юрий Борисович
  • Королев Вадим Сергеевич
  • Прусаков Александр Анатольевич
  • Романов Сергей Юрьевич
  • Саркисов Владимир Гургенович
RU2663475C1
СПОСОБ РАСПОЗНАВАНИЯ КОНТЕНТНОГО СОДЕРЖАНИЯ СООБЩЕНИЙ ГРАФИЧЕСКИХ ФОРМАТОВ 2011
  • Замарин Александр Иванович
  • Сазонов Константин Викторович
RU2479028C2
СПОСОБЫ И СИСТЕМЫ ОБРАБОТКИ ИЗОБРАЖЕНИЙ МАТЕМАТИЧЕСКИХ ВЫРАЖЕНИЙ 2014
  • Исупов Дмитрий Сергеевич
  • Масалович Антон Андреевич
RU2596600C2
УСТРОЙСТВА И СПОСОБЫ, КОТОРЫЕ ИСПОЛЬЗУЮТ ИЕРАРХИЧЕСКИ УПОРЯДОЧЕННУЮ СТРУКТУРУ ДАННЫХ, СОДЕРЖАЩУЮ НЕПАРАМЕТРИЗОВАННЫЕ СИМВОЛЫ, ДЛЯ ПРЕОБРАЗОВАНИЯ ИЗОБРАЖЕНИЙ ДОКУМЕНТОВ В ЭЛЕКТРОННЫЕ ДОКУМЕНТЫ 2013
  • Чулинин Юрий Георгиевич
RU2643465C2

Иллюстрации к изобретению RU 2 259 592 C2

Реферат патента 2005 года СПОСОБ РАСПОЗНАВАНИЯ ГРАФИЧЕСКИХ ОБЪЕКТОВ С ИСПОЛЬЗОВАНИЕМ ПРИНЦИПА ЦЕЛОСТНОСТИ

Изобретение относится к распознаванию графических образов. Его использование позволяет увеличить точность и помехозащищённость распознавания объектов изображения. Способ характеризуется разбиением изображения на области; выделением текстовых и нетекстовых областей; распознаванием объектов; предварительным назначением по крайней мере одной графической конструкции из наименьших единиц изображения в качестве типового элемента для составления распознаваемого объекта; предварительным представлением изображения этого объекта в виде совокупности типовых элементов одного типа с их взаимными пространственно-параметрическими соотношениями. Технический результат достигается благодаря тому, что осуществляют поиск и идентификацию изображения типового элемента; выбор найденного типового элемента для проверки на принадлежность распознаваемому объекту; выдвижение и проверку гипотезы о распознаваемом объекте по изображению из совокупности выбранных типовых элементов в целом с учетом их взаимных пространственно-параметрических соотношений. 2 с. и 23 з.п. ф-лы, 3 ил.

Формула изобретения RU 2 259 592 C2

1. Способ распознавания объектов на изображении в электронной форме, характеризующийся разбиением изображения на области, выделением текстовых и нетекстовых областей, распознаванием объектов, предварительным назначением по крайней мере одной графической конструкции, состоящей более чем из одной наименьшей единицы изображения, в качестве типового элемента, из которого может быть составлен как из частей по крайней мере один распознаваемый объект, предварительным представлением изображения по крайней мере одного распознаваемого объекта в виде совокупности указанных типовых элементов по крайней мере одного типа с их взаимными пространственно-параметрическими соотношениями, отличающийся выполнением следующей процедуры: поиска и идентификации изображения по крайней мере одного типового элемента, выбора по крайней мере одного найденного типового элемента для проверки на принадлежность распознаваемому объекту, выдвижения и проверки гипотезы о распознаваемом объекте по изображению, составленному из всей совокупности выбранных типовых элементов в целом с учетом их взаимных пространственно-параметрических соотношений.2. Способ по п. 1, отличающийся тем, что по крайней мере один типовой элемент, составляющий изображение распознаваемого объекта, задают в виде альтернативы.3. Способ по п. 1, отличающийся тем, что состав типовых элементов, образующих изображение распознаваемого объекта, задают в виде альтернативы.4. Способ по п. 1, отличающийся тем, что по крайней мере один типовой элемент, составляющий изображение распознаваемого объекта, задают в виде интервала.5. Способ по п. 1, отличающийся тем, что по крайней мере часть изображения распознаваемого объекта состоит из типовых элементов, связанных отношениями математической логики.6. Способ по п. 5, отличающийся тем, что этап идентификации изображения распознаваемого объекта как совокупности изображения типовых элементов включает анализ совокупности элементов, связанных отношением типа И, анализ совокупности элементов, связанных отношением типа ИЛИ, анализ совокупности элементов, связанных отношением типа НЕ.7. Способ по п. 1, отличающийся тем, что взаимосвязи типовых элементов в распознаваемом объекте выражают в виде более чем одноуровневой структуры.8. Способ по п. 1, отличающийся тем, что по крайней мере один типовой элемент содержит единицы изображения белого цвета.9. Способ по п. 1, отличающийся тем, что по крайней мере один типовой элемент содержит прозрачные единицы изображения.10. Способ по п. 1 или 2, отличающийся тем, что в случае многозначного результата проверки гипотез используют дополнительную информацию.11. Способ по п. 1, отличающийся тем, что в случае многозначного результата проверки гипотез применяют дополнительные способы распознавания.12. Способ по п. 1, отличающийся тем, что типовой элемент может быть составлен из более простых типовых элементов по крайней мере одной разновидности.13. Способ по п. 1, отличающийся тем, что описание состава и взаимных пространственно-параметрических характеристик распознаваемого объекта в виде типовых элементов помещают в средство хранения и поиска.14. Способ распознавания текста на изображении документа в электронной форме, характеризующийся разбиением изображения на области, выделением текстовых и нетекстовых областей, выделением областей, содержащих изображения букв, распознаванием букв, предварительным назначением графической конструкции по крайней мере одной разновидности, состоящей из более чем одного минимального элемента изображения, в качестве типового элемента, из которого может быть составлено, как из частей, по крайней мере одно изображение буквы, предварительным представлением изображения по крайней мере одной буквы в виде совокупности указанных типовых элементов одного или более типа с их взаимными пространственно-параметрическими соотношениями, отличающийся выполнением процедуры поиска и идентификации на области, содержащей изображение буквы, изображения по крайней мере одного типового элемента по крайней мере одной разновидности; выбора всех найденных типовых элементов на области, содержащей изображение буквы для проверки на принадлежность букве, выдвижения и проверки гипотезы о виде буквы по изображению, составленному из всей совокупности выбранных типовых элементов в целом с учетом их взаимных пространственно-параметрических соотношений.15. Способ по п. 14, отличающийся тем, что по крайней мере один типовой элемент, составляющий изображение распознаваемого объекта, задают в виде альтернативы.16. Способ по п. 14, отличающийся тем, что состав типовых элементов, образующих изображение распознаваемого объекта, задают в виде альтернативы.17. Способ по п. 14, отличающийся тем, что по крайней мере один типовой элемент, составляющий изображение распознаваемого объекта, задают в виде интервала.18. Способ по п. 14, отличающийся тем, что по крайней мере часть изображения распознаваемого объекта состоит из типовых элементов, связанных отношениями математической логики.19. Способ по п. 18, отличающийся тем, что этап идентификации изображения распознаваемого объекта как совокупности изображения типовых элементов включает анализ совокупности элементов, связанных отношением типа И, анализ совокупности элементов, связанных отношением типа ИЛИ, анализ совокупности элементов, связанных отношением типа НЕ.20. Способ по п. 14, отличающийся тем, что взаимосвязи типовых элементов в распознаваемом объекте выражают в виде более чем одноуровневой структуры.21. Способ по п. 14, отличающийся тем, что по крайней мере один типовой элемент содержит единицы изображения белого цвета.22. Способ по п. 14, отличающийся тем, что по крайней мере один типовой элемент содержит прозрачные единицы изображения.23. Способ по п. 14 или 2, отличающийся тем, что в случае многозначного результата проверки гипотез используют дополнительную информацию.24. Способ по п. 14, отличающийся тем, что в случае многозначного результата проверки гипотез применяют дополнительные способы распознавания.25. Способ по п. 14, отличающийся тем, что описание состава и взаимных пространственно-параметрических характеристик распознаваемого объекта в виде типовых элементов помещают в средство хранения и поиска.

Документы, цитированные в отчете о поиске Патент 2005 года RU2259592C2

US 5680479 A, 21.10.1997.US 2001/0038711 A1, 08.11.2001.US 5303312 A, 12.04.1994.US 5680478 A, 21.10.1997.SU 1578725 A1, 15.07.1990.SU 1298782 A1, 23.03.1987.US 4365235 A, 21.12.1982.

RU 2 259 592 C2

Авторы

Анисимович К.В.

Шамис А.Л.

Зуев К.А.

Даты

2005-08-27Публикация

2003-06-24Подача