Изобретение относится к распознаванию графических образов, в частности к распознаванию нетекстовых объектов и/или текста на изображении документа в электронном виде.
Указанные способы применяют в том числе, но не только при распознавании форм ввода данных, сочетающих типографский и рукописный тексты, и набор специальных ориентиров для осуществления навигации по документу. Это такие документы как опросные листы, анкеты, банковские счета - жесткой или свободной формы расположения полей.
Возможно применение указанных способов для распознавания объектов заданного вида из графического образа в электронной форме.
Из уровня техники известны способы распознавания образов из графического изображения путем сравнения полученного образа объекта как совокупности единичных элементов изображения - точек - с эталонным образом всего объекта или набором разных воплощений объекта, имеющимся в специальном справочнике-классификаторе.
Известен способ распознавания текстовой информации, при котором растровое изображение разбивается на области (блоки), предположительно содержащие изображения печатных символов текста с последующим сопоставлением изображения в блоках с эталонным описанием изображения, содержащимся в одном или нескольких специальных признаковых или растровых классификаторах.
Такой способ реализуется, например, в способе распознавания информации по патенту США № 5680479 (October 21, 1997, Wang, et al.).
Известен аналогичный способ, раскрытый в патенте США № 5684891 (November 4, 1997, Tanaka, et al.). В документе описан способ выполнения сегментации всего изображения для выделения изображения отдельного символа, который по мнению автора позволяет достичь большей достоверности и производительности процесса. Изображение символа, как совокупность точек, сравнивают с эталоном, имеющимся в классификаторе.
Недостатком способа следует считать применение сравнения изображения целого символа с полноразмерным шаблоном.
Технический результат состоит в увеличении точности и помехозащищенности распознавания объектов изображения.
Указанный технический результат достигается предварительным назначением надежно распознаваемых графических конструкций ограниченного числа разновидностей - типовых элементов (типовых графических конструкций) - в качестве элементов, из которых могут состоять распознаваемые объекты.
Указанные типовые элементы состоят из более чем одного наименьшего символа изображения.
Каждый распознаваемый объект описывают, как состоящий из одного или более заранее назначенных типовых элементов, как из частей с указанием их взаимных пространственно-параметрических соотношений. Причем в одном распознаваемом объекте могут присутствовать типовые элементы одного или (более) нескольких видов. Они могут отличаться относительным пространственным расположением, размерами и другими параметрами.
В качестве распознаваемых объектов могут быть графические элементы на изображении, элементы оформления документа, специальные графические элементы, используемые как реперы для навигации по документу, текстовые элементы, в том числе буквы печатного и/или рукописного шрифта.
Сущность изобретения состоит в следующем.
Предварительно назначают элементы одной или более разновидностей, встречающиеся на изображении, - типовые элементы, из которых могут состоять распознаваемые объекты. Например, отрезок прямой, окружность, овал, дуга и др.
Эти типовые элементы отличаются большей надежностью идентификации и распознавания на изображении, вследствие геометрической простоты.
Типовые элементы могут отличаться пространственно-параметрическими соотношениями. Например, для отрезка прямой это может быть длина, угол наклона, толщина линии (относительная или абсолютная); для дуги - это угол, радиус кривизны, ориентация и др.
Типовые элементы могут включать в себя части белого цвета или бесцветные области без черного или цветного изображения.
На фиг.1 показаны примеры простых типовых элементов.
В классификатор (словарь), используемый для распознавания объектов изображения (букв, реперов, др. элементов), заносят описание объекта в виде перечня типовых элементов, из которых состоит объект, их взаимного расположения и пространственно параметрических соотношений.
В классификатор также заносят все возможные варианты реализации изображения распознаваемого объекта, описанные как совокупность типовых элементов вместе с их взаимным расположением и относительными и/или абсолютными размерами. В указанном описании совокупности типовых элементов могут отличаться как составом типовых элементов, так и их пространственно-параметрическими соотношениями. Некоторые из возможных вариантов представления распознаваемого объекта изображения в виде наборов стандартных элементов на примере буквы "В" показаны на фиг.2.
Затем на изображении идентифицируют и распознают типовые элементы.
Выбирают группы типовых элементов. Для каждой группы типовых элементов выдвигают и проверяют гипотезу о принадлежности всех элементов группы в целом к одному предполагаемому объекту, описанному в классификаторе.
При недостаточно надежном результате проверки гипотезы выдвигают и проверяют гипотезу о принадлежности элементов группы в целом к другому предполагаемому объекту, описанному в классификаторе.
После проверки всех гипотез выбирают наиболее вероятный вариант распознаваемого объекта. В случае многозначного результата проверки гипотез используют дополнительную информацию или применяют дополнительные способы распознавания.
Типовые элементы могут образовывать более сложные типовые элементы путем объединения в различные сочетания разных и/или одинаковых элементов с разным взаимным расположением и разными размерами, например крест, - объединение горизонтального и вертикального прямых отрезков.
Примеры сложных типовых элементов показаны на фиг.3.
Описание распознаваемого объекта может быть задано в виде альтернативы, как по составу типовых элементов, так и по их взаимным пространственно-параметрическим соотношениям.
Описание распознаваемого объекта может быть задано в виде интервала для одного или нескольких взаимных пространственно-параметрических соотношений.
Описание распознаваемого объекта может быть задано в виде совокупности типовых элементов, связанных отношениями математической логики, в том числе типа "И", типа "ИЛИ", типа "НЕ".
Взаимосвязи стандартных элементов в распознаваемом объекте могут быть выражены в виде более чем одноуровневой структуры.
Типовые элементы могут содержать элементы белого цвета, а также без цвета.
Изобретение промышленно применимо, поскольку использует для реализации широко известные приемы и математический аппарат.
название | год | авторы | номер документа |
---|---|---|---|
СПОСОБ АНАЛИЗА РАСТРОВОГО ИЗОБРАЖЕНИЯ | 2002 |
|
RU2251151C2 |
СПОСОБ РАСПОЗНАВАНИЯ ТЕКСТОВОЙ ИНФОРМАЦИИ ИЗ ВЕКТОРНО-РАСТРОВОГО ИЗОБРАЖЕНИЯ | 2005 |
|
RU2309456C2 |
СПОСОБ АВТОМАТИЧЕСКОГО ОПРЕДЕЛЕНИЯ ЯЗЫКА РАСПОЗНАВАЕМОГО ТЕКСТА ПРИ МНОГОЯЗЫЧНОМ РАСПОЗНАВАНИИ | 2002 |
|
RU2251737C2 |
СПОСОБ РАСПОЗНАВАНИЯ ТЕКСТОВОЙ ИНФОРМАЦИИ ИЗ ГРАФИЧЕСКОГО ФАЙЛА С ИСПОЛЬЗОВАНИЕМ СЛОВАРЕЙ И ДОПОЛНИТЕЛЬНЫХ ДАННЫХ | 2005 |
|
RU2295154C1 |
УСТРОЙСТВО И СПОСОБ ПОИСКА РАЗЛИЧИЙ В ДОКУМЕНТАХ | 2013 |
|
RU2571378C2 |
ВЫЯВЛЕНИЕ КИТАЙСКОЙ, ЯПОНСКОЙ И КОРЕЙСКОЙ ПИСЬМЕННОСТИ | 2013 |
|
RU2613847C2 |
СПОСОБ ИДЕНТИФИКАЦИИ ПОЛЬЗОВАТЕЛЯ КОМПЬЮТЕРА "ЧЕЛОВЕК ИЛИ ИНТЕРНЕТ-РОБОТ" | 2017 |
|
RU2663475C1 |
СПОСОБ РАСПОЗНАВАНИЯ КОНТЕНТНОГО СОДЕРЖАНИЯ СООБЩЕНИЙ ГРАФИЧЕСКИХ ФОРМАТОВ | 2011 |
|
RU2479028C2 |
СПОСОБЫ И СИСТЕМЫ ОБРАБОТКИ ИЗОБРАЖЕНИЙ МАТЕМАТИЧЕСКИХ ВЫРАЖЕНИЙ | 2014 |
|
RU2596600C2 |
УСТРОЙСТВА И СПОСОБЫ, КОТОРЫЕ ИСПОЛЬЗУЮТ ИЕРАРХИЧЕСКИ УПОРЯДОЧЕННУЮ СТРУКТУРУ ДАННЫХ, СОДЕРЖАЩУЮ НЕПАРАМЕТРИЗОВАННЫЕ СИМВОЛЫ, ДЛЯ ПРЕОБРАЗОВАНИЯ ИЗОБРАЖЕНИЙ ДОКУМЕНТОВ В ЭЛЕКТРОННЫЕ ДОКУМЕНТЫ | 2013 |
|
RU2643465C2 |
Изобретение относится к распознаванию графических образов. Его использование позволяет увеличить точность и помехозащищённость распознавания объектов изображения. Способ характеризуется разбиением изображения на области; выделением текстовых и нетекстовых областей; распознаванием объектов; предварительным назначением по крайней мере одной графической конструкции из наименьших единиц изображения в качестве типового элемента для составления распознаваемого объекта; предварительным представлением изображения этого объекта в виде совокупности типовых элементов одного типа с их взаимными пространственно-параметрическими соотношениями. Технический результат достигается благодаря тому, что осуществляют поиск и идентификацию изображения типового элемента; выбор найденного типового элемента для проверки на принадлежность распознаваемому объекту; выдвижение и проверку гипотезы о распознаваемом объекте по изображению из совокупности выбранных типовых элементов в целом с учетом их взаимных пространственно-параметрических соотношений. 2 с. и 23 з.п. ф-лы, 3 ил.
US 5680479 A, 21.10.1997.US 2001/0038711 A1, 08.11.2001.US 5303312 A, 12.04.1994.US 5680478 A, 21.10.1997.SU 1578725 A1, 15.07.1990.SU 1298782 A1, 23.03.1987.US 4365235 A, 21.12.1982. |
Авторы
Даты
2005-08-27—Публикация
2003-06-24—Подача