Показать метаданные Скрыть метаданные

(19)

(11)

2 251 151

(13)

(51)

МПК

G06K9/36(2000-01-01)

G06K9/68(2000-01-01)

(21) (22)

Заявка

2002133898/09, 2002-12-17

(24)

Дата начала отсчета патента

2002-12-17

(22)

дата подачи заявки

2002-12-17

(45)

опубликовано

2005-04-27

(72)

авторы

Анисимович К.В.Терещенко В.В.Рыбкин В.Ю.Внучков Д.Н.

(73)

патентообладатели

Аби Софтвер Лтд.

(56)

Документы, цитированные в отчете о поиске

СМОТРЯЕВА ЯТехнология распознавания изнутри- ЧИП, 2001, №8, с.104-107US 5761344 А, 02.06.1998

СПОСОБ АНАЛИЗА РАСТРОВОГО ИЗОБРАЖЕНИЯ Российский патент 2005 года по МПК G06K9/36 G06K9/68

Описание патента на изобретение RU2251151C2

Изобретение относится к области распознавания символов и текста, в частности к способам предварительного анализа растрового изображения и выполнению действий, предшествующих процедурам распознавания символов.

Известные способы предварительной обработки растрового изображения предполагают сканирование информации с бумажного или другого жесткого носителя, например микрофиш, перевод изображения в графический файл, или получение его другим способом, разбиение графического файла на объекты с последующей обработкой объектов каждого типа специальными способами.

Это не позволяет провести максимально полный и всесторонний анализ объектов, поскольку использует лишь ограниченный объем информации.Кроме того, эти способы требуют применения значительного перечня специальных процедур по числу видов объектов с вариантами реализации их параметров.

Такой способ представлен, например, в патенте США №6,408,094 June 18, 2002.

Известен способ предварительной обработки растрового изображения, который предполагают сканирование информации с бумажного или другого жесткого носителя, перевод изображения в графический файл, разбиение графического файла на объекты с последующей обработкой объектов каждого типа специальными способами. Особенностью указанного способа является то, что он позволяет работать только с параметрами формы символов.

Это не позволяет провести максимально полный и всесторонний анализ объектов, поскольку не учитывает другие параметры, например пространственные соотношения символов.

Такой способ представлен, например, в патенте США №5,594,815 January 14, 1997.

Недостатком способов указанного вида является низкое качество, недостаточная полнота предварительного анализа распознаваемого текста, малая защищенность от ошибок, значительный перечень необходимых процедур.

Техническим результатом изобретения является повышение качества предварительного анализа растрового изображения, уменьшение числа необходимых специальных процедур, снижение чувствительности к ошибкам.

Это достигается тем, что на этапе предварительной обработки все растровое изображение представляют через его части - объекты разных уровней сложности, иерархически связанные между собой пространственно-параметрическими соотношениями. Далее, переходя от более сложных объектов к менее сложным, последовательно выдвигают и проверяют гипотезы об из пространственно-параметрических соотношениях.

Известны способы, включающие разбиениение растрового изображения и установление логических связей между объектами одной и разных степеней сложности.

Примерами такого способа являются, например, работа [1] и патенты США №6,038,342 March 14, 2000; №5,848,184 December 8, 1998.

В качестве прототипа выбран патент США №6,038,342 March 14, 2000.

Недостатками указанных способов является значительное количество специальных процедур обработки объектов каждого вида, а также ограниченность получаемой дополнительной информации для анализа других объектов как следствие недостаточного анализа взаимосвязей объектов.

Указанные недостатки значительно ограничивают возможности использования известных способов для предварительного анализа распознаваемой информации.

Известные способы непригодны для достижения заявленного технического результата.

Предлагаемый способ отличается тем, что все растровое изображение представляют как многоуровневый объект, в котором более сложные объекты представляют через входящие в них менее сложные, иерархически связанные между собой пространственно-параметрическими соотношениями.

Весь перечень объектов, которые могут присутствовать в растровом изображении, предварительно подразделяют на несколько уровней, отличающихся степенью сложности, устанавливают принадлежность каждого найденного объекта одному из уровней сложности, устанавливают связи между объектами разных уровней сложности, а также между объектами внутри каждого уровня, проводят анализ информации о свойствах объектов, который состоит по крайней мере из следующих однотипных для любого уровня действий - выдвижения гипотезы о свойствах объекта и проверки гипотезы о свойствах объекта с привлечением информации, полученной при анализе свойств по крайней мере одного объекта другого уровня сложности, выполнения рекурсивного сечения для получения дополнительной информации об объектах.

Обработку информации растрового изображения проводят предварительно подразделив все объекты, которые могут встретиться в информации, содержащейся в растровом изображении, на ряд уровней, отличающихся степенью сложности объектов.

Проводят разбиение информации растрового изображения.

Устанавливают принадлежность объектов выбранным уровням сложности, а также взаимосвязи объектов внутри каждого уровня и между уровнями. Анализируют свойства полученных объектов. Анализ включает по крайней мере следующие шаги - выдвижение гипотезы о свойствах объекта, проверку гипотезы о свойствах объекта с привлечением информации, полученной при анализе свойств объектов других уровней сложности, выполнение рекурсивного сечения для получения дополнительной информации для проверки гипотез о свойствах других объектов.

Рекурсивное сечение растрового изображения состоит в одно- или многократном разбиении изображения на непересекающиеся области с учетом близости пространственных и параметрических характеристик объектов выбранного уровня [2, 3].

Вычисляют ряд характеристик общих для всех объектов области. Далее области анализируют. Определяют ограничения или расширения, накладываемые общими характеристиками на исходные объекты, входящие в область. Корректируют параметры исходных объектов. В случае возникновения значительных расхождений между начальными и вновь вычисленными параметрами, объект может быть исключен из области. В результате анализа некоторые группы сходных областей, разделенные чужеродным для области пространством (для текстовой области - пустым, разделителями, картинками и т.д.), могут быть объединены в единую новую область. В результате объединения подтверждают и/или отвергают ряд предварительных гипотез об исходных объектах и областях. Полученную новую информацию используют для корректировки свойств связанных объектов того же и/или других уровней сложности.

Сущность предложения иллюстрируется фиг.1-3.

Фиг.1 и фиг.2 иллюстрируют разные возможные варианты деления на уровни сложности всех объектов, которые могут встретиться в растровом изображении (тексте).

Фиг.3 отражает перечень однотипных операций, который может выполняться полностью или частично при анализе объектов всех уровней сложности.

На фиг.1 и фиг.2 показаны варианты деления объектов на уровни сложности. Варианты деления определяют в зависимости от вида растрового изображения - сплошной текст, текст с картинками, текст с таблицами, только таблицы и т.д. Возможно задание классификатора с числом уровней сложности более и менее указанных.

На фиг.3 показан перечень операций, достаточный для анализа объектов любого уровня.

Блок 1 - выдвижение гипотезы о свойствах объекта; блок 2 - проверка гипотезы о свойствах объекта с привлечением информации, полученной при анализе свойств объектов другого уровня; блок 3 - корректировка информации о свойствах связанных объектов других уровней сложности; блок 4 - выполнение одного или более рекурсивного сечения для получения дополнительной информации об объектах.

Ограниченное число видов процедур для анализа свойств объектов всех уровней сложности значительно сокращает объем необходимого математического аппарата, повышает качество предварительного анализа растрового изображения.

Иллюстрации к изобретению RU 2 251 151 C2

Реферат патента 2005 года СПОСОБ АНАЛИЗА РАСТРОВОГО ИЗОБРАЖЕНИЯ

Изобретение относится к области оптического распознавания текста из растрового изображения. Его применение позволяет получить технический результат в виде повышения качества предварительного анализа информации растрового изображения, уменьшения числа необходимых специальных процедур, повышения чувствительности к ошибкам. Этот результат достигается благодаря тому, что способ включает в себя следующие этапы: подразделение информации растрового изображения на уровни, отличающиеся степенью сложности; разбиение этой информации объекты; установление принадлежности каждого объекта одному из уровней сложности; установление иерархических связей между объектами разных уровней сложности; установление взаимосвязи между объектами одного уровня сложности; проведение анализа свойств объектов, включающий, по меньшей мере, следующие шаги: выдвижение гипотезы о свойствах анализируемого объекта, проверку гипотезы о свойствах анализируемого объекта, корректировку информации о свойствах связанных объектов того же или других уровней сложности. 5 з.п. ф-лы, 3 ил.

Формула изобретения RU 2 251 151 C2

1. Способ анализа растрового изображения, содержащего символьную информацию, характеризующийся получением растрового изображения, отличающийся выполнением следующей последовательности действий: весь перечень объектов, которые могут присутствовать на растровом изображении, предварительно подразделяют на один или более предварительно назначенных уровней, отличающихся степенью сложности входящих в него объектов; полученное растровое изображение разбивают на объекты, перечень которых может содержать в т.ч. все или часть из ниже перечисленных: символы, и/или фрагменты слов, и/или слова, и/или строки, и/или параграфы, и/или области, и/или таблицы, и/или нетекстовые объекты; устанавливают принадлежность каждого объекта одному из предварительно назначенных уровней сложности; устанавливают связи между объектами разных уровней сложности; устанавливают связи между объектами одного уровня сложности; проводят анализ свойств объектов, включающий, по крайней мере, следующие шаги: выдвигают гипотезу о пространственных и/или параметрических свойствах, которые должны присутствовать у анализируемого объекта в зависимости от принадлежности к предварительно назначенному уровню сложности; проверяют гипотезу о наличии всех свойств, которые должны присутствовать у анализируемого объекта, привлекая по возможности результаты анализа свойств других объектов того же и/или другого уровня; в соответствии с результатами проверки гипотезы корректируют свойства объектов того же или других уровней сложности, связанных с анализируемым объектом.2. Способ по п.1, отличающийся тем, что анализ информации о свойствах объектов дополнительно включает выполнение по крайней мере одного рекурсивного сечения по объектам.3. Способ по п.1 или 2, отличающийся тем, что гипотеза о свойствах объекта включает, по крайней мере, следующую информацию: перечень входящих в объект более простых объектов, оценку по крайней мере пространственных и/или параметрических соотношений, связывающие объекты одного уровня.4. Способ по п.1 или 2, отличающийся тем, что анализ проводят, переходя от объектов более сложного уровня к менее сложному.5. Способ по п.1 или 2, отличающийся тем, что анализ проводят, переходя от объектов менее сложного уровня к более сложному.6. Способ по п.1 или 2, отличающийся тем, что анализ объектов проводят, обращаясь к разным уровням сложности в таком порядке и такое число раз, как требует выбранный алгоритм анализа.

Документы, цитированные в отчете о поиске Патент 2005 года RU2251151C2

СМОТРЯЕВА Я
Технология распознавания изнутри
- ЧИП, 2001, №8, с.104-107
Аналоговый перемножитель	1976	Тарасов Виктор Петрович Степаненко Игорь Павлович Алексенко Андрей Геннадьевич Тимонтеев Валерий Николаевич Заика Владислав Васильевич Ткаченко Владимир Александрович Ламбин Владимир Иванович	SU602955A1
US 5761344 А, 02.06.1998
Приспособление для точного наложения листов бумаги при снятии оттисков	1922	Асафов Н.И.	SU6A1
Топчак-трактор для канатной вспашки	1923	Берман С.Л.	SU2002A1

RU 2 251 151 C2

Авторы

Анисимович К.В.

Терещенко В.В.

Рыбкин В.Ю.

Внучков Д.Н.

Даты

2005-04-27—Публикация

2002-12-17—Подача

название	год	авторы	номер документа
СПОСОБ РАСПОЗНАВАНИЯ ГРАФИЧЕСКИХ ОБЪЕКТОВ С ИСПОЛЬЗОВАНИЕМ ПРИНЦИПА ЦЕЛОСТНОСТИ	2003	Анисимович К.В. Шамис А.Л. Зуев К.А.	RU2259592C2
СПОСОБ АВТОМАТИЧЕСКОГО ОПРЕДЕЛЕНИЯ ЯЗЫКА РАСПОЗНАВАЕМОГО ТЕКСТА ПРИ МНОГОЯЗЫЧНОМ РАСПОЗНАВАНИИ	2002	Анисимович К.В. Терещенко В.В. Рыбкин В.Ю.	RU2251737C2
СПОСОБ РАСПОЗНАВАНИЯ КОНТЕНТНОГО СОДЕРЖАНИЯ СООБЩЕНИЙ ГРАФИЧЕСКИХ ФОРМАТОВ	2011	Замарин Александр Иванович Сазонов Константин Викторович	RU2479028C2
СПОСОБ РАСПОЗНАВАНИЯ КОНТЕНТА СЖАТЫХ НЕПОДВИЖНЫХ ГРАФИЧЕСКИХ СООБЩЕНИЙ В ФОРМАТЕ JPEG	2018	Иванов Владимир Алексеевич Скурнович Алексей Валентинович Ревякин Андрей Михайлович	RU2680358C1
СПОСОБ РАСПОЗНАВАНИЯ ТЕКСТОВОЙ ИНФОРМАЦИИ И ОЦЕНКИ ЕЕ ПОЛНОТЫ В ЭЛЕКТРОННЫХ ДОКУМЕНТАХ СЕТИ ИНТЕРНЕТ	2013	Молчанов Артем Николаевич Скурнович Алексей Валентинович Стельмах Эдуард Петрович Молчанов Илья Николаевич	RU2550543C1
СПОСОБЫ И СИСТЕМЫ ОБРАБОТКИ ИЗОБРАЖЕНИЙ МАТЕМАТИЧЕСКИХ ВЫРАЖЕНИЙ	2014	Исупов Дмитрий Сергеевич Масалович Антон Андреевич	RU2596600C2
Способ формирования математических моделей пациента с использованием технологий искусственного интеллекта	2017	Дрокин Иван Сергеевич Бухвалов Олег Леонидович Сорокин Сергей Юрьевич	RU2720363C2
СПОСОБ РАСПОЗНАВАНИЯ ТЕКСТОВОЙ ИНФОРМАЦИИ ИЗ ГРАФИЧЕСКОГО ФАЙЛА С ИСПОЛЬЗОВАНИЕМ СЛОВАРЕЙ И ДОПОЛНИТЕЛЬНЫХ ДАННЫХ	2005	Анисимович Константин Владимирович Рыбкин Владимир Юрьевич Шамис Александр Львович	RU2295154C1
СПОСОБ РАСПОЗНАВАНИЯ ТЕКСТОВОЙ ИНФОРМАЦИИ ИЗ ВЕКТОРНО-РАСТРОВОГО ИЗОБРАЖЕНИЯ	2005	Дерягин Дмитрий Георгиевич Сапроненко Вячеслав Михайлович	RU2309456C2
Способ и система поддержки принятия врачебных решений с использованием математических моделей представления пациентов	2017	Дрокин Иван Сергеевич Бухвалов Олег Леонидович Сорокин Сергей Юрьевич	RU2703679C2