СПОСОБ АНАЛИЗА РАСТРОВОГО ИЗОБРАЖЕНИЯ Российский патент 2005 года по МПК G06K9/36 G06K9/68 

Описание патента на изобретение RU2251151C2

Изобретение относится к области распознавания символов и текста, в частности к способам предварительного анализа растрового изображения и выполнению действий, предшествующих процедурам распознавания символов.

Известные способы предварительной обработки растрового изображения предполагают сканирование информации с бумажного или другого жесткого носителя, например микрофиш, перевод изображения в графический файл, или получение его другим способом, разбиение графического файла на объекты с последующей обработкой объектов каждого типа специальными способами.

Это не позволяет провести максимально полный и всесторонний анализ объектов, поскольку использует лишь ограниченный объем информации.Кроме того, эти способы требуют применения значительного перечня специальных процедур по числу видов объектов с вариантами реализации их параметров.

Такой способ представлен, например, в патенте США №6,408,094 June 18, 2002.

Известен способ предварительной обработки растрового изображения, который предполагают сканирование информации с бумажного или другого жесткого носителя, перевод изображения в графический файл, разбиение графического файла на объекты с последующей обработкой объектов каждого типа специальными способами. Особенностью указанного способа является то, что он позволяет работать только с параметрами формы символов.

Это не позволяет провести максимально полный и всесторонний анализ объектов, поскольку не учитывает другие параметры, например пространственные соотношения символов.

Такой способ представлен, например, в патенте США №5,594,815 January 14, 1997.

Недостатком способов указанного вида является низкое качество, недостаточная полнота предварительного анализа распознаваемого текста, малая защищенность от ошибок, значительный перечень необходимых процедур.

Техническим результатом изобретения является повышение качества предварительного анализа растрового изображения, уменьшение числа необходимых специальных процедур, снижение чувствительности к ошибкам.

Это достигается тем, что на этапе предварительной обработки все растровое изображение представляют через его части - объекты разных уровней сложности, иерархически связанные между собой пространственно-параметрическими соотношениями. Далее, переходя от более сложных объектов к менее сложным, последовательно выдвигают и проверяют гипотезы об из пространственно-параметрических соотношениях.

Известны способы, включающие разбиениение растрового изображения и установление логических связей между объектами одной и разных степеней сложности.

Примерами такого способа являются, например, работа [1] и патенты США №6,038,342 March 14, 2000; №5,848,184 December 8, 1998.

В качестве прототипа выбран патент США №6,038,342 March 14, 2000.

Недостатками указанных способов является значительное количество специальных процедур обработки объектов каждого вида, а также ограниченность получаемой дополнительной информации для анализа других объектов как следствие недостаточного анализа взаимосвязей объектов.

Указанные недостатки значительно ограничивают возможности использования известных способов для предварительного анализа распознаваемой информации.

Известные способы непригодны для достижения заявленного технического результата.

Предлагаемый способ отличается тем, что все растровое изображение представляют как многоуровневый объект, в котором более сложные объекты представляют через входящие в них менее сложные, иерархически связанные между собой пространственно-параметрическими соотношениями.

Весь перечень объектов, которые могут присутствовать в растровом изображении, предварительно подразделяют на несколько уровней, отличающихся степенью сложности, устанавливают принадлежность каждого найденного объекта одному из уровней сложности, устанавливают связи между объектами разных уровней сложности, а также между объектами внутри каждого уровня, проводят анализ информации о свойствах объектов, который состоит по крайней мере из следующих однотипных для любого уровня действий - выдвижения гипотезы о свойствах объекта и проверки гипотезы о свойствах объекта с привлечением информации, полученной при анализе свойств по крайней мере одного объекта другого уровня сложности, выполнения рекурсивного сечения для получения дополнительной информации об объектах.

Обработку информации растрового изображения проводят предварительно подразделив все объекты, которые могут встретиться в информации, содержащейся в растровом изображении, на ряд уровней, отличающихся степенью сложности объектов.

Проводят разбиение информации растрового изображения.

Устанавливают принадлежность объектов выбранным уровням сложности, а также взаимосвязи объектов внутри каждого уровня и между уровнями. Анализируют свойства полученных объектов. Анализ включает по крайней мере следующие шаги - выдвижение гипотезы о свойствах объекта, проверку гипотезы о свойствах объекта с привлечением информации, полученной при анализе свойств объектов других уровней сложности, выполнение рекурсивного сечения для получения дополнительной информации для проверки гипотез о свойствах других объектов.

Рекурсивное сечение растрового изображения состоит в одно- или многократном разбиении изображения на непересекающиеся области с учетом близости пространственных и параметрических характеристик объектов выбранного уровня [2, 3].

Вычисляют ряд характеристик общих для всех объектов области. Далее области анализируют. Определяют ограничения или расширения, накладываемые общими характеристиками на исходные объекты, входящие в область. Корректируют параметры исходных объектов. В случае возникновения значительных расхождений между начальными и вновь вычисленными параметрами, объект может быть исключен из области. В результате анализа некоторые группы сходных областей, разделенные чужеродным для области пространством (для текстовой области - пустым, разделителями, картинками и т.д.), могут быть объединены в единую новую область. В результате объединения подтверждают и/или отвергают ряд предварительных гипотез об исходных объектах и областях. Полученную новую информацию используют для корректировки свойств связанных объектов того же и/или других уровней сложности.

Сущность предложения иллюстрируется фиг.1-3.

Фиг.1 и фиг.2 иллюстрируют разные возможные варианты деления на уровни сложности всех объектов, которые могут встретиться в растровом изображении (тексте).

Фиг.3 отражает перечень однотипных операций, который может выполняться полностью или частично при анализе объектов всех уровней сложности.

На фиг.1 и фиг.2 показаны варианты деления объектов на уровни сложности. Варианты деления определяют в зависимости от вида растрового изображения - сплошной текст, текст с картинками, текст с таблицами, только таблицы и т.д. Возможно задание классификатора с числом уровней сложности более и менее указанных.

На фиг.3 показан перечень операций, достаточный для анализа объектов любого уровня.

Блок 1 - выдвижение гипотезы о свойствах объекта; блок 2 - проверка гипотезы о свойствах объекта с привлечением информации, полученной при анализе свойств объектов другого уровня; блок 3 - корректировка информации о свойствах связанных объектов других уровней сложности; блок 4 - выполнение одного или более рекурсивного сечения для получения дополнительной информации об объектах.

Ограниченное число видов процедур для анализа свойств объектов всех уровней сложности значительно сокращает объем необходимого математического аппарата, повышает качество предварительного анализа растрового изображения.

Похожие патенты RU2251151C2

название год авторы номер документа
СПОСОБ РАСПОЗНАВАНИЯ ГРАФИЧЕСКИХ ОБЪЕКТОВ С ИСПОЛЬЗОВАНИЕМ ПРИНЦИПА ЦЕЛОСТНОСТИ 2003
  • Анисимович К.В.
  • Шамис А.Л.
  • Зуев К.А.
RU2259592C2
СПОСОБ АВТОМАТИЧЕСКОГО ОПРЕДЕЛЕНИЯ ЯЗЫКА РАСПОЗНАВАЕМОГО ТЕКСТА ПРИ МНОГОЯЗЫЧНОМ РАСПОЗНАВАНИИ 2002
  • Анисимович К.В.
  • Терещенко В.В.
  • Рыбкин В.Ю.
RU2251737C2
СПОСОБ РАСПОЗНАВАНИЯ КОНТЕНТНОГО СОДЕРЖАНИЯ СООБЩЕНИЙ ГРАФИЧЕСКИХ ФОРМАТОВ 2011
  • Замарин Александр Иванович
  • Сазонов Константин Викторович
RU2479028C2
СПОСОБ РАСПОЗНАВАНИЯ КОНТЕНТА СЖАТЫХ НЕПОДВИЖНЫХ ГРАФИЧЕСКИХ СООБЩЕНИЙ В ФОРМАТЕ JPEG 2018
  • Иванов Владимир Алексеевич
  • Скурнович Алексей Валентинович
  • Ревякин Андрей Михайлович
RU2680358C1
СПОСОБ РАСПОЗНАВАНИЯ ТЕКСТОВОЙ ИНФОРМАЦИИ И ОЦЕНКИ ЕЕ ПОЛНОТЫ В ЭЛЕКТРОННЫХ ДОКУМЕНТАХ СЕТИ ИНТЕРНЕТ 2013
  • Молчанов Артем Николаевич
  • Скурнович Алексей Валентинович
  • Стельмах Эдуард Петрович
  • Молчанов Илья Николаевич
RU2550543C1
СПОСОБЫ И СИСТЕМЫ ОБРАБОТКИ ИЗОБРАЖЕНИЙ МАТЕМАТИЧЕСКИХ ВЫРАЖЕНИЙ 2014
  • Исупов Дмитрий Сергеевич
  • Масалович Антон Андреевич
RU2596600C2
Способ формирования математических моделей пациента с использованием технологий искусственного интеллекта 2017
  • Дрокин Иван Сергеевич
  • Бухвалов Олег Леонидович
  • Сорокин Сергей Юрьевич
RU2720363C2
СПОСОБ РАСПОЗНАВАНИЯ ТЕКСТОВОЙ ИНФОРМАЦИИ ИЗ ГРАФИЧЕСКОГО ФАЙЛА С ИСПОЛЬЗОВАНИЕМ СЛОВАРЕЙ И ДОПОЛНИТЕЛЬНЫХ ДАННЫХ 2005
  • Анисимович Константин Владимирович
  • Рыбкин Владимир Юрьевич
  • Шамис Александр Львович
RU2295154C1
СПОСОБ РАСПОЗНАВАНИЯ ТЕКСТОВОЙ ИНФОРМАЦИИ ИЗ ВЕКТОРНО-РАСТРОВОГО ИЗОБРАЖЕНИЯ 2005
  • Дерягин Дмитрий Георгиевич
  • Сапроненко Вячеслав Михайлович
RU2309456C2
СПОСОБ ОБНАРУЖЕНИЯ ТЕКСТА В РАСТРОВОМ ИЗОБРАЖЕНИИ (ВАРИАНТЫ) И СПОСОБ ВЫЯВЛЕНИЯ СПАМА, СОДЕРЖАЩЕГО РАСТРОВЫЕ ИЗОБРАЖЕНИЯ 2007
  • Смирнов Евгений Петрович
RU2363047C1

Иллюстрации к изобретению RU 2 251 151 C2

Реферат патента 2005 года СПОСОБ АНАЛИЗА РАСТРОВОГО ИЗОБРАЖЕНИЯ

Изобретение относится к области оптического распознавания текста из растрового изображения. Его применение позволяет получить технический результат в виде повышения качества предварительного анализа информации растрового изображения, уменьшения числа необходимых специальных процедур, повышения чувствительности к ошибкам. Этот результат достигается благодаря тому, что способ включает в себя следующие этапы: подразделение информации растрового изображения на уровни, отличающиеся степенью сложности; разбиение этой информации объекты; установление принадлежности каждого объекта одному из уровней сложности; установление иерархических связей между объектами разных уровней сложности; установление взаимосвязи между объектами одного уровня сложности; проведение анализа свойств объектов, включающий, по меньшей мере, следующие шаги: выдвижение гипотезы о свойствах анализируемого объекта, проверку гипотезы о свойствах анализируемого объекта, корректировку информации о свойствах связанных объектов того же или других уровней сложности. 5 з.п. ф-лы, 3 ил.

Формула изобретения RU 2 251 151 C2

1. Способ анализа растрового изображения, содержащего символьную информацию, характеризующийся получением растрового изображения, отличающийся выполнением следующей последовательности действий: весь перечень объектов, которые могут присутствовать на растровом изображении, предварительно подразделяют на один или более предварительно назначенных уровней, отличающихся степенью сложности входящих в него объектов; полученное растровое изображение разбивают на объекты, перечень которых может содержать в т.ч. все или часть из ниже перечисленных: символы, и/или фрагменты слов, и/или слова, и/или строки, и/или параграфы, и/или области, и/или таблицы, и/или нетекстовые объекты; устанавливают принадлежность каждого объекта одному из предварительно назначенных уровней сложности; устанавливают связи между объектами разных уровней сложности; устанавливают связи между объектами одного уровня сложности; проводят анализ свойств объектов, включающий, по крайней мере, следующие шаги: выдвигают гипотезу о пространственных и/или параметрических свойствах, которые должны присутствовать у анализируемого объекта в зависимости от принадлежности к предварительно назначенному уровню сложности; проверяют гипотезу о наличии всех свойств, которые должны присутствовать у анализируемого объекта, привлекая по возможности результаты анализа свойств других объектов того же и/или другого уровня; в соответствии с результатами проверки гипотезы корректируют свойства объектов того же или других уровней сложности, связанных с анализируемым объектом.2. Способ по п.1, отличающийся тем, что анализ информации о свойствах объектов дополнительно включает выполнение по крайней мере одного рекурсивного сечения по объектам.3. Способ по п.1 или 2, отличающийся тем, что гипотеза о свойствах объекта включает, по крайней мере, следующую информацию: перечень входящих в объект более простых объектов, оценку по крайней мере пространственных и/или параметрических соотношений, связывающие объекты одного уровня.4. Способ по п.1 или 2, отличающийся тем, что анализ проводят, переходя от объектов более сложного уровня к менее сложному.5. Способ по п.1 или 2, отличающийся тем, что анализ проводят, переходя от объектов менее сложного уровня к более сложному.6. Способ по п.1 или 2, отличающийся тем, что анализ объектов проводят, обращаясь к разным уровням сложности в таком порядке и такое число раз, как требует выбранный алгоритм анализа.

Документы, цитированные в отчете о поиске Патент 2005 года RU2251151C2

СМОТРЯЕВА Я
Технология распознавания изнутри
- ЧИП, 2001, №8, с.104-107
Аналоговый перемножитель 1976
  • Тарасов Виктор Петрович
  • Степаненко Игорь Павлович
  • Алексенко Андрей Геннадьевич
  • Тимонтеев Валерий Николаевич
  • Заика Владислав Васильевич
  • Ткаченко Владимир Александрович
  • Ламбин Владимир Иванович
SU602955A1
US 5761344 А, 02.06.1998
Приспособление для точного наложения листов бумаги при снятии оттисков 1922
  • Асафов Н.И.
SU6A1
Топчак-трактор для канатной вспашки 1923
  • Берман С.Л.
SU2002A1

RU 2 251 151 C2

Авторы

Анисимович К.В.

Терещенко В.В.

Рыбкин В.Ю.

Внучков Д.Н.

Даты

2005-04-27Публикация

2002-12-17Подача