Изобретение относится к области представления и распознавания данных на носителях информации, в частности к выполнению носителя информации, используемого с машинами и предназначенного для переноса информации с использованием записей различного вида.
Известен форматированный носитель информации - печатный бланк для автоматизированного ввода в информационную систему, содержащий расположенные в тематической последовательности информационные поля, имеющие изолированные окна для внесения индивидуальной значащей информации (1).
Недостатками этого носителя информации являются низкая точность распознавания, обусловленная выполнением всех окон в виде прямоугольников, ограниченных непрерывными линиями, и низкая надежность машинного считывания, обусловленная влиянием индивидуальных особенностей заполнения и обращения с документом.
Известен также форматированный носитель информации - печатный бланк для автоматизированного ввода в информационную систему, содержащий расположенные в тематической последовательности информационные поля, имеющие рубрики постоянной тематической шрифтовой информации и по меньшей мере одно изолированное окно для внесения символа индивидуальной значащей информации, обособленное явными разделителями, имеющими визуальные характеристики, обеспечивающие нахождение окна для его заполнения (2).
Недостатками этого носителя информации также являются низкая точность считывания и распознавания, обусловленная выполнением заполняемых окон в виде прямоугольников, каждый из которых ограничен прерывистой линией, и низкая надежность машинного считывания, обусловленная влиянием индивидуальных особенностей заполнения и обращения с документом.
Технической задачей изобретения является создание несложного, недорого и удобного для массового воспроизведения и распространения форматированного носителя информации, преимущественно печатного бланка для автоматизированного ввода в информационную систему, помехоустойчивого к реальным многочисленным искажениям, возникающим под влиянием индивидуальных особенностей заполнения и обращения с документом.
Технический результат, обеспечивающий решение поставленной задачи, состоит в повышении точности и надежности распознавания, снижении требований к точности ориентации вносимых физическими лицами символов в окнах, снижении доли типографского брака в тираже, а также упрощении и сокращении времени заполнения и обработки.
Сущность изобретения заключается в том, что в форматированном носителе информации, преимущественно печатном бланке для автоматизированного ввода в информационную систему, содержащем расположенные в тематической последовательности информационные поля, имеющие рубрики постоянной тематической шрифтовой информации и по меньшей мере одно изолированное окно для внесения символа индивидуальной значащей информации, обособленное явными разделителями, для достижения указанного технического результата по меньшей мере с двух сторон по меньшей мере одного окна разделители выполнены в виде промежутков, заполненных черно-белым растром, состоящим из печатных знаков, распределенных с интервалами между ними, не меньшими удвоенного максимального линейного размера знаков.
Предпочтительно максимальный линейный размер печатных знаков черно-белого растра выбран из условия исключения проявления знака совместно с символом индивидуальной значащей информации, внесенным в это окно, например максимальный линейный размер печатных знаков черно-белого растра не превышает утроенного линейного размера элемента разложения сканера, предназначенного для считывания информации на бланке, и/или максимальный линейный размер печатных знаков черно-белого растра выбран из условия выполнения этих знаков с площадью, не превышающей 3х3 площади элемента разложения сканера, предназначенного для считывания информации на бланке.
В качестве печатных знаков черно-белого растра могут быть нанесены штрихи, регулярно распределенные по строкам, а с разных сторон по меньшей мере одного окна разделители могут быть выполнены в виде промежутков разной ширины, заполненных черно-белым растром, состоящим из печатных знаков.
Кроме того, носитель информации содержит по меньшей мере одно изолированное окно для внесения индивидуальной значащей информации, обособленное явными разделителями в виде линий.
При этом по меньшей мере одно изолированное окно предназначено для внесения символа индивидуальной значащей информации в виде метки произвольного вида и по меньшей мере одно изолированное окно, обособленное разделителями в виде промежутков, заполненных черно-белым растром, предназначено для внесения символа индивидуальной значащей информации в виде цифры или буквы, тематическая шрифтовая информация рубрик ориентирована горизонтально, окна для внесения символов индивидуальной значащей информации в виде метки имеют форму квадрата, а окна для внесения символов индивидуальной значащей информации в виде цифры или буквы имеют форму прямоугольника и ориентированы вертикально.
В обоснованных случаях с трех сторон по меньшей мере одного окна разделители могут быть выполнены в виде промежутков разной ширины, заполненных черно-белым растром, состоящим из печатных знаков, а с одной стороны - в виде прерывистой линии или последовательности печатных знаков.
На фиг. 1 и 2 изображены варианты исполнения форматированного носителя информации, выполненного в виде печатного бланка для автоматизированного ввода в информационную систему; на фиг.3 - увеличенное изображение окон.
Форматированный носитель информации (документ) представляет собой бланк с выраженной структурой, типичным примером которого может быть вопросник (опросный лист) переписи населения.
Бланк содержит расположенные в тематической последовательности информационные поля 1, 2, 3, 4, 5, 6, 7, 8 (на чертеже обозначены восемь полей), имеющие рубрики 9, 10, 11, 12, 13, 14, 15, 16 постоянной тематической шрифтовой информации, и изолированные окна 17, 18, 19, 20 в форме прямоугольников для внесения символа индивидуальной значащей информации в виде цифры или буквы, обособленные на фиг.1 со всех, а на фиг.2 - с трех сторон явными разделителями в виде промежутков (не обозначены), заполненных черно-белым растром, состоящим из печатных знаков (не обозначены), регулярно (по определенному закону) распределенных с интервалами "Т" между ними в двух направлениях, не меньшими удвоенного максимального линейного размера знаков (см. фиг. 3), выбранного из условия исключения проявления знаков совместно с символами (не обозначены) индивидуальной значащей информации, внесенными в соответствующие окна 17-20. Разделители в виде промежутков, заполненных черно-белым растром (гильошированные мелкоточечные полосы), имеют визуальные характеристики, обеспечивающие нахождение окон 17-20 для заполнения.
При этом максимальный линейный размер печатных знаков черно-белого растра выполнен таким, что не превышает утроенного линейного размера элемента разложения сканера, предназначенного для считывания и распознавания информации на бланке, и выбран из условия выполнения знаков с площадью (на которую нанесена краска знака), не превышающей 3х3 площади элемента разложения (пикселя) упомянутого сканера.
В качестве печатных знаков черно-белого растра могут быть нанесены знаки произвольной формы, например штрихи или точки любой правильной или неправильной формы, регулярно распределенные по строкам (рядам), а с разных сторон окон 17-20 разделители могут быть выполнены в виде промежутков (полос) разной ширины, заполненных черно-белым растром, состоящим из печатных знаков (фиг. 1). Ряды (строки) знаков в растре смещены друг относительно друга приблизительно на Т/2 - половину расстояния Т между двумя соседними знаками (фиг.3). Смежные (парные) окна на одном поле, т.е. относящиеся к информации, представляемой с помощью двух или более цифр (дата, год, номер региона), разделены промежутками, полностью заполненными черно-белым растром, состоящим из печатных знаков.
Кроме того, носитель информации содержит изолированные окна 21, 22, 23, 24, 25 в форме квадратов для внесения индивидуальной значащей информации в виде меток, обособленные явными разделителями в виде промежутков (полос) разной ширины, заполненных черно-белым растром, состоящим из печатных знаков (фиг. 1) или в виде линий (фиг.2), и окна 26, 27, 28, предназначенные для словесной индивидуальной значащей информации, обособленные явными разделителями в виде линии.
Тематическая шрифтовая информация (текст) рубрик 9-16 полей 1-8 ориентирована горизонтально, а окна 17-20 для внесения символов индивидуальной значащей информации в виде цифры или буквы имеют форму прямоугольника и ориентированы вертикально.
С трех сторон окон 17-20 разделители могут быть выполнены в виде промежутков разной ширины, заполненных черно-белым растром, состоящим из печатных знаков, а с одной стороны - в виде прерывистой линии, состоящей из тех же или иных печатных знаков (фиг.2).
Обработка форматированного носителя информации состоит из двух основных процессов: нахождение полей (сегментация документа) и чтение информации. Эти процессы могут быть выполнены, если поля 1-8 и окна 17-28 полностью определены своими визуальными характеристиками.
Нахождение полей на бланке с однозначно определенным положением полей не представляет сложности.
Задача чтения осложняется множеством факторов: помехами, смещением текста шрифтовой информации в полях, искажениями формы документа в процессе сканирования, неконтролируемыми дефектами в виде разрывов или типографской грязи, механическими повреждениями при складывании, а главное тем, что произвольно вносимые символы могут прилегать к разделителям окон и частично накладываться на них.
При обработке окон 21-25, предназначенных для внесения символа индивидуальной значащей информации в виде метки произвольного вида, частичное наложение этой метки на разделитель во многих случаях не имеет существенного значения, так как при считывании факт наличия метки в окне будет скорее всего установлен и в этом случае.
Однако наложение на разделители внесенных в окна 17-20 символов индивидуальной значащей информации в виде цифр или букв привело бы к искажению информации, внесенной в бланк, как это и происходит с известными форматированными документами, где разделители выполнены в виде линии. В этом случае линии символа, касаясь, пересекаясь или накладываясь на линии разделителя, могли бы образовать ложное изображение, которое при реальных способах обработки будет считано ошибочно или не считано вообще. Избежать этого в известных аналогах не удается даже при значительном увеличении размеров окна.
В настоящем техническом решении наложение линий символов на растр - т.е. на дискретно и, предпочтительно, регулярно распределенные в промежутке печатные знаки разделителя не приводит к существенному искажению значения этих символов и не препятствует правильному считыванию индивидуальной значащей информации в окнах 17-20. Поэтому в необходимых случаях размер окон 17-20 может быть несколько уменьшен.
Неконтролируемые дефекты в виде разрывов или типографской грязи, механические повреждения при складывании, сравнимые с размерами печатных знаков растра и интервалов между ними, также не приводят к существенному искажению символов и не препятствуют правильному считыванию индивидуальной значащей информации, что позволяет сократить забракованную по указанным причинам часть тиража.
Таким образом, создан несложный, недорогой и удобный для массового воспроизведения и распространения форматированный носитель информации, преимущественно печатный бланк для автоматизированного ввода в информационную систему, помехоустойчивый к реальным многочисленным искажениям, возникающим под влиянием индивидуальных особенностей заполнения и обращения с документом.
При этом повышены точность и надежность распознавания, снижены требований к точности ориентации вносимых физическими лицами символов в окнах, снижена доля документов, признаваемых недействительными по результатам автоматизированной обработки, снижена доля типографского брака в тираже, а также упрощены и ускорены заполнение и обработка документов.
Источники информации
1. RU, 17643 (полезная модель), 2001.
2. RU, 47713 (промышленный образец), 2000.
название | год | авторы | номер документа |
---|---|---|---|
НАБОР ТИПОГРАФСКИЙ ПОРТАТИВНЫЙ ДЛЯ КАНЦЕЛЯРСКИХ РАБОТ | 1999 |
|
RU2153420C1 |
Способ поиска пути по дереву | 2015 |
|
RU2622629C2 |
СПОСОБ ЗАЩИТЫ ОБЪЕКТА ОТ НЕСАНКЦИОНИРОВАННОГО ИСПОЛЬЗОВАНИЯ И ПОДДЕЛКИ И ПОЛУЧЕННОЕ ЭТИМ СПОСОБОМ УСТРОЙСТВО | 2011 |
|
RU2473965C1 |
КЛИШЕ ДЛЯ ШТЕМПЕЛЕВАНИЯ | 1999 |
|
RU2152312C1 |
ИЗДЕЛИЕ СО СРЕДСТВОМ ПРОВЕРКИ ПОДЛИННОСТИ | 1997 |
|
RU2133200C1 |
ЗАЩИЩЕННЫЙ НОСИТЕЛЬ ИНФОРМАЦИИ, ОБЛАДАЮЩИЙ ОПТИЧЕСКИ ПЕРЕМЕННЫМ ЭФФЕКТОМ, И СПОСОБ ИЗГОТОВЛЕНИЯ ЗАЩИЩЕННОГО НОСИТЕЛЯ ИНФОРМАЦИИ | 2017 |
|
RU2651339C1 |
СПОСОБ ВЫЯВЛЕНИЯ СПАМА В РАСТРОВОМ ИЗОБРАЖЕНИИ | 2011 |
|
RU2453919C1 |
МЕДИЦИНСКАЯ ИНФОРМАЦИОННО-КОНСУЛЬТАЦИОННАЯ СИСТЕМА (МИС) | 2001 |
|
RU2207623C2 |
СПОСОБ РЕКЛАМИРОВАНИЯ | 1998 |
|
RU2150754C1 |
Сканер документов, удостоверяющих личность | 2019 |
|
RU2723409C1 |
Изобретение относится к выполнению носителя информации. Его использование для машинного распознавания записей позволяет получить технический результат в виде повышения точности и надежности распознавания. Форматированный носитель информации, преимущественно печатный бланк для автоматизированного ввода в информационную систему, содержит расположенные в тематической последовательности информационные поля, имеющие рубрики постоянной тематической шрифтовой информации и по меньшей мере одно изолированное окно для внесения символа индивидуальной значащей информации, обособленное явными разделителями, обеспечивающими нахождение окна для его заполнения. Технический результат достигается благодаря тому, что хотя бы с двух сторон окна разделители выполнены в виде промежутков, заполненных черно-белым растром, состоящим из печатных знаков, распределенных с интервалами между ними, не меньшими удвоенного максимального линейного размера знаков, который выбран из условия исключения проявления знака совместно с символом, внесенным в это окно, и не превышает утроенного линейного размера элемента разложения сканера, предназначенного для считывания информации на бланке. 7 з.п. ф-лы, 3 ил.
Очаг для массовой варки пищи, выпечки хлеба и кипячения воды | 1921 |
|
SU4A1 |
- М.: ABBYY Software House (BIT Software, Inc.), 1998, с.59-63 | |||
Конструкция тоннельного тюбинга | 1935 |
|
SU47713A1 |
1972 |
|
SU431049A1 | |
ВИЗУАЛЬНО ИДЕНТИФИЦИРУЕМЫЙ ОПТИЧЕСКИЙ ЭЛЕМЕНТ | 1995 |
|
RU2136508C1 |
US 5295434 A, 22.03.1994 | |||
Печь для непрерывного получения сернистого натрия | 1921 |
|
SU1A1 |
Авторы
Даты
2003-09-10—Публикация
2001-11-30—Подача