СПОСОБ РАСПОЗНАВАНИЯ КОДИРОВАННЫХ ИЗОБРАЖЕНИЙ Российский патент 1999 года по МПК G06K9/00 H04N7/24 H04N7/28 

Описание патента на изобретение RU2126552C1

Изобретение относится к автоматике и вычислительной технике и может быть использовано для распознавания и селекции кодированных документальных сообщений при обработке факсимальной информации.

Известен способ распознавания графической и текстовой информации [1], основанный на построчном сканировании изображения, преобразовании его в последовательность импульсов и формировании информационных импульсов и опорного временного интервала от окончания минимального временного интервала до окончания максимального временного интервала, преобразовании опорного временного интервала в последовательность зонных интервалов равной длительности, а затем в выделении в каждом зонном временном интервале группы импульсов с временными интервалами между соседними импульсами, меньшими или равными суммарной длительности строки и зонного интервала и вынесении решения по числу выделенных групп в каждом зонном интервале.

Существенным недостатком этого способа является низкая точность распознавания кодированных сигналов факсимильных изображений.

Известен способ распознавания факсимильных изображений [2], основанный на построчном сканировании изображения документа, последовательном выделении каждого локального графического образа в сканируемой строке изображения, определении координат и параметров выделенного локального образа, формировании набора пронумерованных эталонов образов в пределах сканируемой строки, формировании набора пронумерованных эталонов образов в пределах всего изображения, сравнении очередного выделенного образа с каждым из эталонов набора сканируемой строки, введении выделенного образа при несовпадении его ни с одним из эталонов в наборе сканируемой строки в этот набор с одновременным определением области несовпадения этого символа с каждым символом из набора эталонов всего изображения и последующем принятии решения путем поэлементной весовой оценки.

Недостатком этого способа является его большая вычислительная сложность и необходимость наличия большого объема памяти для хранения эталонных образцов кодированных символов факсимильных изображений.

Наиболее близким по своей сущности к заявляемому изобретению является способ распознавания факсимильных изображений [3], основанный на операции разделения изображения, представленного в форме электрических сигналов, на несколько участков и оценке размеров этих участков, кроме того, в способе производятся операции выделения участков, содержащих непрерывную информацию, по размеру которых определяют, какие участки содержат символьную информацию, а какие - линейную, в соответствии с чем выполняют отдельную обработку каждого участка.

Основным недостатком этого способа является низкая точность распознавания кодированных текстовых и графических факсимильных сообщений друг от друга.

Известно [4], что наиболее целесообразно осуществлять хранение факсимильных изображений в факсимильных базах данных в форме, использующей кодирование модифицированным кодом Хаффмана (МХ-код), так как это требует меньше места для размещения информации, чем использование других форматов (например, РСХ).

В этой связи распределения серий "нулей" и "единиц" в кодированном факсимильном изображении могут не соответствовать распределениям "нулей" и "единиц" (участков "белого" и "черного" соответственно) в некодированном факсимильном изображении, представленном в двоичной форме, что является причиной низкой точности распознавания кодированных МХ-кодом текстовых и графических изображений в способе-прототипа [3].

Целью изобретения является повышение точности распознавания кодированных текстовых и графических факсимильных изображений.

Указанная цель достигается тем, что в способ распознавания факсимильных изображений, основанный на операции разделения изображения, представленного в форме электрических сигналов, на несколько участков и оценки размеров Ni этих участков, введены операции выделения кодированных строчных участков электрических сигналов, заключенных между двумя соседними кодовыми словами конца строки развертки изображения, удаления служебных битов в выделенных строчных участках, различения и выделения r-х групп (r = 1,2,...,R) последовательных участков соседних "белых" строк минимальной размерности N(i+1)r, N(i+2)r, . . ., N(i+m)r, ..., N(i+M)r (M - априорно заданное число соседних белых строк в анализируемом фрагменте изображения) путем сравнения с соответствующей пороговой величиной No (N(i+m)r ≤ No), выделения p-х групп (p = 1, 2, . . . , P) последовательных "небелых" кодированных строк размерности N(i+1)p, N(i+2)p, . .., N(i+l)p, ..., N(i+L)p (L - априорно заданное число соседних "небелых" строк в анализируемом фрагменте изображения) путем сравнения с соответствующей пороговой величиной N1 (N(i+l)p ≥ N1, оценки наличия квазипериодичности следования участков, соответствующих кодированным "белым" строкам развертки изображения, оценки средней величины квазипериода оценки абсолютных величин Δip разностей размеров соседних кодированных "небелых" строк вычисления отношений dp= Δipмаксipмин максимальных и минимальных значений разностей Δip, сравнения полученных значений dp с априорно заданной пороговой величиной D и вынесения соответствующего решения о принадлежности кодированного факсимильного изображения или его фрагмента графической или текстовой форме.

Как известно [5] кодированная МХ-кодом строка развертки факсимильного изображения состоит из информационных битов, служебных битов заполнения (FILL) и следующего за ними кодового слова конца строки (EOL). Известно также [5], что наименьшее число информационных битов содержится в кодированной "белой" строке развертки факсимильного изображения и, кроме того, среднее число информационных бит, содержащихся в кодированной строке развертки графического изображения, существенно меньше (в 2 - 3 раза), чем среднее число бит в кодированной строке текстового изображения.

В этой связи признаками кодированного текстового сообщения (или его фрагмента) является наличие: 1) групп минимальных значений чисел, меньших порогового значения hмин = N0; 2) групп чисел максимального значения, превышающих пороговую величину hмакс = N1; 3) квазипериодичности чередования групп минимальных и максимальных чисел.

Сопоставительный анализ со способом, выбранным в качестве прототипа, показывает, что заявляемый способ отличается использованием для распознавания кодированных факсимильных изображений принципиально новых операций: определения наличия групп "минимальных" и "максимальных" чисел битов в кодированных строках развертки, наличия квазипериодичности чередования групп минимальных чисел в кодированных строках развертки, вычисления отношения максимального значения разности соседних чисел к минимальному значению их разности в группе из максимальных чисел битов в кодированных строках развертки и сравнения величины этого отношения с заданной пороговой величиной.

Таким образом, заявляемый способ соответствует критерию изобретения "новизна".

Сравнение заявляемого способа с другими способами распознавания изображений показывает, что введение операций выделения групп минимальных, а также максимальных чисел битов в кодированных строках развертки, определения наличия квазипериодичности в порядке их чередования и сравнения величины квазипериода с заданной, вычисления отношения среднего числа битов в группах из максимального числа битов в кодированных строках развертки к среднему числу битов в группе из минимальных чисел битов позволяет выделить признаки для принятия решения о структуре факсимильного изображения по его кодированным сигналам, что обеспечивает (в сравнении с другими способами) повышение точности распознавания текстовых и графических факсимильных изображений.

Таким образом, предлагаемый способ распознавания кодированных изображений для специалиста явным образом не следует из уровня техники и соответствует критерию "изобретательский уровень".

Изобретение может быть использовано в различных областях промышленности, а именно, связанных с техникой передачи и обработки изображений, с вычислительной техникой, а также в других областях народного хозяйства, поэтому соответствует критерию "промышленная применимость".

На чертеже представлена блок-схема алгоритма распознавания кодированных изображений.

Способ осуществления следующим образом.

Последовательность двоичных кодированных электрических сигналов факсимильного изображения объема J (бит) после удаления служебных битов (битов-вставок, битов заполнения типа "FILL", а также кодовых слов (EOL) конца строки развертки [5], разделяется на i-е участки, состоящие из битов кодированных строк развертки изображения. Затем производится оценка размеров Ni (где Ni - случайные величины, определяемые структурой изображения) выделенных i-х участков двоичной последовательности, выделение r-х групп (r = 1, 2, ..., R) последовательных минимальных значений размеров кодированных участков соседних строк N(i+1)r, ..., N(i+m)r, ..., N(i+M)r, где M ≥ Mo - минимально возможное число "белых" строк в промежутках между соседними текстовыми строками - в случае текстовых изображений, N(i+m)r ≤ No, No - максимально допустимый размер кодированной "белой" строки развертки).

В случае отсутствия (необнаружения) участков с такими значениями их размеров выносится решение о принадлежности данной последовательности кодированных сигналов графическому изображению.

При обнаружении r-х групп, соответствующих "кодированным" белым строкам развертки изображения, производится выделение p-х групп "небелых" кодированных строк размера N(i+1)p, ..., N(i+l)p, ..., N(i+L)p (p=1,2,..., P) путем сравнения с соответствующей пороговой величиной N(i+l)p ≥ N1 (при этом N1 выбирается таким образом, чтобы разность N1 - N0 = ΔN превышала величину погрешности Δh, обусловленной наличием "точечных" дефектов на "белых" участках некодированного изображения ΔN ≥ Δh, величина L ≥ L0, где L0 - максимальное число строк развертки, содержащихся в строке печатного текста с заданной гарнитурой).

После выполнения указанных выше операций производится обнаружение начала квазипериодичности следования участков, соответствующих кодированным белым строкам, и оценка соответствия величины Qr квазипериода (в случае его обнаружения) заданным нижней qмин и верхней qмакс границам интервала значений Qr. При этом значения qмин, qмакс определяются возможными типами используемых шрифтов в текстовом изображении, а также разрешающей способностью по вертикали конкретной системы развертки изображения.

В случае обнаружения квазипериодичности групп участков, соответствующих "белым" строкам и соответствия величины квазипериода Qr заданному интервалу значений производится принятие решения о принадлежности кодированных сигналов текстовому изображению. В противном случае производится оценка абсолютных величин Δip разностей значений размеров соседних кодированных "небелых" строк и вычисление отношений dp= Δipмаксipмин максимальных и минимальных значений указанных выше разностей для каждой p-й группы "небелых" строк, которое затем сравнивается с априорно выбранным порогом D, при превышении которого выносится решение о принадлежности данной p-й группы "небелых" строк графическому изображению, а иначе - текстовому (при этом величина порога D выбирается порядка D = 40 - 60).

Способ реализуется на базе использования однокристальной микро-ЭВМ или ПЭВМ типа IBM РС 386/386 (обеспечивающих ввод данных кодированного факсимального изображения объема 0,5 - 1 кбайт в память ОЭВМ/ПЭВМ и последующую соответствующую арифметико-логическую обработку этих данных).

Таким образом, введение операций выделения r-х групп последовательных минимальных значений размеров кодированных "белых" участков соседних строк развертки изображения, оценки квазипериодичности следования этих r-х групп, выделения p-х групп последовательных значений размеров кодированных "небелых" участков соседних строк, оценки абсолютного значения разностей размеров кодированных "небелых" участков соседних строк внутри каждой p-й группы, вычисления отношения максимальных и минимальных значений этих разностей для каждой p-й группы и сравнения с априорно заданным пороговым значением D обеспечивает повышение точности распознавания кодированных графических и текстовых изображений между собой.

Источники информации:
1. Авторское свидетельство СССР N 1348870, G06K 9/00, 30.10.87.

2. Авторское свидетельство СССР N 1809449, G06K 9/62, H03M 7/42.

3. Патент Японии МКИ по заявке N 61-56554 G06K 9/00, 03.12.86.

4. Введение к реализации системы поиска факсимильных изображений. Экспресс-информация, Сер.Информатика. - 1993, N 3, с.6.

5. Рекомендации МККТТ. Серия Т.4. Синяя книга. Т.VII, вып.VII.3. - 1988, с.17.

Похожие патенты RU2126552C1

название год авторы номер документа
СПОСОБ РАСПОЗНАВАНИЯ КОДИРОВАННЫХ ИЗОБРАЖЕНИЙ 2003
  • Лысенко В.Л.
RU2238587C1
СПОСОБ ФАКСИМИЛЬНОГО РАСПОЗНАВАНИЯ И ВОСПРОИЗВЕДЕНИЯ ТЕКСТА ПЕЧАТНОЙ ПРОДУКЦИИ 2003
  • Королев И.Ф.
  • Курбатов В.С.
RU2260208C2
СПОСОБ АВТОМАТИЧЕСКОГО РАСПОЗНАВАНИЯ СИГНАЛОВ ЦВЕТНЫХ ФАКСИМИЛЬНЫХ СООБЩЕНИЙ 2006
  • Варганов Алексей Вячеславович
  • Лысенко Владимир Леонидович
  • Захаренков Анатолий Иванович
RU2312467C1
Способ приема координатно-кодово кодированных цифровых факсимильных сигналов 1982
  • Черкавский Петр Орестович
SU1172070A1
ПРИЕМНЫЙ ФАКСИМИЛЬНЫЙ АППАРАТ 1992
  • Киселев Б.И.
  • Зиновьева Т.А.
RU2089048C1
УСТРОЙСТВО ПЕРЕДАЧИ И ПРИЕМА НЕПОДВИЖНЫХ ИЗОБРАЖЕНИЙ ПО КАНАЛАМ ЭЛЕКТРИЧЕСКОЙ СВЯЗИ 1990
  • Киселев Б.И.
  • Зиновьева Т.А.
RU2007051C1
ТЕЛЕВИЗИОННОЕ УСТРОЙСТВО ДЛЯ ОБНАРУЖЕНИЯ ПЕРЕМЕЩЕНИЙ ОБЪЕКТОВ 1984
  • Карпов В.В.
  • Балахонский А.А.
RU2140721C1
Устройство приема цифровых факсимильных сигналов с коррекцией искажений изображения 1985
  • Черкавский Петр Орестович
SU1319313A1
УСТРОЙСТВО ДЛЯ ИДЕНТИФИКАЦИИ ФАКСИМИЛЬНЫХ СИГНАЛОВ 2000
  • Каленков Б.О.
  • Щевьев В.Н.
RU2192667C2
Способ передачи и приема факсимильных мелкоструктурных изображений по цифровым каналам связи с групповой помехой 1987
  • Торба Олег Иванович
  • Морозов Борис Алексеевич
SU1538274A1

Реферат патента 1999 года СПОСОБ РАСПОЗНАВАНИЯ КОДИРОВАННЫХ ИЗОБРАЖЕНИЙ

Изобретение относится к автоматике и вычислительной технике и может быть использовано для обработки кодированных факсимильных изображений. Цель изобретения - повышение точности распознавания кодированных текстовых и графических факсимильных изображений. Способ основан на операции разделения изображения, представленного в форме электрических сигналов, на несколько участков и оценки размеров Ni этих участков. Новым является введение операций выделения кодированных строчных участков, выделения r-х групп последовательных участков соседних "белых строк" минимального размера, выделения р-х групп последовательных участков соседних "небелых" строк, оценки наличия квазипериодичности следования групп последовательных участков "белых" строк и величины квазипериода Qr, вычисления отношений dp максимальных Δdipмакс и минимальных Δipмин абсолютных значений разностей размеров соседних кодированных "небелых" строк, сравнения их с порогом D и вынесения соответствующего решения. Способ позволяет выделить признаки, обеспечивающие повышение точности распознавания кодированных факсимильных изображений. 1 ил.

Формула изобретения RU 2 126 552 C1

Способ разпознавания кодированных изображений, основанный на операции разделения изображения, представленного в форме кодированных электрических сигналов, на несколько участков и оценки размеров Ni этих участков, отличающийся тем, что выделяют кодированные строчные участки электрических сигналов, заключенные между двумя соседними кодовыми словами конца строки развертки изображения, удаляют служебные биты заполнения в выделенных строчных участках, различают и выделяют r-е группы, состоящие из M последовательных участков соседних "белых" строк минимальной размерности, сравнивают числа этих групп с соответствующей пороговой величиной N0 и выделяют p-е группы, состоящие из L последовательных "небелых" кодированных строк, сравнивают числа данных групп с соответствующей пороговой величиной N1, оценивают наличие квазипериодичности следования участков, соответствующих кодированным "белым" строкам развертки изображения, определяют среднюю величину квазипериода Qr, оценивают абсолютные величины Δip разностей размеров соседних кодированных "небелых" строк, вычисляют отношения dp максимальных и минимальных значений разностей Δip, сравнивают полученные величины отношений dp с априорно заданной пороговой величиной D и выносят решение о принадлежности кодированного изображения или его фрагмента графической или текстовой форме.

Документы, цитированные в отчете о поиске Патент 1999 года RU2126552C1

JP, заявка, 61-56554 кл
Разборный с внутренней печью кипятильник 1922
  • Петухов Г.Г.
SU9A1
RU, патент, 2042282 кл
Очаг для массовой варки пищи, выпечки хлеба и кипячения воды 1921
  • Богач Б.И.
SU4A1
US 5136374 A, кл
Очаг для массовой варки пищи, выпечки хлеба и кипячения воды 1921
  • Богач Б.И.
SU4A1
US 5309232 A, кл
Очаг для массовой варки пищи, выпечки хлеба и кипячения воды 1921
  • Богач Б.И.
SU4A1

RU 2 126 552 C1

Авторы

Лысенко В.Л.

Даты

1999-02-20Публикация

1995-05-22Подача