СПОСОБ РАСПОЗНАВАНИЯ КОДИРОВАННЫХ ИЗОБРАЖЕНИЙ Российский патент 2004 года по МПК G06K9/70 

Описание патента на изобретение RU2238587C1

Изобретение относится к автоматике и вычислительной технике и может быть использовано для распознавания и селекции заданных видов фрагментов кодированных документальных сообщений при обработке факсимильной информации.

Известен способ распознавания фрагментов изображения [1], основанный на нахождении в памяти пиксельных данных, описывающих вставку размером n*n пикселов в первом изображении, производстве свертки величин интенсивности пикселов вставки с величинами ядра Лапласа с нулевым средним и получении лапласовой вставки, данные которой описывают координаты х, у и величины интенсивности пикселов со знаками, производстве свертки величин интенсивности лапласовой вставки с ядром Гаусса вдоль осей х и у и получении изображения, данные которого описывают положения и величины интенсивностей пикселов со знаками, упорядочивании чисел ядра Гаусса в гауссову последовательность и преобразовании пиксельных данных в бинарные, повторении преобразования над данными вставки размером m*m (m<n) пикселов из второго изображения, получении для каждого из возможных сдвигов величины корреляции пикселов, сравнивании величины корреляций и определении на основе максимальной величины корреляции сдвига.

Недостатком данного изобретения является существенная вычислительная сложность, обусловленная необходимостью обеспечения свертки величин интенсивностей матриц пикселов размера n*n и m*m с соответствующими величинами ядер Лапласа и Гаусса, а также вычисления соответствующих величин корреляций пикселов с последующим их сравнением.

Известен также способ распознавания текстовых изображений [2], основанный на определении прямоугольников, ограничивающих части изображения, потенциально содержащие текст, генерировании последовательности признаков для каждой части изображения, определении набора обученных скрытых марковских моделей (СММ) одиночных знаков с учетом структурных параметров каждого знака, объединении СММ, соответствующих знакам ключевого слова и имеющих один и тот же контекст, конструировании сети СММ, содержащей СММ ключевого слова, и определении с ее помощью наличия ключевого слова во входном изображении.

Как показано в [3], хранение факсимильных изображений в факсимильных банках данных наиболее целесообразно осуществлять в сжатой форме, что обеспечивается использованием специальных видов кодирования, таких как модифицированный код Хаффмана (код МН) или модифицированный код READ (код MR) [4], обеспечивающих меньший объем памяти, необходимой для хранения факсимильного изображения, чем в случае использования других графических форматов.

В этой связи недостатком приведенного выше способа является низкая точность распознавания фрагментов факсимильных изображений, представленных в кодированной форме (МН или MR), так как при этом биты знаков ключевых слов заменяются кодами длин серий двоичных нулей и единиц, что исключает возможность использования признаков, предложенных в указанном выше способе.

Наиболее близким по своей сущности к заявляемому изобретению является способ распознавания кодированных изображений [5], основанный на операции разделения изображения, представленного в форме кодированных электрических сигналов, на несколько участков и оценки размеров Ni этих участков, причем выделяют кодированные строчные участки электрических сигналов, заключенные между двумя соседними кодовыми словами конца строки развертки изображения, удаляют служебные биты заполнения в выделенных строчных участках, различают и выделяют r-е группы, состоящие из М последовательных участков соседних “белых” строк минимальной размерности, сравнивают числа этих групп с соответствующей пороговой величиной N0 и выделяют р-е группы, состоящие из L последовательных “небелых” кодированных строк, сравнивают числа данных групп с соответствующей пороговой величиной N1, оценивают наличие квазипериодичности следования участков, соответствующих кодированным “белым” строкам развертки изображения, определяют среднюю величину квазипериода Qr, оценивают абсолютные величины ip разностей размеров соседних кодированных “небелых” строк, вычисляют отношения dp максимальных и минимальных значений разностей ip, сравнивают полученные величины отношений dp с априорно заданной пороговой величиной D и выносят решение о принадлежности кодированного изображения или его фрагмента графической или текстовой форме.

Недостатком данного способа является низкая точность распознавания кодированных фрагментов факсимильных изображений, представленных в одинаковой форме (графической или текстовой), поскольку используемые в нем признаки предназначены исключительно для различения между собой двух разных форм кодированных фрагментов факсимильных изображений: текстовой и графической. Таким образом, данный способ не позволяет обеспечить достоверное распознавание априорно заданных кодированных текстовых фрагментов среди множества возможных кодированных текстовых фрагментов (так же, как и кодированных графических фрагментов заданного вида среди множества возможных кодированных графических фрагментов факсимильных изображений).

Целью изобретения является повышение точности распознавания фрагментов заданного вида в кодированном факсимильном изображении.

Цель достигается тем, что в известный способ, включающий выделение кодированных строчных участков электрических сигналов, удаление из них служебных битов и кодовых комбинаций, выделение групп соседних кодированных строк развертки, оценку числа бит в каждой кодированной строке, входящей в данную группу, согласно изобретению введены операции, при которых интервал возможных значений числа бит в каждой кодированной строке развертки разделяют на "К" субинтервалов ak (k=1, 2,... , К), нумерованных в порядке возрастания возможных значений длин этих строк, представляют на этапе обучения каждого "q"-ro (q=1, 2,... , Q, Q - число заданных эталонных фрагментов факсимильного изображения) эталонного фрагмента цепочкой Aq номеров а(q)k

субинтервалов, следующих в порядке поступления соответствующих текущих кодированных строк эталонного фрагмента факсимильного изображения, размещают полученные цепочки в банке эталонных цепочек, формируют на этапе распознавания эталонных фрагментов в текущем факсимильном изображении текущую цепочку Ax номеров а(x)k
заданных субинтервалов, в которые попадают значения размеров следующих друг за другом кодированных строк, сравнивают друг с другом элементы а(x)k
и а(q)k
с одинаковыми порядковыми номерами "k", входящие в текущую цепочку Ах и в эталонные цепочки Aq, и выносят решение о принадлежности текущего фрагмента факсимильного изображения одному из заданных эталонных фрагментов.

Оценивают абсолютные величины разностей | a(x)k

-a(x)k-1
|и | a(x)k
|-a(x)k+1
между значениями текущего элемента а(x)k
цепочки Ах и значениями предыдущего a(x)k-1
и последующего a(x)k+1
элементов цепочки Ах и заменяют элемент а(x)k
на среднее значение <a(x)k
>=(a(x)k-1
-a(x)k+1
)/2 предыдущего и последующего элементов в случае превышения значений обеих разностей заданной величины δ .

Выносят решение о принадлежности текущего фрагмента, заданного цепочкой Ax, "q"-мy эталонному фрагменту, заданному цепочкой Aq, если абсолютные величины разностей значений элементов а(x)k

и а(q)k
цепочек Ах и Aq с одинаковыми порядковыми номерами "k" не превышают заданных величин η (q)k
.

Сопоставительный анализ со способом, выбранным в качестве прототипа, показывает, что заявляемый способ отличается новыми операциями разделения интервала возможных значений числа бит в каждой кодированной строке развертки на "К" субинтервалов ak (k=1, 2,... , К), нумерованных в порядке возрастания значений длин этих строк, представления на этапе обучения каждого "q"-го (q=1, 2,... , Q, Q - число заданных эталонных фрагментов факсимильного изображения) эталонного фрагмента цепочкой Aq номеров а(q)k

субинтервалов, следующих в порядке поступления соответствующих текущих кодированных строк эталонного фрагмента факсимильного изображения, размещения полученных цепочек в банке эталонных цепочек, формирования на этапе распознавания эталонных фрагментов в текущем факсимильном изображении текущей цепочки Ах номеров а(x)k
заданных субинтервалов, в которые попадают значения размеров следующих друг за другом кодированных строк, сравнения друг с другом элементов а(x)k
и а(q)k
с одинаковыми порядковыми номерами "k", входящими в текущую цепочку Ах и в эталонные цепочки Aq и вынесения решения о принадлежности текущего фрагмента факсимильного изображения одному из заданных эталонных фрагментов; а также введены операции оценки абсолютной величины разностей | a(x)k
-a(x)k-1
|и | a(x)k
-a(x)k+1
|между значениями текущего элемента а(x)k
цепочки Ах и значениями предыдущего a(x)k-1
и последующего a(x)k+1
элементов цепочки Ах и замены элемента а(x)k
на среднее значение <a(x)k
>=(a(x)k-1
-a(x)k+1
)/2 предыдущего и последующего элементов в случае превышения значений обеих разностей заданной величины δ ; а также введены операции вынесения решения о принадлежности текущего фрагмента, заданного цепочкой Ах, "q"-мy эталонному фрагменту, заданному цепочкой Aq, если разности значений элементов а(x)k
и а(q)k
цепочек Ах и Aq с одинаковыми порядковыми номерами "k" не превышают заданных величин η (q)k
.

Таким образом, заявляемый способ соответствует критерию изобретения "новизна".

Изобретение имеет "изобретательский уровень", т.к. оно для специалиста явным образом не следует из уровня техники.

Изобретение может быть использовано в различных областях промышленности, а именно связанных с техникой передачи и обработки изображений, с информационно-вычислительной техникой, а также в других областях народного хозяйства, и соответствует критерию "промышленная применимость".

На чертеже представлена блок-схема алгоритма распознавания кодированных изображений.

Предлагаемый способ реализуется следующим образом.

В последовательности двоичных кодированных электрических сигналов факсимильного изображения после удаления служебных битов и кодовых слов выделяются текущие группы соседних кодированных строк развертки и затем производится оценка числа бит в каждой кодированной строке, входящей в данную группу. Далее на этапе обучения интервал возможных значений числа бит в каждой кодированной строке развертки разделяется на "К" субинтервалов ak (k=1, 2,... , К), нумерованных в порядке возрастания значений длин этих строк, а каждый "q"-й (q=1, 2,... , Q, Q - число заданных эталонных фрагментов факсимильного изображения) эталонный фрагмент представляется цепочкой Aq номеров а(q)k

субинтервалов, следующих в порядке поступления соответствующих текущих кодированных строк эталонного фрагмента факсимильного изображения, и полученные цепочки размещаются в банке эталонных цепочек. На этапе распознавания эталонных фрагментов в текущем факсимильном изображении формируется текущая цепочка Ах номеров а(x)k
заданных субинтервалов, в которые попадают значения размеров следующих друг за другом кодированных строк, производится оценка абсолютной величины разностей | a(x)k
-a(x)k-1
|и | a(x)k
-a(x)k+1
|между значениями текущего элемента а(х)k
цепочки Ах и значениями предыдущего а(x)k-1
и последующего а(x)k+1
элементов цепочки Ах и замена элемента а(x)k
на среднее значение <a(x)k
>=(a(x)k-1
-a(x)k+1
)/2 предыдущего и последующего элементов в случае превышения значений обеих разностей заданной величины δ ; элементы а(x)k
и а(q) k
с одинаковыми порядковыми номерами "k", входящими в текущую цепочку Ах и в эталонные цепочки Aq, сравниваются друг с другом и выносится решение о принадлежности текущего фрагмента факсимильного изображения одному из заданных эталонных фрагментов, если разности значений элементов а(x)k
и а(q)k
цепочек Ах и Aq с одинаковыми порядковыми номерами "k" не превышают заданных величин η (q)k
.

Способ реализуется на базе использования однокристальной микроЭВМ или ПЭВМ с процессором PENTIUM, обеспечивающих ввод данных кодированного факсимильного изображения объема 50-150 кбайт в память ОЭВМ/ПЭВМ и последующую арифметико-логическую обработку этих данных.

Способ позволяет на базе введенных операций использовать связь между структурой строчного фрагмента факсимильного изображения и структурой сформированных цепочек номеров интервалов величин размеров кодированных строк этого фрагмента и тем самым повысить точность распознавания заданных фрагментов в кодированном факсимильном изображении.

Источники информации

1. Патент США №5604819, МКИ G 06 K 9/00 от 15.03.93.

2. Патент США №5592568, МКИ G 06 K 9/68 от 13.02.93.

3. Введение к реализации системы поиска факсимильных изображений. Экспресс-информация, сер. Информатика, - 1993, №3, с.6.

4. Рекомендации МККТТ. Серия Т.4. Синяя книга. Т. VII, вып. VII.3, 1988, с.17.

5. Патент РФ №2126552, МКИ G 06 K 9/00.

Похожие патенты RU2238587C1

название год авторы номер документа
СПОСОБ АВТОМАТИЧЕСКОГО РАСПОЗНАВАНИЯ СИГНАЛОВ ЦВЕТНЫХ ФАКСИМИЛЬНЫХ СООБЩЕНИЙ 2006
  • Варганов Алексей Вячеславович
  • Лысенко Владимир Леонидович
  • Захаренков Анатолий Иванович
RU2312467C1
СПОСОБ РАСПОЗНАВАНИЯ КОДИРОВАННЫХ ИЗОБРАЖЕНИЙ 1995
  • Лысенко В.Л.
RU2126552C1
Способ распознавания протоколов низкоскоростного кодирования 2016
  • Аладинский Виктор Алексеевич
  • Кузьминский Сергей Владиславович
  • Смирнов Павел Леонидович
  • Чубатый Дмитрий Николаевич
RU2610285C1
СПОСОБ ЛОКАЛИЗАЦИИ ДОРОЖНЫХ ЗНАКОВ И РАСПОЗНАВАНИЯ ИХ ГРУПП И ПОДГРУПП 2012
  • Фурсов Владимир Алексеевич
  • Бибиков Сергей Алексеевич
  • Никоноров Артем Владимирович
  • Якимов Павел Юрьевич
RU2488164C1
СПОСОБ ИДЕНТИФИКАЦИИ СИГНАЛОВ 2012
  • Комолов Дмитрий Викторович
RU2485586C1
СПОСОБ РАСПОЗНАВАНИЯ ТЕКСТОВОЙ ИНФОРМАЦИИ ИЗ ГРАФИЧЕСКОГО ФАЙЛА С ИСПОЛЬЗОВАНИЕМ СЛОВАРЕЙ И ДОПОЛНИТЕЛЬНЫХ ДАННЫХ 2005
  • Анисимович Константин Владимирович
  • Рыбкин Владимир Юрьевич
  • Шамис Александр Львович
RU2295154C1
Способ распознавания протоколов низкоскоростного кодирования речи 2017
  • Аладинский Виктор Алексеевич
  • Вещунин Евгений Андреевич
  • Кузьминский Сергей Владиславович
  • Смирнов Павел Леонидович
RU2667462C1
Способ транскрибирования речи по цифровым сигналам с низкоскоростным кодированием 2023
  • Аладинский Виктор Алексеевич
  • Кузьминский Сергей Владиславович
  • Павлов Андрей Петрович
  • Смирнов Павел Леонидович
RU2801621C1
Устройство для коррекции ошибок приемника факсимильных сигналов 1980
  • Ляшевич Вячеслав Степанович
SU976506A2
СПОСОБ РАСПОЗНАВАНИЯ СЛОЖНОГО ГРАФИЧЕСКОГО ОБЪЕКТА 2006
  • Миняев Андрей Александрович
  • Яковлев Вадим Лаврович
RU2321058C1

Реферат патента 2004 года СПОСОБ РАСПОЗНАВАНИЯ КОДИРОВАННЫХ ИЗОБРАЖЕНИЙ

Изобретение относится к автоматике и вычислительной технике. Его применение при распознавании и селекции заданных видов фрагментов кодированных документальных сообщений при обработке факсимильной информации позволяет получить технический результат в виде повышения точности распознавания заданных фрагментов в кодированном факсимильном изображении. Этот результат достигается благодаря тому, что в способ введены операции разделения интервала возможных значений числа бит в каждой кодированной строке развертки на "К" субинтервалов ak (k=1,2,...,К), представления на этапе обучения каждого "q"-го эталонного фрагмента цепочкой Aq номеров а(q)k

субинтервалов, размещения полученных цепочек в банке эталонных цепочек, формирования на этапе распознавания эталонных фрагментов в текущем факсимильном изображении текущей цепочки Ах номеров а(x)k
заданных субинтервалов, сравнения друг с другом элементов а(x)k
и а(q)k
с одинаковыми порядковыми номерами "k" и вынесения решения о принадлежности текущего фрагмента факсимильного изображения одному из заданных эталонных фрагментов. 2 з.п. ф-лы, 1 ил.

Формула изобретения RU 2 238 587 C1

1. Способ распознавания кодированных изображений, включающий выделение кодированных строчных участков электрических сигналов, удаление из них служебных битов и кодовых комбинаций, выделение групп соседних кодированных строк развертки, оценку числа бит в каждой кодированной строке, входящей в данную группу, отличающийся тем, что интервал возможных значений числа бит в каждой кодированной строке развертки разделяют на К субинтервалов ak (k=1,2,... ,К), нумерованных в порядке возрастания значений длин этих строк, представляют на этапе обучения каждый q-й (q=1,2,... ,Q, Q - число заданных эталонных фрагментов факсимильного изображения) эталонный фрагмент цепочкой Aq номеров а(q)k

субинтервалов, следующих в порядке поступления соответствующих текущих кодированных строк эталонного фрагмента факсимильного изображения, размещают полученные цепочки в банке эталонных цепочек, формируют на этапе распознавания эталонных фрагментов в текущем факсимильном изображении текущей цепочки Ах номеров а(x)k
заданных субинтервалов, в которые попадают значения размеров следующих друг за другом кодированных строк, сравнивают друг с другом элементы а(x)k
и а(q)k
с одинаковыми порядковыми номерами k, входящими в текущую цепочку Ах и в эталонные цепочки Aq и выносят решение о принадлежности текущего фрагмента факсимильного изображения одному из заданных эталонных фрагментов.2. Способ по п.1, отличающийся тем, что оценивают абсолютные величины разностей | а(x)k
(x)k-1
|и | а(x)k
(x)k+1
|между значениями текущего элемента а(x)k
цепочки Ах и значениями предыдущего а(x)k-1
и последующего a(x)k+1
элементов цепочки Ах и заменяют элемент а(x)k
на среднее значение <a(x)k
>=(a(x)k-1
-a(x)k+1
)/2 предыдущего и последующего элементов в случае превышения значений обеих разностей заданной величины д.
3. Способ по п.1, отличающийся тем, что выносят решение о принадлежности текущего фрагмента, заданного цепочкой Ах, q-му эталонному фрагменту, заданному цепочкой Aq, если абсолютные величины разностей значений элементов а(x)k
и а(q)k
цепочек Ах и Aq с одинаковыми порядковыми номерами k не превышают заданных величин η (q)k
.

Документы, цитированные в отчете о поиске Патент 2004 года RU2238587C1

СПОСОБ РАСПОЗНАВАНИЯ КОДИРОВАННЫХ ИЗОБРАЖЕНИЙ 1995
  • Лысенко В.Л.
RU2126552C1
US 5787202 A, 28.07.1998
ЩИТОВОЙ ДЛЯ ВОДОЕМОВ ЗАТВОР 1922
  • Гебель В.Г.
SU2000A1
Способ восстановления хромовой кислоты, в частности для получения хромовых квасцов 1921
  • Ланговой С.П.
  • Рейзнек А.Р.
SU7A1
US 5745600 A, 28.04.1998.

RU 2 238 587 C1

Авторы

Лысенко В.Л.

Даты

2004-10-20Публикация

2003-02-06Подача