Показать метаданные Скрыть метаданные

(19)

(11)

2 238 587

(13)

(51)

МПК

G06K9/70(2000-01-01)

(21) (22)

Заявка

2003103637/09, 2003-02-06

(24)

Дата начала отсчета патента

2003-02-06

(22)

дата подачи заявки

2003-02-06

(45)

опубликовано

2004-10-20

(72)

авторы

Лысенко В.Л.

(73)

патентообладатели

Войсковая Часть

(56)

Документы, цитированные в отчете о поиске

US 5787202 A, 28.07.1998US 5745600 A, 28.04.1998.

СПОСОБ РАСПОЗНАВАНИЯ КОДИРОВАННЫХ ИЗОБРАЖЕНИЙ Российский патент 2004 года по МПК G06K9/70

Описание патента на изобретение RU2238587C1

Изобретение относится к автоматике и вычислительной технике и может быть использовано для распознавания и селекции заданных видов фрагментов кодированных документальных сообщений при обработке факсимильной информации.

Известен способ распознавания фрагментов изображения [1], основанный на нахождении в памяти пиксельных данных, описывающих вставку размером n*n пикселов в первом изображении, производстве свертки величин интенсивности пикселов вставки с величинами ядра Лапласа с нулевым средним и получении лапласовой вставки, данные которой описывают координаты х, у и величины интенсивности пикселов со знаками, производстве свертки величин интенсивности лапласовой вставки с ядром Гаусса вдоль осей х и у и получении изображения, данные которого описывают положения и величины интенсивностей пикселов со знаками, упорядочивании чисел ядра Гаусса в гауссову последовательность и преобразовании пиксельных данных в бинарные, повторении преобразования над данными вставки размером m*m (m<n) пикселов из второго изображения, получении для каждого из возможных сдвигов величины корреляции пикселов, сравнивании величины корреляций и определении на основе максимальной величины корреляции сдвига.

Недостатком данного изобретения является существенная вычислительная сложность, обусловленная необходимостью обеспечения свертки величин интенсивностей матриц пикселов размера n*n и m*m с соответствующими величинами ядер Лапласа и Гаусса, а также вычисления соответствующих величин корреляций пикселов с последующим их сравнением.

Известен также способ распознавания текстовых изображений [2], основанный на определении прямоугольников, ограничивающих части изображения, потенциально содержащие текст, генерировании последовательности признаков для каждой части изображения, определении набора обученных скрытых марковских моделей (СММ) одиночных знаков с учетом структурных параметров каждого знака, объединении СММ, соответствующих знакам ключевого слова и имеющих один и тот же контекст, конструировании сети СММ, содержащей СММ ключевого слова, и определении с ее помощью наличия ключевого слова во входном изображении.

Как показано в [3], хранение факсимильных изображений в факсимильных банках данных наиболее целесообразно осуществлять в сжатой форме, что обеспечивается использованием специальных видов кодирования, таких как модифицированный код Хаффмана (код МН) или модифицированный код READ (код MR) [4], обеспечивающих меньший объем памяти, необходимой для хранения факсимильного изображения, чем в случае использования других графических форматов.

В этой связи недостатком приведенного выше способа является низкая точность распознавания фрагментов факсимильных изображений, представленных в кодированной форме (МН или MR), так как при этом биты знаков ключевых слов заменяются кодами длин серий двоичных нулей и единиц, что исключает возможность использования признаков, предложенных в указанном выше способе.

Наиболее близким по своей сущности к заявляемому изобретению является способ распознавания кодированных изображений [5], основанный на операции разделения изображения, представленного в форме кодированных электрических сигналов, на несколько участков и оценки размеров N_i этих участков, причем выделяют кодированные строчные участки электрических сигналов, заключенные между двумя соседними кодовыми словами конца строки развертки изображения, удаляют служебные биты заполнения в выделенных строчных участках, различают и выделяют r-е группы, состоящие из М последовательных участков соседних “белых” строк минимальной размерности, сравнивают числа этих групп с соответствующей пороговой величиной N₀ и выделяют р-е группы, состоящие из L последовательных “небелых” кодированных строк, сравнивают числа данных групп с соответствующей пороговой величиной N₁, оценивают наличие квазипериодичности следования участков, соответствующих кодированным “белым” строкам развертки изображения, определяют среднюю величину квазипериода Q_r, оценивают абсолютные величины i_p разностей размеров соседних кодированных “небелых” строк, вычисляют отношения d_p максимальных и минимальных значений разностей i_p, сравнивают полученные величины отношений d_p с априорно заданной пороговой величиной D и выносят решение о принадлежности кодированного изображения или его фрагмента графической или текстовой форме.

Недостатком данного способа является низкая точность распознавания кодированных фрагментов факсимильных изображений, представленных в одинаковой форме (графической или текстовой), поскольку используемые в нем признаки предназначены исключительно для различения между собой двух разных форм кодированных фрагментов факсимильных изображений: текстовой и графической. Таким образом, данный способ не позволяет обеспечить достоверное распознавание априорно заданных кодированных текстовых фрагментов среди множества возможных кодированных текстовых фрагментов (так же, как и кодированных графических фрагментов заданного вида среди множества возможных кодированных графических фрагментов факсимильных изображений).

Целью изобретения является повышение точности распознавания фрагментов заданного вида в кодированном факсимильном изображении.

Цель достигается тем, что в известный способ, включающий выделение кодированных строчных участков электрических сигналов, удаление из них служебных битов и кодовых комбинаций, выделение групп соседних кодированных строк развертки, оценку числа бит в каждой кодированной строке, входящей в данную группу, согласно изобретению введены операции, при которых интервал возможных значений числа бит в каждой кодированной строке развертки разделяют на "К" субинтервалов a_k(k=1, 2,... , К), нумерованных в порядке возрастания возможных значений длин этих строк, представляют на этапе обучения каждого "q"-ro (q=1, 2,... , Q, Q - число заданных эталонных фрагментов факсимильного изображения) эталонного фрагмента цепочкой A_q номеров а(q)k

субинтервалов, следующих в порядке поступления соответствующих текущих кодированных строк эталонного фрагмента факсимильного изображения, размещают полученные цепочки в банке эталонных цепочек, формируют на этапе распознавания эталонных фрагментов в текущем факсимильном изображении текущую цепочку A_x номеров а(x)k

заданных субинтервалов, в которые попадают значения размеров следующих друг за другом кодированных строк, сравнивают друг с другом элементы а(x)k

и а(q)k

с одинаковыми порядковыми номерами "k", входящие в текущую цепочку А_х и в эталонные цепочки A_q, и выносят решение о принадлежности текущего фрагмента факсимильного изображения одному из заданных эталонных фрагментов.

Оценивают абсолютные величины разностей | a(x)k

-a(x)k-1

|^{и | a(x)k|^{-a(x)k+1 между значениями текущего элемента а(x)k цепочки А_х и значениями предыдущего a(x)k-1 и последующего a(x)k+1 элементов цепочки А_хи заменяют элемент а(x)k на среднее значение <a(x)k>=(a(x)k-1-a(x)k+1)/2 предыдущего и последующего элементов в случае превышения значений обеих разностей заданной величины δ .}}

Выносят решение о принадлежности текущего фрагмента, заданного цепочкой A_x, "q"-мy эталонному фрагменту, заданному цепочкой A_q, если абсолютные величины разностей значений элементов а(x)k

и а(q)k

цепочек А_х и A_q с одинаковыми порядковыми номерами "k" не превышают заданных величин η (q)k

Сопоставительный анализ со способом, выбранным в качестве прототипа, показывает, что заявляемый способ отличается новыми операциями разделения интервала возможных значений числа бит в каждой кодированной строке развертки на "К" субинтервалов a_k (k=1, 2,... , К), нумерованных в порядке возрастания значений длин этих строк, представления на этапе обучения каждого "q"-го (q=1, 2,... , Q, Q - число заданных эталонных фрагментов факсимильного изображения) эталонного фрагмента цепочкой A_q номеров а(q)k

субинтервалов, следующих в порядке поступления соответствующих текущих кодированных строк эталонного фрагмента факсимильного изображения, размещения полученных цепочек в банке эталонных цепочек, формирования на этапе распознавания эталонных фрагментов в текущем факсимильном изображении текущей цепочки А_х номеров а(x)k

заданных субинтервалов, в которые попадают значения размеров следующих друг за другом кодированных строк, сравнения друг с другом элементов а(x)k

и а(q)k

с одинаковыми порядковыми номерами "k", входящими в текущую цепочку А_х и в эталонные цепочки A_q и вынесения решения о принадлежности текущего фрагмента факсимильного изображения одному из заданных эталонных фрагментов; а также введены операции оценки абсолютной величины разностей | a(x)k

-a(x)k-1

|^{и | a(x)k-a(x)k+1|^{между значениями текущего элемента а(x)k цепочки А_х и значениями предыдущего a(x)k-1 и последующего a(x)k+1 элементов цепочки А_х и замены элемента а(x)k на среднее значение <a(x)k>=(a(x)k-1-a(x)k+1)/2 предыдущего и последующего элементов в случае превышения значений обеих разностей заданной величины δ ; а также введены операции вынесения решения о принадлежности текущего фрагмента, заданного цепочкой А_х, "q"-мy эталонному фрагменту, заданному цепочкой A_q, если разности значений элементов а(x)k и а(q)k цепочек А_х и A_q с одинаковыми порядковыми номерами "k" не превышают заданных величин η (q)k.}}

Таким образом, заявляемый способ соответствует критерию изобретения "новизна".

Изобретение имеет "изобретательский уровень", т.к. оно для специалиста явным образом не следует из уровня техники.

Изобретение может быть использовано в различных областях промышленности, а именно связанных с техникой передачи и обработки изображений, с информационно-вычислительной техникой, а также в других областях народного хозяйства, и соответствует критерию "промышленная применимость".

На чертеже представлена блок-схема алгоритма распознавания кодированных изображений.

Предлагаемый способ реализуется следующим образом.

В последовательности двоичных кодированных электрических сигналов факсимильного изображения после удаления служебных битов и кодовых слов выделяются текущие группы соседних кодированных строк развертки и затем производится оценка числа бит в каждой кодированной строке, входящей в данную группу. Далее на этапе обучения интервал возможных значений числа бит в каждой кодированной строке развертки разделяется на "К" субинтервалов a_k (k=1, 2,... , К), нумерованных в порядке возрастания значений длин этих строк, а каждый "q"-й (q=1, 2,... , Q, Q - число заданных эталонных фрагментов факсимильного изображения) эталонный фрагмент представляется цепочкой A_q номеров а(q)k

субинтервалов, следующих в порядке поступления соответствующих текущих кодированных строк эталонного фрагмента факсимильного изображения, и полученные цепочки размещаются в банке эталонных цепочек. На этапе распознавания эталонных фрагментов в текущем факсимильном изображении формируется текущая цепочка А_х номеров а(x)k

заданных субинтервалов, в которые попадают значения размеров следующих друг за другом кодированных строк, производится оценка абсолютной величины разностей | a(x)k

-a(x)k-1

|^{и | a(x)k-a(x)k+1|^{между значениями текущего элемента а(х)k цепочки А_х и значениями предыдущего а(x)k-1 и последующего а(x)k+1 элементов цепочки А_х и замена элемента а(x)k на среднее значение <a(x)k>=(a(x)k-1-a(x)k+1)/2 предыдущего и последующего элементов в случае превышения значений обеих разностей заданной величины δ ; элементы а(x)k и а(q) kс одинаковыми порядковыми номерами "k", входящими в текущую цепочку А_х и в эталонные цепочки A_q, сравниваются друг с другом и выносится решение о принадлежности текущего фрагмента факсимильного изображения одному из заданных эталонных фрагментов, если разности значений элементов а(x)k и а(q)k цепочек А_х и A_q с одинаковыми порядковыми номерами "k" не превышают заданных величин η (q)k.}}

Способ реализуется на базе использования однокристальной микроЭВМ или ПЭВМ с процессором PENTIUM, обеспечивающих ввод данных кодированного факсимильного изображения объема 50-150 кбайт в память ОЭВМ/ПЭВМ и последующую арифметико-логическую обработку этих данных.

Способ позволяет на базе введенных операций использовать связь между структурой строчного фрагмента факсимильного изображения и структурой сформированных цепочек номеров интервалов величин размеров кодированных строк этого фрагмента и тем самым повысить точность распознавания заданных фрагментов в кодированном факсимильном изображении.

Источники информации

1. Патент США №5604819, МКИ G 06 K 9/00 от 15.03.93.

2. Патент США №5592568, МКИ G 06 K 9/68 от 13.02.93.

3. Введение к реализации системы поиска факсимильных изображений. Экспресс-информация, сер. Информатика, - 1993, №3, с.6.

4. Рекомендации МККТТ. Серия Т.4. Синяя книга. Т. VII, вып. VII.3, 1988, с.17.

5. Патент РФ №2126552, МКИ G 06 K 9/00.

Реферат патента 2004 года СПОСОБ РАСПОЗНАВАНИЯ КОДИРОВАННЫХ ИЗОБРАЖЕНИЙ

Изобретение относится к автоматике и вычислительной технике. Его применение при распознавании и селекции заданных видов фрагментов кодированных документальных сообщений при обработке факсимильной информации позволяет получить технический результат в виде повышения точности распознавания заданных фрагментов в кодированном факсимильном изображении. Этот результат достигается благодаря тому, что в способ введены операции разделения интервала возможных значений числа бит в каждой кодированной строке развертки на "К" субинтервалов a_k (k=1,2,...,К), представления на этапе обучения каждого "q"-го эталонного фрагмента цепочкой A_q номеров а(q)k

субинтервалов, размещения полученных цепочек в банке эталонных цепочек, формирования на этапе распознавания эталонных фрагментов в текущем факсимильном изображении текущей цепочки А_х номеров а(x)k

заданных субинтервалов, сравнения друг с другом элементов а(x)k

и а(q)k

с одинаковыми порядковыми номерами "k" и вынесения решения о принадлежности текущего фрагмента факсимильного изображения одному из заданных эталонных фрагментов. 2 з.п. ф-лы, 1 ил.

Формула изобретения RU 2 238 587 C1

1. Способ распознавания кодированных изображений, включающий выделение кодированных строчных участков электрических сигналов, удаление из них служебных битов и кодовых комбинаций, выделение групп соседних кодированных строк развертки, оценку числа бит в каждой кодированной строке, входящей в данную группу, отличающийся тем, что интервал возможных значений числа бит в каждой кодированной строке развертки разделяют на К субинтервалов a_k (k=1,2,... ,К), нумерованных в порядке возрастания значений длин этих строк, представляют на этапе обучения каждый q-й (q=1,2,... ,Q, Q - число заданных эталонных фрагментов факсимильного изображения) эталонный фрагмент цепочкой A_q номеров а(q)k

и а(q)k

с одинаковыми порядковыми номерами k, входящими в текущую цепочку А_х и в эталонные цепочки A_q и выносят решение о принадлежности текущего фрагмента факсимильного изображения одному из заданных эталонных фрагментов.

2. Способ по п.1, отличающийся тем, что оценивают абсолютные величины разностей | а(x)k

-а(x)k-1

|^{и | а(x)k-а(x)k+1|^{между значениями текущего элемента а(x)k цепочки А_х и значениями предыдущего а(x)k-1 и последующего a(x)k+1 элементов цепочки А_х и заменяют элемент а(x)k на среднее значение <a(x)k>=(a(x)k-1-a(x)k+1)/2 предыдущего и последующего элементов в случае превышения значений обеих разностей заданной величины д.}}

3. Способ по п.1, отличающийся тем, что выносят решение о принадлежности текущего фрагмента, заданного цепочкой А_х, q-му эталонному фрагменту, заданному цепочкой A_q, если абсолютные величины разностей значений элементов а(x)k

и а(q)k

цепочек А_х и A_q с одинаковыми порядковыми номерами k не превышают заданных величин η (q)k

Документы, цитированные в отчете о поиске Патент 2004 года RU2238587C1

СПОСОБ РАСПОЗНАВАНИЯ КОДИРОВАННЫХ ИЗОБРАЖЕНИЙ	1995	Лысенко В.Л.	RU2126552C1
US 5787202 A, 28.07.1998
ЩИТОВОЙ ДЛЯ ВОДОЕМОВ ЗАТВОР	1922	Гебель В.Г.	SU2000A1
Способ восстановления хромовой кислоты, в частности для получения хромовых квасцов	1921	Ланговой С.П. Рейзнек А.Р.	SU7A1
US 5745600 A, 28.04.1998.

RU 2 238 587 C1

Авторы

Лысенко В.Л.

Даты

2004-10-20—Публикация

2003-02-06—Подача

название	год	авторы	номер документа
СПОСОБ АВТОМАТИЧЕСКОГО РАСПОЗНАВАНИЯ СИГНАЛОВ ЦВЕТНЫХ ФАКСИМИЛЬНЫХ СООБЩЕНИЙ	2006	Варганов Алексей Вячеславович Лысенко Владимир Леонидович Захаренков Анатолий Иванович	RU2312467C1
СПОСОБ РАСПОЗНАВАНИЯ КОДИРОВАННЫХ ИЗОБРАЖЕНИЙ	1995	Лысенко В.Л.	RU2126552C1
Способ распознавания протоколов низкоскоростного кодирования	2016	Аладинский Виктор Алексеевич Кузьминский Сергей Владиславович Смирнов Павел Леонидович Чубатый Дмитрий Николаевич	RU2610285C1
СПОСОБ ЛОКАЛИЗАЦИИ ДОРОЖНЫХ ЗНАКОВ И РАСПОЗНАВАНИЯ ИХ ГРУПП И ПОДГРУПП	2012	Фурсов Владимир Алексеевич Бибиков Сергей Алексеевич Никоноров Артем Владимирович Якимов Павел Юрьевич	RU2488164C1
СПОСОБ ИДЕНТИФИКАЦИИ СИГНАЛОВ	2012	Комолов Дмитрий Викторович	RU2485586C1
СПОСОБ РАСПОЗНАВАНИЯ ТЕКСТОВОЙ ИНФОРМАЦИИ ИЗ ГРАФИЧЕСКОГО ФАЙЛА С ИСПОЛЬЗОВАНИЕМ СЛОВАРЕЙ И ДОПОЛНИТЕЛЬНЫХ ДАННЫХ	2005	Анисимович Константин Владимирович Рыбкин Владимир Юрьевич Шамис Александр Львович	RU2295154C1
Способ распознавания протоколов низкоскоростного кодирования речи	2017	Аладинский Виктор Алексеевич Вещунин Евгений Андреевич Кузьминский Сергей Владиславович Смирнов Павел Леонидович	RU2667462C1
Способ транскрибирования речи по цифровым сигналам с низкоскоростным кодированием	2023	Аладинский Виктор Алексеевич Кузьминский Сергей Владиславович Павлов Андрей Петрович Смирнов Павел Леонидович	RU2801621C1
Устройство для коррекции ошибок приемника факсимильных сигналов	1980	Ляшевич Вячеслав Степанович	SU976506A2
Способ передачи факсимильных изображений с распознаванием символов	1989	Балькин Геннадий Федорович Голосной Валентин Иванович Ляшевич Вячеслав Степанович Михалин Геннадий Александрович Сапунков Михаил Наумович Зайченко Александр Григорьевич	SU1695510A1

СПОСОБ РАСПОЗНАВАНИЯ КОДИРОВАННЫХ ИЗОБРАЖЕНИЙ Российский патент 2004 года по МПК G06K9/70

Описание патента на изобретение RU2238587C1

Похожие патенты RU2238587C1

Реферат патента 2004 года СПОСОБ РАСПОЗНАВАНИЯ КОДИРОВАННЫХ ИЗОБРАЖЕНИЙ

Формула изобретения RU 2 238 587 C1

Документы, цитированные в отчете о поиске Патент 2004 года RU2238587C1

RU 2 238 587 C1