[001] По настоящей заявке испрашивается приоритет на основании патентной заявки Китая № 201510726153.9, поданной 30 октября 2015 г., все содержание которой включено в настоящий документ посредством ссылки.
Область техники, к которой относится изобретение
[002] Настоящее изобретение в целом относится к области обработки изображений, в частности к способу и устройству для идентификации области.
Уровень техники
[003] В области обработки изображений перед идентификацией слов на изображении терминалу может сначала потребоваться идентификация символьной области каждого слова.
[004] На предшествующем уровне техники был предложен способ для идентификации области, включая удаление при помощи терминала фона изображения, извлечение основного изображения, идентификацию при помощи технологии повышения четкости границы каждого слова на извлеченном основном изображении и определение символьной области каждого слова в соответствии с идентифицированной границей каждого слова.
[005] Для вышеуказанного решения точность определения символьной области может быть относительно низкой, так как технология повышения четкости может обеспечить только приблизительное положение.
Раскрытие изобретения
[006] Учитывая тот факт, что на предшествующем уровне техники точность положения символьной области относительна низкая, в данном раскрытии представлены способ и устройство для идентификации области.
[007] Согласно первому аспекту осуществления изобретения данного раскрытия предложен способ определения области, включая: бинаризацию области слова для получения бинаризованной области слова, при этом область слова включает несколько слов, принадлежащих к одному ряду; расчет гистограммы в вертикальном направлении для бинаризованной области слова, при этом гистограмма включает абсциссы пикселей в каждом столбце и накопленное значение пикселей цвета переднего плана для пикселей в каждом столбце; идентификацию символьной области каждого слова в области слова согласно информации распределения накопленных значений в гистограмме.
[008] Дополнительно вышеуказанный шаг идентификации может включать: определение нескольких наборов абсцисс согласно информации распределения накопленных значений на гистограмме, при этом каждый из нескольких наборов абсцисс включает первую и вторую абсциссу, расположенные справа от первой абсциссы; при этом накопленные значения, относящиеся соответственно к первой абсциссе и абсциссе справа и прилегающей к первой абсциссе, больше первого порогового значения, а накопленное значение, относящееся к абсциссе слева и прилегающей к первой абсциссе, меньше второго порогового значения; накопленные значения, относящиеся соответственно ко второй абсциссе и абсциссе слева и прилегающей ко второй абсциссе, больше первого порогового значения, а накопленное значение, относящееся к абсциссе справа и прилегающей ко второй абсциссе, меньше второго порогового значения; для каждого из нескольких наборов абсцисс определение столбца пикселей, где первая абсцисса является левой границей символьной области, и определение столбца пикселей, где вторая абсцисса является правой границей символьной области.
[009] Дополнительно шаг определения нескольких наборов абсцисс согласно информации распределения накопленных значений на гистограмме может включать: определение третьей абсциссы на гистограмме согласно информации распределения накопленных значений, при этом третья абсцисса – это абсцисса на гистограмме, относящаяся к левой границе символьной области первого действительного слова среди нескольких слов, или абсцисса на гистограмме, относящаяся к правой границе символьной области последнего действительного слова среди нескольких слов; поиск нескольких наборов абсцисс, начиная с третьей абсциссы в заранее определенном направлении и основываясь на информации распределения накопленных значений.
[0010] Дополнительно, если третья абсцисса – это абсцисса на гистограмме, относящаяся к левой границе символьной области первого действительного слова среди нескольких слов, этап поиска нескольких наборов абсцисс, начиная с третьей абсциссы в заранее определенном направлении и основываясь на информации распределения накопленных значений, включает: для i-го набора абсцисс на гистограмме поиск четвертой абсциссы, начиная с первой абсциссы в i-м наборе абсцисс на гистограмме и в направлении вправо, где накопленные значения, относящиеся соответственно к четвертой абсциссе и абсциссе слева и прилегающей к четвертой абсциссе, больше первого порогового значения, и накопленное значение, относящееся к абсциссе справа и прилегающей к четвертой абсциссе меньше второго порогового значения; при этом
[0011] Наоборот, если третья абсцисса – это абсцисса на гистограмме, относящаяся к правой границе символьной области последнего действительного слова среди нескольких слов, шаг поиска нескольких наборов абсцисс, начиная с третьей абсциссы в заранее определенном направлении и основываясь на информации распределения накопленных значений, включает: для j-го набора абсцисс поиск шестой абсциссы, начиная со второй абсциссы в j-м наборе абсцисс на гистограмме и в направлении влево, где накопленные значения, относящиеся соответственно к шестой абсциссе и абсциссе справа и прилегающей к шестой абсциссе, больше первого порогового значения, и накопленное значение, относящееся к абсциссе слева и прилегающей к шестой абсциссе меньше второго порогового значения;
[0012] Наоборот, если третья абсцисса – это абсцисса на гистограмме, относящаяся к левой границе символьной области первого действительного слова среди нескольких слов, этап идентификации третьей абсциссы на гистограмме согласно информации распределения накопленных значений может включать: если несколько слов включают и действительные, и недействительные слова, и первое расстояние между действительным и недействительным словом больше второго расстояния между двумя соседними действительными словами, поиск, начиная с предварительно определенной абсциссы на гистограмме и в направлении влево, интервала, являющегося первым интервалом, ширина которого больше второго расстояния; определение абсциссы справа от интервала, для которой накопленное значение пикселей цвета переднего плана больше первого порогового значения, как третьей абсциссы; при этом предварительно определенная абсцисса принадлежит предварительно определенному диапазону, заданному согласно эмпирическому значению; накопленное значение пикселей цвета переднего плана в интервале меньше второго порогового значения; если все несколько слов являются действительными словами, определение первой абсциссы из расположенных в левой части гистограммы, для которой накопленное значение пикселей цвета переднего плана больше первого порогового значения, как третьей абсциссы.
[0013] Наоборот, если третья абсцисса – это абсцисса на гистограмме, относящаяся к правой границе символьной области последнего действительного слова среди нескольких слов, шаг идентификации третьей абсциссы на гистограмме согласно информации распределения накопленных значений может включать: если несколько слов включают и действительные, и недействительные слова, и первое расстояние между действительным и недействительным словом больше второго расстояния между двумя соседними действительными словами, поиск, начиная с предварительно определенной абсциссы на гистограмме и в направлении вправо, интервала, ширина которого больше второго расстояния; определение абсциссы слева от интервала, для которой накопленное значение пикселей цвета переднего плана больше первого порогового значения, как третьей абсциссы; при этом предварительно определенная абсцисса принадлежит предварительно определенному диапазону, заданному согласно эмпирическому значению; накопленное значение пикселей цвета переднего плана в интервале меньше второго порогового значения; если все несколько слов являются действительными словами, определение первой абсциссы из расположенных в правой части гистограммы, для которой накопленное значение пикселей цвета переднего плана больше первого порогового значения, как третьей абсциссы.
[0014] Дополнительно способ может также включать: бинаризацию целевой области изображения для получения бинаризованной целевой области изображения; расчет в горизонтальном направлении горизонтальной гистограммы для бинаризованной целевой области изображения, при этом горизонтальная гистограмма включает: ординаты пикселей в каждом ряду и накопленное значение пикселей цвета на переднем плане пикселей в каждом ряду; определение нескольких наборов ординат согласно информации распределения накопленных значений на горизонтальной гистограмме, при этом каждый из нескольких наборов ординат включает первую и вторую ординату, расположенные под первой ординатой; для каждого из нескольких наборов ординат определение ряда пикселей, где первая ордината является верхней границей ряда слов, и определение ряда пикселей, где вторая ордината является нижней границей ряда слов; накопленные значения, относящиеся соответственно к первой ординате и ординате снизу и прилегающей к первой абсциссе, больше первого порогового значения, а накопленное значение, относящееся к ординате сверху и прилегающей к первой ординате, меньше второго порогового значения; накопленные значения, относящиеся соответственно ко второй ординате и ординате сверху и прилегающей ко второй абсциссе, больше первого порогового значения, а накопленное значение, относящееся к ординате снизу и прилегающей ко второй абсциссе, меньше второго порогового значения; для k-го ряда в области слова выполнение этапа бинаризации области слова, при этом
[0015] Согласно второму аспекту осуществления изобретения данного раскрытия предложено устройство идентификации области, включая: первый модуль бинаризации для бинаризации области слова для получения бинаризованной области слова, при этом область слова включает несколько слов, принадлежащих к одному ряду; первый модуль расчета для расчета гистограммы в вертикальном направлении для бинаризованной области слова, при этом гистограмма включает абсциссы пикселей в каждом столбце и накопленное значение пикселей цвета переднего плана для пикселей в каждом столбце; модуль идентификации области для идентификации символьной области каждого слова в области слова согласно информации распределения накопленных значений в гистограмме.
[0016] Дополнительно модуль идентификации области может включать: подмодуль определения координат для определения нескольких наборов абсцисс согласно информации распределения накопленных значений на гистограмме, при этом каждый из нескольких наборов абсцисс включает первую и вторую абсциссу, расположенные справа от первой абсциссы; при этом накопленные значения, относящиеся соответственно к первой абсциссе и абсциссе справа от прилегающей к первой абсциссе, больше первого порогового значения, а накопленное значение, относящееся к абсциссе слева и прилегающей к первой абсциссе, меньше второго порогового значения; накопленные значения, относящиеся соответственно ко второй абсциссе и абсциссе слева и прилегающей ко второй абсциссе, больше первого порогового значения, а накопленное значение, относящееся к абсциссе справа и прилегающей ко второй абсциссе, меньше второго порогового значения; подмодуль идентификации области для определения столбца пикселей, где первая абсцисса является левой границей символьной области, и определения столбца пикселей, где вторая абсцисса является правой границей символьной области, для каждого из нескольких наборов абсцисс.
[0017] Дополнительно подмодуль определения координаты может включать: подмодуль идентификации координаты для определения третьей абсциссы на гистограмме согласно информации распределения накопленных значений, при этом третья абсцисса – это абсцисса на гистограмме, относящаяся к левой границе символьной области первого действительного слова среди нескольких слов, или абсцисса на гистограмме, относящаяся к правой границе символьной области последнего действительного слова среди нескольких слов; подмодуль поиска координаты для поиска нескольких наборов абсцисс, начиная с третьей абсциссы в заранее определенном направлении и основываясь на информации распределения накопленных значений.
[0018] Наоборот, если третья абсцисса – это абсцисса на гистограмме, относящаяся к левой границе символьной области первого действительного слова среди нескольких слов, подмодуль поиска координат далее конфигурируется: для i-го набора абсцисс на гистограмме для поиска четвертой абсциссы, начиная с первой абсциссы в i-м наборе абсцисс на гистограмме и в направлении вправо, при этом накопленные значения, относящиеся соответственно к четвертой абсциссе и абсциссе слева и прилегающей к четвертой абсциссе, больше первого порогового значения, и накопленное значение, относящееся к абсциссе справа и прилегающей к четвертой абсциссе меньше второго порогового значения; при этом
[0019] Наоборот, если третья абсцисса – это абсцисса на гистограмме, относящаяся к правой границе символьной области последнего действительного слова среди нескольких слов, подмодуль поиска координат далее конфигурируется: для j-го набора абсцисс для поиска шестой абсциссы, начиная со второй абсциссы в j-м наборе абсцисс на гистограмме и в направлении влево, где накопленные значения, относящиеся соответственно к шестой абсциссе и абсциссе справа и прилегающей к шестой абсциссе, больше первого порогового значения, и накопленное значение, относящееся к абсциссе слева и прилегающей к шестой абсциссе меньше второго порогового значения; там, где
[0020] Наоборот, если третья абсцисса – это абсцисса на гистограмме, относящаяся к левой границе символьной области первого действительного слова среди нескольких слов, подмодуль идентификации координаты далее конфигурируется: если несколько слов включают и действительные, и недействительные слова, и первое расстояние между действительным и недействительным словом больше второго расстояния между двумя соседними действительными словами, для поиска, начиная с предварительно определенной абсциссы на гистограмме и в направлении влево, интервала, являющегося первым интервалом, ширина которого больше второго расстояния; для определения абсциссы справа от интервала, для которой накопленное значение пикселей цвета переднего плана больше первого порогового значения, как третьей абсциссы; при этом предварительно определенная абсцисса принадлежит предварительно определенному диапазону, заданному согласно эмпирическому значению; накопленное значение пикселей цвета переднего плана в интервале меньше второго порогового значения; если все несколько слов являются действительными словами, для определения первой абсциссы из расположенных в левой части гистограммы, для которой накопленное значение пикселей цвета переднего плана больше первого порогового значения, как третьей абсциссы.
[0021] Наоборот, если третья абсцисса – это абсцисса на гистограмме, относящаяся к правой границе символьной области последнего действительного слова среди нескольких слов, подмодуль идентификации координаты далее конфигурируется: если несколько слов включают и действительные, и недействительные слова, и первое расстояние между действительным и недействительным словом больше второго расстояния между двумя соседними действительными словами, для поиска, начиная с предварительно определенной абсциссы на гистограмме и в направлении влево, интервала, ширина которого больше второго расстояния; для определения абсциссы слева от интервала, для которой накопленное значение пикселей цвета переднего плана больше первого порогового значения, как третьей абсциссы; при этом предварительно определенная абсцисса принадлежит предварительно определенному диапазону, заданному согласно эмпирическому значению; накопленное значение пикселей цвета переднего плана в интервале меньше второго порогового значения; если все несколько слов являются действительными словами, для определения первой абсциссы из расположенных в правой части гистограммы, для которой накопленное значение пикселей цвета переднего плана больше первого порогового значения, как третьей абсциссы.
[0022] Дополнительно устройство может также включать: второй модуль бинаризации для бинаризации целевой области изображения для получения бинаризованной целевой области изображения; второй модуль расчета для расчета в горизонтальном направлении горизонтальной гистограммы для бинаризованной целевой области изображения, при этом горизонтальная гистограмма включает: ординаты пикселей в каждом ряду и накопленное значение пикселей цвета на переднем плане пикселей в каждом ряду; модуль определения границы для определения нескольких наборов ординат согласно информации распределения накопленных значений на горизонтальной гистограмме, при этом каждый из нескольких наборов ординат включает первую и вторую ординату, расположенные под первой ординатой; для каждого из нескольких наборов ординат для определения ряда пикселей, где первая ордината является верхней границей ряда слов, и определения ряда пикселей, где вторая ордината является нижней границей ряда слов; накопленные значения, относящиеся соответственно к первой ординате и ординате снизу и прилегающей к первой абсциссе, больше первого порогового значения, а накопленное значение, относящееся к ординате сверху и прилегающей к первой ординате, меньше второго порогового значения; накопленные значения, относящиеся соответственно ко второй ординате и ординате сверху и прилегающей ко второй абсциссе, больше первого порогового значения, а накопленное значение, относящееся к ординате снизу и прилегающей ко второй абсциссе, меньше второго порогового значения; первый модуль бинаризации далее конфигурируется для k-го ряда в области слова для выполнения этапа бинаризации области слова, при этом
[0023] Согласно третьему аспекту осуществления изобретения данного раскрытия предложено устройство идентификации области, включая: процессор; память для хранения инструкций, исполняемых процессором; при этом процессор выполнен с возможностью для: бинаризации области слова для получения бинаризованной области слова, где область слова включает несколько слов, принадлежащих к одному ряду; расчета гистограммы в вертикальном направлении для бинаризованной области слова, при этом гистограмма включает абсциссы пикселей в каждом столбце и накопленное значение пикселей цвета переднего плана для пикселей в каждом столбце; идентификации символьной области каждого слова в области слова согласно информации распределения накопленных значений в гистограмме.
[0024] В соответствии с техническими решениями вариантов осуществления настоящего изобретения могут быть достигнуты, по крайней мере, следующие технические результаты.
[0025] В соответствии с вариантами осуществления изобретения может быть решена проблема относительно низкой точности положения символьной области на предыдущих уровнях техники посредством расчета гистограммы в вертикальном направлении для бинаризованной области слова и определения символьной области каждого слова в области слова согласно информации распределения в гистограмме; в результате может быть получен эффект точного положения символьной области каждого слова согласно информации распределения накопленных значений пикселей цвета переднего плана в гистограмме.
[0026] Следует понимать, что, как предшествующее общее раскрытие, так и нижеследующее подробное раскрытие являются лишь примерами и не ограничивают настоящее изобретение.
Краткое описание чертежей
[0027] Сопровождающие чертежи, включенные в настоящий документ и составляющие его часть, иллюстрируют варианты осуществления изобретения, соответствующие настоящему раскрытию, и вместе с настоящим раскрытием служат для пояснения принципов настоящего изобретения.
[0028] Фиг. 1 представляет собой схему, иллюстрирующую область слова в соответствии с некоторыми примерными вариантами осуществления изобретения;
[0029] Фиг. 2 представляет собой функциональную схему, иллюстрирующую способ для идентификации области в соответствии с примерным вариантом осуществления изобретения;
[0030] Фиг. 3А представляет собой функциональную схему, иллюстрирующую способ для идентификации области в соответствии с другим примерным вариантом осуществления изобретения;
[0031] Фиг. 3В представляет собой схему, иллюстрирующую бинаризованную область слова в соответствии с другим примерным вариантом осуществления изобретения;
[0032] Фиг. 3С представляет собой схему, иллюстрирующую гистограмму, рассчитанную в вертикальном направлении в соответствии с другим примерным вариантом осуществления изобретения;
[0033] Фиг. 3D представляет собой функциональную схему, иллюстрирующую способ определения нескольких наборов абсцисс для терминала в соответствии с другим примерным вариантом осуществления изобретения;
[0034] Фиг. 3Е представляет собой схему, иллюстрирующую третью абсциссу, определенную терминалом в гистограмме в соответствии с другим примерным вариантом осуществления изобретения;
[0035] Фиг. 3F представляет собой схему, иллюстрирующую каждый набор абсцисс, определенный на основе гистограммы в соответствии с другим примерным вариантом осуществления изобретения;
[0036] Фиг. 3G представляет собой схему, иллюстрирующую заранее определенные абсциссы в гистограмме в соответствии с другим примерным вариантом осуществления изобретения;
[0037] Фиг. 3H представляет собой схему, иллюстрирующую третью абсциссу, определенную на основе гистограммы в соответствии с другим примерным вариантом осуществления изобретения;
[0038] Фиг. 4 представляет собой функциональную схему, иллюстрирующую способ определения каждого набора абсцисс на основе информации распределения накопленного значения и третьей абсциссы в соответствии с другим примерным вариантом осуществления изобретения;
[0039] Фиг. 5 представляет собой функциональную схему, иллюстрирующую способ определения каждого набора абсцисс на основе информации распределения накопленного значения и третьей абсциссы в соответствии с другим примерным вариантом осуществления изобретения;
[0040] Фиг. 6 представляет собой функциональную схему, иллюстрирующую способ идентификации области слова для терминала в соответствии с примерным вариантом осуществления изобретения;
[0041] Фиг. 7 представляет собой блок-схему, иллюстрирующую устройство для идентификации области в соответствии с примерным вариантом осуществления изобретения;
[0042] Фиг. 8 представляет собой блок-схему, иллюстрирующую устройство для идентификации области в соответствии с другим примерным вариантом осуществления изобретения;
[0043] Фиг. 9 представляет собой блок-схему, иллюстрирующую устройство для идентификации области в соответствии с примерным вариантом осуществления изобретения.
Осуществление изобретения
[0044] Далее в подробностях будут рассмотрены примерные варианты осуществления изобретения, иллюстрируемые сопровождающими чертежами. Дальнейшее описание относится к сопровождающим чертежам, в которых одинаковые номера на разных чертежах обозначают одинаковые или подобные элементы, если не указано иное. Варианты осуществления, рассмотренные в нижеследующем описании примерных вариантов осуществления изобретения, не представляют собой все возможные варианты осуществления, соответствующие настоящему изобретению. Напротив, они представляют собой лишь примеры устройств и способов, соответствующих аспектам, относящимся к настоящему изобретению согласно прилагаемой формуле изобретения.
[0045] Для облегчения понимания сначала будет представлено краткое введение в условия, связанные с каждым примерным вариантом осуществления изобретения.
[0046] Область слова может включать несколько слов, принадлежащих к одному ряду. Область слова может быть областью в изображении идентификационных данных, областью на отсканированном изображении статьи или областью в электронном документе, и вариант осуществления изобретения этим не ограничивается. Дополнительно в варианте осуществления изобретения верхняя граница области слова находится между верхней границей слов в одном ряду и нижней границей слов в предыдущем ряду; нижняя граница области слова находится между нижней границей слов в том же ряду и верхней границей слов в следующем ряду.
[0047] Например, примем, что область слова – это область, содержащая номер удостоверения личности гражданина, входящий в тот же ряд на удостоверении личности второго поколения. Например, см. фиг. 1, верхняя граница области слова находится между l1 и l2, нижняя граница области слова находится между l3 и l4. Например, область слова – это область 11, как показано на фиг. 1.
[0048] Все слова в области слова могут быть действительными словами или комбинацией действительных и недействительных слов. Символьная область для каждого действительного слова требует идентификации; однако, символьная область для каждого недействительного слова не требует идентификации. Например, примем, что область для каждого числа в номере удостоверения личности гражданина требует идентификации (т.е. все числа в номере удостоверения личности гражданина являются действительными словами). Например, слова в области слова могут включать только входящие туда числа, т.е. «3 3 0 4 2 1 1 9 9 0 1 2 1 6 2 8 3 4» или могут включать в дополнение к числам как минимум один символ слева от чисел («3 3 0 4 2 1 1 9 9 0 1 2 1 6 2 8 3 4»). Например, слова в области слова – это «number 3 3 0 4 2 1 1 9 9 0 1 2 1 6 2 8 3 4». Символьная область относится к области, относящейся к одному слову.
[0049] Далее под словами в различных вариантах осуществления изобретения могут подразумеваться числа, буквы, символы, изображения или другое содержание, для которого количество пикселей цвета переднего плана больше порогового значения в рассчитанной гистограмме.
[0050] Фиг. 2 представляет собой функциональную схему, иллюстрирующую способ для идентификации области в соответствии с примерным вариантом осуществления изобретения. Как показано на фиг. 2, способ для идентификации области может включать в себя следующие шаги.
[0051] На шаге 201 область слова может быть бинаризована для получения бинаризованной области слова. Область слова может включать несколько слов, принадлежащих к одному ряду.
[0052] На шаге 202 гистограмма может быть рассчитана в вертикальном направлении для бинаризованной области слова. Гистограмма может включать абсциссы пикселей в каждом столбце и накопленное значение пикселей цвета переднего плана для пикселей в каждом столбце.
[0053] На шаге 203 символьная область каждого слова в области слова может быть идентифицирована согласно информации распределения накопленных значений в гистограмме.
[0054] Способ идентификации области в вариантах осуществления изобретения, как указано, устраняет проблему низкой точности положения символьной области на предыдущих уровнях техники посредством расчета гистограммы в вертикальном направлении для бинаризованной области слова и определения символьной области каждого слова в области слова согласно информации распределения в гистограмме; в результате может быть получен эффект точного положения символьной области каждого слова согласно информации распределения накопленных значений пикселей цвета переднего плана в гистограмме.
[0055] Фиг. 3А представляет собой функциональную схему, иллюстрирующую способ для идентификации области в соответствии с другим примерным вариантом осуществления изобретения. Как показано на фиг. 3, способ для идентификации области может включать в себя следующие шаги.
[0056] На шаге 301 область слова может быть бинаризована для получения бинаризованной области слова. Область слова может включать несколько слов, принадлежащих к одному ряду.
[0057] Наоборот, терминал может предварительно обрабатывать область слова, при этом предварительная обработка включает такие операции, как очистка от шумов, фильтрация, разделение границ и аналогичные; предварительно обработанная область слова может быть бинаризована.
[0058] Бинаризация означает сравнение значений серого уровня пикселей в области слова с предварительно определенным значением серого уровня; разделение пикселей в области слова на две части: группа пикселей, для каждого из которых значение серого уровня больше предварительно определенного значения уровня серого, и группа пикселей, для каждого из которых значение уровня серого меньше предварительно определенного значения серого уровня; выделение двух групп пикселей в области слова при помощи двух различных цветов, таких как белый и черный, для получения бинаризованной области слова, как показано на фиг. 3В. На фиг. 3D пиксели, расположенные в цвете переднего плана, можно назвать пикселями цвета переднего плана, т.е. белыми пикселями на фиг. 3B; пиксели, расположенные в цвете фона, можно назвать пикселями цвета фона, т.е. черными пикселями на фиг. 3В.
[0059] На шаге 302 гистограмма может быть рассчитана в вертикальном направлении для бинаризованной области слова. Гистограмма может включать абсциссы пикселей в каждом столбце и накопленное значение пикселей цвета переднего плана для пикселей в каждом столбце.
[0060] Гистограмма может быть рассчитана в вертикальном направлении после бинаризации области слова. Горизонтальное направление гистограммы может представлять абсциссы пикселей в каждом столбце, а вертикальное направление гистограммы может представлять накопленное значение нескольких пикселей цвета переднего плана для пикселей в каждом столбце; при этом пиксели цвета переднего плана относятся к пикселям в белой области бинаризованной области слова с учетом пикселей цвета фона. Например, терминал может рассчитать гистограмму.
[0061] На шаге 303 несколько наборов абсцисс может быть определено согласно информации распределения накопленных значений в гистограмме.
[0062] И наоборот, см. фиг. 3D, шаг 303 может включать следующие шаги.
[0063] На шаге 303a третья абсцисса может быть определена на гистограмме согласно информации распределения накопленных значений.
[0064] Третья абсцисса может быть абсциссой на гистограмме, относящейся к левой границе символьной области первого действительного слова среди нескольких слов, или абсцисса на гистограмме, относящаяся к правой границе символьной области последнего действительного слова среди нескольких слов.
[0065] Например, примем, что действительные слова в области слова могут быть номером удостоверения личности гражданина на фиг. 1, например, см. фиг. 3Е, третья абсцисса может быть абсциссой X1 на гистограмме, относящейся к левой границе первого действительного слова «3» или абсциссой X2, относящейся к правой границе последнего действительного слова «4».
[0066] На шаге 303b поиск нескольких наборов абсцисс осуществляется, начиная с третьей абсциссы, в заранее определенном направлении и основываясь на информации распределения накопленных значений.
[0067] После идентификации третьей абсциссы терминал может осуществлять поиск нескольких наборов абсцисс, начиная с третьей абсциссы, в заранее определенном направлении и основываясь на информации распределения накопленных значений. Если третья абсцисса – это абсцисса на гистограмме, относящаяся к левой границе символьной области первого действительного слова, то заранее определенное направление – это направление вправо; и если третья абсцисса – это абсцисса на гистограмме, относящаяся к правой границе символьной области последнего действительного слова, то заранее определенное направление – это направление влево.
[0068] Несколько наборов абсцисс может относиться к нескольким действительным словам в области слова, т.е. каждый набор абсцисс может включать первую абсциссу на гистограмме, относящуюся к левой границе символьной области одного действительного слова, и вторую абсциссу на гистограмме, относящуюся к левой границе символьной области действительного слова. Другими словами, каждый набор абсцисс может включать первую абсциссу и вторую абсциссу, расположенные справа от первой абсциссы. Накопленные значения, относящиеся соответственно к первой абсциссе и абсциссе справа от прилегающей к первой абсциссе, больше первого порогового значения, а накопленное значение, относящееся к абсциссе слева и прилегающей к первой абсциссе, могут быть меньше второго порогового значения; накопленные значения, относящиеся соответственно ко второй абсциссе и абсциссе слева и прилегающей ко второй абсциссе, могут быть больше первого порогового значения, а накопленное значение, относящееся к абсциссе справа и прилегающей ко второй абсциссе, может быть меньше второго порогового значения.
[0069] Например, примем, что первая абсцисса – это x1, а вторая абсцисса – это x2, в качестве примера терминал может идентифицировать каждый набор абсцисс, как показано на фиг. 3F. Следует принять во внимание, что фиг. 3F является лишь примерной иллюстрацией, показывающей несколько идентифицированных наборов абсцисс, на практике может быть включено большее количество наборов абсцисс, и вариант осуществления изобретения этим не ограничивается.
[0070] Вышеуказанные первое и второе пороговые значения имеют относительно небольшие числовые значения. Например, первое и второе пороговые значения могут иметь числовые значения немного больше 0. И наоборот, первое пороговое значение может быть равным 0, а второе пороговое значение может иметь числовое значение, близкое к 0. Далее на практике накопленные значения, относящиеся соответственно к первой абсциссе и абсциссе справа и прилегающей к первой абсциссе, могут быть равны 0, и накопленное значение, относящееся к абсциссе слева и прилегающей к первой абсциссе, может быть равным 0; накопленные значения, относящиеся соответственно ко второй абсциссе и абсциссе слева и прилегающей ко второй абсциссе, могут быть равны 0, и накопленное значение, относящееся к абсциссе справа и прилегающей ко второй абсциссе, может быть равно 0.
[0071] На шаге 304 для каждого набора абсцисс столбец пикселей, где находится первая абсцисса, может быть идентифицирован как левая граница символьной области, и столбец пикселей, где находится вторая абсцисса, может быть идентифицирован как правая граница символьной области.
[0072] Способ идентификации области в вариантах осуществления изобретения, как указано, устраняет проблему низкой точности положения символьной области на предыдущих уровнях техники посредством расчета гистограммы в вертикальном направлении для бинаризованной области слова и определения символьной области каждого слова в области слова согласно информации распределения в гистограмме; в результате может быть получен эффект точного положения символьной области каждого слова согласно информации распределения накопленных значений пикселей цвета переднего плана в гистограмме.
[0073] В варианте осуществления изобретения на фиг. 3А, если слова в области слова и действительные, и недействительные, и первое расстояние между действительным словом и недействительным словом больше второго расстояния между двумя соседними действительными словами, шаг 303a может включать следующие шаги.
[0074] Начиная с заранее определенной абсциссы на гистограмме, терминал может искать в направлении влево интервал, являющийся первым интервалом, ширина которого больше второго расстояния; терминал может определять как третью абсциссу, расположенную справа от интервала и для которой накопленное значение пикселей цвета переднего плана больше первого порогового значения.
[0075] Заранее определенной абсциссой может быть абсцисса в заранее определенном диапазоне, который является областью отображения значений на гистограмме, относящейся к действительным словам в области слова. Например, примем, что действительные слова – это номер удостоверения личности гражданина, см. фиг. 3Е, заранее определенным диапазоном будет диапазон [X1, X2] на фиг. 3E. Обычно заранее определенный диапазон может быть задан согласно эмпирическому значению. Кроме того, накопленное значение пикселей цвета переднего плана в интервале может быть меньше второго порогового значения.
[0076] Примем в качестве примера, что действительные слова – это номер удостоверения личности гражданина на фиг. 1, заранее определенная абсцисса может быть абсциссой на гистограмме, относящейся к среднему положению в горизонтальном направлении удостоверения личности второго поколения, так как среднее положение в горизонтальном направлении удостоверения личности второго поколения определенно может быть в номере удостоверения личности гражданина. Например, примем, что ширина области слова является общей шириной удостоверения личности второго поколения, см. фиг. 3G, заранее определенной абсциссой может быть X0 , как показано на фиг. 3G. Терминал может осуществлять поиск, начиная сX0, и в направлении влево. Так как первое расстояние между двумя соседними числами намного меньше второго расстояния между китайским символом «码» и первым числом в номере удостоверения личности гражданина, после поиска интервала, больше второго расстояния (т.е. интервала d, как показано на фиг. 3G), терминал может определять как третью абсциссу, расположенную справа от интервала и для которой накопленное значение пикселей цвета переднего плана больше первого порогового значения, т.е. определена третья абсцисса X1.
[0077] Вышеуказанным принимается, что терминал может осуществлять поиск, начиная с заранее определенной абсциссы, и в направлении влево в качестве примера. Аналогично, терминал может осуществлять поиск, начиная с заранее определенной абсциссы, в направлении вправо и после поиска интервала больше второго расстояния; и, определять как третью абсциссу, расположенную слева от интервала и для которой накопленное значение пикселей цвета переднего плана больше первого порогового значения. Данный случай не будет подробно описан в варианте осуществления изобретения.
[0078] В других вариантах осуществления изобретения, как показано на фиг. 3А, если все слова в области слова являются действительными словами, шаг 303a может включать следующие шаги.
[0079] Если все слова в области слова являются действительными словами, после расчета гистограммы для бинаризованной области слова, где первая абсцисса в левой части гистограммы, для которой накопленное значение пикселей цвета переднего плана больше первого порогового значения, может быть определена как абсцисса на гистограмме, относящейся к первому действительному значению, затем терминал может определить первую абсциссу в левой части гистограммы, для которой накопленное значение пикселей цвета переднего плана больше первого порогового значения, как третью абсциссу.
[0080] Например, см. фиг. 3H, терминал может определить X1 как третью абсциссу.
[0081] Аналогично, первая абсцисса с правой стороны гистограммы, для которой накопленное значение пикселей цвета переднего плана больше первого порогового значения, может быть определена как абсцисса на гистограмме, относящаяся к последнему действительному слову. Поэтому терминал затем может определить первую абсциссу с правой стороны гистограммы, для которой накопленное значение пикселей цвета переднего плана больше первого порогового значения, как третью абсциссу. Согласно фиг. 3H, терминал может определить X2 как третью абсциссу.
[0082] В варианте осуществления изобретения на фиг. 3А после того, как терминал рассчитает третью абсциссу согласно вышеуказанному режиму расчета, если рассчитанная третья абсцисса будет абсциссой на гистограмме, относящейся к левой границе символьной области первого действительного слова среди нескольких слов, можно сослаться на фиг. 4. На фиг. 4 шаг 303b может быть заменен на шаги 401-404.
[0083] На шаге 401 для i-го набора абсцисс, начиная с первой абсциссы в i-ом наборе абсцисс на гистограмме, поиск четвертой абсциссы можно осуществлять в направлении вправо.
[0085] Дополнительно первая абсцисса в первом наборе абсцисс может быть третьей абсциссой. И накопленные значения, относящиеся соответственно к четвертой абсциссе и абсциссе слева и прилегающей к четвертой абсциссе, могут быть больше первого порогового значения, а накопленное значение, относящееся к абсциссе справа и прилегающей к четвертой абсциссе, может быть меньше второго порогового значения.
[0086] Примем в качестве примера, что i=1, так как первая абсцисса x1в первом наборе абсцисс может быть третьей абсциссой X1, терминал может осуществлять поиск в гистограмме, начиная с X1, и в направлении влево для определения первой четвертой абсциссы.
[0087] На шаге 402 четвертая абсцисса может быть определена как вторая абсцисса в i-м наборе абсцисс.
[0088] На шаге 403, если i<n, начиная с четвертой абсциссы на гистограмме, поиск пятой абсциссы можно осуществлять в направлении вправо.
[0089] Если i<n, терминал может определить, что с правой стороны может быть как минимум одно действительное слово, для которого символьная область не определена. В точке терминал может осуществлять поиск, начиная с абсциссы на гистограмме, относящейся к правой границе символьной области действительного слова, определяемой в настоящее время, и в направлении вправо, абсциссы на гистограмме, относящейся к левой границе символьной области следующего действительного слова.
[0090] Наоборот, терминал может осуществлять поиск первой пятой абсциссы, начиная с четвертой абсциссы и в направлении вправо. Накопленные значения, относящиеся соответственно к пятой абсциссе и абсциссе справа и прилегающей к пятой абсциссе, могут быть больше первого порогового значения, а накопленное значение, относящееся к абсциссе слева и прилегающей к пятой абсциссе, может быть меньше второго порогового значения.
[0091] На шаге 404 установить i=i+1, пятая абсцисса может быть определена как первая абсцисса в i-м наборе абсцисс.
[0092] Терминал может определять искомую абсциссу как абсциссу на гистограмме, относящуюся к левой границе символьной области следующего действительного слова. Наоборот, терминал может устанавливать i=i+1 и определять пятую абсциссу как первую абсциссу в i-м наборе абсцисс.
[0093] Начиная отсюда, терминал может продолжить поиск в направлении вправо для определения набора абсцисс, относящихся к символьной области каждого действительного слова согласно способу, представленному выше.
[0094] В варианте осуществления изобретения на фиг. 3А после того, как терминал рассчитает третью абсциссу согласно вышеуказанному режиму расчета, если рассчитанная третья абсцисса будет абсциссой на гистограмме, относящейся к правой границе символьной области последнего действительного слова среди нескольких слов, можно сослаться на фиг. 5. На фиг. 5 шаг 303b может быть заменен на шаги 501-504.
[0095] На шаге 501 для j-го набора абсцисс, начиная со второй абсциссы в j-ом наборе абсцисс на гистограмме, поиск шестой абсциссы можно осуществлять в направлении влево.
[0096] Накопленные значения, относящиеся соответственно к шестой абсциссе и абсциссе справа и прилегающей к шестой абсциссе, могут быть больше первого порогового значения, а накопленное значение, относящееся к абсциссе слева и прилегающей к шестой абсциссе, может быть меньше второго порогового значения, при этом j – это положительное целое число, начальное значение которого n, n – это количество действительных слов среди нескольких слов; вторая абсцисса в n-м наборе абсцисс может быть третьей абсциссой.
[0097] На шаге 502 шестая абсцисса может быть определена как первая абсцисса в j-м наборе абсцисс.
[0098] На шаге 503, если j>0, начиная с шестой абсциссы на гистограмме, поиск седьмой абсциссы можно осуществлять в направлении влево. Накопленные значения, относящиеся соответственно к седьмой абсциссе и абсциссе слева и прилегающей к седьмой абсциссе, могут быть больше первого порогового значения, а накопленное значение, относящееся к абсциссе слева и прилегающей к седьмой абсциссе, может быть меньше второго порогового значения, при этом j – это положительное целое число, начальное значение которого n.
[0099] На шаге 504 при j, установленном как j-1, седьмая абсцисса может быть определена как вторая абсцисса в j-м наборе абсцисс.
[00100] Далее необходимо объяснить, что шаги 501-504 могут быть аналогичными шагам 401-404; разница между ними может состоять в том, что способ, указанный в шагах 401-404, включает поиск, начиная с левой стороны, в правую сторону, в то время как способ, указанный в шагах 501-504, включает поиск, начиная с правой стороны, в левую сторону. Вариант осуществления изобретения не будет здесь подробно описан.
[00101] На основе вышеуказанного варианта осуществления изобретения, см. фиг. 6, перед бинаризацией области слова для получения бинаризованной области слова терминал может выполнить следующие шаги.
[00102] На шаге 601 целевая область изображения может быть бинаризована, таким образом, чтобы получить бинаризованную целевую область изображения.
[00103] Целевая область изображения может быть областью, включающей несколько рядов слов.
[00104] Шаг 601 может быть аналогичным этапу 301 в варианте осуществления изобретения выше, и, таким образом, в подробной технической спецификации могут быть ссылки на него, что не будет ограничено в настоящем варианте осуществления изобретения.
[00105] На шаге 602 горизонтальная гистограмма может быть рассчитана в горизонтальном направлении для бинаризованной целевой области изображения. Горизонтальная гистограмма может включать ординаты пикселей в каждом ряду и накопленное значение пикселей цвета переднего плана для пикселей в каждом ряду.
[00106] Шаг 602 может быть аналогичным шагу 302 в вышеуказанном варианте осуществления изобретения; разница между ними может состоять в том, что на шаге 302 гистограмма может быть рассчитана в вертикальном направлении для бинаризованной области слова, в то время как на шаге 602 гистограмма может быть рассчитана в горизонтальном направлении для бинаризованной целевой области изображения.
На шаге 603 несколько наборов ординат могут быть определены согласно информации распределения накопленных значений в горизонтальной гистограмме; при этом каждый набор ординат может включать первую и вторую ординаты, расположенные ниже первой ординаты. Для каждого набора ординат ряд пикселей, где может находиться первая ордината, может быть определен как верхняя граница ряда слов, и ряд пикселей, где может находиться вторая ордината, может быть определен как нижняя граница ряда слов.
[00107] После расчета горизонтальной гистограммы терминал может определить несколько наборов ординат согласно информации распределения накопленных значений на гистограмме, а затем определить область для каждого ряда согласно каждому из нескольких наборов ординат.
[00108] Шаг может быть аналогичным шагу определения нескольких наборов абсцисс согласно информации распределения накопленных значений в вертикальной гистограмме и последующего определения левой и правой границ каждого слова согласно каждому из нескольких наборов абсцисс. Подробная техническая спецификация может иметь ссылки на вариант осуществления изобретения выше.
[00109] Накопленные значения, относящиеся соответственно к первой ординате и ординате снизу от прилегающей к первой абсциссе, могут быть больше первого порогового значения, а накопленное значение, относящееся к ординате сверху и прилегающей к первой ординате, может быть меньше второго порогового значения; накопленные значения, относящиеся соответственно ко второй ординате и ординате сверху и прилегающей ко второй абсциссе, могут быть больше первого порогового значения, а накопленное значение, относящееся к ординате снизу и прилегающей ко второй абсциссе, может быть меньше второго порогового значения.
[00110] На шаге 604 шаг бинаризации области слова для получения бинаризованной области слова может быть выполнен для k-го ряда в области слова, при этом
[00111] После идентификации всех рядов слов на шаге 603 терминал может выполнить этап бинаризации области слова для получения бинаризованной области слова для каждого ряда слов.
[00112] Таким образом, терминал может идентифицировать символьную область каждого действительного слова в каждом ряду в целевой области изображения.
[00113] В варианте осуществления изобретения выше принято, что терминал может определять область слова согласно горизонтальной гистограмме в качестве примера. Наоборот, терминал может определять область слова другими путями определения. Например, терминал может получать область слова посредством технологии позиционирования изображения. Примем в качестве примера, что область слова может быть номером удостоверения личности гражданина, так как номер удостоверения личности гражданина может находиться в относительно фиксированном положении и относительно далеко от адреса и фотографии над номером удостоверения личности гражданина, терминал может располагаться непосредственно в нижней 1/5 области изображения идентификационных данных и определить обнаруженную область изображения как область слова. Вариант осуществления изобретения не будет этим ограничиваться.
[00114] Варианты осуществления устройства показаны ниже и могут быть выполнены для осуществления вариантов способа данного раскрытия. Подробности, не раскрытые в вариантах осуществления устройства, могут относиться к вариантам осуществления способа данного раскрытия.
[00115] Фиг. 7 представляет собой блок-схему, иллюстрирующую устройство для идентификации области в соответствии с примерным вариантом осуществления изобретения. Как показано на фиг. 7, устройство для идентификации области может включать, но не ограничивается первым модулем бинаризации 710, первым модулем расчета 720 и модулем идентификации области 730.
[00116] Первый модуль бинаризации 710 может быть выполнен с возможностью бинаризации области слова для получения бинаризованной области слова. Область слова может включать несколько слов, принадлежащих к одному ряду.
[00117] Первый модуль расчета 720 может быть выполнен с возможностью расчета гистограммы в вертикальном направлении для бинаризованной области слова. Гистограмма может включать абсциссы пикселей в каждом столбце и накопленное значение пикселей цвета переднего плана для пикселей в каждом столбце.
[00118] Модуль идентификации области 730 может быть сконфигурирован для идентификации символьной области каждого слова в области слова согласно информации распределения накопленных значений на гистограмме.
[00119] Как видно, устройство идентификации области в вариантах осуществления изобретения устраняет проблему низкой точности положения символьной области на предыдущих уровнях техники посредством расчета гистограммы в вертикальном направлении для бинаризованной области слова и определения символьной области каждого слова в области слова согласно информации распределения в гистограмме; в результате может быть получен эффект точного положения символьной области каждого слова согласно информации распределения накопленных значений пикселей цвета переднего плана в гистограмме.
[00120] Фиг. 8 представляет собой блок-схему, иллюстрирующую устройство для идентификации области в соответствии с другим примерным вариантом осуществления изобретения. Как показано на фиг. 8, устройство для идентификации области может включать, но не ограничивается первым модулем бинаризации 810, первым модулем расчета 820 и модулем идентификации области 830.
[00121] Первый модуль бинаризации 810 может быть выполнен с возможностью бинаризации области слова для получения бинаризованной области слова. Область слова может включать несколько слов, принадлежащих к одному ряду.
[00122] Наоборот, первый модуль бинаризации 810 может предварительно обрабатывать область слова, при этом предварительная обработка включает такие операции, как очистка от шумов, фильтрация, разделение границ и аналогичные, и бинаризовать предварительно обработанную область слова.
[00123] Бинаризация означает сравнение значений серого уровня пикселей в области слова с предварительно определенным значением серого уровня; разделение пикселей в области слова на две части: группа пикселей, для каждого из которых значение серого уровня больше предварительно определенного значения серого уровня, и группа пикселей, для каждого из которых значение уровня серого меньше предварительно определенного значения серого уровня; выделение двух групп пикселей в области слова при помощи двух различных цветов, таких как белый и черный, для получения бинаризованной области слова.
[00124] Первый модуль расчета 820 может быть выполнен с возможностью расчета гистограммы в вертикальном направлении для бинаризованной области слова. Гистограмма может включать абсциссы пикселей в каждом столбце и накопленное значение пикселей цвета переднего плана для пикселей в каждом столбце.
[00125] После того, как первый модуль бинаризации 810 бинаризует область слова, первый модуль расчета 820 может рассчитать гистограмму в вертикальном направлении. Горизонтальное направление гистограммы может представлять абсциссы пикселей в каждом столбце, а вертикальное направление гистограммы может представлять накопленное значение нескольких пикселей цвета переднего плана для пикселей в каждом столбце; при этом пиксели цвета переднего плана относятся к пикселям в белой области бинаризованной области слова с учетом пикселей цвета фона.
[00126] Модуль идентификации области 830 может быть сконфигурирован для идентификации символьной области каждого слова в области слова согласно информации распределения накопленных значений на гистограмме.
[00127] При потенциальном применении модуль идентификации области 830 может включать подмодуль определения координаты 831 и подмодуль идентификации области 832.
[00128] Подмодуль определения координат 831 может быть выполнен с возможностью определения нескольких наборов абсцисс согласно информации распределения накопленных значений в гистограмме. Каждый набор абсцисс может включать первую абсциссу и вторую абсциссу, расположенную справа от первой; при этом накопленные значения, относящиеся соответственно к первой абсциссе и абсциссе справа и прилегающей к первой абсциссе, больше первого порогового значения, а накопленное значение, относящееся к абсциссе слева и прилегающей к первой абсциссе, могут быть меньше второго порогового значения; накопленные значения, относящиеся соответственно ко второй абсциссе и абсциссе слева и прилегающей ко второй абсциссе, могут быть больше первого порогового значения, а накопленное значение, относящееся к абсциссе справа и прилегающей ко второй абсциссе, может быть меньше второго порогового значения.
[00129] Подмодуль идентификации области 832 может быть сконфигурирован, чтобы для каждого набора абсцисс определять столбец пикселей, где находится первая абсцисса, как левую границу символьной области, и столбец пикселей, где находится вторая абсцисса, как правую границу символьной области.
[00130] Дополнительно подмодуль определения координат 831 может включать подмодуль идентификации координат 831а и подмодуль поиска координат 831b.
[00131] Подмодуль идентификации координат 831а может быть выполнен с возможностью идентификации третьей абсциссы на гистограмме согласно информации распределения накопленных значений. Третья абсцисса может быть абсциссой на гистограмме, относящейся к левой границе символьной области первого действительного слова среди нескольких слов, или абсцисса на гистограмме, относящаяся к правой границе символьной области последнего действительного слова среди нескольких слов.
[00132] Подмодуль поиска координат 831b может быть выполнен с возможностью поиска нескольких наборов абсцисс, начиная с третьей абсциссы в заранее определенном направлении и основываясь на информации распределения накопленных значений.
[00133] После того как подмодуль идентификации координат 831а идентифицирует третью абсциссу, подмодуль поиска координат 831b может осуществлять поиск нескольких наборов абсцисс, начиная с третьей абсциссы в заранее определенном направлении и основываясь на информации распределения накопленных значений. Если третья абсцисса – это абсцисса на гистограмме, относящаяся к левой границе символьной области первого действительного слова, то заранее определенное направление – это направление вправо; и если третья абсцисса – это абсцисса на гистограмме, относящаяся к правой границе символьной области последнего действительного слова, то заранее определенное направление – это направление влево.
[00134] Несколько наборов абсцисс может относиться к нескольким действительным словам в области слова, т.е. каждый набор абсцисс может включать первую абсциссу на гистограмме, относящуюся к левой границе символьной области одного действительного слова, и вторую абсциссу на гистограмме, относящуюся к левой границе символьной области действительного слова. Другими словами, каждый набор абсцисс может включать первую абсциссу и вторую абсциссу, расположенные справа от первой абсциссы. Накопленные значения, относящиеся соответственно к первой абсциссе и абсциссе справа от прилегающей к первой абсциссе, больше первого порогового значения, а накопленное значение, относящееся к абсциссе слева и прилегающей к первой абсциссе, могут быть меньше второго порогового значения; накопленные значения, относящиеся соответственно ко второй абсциссе и абсциссе слева и прилегающей ко второй абсциссе, могут быть больше первого порогового значения, а накопленное значение, относящееся к абсциссе справа и прилегающей ко второй абсциссе, может быть меньше второго порогового значения.
[00135] Вышеуказанные первое и второе пороговые значения имеют относительно небольшие числовые значения. Например, первое и второе пороговые значения могут иметь числовые значения немного больше 0. И наоборот, первое пороговое значение может быть равным 0, а второе пороговое значение может иметь числовое значение, близкое к 0. Далее на практике накопленные значения, относящиеся соответственно к первой абсциссе и абсциссе справа и прилегающей к первой абсциссе, могут быть равны 0, и накопленное значение, относящееся к абсциссе слева и прилегающей к первой абсциссе, может быть равным 0; накопленные значения, относящиеся соответственно ко второй абсциссе и абсциссе слева и прилегающей ко второй абсциссе, могут быть равны 0, и накопленное значение, относящееся к абсциссе справа и прилегающей ко второй абсциссе, может быть равно 0.
[00136] Наоборот, третья абсцисса может быть абсциссой на гистограмме, относящейся к левой границе символьной области первого слова из нескольких слов.
[00137] Подмодуль поиска координат 831b может быть выполнен с возможностью поиска четвертой абсциссы для i-го набора абсцисс, начиная с первой абсциссы в i-м наборе абсцисс на гистограмме, и в направлении вправо. Накопленные значения, относящиеся соответственно к четвертой абсциссе и абсциссе слева и прилегающей к четвертой абсциссе, могут быть больше первого порогового значения, а накопленное значение, относящееся к абсциссе справа и прилегающей к четвертой абсциссе, может быть меньше второго порогового значения.
[00138] Подмодуль поиска координат 831b может быть выполнен с возможностью определения четвертой абсциссы как второй абсциссы в i-м наборе абсцисс.
[00139] Подмодуль поиска координат 831b может быть выполнен с возможностью поиска пятой абсциссы, начиная с четвертой абсциссы на гистограмме, и в направлении вправо, если i<n. Накопленные значения, относящиеся соответственно к пятой абсциссе и абсциссе справа и прилегающей к пятой абсциссе, могут быть больше первого порогового значения, а накопленное значение, относящееся к абсциссе слева и прилегающей к пятой абсциссе, может быть меньше второго порогового значения.
[00140] Подмодуль поиска координат 831b может быть выполнен с возможностью установки i=i+1 и определения пятой абсциссы как первой абсциссы в i-м наборе абсцисс.
[00141] Подмодуль поиска координат 831b может определять искомую абсциссу как абсциссу на гистограмме, относящуюся к левой границе символьной области следующего действительного слова. Наоборот, подмодуль поиска координат 831b может устанавливать i=i+1 и определять пятую абсциссу как первую абсциссу в i-м наборе абсцисс.
[00142] Начиная отсюда, подмодуль поиска координат 831b может продолжить поиск в направлении вправо для определения набора абсцисс, относящихся к символьной области каждого действительного слова согласно способу, представленному выше.
[00143] Наоборот, третья абсцисса может быть абсциссой на гистограмме, относящейся к правой границе символьной области последних действительных слов среди нескольких слов.
[00144] Подмодуль поиска координат 831b может быть выполнен с возможностью выполнения следующих операций: для j-го набора абсцисс – поиск шестой абсциссы, начиная со второй абсциссы в j-м наборе абсцисс на гистограмме, и в направлении влево; накопленные значения, относящиеся соответственно к шестой абсциссе и абсциссе справа и прилегающей к шестой абсциссе, могут быть больше первого порогового значения, а накопленное значение, относящееся к абсциссе слева и прилегающей к шестой абсциссе, может быть меньше второго порогового значения, при этом j – это положительное целое число, начальное значение которого n, n – это количество действительных слов среди нескольких слов; вторая абсцисса в n-м наборе абсцисс может быть третьей абсциссой; определение шестой абсциссы как первой абсциссы в j-м наборе абсцисс.
[00145] Подмодуль поиска координат 831b может быть выполнен с возможностью поиска седьмой абсциссы, начиная с шестой абсциссы на гистограмме, и в направлении влево, если j>0. Накопленные значения, относящиеся соответственно к седьмой абсциссе и абсциссе слева и прилегающей к седьмой абсциссе, могут быть больше первого порогового значения, а накопленное значение, относящееся к абсциссе слева и прилегающей к седьмой абсциссе, может быть меньше второго порогового значения, при этом j – это положительное целое число, начальное значение которого n.
[00146] Подмодуль поиска координат 831b может быть выполнен с возможностью установки j равным j-1, и определения седьмой абсциссы как второй абсциссы в j-м наборе абсцисс.
[00147] Наоборот, третья абсцисса может быть абсциссой на гистограмме, относящейся к левой границе символьной области первых действительных слов среди нескольких слов.
[00148] Необходимо далее объяснить, что если третья абсцисса – это абсцисса на гистограмме, относящаяся к правой границе символьной области последних действительных слов среди нескольких слов, подмодуль поиска координаты 831b может выполнять шаги, аналогичные тем, когда третья абсцисса – это абсцисса на гистограмме, относящаяся к левой границе символьной области первых действительных слов среди нескольких слов, которые здесь опущены.
[00149] Если несколько слов включают и действительные, и недействительные слова, и первое расстояние между действительным и недействительным словом больше второго расстояния между двумя соседними действительными словами, подмодуль идентификации координат 831a может быть выполнен с возможностью поиска, начиная с предварительно определенной абсциссы на гистограмме и в направлении влево, интервала, являющегося первым интервалом, ширина которого больше второго расстояния; для определения абсциссы справа от интервала, для которой накопленное значение пикселей цвета переднего плана больше первого порогового значения, как третьей абсциссы; при этом предварительно определенная абсцисса может принадлежать предварительно определенному диапазону, заданному согласно эмпирическому значению; накопленное значение пикселей цвета переднего плана в интервале может быть меньше второго порогового значения.
[00150] Наоборот, если все слова в области слова являются действительными, подмодуль идентификации координат 831a может быть выполнен с возможностью определения первой абсциссы с левой стороны гистограммы, для которой накопленное значение пикселей цвета переднего плана больше первого порогового значения, как третьей абсциссы.
[00151] Наоборот, если несколько слов включают и действительные, и недействительные слова, и первое расстояние между действительным и недействительным словом больше второго расстояния между двумя соседними действительными словами, подмодуль идентификации координат 831a может быть выполнен с возможностью поиска, начиная с предварительно определенной абсциссы на гистограмме и в направлении влево, интервала, являющегося первым интервалом, ширина которого больше второго расстояния; для определения абсциссы справа от интервала, для которой накопленное значение пикселей цвета переднего плана больше первого порогового значения, как третьей абсциссы.
[00152] Заранее определенной абсциссой может быть абсцисса в заранее определенном диапазоне, который является областью отображения значений на гистограмме, относящейся к действительным словам в области слова.
[00153] Вышеуказанным принимается, что подмодуль идентификации координат 831a может осуществлять поиск, начиная с заранее определенной абсциссы, и в направлении влево в качестве примера. Аналогично, подмодуль идентификации координат 831a может осуществлять поиск, начиная с заранее определенной абсциссы, в направлении вправо и после поиска интервала больше второго расстояния; и, определять как третью абсциссу, расположенную слева от интервала и для которой накопленное значение пикселей цвета переднего плана больше первого порогового значения. Данный случай не будет проиллюстрирован в варианте осуществления изобретения.
[00154] Наоборот, если все несколько слов являются действительными словами, после расчета гистограммы для бинаризованной области слова, где первая абсцисса в левой части гистограммы, для которой накопленное значение пикселей цвета переднего плана больше первого порогового значения, может быть определена как абсцисса на гистограмме, относящейся к первому действительному значению, подмодуль идентификации координат 831a может определить первую абсциссу в левой части гистограммы, для которой накопленное значение пикселей цвета переднего плана больше первого порогового значения, как третью абсциссу.
[00155] Наоборот, третья абсцисса может быть абсциссой на гистограмме, относящейся к правой границе символьной области последних действительных слов среди нескольких слов.
[00156] Если несколько слов включают и действительные, и недействительные слова, и первое расстояние между действительным и недействительным словом больше второго расстояния между двумя соседними действительными словами, подмодуль идентификации координат 831a может быть выполнен с возможностью поиска, начиная с предварительно определенной абсциссы на гистограмме и в направлении вправо, интервала, ширина которого больше второго расстояния; для определения абсциссы слева от интервала, для которой накопленное значение пикселей цвета переднего плана больше первого порогового значения, как третьей абсциссы; при этом предварительно определенная абсцисса может принадлежать предварительно определенному диапазону, заданному согласно эмпирическому значению; накопленное значение пикселей цвета переднего плана в интервале может быть меньше второго порогового значения.
[00157] Наоборот, если все несколько слов являются действительными, подмодуль идентификации координат 831a может быть выполнен с возможностью определения первой абсциссы с правой стороны гистограммы, для которой накопленное значение пикселей цвета переднего плана больше первого порогового значения, как третьей абсциссы.
[00158] Необходимо далее объяснить, что если третья абсцисса – это абсцисса на гистограмме, относящаяся к правой границе символьной области последних действительных слов среди нескольких слов, подмодуль идентификации координаты 831a может выполнять шаги, аналогичные тем, когда третья абсцисса – это абсцисса на гистограмме, относящаяся к левой границе символьной области первых действительных слов среди нескольких слов, которые здесь опущены.
[00159] Наоборот, устройство может дополнительно включать второй модуль бинаризации 840, второй модуль расчета 850 и модуль определения границы 860.
[00160] Первый модуль бинаризации 840 может быть выполнен с возможностью бинаризации целевой области изображения для получения бинаризованной целевой области изображения.
[00161] Целевая область изображения может быть областью, включающей несколько рядов слов.
[00162] Второй модуль бинаризации 840 может быть аналогичным первому модулю бинаризации 810, и, таким образом, в подробной технической спецификации могут быть ссылки на первый модуль бинаризации 810, что не будет ограничено в настоящем варианте осуществления изобретения.
[00163] Второй модуль расчета 850 может быть выполнен с возможностью расчета горизонтальной гистограммы в горизонтальном направлении для бинаризованной целевой области изображения. Горизонтальная гистограмма может включать ординаты пикселей в каждом ряду и накопленное значение пикселей цвета переднего плана для пикселей в каждом ряду.
[00164] Второй модуль расчета 850 может быть аналогичным первому модулю расчета 820; разница между ними может состоять в том, что первый модуль расчета 820 может рассчитывать гистограмму в вертикальном направлении для бинаризованной области слова, в то время как второй модуль расчета 850 может рассчитывать гистограмму в горизонтальном направлении для бинаризованной целевой области изображения.
[00165] Модуль определения границы 860 может быть выполнен с возможностью определения несколько наборов ординат согласно информации распределения накопленных значений в гистограмме; при этом каждый набор ординат может включать первую и вторую ординаты, расположенные ниже первой ординаты. Для каждого набора ординат ряд пикселей, где может находиться первая ордината, может быть определен как верхняя граница ряда слов, и ряд пикселей, где может находиться вторая ордината, может быть определен как нижняя граница ряда слов. Накопленные значения, относящиеся соответственно к первой ординате и ординате снизу от прилегающей к первой абсциссе, может быть больше первого порогового значения, а накопленное значение, относящееся к ординате сверху и прилегающей к первой ординате, может быть меньше второго порогового значения; накопленные значения, относящиеся соответственно ко второй ординате и ординате сверху и прилегающей ко второй абсциссе, могут быть больше первого порогового значения, а накопленное значение, относящееся к ординате снизу и прилегающей ко второй абсциссе, может быть меньше второго порогового значения.
[00166] После расчета горизонтальной гистограммы в горизонтальном направлении модуль определения границы 860 может определить несколько наборов ординат согласно информации распределения накопленных значений на гистограмме, а затем определить область для каждого ряда согласно каждому из нескольких наборов ординат.
[00167] Первый модуль бинаризации 810 может дополнительно быть выполнен с возможностью бинаризации области слова для k-го ряда в области слова для получения области слова, при этом
[00168] Таким образом, устройство для идентификации области может идентифицировать символьную область каждого действительного слова в каждом ряду в целевой области изображения.
[00169] Как видно, устройство идентификации области в вариантах осуществления изобретения устраняет проблему низкой точности положения символьной области на предыдущих уровнях техники посредством расчета гистограммы в вертикальном направлении для бинаризованной области слова и определения символьной области каждого слова в области слова согласно информации распределения в гистограмме; в результате может быть получен эффект точного положения символьной области каждого слова согласно информации распределения накопленных значений пикселей цвета переднего плана в гистограмме.
[00170] В отношении устройства, описанного в вышеуказанных вариантах осуществления изобретения, определенные способы выполнения различными модулями соответствующих операций подробно описаны в соответствующих вариантах осуществления способа, которые не будут описаны ниже.
[00171] Устройство для идентификации области может быть описано в примерном варианте осуществления изобретения раскрытия. Устройство для идентификации области может реализовывать способ идентификации области, описанный в раскрытии. Устройство идентификации области может включать процессор и память для хранения инструкций, исполняемых процессором.
[00172] Процессор может быть выполнен с возможностью бинаризации области слова, при этом область слова включает несколько слов, принадлежащих к одному ряду; расчета гистограммы в вертикальном направлении для бинаризованной области слова, при этом гистограмма включает абсциссы пикселей в каждом столбце и накопленное значение пикселей цвета переднего плана для пикселей в каждом столбце; идентификации символьной области каждого слова в области слова согласно информации распределения накопленных значений в гистограмме.
[00173] Фиг. 9 представляет собой блок-схему, иллюстрирующую устройство для идентификации области в соответствии с примерным вариантом осуществления изобретения. Например, устройством 900 может быть мобильный телефон, компьютер, цифровой передающий терминал, устройство рассылки сообщений, игровая консоль, планшетный компьютер, медицинское устройство, тренировочное оборудование, карманный персональный компьютер и т. д.
[00174] В соответствии с фиг. 9 устройство 900 может включать в себя следующие компоненты: обрабатывающий компонент 902, память 904, питающий компонент 906, мультимедийный компонент 908, аудио компонент 910, интерфейс ввода-вывода 912, сенсорный компонент 914 и коммуникационный компонент 916.
[00175] Обрабатывающий компонент 902, как правило, управляет всеми операциями, выполняемыми устройством 900, например, операциями, связанными с отображением, телефонными вызовами, передачей данных, функционированием камеры, операциями записи. Обрабатывающий компонент 902 может включать в себя один или несколько процессоров 918 для исполнения инструкций для выполнения одного или нескольких этапов в соответствии с вышеуказанными способами. Кроме того, обрабатывающий компонент 902 может включать в себя один или несколько модулей, способствующих взаимодействию между обрабатывающим компонентом 902 и другими компонентами. Например, обрабатывающий компонент 902 может включать в себя мультимедийный модуль, способствующий взаимодействию между мультимедийным компонентом 908 и обрабатывающим компонентом 902.
[00176] Память 904 может быть выполнена с возможностью хранения различных типов данных для поддержки операций устройства 900. Примеры таких типов данных могут включать в себя инструкции для каких-либо приложений или способов, используемых на устройстве 900, контактные данные, данные телефонной книги, сообщения, изображения, видео и т. д. Память 904 может быть выполнена с возможностью использования любого типа энергозависимых или энергонезависимых устройств или их сочетания, например, Статического Запоминающего Устройства с Произвольной Выборкой СЗУПВ (SRAM), Электрически Стираемого Программируемого Постоянного Запоминающего Устройства ЭСППЗУ (EEPROM), Стираемого Программируемого Постоянного Запоминающего Устройства СППЗУ (EPROM), Программируемого Постоянного Запоминающего Устройства ППЗУ (PROM), Постоянного Запоминающего Устройства ПЗУ (ROM), магнитного запоминающего устройства, флэш-памяти, магнитного или оптического диска.
[00177] Питающий компонент 906 используется для подачи питания на различные компоненты устройства 900. Питающий компонент 906 может включать в себя систему управления питанием, один или несколько источников питания и другие компоненты, связанные с генерацией, управлением и распределением питания устройства 900.
[00178] Мультимедийный компонент 908 может включать в себя экран, обеспечивающий выходной интерфейс между устройством 900 и пользователем. В некоторых вариантах осуществления экран может включать в себя Жидко-Кристаллический Дисплей ЖКД (LCD) и Сенсорную Панель СП (TP). Если экран включает в себя сенсорную панель, возможен вариант осуществления, в котором сенсорный экран используют для получения входных сигналов от пользователя. Сенсорная панель включает в себя один или несколько датчиков касания для обнаружения касаний, скольжений по экрану и жестов на сенсорной панели. Датчики касания выполнены с возможностью определения не только границ, но и продолжительности и давления касания или скольжения. В некоторых вариантах осуществления мультимедийный компонент 908 включает в себя переднюю камеру и/или заднюю камеру. Передняя и задняя камеры могут получать внешние мультимедийные данные, когда устройство 900 находится в рабочем режиме, например, в режиме фотосъемки или видеосъемки. Как передняя, так и задняя камера может быть выполнена в форме фиксированной оптической системы или с возможностью оптической регулировки фокусного расстояния и увеличения.
[00179] Аудио компонент 910 может быть выполнен с возможностью вывода и/или ввода аудио сигналов. Например, аудио компонент 910 включает в себя микрофон ("MIC"), выполненный с возможностью получения внешнего аудио сигнала, когда устройство 900 находится в рабочем режиме, например, в режиме вызова, в режиме записи, в режиме распознавания голосовых данных. Полученный аудио сигнал затем можно хранить в памяти 904 или передавать через коммуникационный компонент 916. В некоторых вариантах осуществления аудио компонент 910 дополнительно включает в себя громкоговоритель для вывода звуковых сигналов.
[00180] Интерфейс ввода-вывода 912 представляет собой интерфейс между обрабатывающим компонентом 902 и периферийными интерфейсными модулями, например, клавиатурой, манипулятором типа Click Wheel, кнопками и т. д. Помимо прочего, кнопки могут включать в себя кнопку "Домой" (Home), кнопку регулировки громкости, пусковую кнопку, блокирующую кнопку.
[00181] Сенсорный компонент 914 включает в себя один или несколько датчиков, обеспечивающих оценку состояния различных аспектов устройства 900. Например, сенсорный компонент 914 может определять открытое/закрытое состояние устройства 900, относительное позиционирование компонентов (например, дисплея и клавиатуры устройства 900), изменение положения устройства 900 или компонента устройства 900, наличие или отсутствие контакта пользователя с устройством 900, ориентацию, ускорение/замедление движения устройства 900 и изменение температуры устройства 900. Сенсорный компонент 914 может включать в себя датчик приближения, выполненный с возможностью обнаружения присутствия объекта поблизости без физического контакта. Сенсорный компонент 914 также может включать в себя датчик освещенности, например, датчик на основе Комплементарного Металл-Оксидного Полупроводника КМОП (CMOS), датчик на основе Прибора с Зарядовой Связью (ПЗС), используемые для работы с изображениями. В некоторых вариантах осуществления изобретения сенсорный компонент 914 также может включать в себя датчик ускорения, гиродатчик, магнитный датчик, датчик давления или датчик температуры.
[00182] Коммуникационный компонент 916 может быть выполнен с возможностью повышения удобства проводной или беспроводной коммуникации между устройством 900 и другими устройствами. Устройство 900 может быть выполнено с возможностью доступа к беспроводной сети на основе стандарта связи, например, Wi-Fi, 2G, 3G или их сочетания. В примерном варианте осуществления изобретения коммуникационный компонент 916 получает раздаваемый сигнал или передаваемую соответствующую информацию от внешней системы управления широковещательной передачей через широковещательный канал. В примерном варианте осуществления изобретения коммуникационный компонент 916 дополнительно включает в себя модуль Коммуникации Ближнего Поля КБП (NFC), способствующий коммуникации малого радиуса действия. Например, модуль КБП может быть выполнен на основе технологии Радиочастотной Идентификации РИ (RFID), технологии ассоциации инфракрасной передачи данных АИПД (IrDA), технологии Сверхширокополосной Передачи СШП (UWB), технологии Bluetooth (BT) и других технологий.
[00183] В примерных вариантах осуществления устройство 900 может быть выполнено с использованием одной или нескольких Интегральных Схем Специального Назначения ИССН (ASIC), Цифровых Сигнальных Процессоров ЦСП (DSP), Устройств Цифровой Обработки Сигналов УЦОС (DSPD), Программируемых Логических Устройств ПЛУ (PLD), Программируемой Пользователем Вентильной Матрицы ППВМ (FPGA), контроллеров, микроконтроллеров, микропроцессоров или других электронных компонентов для осуществления вышеописанных способов.
[00184] В примерных вариантах осуществления изобретения также предлагают энергонезависимый машиночитаемый носитель, включающий в себя инструкции, например, содержащиеся в памяти 904, исполняемые процессором 918 в устройстве 900 для осуществления способов, описанных выше. Например, в качестве энергонезависимого машиночитаемого носителя может использоваться ПЗУ (ROM), Оперативное Запоминающее Устройство ОЗУ (RAM), ПЗУ на компакт-диске (CD-ROM), магнитная лента, дискета, оптическое устройство хранения данных и т. д.
[00185] Другие варианты осуществления изобретения очевидны для специалистов в данной области техники из рассмотрения спецификации и практики использования изобретения, раскрываемого в настоящем документе. Настоящая заявка предназначена для охвата любых вариаций, областей применения или адаптаций изобретения в соответствии с общими принципами, изложенными в заявке, включая отклонения от настоящего изобретения в соответствии с известной или общепринятой практикой в данной области техники. Спецификацию и варианты осуществления рассматривают только в качестве примеров, объем и сущность изобретения по существу ограничивают только формулой изобретения.
[00186] Следует понимать, что раскрытие не ограничивается точной вышеописанной и показанной на рисунках конструкцией, но допускаются различные модификации и изменения без отклонения от объема настоящего изобретения. Объем раскрытия ограничивается только формулой изобретения.
название | год | авторы | номер документа |
---|---|---|---|
СПОСОБ И УСТРОЙСТВО ДЛЯ ИЗВЛЕЧЕНИЯ ОБЛАСТИ ИЗОБРАЖЕНИЯ | 2015 |
|
RU2642404C2 |
СПОСОБ И УСТРОЙСТВО ДЛЯ ИДЕНТИФИКАЦИИ ОБЛАСТИ | 2015 |
|
RU2641449C2 |
СПОСОБ И УСТРОЙСТВО ДЛЯ ИДЕНТИФИКАЦИИ ОБЛАСТИ | 2015 |
|
RU2633184C2 |
СПОСОБ И УСТРОЙСТВО ДЛЯ ИДЕНТИФИКАЦИИ ОБЛАСТИ | 2015 |
|
RU2629537C1 |
Способ бинаризации изображений символов на банкноте на основе гистограммы длины границ | 2019 |
|
RU2718571C1 |
Способ контроля пространственного положения участников спортивного события на игровом поле | 2016 |
|
RU2616152C1 |
ОПРЕДЕЛЕНИЕ НАПРАВЛЕНИЯ СТРОК ТЕКСТА | 2016 |
|
RU2633182C1 |
СПОСОБ ДИАГНОСТИКИ МЕЛАНОМЫ КОЖИ | 2021 |
|
RU2780367C1 |
АВТОМАТИЧЕСКАЯ СЪЕМКА ДОКУМЕНТА С ЗАДАННЫМИ ПРОПОРЦИЯМИ | 2013 |
|
RU2541353C2 |
СПОСОБ И СИСТЕМА УПРАВЛЕНИЯ БАНКОМАТАМИ | 2016 |
|
RU2708422C1 |
Изобретение относится к области обработки изображений. Техническим результатом является повышение точности определения положения символьной области каждого слова. В способе идентификации символьной области в области слова выполняют бинаризацию области слова для получения бинаризованной области слова, при этом область слова включает несколько слов, принадлежащих к одному ряду. Рассчитывают гистограмму в вертикальном направлении для бинаризованной области слова, при этом гистограмма включает абсциссы пикселей в каждом столбце и накопленное значение пикселей цвета переднего плана для пикселей в каждом столбце. Идентифицируют символьную область каждого слова в области слова согласно информации распределения накопленных значений в гистограмме. Причем идентификация включает определение нескольких наборов абсцисс согласно информации распределения накопленных значений на гистограмме и для каждого набора абсцисс определение столбца пикселей, где первая абсцисса является левой границей символьной области, и определение столбца пикселей, где вторая абсцисса является правой границей символьной области. 3 н. и 12 з.п. ф-лы, 16 ил.
1. Способ идентификации символьной области в области слова, включающий:
бинаризацию области слова для получения бинаризованной области слова, при этом область слова включает несколько слов, принадлежащих одному ряду;
расчет гистограммы в вертикальном направлении для бинаризованной области слова, при этом гистограмма включает абсциссы пикселей в каждом столбце и накопленное значение пикселей цвета на переднем плане пикселей в каждом столбце;
идентификацию символьной области каждого слова в области слова согласно информации распределения накопленных значений в гистограмме,
где идентификация включает:
определение нескольких наборов абсцисс согласно информации распределения накопленных значений на гистограмме, при этом каждый из нескольких наборов абсцисс включает первую и вторую абсциссу, расположенные справа от первой абсциссы; при этом накопленные значения, относящиеся соответственно к первой абсциссе и абсциссе справа от прилегающей к первой абсциссе, больше первого порогового значения, а накопленное значение, относящееся к абсциссе слева и прилегающей к первой абсциссе, меньше второго порогового значения; накопленные значения, относящиеся соответственно ко второй абсциссе и абсциссе слева и прилегающей ко второй абсциссе, больше первого порогового значения, а накопленное значение, относящееся к абсциссе справа и прилегающей ко второй абсциссе, меньше второго порогового значения;
для каждого из нескольких наборов абсцисс определение столбца пикселей, где первая абсцисса является левой границей символьной области, и определение столбца пикселей, где вторая абсцисса является правой границей символьной области.
2. Способ по п. 1, где определение нескольких наборов абсцисс согласно информации распределения накопленных значений в гистограмме включает:
определение третьей абсциссы на гистограмме согласно информации распределения накопленных значений, при этом третья абсцисса - это абсцисса на гистограмме, относящаяся к левой границе символьной области первого действительного слова среди нескольких слов, или абсцисса на гистограмме, относящаяся к правой границе символьной области последнего действительного слова среди нескольких слов;
поиск нескольких наборов абсцисс, начиная с третьей абсциссы в заранее определенном направлении и основываясь на информации распределения накопленных значений,
при этом действительное слово представляет собой слово, для которого требуется идентифицировать символьную область.
3. Способ по п. 2, при этом, если третья абсцисса - это абсцисса на гистограмме, относящаяся к левой границе символьной области первого действительного слова среди нескольких слов, поиск нескольких абсцисс, начиная с третьей абсциссы в заранее определенном направлении и основываясь на информации распределения накопленных значений, включает:
для i-го набора абсцисс - поиск четвертой абсциссы, начиная с первой абсциссы в i-м наборе абсцисс в гистограмме и в направлении вправо, при этом накопленные значения, относящиеся соответственно к четвертой абсциссе и абсциссе слева и прилегающей к четвертой абсциссе, больше первого порогового значения, а накопленное значение, относящееся к абсциссе справа и прилегающей к четвертой абсциссе, может быть меньше второго порогового значения; при этом 1≤i≤n, где i - это положительное целое число, начальное значение которого 1, n - это количество действительных слов среди нескольких слов; и первая абсцисса в первом наборе абсцисс - это третья абсцисса;
определение четвертой абсциссы как второй абсциссы в i-м наборе абсцисс;
поиск пятой абсциссы, начиная с четвертой абсциссы в гистограмме и в направлении вправо, если i<n, при этом накопленные значения, относящиеся соответственно к пятой абсциссе и абсциссе справа и прилегающей к пятой абсциссе, больше первого порогового значения, а накопленное значение, относящееся к абсциссе слева и прилегающей к пятой абсциссе, меньше второго порогового значения;
установление i равным i+1, и определение пятой абсциссы как первой абсциссы в i-м наборе абсцисс;
4. Способ по п. 2, при этом, если третья абсцисса - это абсцисса на гистограмме, относящаяся к правой границе символьной области последнего действительного слова среди нескольких слов, поиск нескольких абсцисс, начиная с третьей абсциссы в заранее определенном направлении и основываясь на информации распределения накопленных значений, включает:
для j-го набора абсцисс - поиск шестой абсциссы, начиная со второй абсциссы в j-м наборе абсцисс в гистограмме, и в направлении влево, при этом накопленные значения, относящиеся соответственно к шестой абсциссе и абсциссе справа и прилегающей к шестой абсциссе, больше первого порогового значения, а накопленное значение, относящееся к абсциссе слева и прилегающей к шестой абсциссе, меньше второго порогового значения; при этом 1≤j≤n, где j - это положительное целое число, начальное значение которого n, n - это количество действительных слов среди нескольких слов; и вторая абсцисса в n-м наборе абсцисс - это третья абсцисса;
определение шестой абсциссы как первой абсциссы в j-м наборе абсцисс;
поиск седьмой абсциссы, начиная с шестой абсциссы в гистограмме, и в направлении влево, если j>0, при этом накопленные значения, относящиеся соответственно к седьмой абсциссе и абсциссе слева и прилегающей к седьмой абсциссе, больше первого порогового значения, а накопленное значение, относящееся к абсциссе справа и прилегающей к седьмой абсциссе, меньше второго порогового значения;
установление j равным j-1, и определение седьмой абсциссы как второй абсциссы в j-м наборе абсцисс.
5. Способ по п. 2, при этом, если третья абсцисса - это абсцисса на гистограмме, относящаяся к левой границе символьной области первого действительного слова среди нескольких слов, идентификация третьей абсциссы на гистограмме согласно информации распределения накопленных значений включает:
если несколько слов включают и действительные, и недействительные слова, и первое расстояние между действительным и недействительным словом больше второго расстояния между двумя соседними действительными словами, поиск, начиная с предварительно определенной абсциссы на гистограмме и в направлении влево, интервала, являющегося первым интервалом, ширина которого больше второго расстояния; и определение абсциссы справа от интервала, для которой накопленное значение пикселей цвета переднего плана больше первого порогового значения, как третьей абсциссы; при этом недействительное слово представляет собой слово, для которого не требуется идентифицировать символьную область; предварительно определенная абсцисса может принадлежать предварительно определенному диапазону, заданному согласно эмпирическому значению; накопленное значение пикселей цвета переднего плана в интервале меньше второго порогового значения;
если все несколько слов являются действительными, определение первой абсциссы с левой стороны гистограммы, для которой накопленное значение пикселей цвета переднего плана больше первого порогового значения, как третьей абсциссы.
6. Способ по п. 2, если третья абсцисса - это абсцисса на гистограмме, относящаяся к правой границе символьной области последнего действительного слова среди нескольких слов, идентификация третьей абсциссы на гистограмме согласно информации распределения накопленных значений включает:
если несколько слов включают и действительные, и недействительные слова, и первое расстояние между действительным и недействительным словом больше второго расстояния между двумя соседними действительными словами, поиск, начиная с предварительно определенной абсциссы на гистограмме и в направлении вправо, интервала, ширина которого больше второго расстояния; и определение абсциссы слева от интервала, для которой накопленное значение пикселей цвета переднего плана больше первого порогового значения, как третьей абсциссы; при этом недействительное слово представляет собой слово, для которого не требуется идентифицировать символьную область; предварительно определенная абсцисса может принадлежать предварительно определенному диапазону, заданному согласно эмпирическому значению; накопленное значение пикселей цвета переднего плана в интервале меньше второго порогового значения;
если все несколько слов являются действительными, определение первой абсциссы с правой стороны гистограммы, для которой накопленное значение пикселей цвета переднего плана больше первого порогового значения, как третьей абсциссы.
7. Способ по любому из пп. 1-6, дополнительно включающий:
бинаризацию целевой области изображения для получения бинаризованной целевой области изображения;
расчет в горизонтальном направлении горизонтальной гистограммы для бинаризованной целевой области изображения, при этом горизонтальная гистограмма включает: ординаты пикселей в каждом ряду и накопленное значение пикселей цвета на переднем плане пикселей в каждом ряду;
определение нескольких наборов ординат согласно информации распределения накопленных значений на горизонтальной гистограмме, где каждый из нескольких наборов ординат включает первую и вторую ординату, расположенные под первой ординатой; для каждого из нескольких наборов ординат определение ряда пикселей, при этом первая ордината является верхней границей ряда слов, и определение ряда пикселей, где вторая ордината является нижней границей ряда слов; накопленные значения, относящиеся соответственно к первой ординате и ординате снизу и прилегающей к первой абсциссе, больше первого порогового значения, а накопленное значение, относящееся к ординате сверху и прилегающей к первой ординате, меньше второго порогового значения; накопленные значения, относящиеся соответственно ко второй ординате и ординате сверху и прилегающей ко второй абсциссе, больше первого порогового значения, а накопленное значение, относящееся к ординате снизу и прилегающей ко второй абсциссе, меньше второго порогового значения;
для k-го ряда в области слова выполнение этапа бинаризации области слова, при этом m≥k≥l, k - это положительное целое число, m - это общее количество идентифицированных рядов.
8. Устройство для идентификации символьной области в области слова, включающее:
первый модуль бинаризации, выполненный с возможностью бинаризации области слова для получения бинаризованной области слова, при этом область слова включает несколько слов, принадлежащих одному ряду;
первый модуль расчета, выполненный с возможностью расчета в вертикальном направлении гистограммы для бинаризованной области слова, при этом гистограмма включает абсциссы пикселей в каждом столбце и накопленное значение пикселей цвета на переднем плане пикселей в каждом столбце;
модуля идентификации области, сконфигурированного для идентификации символьной области каждого слова в области слова согласно информации распределения накопленных значений на гистограмме,
где модуль идентификации области включает:
подмодуль определения координат, выполненный с возможностью определения нескольких наборов абсцисс согласно информации распределения накопленных значений на гистограмме, при этом каждый из нескольких наборов абсцисс включает первую и вторую абсциссу, расположенные справа от первой абсциссы; при этом накопленные значения, относящиеся соответственно к первой абсциссе и абсциссе справа от прилегающей к первой абсциссе, больше первого порогового значения, а накопленное значение, относящееся к абсциссе слева и прилегающей к первой абсциссе, меньше второго порогового значения; накопленные значения, относящиеся соответственно ко второй абсциссе и абсциссе слева и прилегающей ко второй абсциссе, больше первого порогового значения, а накопленное значение, относящееся к абсциссе справа и прилегающей ко второй абсциссе, меньше второго порогового значения;
подмодуль идентификации области, выполненный с возможностью идентификации для каждого набора абсцисс столбца пикселей, где находится первая абсцисса, как левой границы символьной области, и столбца пикселей, где находится вторая абсцисса, как правой границы символьной области.
9. Устройство по п. 8, где подмодуль определения координат включает:
подмодуль идентификации координат, выполненный с возможностью определения третьей абсциссы на гистограмме согласно информации распределения накопленных значений, при этом третья абсцисса - это абсцисса на гистограмме, относящаяся к левой границе символьной области первого действительного слова среди нескольких слов, или абсцисса на гистограмме, относящаяся к правой границе символьной области последнего действительного слова среди нескольких слов;
подмодуль поиска координат, выполненный с возможностью поиска нескольких наборов абсцисс, начиная с третьей абсциссы в заранее определенном направлении и основываясь на информации распределения накопленных значений,
при этом действительное слово представляет собой слово, для которого требуется идентифицировать символьную область.
10. Устройство по п. 9, при этом, если третья абсцисса - это абсцисса на гистограмме, относящаяся к левой границе символьной области первого действительного слова среди нескольких слов, подмодуль поиска координат дополнительно имеет возможность:
для i-го набора абсцисс - поиска четвертой абсциссы, начиная с первой абсциссы в i-м наборе абсцисс в гистограмме и в направлении вправо, при этом накопленные значения, относящиеся соответственно к четвертой абсциссе и абсциссе слева и прилегающей к четвертой абсциссе, больше первого порогового значения, а накопленное значение, относящееся к абсциссе справа и прилегающей к четвертой абсциссе, может быть меньше второго порогового значения; при этом 1≤i≤n, где i - это положительное целое число, начальное значение которого 1, n - это количество действительных слов среди нескольких слов; и первая абсцисса в первом наборе абсцисс - это третья абсцисса;
определения четвертой абсциссы как второй абсциссы в i-м наборе абсцисс;
поиска пятой абсциссы, начиная с четвертой абсциссы в гистограмме и в направлении вправо, если i<n, при этом накопленные значения, относящиеся соответственно к пятой абсциссе и абсциссе справа и прилегающей к пятой абсциссе, больше первого порогового значения, а накопленное значение, относящееся к абсциссе слева и прилегающей к пятой абсциссе, меньше второго порогового значения;
установления i равным i+1, и определения пятой абсциссы как первой абсциссы в i-м наборе абсцисс.
11. Устройство по п. 9, при этом, если третья абсцисса - это абсцисса на гистограмме, относящаяся к правой границе символьной области последнего действительного слова среди нескольких слов, подмодуль поиска координат дополнительно имеет возможность:
для j-го набора абсцисс - поиска шестой абсциссы, начиная со второй абсциссы в j-м наборе абсцисс в гистограмме, и в направлении влево, при этом накопленные значения, относящиеся соответственно к шестой абсциссе и абсциссе справа и прилегающей к шестой абсциссе, больше первого порогового значения, а накопленное значение, относящееся к абсциссе слева и прилегающей к шестой абсциссе, меньше второго порогового значения; при этом 1≤j≤n, где j - это положительное целое число, начальное значение которого n, n - это количество действительных слов среди нескольких слов; и вторая абсцисса в n-м наборе абсцисс - это третья абсцисса;
определения шестой абсциссы как первой абсциссы в j-м наборе абсцисс;
поиска седьмой абсциссы, начиная с шестой абсциссы в гистограмме, и в направлении влево, если j>0, при этом накопленные значения, относящиеся соответственно к седьмой абсциссе и абсциссе слева и прилегающей к седьмой абсциссе, больше первого порогового значения, а накопленное значение, относящееся к абсциссе справа и прилегающей к седьмой абсциссе, меньше второго порогового значения;
установления j равным j-1, и определения седьмой абсциссы как второй абсциссы в j-м наборе абсцисс.
12. Устройство по п. 9, при этом, если третья абсцисса - это абсцисса на гистограмме, относящаяся к левой границе символьной области первого действительного слова среди нескольких слов, подмодуль идентификации координат дополнительно имеет возможность:
если несколько слов включают и действительные, и недействительные слова, и первое расстояние между действительным и недействительным словом больше второго расстояния между двумя соседними действительными словами, поиска, начиная с предварительно определенной абсциссы на гистограмме и в направлении влево, интервала, являющегося первым интервалом, ширина которого больше второго расстояния; и определения абсциссы справа от интервала, для которой накопленное значение пикселей цвета переднего плана больше первого порогового значения, как третьей абсциссы; при этом недействительное слово представляет собой слово, для которого не требуется идентифицировать символьную область; предварительно определенная абсцисса может принадлежать предварительно определенному диапазону, заданному согласно эмпирическому значению; накопленное значение пикселей цвета переднего плана в интервале меньше второго порогового значения;
если все несколько слов являются действительными, определения первой абсциссы с левой стороны гистограммы, для которой накопленное значение пикселей цвета переднего плана больше первого порогового значения, как третьей абсциссы.
13. Устройство по п. 9, при этом, если третья абсцисса - это абсцисса на гистограмме, относящаяся к правой границе символьной области последнего действительного слова среди нескольких слов, подмодуль идентификации координат дополнительно имеет возможность:
если несколько слов включают и действительные, и недействительные слова, и первое расстояние между действительным и недействительным словом больше второго расстояния между двумя соседними действительными словами, поиска, начиная с предварительно определенной абсциссы на гистограмме и в направлении вправо, интервала, ширина которого больше второго расстояния; и определения абсциссы слева от интервала, для которой накопленное значение пикселей цвета переднего плана больше первого порогового значения, как третьей абсциссы; при этом недействительное слово представляет собой слово, для которого не требуется идентифицировать символьную область; предварительно определенная абсцисса может принадлежать предварительно определенному диапазону, заданному согласно эмпирическому значению; накопленное значение пикселей цвета переднего плана в интервале меньше второго порогового значения;
если все несколько слов являются действительными, определения первой абсциссы с правой стороны гистограммы, для которой накопленное значение пикселей цвета переднего плана больше первого порогового значения, как третьей абсциссы.
14. Устройство по любому из пп. 8-13, дополнительно включающее:
второй модуль бинаризации, выполненный с возможностью бинаризации целевой области изображения для получения бинаризованной целевой области изображения;
второй модуль расчета, выполненный с возможностью расчета в горизонтальном направлении горизонтальной гистограммы для бинаризованной целевой области изображения, при этом горизонтальная гистограмма включает: ординаты пикселей в каждом ряду и накопленное значение пикселей цвета на переднем плане пикселей в каждом ряду;
модуль определения границы, выполненный с возможностью определения нескольких наборов ординат согласно информации распределения накопленных значений на горизонтальной гистограмме, где каждый из нескольких наборов ординат включает первую и вторую ординату, расположенные под первой ординатой; для каждого из нескольких наборов ординат определения ряда пикселей, при этом первая ордината является верхней границей ряда слов, и определения ряда пикселей, где вторая ордината является нижней границей ряда слов; накопленные значения, относящиеся соответственно к первой ординате и ординате снизу и прилегающей к первой абсциссе, больше первого порогового значения, а накопленное значение, относящееся к ординате сверху и прилегающей к первой ординате, меньше второго порогового значения; накопленные значения, относящиеся соответственно ко второй ординате и ординате сверху и прилегающей ко второй абсциссе, больше первого порогового значения, а накопленное значение, относящееся к ординате снизу и прилегающей ко второй абсциссе, меньше второго порогового значения;
первый модуль бинаризации с дополнительной возможностью для k-го ряда в области слова выполнять бинаризацию области слова, при этом m≥k≥1, где k - это положительное целое число, m - это общее количество идентифицированных рядов.
15. Устройство для идентификации символьной области в области слова, включающее:
процессор;
память для хранения инструкций, исполняемых процессором;
при этом процессор выполнен с возможностью:
бинаризации области слова для получения бинаризованной области слова, при этом область слова включает несколько слов, принадлежащих одному ряду;
расчета гистограммы в вертикальном направлении для бинаризованной области слова, при этом гистограмма включает абсциссы пикселей в каждом столбце и накопленное значение пикселей цвета на переднем плане пикселей в каждом столбце;
идентификации символьной области каждого слова в области слова согласно информации распределения накопленных значений в гистограмме, включающей:
определение нескольких наборов абсцисс согласно информации распределения накопленных значений на гистограмме, при этом каждый из нескольких наборов абсцисс включает первую и вторую абсциссу, расположенные справа от первой абсциссы; при этом накопленные значения, относящиеся соответственно к первой абсциссе и абсциссе справа от прилегающей к первой абсциссе, больше первого порогового значения, а накопленное значение, относящееся к абсциссе слева и прилегающей к первой абсциссе, меньше второго порогового значения; накопленные значения, относящиеся соответственно ко второй абсциссе и абсциссе слева и прилегающей ко второй абсциссе, больше первого порогового значения, а накопленное значение, относящееся к абсциссе справа и прилегающей ко второй абсциссе, меньше второго порогового значения;
для каждого из нескольких наборов абсцисс определение столбца пикселей, где первая абсцисса является левой границей символьной области, и определение столбца пикселей, где вторая абсцисса является правой границей символьной области.
CN 104156704 A, 19.11.2014 | |||
Изложница с суживающимся книзу сечением и с вертикально перемещающимся днищем | 1924 |
|
SU2012A1 |
CN 102184399 A, 14.09.2011 | |||
Многоступенчатая активно-реактивная турбина | 1924 |
|
SU2013A1 |
СПОСОБ РАСПОЗНАВАНИЯ ТЕКСТА С ПРИМЕНЕНИЕМ НАСТРАИВАЕМОГО КЛАССИФИКАТОРА | 2002 |
|
RU2234126C2 |
Авторы
Даты
2017-12-21—Публикация
2015-12-29—Подача