Предпосылки изобретения
Область техники, к которой относится изобретение
[0001] Настоящее изобретение относится к устройству обработки изображений, способу обработки изображений и носителю данных.
Описание предшествующего уровня техники
[0002] В последние годы число цветных печатных документов увеличилось благодаря широкому использованию цветных принтеров, цветных сканеров и т.п., и увеличиваются возможности выполнения сканирования для считывания этих документов и их хранения в виде электронных файлов или их передачи третьим лицам через Интернет. Однако, если данные обрабатываются в полноцветных данных, как есть, нагрузка на устройство хранения или линию является большой, и, следовательно, объем данных должен быть уменьшен путем выполнения обработки сжатия.
[0003] В качестве известных способов сжатия данных цветного изображения существует способ сжатия, в котором цветное изображение преобразуется в двоичное изображение, имеющее псевдо–полутон, с использованием диффузии ошибок или т.п., способ сжатия, в котором цветное изображение преобразуется в формат JPEG, и способ сжатия, в котором цветное изображение преобразуется в цвета 8–битной палитры, и, например, над ним выполняется сжатие ZIP или сжатие LZW.
[0004] В выложенной японской патентной заявке № 2003–8909 раскрыта технология, в которой обнаруживается символьная область, включенная во входное изображение, каждый символ в символьной области преобразуется в двоичное изображение, над которым выполняется сжатие MMR (двоичное сжатие без потерь), и полученные в результате данные сохраняются в виде файла вместе с информацией цвета символа для символа. Кроме того, путем заполнения символа входного изображения цветом окружающей области формируется фоновое изображение, над ним выполняется сжатие JPEG (сжатие с потерями) при уменьшении разрешения, и полученные в результате данные записываются в файл. Когда файл подвергается сжатию с использованием этого способа сжатия, степень сжатия может быть увеличена при сохранении высокого качества символьной области. Кроме того, с помощью способа в японской выложенной патентной заявке № 2003–8909 символы в символьной области разделяются на единичные символы, каждому отдельному символу присваивается одно из значений характерного цвета, которые вычисляются относительно символьной области, и в результате, даже в случае, когда в символьной области присутствуют символы, имеющие множество цветов, могут благоприятно воспроизводиться цвета символов.
[0005] В способе в вышеупомянутой выложенной японской патентной заявке № 2003–8909 гистограммы проекции черных пикселей в направлении основного сканирования и в направлении вспомогательного сканирования формируются с использованием двоичного изображения, полученного путем преобразования в двоичную форму входного изображения. Кроме того, по гистограммам проекции обнаруживаются точки разрыва в направлениях строк и столбцов, и в результате указывается участок для каждого символа (в дальнейшем называемый «участком отсечения символа»). Здесь, когда в многозначном изображении, соответствующем части черных пикселей двоичного изображения на участке отсечения символа присутствует множество цветов, если участок отсечения символа выражается одним характерным цветом, то существуют случаи, когда символ воспроизводится с цветом, отличным от исходного цвета символа.
[0006] Фиг. 11 является схемой для описания известного примера, в котором цвет символов меняется.
[0007] Случаи включают в себя случай, когда черный символ 1102 окружен рамкой 1101 красной окружности перекрывающимся образом, и случай, когда отметка 1103 написана на черном символе 1104, например, красной ручкой или тому подобным. Кроме того, в качестве примера проиллюстрирован случай, когда отметки 1105 и 1107 нарисованы с помощью маркера или т.п. на строке 1106 черных символов. При формировании двоичного изображения из входного изображения на фиг. 11, часть черного символа и часть, где присутствует красная рамка, или то, что нарисовано красной ручкой или маркером, в обоих случаях представлены черными пикселями после преобразования в двоичную форму. Таким образом, черные и красные участки, которые объединены в двоичном изображении, не могут быть отделены из гистограмм проекции, сформированных из двоичного изображения. Что касается двоичного изображения на фиг. 11, участки отсечения символа формируются, как указано ссылочными позициями 1108, 1109 и 1110. В этом случае в многозначном изображении, соответствующем части черных пикселей, на одном участке отсечения символа присутствует множество цветов. Поэтому, если один характерный цвет назначается каждому участку отсечения символа, один цвет назначается одной символьной области, и, следовательно, формируется изображение символа, цвет которого отличается от исходных цветов символа, как описано выше.
Сущность изобретения
[0008] Аспектом настоящего изобретения является устранение вышеупомянутой проблемы с традиционной технологией.
[0009] Особенность настоящего изобретения состоит в предоставлении технологии, в которой при преобразовании символьной области в двоичную форму назначается характерный цвет и воспроизводится цвет символа, при этом цвет символа не изменяется по сравнению с исходными цветами при воспроизведении.
[0010] Согласно первому аспекту настоящего изобретения, предложено устройство обработки изображений, содержащее: блок преобразования, выполненный с возможностью преобразовывать многозначное изображение в двоичное изображение; первый блок определения, выполненный с возможностью определять на двоичном изображении символьные области и несимвольные области; блок отсечения символа, выполненный с возможностью извлекать участки с единичным символом из области, определенной первым блоком определения как символьная область; второй блок определения, выполненный с возможностью определять, является ли каждый из участков с единичным символом областью символа или областью не символа; блок формирования, выполненный с возможностью извлекать из многозначного изображения, включенного в участок с единичным символом, для каждого из участков с единичным символом, которые были определены вторым блоком определения как символьная область, первый характерный цвет и формировать двоичное изображение участка с единичным символом, соответствующее первому характерному цвету; блок принятия решения, выполненный с возможностью осуществлять выбор второго характерного цвета, ближайшего к цвету целевого пикселя, путем сравнения первого характерного цвета с цветом целевого пикселя на участке с единичным символом; и блок изменения, выполненный с возможностью заменять двоичное изображение участка с единичным символом, соответствующее первому характерному цвету, сформированное блоком формирования, на двоичное изображение второго характерного цвета, выбранного блоком принятия решения.
[0011] Согласно второму аспекту настоящего изобретения, предоставлен способ обработки изображений, содержащий: преобразование многозначного изображения в двоичное изображение; определение символьной области и несимвольной области на двоичном изображении; извлечение участков с единичным символом из области, определенной как символьная область; определение, является ли каждый из участков с единичным символом областью символа или областью не символа; извлечение из многозначного изображения, включенного в участок с единичным символом, для каждого из участков с единичным символом, которые были определены как области символа, первого характерного цвета и формирование двоичного изображения участка с единичным символом, соответствующее первому характерному цвету; осуществление выбора второго характерного цвета, ближайшего к цвету целевого пикселя, путем сравнения первого характерного цвета с цветом целевого пикселя на участке с единичным символом; и замена сформированного двоичного изображения участка с единичным символом, соответствующее первому характерному цвету, на двоичное изображение выбранного второго характерного цвета.
[0012] Дополнительные признаки настоящего изобретения станут очевидны из последующего описания примерных вариантов осуществления со ссылкой на приложенные чертежи.
Краткое описание чертежей
[0013] Сопровождающие чертежи, которые включены в и составляют часть спецификации, иллюстрируют варианты осуществления изобретения и вместе с описанием служат для объяснения принципов изобретения.
[0014] Фиг. 1 представляет собой схему для описания общей конфигурации системы, включающей устройство обработки изображения в соответствии с первым вариантом осуществления настоящего изобретения.
[0015] Фиг. 2 представляет собой функциональную блок–схему, иллюстрирующую функциональную конфигурацию блока обработки сжатия блока сжатия/восстановления в соответствии с первым вариантом осуществления.
[0016] Фиг. 3 представляет собой блок–схему для описания конфигурации для восстановления сжатых данных в формате PDF, которые были переданы от другого устройства с помощью блока сжатия/восстановления в соответствии с первым вариантом осуществления.
[0017] Фиг. 4 представляет собой блок–схему последовательности операций для описания обработки от считывания документа до формирования файла в устройстве обработки изображений в соответствии с первым вариантом осуществления.
[0018] Фиг. 5 представляет собой блок–схему последовательности операций для описания обработки сжатия данных изображения с помощью блока сжатия/восстановления, который показан на этапе S405 на фиг. 4.
[0019] Фиг. 6 представляет собой блок–схему последовательности операций для описания обработки для коррекции цвета символа с помощью модуля коррекции цвета символа на этапе S509 на фиг. 5.
[0020] Фиг. 7 представляет собой схему для описания конкретного примера обработанных результатов модуля преобразования в двоичную форму (бинаризации), модуля определения области и модуля отсечения символа блока сжатия/восстановления в соответствии с первым вариантом осуществления.
[0021] Фиг. 8А–8С представляют собой схемы для описания примера, в котором двоичные изображения классифицируются по характерным цветам, извлеченным модулем извлечения характерного цвета в соответствии с первым вариантом осуществления, и хранятся в буфере изображений.
[0022] Фиг. 9А–9С представляют собой схемы для описания примера, в котором, после того как модуль коррекции цвета символа в соответствии с первым вариантом осуществления выполнил обработку коррекции в отношении цвета символа, двоичные изображения классифицируются по отношению к характерным цветам и сохраняются в буфере изображения.
[0023] Фиг. 10А–10С представляют собой схемы для описания примера обработки для коррекции цвета символа, выполняемого модулем коррекции цвета символа в соответствии с первым вариантом осуществления.
[0024] Фиг. 11 представляет собой схему для описания примера традиционной технологии, в котором цвет символа изменяется.
[0025] Фиг. 12 представляет собой блок–схему последовательности операций для описания обработки в отношении одного участка отсечения символа, выполняемой модулем определения области в соответствии со вторым вариантом осуществления.
[0026] Фиг. 13 представляет собой блок–схему последовательности операций для описания обработки для коррекции цвета символа с помощью модуля коррекции цвета символа в соответствии со вторым вариантом осуществления на этапе S509 на фиг. 5.
[0027] Фиг. 14 представляет собой схему для описания конкретного примера определения области в вариантах осуществления.
Описание вариантов осуществления
[0028] Варианты осуществления настоящего изобретения будут подробно описаны здесь со ссылкой на прилагаемые чертежи. Следует понимать, что последующие варианты осуществления не предназначены для ограничения формулы настоящего изобретения и что не все из сочетаний аспектов, которые описываются согласно последующим вариантам осуществления, обязательно требуются относительно средства решения проблем согласно настоящему изобретению.
[0029] Первый вариант осуществления
Фиг. 1 представляет собой схему для описания общей конфигурации системы, включающей устройство обработки изображения в соответствии с первым вариантом осуществления настоящего изобретения.
[0030] Устройство обработки изображений представляет собой многофункциональное периферийное устройство, которое включает в себя, например, блок 100 управления, сканер 115, принтер 116 и консольный блок 117. Блок 100 управления соединен со сканером 115, который считывает документ и вводит его данные изображения в блок 100 управления, и принтер 116, который печатает изображение, соответствующее данным изображения. Кроме того, блок 100 управления сообщается с главным компьютером 119 через LAN 118 и принимает и выводит данные изображения и информацию об устройстве. CPU 103 (ЦП – центральный процессор) функционирует в качестве контроллера, который выполняет общее управление устройством обработки изображений. RAM 104 (ОЗУ - оперативное запоминающее устройство) используется в качестве временной памяти для управляющих данных или рабочей памяти под управлением CPU 103. ROM 105 (ПЗУ - постоянное запоминающее устройство) хранит программу, подлежащую выполнению с помощью CPU 103 и т.п. HDD 106 является жестким диском и хранит системное программное обеспечение, данные изображений и т.п. CPU 103 управляет операциями устройства обработки изображений, выполняя программу загрузки, хранящуюся в ROM 105, развертывая программу, хранящуюся на жестком диске 106, в RAM 104 и выполняя эту программу. Интерфейс 107 консольного блока является интерфейсным блоком с консольным блоком 117 и выводит на консольный блок 117 данные изображения, подлежащие отображению консольным блоком 117. Кроме того, интерфейс 107 консольного блока передает информацию, введенную пользователем, используя консольный блок 117, в CPU 103. Пользователь может вводить различные типы инструкций в устройство обработки изображений, управляя консольным блоком 117. Например, пользователь назначает пункт назначения, в который должны передаваться данные, различные настройки передачи (такие как разрешение и степень сжатия) и формат данных (например, JPEG/TIFF/PDF/PDF с высокой степенью сжатия).
[0031] В первом варианте осуществления описан случай, в котором цвет символа корректируется в технологии сжатия цветного изображения, и поэтому в качестве примера будет описан случай, где в качестве формата данных обозначен PDF с высокой степенью сжатия. Подробности технологии PDF с высокой степенью сжатия будут описаны позже. Интерфейс 108 сети подключен к LAN 118 и принимает и выводит информацию. Вышеописанные составляющие элементы расположены на системной шине 101.
[0032] Интерфейс 110 шины изображения представляет собой шинный мост, который соединяет системную шину 101 с шиной 102 изображения, которая передает данные изображения с высокой скоростью и преобразует структуру данных. Шина 102 изображения является высокоскоростной шиной, такой как шина PCI или IEEE1394. Интерфейс 111 устройства соединяет сканер 115 и принтер 116 с блоком 100 управления и выполняет преобразование между синхронной и асинхронной системами.
[0033] Блок 112 обработки входного изображения выполняет обработку изображения, такую как обработка коррекции затенения, обработка гамма–коррекции, обработка коррекции смещения цвета, обработка преобразования цвета и обработка фильтрации для данных изображения, введенных из сканера 115. Блок 113 обработки выходного изображения выполняет обработку изображения, такую как обработка преобразования цвета и обработка псевдо–полутонов на данных растрового изображения, выводимого на принтер 116. Блок 114 сжатия/восстановления формирует описанные ниже сжатые данные 220 в формат PDF (фиг. 2) путем выполнения обработки PDF с высокой степенью сжатия. Сформированные сжатые данные 220 передаются в назначенный пункт назначения (например, главный компьютер 119) через интерфейс 108 сети и LAN 118. Кроме того, блок 114 сжатия/восстановления также может выполнять восстановление сжатых данных, принятых через интерфейс 108 сети и LAN 118. Восстановленные данные изображения, подвергнутые обработке изображения, выполняемой блоком 113 обработки выходного изображения, передаются для печати на принтер 116 через интерфейс 111 устройства. Детали блока 114 сжатия/восстановления будут описаны позже.
[0034] Сканер 115 преобразует информацию изображения документа в электрический сигнал путем экспонирования–сканирования изображения на документе светом, излучаемым лампой освещения, и ввода отраженного света в линейный датчик изображения (датчик CCD). Сканер 115 дополнительно преобразует электрический сигнал в сигналы яркости R, G и B и выводит сигналы яркости на блок 100 управления в качестве данных изображения через интерфейс 111 устройства. Принтер 116 принимает данные изображения, созданные в заданном формате изображения, из блока 100 управления и выполняет печать на листе переноса, подаваемом из блока подачи (не показан). Здесь изображение печатается на листе для записи, который является материалом для переноса, например, путем обработки зарядки, экспонирования, проявления, переноса и закрепления.
[0035] Далее, конфигурация блока обработки сжатия изображения и блока обработки восстановления изображения, которые реализуются с помощью блока 114 сжатия/восстановления в соответствии с первым вариантом осуществления, будут описаны со ссылкой на фиг. 2 и 3. В первом варианте осуществления функции блока 114 сжатия/восстановления реализуются с помощью CPU 103, исполняющего программу, развернутую в RAM 104 с HDD 106. В качестве альтернативы, некоторые или все функции блока 114 сжатия/восстановления могут быть реализованы аппаратными средствами, такими как ASIC (специализированная интегральная микросхема).
[0036] Как описано выше, блок 114 сжатия/восстановления выполняет обработку PDF с высокой степенью сжатия. Здесь PDF с высокой степенью сжатия – это технология сжатия цветных и монохромных многозначных изображений. В PDF с высокой степенью сжатия определение области выполняется на данных изображения, и данные изображения сжимаются с помощью адаптивного переключения между двоичным сжатием без потерь MMR и сжатием с потерями JPEG в соответствии с атрибутами каждой области. При этом возможно сжатие, при котором степень сжатия может быть увеличена и может быть получено высококачественное изображение относительно символьной области.
[0037] Фиг. 2 представляет собой функциональную блок–схему для описания функциональной конфигурации блока обработки сжатия блока 114 сжатия/восстановления в соответствии с первым вариантом осуществления. Здесь PDF с высокой степенью сжатия формируется путем сжатия данных входного изображения. Здесь будет дано описание в предположении, что данные изображения, подлежащие введению в модуль 114 сжатия/восстановления, являются данными изображения, которые были получены путем считывания документа с использованием сканера 115 и были подвергнуты обработке, выполняемой блоком 112 обработки входного изображения. Также соответствующим образом во время описания делаются ссылки на фиг. 7. Следует отметить, что, когда функции блока 114 сжатия/восстановления реализуются с помощью CPU 103, выполняющего программу, функции функциональных модулей, показанных на фиг. 2, реализуются с помощью CPU 103, выполняющего программу.
[0038] Фиг. 7 представляет собой схему для описания конкретного примера обработанных результатов модуля 202 преобразования в двоичную форму, модуля 203 определения области и модуля 204 отсечения символа блока 114 сжатия/восстановления в соответствии с первым вариантом осуществления.
[0039] Модуль 202 преобразования в двоичную форму формирует двоичное изображение из входного изображения 201, которое является многозначным изображением. В двоичном изображении пиксель высокой оптической плотности во входном изображении, оптическая плотность которого составляет пороговое значение или более, является, например, черным пикселем, а пиксель, оптическая плотность которого меньше порогового значения, является, например, белым пикселем. Конечно, результат преобразования в двоичную форму может быть выражен другими цветами вместо черного и белого или числами 1 и 0 вместо цветов. Кроме того, пороговое значение может быть фиксированным значением (например, 128 в 8–битных данных), или может использоваться способ, в котором из многозначного изображения формируется гистограмма и рассчитывается оптимальное пороговое значение для разделения между частями символов и частями не символов.
[0040] Здесь, когда входное изображение 201 представляет собой изображение, обозначенное ссылочной позицией 701 на фиг. 7, например, двоичное изображение, подвергнутое преобразованию в двоичную форму, является изображением, обозначенным ссылочной позицией 702.
[0041] На входном изображении 701 обозначенные ссылочной позицией 711 объекты являются красными, а черный символ «А» в строке 712 символов обведен красным кружком. Также предполагается, что «BCDEFGH» в строке 712 символов являются черными символами. Следует отметить, что, когда входное изображение 201 является многозначным цветным изображением, выполняется преобразование в двоичную форму относительно яркости (например, Y из YUV) многозначного изображения.
[0042] Модуль 203 определения области обнаруживает из двоичного изображения, сформированного модулем 202 преобразования в двоичную форму, символьные области, которые могут включать в себя символ, и несимвольные области, которые не включают в себя символ. Здесь краткая схема будет описана с использованием фиг. 14.
[0043] Фиг. 14 представляет собой схему для описания конкретного примера определения области в первом варианте осуществления.
[0044] (1) Кластер из черных пикселей (кластер черных пикселей) извлекается путем отслеживания контура черных пикселей относительно двоичного изображения. При отслеживании контура определяется, продолжаются ли черные пиксели в одном из восьми направлений, а именно в верхнем, верхнем левом, левом, нижнем левом, нижнем, нижнем правом, правом и верхнем правом направлениях. Например, на фиг. 14 (1) извлекается кластер черных пикселей, окруженный рамкой 1400.
[0045] (2) Если кластер черных пикселей, размер которого превышает определенный размер, присутствует в извлеченном кластере черных пикселей, то указывается, присутствует ли кластер белых пикселей в области. Таким образом, кластер белых пикселей извлекается путем отслеживания контура из белых пикселей внутри области кластера черных пикселей. Например, кластер белых пикселей извлекается путем отслеживания контура из белых пикселей внутри рамки на фиг. 14 (2). Кроме того, если размер извлеченного кластера белых пикселей превышает определенный размер, кластер черных пикселей снова извлекается путем отслеживания контура черных пикселей внутри кластера белых пикселей. Например, кластер черных пикселей извлекается путем отслеживания контура из части черного символа на фиг. 14 (2). Эти этапы обработки многократно выполняются, пока размер кластера пикселей не уменьшится ниже определенного размера. Эта обработка выполняется, чтобы извлекать, например, символьную область внутри области, окруженной рамкой 1400.
[0046] (3) Полученный кластер черных пикселей классифицируется в один из символа и не символа, используя по меньшей мере одно из размера, формы и плотности черных пикселей. Например, если кластер черных пикселей имеет соотношение сторон, близкое к единице, и размер в заданном диапазоне, как символ на фиг. 14 (3), то можно определить, что кластер черных пикселей представляет собой кластер черных пикселей, который представляет собой символ. Кроме того, определяется, что оставшаяся часть кластера черных пикселей является кластером пикселей, который составляет не символ.
[0047] (4) Если расстояние между крайними частями кластеров черных пикселей, каждый из которых составляет символ, является небольшим, кластеры черных пикселей классифицируются в одну и ту же группу. Затем ограниченная прямоугольная область 1401, которая включает в себя все кластеры черных пикселей, которые были классифицированы в одну и ту же группу, определяется как символьная область. Например, если расстояния между символами являются небольшими, как показано на фиг. 14 (4), то строка символов «ABC» определяется как одна символьная область. Следует отметить, что, если другой кластер черных пикселей, который составляет символ, не присутствует в заданном диапазоне расстояний, кластер черных пикселей, который составляет символ, сам составляет одну группу. Следовательно, ограниченная прямоугольная область единого кластера черных пикселей определяется как символьная область. Следует отметить, что предполагается, что обработка, аналогичная обработке, описанной в пункте (4), выполняется на кластере черных пикселей, который составляет не символ.
[0048] Положение каждой области, полученной таким образом, и информация определения атрибута (символ или не символ) каждой из областей выводятся в качестве результата определения.
[0049] В результате обработки в вышеописанных пунктах (1)–(4), когда двоичное изображение, вводимое в модуль 203 определения области, представляет собой двоичное изображение 702 на фиг. 7, выводится результат определения, обозначенный ссылочной позицией 703 на фиг. 7. Таким образом, выводится результат определения, в котором области 713 и 715 определяются как символьные области, которые, весьма вероятно, включают в себя символ, а область 714 определяется как несимвольная область, которая не включает в себя символ. Описание модуля 203 определения области является таким, как описано выше.
[0050] Модуль 204 отсечения символа выполняет обработку для отсечения прямоугольника отсечения символа относительно каждой из символьных областей, определенных модулем 203 определения области. Здесь результат, полученный путем выполнения отсечения символа относительно областей 713 и 715, которые были определены как символьные области модулем 203 определения области, как обозначено ссылочной позицией 703 на фиг. 7, показан с обозначением ссылочной позицией 704. Результат отсечения обозначен ссылочными позициями 716, 717, 718, 719 и 720. Обработка отсечения включает в себя следующие этапы обработки.
[0051] (1) Выбирается одна из символьных областей (например, область 713).
[0052] (2) Выполняется проекция в поперечном направлении одного двоичного изображения, указанного символьной областью. В частности, подсчитывается число черных пикселей на линии, проходящей в поперечном направлении, и результатом подсчета является проекция. Выполненная проекция обозначена ссылочной позицией 705. На проекции 705 линии, непрерывные в продольном направлении, на каждой из которых число черных пикселей превышает пороговое значение Th_hm, образуют одну группу. Эта группа обозначена ссылочной позицией 706. В результате, что касается символьной области 713, была сформирована одна группа.
[0053] (3) Относительно этой группы выполняется проекция в продольном направлении. В частности, подсчитывается число черных пикселей, которые присутствуют в продольном направлении, и результатом подсчета является проекция. Полученная таким образом проекция обозначена ссылочной позицией 707.
[0054] (4) В проекции 707, полученной в пункте (3), линии, непрерывные в поперечном направлении, на каждой из которых число черных пикселей превышает пороговое значение Th_hs, образуют одну группу. Эта группа обозначена ссылочной позицией 708. Например, в проекции 707 сформировано шесть групп. Эти шесть групп соответственно составлены символами S, A, M, P, L и E.
[0055] (5) Ограниченный прямоугольник каждой группы линий, полученных в пункте (4), отсекается как участок отсечения символа. В результате ограниченный прямоугольник каждого символа отсекается, например, как участок отсечения символа. Описанные прямоугольники, обозначенные ссылочной позицией 716, получаются путем отсечения.
[0056] (6) Обработка вышеописанных пунктов (1)–(5) повторяется до тех пор, пока не останется ни одной символьной области, которая не была выбрана. При обработке пунктов (1)–(6) выводятся результаты 716, 717, 718, 719 и 720 участков отсечения символа. Описание модуля 204 отсечения символа такое же, как описано выше.
[0057] Модуль 205 определения области определяет, является ли символом изображение символа на каждом участке отсечения символа, который был отсечен модулем 204 отсечения символа, на участке отсечения единичного символа. Здесь, например, является ли символом изображение символа, определяется на основе плотности черных пикселей внутри участка отсечения символа. Например, в случае символа, между строками, которые составляют символ, есть промежутки. Следовательно, присутствует определенное количество белых пикселей. С другой стороны, в случае не символа, большинство пикселей внутри участка отсечения символа во многих случаях являются черными. Следовательно, определяется, что, если плотность черных пикселей больше, чем пороговое значение, изображение является не символом, и, если плотность черных пикселей меньше, чем пороговое значение, изображение является символом. Кроме того, помимо этого способа, определение может быть сделано на основе соотношения сторон (аспектного отношения) участка отсечения символа. Кроме того, модуль 205 определения области корректирует информацию символьной области, сформированную модулем 203 определения области, и информацию участка отсечения символа, сформированную модулем 204 отсечения символа, на основе информации участка отсечения символа, который был определен как не символ с помощью модуля 203 определения области. Т.е. информация о символьной области, определенной как не символ модулем 205 определения области, удаляется из информации о символьной области, сформированной модулем 203 определения области, и информации участка отсечения символа, сформированной модулем 204 отсечения символа.
[0058] Модуль 206 уменьшения формирует уменьшенное многозначное изображение путем выполнения обработки уменьшения (обработки уменьшения разрешения) для входного изображения 201. В первом варианте осуществления входное изображение имеет разрешение 300 точек на дюйм и выполняется обработка для уменьшения разрешения до 150 точек на дюйм.
[0059] Модуль 207 извлечения характерного цвета задает позиции пикселей (черные пиксели), которые составляют каждый символ на двоичном изображении, на основе информации о символьной области, скорректированной модулем 205 определения области, и информации прямоугольной области отсечения символа. Кроме того, модуль 207 извлечения характерного цвета вычисляет характерный цвет символа на участке отсечения единичного символа, обращаясь к цветам соответствующих позиций на уменьшенном многозначном изображении, на основе указанных позиций пикселя символа и получает информацию цвета символа для каждого символа. Кроме того, модуль 207 извлечения характерного цвета объединяет двоичные изображения одного и того же характерного цвета и формирует буфер изображения для каждого характерного цвета. Характерный цвет рассчитывается путем выполнения усреднения или взвешенного усреднения по цветам многозначного изображения, соответствующего группе пикселей, которые стали черными на двоичном изображении на участке отсечения символа. Альтернативно, характерным цветом является цвет, частота которого является самой высокой в такой группе пикселей. Возможны различные способы получения характерного цвета, но цвет в многозначном изображении по меньшей мере одного пикселя из группы пикселей, которые стали черными на двоичном изображении на участке отсечения символа, используется для вычисления характерного цвета. В первом варианте осуществления будет описан пример, в котором характерный цвет вычисляется путем усреднения.
[0060] Также в первом варианте осуществления многозначное изображение относится к уменьшенному многозначному изображению, но может относиться к многозначному изображению входного изображения.
[0061] Далее результат обработки, выполняемой модулем 207 извлечения характерного цвета, будет описан со ссылкой на фиг. 7 и 8A–8C.
[0062] Изображение 701, показанное на фиг. 7, является примером входного изображения 201, и каждая ссылочная позиция 716, 717, 718, 719 и 720 на изображении 704 указывает на участок отсечения символа, формируемый модулем 204 отсечения символа. Пример буферов изображения, полученных путем классификации двоичных изображений этих участков отсечения символа относительно характерного цвета, извлеченного модулем 207 извлечения характерного цвета, показан на фиг. 8A–8C.
[0063] Фиг. 8А–8С представляют собой схемы для описания примера, в котором двоичные изображения классифицируются по характерным цветам, извлеченным модулем 207 извлечения характерного цвета, в соответствии с первым вариантом осуществления и сохраняются в буферах изображения.
[0064] На фиг. 8А показан вид, иллюстрирующий группу участков отсечения символа, характерный цвет которых был определен как (R,G,B) = (20, 20, 20). На фиг. 8B показан вид, иллюстрирующий группу участков отсечения символа, характерный цвет которых был определен как (R,G,B) = (255,32,32). Кроме того, на фиг. 8С показан вид, иллюстрирующий группу прямоугольных участков отсечения символа, характерный цвет которых был определен как (R,G,B) = (98,24,24).
[0065] Обнаруженный участок отсечения символа на фиг. 8C является областью во входном изображении 701, в которой черный символ A окружен красной окружностью. Обработка преобразования в двоичную форму, выполняемая модулем 202 преобразования в двоичную форму, является пороговой обработкой, и поэтому часть с высокой плотностью должна быть составлена черными пикселями. Следовательно, что касается черного символа A, окруженного красной окружностью на входном изображении 701, части и черного символа A, и красной окружности преобразуются в черные пиксели путем обработки преобразования в двоичную форму. В этом случае, поскольку части черного символа A и красной окружности соединены в двоичном изображении, подвергнутом преобразованию в двоичную форму, эти части не могут быть отделены обработкой, выполняемой модулем 204 отсечения символа. В этом случае многозначное изображение, соответствующее черным пикселям внутри участка отсечения одного символа, содержит значения цвета как черного, так и красного. Следовательно, модуль 207 извлечения характерного цвета определяет характерный цвет путем вычисления среднего значения многозначного изображения, соответствующего части черного пикселя, и определяет цвет, подлежащий использованию, когда должна воспроизводиться часть черного пикселя внутри участка отсечения символа. Здесь, когда присутствуют оба, и черный, и красный цвета, его среднее значение указывает на коричневый цвет, и часть символа А, которая изначально черная, и часть красной окружности, которая изначально красная, должны быть воспроизведены в коричневом цвете.
[0066] Следовательно, в первом варианте осуществления исключается случай, когда цвет символа воспроизводится цветом, отличающимся от исходного цвета, путем коррекции характерного цвета, извлеченного модулем 207 извлечения характерного цвета, так, чтобы он представлял характерный цвет, который является близким к значению цвета входного изображения. Способ коррекции характерного цвета будет описан позже.
[0067] Модуль 208 заполнения области символа определяет позиции пикселей (черных пикселей), которые составляют каждый символ на двоичном изображении, на основе информации области символа, сформированной модулем 205 определения области. Также модуль 208 заполнения области символа выполняет обработку для заполнения пикселей в соответствующих позициях в уменьшенном многозначном изображении с периферийным цветом, основываясь на указанных позициях пикселей. Здесь в качестве периферийного цвета используется среднее значение из значений пикселей для пикселей, окружающих символ, и значения пикселей для пикселей символа могут быть заменены полученным периферийным цветом.
[0068] Модуль 209 коррекции цвета символа корректирует информацию цвета символа на основе информации участка отсечения символа, скорректированной модулем 205 определения области, характерных цветов соответствующих участков отсечения символа, сформированных модулем 207 извлечения характерного цвета, и уменьшенного многозначного изображения, сформированного с помощью модуля 206 уменьшения. Подробности модуля 209 коррекции цвета символов будут описаны позже.
[0069] Модуль 210 сжатия MMR выполняет сжатие MMR для двоичного изображения для каждого характерного цвета, сформированного модулем 209 коррекции цвета символов, и формирует код 1 сжатия, как показано ссылочной позицией 221.
[0070] Модуль 211 сжатия JPEG выполняет сжатие JPEG для многозначного изображения, подвергнутого обработке заполнения, выполняемой модулем 208 заполнения области символа, и формирует код сжатия 2, как показано ссылочной позицией 224.
[0071] Таким образом, файл сжатых данных 220, включающий в себя код 1 сжатия, информацию 222 области символа, информацию 223 цвета символов и код 2 сжатия, которые были получены из соответствующих составляющих элементов, формируется в формате PDF. Сформированный файл в формате PDF должен быть передан в пункт назначения, указанный пользователем, как описано выше.
[0072] Фиг. 3 представляет собой блок–схему для описания конфигурации для восстановления сжатых данных в формате PDF, которые были передан от другого устройства, с помощью блока 114 сжатия/восстановления в соответствии с первым вариантом осуществления. Обработка на фиг. 3 выполняется, когда печать должна быть выполнена путем восстановления сжатых данных или т.п. Здесь в качестве примера будет описан случай, когда сжатые данные, передаваемые с главного компьютера 119, имеют формат файла, который является таким же, как вышеописанные сжатые данные 220. Следует отметить, что, когда функции блока 114 сжатия/восстановления реализуются с помощью CPU 103, выполняющего программу, функции функциональных модулей, показанных на фиг. 3, реализуются с помощью CPU 103, выполняющего программу.
[0073] Модуль 301 восстановления MMR выполняет обработку восстановления MMR для кода 1 сжатия, как показано ссылочной позицией 221, включенного в файл сжатых данных 220, и воспроизводит двоичное изображение. Модуль 302 восстановления JPEG выполняет обработку восстановления JPEG для кода 2 сжатия, как показано ссылочной позицией 224, включенного в файл сжатых данных 220, и воспроизводит уменьшенное многозначное изображение. Модуль 303 увеличения формирует многозначное изображение, имеющее тот же размер, что и размер входного изображения 201, который оно имело перед сжатием, выполняя обработку увеличения уменьшенного многозначного изображения, которое было восстановлено модулем 302 восстановления JPEG.
[0074] Модуль 304 объединения назначает цвет (в дальнейшем именуемый «цвет символа»), указанный информацией цвета символа, черным пикселям на двоичном изображении, которое было восстановлено модулем 301 восстановления MMR, при обращении к информации 222 области символа. Кроме того, модуль 304 объединения формирует изображение 305 восстановления путем объединения двоичного изображения, которому был назначен цвет символа, с многозначным изображением, сформированным модулем 204 увеличения. Когда выполняется объединение, прозрачный цвет назначается белым пикселям на двоичном изображении, и можно увидеть фоновое многозначное изображение. Таким образом, модуль 114 сжатия/восстановления формирует восстановленное изображение 305 путем восстановления сжатых данных. Это восстановленное изображение 305 после обработки изображения, выполняемой блоком 113 обработки выходного изображения, передается на принтер 116 через интерфейс 111 устройства и печатается.
[0075] Фиг. 4 представляет собой блок–схему последовательности операций для описания обработки от считывания документа до формирования файла в устройстве обработки изображения в соответствии с первым вариантом осуществления. Обработка, показанная на блок-схеме последовательности операций на фиг. 4, достигается с помощью CPU 103, выполняющего программу, развернутую в вышеупомянутом RAM 104.
[0076] Сначала, на этапе S401, CPU 103 обнаруживает нажатие клавиши запуска (не показана) на консольном блоке 117. Далее CPU 103 переводит обработку на этап S402 и получает значения настройки (такие как формат файла, разрешение и пункт назначения передачи), которые были установлены пользователем с помощью консольного блока 117. Затем CPU 103 переводит обработку на этап S403 и считывает документ, управляя сканером 115. Кроме того, CPU 103 переводит обработку на этап S404 и выполняет обработку, при которой блок 112 обработки входного изображения побуждается выполнять обработку изображения для данных изображения, полученных сканером 115, считавшим документ на этапе S403, и данные изображения, подвергнутые обработке, сохраняются в RAM 104. Затем CPU 103 переводит обработку на этап S405, формирует сжатые данные 220, побуждая блок 114 сжатия/восстановления выполнять обработку сжатия изображения для данных изображения, хранящихся в RAM 104. Подробности процесса формирования кода 1 сжатия, информации 222 области символа и информации 223 цвета символа будут описаны позже со ссылкой на блок–схему последовательности операций на фиг. 5. Затем CPU 103 переводит обработку на этап S406, формирует файл в формате PDF из сжатых данных 220, сформированных блоком 114 сжатия/восстановления, и заканчивает эту обработку.
[0077] Фиг. 5 представляет собой блок–схему последовательности операций для описания обработки сжатия данных изображения блоком 114 сжатия/восстановления, который показан на этапе S405 на фиг. 4. Здесь будет приведено описание при условии, что функции блока 114 сжатия/восстановления реализуются с помощью CPU 103, выполняющего программу.
[0078] Сначала на этапе S501 CPU 103 функционирует в качестве модуля 206 уменьшения и формирует данные уменьшенного многозначного изображения, выполняя обработку уменьшения изображения на входном изображении 201. Затем CPU 103 переводит обработку на этап S502, функционируя как модуль 202 преобразования в двоичную форму, и выполняет обработку преобразования в двоичную форму на входном изображении 201. Затем CPU 103 переводит обработку на этап S503, функционирует как модуль 203 определения области, выполняет обработку 1 определения области для двоичного изображения, сформированного на этапе S502, идентифицирует области, включенные в двоичное изображение, и определяет, является ли каждая идентифицированная область символьной областью или несимвольной областью.
[0079] Затем CPU 103 переводит обработку на этап S504, функционируя в качестве модуля 205 определения области, последовательно задает одну из областей, определенных модулем 203 определения области, в качестве целевой области, и определяет, является ли результат определения модуля 203 определения области по отношению к целевой области символьной областью. Здесь, если целевая область является символьной областью, CPU 103 переводит обработку на этап S505, и, если целевая область является несимвольной областью, CPU 103 переводит обработку на этап S507. На этапе S505 CPU 103 функционирует как модуль 204 отсечения символа и извлекает участки отсечения символа с единичным символом из целевой области, определенной как символьная область. Затем CPU 103 переводит обработку на этап S506, функционируя в качестве модуля 207 извлечения характерного цвета, вычисляет характерный цвет, указывающий цвет двоичного изображения для каждого прямоугольного участка отсечения символа, сформированного модулем 204 отсечения символа. Затем CPU 103 переводит обработку на этап S507, определяет, была ли завершена обработка на этапах S504–S506 по отношению ко всем областям, сформированным модулем 203 определения области, и, если определено, что обработка по всем областям завершена, то CPU 103 переводит обработку на этап S508, а если нет, CPU 103 переводит обработку на этап S504.
[0080] На этапе S508 CPU 103 функционирует в качестве модуля 205 определения области, определяет, является ли каждый участок отсечения символа, сформированный на этапе S505, символом, и корректирует определение, касающееся символьной области. В частности, символьные области корректируются путем удаления из символьных областей, извлеченных на этапе S503, участка отсечения символа, который был определен как не символ при обработке определения, выполняемой модулем 205 определения области. Затем CPU 103 переводит обработку на этап S509, функционирует в качестве модуля 209 коррекции цвета символа и корректирует характерный цвет для каждого участка отсечения символа, рассчитанный модулем 207 извлечения характерного цвета. Подробности этой обработки будут описаны позже со ссылкой на фиг. 6. Далее CPU 103 переводит обработку на этап S510, функционирует как модуль 208 заполнения области символа и выполняет обработку, в которой пиксели на участке символа заполняются периферийным цветом по отношению к уменьшенному многозначному изображению, сформированному модулем 206 уменьшения. Затем CPU 103 переводит обработку на этап S511, функционирует как модуль 210 сжатия MMR и формирует код 1 сжатия, как показано ссылочной позицией 221, путем выполнения сжатия MMR для двоичного изображения на основе двоичного изображения, скорректированного модулем 209 коррекции цвета символа, и информации цвета символа. Кроме того, CPU 103 функционирует как модуль 211 сжатия JPEG, формирует код 2 сжатия, как показано ссылочной позицией 224, путем выполнения сжатия JPEG для многозначного изображения, сформированного модулем 208 заполнения области символа, и заканчивает эту обработку.
[0081] Фиг. 6 представляет собой блок–схему последовательности операций для описания обработки для коррекции цвета символов с помощью модуля 209 коррекции цвета символа на этапе S509 на фиг. 5. Кроме того, при описании блок–схемы последовательности операций, даются ссылки на фиг. 9A–9C и фиг. 10А–10С.
[0082] Фиг. 9А–9С представляют собой схемы для описания примера, в котором, после того, как модуль 209 коррекции цвета символа в соответствии с первым вариантом осуществления выполнил обработку коррекции в отношении цвета символа, двоичные изображения классифицируются по отношению к характерным цветам и сохраняются в буферах изображения.
[0083] Фиг. 10А–10С представляют собой схемы для описания примера обработки для коррекции цвета символа с помощью модуля 209 коррекции цвета символа в соответствии с первым вариантом осуществления.
[0084] Сначала на этапе S601 CPU 103 выполняет преобразование цвета N характерных цветов соответствующих участков отсечения символа, вычисленных модулем 207 извлечения характерного цвета. Здесь характерные цвета, вычисленные модулем 207 извлечения характерного цвета, находятся в цветовом пространстве на основе яркости, обозначенном R, G и B, и поэтому характерные цвета преобразуются в цвета в цветовом пространстве Lab, которое является однородным цветовым пространством. Обратите внимание, что преобразование из цветового пространства RGB в цветовое пространство Lab может быть реализовано с использованием стандартного уравнения преобразования. Здесь преобразование в цветовое пространство Lab выполняется для того, чтобы вычислить описанный ниже сигнал цветового различия, но преобразование не ограничивается этим и может быть выполнено преобразование в цветовое пространство YCbCr. Кроме того, описанное ниже цветовое различие может быть вычислено в упрощенном виде из цветового различия в цветовом пространстве RGB без выполнения преобразования цветового пространства.
[0085] На фиг. 10B показан вид, иллюстрирующий значения цвета, когда характерные цвета, показанные на фиг. 8А–8С, преобразуются в значения цвета в цветовом пространстве Lab с использованием стандартного уравнения преобразования. Здесь характерные цвета №1-№3, соответственно, соответствуют характерным цветам на фиг. 8А–8С. Значение Lab характерного цвета на фиг. 8А составляет (L,a,b) = (33, 0, 0), значение Lab характерного цвета на фиг. 8В составляет (L,a,b) = (69, 59, 31) и значение Lab характерного цвета на фиг. 8C составляет (L,a,b) = (46, 33, 15). Следует отметить, что в первом варианте осуществления будет дано описание в предположении, что число характерных цветов N=3.
[0086] Затем CPU 103 переводит обработку на этап S602, последовательно задает один черный пиксель для части черных пикселей на двоичном изображении внутри участка отсечения символа, который был определен как символ, в качестве целевого пикселя, и преобразует сигнал RGB в многозначном изображении, соответствующем позиции целевого пикселя, в сигнал Lab.
[0087] На фиг. 10A показан вид, иллюстрирующий многозначное изображение части, показанной на фиг. 7, в котором черный символ А окружен рамкой красной окружности. Здесь, когда целевой пиксель 1000 установлен на целевой пиксель части красной рамки, предполагается, что значение сигнала в многозначном изображении составляет (R,G,B) = (255, 32, 32). Когда это значение преобразуется в значение Lab с использованием общего уравнения преобразования, получается (L,a,b) = (63,59,31). С другой стороны, когда целевой пиксель 1001 установлен на целевой пиксель части черного символа A, предполагается, что значение сигнала многозначного изображения составляет (R,G,B) = (20, 20, 20). Когда это значение преобразуется в значение Lab, получается (L,a,b) = (33,0,0).
[0088] Затем CPU 103 переводит обработку на этап S603 и вычисляет цветовое различие ΔE на основании сигнала Lab (L1,a1,b1) целевого пикселя, вычисленного на этапе S602, и сигнала Lab (L2,a2,b2) характерного цвета целевого участка отсечения символа. Это цветовое различие ΔE может быть рассчитано с использованием следующего уравнения (1).
Цветовое различие ΔE = √ ((ΔL×ΔL) + (Δa×Δa) + (Δb×Δb)) Уравнение (1)
[0089] Здесь ΔL=L1–L2, Δa=a1–a2 и Δb=b1–b2, и √() обозначает функцию получения квадратного корня. Рассчитанное здесь цветовое различие ΔE сохраняется в переменной Min, предоставленной в RAM 104.
[0090] Затем CPU 103 переводит обработку на этап S604 и вычисляет цветовое различие ΔEn из сигнала Lab (L1,a1,b1) целевого пикселя, вычисленного на этапе S602, и сигнала Lab (Ln,an,bn) n–го (n хранится в RAM 104, и начальное значение n составляет «1») характерного цвета, вычисленного на этапе S601. Затем CPU 103 переводит обработку на этап S605 и определяет, меньше или нет различие ΔEn, рассчитанное на этапе S604, чем Min. Затем, если цветовое различие ΔEn меньше, чем Min, т.е., если цвет символа целевого пикселя ближе к n–му характерному цвету, чем к характерному цвету целевого участка отсечения символа, то CPU 103 переводит обработку на этап S606. Если нет, CPU 103 переводит обработку на этап S607. На этапе S606 CPU 103 сохраняет цветовое различие ΔEn в Min и обновляет характерный цвет до n–го характерного цвета, с которым цветовое различие от значения цвета целевого пикселя меньше. Здесь, чтобы зафиксировать информацию значения n–го цвета, n устанавливается равным переменной MinN, предоставленной в RAM 104, и сохраняется номер характерного цвета, чье цветовое различие от значения цвета целевого пикселя меньше.
[0091] Затем CPU 103 переводит обработку на этап S607 и определяет, было ли завершено сравнение со всеми из N характерных цветов относительно целевого пикселя. Если сравнение со всеми из N характерных цветов было завершено, CPU 103 переводит обработку на этап S609, а если нет, CPU 103 переводит обработку на этап S608. На этапе S608 CPU 103 подсчитывает переменную n и переводит обработку на этап S604, чтобы выполнять сравнение различия цвета со следующим характерным цветом.
[0092] На этапе S609 CPU 103 перемещает данные двоичного изображения в буфер двоичного изображения, обозначенный характерным цветом, номер (n) которого хранится в переменной MinN. Таким образом, если найден характерный цвет, который ближе к значению цвета целевого пикселя, чем характерный цвет, зафиксированный для текущего прямоугольного участка отсечения символа, то значение цвета целевого пикселя воспроизводится найденным характерным цветом.
[0093] На фиг. 10С показан вид, иллюстрирующий пример цветовых различий между значениями цвета целевых пикселей 1000 и 1001 и соответствующими характерными цветами. Цветовое различие от соответствующих характерных цветов по отношению к целевому пикселю 1000 является наименьшим для характерного цвета №2. В этом случае двоичное изображение, соответствующее целевому пикселю 1000, перемещается в буфер изображения характерного цвет №2. При этом двоичное изображение части рамки красной окружности на фиг. 8C перемещается из буфера характерного цвета (R,G,B) = (98,24,24) на фиг. 9C в буфер изображения характерного цвета №2, показанного на фиг. 9В.
[0094] Кроме того, цветовое различие от соответствующих характерных цветов по отношению к целевому пикселю 1001 является наименьшим для характерного цвета №1. В этом случае двоичное изображение, соответствующее целевому пикселю 1001, перемещается из буфера характерного цвета (R,G,B) = (98,24,24) на фиг. 9C в буфер изображения характерного цвета №1 на фиг. 9A. При этом, двоичное изображение части черного символа «A» на фиг. 8С перемещается в буфер изображения характерного цвета №1, как показано на фиг. 9А.
[0095] Соответственно, даже в случае, когда множество цветов присутствует на одном участке отсечения символа, цвет символа может быть запрещен от изменения и цвет символа может быть соответствующим образом воспроизведен.
[0096] Затем CPU 103 переводит обработку на этап S610 и определяет, были ли обработаны все черные пиксели на двоичном изображении внутри прямоугольного участка отсечения символа, и, если все черные пиксели были обработаны, CPU 103 переводит обработку на этапе S612. Если не все черные пиксели были обработаны, то CPU 103 переводит обработку на этап S611, CPU 103 устанавливает следующий черный пиксель в качестве целевого пикселя и переводит обработку на этап S602. На этапе S612 CPU 103 определяет, была ли завершена обработка по отношению ко всем прямоугольным участкам отсечения символа. Если обработка была завершена в отношении всех прямоугольных участков отсечения символа, CPU 103 заканчивает эту обработку, а если нет, CPU 103 переводит обработку на этап S613, устанавливает следующий прямоугольный участок отсечения символа в качестве целевого прямоугольного участка отсечения символа и переводит обработку на этап S602.
[0097] Как описано выше, в соответствии с первым вариантом осуществления, когда символьная область преобразуется в двоичную форму и цвет символа воспроизводится характерным цветом, значение цвета целевого пикселя сравнивается со значениями цвета, которые были извлечены в качестве характерных цветов, и повторно выбирается характерный цвет, наиболее близкий к значению цвета целевого пикселя. При этом даже в случае, когда множество цветов присутствует в многозначном изображении, соответствующем части черного пикселя внутри одного участка отсечения символа, цвет символа может быть исключен из воспроизведения цветом, который отличается от исходного цвета, и цвет символа может быть воспроизведен соответствующим образом.
[0098] Второй вариант осуществления
В вышеописанном первом варианте осуществления был описан пример, в котором значение цвета целевого пикселя сравнивается со значениями цвета, которые были извлечены в качестве характерных цветов, и получен характерный цвет, который является наиболее близким к значению цвета целевого пикселя. Однако существуют случаи, когда при сравнении значения цвета целевого пикселя со значениями цвета, которые были извлечены в качестве характерных цветов, необходимо выполнить сравнительные вычисления, нагрузка которых зависит от числа черных пикселей, включенных в прямоугольный участок отсечения символа, который был определен как символ, и числа цветов, которые были извлечены в качестве характерных цветов, и скорость обработки уменьшается. Поэтому во втором варианте осуществления будет описан пример, в котором определяется, присутствует или нет множество цветов внутри прямоугольника отсечения символа, и модуль 209 коррекции цвета символа выполняет обработку только на прямоугольных участках отсечения символа, которые были определены как символ и включают в себя множество цветов. Следует отметить, что аппаратная конфигурация и т.п. устройства обработки изображения в соответствии со вторым вариантом осуществления аналогична конфигурации по вышеописанному первому варианту осуществления, и поэтому ее описание будет пропущено. Кроме того, обработка для сжатия данных изображения, выполняемая с помощью блока 114 сжатия/восстановления в соответствии со вторым вариантом осуществления является такой же, как обработка, показанная на вышеописанной блок–схеме последовательности операций на фиг. 5, но обработка для коррекции цвета символов на этапе S506 отличается от такой в первом варианте осуществления (фиг. 6). Это будет описано позже со ссылкой на фиг. 13.
[0099] Фиг. 12 представляет собой блок–схему последовательности операций для описания обработки в отношении одного участка отсечения символа, которая выполняется модулем 205 определения области в соответствии со вторым вариантом осуществления. Обработка, показанная на блок–схеме последовательности операций на фиг. 12, достигается с помощью CPU 103, выполняющего программу, развернутую в вышеупомянутом RAM 104.
[0100] Сначала на этапе S1201 CPU 103 вычисляет плотность черных пикселей из двоичного изображения на участке отсечения символа. Плотность черных пикселей может быть получена путем деления числа черных пикселей внутри участка отсечения символа на число пикселей на участке отсечения символа. Затем CPU 103 переводит обработку на этап S1202 и определяет, меньше ли плотность черных пикселей, полученная на этапе S1201, чем пороговое значение ThM. Здесь, если определено, что плотность черных пикселей меньше порогового значения ThM, CPU 103 переводит обработку на этап S1203, а если нет, CPU 103 переводит обработку на этап S1208.
[0101] На этапе S1203 CPU 103 вычисляет дисперсию цвета из многозначного изображения, соответствующего позициям черных пикселей на двоичном изображении на участке отсечения символа. В частности, значения RGB преобразуются в значения Lab, и вычисляются значения расхождения a и b в части позиции черных пикселей. CPU 103 переводит обработку на этап S1204 и определяет, меньше ли дисперсия цвета, полученная на этапе S1203, чем пороговое значение ThS1. Здесь, если определено, что дисперсия цвета меньше порогового значения ThS1, CPU 103 переводит обработку на этап S1205, а если нет, CPU 103 переводит обработку на этап S1206. Здесь, чтобы определить участок отсечения символа, который, очевидно, представляет собой единственный цвет, «50» устанавливается на пороговое значение ThS1, но нет никаких ограничений на это. На этапе S1205 CPU 103 выводит результат, утверждающий, что информация цвета участка отсечения символа была определена как единственный цвет, и заканчивает эту обработку. Т.е. здесь, если плотность черных пикселей на участке отсечения символа меньше, чем первое заданное значение (пороговое значение ThM), а дисперсия цвета черных пикселей меньше, чем второе заданное значение (пороговое значение ThS1), то определяется, что информация цвета символа участка отсечения символа является единственным цветом.
[0102] С другой стороны, если дисперсия цвета больше порогового значения ThS1, на этапе S1206 CPU 103 определяет, является ли дисперсия цвета, полученная на этапе S1203, большей или равной пороговому значению ThS1 и меньшей порогового значения ThS2 (ThS1<ThS2). Если вышеуказанное условие удовлетворяется, CPU 103 переводит обработку на этап S1207, а если нет, CPU 103 переводит обработку на этап S1208. Здесь пороговое значение ThS2 является пороговым значением для распознавания участка отсечения символа, который имеет большое число цветов и, очевидно, не является символом, и составляет здесь, например, «300», но здесь нет ограничений. На этапе S1207 CPU 103 выводит результат, утверждающий, что информация цвета участка отсечения символа была определена как множество цветов, и заканчивает эту обработку. Т.е. здесь, когда плотность черных пикселей на участке отсечения символа меньше, чем первое заданное значение, и цветовая дисперсия черных пикселей больше, чем второе заданное значение, но участок отсечения символа может быть определен как символ, определяется, что информация цвета символа участка отсечения символа представляет собой множество цветов.
[0103] Кроме того, если плотность черных пикселей на участке отсечения символа больше, чем пороговое значение ThM, на этапе S1208 CPU 103 определяет, что участок отсечения символа является областью не символа, и корректирует информацию символьной области, сформированную модулем 203 определения области, и информацию отсечения символа, сформированную модулем 204 отсечения символа. Т.е. CPU 103 удаляет этот участок отсечения символа из информации символьной области и информации отсечения символа и заканчивает эту обработку.
[0104] Фиг. 13 представляет собой блок–схему последовательности операций для описания обработки для коррекции цвета символа модулем 209 коррекции цвета символа в соответствии со вторым вариантом осуществления на этапе S509 на фиг. 5. Следует отметить, что обработка на этапах S1301–S1313 на фиг. 13 является такой же, как вышеупомянутая обработка на этапах S601–S613 и, следовательно, их описание будет пропущено.
[0105] На этапе S1314 CPU 103 обращается к информации цвета участка отсечения символа, формируемой на этапе S1205 или S1207 на фиг. 12, и определяет присутствует или нет множество цветов символа на участке отсечения символа. Здесь, если определено, что множество цветов символа присутствует на участке отсечения символа, CPU 103 переводит обработку на этап S1302 и выполняет обработку, аналогичную вышеописанной на фиг. 6. С другой стороны, если он определяет, что единственный цвет символа присутствует на участке отсечения символа, CPU 103 пропускает обработку на фиг. 6 и переводит обработку на этап S1312.
[0106] Как описано выше, согласно второму варианту осуществления определяется, присутствует или нет множество цветов символа на участке отсечения символа, и только если существует множество цветов символа, выполняется обработка, аналогичная вышеописанной в первом варианте осуществления. При этом предотвращается выполнение обработки для коррекции цвета символа на всех участках отсечения символа. Соответственно, предотвращается снижение скорости обработки, и цвета символа не воспроизводятся в цветах, отличных от исходных цветов, и в результате цвета символа могут быть воспроизведены соответствующим образом.
[0107] Следует отметить, что во втором варианте осуществления при определении того, присутствует или нет множество цветов символа на участке отсечения символа, используется дисперсия цвета, но настоящее изобретение этим не ограничивается. Например, конфигурация может быть такой, чтобы путем формирования двухмерной или трехмерной гистограммы значений RGB или значений Lab многозначного изображения формировались наборы цветов, и чтобы определялось на основе ряда таких наборов, присутствует ли множество цветов.
[0108] Другие варианты осуществления
Варианты осуществления настоящего изобретения также могут быть реализованы компьютером системы или устройства, который считывает и выполняет исполняемые компьютером инструкции (например, одну или более программ), записанные на носителе хранения данных (который также более полно может называться «невременным считываемым компьютером носителем хранения данных»), осуществляя функции одного или более вышеописанных вариантов осуществления, и/или который включает в себя одну или более схем (например, специализированную интегральную схему (ASIC)) для выполнения функций одного или более вышеописанных вариантов осуществления, и с помощью способа, осуществляемого компьютером системы или устройства, например, путем считывания из носителя хранения данных и выполнения исполняемых компьютером инструкций с выполнением функций одного или более вышеописанных вариантов осуществления, и/или путем управления одной или более схемами с выполнением функций одного или более вышеописанных вариантов осуществления. Компьютер может содержать один или более процессоров (например, центральный процессор (CPU), микропроцессор (MPU)) и может включать в себя сеть отдельных компьютеров или отдельных процессоров, считывающих и исполняющих исполняемые компьютером инструкции. Исполняемые компьютером инструкции могут быть предоставлены компьютеру, например, из сети или с носителя хранения данных. Носитель хранения данных может включать в себя, например, одно или более из жесткого диска, оперативного запоминающего устройства (RAM), постоянного запоминающего устройства (ROM), хранилища распределенных вычислительных систем, оптического диска (такого как компакт-диск (CD), цифровой многофункциональный диск (DVD) или диск Blu-ray (BD)™), устройства флэш-памяти, карты памяти и т.п.
[0109] В то время как настоящее изобретение было описано со ссылкой на примерные варианты осуществления, должно быть понятно, что изобретение не ограничено раскрытыми примерными вариантами осуществления. Объем следующей формулы должен соответствовать самой широкой интерпретации с тем, чтобы охватывать все такие модификации и эквивалентные структуры и функции.
Изобретение относится к средствам для обработки изображений. Технический результат заключается в повышении эффективности обработки изображений. Преобразовывают многозначное изображение в двоичное изображение. Определяют символьную область и несимвольную область на двоичном изображении. Извлекают участки с единичным символом из области, определенной как символьная область. Определяют, является ли каждый из участков с единичным символом областью символа или областью не символа. Извлекают из многозначного изображения, включенного в участок с единичным символом, для каждого из участков с единичным символом, которые были определены как область символа, первый характерный цвет и формируют двоичное изображение участка с единичным символом, соответствующее первому характерному цвету. Делают выбор второго характерного цвета, ближайшего к цвету целевого пикселя, путем сравнения первого характерного цвета с цветом целевого пикселя на участке с единичным символом. Заменяют сформированное двоичное изображение участка с единичным символом, соответствующее первому характерному цвету, на двоичное изображение из выбранного второго характерного цвета. 3 н. и 8 з.п. ф-лы, 20 ил.
1. Устройство обработки изображений, содержащее:
блок преобразования, выполненный с возможностью преобразовывать многозначное изображение в двоичное изображение;
первый блок определения, выполненный с возможностью определять на двоичном изображении символьную область и несимвольную область;
блок отсечения символа, выполненный с возможностью извлекать участки с единичным символом из области, определенной первым блоком определения как символьная область;
второй блок определения, выполненный с возможностью определять, является ли каждый из участков с единичным символом областью символа или областью не символа;
блок формирования, выполненный с возможностью извлекать из многозначного изображения, включенного в участок с единичным символом, для каждого из участков с единичным символом, которые были определены вторым блоком определения как область символа, первый характерный цвет и формировать двоичное изображение участка с единичным символом, соответствующее первому характерному цвету;
блок принятия решения, выполненный с возможностью осуществлять выбор второго характерного цвета, ближайшего к цвету целевого пикселя, путем сравнения первого характерного цвета с цветом целевого пикселя на участке с единичным символом; и
блок изменения, выполненный с возможностью заменять двоичное изображение участка с единичным символом, соответствующее первому характерному цвету, сформированное блоком формирования, на двоичное изображение второго характерного цвета, выбранного блоком принятия решения.
2. Устройство обработки изображений по п. 1, в котором блок преобразования выполнен с возможностью преобразовывать пиксель, включенный в многозначное изображение, оптическая плотность которого больше или равна пороговому значению, в черный пиксель и преобразовывать пиксель, оптическая плотность которого меньше порогового значения, в белый пиксель.
3. Устройство обработки изображений по п. 1, в котором первый блок определения выполнен с возможностью извлекать кластер черных пикселей путем отслеживания контура черных пикселей на двоичном изображении и определять, каким из символьной области и несимвольной области является упомянутый участок, используя по меньшей мере одно из размера, формы, плотности черных пикселей кластера черных пикселей.
4. Устройство обработки изображений по любому из пп. 1-3, дополнительно содержащее блок уменьшения, выполненный с возможностью уменьшать многозначное изображение,
при этом блок формирования выполнен с возможностью задавать позиции пикселей, составляющих соответствующие символы на участках с единичным символом, которые были определены как область символа, и извлекать первый характерный цвет на каждом из участков с единичным символом путем обращения к цветам в соответствующих позициях на многозначном изображении, которое было уменьшено блоком уменьшения, на основе заданных позиций пикселей символа.
5. Устройство обработки изображений по п. 4, в котором блок формирования выполнен с возможностью извлекать первый характерный цвет на основе среднего или средневзвешенного из цветов многозначного изображения, соответствующего группе черных пикселей на двоичном изображении на каждом из участков с единичным символом.
6. Устройство обработки изображений по п. 4, в котором блок формирования выполнен с возможностью извлекать первый характерный цвет на основе цвета, который наиболее часто появляется в группе черных пикселей на двоичном изображении на каждом из участков с единичным символом.
7. Устройство обработки изображений по любому из пп. 1-3, дополнительно содержащее третий блок определения, выполненный с возможностью определять, извлек ли блок формирования множество первых характерных цветов относительно каждого из участков с единичным символом,
при этом блок принятия решения выполнен с возможностью после определения, что блок формирования извлек множество первых характерных цветов, осуществлять выбор второго характерного цвета, который является наиболее близким к цвету целевого пикселя, из множества первых характерных цветов.
8. Устройство обработки изображений по п. 7, в котором третий блок определения выполнен с возможностью вычислять дисперсию цвета из многозначного изображения, соответствующего позициям черных пикселей на двоичном изображении на каждом из участков с единичным символом, и определяет, если дисперсия цвета меньше первого порогового значения, что участок с единичным символом является участком единственного цвета, и определяет, если дисперсия цвета больше или равна первому пороговому значению и меньше второго порогового значения, что участок с единичным символом является участком множества цветов.
9. Устройство обработки изображений по п. 1, дополнительно содержащее блок сжатия, выполненный с возможностью выполнять двоичное сжатие без потерь для двоичного изображения, которое было заменено блоком изменения.
10. Способ обработки изображения, содержащий этапы, на которых:
преобразовывают многозначное изображение в двоичное изображение;
определяют символьную область и несимвольную область на двоичном изображении;
извлекают участки с единичным символом из области, определенной как символьная область;
определяют, является ли каждый из участков с единичным символом областью символа или областью не символа;
извлекают из многозначного изображения, включенного в участок с единичным символом, для каждого из участков с единичным символом, которые были определены как область символа, первый характерный цвет и формируют двоичное изображение участка с единичным символом, соответствующее первому характерному цвету;
делают выбор второго характерного цвета, ближайшего к цвету целевого пикселя, путем сравнения первого характерного цвета с цветом целевого пикселя на участке с единичным символом и
заменяют сформированное двоичное изображение участка с единичным символом, соответствующее первому характерному цвету, на двоичное изображение из выбранного второго характерного цвета.
11. Считываемый компьютером носитель данных, хранящий программу, побуждающую процессор выполнять способ обработки изображения по п. 10.
Станок для изготовления деревянных ниточных катушек из цилиндрических, снабженных осевым отверстием, заготовок | 1923 |
|
SU2008A1 |
US 7133565 B2, 07.11.2006 | |||
JP 2007251518 A, 27.09.2007 | |||
Приспособление для суммирования отрезков прямых линий | 1923 |
|
SU2010A1 |
RU 2006101393 A, 10.08.2007 | |||
СПОСОБ ИНТЕРПОЛЯЦИИ ДВУХГРАДАЦИОННОГО ИЗОБРАЖЕНИЯ | 1997 |
|
RU2221275C2 |
Авторы
Даты
2020-11-24—Публикация
2019-09-03—Подача