СПОСОБ СЕГМЕНТАЦИИ И РАСПОЗНАВАНИЯ СИМВОЛОВ Российский патент 2019 года по МПК G06K9/20 

Описание патента на изобретение RU2678485C1

[0001] Настоящая заявка притязает на приоритет патентной заявки Китая № 201510083858.3, озаглавленной "CHARACTER SEGMENTATION AND RECOGNITION METHOD", поданной 13 февраля 2015 в Государственное ведомство интеллектуальной собственности Китайской Народной Республики, которая включена в настоящий документ путем ссылки в полном объеме.

ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ

[0002] Раскрытие настоящего изобретения относится к области оптического распознавания символов и, в частности, к способу сегментации и распознавания.

УРОВЕНЬ ТЕХНИКИ

[0003] Оптическое распознавание символов является обнаружением и распознаванием печатных символов с помощью электронного оборудования. Когда степень автоматизации и интеллектуальный уровень общественного производства и жизнедеятельности повышается, оптическое распознавание символов (OCR) применяется более широко, например, система обнаружения печати на различных упаковках, система позиционирования и распознавания символов номерного знака в "умных" перевозках, распознавание символа короны при распознавании банкноты, распознавание серийного номера при распознавании счетов и анализ компоновки при распознавании счета. Таким образом, разработка эффективной системы оптического распознавания символов имеет большие социальные выгоды и экономические выгоды.

[0004] В практических приложениях из-за отсутствия целостности сцен съемки изображения и влияния различных факторов, таких как датчики и засветки, ситуации со сложным фоновым изображением, таким как затенения, печати и трафареты. Узким местом OCR больше не является дизайн классификатора, но в основном зависит от точности сегментации символа и, в частности, для сегментации сцепленных или испорченных строк символов. Таким образом, следует предложить более эффективный способ сегментации символов.

[0005] В настоящее время, общий способ сегментации символов представляет собой способ сегментации на основе изображения, которое включает в себя рассмотрение начальной точки изображения в качестве возможной точки сегментации, определение других эффективных точек сегментации и отбор целевой точки сегментации из эффективных точек сегментации. Способ состоит в том, чтобы получить целевую точку сегментации с использованием свойств отдельного символа и распознать сегментированный символ. Однако способ сегментации обладает низкой способностью к распознаванию символов и плохой способностью против загрязнений на сложном фоне.

СУЩНОСТЬ ИЗОБРЕТЕНИЯ

[0006] Способ сегментации и распознавания символов предоставляется в соответствии с вариантом осуществления настоящего изобретения, для решения проблемы низкой способности распознавания символов и плохими возможностями против загрязнений на сложном фоне при традиционном способе сегментации.

[0007] Способ сегментации и распознавания символов предоставляется в соответствии с вариантом осуществления настоящего изобретения, который включает в себя:

сбор данных изображения для получения изображения, предназначенного для распознавания;

позиционирование вероятной области строки символов на изображении, предназначенном для распознавания;

получение предварительной информации заранее заданной строки символов, где предварительная информация строки символов включает в себя количество символов, интервал между символами и размер символа;

получение соответствующего шаблона точек сегментации на основе предварительной информации строки символов;

получение степеней достоверности различных положений на вероятной области строки символов, пройденной шаблоном точек сегментации;

определение положения с наивысшей степенью достоверности как оптимального положения сегментации;

сегментация вероятной области строки символов на основе шаблона точек сегментации и оптимального положения сегментации для получения множественных областей отдельного символа и

выполнение распознавания символа в каждой из областей отдельного символа для получения соответствующего результата распознавания.

[0008] В некоторых случаях, получение предварительной информации заранее заданной строки символов включает в себя:

получение предварительной информации заранее заданной строки символов на основе типа изображения, предназначенного для распознавания или

получение предварительной информации заранее заданной строки символов на основе характеристики ориентации вероятной области строки символов.

[0009] В необязательном порядке, получение соответствующего шаблона точек сегментации на основе предварительной информации строки символов включает в себя:

создание и инициализацию шаблона точек сегментации на основе предварительной информации строки символов или

получение соответствующего шаблона точек сегментации на основе предварительной информации строки символов и заранее заданной индексной таблицы сегментации, где индексная таблица сегментации включает в себя соответствие между предварительной информацией строки символов и шаблоном точек сегментации.

[0010] В необязательном порядке, получение степеней достоверности различных положений в вероятной области строки символов, пройденной шаблоном точек сегментации, включает в себя:

запись информации о положении вероятной области строки символов, пройденной шаблоном точек сегментации, и

получение степеней достоверности соответствующей информации о положении.

[0011] В необязательном порядке, получение степеней достоверности, соответствующих информации о положении включает в себя:

получение первого числа из первых эффективных пиксельных точек вероятной области строки символов на левой границе точки сегментации символа, где шаблон точек сегментации включает в себя множественные точки сегментации символа, каждая из точек сегментации символа соответствует одному символу в строке символов, каждая из точек сегментации символа включает в себя левую границу и правую границу, и первые эффективные пиксельные точки представляют собой пиксельные точки со значениями уровней яркости в заранее заданном первом пороговом диапазоне;

получение первого значения оценки на основе первого числа и заранее заданного первого весового значения;

получение второго числа вторых эффективных пиксельных точек вероятной области строки символов на правой границе точки сегментации символа, где вторые эффективные пиксельные точки представляют собой пиксельные точки со значениями уровней яркости в заранее заданном втором пороговом диапазоне;

получение второго значения оценки на основе второго числа и заранее заданного второго весового значения;

получение третьего числа третьих эффективных пиксельных точек вероятной области строки символов в пределах шаблона точек сегментации, где третьи эффективные пиксельные точки представляют собой пиксельные точки со значениями уровней яркости в заранее заданном третьем пороговом диапазоне;

получение третьего значения оценки на основе третьего числа и заранее заданного третьего весового значения и

получение степеней достоверности, соответствующих информации о положении на основе первого значения оценки, второго значения оценки и третьего значения оценки.

[0012] В необязательном порядке, после получения соответствующего шаблона точек сегментации, на основе предварительной информации строки символов, способ дополнительно включает в себя:

получение двоичного изображения для изображения, предназначенного для распознавания;

получение кривой проекции двоичного изображения в горизонтальном направлении и

обновление верхней границы и нижней границы шаблона точек сегментации на основе кривой проекции.

[0013] В необязательном порядке, обновление верхней границы и нижней границы шаблона точек сегментации на основе кривой проекции включает в себя:

определение и обновление самого верхнего положения, при котором значение уровня яркости больше, чем заранее заданное четвертое пороговое значение, на кривой проекции, в качестве верхней границы шаблона точек сегментации и

определение и обновление самого нижнего положения, при котором значение уровня яркости больше, чем заранее заданное пятое пороговое значение, на кривой проекции, в качестве нижней границы шаблона точек сегментации.

[0014] В необязательно порядке, случаях позиционирование вероятной области строки символов на изображении, предназначенном для распознавания, включает в себя:

позиционирование области, представляющей интерес, где строка символов располагается на изображении, предназначенном для распознавания;

выполнение аффинного преобразования и билинейной интерполяции на области, представляющей интерес, для получения корректирующего изображения и

позиционирование вероятной области строки символов на корректирующем изображении.

[0015] В необязательном порядке, выполнение распознавания символа, на каждой из областей отдельного символа, для получения соответствующего результата распознавания включает в себя:

получение данных характеристики символа в области отдельного символа и

выполнение распознавания символа на основе данных характеристики символа для получения результата распознавания.

[0016] В необязательном порядке, данные характеристики символа представляют собой данные характеристики контура символа.

[0017] Из вышеприведенных технических решений видно, что варианты осуществления настоящего изобретения имеют следующие преимущества. В вариантах осуществления настоящего изобретения, данные изображения собираются для получения изображения, предназначенного для распознавания; вероятную область строки символов располагают на изображении, предназначенном для распознавания; получают предварительную информацию заранее заданной строки символов, где предварительная информация строки символов включает в себя количество символов, интервал между символами и размер символа; соответствующий шаблон точек сегментации получают на основе предварительной информации строки символов; получают степени достоверности различных положений в вероятной области строки символов, пройденной шаблоном точек сегментации; положение с наивысшей степенью достоверности определяют как оптимальное положение сегментации; вероятную область строки символов сегментируют на основе шаблона точек сегментации и оптимального положения сегментации для получения множественных областей отдельного символа, и распознавание символа выполняется в каждой из областей отдельного символа для получения соответствующего результата распознавания. В вариантах осуществления настоящего изобретения возможности против загрязнений способа сегментации символа улучшаются при помощи введения шаблона точек сегментации и определения оптимального положения сегментации. Даже на сложном фоне способ сегментации и распознавания символов может по-прежнему иметь хорошие возможности распознавания, вследствие чего увеличивается эффективность распознавания символа.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

[0018] ФИГ. 1 представляет блок-схему способа сегментации и распознавания символов в соответствии с первым вариантом осуществления настоящего изобретения;

[0019] ФИГ. 2 представляет блок-схему способа сегментации и распознавания символа в соответствии со вторым вариантом осуществления настоящего изобретения;

[0020] ФИГ. 3 представляет блок-схему способа сегментации и распознавания символа в соответствии с третьим вариантом осуществления настоящего изобретения;

[0021] ФИГ. 4 представляет схематический чертеж изображения, предназначенного для распознавания, в соответствии с вариантом осуществления настоящего изобретения;

[0022] Каждая из ФИГ. 5a и ФИГ. 5b представляет схематический чертеж положения вероятной области строки символов в соответствии с вариантом осуществления настоящего изобретения;

[0023] ФИГ. 6 представляет схематическую структурную схему шаблона точек сегментации в соответствии с вариантом осуществления настоящего изобретения;

[0024] ФИГ. 7a представляет схематический чертеж верхней границы и нижней границы шаблона точек сегментации перед обновлением верхней границы и нижней границы;

[0025] Каждая из ФИГ. 7b и ФИГ. 7c представляет схематический чертеж верхней границы и нижней границы шаблона точек сегментации после обновления верхней границы и нижней границы;

[0026] ФИГ. 8 представляет схематический чертеж точного позиционирования всех символов на шаблоне точек сегментации с помощью кривой проекции;

[0027] Каждая из ФИГ. 9a и ФИГ. 9b представляют схематический чертеж результата сегментации символа в способе сегментации и распознавания символов в соответствии с вариантом осуществления настоящего изобретения и

[0028] ФИГ. 10 представляет схематический чертеж результата сегментации символа при традиционном способе.

ПОДРОБНОЕ ОПИСАНИЕ ВАРИАНТОВ ОСУЩЕСТВЛЕНИЯ НАСТОЯЩЕГО ИЗОБРЕТЕНИЯ

[0029] Способ сегментации и распознавания символов предлагается в соответствии с вариантом осуществления настоящего изобретения для решения проблемы низкой способности распознавания символов и плохих возможностей против загрязнений на сложном фоне при традиционном способе сегментации.

[0030] Для того чтобы сделать задачи, признаки и преимущества раскрытия настоящего изобретения более ясными и более понятными, далее технические решения вариантов осуществления настоящего изобретения иллюстрируются четко и в полном соответствии с чертежами вариантов осуществления настоящего изобретения. Очевидно, что описанные варианты осуществления настоящего изобретения представляют собой всего лишь некоторые, а не все варианты осуществления настоящего изобретения. Все другие варианты осуществления настоящего изобретения, полученные специалистами в данной области техники на основе вариантов осуществления настоящего изобретения без творческих усилий, подпадают под объем охраны раскрытия настоящего изобретения.

[0031] Со ссылкой на ФИГ. 1 способ сегментации и распознавания символов в соответствии с первым вариантом осуществления настоящего изобретения включает в себя этапы 101-108.

[0032] На этапе 101 данные изображения собираются для получения изображения, предназначенного для распознавания.

[0033] Прежде всего, данные изображения собираются для получения изображения, предназначенного для распознавания.

[0034] На этапе 102 вероятную область строки символов располагают на изображении, предназначенном для распознавания.

[0035] После того, как изображение, предназначенное для распознавания, будет получено, вероятная область строки символов может быть наложена на изображении, предназначенном для распознавания.

[0036] На этапе103 получают предварительную информацию заранее заданной строки символов.

[0037] Кроме того, может быть получена предварительная информация заранее заданной строки символов. Предварительная информация строки символов включает в себя количество символов, интервал между символами и размер символа.

[0038] На этапе 104 на основе предварительной информации строки символов получают соответствующий шаблон точек сегментации.

[0039] После получения предварительной информации заранее заданной строки символов, на основе предварительной информации строки символов может быть получен соответствующий шаблон точек сегментации.

[0040] На этапе 105 получают степени достоверности различных положений в вероятной области строки символов, пройденной шаблоном точек сегментации.

[0041] После получения соответствующего шаблона точек сегментации, на основе предварительной информации строки символов, могут быть получены степени достоверности различных положений в вероятной области строки символов, пройденной шаблоном точек сегментации.

[0042] На этап 106 положение с наивысшей степенью достоверности определяется как оптимальное положение сегментации.

[0043] После получения степеней достоверности различных положений, положение с наивысшей степенью достоверности может быть определено как оптимальное положение сегментации.

[0044] На этапе 107 вероятная область строки символов сегментируется на основе шаблона точек сегментации и оптимального положения сегментации для получения множественных областей отдельного символа.

[0045] После того, как положение с наивысшей степенью достоверности определено как оптимальное положение сегментации, вероятная область строки символов может быть сегментирована на основе шаблона точек сегментации и оптимального положения сегментации для получения множественных областей отдельного символа.

[0046] На этапе 108 распознавание символа выполняется в каждой из областей отдельного символа для получения соответствующего результата распознавания.

[0047] После того, как будут получены множественные области отдельного символа, распознавание символа может быть выполнено в каждой из областей отдельного символа для получения соответствующего результата распознавания.

[0048] В вариантах осуществления настоящего изобретения данные изображения собираются для получения изображения, предназначенного для распознавания; вероятную область строки символов располагаются на изображении, предназначенном для распознавания; получают предварительную информацию заранее заданной строки символов, где предварительная информация строки символов включает в себя количество символов, интервал между символами и размер символа; получают соответствующий шаблон точек сегментации на основе предварительной информации строки символов; получают степени достоверности различных положений в вероятной области строки символов, пройденной шаблоном точек сегментации; определяют положение с наивысшей степенью достоверности как оптимальное положение сегментации; сегментируют вероятную область строки символов на основе шаблона точек сегментации и оптимального положения сегментации для получения множественных областей отдельного символа, и распознавание символа выполняют в каждой из областей отдельного символа для получения соответствующего результата распознавания. В вариантах осуществления настоящего изобретения возможности против загрязнений способа сегментации символа улучшаются с помощью шаблона точек сегментации и определения оптимального положения сегментации. Даже на сложном фоне способ сегментации и распознавания символов может по-прежнему иметь хорошую способность распознавания, вследствие чего повышается эффективность распознавания символа.

[0049] Для простоты понимания, далее в настоящем документе способ сегментации и распознавания символов в соответствии с вариантами осуществления настоящего изобретения описывается более подробно. Со ссылкой на ФИГ. 2 способ сегментации и распознавания символов в соответствии со вторым вариантом осуществления настоящего изобретения включает в себя этапы 201-212.

[0050] На этапе 201 данные изображения собираются для получения изображения, предназначенного для распознавания.

[0051] Прежде всего, данные изображения собираются для получения изображения, предназначенного для распознавания. Данные изображения могут быть получены с банкнот, билетов, счетов, печатей на упаковке, компоновок книг и так далее.

[0052] На этапе 202 вероятную область строки символов располагаются на изображении, предназначенном для распознавания.

[0053] После получения изображения, предназначенного для распознавания, вероятная область строки символов может быть наложена на изображение, предназначенное для распознавания. Становится понятным, что если тип или источник изображения, предназначенного для распознавания, заранее известен, становится легко позиционировать положение строк символов, предназначенных для распознавания. Например, если изображение, предназначенное для распознавания, представляет собой фронт банкноты (Женьминьби), положение вероятной области строки символов является положением кодовых номеров банкноты, которые располагаются в нижнем левом углу изображения, предназначенного для распознавания.

[0054] На этапе 203 получают предварительную информацию заранее заданной строки символов.

[0055] Кроме того, может быть получена предварительная информация заранее заданной строки символов. Предварительная информация строки символов включает в себя количество символов, интервал между символами и размер символа. В частности, предварительная информация заранее заданной строки символов может быть получена на основе типа изображения, предназначенного для распознавания, или на основе характеристики ориентации вероятной области строки символов.

[0056] Следует отметить, что в случае, когда тип изображения, предназначенного для распознавания, известен, описание характеристики строки символа фиксировано, то есть, количество символов, интервал между символами и размер символов являются фиксированными. Таким образом, может быть получена соответствующая предварительная информация строки символов. Например, если изображение, предназначенное для распознавания, является фронтом банкноты, строка символов представляет собой кодовые номера банкноты и предварительная информация строки символов кодовых номеров банкноты является характерной и может быть установлена в системе заранее. Кроме того, в случае, когда известна характеристика ориентации вероятной области строки символов, соответствующая предварительная информация строки символов также может быть легко получена. Например, строка символов, такая как "кодовый номер счет-фактуры", "номер счет-фактуры" и "номер заказа", располагается на счет-фактуре, если известна характеристика ориентации вероятной области строки символов, известно приблизительное положение, где строка символов располагается на целом изображении, предназначенном для распознавания, то есть, для типов, принадлежащих "кодам номеров счет-фактуры", "номеру счет-фактуры" и "номеру заказа", строка символов может быть известна, поэтому может быть получена соответствующая предварительная информация строки символов.

[0057] На этапе 204 получают соответствующий шаблон точек сегментации на основе предварительной информации строки символов.

[0058] После того, как получена предварительная информация заранее заданной строки символов, может быть получен соответствующий шаблон точек сегментации на основе предварительной информации строки символов. В частности, шаблон точек сегментации создается и инициализируется на основе предварительной информации строки символов. В качестве альтернативного варианта, соответствующий шаблон точек сегментации получают на основе предварительной информации строки символов и заранее заданной индексной таблицы сегментации, и индексная таблица сегментации включает в себя соответствие между предварительной информацией строки символов и шаблоном точек сегментации.

[0059] Следует отметить, что если создается и инициализируется шаблон точек сегментации на основе предварительной информации строки символов, предварительная информация строки символов включает в себя количество символов, интервал между символами и размер символов, что просто для получения длины и высоты шаблона точек сегментации и создания соответствующего шаблона точек сегментации. В качестве альтернативного варианта, создают каждую точку сегментации символа, соответствующую каждому символу в предварительной информации строки символов, и шаблон точек сегментации получают путем упорядочения всех точек сегментации символов в порядке предварительной информации строки символов. Размер символа может быть известен из предварительной информации строки символов, а размер символа включает в себя высоту и ширину символа. Таким образом, может быть определена левая граница, и правая граница, и верхняя граница, и нижняя граница каждой точки сегментации символа. Точки сегментации символов упорядочиваются в соответствии с интервалом между символами, чтобы позволить созданному шаблону точек сегментации соответствовать предварительной информации строки символов.

[0060] Следует отметить, что в случае, когда шаблон точек сегментации получается на основе предварительной информации строки символов и заранее заданной индексной таблицы сегментации, индексная таблица сегментации устанавливается в системе заранее и шаблон точек сегментации, соответствующий предварительной информации строки символов, также может быть сохранен в системе заранее. Таким образом, индексная таблица сегментации и шаблон точек сегментации могут напрямую запрашиваться и вызываться, когда это необходимо.

[0061] На этапе 205 получают двоичное изображение для изображения, предназначенного для распознавания.

[0062] После получения изображения, предназначенного для распознавания, может быть получено двоичное изображение для изображения, предназначенного для распознавания. В частности, значения пиксельных точек на изображении, предназначенном для распознавания, которые больше, чем заранее заданный порог, определяются как 1, значения пиксельных точек на изображении, предназначенном для распознавания, которые меньше, чем заранее заданный порог, определяются как 0, и может быть получено двоичное изображение.

[0063] На шаге 206 получают кривую проекции двоичного изображения в горизонтальном направлении.

[0064] После того, как получено двоичное изображение для изображения, предназначенного для распознавания, может быть получена кривая проекции двоичного изображения в горизонтальном направлении.

[0065] На этап 207 верхняя граница и нижняя граница шаблона точек сегментации обновляются на основе кривой проекции.

[0066] После того, как получена кривая проекции двоичного изображения в горизонтальном направлении, верхняя граница и нижняя граница шаблона точек сегментации могут быть обновлены на основе кривой проекции. В частности, самое верхнее положение, при котором величина уровня яркости выше, чем заранее заданное четвертое пороговое значение в кривой проекции, определяется и обновляется как верхняя граница шаблона точек сегментации, а самое нижнее положение, при котором величина уровня яркости выше, чем заранее заданное пятое пороговое значение в кривой проекции, определяется и обновляется как нижняя граница шаблона точек сегментации, обеспечивая тем самым верхнюю границу и нижнюю границу шаблона точек сегментации, чтобы быть ближе к строке символа, вследствие чего, обеспечиваются гарантии для последующей сегментации против загрязнений и точного распознавания символа.

[0067] На этапе 208 записывают информацию о положении вероятной области строки символов, пройденной шаблоном точек сегментации.

[0068] После определения шаблона точек сегментации, может быть записана информация о положении вероятной области строки символов, пройденной шаблоном точек сегментации. Становится понятным, что шаблон точек сегментации может скользить по вероятной области строки символов до тех пор, пока не пройдет вся вероятная область строки символов. Во время прохождения шаблон точек сегментации может оказываться на всех положениях вероятной области строки символов, и для различных положений соответственно формируется информация для различных положений.

[0069] На этапе 209 получают степени достоверности, соответствующие информации о положении.

[0070] После записи информации о положении вероятной области строки символов, пройденной шаблоном точек сегментации, могут быть получены степени достоверности, соответствующие информации о положении.

[0071] Следует отметить, что способ получения степеней достоверности в варианте осуществления изобретения включает в себя:

получение первого числа первых эффективных пиксельных точек вероятной области строки символов на левой границе точки сегментации символа, где шаблон точек сегментации включает в себя множественные точки сегментации символов, каждая из точек сегментации символа соответствует одному символу в строке символов, каждая из точек сегментации символа включает в себя левую границу и правую границу, и первые эффективные пиксельные точки являются пиксельными точками со значениями уровней яркости в заранее заданном первом пороговом диапазоне;

получение первого значения оценки на основе первого числа и заранее заданного первого весового значения;

получение второго числа вторых эффективных пиксельных точек вероятной области строки символов на правой границе точки сегментации символа, где вторые эффективные пиксельные точки являются пиксельными точками со значениями уровней яркости в заранее заданном втором пороговом диапазоне;

получение второго значения оценки на основе второго числа и заранее заданного второго весового значения;

получение третьего числа третьих эффективных пиксельных точек вероятной области строки символов в пределах шаблона точек сегментации, где третьи эффективные пиксельные точки являются пиксельными точками с уровнями яркости в заранее заданном третьем пороговом диапазоне;

получение третьего значения оценки на основе третьего числа и заранее заданного третьего весового значения и

получение степеней достоверности, соответствующих информации о положении, на основе первого значения оценки, второго значения оценки и третьего значения оценки.

[0072] Первое значение оценки, второе значение оценки и третье значение оценки, соответственно, получают путем введения первого весового значения, второго весового значения и третьего весового значения, а степени достоверности, соответствующие информации о положении, получают путем синтеза первого значения оценки, второго значения оценки и третьего значения оценки, что позволяет степеням достоверности более точно отражать сегментацию и сделать возможности против загрязнений шаблона точек сегментации, соответствующей информации о положении вероятной области строки символов, более точными и эффективными.

[0073] На этапе 210 положение с наивысшей степенью достоверности определяется как оптимальное положение сегментации.

[0074] После получения степеней достоверности различных положений, положение с наивысшей степенью достоверности может быть определено как оптимальное положение сегментации.

[0075] На этапе 211 вероятная область строки символов сегментируется на основе шаблона точек сегментации и оптимального положения сегментации для получения множественных областей отдельного символа.

[0076] После того, как положение с наивысшей степенью достоверности определено как оптимальное положение сегментации, вероятная область строки символов может быть сегментирована на основе шаблона точек сегментации и оптимального положения сегментации для получения множественных областей отдельного символа.

[0077] На этапе 212 распознавание символа выполняется на каждой из областей отдельного символа для получения соответствующего результата распознавания.

[0078] После получения множественных областей отдельного символа, распознавание символа может быть выполнено в каждой из областей отдельного символа для получения соответствующего результата распознавания.

[0079] В варианте осуществления изобретения первое значение оценки, второе значение оценки и третье значение оценки соответственно получают путем введения первого весового значения, второго весового значения и третьего весового значения, а степени достоверности, соответствующие информации о положении, получают путем синтеза первого значения оценки, второго значения оценки и третьего значения оценки, что позволяет степеням достоверности отражать точность сегментации и способность против загрязнений шаблона точек сегментации, соответствующей информации о положении вероятной области строки символов более точно и эффективно.

[0080] Кроме того, получение кривой проекции двоичного изображения для изображения, предназначенного для распознавания, и обновление верхней границы и нижней границы шаблона точек сегментации на основе кривой проекции, что позволяет верхней границе и нижней границе шаблона точек сегментации быть ближе к строке символов, вследствие чего обеспечиваются гарантии для последующей сегментации против загрязнений и точного распознавания символов.

[0081] Способ сегментации и распознавания символов описывается в вышеупомянутом втором варианте осуществления изобретения в аспекте улучшения возможностей против загрязнений, и далее способ сегментации и распознавания символов описывается более подробно в другом аспекте. Со ссылкой на ФИГ. 3, способ сегментации и распознавания символов в соответствии с третьим вариантом осуществления настоящего изобретения включает в себя шаги 301-315.

[0082] На этапе 301 данные изображения собираются для получения изображения, предназначенного для распознавания.

[0083] Прежде всего, данные изображения собираются для получения изображения, предназначенного для распознавания. Данные изображения могут быть взяты с банкнот, билетов, счетов, печатей на упаковке, компоновок книги и так далее.

[0084] На этапе 302 область, представляющая интерес, где располагается строка символов, позиционируется на изображении, предназначенном для распознавания.

[0085] После получения изображения, предназначенного для распознавания, область, представляющая интерес, где располагается строка символов, может быть позиционирована на изображении, предназначенном для распознавания. Становится понятным, что если тип или источник изображения, предназначенного для распознавания, заранее известен, то становится легко позиционировать положение строки символов, предназначенной для распознавания. Например, если изображение, предназначенное для распознавания, представляет собой фронт банкноты (Женьминьби), положением вероятной области строки символов является положение кодовых номеров банкноты, которые расположены в нижнем левом углу изображения, предназначенного для распознавания.

[0086] Следует отметить, что область, представляющая интерес, может быть ориентировочно позиционирована на изображении, предназначенном для распознавания, и точное позиционирование не требуется до тех пор, пока приблизительное положение строки символов может быть быстро позиционировано.

[0087] На этапе 303 аффинное преобразование и билинейная интерполяция выполняются на области, представляющей интерес, для получения корректирующего изображения.

[0088] После позиционирования области, представляющей интерес, аффинное преобразование и билинейная интерполяция могут быть выполнены на области, представляющей интерес, для получения корректирующего изображения. Становится понятным, что корректирующее изображение, сформированное выполнением аффинного преобразования и билинейной интерполяции, в большей степени способствует сегментации и распознаванию символа.

[0089] На этапе 304 вероятную область строки символов располагаются на корректирующем изображении.

[0090] После получения корректирующего изображения, вероятная область строки символов может быть расположена на корректирующем изображении. Следует отметить, что положение вероятной области строки символов на корректирующем изображении должно быть точно позиционировано, то есть, позиционирование должно быть безошибочным, а случай, когда вероятная область строки символов точно охватывает строку символов, требуемую для распознавания, является лучшим, в плане уменьшения времени корректировки шаблона точек сегментации на последующих шагах. Таким образом, эффективность повышается.

[0091] На этапе 305 получают предварительную информацию заранее заданной строки символов.

[0092] Кроме того, может быть получена предварительная информация заранее заданной строки символов. Предварительная информация строки символов включает в себя количество символов, интервал между символами и размер символов. В частности, может быть получена предварительная информация заранее заданной строки символов, на основе типа изображения, предназначенного для распознавания, или на основе характеристики ориентации вероятной области строки символов.

[0093] Следует отметить, что в случае, когда тип изображения, предназначенного для распознавания, известен, то описание строки символов фиксировано, то есть, количество символов, интервал между символами и размер символов фиксированы. Таким образом, может быть получена соответствующая предварительная информация строки символов. Например, если изображение, предназначенное для распознавания, представляет собой фронт банкноты, то строка символов является кодовыми номерами банкноты и предварительная информация строки символов кодовых номеров банкноты является характерной и может быть установлена в системе заранее. Кроме того, в случае, когда характеристика ориентации вероятной области строки символов известна, то соответствующая предварительная информация строки символов также может быть легко получена. Например, на счет-фактуре присутствует строка символов, такая как "кодовый номер счет-фактуры", "номер счет-фактуры" и "номер заказа", если характеристика ориентации вероятной области строки символов известна, примерное положение, где строка символов располагается на всем изображении, предназначенном для распознавания, будет известна, то есть, может быть известно, к каким типам "кодового номера счет-фактуры", "номера счет-фактуры" и "номера заказа" принадлежит строка символов, таким образом может быть получена соответствующая предварительная информация строки символов.

[0094] На этапе 306 получают соответствующий шаблон точек сегментации на основе предварительной информации строки символов.

[0095] После получения предварительной информации заранее заданной строки символов, может быть получен соответствующий шаблон точек сегментации на основе предварительной информации строки символов. В частности, шаблон точек сегментации создается и инициализируется на основе предварительной информации строки символов. В качестве альтернативного варианта, соответствующий шаблон точек сегментации получают на основе предварительной информации строки символов и заранее заданной индексной таблицы сегментации, а индексная таблица сегментации включает в себя соответствие между предварительной информацией строки символов и шаблоном точек сегментации.

[0096] Следует отметить, что если шаблон точек сегментации создается и инициализируется на основе предварительной информации строки символов, предварительная информация строки символов включает в себя количество символов, интервал между символами и размер символа, то становится легко получить длину и высоту шаблона точек сегментации и создать соответствующий шаблон точек сегментации. В качестве альтернативного варианта, создаются каждую точку сегментации символа, соответствующую каждому символу в предварительной информации строки символов, и получают шаблон точек сегментации упорядочения всех точек сегментации символа в предварительной информации строки символов. Размер символа может быть известен из предварительной информации строки символов, а размер символа включает в себя высоту и ширину символа. Таким образом, может быть определена левая граница, и правая граница, и верхняя граница, и нижняя граница каждой точки сегментации символа. Точки сегментации символов упорядочиваются на основе интервала между символами, чтобы позволить созданному шаблону точек сегментации соответствовать предварительной информации строки символов.

[0097] Следует отметить, что в случае, когда шаблон точек сегментации получают на основе предварительной информации строки символов и заранее заданной индексной таблицы сегментации, индексную таблицу сегментации устанавливают в системе заранее, и шаблон точек сегментации, соответствующий предварительной информации строки символов, может быть сохранен в системе заранее. Таким образом, индексная таблица сегментации и шаблон точек сегментации могут быть запрошены и вызваны, когда это необходимо.

[0098] На этапе 307 получают двоичное изображение для изображения, предназначенного для распознавания.

[0099] После получения изображения, предназначенного для распознавания, может быть получено двоичное изображение для изображения, предназначенного для распознавания. В частности, значения пиксельных точек на изображении, предназначенном для распознавания, которые выше, чем заранее заданный порог, определяют как 1, значения пиксельных точек на изображении, предназначенном для распознавания, которые меньше, чем заранее заданный порог, определяют как 0, и может быть получено двоичное изображение.

[0100] На этапе 308 получают кривую проекции двоичного изображения в горизонтальном направлении.

[0101] После получения двоичного изображения для изображения, предназначенного для распознавания, может быть получена кривая проекции двоичного изображения в горизонтальном направлении.

[0102] На этапе 309 происходит обновление верхней границы и нижней границы шаблона точек сегментации на основе кривой проекции.

[0103] После получения кривой проекции двоичного изображения в горизонтальном направлении, верхняя граница и нижняя граница шаблона точек сегментации могут быть обновлены на основе кривой проекции. В частности, самое верхнее положение, при котором значение уровня яркости больше, чем заранее заданное четвертое пороговое значение в кривой проекции, определяется и обновляется как верхняя граница шаблона точек сегментации и самое нижнее положение, при котором величина уровня яркости больше, чем заранее заданное пятое пороговое значение в кривой проекции, определяется и обновляется как нижняя граница шаблона точек сегментации, что позволяет верхней границе и нижней границе шаблона точек сегментации быть ближе к строке символа, вследствие чего обеспечиваются гарантии для последующей сегментации против загрязнений и точного распознавания символов.

[0104] Следует отметить, что, в качестве альтернативного варианта, верхняя граница и нижняя граница могут быть определены путем сравнения градиента кривой проекции с четвертым пороговым значением или пятым пороговым значением. Например, самое верхнее положение, при котором градиент больше, чем заранее заданное четвертое пороговое значение в кривой проекции, определяется и обновляется как верхняя граница шаблона точек сегментации, и самое нижнее положение, при котором градиент больше, чем заранее заданное пятое пороговое значение в кривой проекции, определяется и обновляется как нижняя граница шаблона точек сегментации.

[0105] На этапе 310 записывается информация о положении вероятной области строки символов, пройденной шаблоном точек сегментации.

[0106] После определения шаблона точек сегментации, может быть записана информация о положении вероятной области строки символов, пройденной шаблоном точек сегментации. Становится понятным, что шаблон точек сегментации может скользить по вероятной области строки символов, пока не будет пройдена вся вероятная область строки символов. Во время прохождения шаблон точек сегментации может оказываться во всех положениях вероятной области строки символов, и соответственно формируется различная информация о положении для различных положений.

[0107] На этапе 311 получают степени достоверности, соответствующие информации о положении.

[0108] После записи информации о положении вероятной области строки символов, пройденной шаблоном точек сегментации, могут быть получены степени достоверности, соответствующие информации о положении.

[0109] Следует отметить, что способ получения степеней достоверности варианте осуществления изобретения включает в себя:

получение первого числа первых эффективных пиксельных точек вероятной области строки символов на левой границе точки сегментации символа, где шаблон точек сегментации включает в себя множественные точки сегментации символов, каждая из точек сегментации символов соответствует одному символу на строке символов, каждая из точек сегментации символов включает в себя левую границу и правую границу, и первые эффективные пиксельные точки представляют собой пиксельные точки с уровнями яркости в заранее заданном первом пороговом диапазоне;

получение первого значения оценки на основе первого числа и заранее заданного первого весового значения;

получение второго числа вторых эффективных пиксельных точек вероятной области строки символов на правой границе точки сегментации символа, где вторые эффективные пиксельные точки представляют собой пиксельные точки со значениями уровней яркости в заранее заданном втором пороговом диапазоне;

получение второго значения оценки на основе второго числа и заранее заданного второго весового значения;

получение третьего числа третьих эффективных пиксельных точек вероятной области строки символов в пределах шаблона точек сегментации, где третьи эффективные пиксельные точки представляют собой пиксельные точки со значениями уровней яркости в заранее заданном третьем пороговом диапазоне;

получение третьего значения оценки на основе третьего числа и заранее заданного третьего весового значения и

получение степеней достоверности соответствующих информации о положении на основе первого значения оценки, второго значения оценки и третьего значения оценки.

[0110] Первое значение оценки, второе значение оценки и третье значение оценки получают, соответственно, путем введения первого весового значения, второго весового значения и третьего весового значения, а степени достоверности, соответствующие информации о положении, получают путем синтеза первого значения оценки, второго значения оценки и третьего значения оценки, что позволяет степеням достоверности отражать точность сегментации и возможности против загрязнений шаблона точек сегментации соответствующей информации о положении вероятной области строки символов более точно и эффективно.

[0111] Следует отметить, что в варианте осуществления изобретения первые эффективные пиксельные точки, вторые эффективные пиксельные точки и третьи эффективные пиксельные точки могут быть, соответственно, пиксельными точками с градиентами в заранее заданном первом пороговом диапазоне, в заранее заданном втором пороговом диапазоне и в заранее заданном третьем пороговом диапазоне.

[0112] На этапе 312 положение с наивысшей степенью достоверности определяется как оптимальное положение сегментации.

[0113] После получения степеней достоверности различных положений, положение с наивысшей степенью достоверности может быть определено как оптимальное положение сегментации.

[0114] На этапе 313 вероятную область строки символов сегментируют на основе шаблона точек сегментации и оптимального положения сегментации для получения множественных областей отдельного символа.

[0115] После того, как будет определено положение с наивысшей степенью достоверности как оптимальное положение сегментации, вероятная область строки символов может быть сегментирована на основе шаблона точек сегментации и оптимального положения сегментации для получения множественных областей отдельного символа.

[0116] На этапе 314 получают данные характеристики символа в области отдельного символа.

[0117] После получения множественных областей отдельного символа, могут быть получены данные характеристики символа в каждой из областей отдельного символа. Данные характеристики символа могут быть данными характеристики контура символа.

[0118] На этапе 315 распознавание символа выполняется на основе данных характеристики символа для получения результата распознавания.

[0119] После того, как будут получены данные характеристики символа в области отдельного символа, распознавание символа может быть выполнено на основе данных характеристики символа для получения результата распознавания.

[0120] В варианте осуществления изобретения корректирующее изображение получают путем выполнения аффинного преобразования и билинейной интерполяции, что обеспечивает подходящую среду для сегментации и распознавания символа, уменьшения времени корректировки шаблона точек сегментации на последующих шагах и повышает эффективность сегментации и распознавания.

[0121] Для простоты понимания далее в настоящем документе описывается практический сценарий способа сегментации и распознавания символов в соответствии с вариантами осуществления настоящего изобретения на основе третьего варианта осуществления изобретения на ФИГ. 3.

[0122] Во-первых, данные изображения собираются для получения данных исходного изображения. Изображение, предназначенное для распознавания, показано на ФИГ. 4. Как показано на ФИГ. 4, область R(r,c), представляющая интерес, где располагается строка символов, быстро позиционируется на собранном исходном изображении. Аффинное преобразование и билинейная интерполяция выполняются на области R(r,c), представляющей интерес, для получения корректирующего изображения pbi(r,c). Как показано на ФИГ. 5a и ФИГ. 5b, область символа точно наложена на корректирующем изображении для получения вероятной области pвероятное(r,c) строки символов.

[0123] Как показано на ФИГ. 6, шаблон M=(m0, m1, m2, … m2i-1) точки сегментации создается и инициализируется на основе предварительной информации строки символов, где i∈[1, N], N является количеством символов, входящих в строку символов, m2(i-1) и m2(i-1)+1 представляют горизонтальную ось левой границы и правой границы точки сегментации символа, соответственно. Число и координаты вершин A и размер hn и wn в шаблоне точек сегментации определяются размером символа. Шаблон точек сегментации на ФИГ. 6 соответствует строке символов на ФИГ. 5a или ФИГ. 5b способом "один к одному" и сохраняется в памяти.

[0124] Данные каждой пиксельной точки в вероятной области pвероятная(r,c) строки символов, значение которой больше, чем заданное пороговое значение, устанавливается в 1, и данные каждой пиксельной точки в вероятной области pвероятное(r,c) строки символов, значение которой меньше, чем заданное пороговое значение, устанавливается в 0. Таким образом, получают двоичное изображение pдвоичное(r,c).

[0125] Верхняя граница поля vНачало и нижняя граница поля vКонец (как показано на ФИГ. 7a, ФИГ. 7b и ФИГ. 7c) символов вычисляются на основе двоичного изображения pдвоичное(r,c). Положение наверху кривой проекции, в котором значение уровня яркости больше, чем заданное пороговое значение Tw, определяется как начальное положение верхней границы, а положение внизу кривой проекции, в котором значение уровня яркости больше, чем заданное пороговое значение Tw, определяется как конечное положение нижней границы.

[0126] Записываются положения pos(r,c) вероятной области pвероятное(r,c) строки символов, пройденные шаблоном точек сегментации.

[0127] Получают степень достоверности, соответствующую положению pos(r,c). Степень достоверности вычисляется на основе синтеза первого значения оценки, второго значения оценки и третьего значения оценки. Подробный процесс вычисления степени достоверности включает в себя:

в вероятной области pвероятное(r,c) строки символов, рассмотрение пиксельных точек на левой границе точки сегментации символа в вертикальном направлении в качестве первых характеристических точек и получение первого значения eЗначение1 оценки путем умножения числа N1 первых характеристических точек со значениями уровней яркости в заданном пороговом значении T1 на заданное весовое значение w1, а именно, eЗначение1=N1×w1; рассмотрение пиксельных точек на правой границе точки сегментации символа в вертикальном направлении в качестве вторых характеристических точек и получение второго значения eЗначение2 оценки путем умножения числа N2 вторых характеристических точек со значениями уровней яркости в заданном пороговом значении T2 на заданное весовое значение w2, а именно, eЗначение2=N2×w2; рассмотрение пиксельных точек вероятной области строки символов в пределах шаблона точек сегментации в качестве третьих характеристических точек и получение третьего значения eЗначения3 оценки путем умножения числа N3 третьих характеристических точек со значениями уровней яркости в заданном пороговом значении T3 на заданное весовое значение w3, а именно, eЗначение3=N3×w3, и суммирование первого значения оценки, второго значения оценки и третьего значения оценки для получения степени Ccur достоверности шаблона точек сегментации в текущем положении, а именно, Ccur=eЗначение1+eЗначение2+eЗначение3.

[0128] После получения степеней достоверности, соответствующих всем положениям pos(r,c), положение с наивысшей степенью достоверности определяется как оптимальное положение сегментации.

[0129] Кривая проекции каждого символа получается на основе оптимального положения M сегментации в сочетании с горизонтальной проекцией двоичного изображения pдвоичное(r,c). Как показано на ФИГ. 8, положение, в котором значение уровня яркости пиксельной точки в верхней части кривой проекции i-того символа является прежде всего больше, чем заданное пороговое значение Tm, записывается и сохраняется в Верх(i), а положение, где значение уровня яркости пиксельной точки в нижней части кривой проекции i-того символа является прежде всего больше, чем заданное пороговое значение Tm, записывается и сохраняется в Низ(i). Таким образом, получают точное положение каждого символа. Как показано на ФИГ. 9a и ФИГ. 9b, область отдельного символа, сегментированная в соответствии со способом, является символом 2, испорченным загрязнением, сцепленный символ 5 и испорченный символ 7 хорошо сегментированы и распознаны. По сравнению с эффектом сегментации и результатом распознавания в традиционном способе, показанном на ФИГ. 10, эффект сегментации в способ значительно улучшен.

[0130] Отдельный символ сегментируется на основе указанного выше положения конечной точки сегментации, и вычисляются данные характеристики отдельного символа. Данные характеристики могут быть, но без ограничения, характеристикой контура символа.

[0131] Отдельный символ распознается на основе данных характеристики отдельного символа.

[0132] Принимая во внимание вышесказанное, поскольку предварительная информация строки символов полностью рассматривается в настоящем раскрытии данного изобретения, воздействия сложных ситуаций, таких как загрязненный символ, сцепленный символ и испорченный символ, преодолеваются путем введения возможного шаблона точек сегментации, который может быстро сегментировать символы, тем самым повышая эффективность распознавания символа.

[0133] Специалисту в данной области техники понятно, что для облегчения и простоты описания, подробный рабочий процесс описанных выше систем, устройств и блоков может относиться к соответствующему процессу в способе осуществления настоящего изобретения, что не повторяется в настоящем документе.

[0134] Вышеупомянутые варианты осуществления настоящего изобретения предназначены только для иллюстрации, но не для ограничения технических решений раскрытия настоящего изобретения. Несмотря на то, что раскрытие настоящего изобретения проиллюстрировано подробно со ссылкой на вышеприведенные варианты осуществления настоящего изобретения, должно быть понятно специалистам в данной области техники, что технические решения в соответствии с вышеприведенными вариантами осуществления настоящего изобретения могут быть модифицированы или некоторые технические характеристики в технических решениях могут быть заменены на эквивалентные, и указанные модификации или замены не приводят к отходу существа технических решений от сущности и объема технических решений в соответствии с вариантами осуществления настоящего изобретения.

Похожие патенты RU2678485C1

название год авторы номер документа
СПОСОБ И СИСТЕМА УПРАВЛЕНИЯ БАНКОМАТАМИ 2016
  • Лю, Юнцюань
  • Лю, Вэйшэн
  • Сунь, Вэйчжун
  • Чжао, Наньнань
  • Ван, Фуянь
  • Цзинь, Бинь
  • Лю, Юньцзян
  • Лу, Бинфэн
  • Цуй, Яньшэнь
  • Цзинь, Ди
  • Цзяо, Жэньган
  • Гэ, Лань
RU2708422C1
СПОСОБ РАСПОЗНАВАНИЯ БАНКНОТ НА ОСНОВЕ НАКОПЛЕНИЯ ПЫЛИ В СОРТИРОВЩИКЕ И СОРТИРОВЩИК 2015
  • Ван Ян
  • Лян Тяньцай
RU2643493C1
Способ оценки действительности документа при помощи оптического распознавания текста на изображении круглого оттиска печати/штампа на цифровом изображении документа 2020
  • Алиев Михаил Александрович
  • Арлазаров Владимир Викторович
  • Маталов Даниил Павлович
  • Николаев Дмитрий Петрович
  • Полевой Дмитрий Валерьевич
  • Усилин Сергей Александрович
RU2750395C1
СПОСОБ РАСПОЗНАВАНИЯ ТЕКСТА НА ИЗОБРАЖЕНИЯХ ДОКУМЕНТОВ 2021
  • Гордеев Дмитрий Владимирович
  • Кондратьев Кирилл Андреевич
  • Островский Константин Игоревич
RU2768544C1
СПОСОБ И УСТРОЙСТВО ДЛЯ ОБУЧЕНИЯ МОДЕЛИ РАСПОЗНАВАНИЯ ЛИЦА И УСТРОЙСТВО ДЛЯ ОПРЕДЕЛЕНИЯ КЛЮЧЕВОЙ ТОЧКИ ЛИЦА 2019
  • Чэнь, Дэцзянь
RU2770752C1
СПОСОБ И СИСТЕМА АВТОМАТИЧЕСКОЙ ПРОВЕРКИ ПРИСУТСТВИЯ ЛИЦА ЖИВОГО ЧЕЛОВЕКА В БИОМЕТРИЧЕСКИХ СИСТЕМАХ БЕЗОПАСНОСТИ 2005
  • Мун Ван Джин
  • Мурынин Александр Борисович
  • Базанов Петр Валерьевич
  • Буряк Дмитрий Юрьевич
  • Ли Юнг Джин
  • Янг Хае Кванг
RU2316051C2
РАСПОЗНАВАНИЕ РУКОПИСНОГО ТЕКСТА ПОСРЕДСТВОМ НЕЙРОННЫХ СЕТЕЙ 2020
  • Упшинский Андрей Леонидович
RU2757713C1
СПОСОБ РАСПОЗНАВАНИЯ СИМВОЛА НА БАНКНОТЕ И СОПРОЦЕССОР ДЛЯ ВЫЧИСЛИТЕЛЬНОЙ СИСТЕМЫ УСТРОЙСТВА ДЛЯ ОБРАБОТКИ БАНКНОТ 2019
  • Минин Петр Валерьевич
  • Письменный Дмитрий Геннадиевич
  • Камбалин Сергей Викторович
RU2707320C1
СПОСОБ И УСТРОЙСТВО ДЛЯ СЕГМЕНТАЦИИ ИЗОБРАЖЕНИЯ 2014
  • Ван Линь
  • Цинь Цюпин
  • Чэнь Чжицзюнь
RU2596580C2
СПОСОБ РАСПОЗНАВАНИЯ ЗНАКОВ 2008
  • Иванов Александр Иванович
  • Андреев Дмитрий Юрьевич
  • Воячек Сергей Александрович
  • Елфимов Андрей Владимирович
RU2390843C2

Иллюстрации к изобретению RU 2 678 485 C1

Реферат патента 2019 года СПОСОБ СЕГМЕНТАЦИИ И РАСПОЗНАВАНИЯ СИМВОЛОВ

Изобретение относится к области вычислительной техники. Технический результат заключается в увеличении эффективности распознавания символа. Способ включает этапы, на которых: собирают данные изображения; позиционируют вероятную область строки символов на изображении; получают предварительную информацию заранее заданной строки символов; получают двоичное изображение из изображения; получают кривую проекции двоичного изображения; получают соответствующий шаблон точек сегментации на основе предварительной информации строки символов; получают степени достоверности различных положений в вероятной области строки символов; определяют положение с наивысшей степенью достоверности как оптимальное положение сегментации; сегментируют вероятную область строки символов; выполняют распознавание символа в каждой из областей отдельного символа. 9 з.п. ф-лы, 10 ил.

Формула изобретения RU 2 678 485 C1

1. Способ сегментации и распознавания символов, включающий в себя этапы, на которых:

собирают данные изображения для получения изображения, которое должно быть распознано;

позиционируют вероятную область строки символов на изображении, которое должно быть распознано;

получают предварительную информацию заранее заданной строки символов, причем предварительная информация строки символов включает в себя количество символов, интервал между символами и размер символа;

получают двоичное изображение из изображения, которое должно быть распознано;

получают кривую проекции двоичного изображения, причем кривая проекции двоичного изображения представляет собой вертикальное распределение уровней яркости;

получают соответствующий шаблон точек сегментации на основе предварительной информации строки символов;

получают степени достоверности различных положений в вероятной области строки символов, пройденной шаблоном точек сегментации;

определяют положение с наивысшей степенью достоверности как оптимальное положение сегментации;

сегментируют вероятную область строки символов на основе шаблона точек сегментации и оптимального положения сегментации для получения множества областей отдельного символа; и

выполняют распознавание символа в каждой из областей отдельного символа для получения соответствующего результата распознавания.

2. Способ по п. 1, в котором получение предварительной информации заранее заданной строки символов включает в себя этапы, на которых:

получают предварительную информацию заранее заданной строки символов на основе типа изображения, которое должно быть распознано, или

получают предварительную информацию заранее заданной строки символов на основе характеристики ориентации вероятной области строки символов.

3. Способ по п. 1, в котором получение соответствующего шаблона точек сегментации на основе предварительной информации строки символов включает в себя этапы, на которых:

создают и инициализируют шаблон точек сегментации на основе предварительной информации строки символов или

получают соответствующий шаблон точек сегментации на основе предварительной информации строки символов и заранее заданной индексной таблицы сегментации, причем индексная таблица сегментации включает в себя соответствие между предварительной информацией строки символов и шаблоном точек сегментации.

4. Способ по п. 1, в котором получение степеней достоверности различных положений на вероятной области строки символов, пройденной шаблоном точек сегментации, включает в себя этапы, на которых:

записывают информацию о положении вероятной области строки символов, пройденной шаблоном точек сегментации, и

получают степени достоверности, соответствующие информации о положении.

5. Способ по п. 4, в котором получение степеней достоверности, соответствующих информации о положении, включает в себя этапы, на которых:

получают первое количество эффективных первых пиксельных точек вероятной области строки символов на левой границе точки сегментации символа, причем шаблон точек сегментации включает в себя множество точек сегментации символа, каждая из точек сегментации символа соответствует одному символу в строке символов, каждая из точек сегментации символа содержит левую границу и правую границу, и первые эффективные пиксельные точки являются пиксельными точками со значениями уровней яркости в заранее заданном первом пороговом диапазоне;

получают первое значение оценки на основе первого количества и заранее заданного первого весового значения;

получают второе количество вторых эффективных пиксельных точек вероятной области строки символов на правой границе точки сегментации символа, причем вторые эффективные пиксельные точки являются пиксельными точками со значениями уровней яркости в заранее заданном втором пороговом диапазоне;

получают второе значение оценки на основе второго количества и заранее заданного второго весового значения;

получают третье количество третьих эффективных пиксельных точек вероятной области строки символов в шаблоне точек сегментации, причем третьи эффективные пиксельные точки являются пиксельными точками со значениями уровней яркости в заранее заданном третьем пороговом диапазоне;

получают третье значение оценки на основе третьего количества и заранее заданного третьего весового значения и

получают степени достоверности, соответствующие информации о положении, на основе первого значения оценки, второго значения оценки и третьего значения оценки.

6. Способ по любому из пп. 1-5, при этом после получения кривой проекции двоичного изображения способ дополнительно содержит этап, на котором обновляют верхнюю границу и нижнюю границу шаблона точек сегментации на основе кривой проекции.

7. Способ по п. 6, в котором обновление верхней границы и нижней границы шаблона точек сегментации на основе кривой проекции включает в себя этапы, на которых:

определяют и обновляют самое верхнее положение, в котором значение уровня яркости больше, чем заранее заданное четвертое пороговое значение, на кривой проекции как верхнюю границу шаблона точек сегментации и

определяют и обновляют самое нижнее положение, в котором значение уровня яркости больше, чем заранее заданное пятое пороговое значение, на кривой проекции как нижнюю границу шаблона точек сегментации.

8. Способ по любому из пп. 1-5, в котором позиционирование вероятной области строки символов на изображении, которое должно быть распознано, включает в себя этапы, на которых:

позиционируют представляющую интерес область, где располагается строка символов, на изображении, которое должно быть распознано;

выполняют аффинное преобразование и билинейную интерполяцию на представляющей интерес области для получения корректирующего изображения; и

позиционируют вероятную область строки символов на корректирующем изображении.

9. Способ по любому из пп. 1-5, в котором выполнение распознавания символа в каждой из областей отдельного символа для получения соответствующего результата распознавания включает в себя этапы, на которых:

получают данные характеристики символа в области отдельного символа; и

выполняют распознавание символа на основе данных характеристики символа для получения результата распознавания.

10. Способ по п. 9, в котором данные характеристики символа являются данными характеристики контура символа.

Документы, цитированные в отчете о поиске Патент 2019 года RU2678485C1

EP 2830024 A1, 28.01.2015
US 6356655 B1, 12.03.2002
US 6473517 B1, 29.10.2002
RU 2007116873 A, 20.11.2008.

RU 2 678 485 C1

Авторы

Ван, Вэйфэн

Цю, Синьхуа

Ван, Жунцю

Ван, Кунь

Даты

2019-01-29Публикация

2015-06-26Подача