Способ контроля достоверности распознавания символов Советский патент 1976 года по МПК G06K9/00 

Описание патента на изобретение SU533947A1

между собой фрагменты изображения символов входного алфавита.

Сущность предлагаемого способа заключается в следующем.

Путем фотомонтажа или другим методом синтезируют изображения символов контрольной выборки для всех возможных пар эталонных изображений символов путем их совмещения так, что к эталонному изображению одного символа добавляются фрагменты изображения другого эталонного символа из входного алфавита.

В результате формируется укороченная контрольная выборка синтезированных изображений символов, ее предъявляют читающему автомату, у которого отключен канал для формирования сигналов, соответствующих отказу от распознавания на неразборчивых символах или знаках.

В синтезированных символах с помощью известных методов (например, ретуши) удаляют несовпадающие фрагменты изображений каждых двух совмеп1,енных между собой эталонных символов.

В результате такой операции получают новый синтезированный символ, отличный от эталонного, который может быть включен в контрольную выборку.

Частным случаем способа по п. 1 является совещение двух букв: ПиН, в результате которого получается синтезированный символ Н. Исправный и хорошо отлаженный читающий автомат примерно в 50% случаев классифицирует такое синтезированное изображение, как Н, и в стольких же случаях, как П. Затем изготавливают документы, содержащие все синтезированные изображения, и проводят стадию опробования на заведомо исправных читающих автоматах, однотипных с контролируемым. Для дальнейщего использования оставляют граничные изображения, правильно распознаваемые исправными читающими автоматами с вероятностью, возможно более близкой к 50%. Синтезированное изображение считается распознанным правильно, если оно отнесено к любому из классов, из элементов изображений которых это граничное изображение синтезировано. Полученные в результате многократного отбора синтезированные изображения предъявляют для распознавания контролируемого читающему автомату. Если у последнего в результате длительной эксплуатации наметилась тенденция к предпочтению одного из классов, например класс символов Н предпочитается классу П, то это немедленно отразится на распределении ответов при распознавании выборки из граничных изображений типа П: увеличится число ответов класса Н за счет ответов класса П.

Необходимо отметить, что даже с помощью большой выборки из обычных изображений эту тенденцию предпочтения у контролируемого автомата не всегда можно обнаружить. Таким образом, предлагаемый способ обладает

в известной степени диагностическими качествами.

Сравним объем выборки, который требуется для проверки качества распознавания читающего автомата на обычных изображениях, с требуемым объемом выборки граничных изображений. Сравнительный анализ проведем для случая двух классов. Пусть читающий автомат работает с вероятностью ощибки, равной 10, а решение о том, что автомат неисправен, принимается, если вероятность ошибки превыщает 2-10.

Обычная в таких случаях процедура проверки исправности автомата заключается в

том, что проводится распознавание выборки объема п и принимается решение об исправности или неисправности автомата в зависимости от того, превышает ли количество ошибочно распознанных знаков порог 1-5-10 п.

Для того чтобы такая процедура обеспечивала достоверность принятого решения не ниже 0,95, объем выборки должен равняться около 80 млн. Можно показать, что если вероятность ошибочного распознавания обычных знаков меняется в пределах 10 -2-10 то вероятность ошибочного распознавания граничных знаков изменяется в пределах 0,5-0,54. Процедура проверки автомата в этом случае заключается

в распознавании выборки граничных знаков и сравнении процента ошибочно распознанных знаков с норогом 52%. Для обеспечения достоверности нринятого об автомате решения не ниже 0,95 достаточен объем 6300 знаков.

Таким образом, из приведенных цифр видно, что требуемый объем выборки при предлагаемом способе значительно (более чем в 10000 раз) меньше, чем при известном. Технико-экономическую эффективность способа

можно оценить следующем образом. Если читающий автомат считывает документы формата 210x297, то на таком документе помещается около 2000 знаков. При предлагаемом способе нужно для проверки качества распознавания (для двух классов) подготовить 3 документа (страницы), а при известном - 40000 документов. При производительности 40 страниц в день для одной машинистки и машбюро в 10 человек для подготовки такой

выборки необходимо 100 дней.

Формула изобретения

1.Способ контроля достоверности раснознавания символов, основанный на формировании

контрольной выборки изображений символов, отличающийся тем, что, с целью сокращения времени контроля, изображения символов контрольной выборки синтезируют совмещение изображений каждых двух символов из входного алфавита.

2.Способ контроля достоверности раснознавания символов по п. 1, отличающийся тем, что в синтезированных изображениях

символов контрольной выборки удаляют не5совпадающие между собой фрагменты изображения символов входного алфавита. Источники информации, принятые во внимание при экспертизе:5 1. Бирман Н. Я. Статистические способы выделения призиаков и оценка качества распоз6павання. Сб. «Автоматическое чтение текста, М., 1967, с. 30. 2. Жлабис Р. К вопросу контроля и оцекки параметров читающи.х устройств. Сб. «Автоматизация ввода письменных знаков в ЭВМ. Материалы Всесоюзной конференции, Вильнюс. 1967, с. 57 (прототип).

Похожие патенты SU533947A1

название год авторы номер документа
Способ контроля цифровых измерительных приборов 1988
  • Мизинов Виктор Викторович
SU1569757A1
Способ транскрибирования речи по цифровым сигналам с низкоскоростным кодированием 2023
  • Аладинский Виктор Алексеевич
  • Кузьминский Сергей Владиславович
  • Павлов Андрей Петрович
  • Смирнов Павел Леонидович
RU2801621C1
СПОСОБ РАСПОЗНАВАНИЯ ТЕКСТОВОЙ ИНФОРМАЦИИ ИЗ ГРАФИЧЕСКОГО ФАЙЛА С ИСПОЛЬЗОВАНИЕМ СЛОВАРЕЙ И ДОПОЛНИТЕЛЬНЫХ ДАННЫХ 2005
  • Анисимович Константин Владимирович
  • Рыбкин Владимир Юрьевич
  • Шамис Александр Львович
RU2295154C1
УСТРОЙСТВО ДЛЯ СЧИТЫВАНИЯ ПЕЧАТНЫХ ЗНАКОВ 1972
SU428415A1
РАСПОЗНАВАНИЕ СИМВОЛОВ С ИСПОЛЬЗОВАНИЕМ ИЕРАРХИЧЕСКОЙ КЛАССИФИКАЦИИ 2018
  • Журавлев Алексей Алексеевич
RU2693916C1
ВЫЯВЛЕНИЕ КИТАЙСКОЙ, ЯПОНСКОЙ И КОРЕЙСКОЙ ПИСЬМЕННОСТИ 2013
  • Атрощенко Михаил Юрьевич
  • Дерягин Дмитрий Георгиевич
  • Чулинин Юрий Георгиевич
RU2613847C2
ОПТИЧЕСКОЕ РАСПОЗНАВАНИЕ СИМВОЛОВ ПОСРЕДСТВОМ ПРИМЕНЕНИЯ СПЕЦИАЛИЗИРОВАННЫХ ФУНКЦИЙ УВЕРЕННОСТИ, РЕАЛИЗУЕМОЕ НА БАЗЕ НЕЙРОННЫХ СЕТЕЙ 2018
  • Журавлев Алексей Алексеевич
RU2703270C1
РАСПОЗНАВАНИЕ РУКОПИСНОГО ТЕКСТА ПОСРЕДСТВОМ НЕЙРОННЫХ СЕТЕЙ 2020
  • Упшинский Андрей Леонидович
RU2757713C1
СПОСОБ ФАКСИМИЛЬНОГО РАСПОЗНАВАНИЯ И ВОСПРОИЗВЕДЕНИЯ ТЕКСТА ПЕЧАТНОЙ ПРОДУКЦИИ 2003
  • Королев И.Ф.
  • Курбатов В.С.
RU2260208C2
КОМПЬЮТЕРНОЕ УСТРОЙСТВО ДЛЯ ЧТЕНИЯ ПЛОСКОПЕЧАТНОГО ТЕКСТА 1996
  • Золотов С.А.
  • Калинин Н.Н.
  • Балахонцев А.Н.
RU2113726C1

Реферат патента 1976 года Способ контроля достоверности распознавания символов

Формула изобретения SU 533 947 A1

SU 533 947 A1

Авторы

Коршак Виталий Кириллович

Даты

1976-10-30Публикация

1973-08-13Подача