Устройство для обнаружения искажений в тексте Советский патент 1982 года по МПК G06F17/21 

Описание патента на изобретение SU920730A1

(5) УСТРОЙСТВО ДЛЯ ОБНАРУЖЕНИЯ ИСКАЖЕНИЙ

1

Изобретение относится к вы1 1слительной технике и может быть исполь зовано в системах обработки текстовой информацииj

Известны устройства для проверки правильности текстов, содержащие регистр сдвига, память и схемы сравнения и осуществляющие анализ текста на основе априорных вероятностей биграмм, триграмм и более длинных сочетаний симовлов

Недостаток этих устройств состоит в их сложности.

Наиболее близким к предлагаемому по технической сущности является устройство для обнаружения искажений в тексте, содержащее регистр сдвига кодов символов, входом соединенный с информационным входом устройства, а выходом - со входом блока хранения вероятностей & грамм, выходы которого соединены с первы1 1 входами соответствующих схем сравнения , вторыми входами подключены

В ТЕКСТЕ

КО входу задания порога, а выходами к регистру фиксации ошибок, выход которого является выходом устройства 2 1.

Недостаток этого устройства состоит в низкой достоверности работы и значительных аппаратурных затратах, так как обнаружение ошибок 8 тексте основано на существовании для определенного словаря используеtoмого языка ограниченного количества разрешенных биграмм, вероятности которых помещаются в блоке хранения вероятностей биграмм. При этом в устройстве не обнаруживаются ошиб15ки, связанные с изменением длины слова или порядка следования символов в тексте. Кроме того, в нем необходимо использовать блок хранения вероятностей биграмм большой емкое

ти, что требует значительных затрат оборудования.

Целью изобретения является повышение достоверности работы и сокращение annapaiypHbix затрат устройства.

Поставленная цель достигается тем, что в устройство, содержаидее регистр кодов символов и регистр фиксации ошибок, выход которого является, выходом устройства, введены блок выделения слова, включающий два элемента И и дешифратор кода пробела, распределитель, блок дешифрации допустимых биграмм и блок дешифрации допустимых корреляций символов, причем первый выход регистра кодов символов соединен через дешифратор пробела с первым входом первого элемента И, вход - с выходом второго элемента И, второй выход - с управляющими входами блоков дешифрации допустимых биграмм и корреляций символов, выходы которых подключены к соответствующим входам регистра фиксации ошибок, а информационные входы через распределитель к группе выходов регистра кодов символов, первый и второй входы второго элемента И подключены соответственно к информационному входу устройства и выходу первого элемента И, вторым входом соединенного с тактовым входом устройства.

На чертеже представлена структур ная схема устройства.

Устройство содержит регистр 1 кодов символов, распределитель 2, под ключенный цепями 3 и 4 к блоку 5 дешифрации допустимых биграмм и к блоку 6 дешифрации допустиMbfx корреля ций символов, регистр 7 фиксации ошибок, подключенный к выходу 8 устройства, блок 9 выделения слова, включающий элементы И 10 и 11 и дешифратор 12, информационный 13 и тактовый Н входы устройства.

Устройство работает следующим образом.

В исходном состоянии регистр 1 находится в обнуленном состоянии„ Распределитель 2 вырабатывает нулевые кодьи На выходах блоков м 6 и регистра 7 сигналы отсутствуют. По тактовым сигналам, поступающим по входу Н, через элемент И 10 разрешается последовательное поступление кодов символов текста через элемент И 11.

При поступлении неискаженного текста по входу 13 коды символов накапливаются на регистре 1 до тех пор, пока не появится код очередного пробела. В этом случае дешифратор 12 формирует сигнал, блокирующий элемент И 1G и прерывакхций поступление кодов символов через элемент И 11. Таким образом, на регистре 1 оказывается выделенной совокупность кодов символов, соответствуюи их слову текста.

Распределитель 2 формирует в цепях 3 пары кодов биграммы отношений 2-3, 3, и ТеД, символов, а в цепях - пары кодов корреляции 2-k , 2-5, и ТоД. символов выделенного слова. В соответствии с кодом первого символа слова, поступающего второго выхода регистра 1 с: блоки 5 и 6, осуществляется подключение рабочих дешифраторов кодов пар 2-3} 3 и ТоДо символов и пар 2-, 2-5, ) и т.д. символов выделенного слова соответственно. Искажения обнаруживаются блоками 5 и 6 в том случае, если хотя ,бы одна из биграмм анализируемого слева является запрещенной комбинацией. Для неискаженных слов текста коды отношений символов и корреляции символов, соответствующие зафиксированному первому символу слова, являются разрешеннь Ми, При этом на выходах блоков 5 и 6 отсутствуют сигналы, а на выходе регистра 7 отсутствуют сигналы об ошибке в тексте. Дальнейшая разблокировка поступления кодированного текста через элемент И 11 осуществляется тактовым сигналом с выхода элемента И 10,

Работа устройства в-случае ошибок в кодированном тексте производится следующим образом.

Допустим, что по входу 13 поступает последовательность кодов символов текста, соответствующих искаженному слову МАОК образованному вследствие пропуска символа 3 на третьей позиции слова (правильно МАЗОК). Коды символов накапливаются на регистре 1 до появления пробела после последнего символа KV В этому случае дешифратора 12 формирует сигнал, по которому запрещается поступление кодов символов через элемент И 1К Таким образом, на регистре 1 выделены коды символов слова МАОК.,

Распределитель 2 вырабатывает в цепях 3 пары кодов отношений 2-3 и 3 символов слова, т.е. пары кодов символов АС и В цепях фор

мируются коды корреляции 2- (Ж) символов слова, просмотр которых осуществляется .с помощью, рабочих .дешифраторов блоков 5 и 6. Так как пары кодов отношений 2-3 (АО) и 3-i (OK) символов являются запрещенными комбинациями для слова, начинающего с символа М, то блок 5 вырабатывается сигнал, записываемый в регистр 7, по которому в выходной цепи 8 формируется сигнал об ошибке в тексте

Допустим, что по входу 13 поступает последовательность кодов символов текста, соответствующих искаженному слову УКВА - (правильно БУКВА), образованному вследствие пропуска первого символа Б слова. После ввода слова в регистр 1, т.е. появления кода пробела вслед за последним символом А - , распределитель 2 вырабатывает в цепях 3 пары кодов отношений 2-3 и символов слова, т.е. пары кодов отношений символов KB и ВА. В цепях формируются пары кодов корреляции сим.волов 2-Ц (КА). В блоках 5 и 6 осуществляется анализ кодов символов слова. Так как пары кодов 2-3 (КБ) и 3- (ВА) символов являются запрещенными комбинациями для слов, начинающихся с символа У, то на выход блока 5 вырабатывается сигнал об ошибке, поступающий на регистр 7. Пара кодов (КА) символов является запрещенной для слова, наминающегося с символа У, поэтому рабо« ie дешифраторы блока б вырабатывают на выходных шинах сигнал, по которому на выходе 8 устройства формируется сигнал об ошибке в тексте. Таким образом осуществляется работа устройства при обнаружении ошибок, связанных с пропуском символов слова.

Допустим, что в последовательности символов текста содержится искаженное слово БУКХВА, образовавшееся вследствие добавления символа X на четвертую позицию слова правильно ) .

После ввода слова с регистр 1 распределитель 2 вырабатывает в цепях 3 пары кодов отношений 2-3, З, 5 5-6 символов слова, т.е. пары кодов отношений символов ВА. В цепях k формируются пары кодов корреляции 2-, 2-5, ,. 3-6 символов, т.е. УХ, УВ, КБ,

КА, Так как пары кодов (КХ) символов, 4-5 (ХВ), 5-6 (ВА) являются запрещенными комбинациями для слова, начинающегося с символа Б, то рабочие дешифраторы блока 5 вырабатывают на выходнах шинах сигнал об ошибке, поступающий на регистр 7- Пары кодов символов 2(УХ),2-5 (УВ),3-5 (KB),3-6 (КА)

является запрещенными для слова, на,чинающегося с символа Б, поэтому рабочие дешифраторы блока 6 вырабатывают на выходных шинах сигнал, поступающий в регистр 7, с выхода.которого на выход 8 выдается сигнал об ошибке в тексте.

Использование блока выделения слова позволяет осуществить просмотр смысловых элементов текста - группы

символов, заключенных между последовательными пробелами в тексте Формирование пар кодов отношений и корреляции символов, число которых определяется длиной слова, позволяет учитывать позиции занимаемых си мволо в в ело ве.

Дешифратор кодов пар символов в зависимости от кода первого символа слова позволяет обнаруживать сочетания символов, недопустимые с ; точки зрения словарных конструкций используемого языка.

Таким образом, устройств позволяет исключить возможность пропуска ошибок в текстах, связанных с изменением длины слова, что повышает достоверность работы устройства Кроме того, устройство не содержит многоразрядного блока памяти

большого объема.

Формула изобретения

Устройство для обнаружения искажений в тексте, содержащее регистр кодов символов и регистр фиксации ошибок, выход которого является выходом устройства, отли чаю-щ е е с я тем, что, с целью повышения достоверности работы устройства, в него введены блок выделения с.лова, включающий два элемента И и деши(№атор, распределитель, блок

деши(йэации допустимых би грамм и блок дешифрации допустимых коррелп ций символов, причем первый выход регистра кодов символов соединен через дешифратор с первым входом

Похожие патенты SU920730A1

название год авторы номер документа
Устройство для обнаружения искажений в тексте 1981
  • Евстигнеев Виталий Евгеньевич
  • Седаков Александр Викторович
  • Тимонин Сергей Иванович
SU1056198A2
Устройство для орфографического контроля слов русского языка 1985
  • Возняк Владимир Владимирович
  • Попыркин Александр Алексеевич
SU1283773A1
Телеграфное устройство для исключения обнаруженных ошибок 1979
  • Барышков Юрий Васильевич
  • Стишковский Владимир Леонидович
  • Крылов Евгений Борисович
  • Блинов Василий Григорьевич
SU773941A2
Телеграфное устройство для исключения обнаруженных ошибок 1975
  • Стишковский Владимир Леонидович
  • Крылов Евгений Борисович
SU562932A1
Устройство для устранения обратной работы в системах передачи дискретных сообщений с фазовой манипуляцией 1990
  • Пынтя Николай Клементьевич
  • Шевченко Николай Емельянович
  • Кравцов Алексей Дмитриевич
SU1755722A3
Устройство для регистрации информации 1973
  • Цфасман Михаил Борисович
  • Фомин Владимир Ильич
  • Иоффе Анатолий Давидович
SU484515A1
Устройство для контроля текстовой информации 1983
  • Пиотровский Раймонд Генрихович
  • Шингарева Елена Александровна
  • Попескул Анатолий Никитович
  • Колибан Валентин Владимирович
  • Тэрэчилэ Николай Александрович
  • Комлев Лев Петрович
SU1328817A1
Устройство для набора текста 1986
  • Бахмутский Виктор Фридрихович
  • Бондаренко Валентин Владимирович
SU1400904A1
Система для передачи и приема цифровой информации 1989
  • Сафаров Риза Таджиевич
SU1637025A1
Устройство для орфографического контроля текстов 1985
  • Сергеев Владимир Семенович
  • Иконников Владимир Николаевич
  • Петрусь Александр Васильевич
  • Харин Николай Петрович
SU1278851A1

Реферат патента 1982 года Устройство для обнаружения искажений в тексте

Формула изобретения SU 920 730 A1

SU 920 730 A1

Авторы

Евстигнеев Виталий Евгеньевич

Седаков Александр Викторович

Тимонин Сергей Иванович

Даты

1982-04-15Публикация

1980-03-24Подача