(5) УСТРОЙСТВО ДЛЯ ОБНАРУЖЕНИЯ ИСКАЖЕНИЙ
1
Изобретение относится к вы1 1слительной технике и может быть исполь зовано в системах обработки текстовой информацииj
Известны устройства для проверки правильности текстов, содержащие регистр сдвига, память и схемы сравнения и осуществляющие анализ текста на основе априорных вероятностей биграмм, триграмм и более длинных сочетаний симовлов
Недостаток этих устройств состоит в их сложности.
Наиболее близким к предлагаемому по технической сущности является устройство для обнаружения искажений в тексте, содержащее регистр сдвига кодов символов, входом соединенный с информационным входом устройства, а выходом - со входом блока хранения вероятностей & грамм, выходы которого соединены с первы1 1 входами соответствующих схем сравнения , вторыми входами подключены
В ТЕКСТЕ
КО входу задания порога, а выходами к регистру фиксации ошибок, выход которого является выходом устройства 2 1.
Недостаток этого устройства состоит в низкой достоверности работы и значительных аппаратурных затратах, так как обнаружение ошибок 8 тексте основано на существовании для определенного словаря используеtoмого языка ограниченного количества разрешенных биграмм, вероятности которых помещаются в блоке хранения вероятностей биграмм. При этом в устройстве не обнаруживаются ошиб15ки, связанные с изменением длины слова или порядка следования символов в тексте. Кроме того, в нем необходимо использовать блок хранения вероятностей биграмм большой емкое
ти, что требует значительных затрат оборудования.
Целью изобретения является повышение достоверности работы и сокращение annapaiypHbix затрат устройства.
Поставленная цель достигается тем, что в устройство, содержаидее регистр кодов символов и регистр фиксации ошибок, выход которого является, выходом устройства, введены блок выделения слова, включающий два элемента И и дешифратор кода пробела, распределитель, блок дешифрации допустимых биграмм и блок дешифрации допустимых корреляций символов, причем первый выход регистра кодов символов соединен через дешифратор пробела с первым входом первого элемента И, вход - с выходом второго элемента И, второй выход - с управляющими входами блоков дешифрации допустимых биграмм и корреляций символов, выходы которых подключены к соответствующим входам регистра фиксации ошибок, а информационные входы через распределитель к группе выходов регистра кодов символов, первый и второй входы второго элемента И подключены соответственно к информационному входу устройства и выходу первого элемента И, вторым входом соединенного с тактовым входом устройства.
На чертеже представлена структур ная схема устройства.
Устройство содержит регистр 1 кодов символов, распределитель 2, под ключенный цепями 3 и 4 к блоку 5 дешифрации допустимых биграмм и к блоку 6 дешифрации допустиMbfx корреля ций символов, регистр 7 фиксации ошибок, подключенный к выходу 8 устройства, блок 9 выделения слова, включающий элементы И 10 и 11 и дешифратор 12, информационный 13 и тактовый Н входы устройства.
Устройство работает следующим образом.
В исходном состоянии регистр 1 находится в обнуленном состоянии„ Распределитель 2 вырабатывает нулевые кодьи На выходах блоков м 6 и регистра 7 сигналы отсутствуют. По тактовым сигналам, поступающим по входу Н, через элемент И 10 разрешается последовательное поступление кодов символов текста через элемент И 11.
При поступлении неискаженного текста по входу 13 коды символов накапливаются на регистре 1 до тех пор, пока не появится код очередного пробела. В этом случае дешифратор 12 формирует сигнал, блокирующий элемент И 1G и прерывакхций поступление кодов символов через элемент И 11. Таким образом, на регистре 1 оказывается выделенной совокупность кодов символов, соответствуюи их слову текста.
Распределитель 2 формирует в цепях 3 пары кодов биграммы отношений 2-3, 3, и ТеД, символов, а в цепях - пары кодов корреляции 2-k , 2-5, и ТоД. символов выделенного слова. В соответствии с кодом первого символа слова, поступающего второго выхода регистра 1 с: блоки 5 и 6, осуществляется подключение рабочих дешифраторов кодов пар 2-3} 3 и ТоДо символов и пар 2-, 2-5, ) и т.д. символов выделенного слова соответственно. Искажения обнаруживаются блоками 5 и 6 в том случае, если хотя ,бы одна из биграмм анализируемого слева является запрещенной комбинацией. Для неискаженных слов текста коды отношений символов и корреляции символов, соответствующие зафиксированному первому символу слова, являются разрешеннь Ми, При этом на выходах блоков 5 и 6 отсутствуют сигналы, а на выходе регистра 7 отсутствуют сигналы об ошибке в тексте. Дальнейшая разблокировка поступления кодированного текста через элемент И 11 осуществляется тактовым сигналом с выхода элемента И 10,
Работа устройства в-случае ошибок в кодированном тексте производится следующим образом.
Допустим, что по входу 13 поступает последовательность кодов символов текста, соответствующих искаженному слову МАОК образованному вследствие пропуска символа 3 на третьей позиции слова (правильно МАЗОК). Коды символов накапливаются на регистре 1 до появления пробела после последнего символа KV В этому случае дешифратора 12 формирует сигнал, по которому запрещается поступление кодов символов через элемент И 1К Таким образом, на регистре 1 выделены коды символов слова МАОК.,
Распределитель 2 вырабатывает в цепях 3 пары кодов отношений 2-3 и 3 символов слова, т.е. пары кодов символов АС и В цепях фор
мируются коды корреляции 2- (Ж) символов слова, просмотр которых осуществляется .с помощью, рабочих .дешифраторов блоков 5 и 6. Так как пары кодов отношений 2-3 (АО) и 3-i (OK) символов являются запрещенными комбинациями для слова, начинающего с символа М, то блок 5 вырабатывается сигнал, записываемый в регистр 7, по которому в выходной цепи 8 формируется сигнал об ошибке в тексте
Допустим, что по входу 13 поступает последовательность кодов символов текста, соответствующих искаженному слову УКВА - (правильно БУКВА), образованному вследствие пропуска первого символа Б слова. После ввода слова в регистр 1, т.е. появления кода пробела вслед за последним символом А - , распределитель 2 вырабатывает в цепях 3 пары кодов отношений 2-3 и символов слова, т.е. пары кодов отношений символов KB и ВА. В цепях формируются пары кодов корреляции сим.волов 2-Ц (КА). В блоках 5 и 6 осуществляется анализ кодов символов слова. Так как пары кодов 2-3 (КБ) и 3- (ВА) символов являются запрещенными комбинациями для слов, начинающихся с символа У, то на выход блока 5 вырабатывается сигнал об ошибке, поступающий на регистр 7. Пара кодов (КА) символов является запрещенной для слова, наминающегося с символа У, поэтому рабо« ie дешифраторы блока б вырабатывают на выходных шинах сигнал, по которому на выходе 8 устройства формируется сигнал об ошибке в тексте. Таким образом осуществляется работа устройства при обнаружении ошибок, связанных с пропуском символов слова.
Допустим, что в последовательности символов текста содержится искаженное слово БУКХВА, образовавшееся вследствие добавления символа X на четвертую позицию слова правильно ) .
После ввода слова с регистр 1 распределитель 2 вырабатывает в цепях 3 пары кодов отношений 2-3, З, 5 5-6 символов слова, т.е. пары кодов отношений символов ВА. В цепях k формируются пары кодов корреляции 2-, 2-5, ,. 3-6 символов, т.е. УХ, УВ, КБ,
КА, Так как пары кодов (КХ) символов, 4-5 (ХВ), 5-6 (ВА) являются запрещенными комбинациями для слова, начинающегося с символа Б, то рабочие дешифраторы блока 5 вырабатывают на выходнах шинах сигнал об ошибке, поступающий на регистр 7- Пары кодов символов 2(УХ),2-5 (УВ),3-5 (KB),3-6 (КА)
является запрещенными для слова, на,чинающегося с символа Б, поэтому рабочие дешифраторы блока 6 вырабатывают на выходных шинах сигнал, поступающий в регистр 7, с выхода.которого на выход 8 выдается сигнал об ошибке в тексте.
Использование блока выделения слова позволяет осуществить просмотр смысловых элементов текста - группы
символов, заключенных между последовательными пробелами в тексте Формирование пар кодов отношений и корреляции символов, число которых определяется длиной слова, позволяет учитывать позиции занимаемых си мволо в в ело ве.
Дешифратор кодов пар символов в зависимости от кода первого символа слова позволяет обнаруживать сочетания символов, недопустимые с ; точки зрения словарных конструкций используемого языка.
Таким образом, устройств позволяет исключить возможность пропуска ошибок в текстах, связанных с изменением длины слова, что повышает достоверность работы устройства Кроме того, устройство не содержит многоразрядного блока памяти
большого объема.
Формула изобретения
Устройство для обнаружения искажений в тексте, содержащее регистр кодов символов и регистр фиксации ошибок, выход которого является выходом устройства, отли чаю-щ е е с я тем, что, с целью повышения достоверности работы устройства, в него введены блок выделения с.лова, включающий два элемента И и деши(№атор, распределитель, блок
деши(йэации допустимых би грамм и блок дешифрации допустимых коррелп ций символов, причем первый выход регистра кодов символов соединен через дешифратор с первым входом
название | год | авторы | номер документа |
---|---|---|---|
Устройство для обнаружения искажений в тексте | 1981 |
|
SU1056198A2 |
Устройство для орфографического контроля слов русского языка | 1985 |
|
SU1283773A1 |
Телеграфное устройство для исключения обнаруженных ошибок | 1979 |
|
SU773941A2 |
Телеграфное устройство для исключения обнаруженных ошибок | 1975 |
|
SU562932A1 |
Устройство для устранения обратной работы в системах передачи дискретных сообщений с фазовой манипуляцией | 1990 |
|
SU1755722A3 |
Устройство для регистрации информации | 1973 |
|
SU484515A1 |
Устройство для контроля текстовой информации | 1983 |
|
SU1328817A1 |
Устройство для набора текста | 1986 |
|
SU1400904A1 |
Система для передачи и приема цифровой информации | 1989 |
|
SU1637025A1 |
Устройство для орфографического контроля текстов | 1985 |
|
SU1278851A1 |
Авторы
Даты
1982-04-15—Публикация
1980-03-24—Подача