Изобретение относится к. автоматике и цифровой вычислительной технике и может быть использовано в различного рода электронных информационных, системах, а также в системах автоматического орфографического контроля.
Цель изобретения - повьшение оперативности контроля путем определения -нечитаемых полностью или частично слов.
На чертеже представлена функциональная схема устройства для орфографического контроля слов русского языка.
Устройство содержит информационный вход 1 , вход 2 сброса уг;тройст- ва, блок 3 дешифраторов, содержащий дешифратор 4 гласных, дешифратор 5 согласных, дешифратор 6 символа пробела,дешифратор 7 запрещенных биграмм, блок анализа 8, содержащий второй 9, третий 10, четвертый 11 и п ятый 12 элементы ИЛИ, счетчики гласных 13, согласных 14, длины слова 15 и слов 16, выходной блок 17, содержащий первый 18 и шестой -.19 элементы ИЛИ, счетчик 20 признаков ошибки и выход 21 устройств а.
В устройстве используются четыре признака: наличие допустимых биграмм, появление ,трех и более гласных,сле- подряд, появление четырех
поступлением на шину 1 символа гласной счетчик 13 увеличивает свое состояние на единицу, а счетчик 14 обнуляется. С поступлением на вход 5 согласной, счетчик 13 обнуляется, а счетчик согласных увеличивает свое состояние на единицу. При поступлении на вход 1 любого символа кроме Пробел, счетчик 15 увеличи- tO вает свое состояние на единицу. При поступлении на шину 1 символа Пробел счетчики 13 - 15 обнуляются, а счетчик 16 увеличивает свое состояние на единицу. Сигналы-приз- 5 наки вырабатываются счетчиком 13 при достижении состояния 3, счетчиком 14 при достижении состояния 5, счетчиком 15 при достижении состояния 15. Кроме этого, сигнал-признак вырабатывается дешифратором 7 при обнаружении запрещенной биграммы, не используемой в русском языке. Значения состояний счетчиков, при которых вырабатываются сигналы-признаки, расчитаны исходя из учета комбинаторно-статистических закономерностей и ограничений, определяющихся неравной вероятностью появления символов алфавита русского языка и их сочетаемости в словах сообщений.
Сигнал-признак поступает через логический элемент ИЛИ 18 на счет20
25
30
чик 20 признаков ошибки. Счетчик - и более согласных, следующих подряд,
,„ ,q -,,1 35 признаков 20 ошибки подсчитывает количество обнаруженных признаков нечитаемости и при достижении состояния 2 выдает сигнал о нечитаемости анализируемого слова. Счетчик 16 подсчитывает количество анализируе- мых слов. При достижении состояния 3 счетчик 16 через элемент ИЛИ 12 обнуляется. Через элемент ИЛИ 19 обнуляется счетчик - 20. Благодаря 45 счетчику 16 и его обратной связи
появление слова длиной более 15 сим волов. Устройство предназначено не для поиска и локализации отдельных ошибок в словах, а для обнаружения нечитаемых полностью или частично слой.
Устройство работает следующим образом.
40
В исходное состояние устройство устанавливается импульсом, подаваемым на вход 2, который приводит в нулевое состояние счетчика 13 - 16 и 20. При портуплении на информа- циоинйй вход I сигналов первого информационного символа дешифраторы 4 .- 7 включаются в работу. При этом дешифратор 4 распознает гласные буквы, дешифратор 5 - согласные, дешиф- ратор 6 - символ пробела, дешифратор 7 .- запрещенные биграммы, неиспользуемые в русском языке (наС
пример ьо
ьъ,йъ и т.д.)
анализ осуществляется на интервале в три слова, причем для контроля о нечитаемости необходима фиксация не менее двух признаков в любом со- 50 четании. Таким образом уменьшает ся вероятность ложных срабатьшаний устройства из-за единичных ошибок в словах, которые вызьшаютпоявление признаков.
Формула изобретения
Устройство для орфографического контроля слов русского языка, содерпоступлением на шину 1 символа гласной счетчик 13 увеличивает свое состояние на единицу, а счетчик 14 обнуляется. С поступлением на вход согласной, счетчик 13 обнуляется, а счетчик согласных увеличивает свое состояние на единицу. При поступлении на вход 1 любого символа кроме Пробел, счетчик 15 увеличи- вает свое состояние на единицу. При поступлении на шину 1 символа Пробел счетчики 13 - 15 обнуляются, а счетчик 16 увеличивает свое состояние на единицу. Сигналы-приз- наки вырабатываются счетчиком 13 при достижении состояния 3, счетчиком 14 при достижении состояния 5, счетчиком 15 при достижении состояния 15. Кроме этого, сигнал-признак вырабатывается дешифратором 7 при обнаружении запрещенной биграммы, не используемой в русском языке. Значения состояний счетчиков, при которых вырабатываются сигналы-признаки, расчитаны исходя из учета комбинаторно-статистических закономерностей и ограничений, определяющихся неравной вероятностью появления символов алфавита русского языка и их сочетаемости в словах сообщений.
Сигнал-признак поступает через логический элемент ИЛИ 18 на счет
анализ осуществляется на интервале в три слова, причем для контроля о нечитаемости необходима фиксация не менее двух признаков в любом со- четании. Таким образом уменьшает ся вероятность ложных срабатьшаний устройства из-за единичных ошибок в словах, которые вызьшаютпоявление признаков.
Формула изобретения
Устройство для орфографического контроля слов русского языка, содержащее дешифратор запрещенных биграм дешифратор символа пробела, первый элемент ИЛИ, причем выход дешифратора запрещенных биграмм соединен с первым входом первого элемента РШИ, отличающееся тем, что, с целью повьшения оперативности контроля за счет определения нечи-; таемых или частично слов, устройство содержит дешифратор гласных, дешифратор согласных, счетчики гласных, согласных, длины слова, слов и признаков ошибки, второй, третий, четвертый, пятый и шестой элементы ИЛИ, причем информационный вход устройства подключен к входам дешифраторов гласных, согласных, символа пробела и запрещенных биграмм, вход сброса устройства подключен к первым входам второго, третьего, четвертого, пятого и шестого элементов ИЛИ, выход дешифратора гласных соединен с счетным входом счетчика гласных и с вторым входом третьего элемента ИЛИ, выход дешифратора согласных соединен с счетным входом счетчика согласных и с втоСоставитель- Д. Ванюхин Редактор Л. Пчелинская Техред Л.Олейник Корректор С. Черни
Заказ 7443/48Тираж 670Подписное
ВНИИПИ Государственного комитета СССР
по делам изобретений и открытий 113035, Москва, Ж-35, Раушская наб., д, 4/5
Производственно-полиграфическое предприятие, г. Ужгород, ул. Проектная,4
O
5
0
5
рым входом второго элемента И1Ш, инверсный выход дешифратора символа пробела соединен с счетным входом счетчика длины слова, прямой выход дешифратора символа пробела соединен с счетным входом счетчика слов, вторьш входом четвертого элемента ИЛИ и третьими входами второго и третьего элементов ИЛИ, выходы второго, третьего, четвертого и пятого элементов ИЛИ соединены с входами сброса соответственно счетчиков гласных, согласных, длины слова и слов, выходы переполнения счетчиков., гласных, согласных и длины слова соединены соответственно с вторым, третьим и четвертым входами первого Элемента ИЛИ, выход переполнения счетчика слов соединен с вторыми входами пятого и шестого элементов ИЛИ, выход первого элемента ИЛИ соединен со счетным входом счетчика признаков ошибки, вход сброса которого соединен с выходом шестого элемента ИЛИ, выход переполнения счетчика признаков ошибки является выходом устройства.
название | год | авторы | номер документа |
---|---|---|---|
Устройство для обнаружения искажений в тексте | 1981 |
|
SU1056198A2 |
Устройство для обнаружения искажений в тексте | 1980 |
|
SU920730A1 |
КОМПЬЮТЕРНОЕ УСТРОЙСТВО ДЛЯ ЧТЕНИЯ ПЛОСКОПЕЧАТНОГО ТЕКСТА | 1996 |
|
RU2113726C1 |
Устройство для автоматического формирования строки к фотонаборной машине | 1979 |
|
SU1024309A1 |
СПОСОБ ПРЕДВАРИТЕЛЬНОЙ ОБРАБОТКИ ТЕКСТА | 2007 |
|
RU2386178C2 |
Устройство формирования строки | 1977 |
|
SU816792A1 |
Устройство для ввода информации | 1978 |
|
SU742918A1 |
Устройство для аппаратурной трансляции | 1982 |
|
SU1056210A1 |
Система и способ корректировки орфографических ошибок | 2020 |
|
RU2753183C1 |
СПОСОБ И СЕРВЕР ТРАНСКРИПЦИИ ЛЕКСИЧЕСКОЙ ЕДИНИЦЫ ИЗ ПЕРВОГО АЛФАВИТА ВО ВТОРОЙ АЛФАВИТ | 2015 |
|
RU2632137C2 |
Изобретение относится к автоматике и цифровой вычислительной технике, в частности.к устройствам обработки текстовой информации. Изобретение позволяет повысить оперативность контроля за счет определения нечитаемых полностьк ипи частично слов. Устройство содержит блок дешифраторов 3, состоящий из дешифратора гласных 4, согласных 5, дешифратора запрещенных биграмм 7, символа пробела 6, блока анализа 8, содержащего счетчики гласных 13, согласных 14, длины слова 15, слов 16 и четырех логических элементов ИШi 9, 10, 11, 12, а также выходного блока 17, содержащего счетчик признаков ошибки 20 и два логических элемента 1ШИ 18 и 19. Анализ текста осуществляется на участке длиной в три слова, что обеспечивается введением в блок анализа счетчика количества слов 16. Сигнал о появлении нечитаемого участка текста вырабатывается при появлении на контролируемом участке текста не менее 2-х из 4-х признаков. Признаками является появление в тексте 3-х и более гласных подряд, 4-х и более согласных подряд, биграмм,. не встречающихся в русском языке (вида оь), а также, слов длиной 15 и более символов. Подсчет количества выявленных признаков осуществляется счетчиком признаков 20 ошибки выходного блзока. 1 ил. а (Л
Устройство для обнаружения искажений в тексте | 1980 |
|
SU920730A1 |
Приспособление для точного наложения листов бумаги при снятии оттисков | 1922 |
|
SU6A1 |
Устройство для обнаружения искажений в тексте | 1981 |
|
SU1056198A2 |
Приспособление для точного наложения листов бумаги при снятии оттисков | 1922 |
|
SU6A1 |
Авторы
Даты
1987-01-15—Публикация
1985-09-26—Подача