УСТРОЙСТВО ОБРАБОТКИ ИНФОРМАЦИИ ДЛЯ ИНФОРМАЦИОННОГО ПОИСКА Российский патент 1997 года по МПК G06F17/00 G06F17/30 

Описание патента на изобретение RU2096825C1

Изобретение относится к техническим средствам информатики и вычислительной техники и может быть использовано для решения задач символьной обработки текстовой информации и предварительной обработки текстовых данных для информационного поиска.

Известно устройство для реализации продукции, содержащее блок памяти слов и узел сравнения [1]
Указанное устройство имеет следующие недостатки: при изменении предметной области или тематической направленности обрабатываемой текстовой информации устройство требует значительных затрат ручного труда для формирования продукционных правил, составляющих содержание узла сравнения и определяющих область применимости устройства; результат обработки не может быть использован для поиска необходимой текстовой информации.

Наиболее близким к предложенному по технической сущности является устройство для информационного поиска, содержащее блок сопряжения с памятью, память исходного массива, блок ввода-вывода, наборное поле, блок отображения, буферную память ввода-вывода, блок управления, буферную память, магистральную шину, включающую шины адресную, информационную и управляющую [2]
Указанное устройство имеет следующие недостатки: для задействования устройства исходный массив текстовой информации необходимо преобразовывать к специальному виду, используемому в устройстве; результат обработки информации не может быть использован в качестве аннотации к обработанному тексту и, кроме того, устройство не может обеспечить возможность выборки данных, а предназначено для предварительной обработки информации в поисковых системах.

Анализ существующих устройств обработки массивов текстовой информации показывает, что полностью исключить участие оператора устройства из процесса обработки неизвестной ранее текстовой информации, оформленной в виде входного потока, не представляется возможным. Однако принципиально возможна автоматизация процесса символьной обработки информации отдельных текстовых массивов, отличающихся определенной целостностью, например отдельная статья тематического сборника, отдельная глава сложного документа и т.п.

Целью изобретения является расширение области применения и функциональных возможностей устройства обработки информации за счет обеспечения возможности обработки и поиска текстовой информации различной тематической и смысловой направленности, а также автоматической адаптации устройства к изменению предметной области обрабатываемой информации на основе исключения человека из процесса первичного анализа, чтения, аннотирования и каталогизации текстовых фрагментов, являющихся составными частями входного потока текстовой информации и характеризующихся смысловой и структурной замкнутостью.

Была поставлена задача: автоматизировать процесс анализа неизвестной ранее текстовой информации с выявлением наиболее характерных для данного текста слов и словосочетаний с учетом их повторяемости, которые в совокупности могут рассматриваться как схематическое отображение тематики и смысловой направленности текста и позволяют, с одной стороны, заменить собой аннотацию к тексту, а с другой стороны, обеспечить автоматизированный поиск необходимой текстовой информации.

Поставленная цель достигается тем, что в устройство, содержащее блок сопряжения с памятью, блок ввода-вывода, буферную память ввода-вывода, блок управления, буферную память, блок отображения, входы и выходы которых соединены через магистральную шину друг с другом, память исходного массива, выход которой соединен с входом блока сопряжения с памятью, наборное поле, выход которого соединен с входом блока ввода-вывода, введены блок синтеза текстовых фрагментов, блок структурного анализа текстового фрагмента, блок символьной обработки текстового фрагмента, блок корректировки словаря словосочетаний, блок синтеза первичного словаря, блок фильтрации первичного словаря, блок синтеза вторичных словарей, блок анализа вторичных словарей, блок синтеза архивной карточки, блок архивации текстовых фрагментов, блок корректировки системных словарей, память архивной карточки, входы и выходы которых соединены через магистральную шину друг с другом, при этом вход блока отображения соединен с выходом блока ввода-вывода.

Блок-схема устройства обработки информации для информационного поиска представлена на фиг.1; на фиг.2 13 представлены функциональные схемы следующих блоков устройства: синтез текстовых фрагментов на фиг.2; структурного анализа текстового фрагмента на фиг.3; символьной обработки текстового фрагмента на фиг.4; корректировки словаря словосочетаний на фиг.5; синтеза первичного словаря на фиг.6; фильтрации первичного словаря - на фиг.7; синтеза вторичных словарей на фиг.8; анализа вторичных словарей - на фиг.9; синтеза архивной карточки на фиг.10; архивации текстовых фрагментов на фиг.11; корректировки системных словарей на фиг.12; память архивной карточки на фиг.13.

Идентификаторы, использованные для описания структуры указанных блоков, представлены в табл. 1. Краткое описание функционального назначения блоков устройства, представленных на схемах фиг.1 13, приведено в табл. 2.

Устройство содержит блок сопряжения с памятью 1, память исходного массива 2, блок ввода-вывода 3, наборное поле 4, блок отображения 5, буферную память ввода-вывода 6, блок управления 7, буферную память 8, блок синтеза текстовых фрагментов 9, блок структурного анализа текстового фрагмента 10, блок символьной обработки текстового фрагмента 11, блок корректировки словаря словосочетаний 12, блок синтеза первичного словаря 13, блок фильтрации первичного словаря 14, блок синтеза вторичных словарей 15, блок анализа вторичных словарей 16, блок синтеза архивной карточки 17, блок архивации текстовых фрагментов 18, блок корректировки системных словарей 19, память архивной карточки 20, магистральную шину 21, включающую шины адресную, информационную и управляющую.

Устройство работает следующим образом.

Процесс обработки информации и формирования архивной карточки работает на два этапа. На первом этапе устройство функционирует под управлением человека оператора устройства, на втором этапе проводится автоматическая обработка информации.

Этап 1.

Устройство по схеме 1 работает в режиме 1 (этап 1) следующим образом.

Оператор устройства формирует в блоке 4 команду активизации (перевода в режим выполнения поступающих команд управления) устройства в режиме 1. С выхода блока 4 на вход блока 3 поступает сигнал начала работы устройства в режиме 1. Из блока 3 по магистральной шине 21 сигнал поступает на вход блока 7, где он преобразуется в последовательность команд управления устройством. Под управлением блока 7 исходная информация из блока 2 передается в блок 1, который формирует выходной информационный сигнал, поступающий по магистральной шине 21 на входы блоков 6 и 8. Блок 3 снимает сигнал с выхода блока 6 и направляет его на вход блока 5.

Оператор устройства анализирует в блоке 5 структуру исходной информации и формирует в блоке 4 одну из двух команд: команду поиска структурных признаков текстовых фрагментов или команду формирования очередного текстового фрагмента. С выхода блока 4 сигналы указанных команд поступают на вход блока 3, с выхода которого сигнал по магистральной шине 21 поступает в блок 7. Блок 7 преобразует поступившие сигналы в команды управления устройством и передает их по магистральной шине 21 в блоки 3 и 9, одновременно подавая на вход блока 3 сигнал, устанавливающий блокировку на выполнение команд, полученных блоком 3, до получения разрешающей команды из блока 9. Блок 9 в зависимости от поступившего на его вход сигнала из блока 7 либо считывает сигнал части исходной информации из блока 8 и формирует на выходе информационный сигнал очередного текстового фрагмента, либо преобразует сигналы блока 6 и выдает на вход блока 3 по магистральной шине 21 разрешающую команду снятия блокировки. Блок 3 считывает с выхода блока 6 информационный сигнал и подает его на вход блока 5.

После создания последнего текстового фрагмента блок 9 формирует команду завершения работы и передает ее по магистральной шине 21 на вход блока 7. Блок 7 выдает команду считывания информационных сигналов текстовых фрагментов с выхода блока 9 на вход блока 8, параллельно записывая в блок 8 сигналы адресных данных для доступа к полученным информационным сигналам, и завершает работу устройства в режиме 1.

При формировании в блоке 4 команд управления работой устройства в режиме 1 оператор устройства руководствуется следующими структурными признаками текстовых фрагментов:
наличие одной и более строк, содержащих символы, воспринимаемые блоком 3 при обработке информационных сигналов, поступающих с выхода блока 8 по магистральной шине 21 как печатный аналог символа "пробел";
сигнал конца цепочки символов, составляющих исходную информацию.

Правила выделения определенной части информационного сигнала исходной информации в очередной текстовый фрагмент определяются оператором устройства и имеют тривиальный смысл: отдельная глава документа, отдельный абзац, отдельная статья сборника статей и т.п.

Этап 2.

Устройство по схеме 1 работает в режиме 2 (этап 2) следующим образом.

Оператор устройства формирует в блоке 4 команду активизации устройства в режиме 2. С выхода блока 4 на вход блока 3 поступает сигнал начала работы устройства в режиме 2. С выхода блока 3 по магистральной шине 21 сигнал передается на вход блока 7, где он преобразуется в последовательность команд управления устройством. Блок 7 последовательно активизирует блоки 10-19 путем подачи команд управления на входы указанных блоков. Сигнал результата работы устройства (архивная карточка текстового фрагмента) подается на вход блока 20, где он записывается для дальнейшего использования.

На вход блока 10 по магистральной шине 21 подается сигнал информации текстового фрагмента с выхода блока 8, с выхода блока 10 на вход блока 8 поступают информационные сигналы о наличии во входных данных строк с определенным процентным содержанием цифровых символов, а также сигналы символьного информационного массива заданной длины. Сигнал структуры указанных выходных данных запоминается в блоке 10 при настройке устройства. Настройка устройства осуществляется до начала его работы.

На вход блока 11 с выхода блока 8 по магистральной шине 21 подается сигнал исходной информации текстового фрагмента. В блоке 11 проводится обработка входных сигналов, соответствующая декомпозиции исходной информации на отдельные слова и словосочетания (совокупность слов, ограниченных в информации исходного текста кавычками). С выхода блока 11 на вход блока 8 поступает сигнал информационного массива, структура которого позволяет считывать из блока 8 отдельное слово или словосочетание, а также различать при поиске слова и словосочетания, при этом в память блока 8 записываются сигналы данных о количестве строк и слов обработанной информации текстового фрагмента.

На вход блока 12 по магистральной шине 21 последовательно поступают сигналы словосочетаний из информационного массива блока 8, сформированного блоком 11. В блоке 12 проводится сравнение сигналов количества символов в считанной из блока 8 информации с эталонным сигналом, запоминаемым в блоке 12 при настройке устройства. При превышении сигналом количества символов эталонного значения сигнал считанной из блока 8 информации подвергается в блоке 12 обработке, соответствующей декомпозиции словосочетаний на отдельные слова. Результаты обработки информационных сигналов в блоке 12 запоминаются в его информационном массиве, структура которого позволяет проводить поиск нужного слова и хранить кроме символьной информации также числовую, привязанную с помощью адресации данных к конкретному слову. Указанный сигнал информационного массива с выхода блока 12 поступает на вход блока 8. Одновременно в блок 8 с выхода блока 12 поступает идентификационный код указанного информационного массива (информационный сигнал объемом в 1 символ), при анализе которого в блоке 7 может быть считана из памяти блока 7 последовательность команд управления, соответствующая конкретному варианту обработки указанного информационного сигнала.

На вход блока 13 по магистральной шине 21 с выхода блока 8 поступает сигнал информационного массива, записанный в блок 8 с выхода блока 12. Блок 13 формирует сигнал нового информационного массива той же структуры, но не содержащий одинаковых слов и словосочетаний. Сигналы числовых данных, привязанных к каждому слову указанного информационного массива, содержат информацию о количестве таких слов в сигнале входной информации блока 13. С выхода блока 13 сигнала поступают на вход блока 8.

На вход блока 14 по магистральной шине 21 поступает сигнал информационного массива с выхода блока 8, записанный в блок 8 с выхода блока 13. Блок 14 предназначен для формирования сигнала нового информационного массива той же структуры, который поступает на вход блока 8. В блоке 14 формируется сигнал, соответствующий результату операции удаления из входного информационного массива информации о тех словах, которые совпадают со словами информационного массива той же структуры, записываемого в память блока 14 при настройке устройства. Если сигнал слова из входной информации блока 14 удовлетворяет условиям сравнения со словами внутренней памяти блока, данные о нем не попадают в выходной информационный массив. Операция сравнения проводится в два этапа. На первом этапе сигналы слов сравниваются по схеме полного совпадения, на втором этапе сигналы слов из входной информации оцениваются на предмет совпадения символьной структуры слов (например, последовательности символов "работали" и "работ." совпадают по символьной структуре; здесь и далее последовательность символов "." воспринимается соответствующими блоками устройства как "последовательность любого количества любых символов").

На вход блока 15 по магистральной шине 21 поступает сигнал информационного массива с выхода блока 8, записанный в блок 8 с выхода блока 14. В блоке 15 проводится обработка входного информационного сигнала, соответствующая разделению данных входного информационного массива на четыре независимых информационных массива той же структуры. Сигнал каждого слова из входной информации проходит в блоке 15 посимвольную обработку на предмет выяснения вида каждого символа ("строчный", "прописной", "цифровой", "алфавитный", "специальный", "значимый", "пробел"). Сигналы слов, состоящих только из цифровых и специальных символов, исключаются из дальнейшей обработки. Сигналы оставшихся слов (и данные им соответствующие) суммируются с сигналами одного из выходных информационных массивов: "имена собственные", "аббревиатуры", "кавычки", "рядовые слова". С выхода блока 15 информационный сигнал подается на вход блока 8.

На вход блока 16 по магистральной шине 21 последовательно подаются сигналы информационных массивов с выхода блока 8, записанные в блок 8 с выхода блока 15 в порядке их расположения в адресном пространстве блока 8. Блок 16 анализирует сигнал идентификационного кода информационного массива, который считывается с выхода блока 8, и выполняет в зависимости от значения идентификационного кода один из трех вариантов обработки входного информационного сигнала. Первый вариант обработки заключается в считывании входного сигнала и записи его в один из выходных информационных массивов, два остальных варианта основаны на выделении из сигнала слова последовательности символов основы слова (путем удаления символов суффиксов и окончаний и замены их последовательностью символов ".") и проведения оценки совпадения символьной структуры полученной последовательности символов с сигналами оставшихся слов текущего информационного массива. Сигналы сформированных в блоке 16 шести информационных массивов с выхода блока 16 подаются на вход блока 8.

На вход блока 17 по магистральной шине 21 с выхода блока 8 подаются следующие сигналы: шести информационных массивов, записанные в блок 8 с выхода блока 16, результатов структурного анализа текстового фрагмента, записанные в блок 8 с выхода блока 10, обобщенных данных результатов символьной обработки текстового фрагмента, записанные в блок 8 с выхода блока 11 и идентифицированной информации текстового фрагмента, записанные в блок 8 с выхода блока 9. Блок 17 формирует выходной сигнал адреса для хранения в памяти блока 20 новой архивной карточки, проводит адресацию входной информации для информационного поиска, формирует выходной информационный сигнал новой архивной карточки и сформированные выходные сигналы со своего выхода подает на вход блока 20. Параллельно с выхода блока 17 на вход блока 7 подается сигнал формирования команды записи информации в блок 20.

На вход блока 18 по магистральной шине 21 с выхода блока 8 подается сигнал исходной информации текстового фрагмента, а с выхода блока 20 сигнал идентификационной информации текстового фрагмента. Блок 18 проводит обработку входных сигналов, соответствующую операциям: определения адреса архивной области блока 8 для хранения текстового фрагмента, проверки ее существования и при необходимости ее создания и идентификации, сжатия исходной информации. С выхода блока 18, кроме информационного сигнала сжатой исходной информации, который подается на вход блока 8, снимается также сигнал адреса хранения в блоке 8 сигнала сжатой исходной информации, который подается на вход блока 20.

На вход блока 19 по магистральной шине 21 с выхода блока 8 подается сигнал идентификационной информации текстового фрагмента, по результатам обработки которого в блоке 19 определяется адрес доступа к последней архивной карточке, при этом выходной сигнал адреса с выхода блока 19 поступает на вход блока 7. Блок 7 формирует команду чтения архивной карточки и вместе с сигналом адреса доступа к карточке направляет ее на вход блока 20. Параллельно блок 7 подает на вход блока 8 управляющий сигнал подготовки для записи области системных словарей блока 8. С выхода блока 20 снимаются сигналы шести информационных массивов, записанных в блок 20 с выхода блока 17. Информационные сигналы с выхода блока 20 подаются на вход блока 19. Блок 19 выполняет операции обработки входных информационных сигналов, соответствующие преобразовыванию входной информации к виду списка слов без какой-либо дополнительной числовой информации, и сформированный информационный сигнал с его выхода поступает на вход блока 8. После выполнения этой операции блок 19 подает на вход блока 7 команду завершения работы устройства. Блок 7 формирует последовательность команд управления, соответствующих очистке памяти блока 8, за исключением областей памяти системных словарей и архивных областей хранения сигналов сжатой информации текстовых фрагментов, и после выполнения указанной последовательности команд завершает работу устройства.

При составлении функциональных схем блоков устройства фиг.2-13 использован следующий порядок нумерации блоков устройства. Если блок имеет составной номер, то его расшифровка осуществляется следующим образом:
составной номер блока аа.bb.cc,
где аа номер типового блока из табл. 1;
bb номер фигуры;
сс порядковый номер типового блока на фигуре.

Если блок имеет простой, а не составной номер, то это означает, что данный блок не является типовым и встречается в составе устроойства только раз.

Команды управления из блока 7 на схемах фиг.2 13 передаются следующим блокам устройства: 22, 23, 25-30, 32-38, 40-49, 51-59, 61, 63-65.

Управляющие входы вышеуказанных блоков на схемах фиг.2-13 не указаны.

Наиболее важными и принципиальными с точки зрения технической сущности устройства являются блоки 15, 16, 17 и 20. Опишем подробно работу этих блоков.

Блок синтеза вторичных словарей (блок 15) по схеме фиг.8 работает следующим образом. Входами блока 15 являются входы блоков 39.8.1, 38.8.1, 26.8.1, 46 и 63, 47. Выходами блока 15 являются выходы блоков 39.8.2, 39.8.3, 39.8.4 и 39.8.5. Сигнал входного информационного массива поступает на вход блока 39.8.1 и запоминается в нем. Методом прямого перебора из блока 39.8.1 на вход блока 38.8.1 последовательно подаются информационные сигналы записей (структурных единиц информации) блок памяти слов (БПС) следующей структуры: сигнал слова БПС, сигнал числового поля, сигнал типа слова. В зависимости от величины сигнала типа слова сигнал входной информации записи БПС с выхода блока 38.8.1 подается на вход блоков 39.8.2 или 31.8.1. С выхода блока 31.8.1 сигнал слова БПС поступает на вход блока 26.8.1. С выхода блока 26.8.1 сигнал слова БПС посимвольно подается на входы блоков 63 и 36.8.1. В случае успешного сравнения сигналов в блоке 63 с выхода указанного блока на вход блока 7 подается управляющий сигнал, а управление передается блоку 36.8.1 путем подачи на вход последнего специальной команды с выхода блока 7. Выходной сигнал блока 47 в зависимости от значения сигнала числового поля цифровой составляющей входного сигнала этого блока, формируемой блоком 46 на основе выходного сигнала блока 36.8.1, передается в один из следующих блоков: 39.8.3, 39.8.4, 39.8.5. Перед формированием выходного сигнала блок 47 считывает в свою внутреннюю память в качестве основы для формирования выходного сигнала информационный сигнал с выхода блока 31.8.1. После завершения работы блока 15 выходные информационные сигналы блоков 39.8.2, 39.8.3, 39.8.4 и 39.8.5 подаются на вход блока 8.

Блок анализа вторичных словарей (блок 16) по схеме фиг.9 работает следующим образом. Входом блока 16 является вход блока 48. Выходами блока 16 являются объединенные выходы блоков 39.9.4, 39.9.5, 39.9.6, 39.9.7, 39.9.8 и 39.9.9. Методом прямого перебора на вход блока 48 с выхода блока 8 подаются сигналы хранимых в памяти блока 8 информационных массивов структуры БПС. В зависимости от величины сигнала идентификационного кода сигнала БПС, анализируемого в блоках 48 и 53, входной информационный сигнал блока 48 без изменений поступает на вход блоков 39.1.1, 39.9.3 или 39.9.4, что соответствует типам сигналов информационных массивов БПС соответственно "рядовые слова", "аббревиатура" и "имена собственные", "кавычки". Блок 39.9.4 является исходной точкой первой схемы обработки сигнала БПС в блоке 16, которая соответствует подаче входного информационного сигнала без изменений на выход блока 16. Блок 39.9.1. является исходной точкой второй схемы обработки сигнала БПС в блоке 16, блок 39.9.3 исходной точкой третьей схемы обработки.

Все три указанные схемы обработки сигналов БПС реализуются за счет выдачи с выхода блока 7 последовательности управляющих сигналов на входы соответствующих блоков. С выхода блока 39.9.1 сигнал записи БПС поступает на вход блока 31.9.1. С первого выхода блока 31.9.1 сигнал слова БПС поступает на вход блока 49.9.1, где он подвергается обработке, соответствующей преобразованию в сигнал шаблона для сравнения символьной структуры последовательностей символов. Сигнал шаблона с выхода блока 49.9.1 поступает на первый вход блока 45.9.1, в котором запоминается. После этого с второго выхода блока 39.9.1 методом прямого перебора снимаются сигналы записей БПС, которые подаются для сравнения символьной структуры на второй вход блока 45.9.1. Выходные сигналы блока 45.9.1 поступают на вход блоков 41.9.1 и 31.9.2. С выхода блока 31.9.2. слово БПС подается на входы блоков 40.9.1 и 64. Блок 7 подает на входы указанных блоков последовательность управляющих сигналов, соответствующих выполнению операций удаления записи из БПС блока 39.9.1 (в блоке 40.9.1) и выбора слова с минимальным количеством символов, сигнал которого запоминается в памяти блока 64. Параллельно в блоке 41.9.1 накапливается сигнал суммы числовых полей удаленных записей. После исчерпания записей блока 39.9.1 выходной сигнал блока 41.9.1 подается на вход блока 51 для сравнения с эталонным сигналом, запоминаемым в памяти блока 51 при настройке устройства. В зависимости от результатов сравнения блок 51 выдает на вход блока 7 один из двух возможных управляющих сигналов, которые, будучи обработаны в блоке 7, приводят к формированию на выходе блока 7 одной из двух возможных последовательностей команд управления, которые подаются на вход блоков соответственно 50 или 39.9.2. В первом случае блок 50 формирует на основании выходных сигналов блоков 64 и 51 сигнал записи БПС и подает его на вход блока 39.9.5. Во втором случае сигнал записи БПС формируется в блоке 39.9.2 на основе выходных сигналов блоков 31.9.1 и 51, при этом с второго выхода блока 31.9.1 снимается только сигнал слова БПС. Сформированный в блоке сигнал записи БПС записывается в память блока 39.9.2 как структурная единица информационного сигнала БПС, хранимого в данном блоке. После этого указанная выше последовательность операций первой схемы обработки БПС в блоке 16 циклически повторяется до исчерпания сигналов записей блока 39.9.1. После исчерпания сигналов записей блока 39.9.1 методом прямого перебора сигналы записей БПС блока 39.9.2 совместно с сигналом основы слова, сформированным в блоке 49.9.2 на основе выходного сигнала блока 39.9.2 со сдвоенного выхода этих блоков, подается на вход блока 52. В блоке 52 сигнал числового поля записи БПС сравнивается с эталонным сигналом, запоминаемым в блоке 52 при настройке устройства. В зависимости от результатов сравнения сигнал основы слова БПС суммируется с сигналом последовательности символов, запоминаемой в одной из областей памяти блока 52. После суммирования в блоке 52 формируется сигнал количества символов в полученной последовательности символов. При превышении величины указанного сигнала значения эталонного сигнала, запоминаемого в памяти блока 52 при настройке устройства, формируется сигнал записи БПС из указанной последовательности символов и сигнала числового поля записи БПС блока 39.9.2. Сформированный сигнал в зависимости от величины сигнала числового поля записи БПС блока 39.9.2 подается на вход блоков 39.9.6 или 39.9.7.

Вторая схема обработки сигналов записей БПС блока 16 аналогична первой с той разницей, что из цепочки взаимодействующих блоков исключены типовые блоки 50, 51 и 64, и соответственно отсутствию выходного сигнала блока 51 во второй схеме не используются блоки, аналогичные по выполняемым операциям блокам 39.92, 49.9.2, 52, 39.9.6 и 39.9.7. При этом выходной сигнал блока 41.9.2 подается на вход блока 31.9.4 и записывает сигнал числовой составляющей во все числовые поля блока, с выхода блока 31.9.4 на вход блока 40.9.2 подаются сигналы всех записей блока 31.9.4, а с выхода блока 31.9.4 на вход блоков 39.9.8 и 39.9.9 подается только сигнал первой записи блока 31.9.4. После завершения работы блока 16 выходные информационные сигналы блоков 39.9.4 39.9.9 подаются на вход блока 8.

Блок синтеза архивной карточки (блок 17) по схеме фиг. 10 работает следующим образом. Входами блока 17 являются входы блоков 39.10.1 39.10.6, 31.10.1, 31.10.2 и 65. Выходом блока 17 является выход блока 65. В блоке 65 формируется сигнал адреса новой архивной карточки, проводится адресация всех поступивших на вход блока 17 информационных массивов. Адресация основана на синтезе уникального кода, имеющего гарантию неповторяемости в рамках одного устройства обработки информации. Выходной информационный сигнал блока 56 подается на вход блока 20. Одновременно на вход блока 7 с выхода блока 65 подается команда записи информации в блок 20 и команда блокировки начала процесса записи информационных сигналов в блок 20 до получения разрешающего сигнала с выхода блока 7. Запись информационного сигнала в память блока 20 осуществляется под управлением блока 7.

Память архивной карточки (блок 20) по схеме фиг. 13 работает следующим образом. Входами блока 20 являются входы блоков 61 и 62. Выходом блока 20 является выход блока 62, при этом в зависимости от сигнала на входе блока 61 на вход блока 62 подается либо сигнал адреса архивной карточки, либо сигнал информационного массива, формируемый на выходе блока 65 (см. фиг. 10). Информационный сигнал блока 62 аналогичен по структуре выходному сигналу блока 65.

Пример реализации устройства.

Решение задачи предварительной обработки исходной информации с получением архивных карточек для дальнейшего осуществления автоматизированного поиска осуществляется следующим образом. В блок 2 устройства обработки информации для информационного поиска по фиг. 1 записывается сигнал исходной информации часть информационного потока агентства экономической информации:
В Санкт-Петербурге завершился 134-й международный пушной аукцион.

134-й международный пушной аукцион завершился в Санкт-Петербурге. Как сообщил корреспонденту ИТАР-ТАСС заместитель директора фирмы "Союзпушнина" Павел Голота, в торгах приняли участие 129 покупателей из 18 стран мира. Наибольшую активность традиционно проявили представители итальянских и английских фирм.

Впервые в качестве покупателя на аукционе была представлена российская меховая фирма из Самары "Отрада", купившая 23 тысячи шкурок норки. Ожидается, что в следующем аукционе, запланированном на июнь нынешнего года, примут участие несколько десятков российских меховых предприятий.

Как сообщил корреспонденту ИТАР-ТАСС Павел Голота, фирма "Союзпушнина" получила разрешение Центробанка РФ на проведение валютных операций с российскими резидентами в конце декабря прошлого года, уже после завершения 133-го международного пушного аукциона. И многие российские меховые фирмы просто не знали о предоставившейся им возможности покупать пушнину за валюту внутри страны. Именно этим, по мнению Павла Голоты, объясняется отсутствие российских покупателей на нынешнем аукционе.

Всего за два дня торгов продано 96 процентов выставленной на продажу пушнины на общую сумму восемь с половиной миллионов долларов США. Специалисты отмечают, что цены на все виды пушнины по сравнению с прошлым аукционом, состоявшимся в начале декабря прошлого года, выросли на 5 10 процентов. ВА/ИТ
Мировая цена на золото поднялась до самого высокого за 2,5 года уровня.

Считающаяся мировой цена на золото в Лондоне впервые за последние 2,5 года превысила рубеж в 400 долларов за унцию, достигнув 407,40 долларов за унцию /1 унция равна 31,1035 г/.

По мнению французской газеты "Фигаро-Экономи", признаком дальнейшего повышения цены на этот металл является тот факт, что австрийские производители золота воздержались от продаж. Обычно они выходят на рынок сразу, как только цена начинает расти. Из этого делается вывод, что повышенная тенденция на мировом рынке золота еще не достигла своего апогея.

В то же время специалисты выражают сомнение относительно возможности удержания в течение длительного времени цены на уровне в 420 долларов за унцию или на более высоком уровне. В случае повышения цены до 440 долларов за унцию, считают они, начинается массовый приток "инвестиционного золота" из государств Ближнего и Среднего Востока, который может достичь 300 500 т, что неизбежно собьет цену. БЗ/ЛР/ВА/ИТ
Вступило в силу торговое соглашение между европейским союзом и Россией.

Вступило в силу временное соглашение по торговле между Европейским союзом и Россией. Оно будет регулировать торговые отношения между ЕС и РФ до того, как закончится процесс ратификации "большого" Соглашения о партнерстве и сотрудничестве, подписанного президентом Борисом Ельциным летом 1994 года во время европейского саммита на о. Керкира /Корфу/.

Объявляя об этом на брифинге, официальный представитель Европейской комиссии отметил, что "большое" соглашение уже ратифицировано Европарламентом и парламентами нескольких стран ЕС, но должно еще получить одобрение федерального Собрания РФ. Пока же временное соглашение позволит пятнадцати странам союза получить лучший выход на российский рынок с целым рядом товаров, в частности автомобилями и алкогольными напитками, надежнее защитить право интеллектуальной, промышленной и торговой собственности, подчеркнул этот представитель. ЕС, по его словам, ослабит ограничение на российский импорт в страны союза и смягчит в пользу России применяемые ныне по отношению к ней процедуры антидемпинга и коммерческой защиты.

"Большое" Соглашение о партнерстве и сотрудничестве идет дальше торгово-экономических отношений. Оно предусматривает регулярный политический диалог, расширение культурных связей, свободу создания предприятий на территории друг друга, свободное движение капиталов и услуг и в перспективе установление зоны свободной торговли между партнерами. ВА/ИТ
В результате работы устройства в режиме 1 сформированы три текстовых фрагмента по количеству приведенных выше информационных сообщений.

В результате автоматической обработки сформированных текстовых фрагментов в режиме 2 получены три архивные карточки, которые могут быть использованы как аннотация к исходной информации и как поле исходных данных для информационного поиска необходимой информации по контексту (фиг. 14 16).

Таким образом, заявляемое устройство по сравнению с известным обладает более широкими функциональными возможностями и областью применения за счет возможности автоматизированной обработки широкого класса массивов исходной информации и способности к адаптации, что существенно расширяет круг решаемых задач, позволяет автоматизировать поиск необходимой информации и, следовательно, повышает производительность.

Похожие патенты RU2096825C1

название год авторы номер документа
УСТРОЙСТВО ОБРАБОТКИ ИНФОРМАЦИИ ДЛЯ ИНФОРМАЦИОННОГО ПОИСКА 2008
  • Костиков Денис Иванович
  • Сулима Павел Михайлович
  • Тимофеев Николай Иванович
  • Тришин Николай Владимирович
RU2386167C1
СПОСОБ ПОИСКА ИНФОРМАЦИИ 2006
  • Окатьев Владимир Васильевич
  • Баркалов Константин Александрович
RU2320005C1
МЕТОД И СИСТЕМА ИЗВЛЕЧЕНИЯ ДАННЫХ ИЗ ИЗОБРАЖЕНИЙ СЛАБОСТРУКТУРИРОВАННЫХ ДОКУМЕНТОВ 2015
  • Костюков Михаил Валериевич
RU2613846C2
СПРАВОЧНАЯ ПРАВОВАЯ СИСТЕМА ХРАНЕНИЯ И ПОИСКА ДАННЫХ 2001
  • Першеев Д.В.
RU2223537C2
СПОСОБ ПРЕДВАРИТЕЛЬНОЙ ОБРАБОТКИ ТЕКСТА 2007
  • Гусев Михаил Николаевич
  • Егорова Ольга Борисовна
  • Смирнов Валентин Александрович
RU2386178C2
Способ и устройство высокоэффективного сжатия мультимедийной информации большого объема по критериям ее ценности для запоминания в системах хранения данных 2016
  • Свириденко Владимир Александрович
RU2654126C2
ОБНАРУЖЕНИЕ ТЕКСТОВЫХ ПОЛЕЙ С ИСПОЛЬЗОВАНИЕМ НЕЙРОННЫХ СЕТЕЙ 2018
  • Зуев Константин Алексеевич
  • Сенкевич Олег Евгеньевич
  • Голубев Сергей Владимирович
RU2699687C1
ВЕРИФИКАЦИЯ РЕЗУЛЬТАТОВ ОПТИЧЕСКОГО РАСПОЗНАВАНИЯ СИМВОЛОВ 2016
  • Калюжный Алексей Иванович
RU2634194C1
АДАПТЕР РАДИАЛЬНЫХ КАНАЛОВ ИНФОРМАЦИОННОГО ОБМЕНА 2000
  • Глушкин Е.З.
  • Рубин Г.С.
RU2159954C1
ТЕЛЕМАТИЧЕСКАЯ СИСТЕМА ДЛЯ ТРАНСПОРТНОГО СРЕДСТВА 2002
  • Бондарик А.Н.
  • Герасимчук А.Н.
  • Ефимцев А.А.
  • Харченко Г.А.
RU2207262C1

Иллюстрации к изобретению RU 2 096 825 C1

Реферат патента 1997 года УСТРОЙСТВО ОБРАБОТКИ ИНФОРМАЦИИ ДЛЯ ИНФОРМАЦИОННОГО ПОИСКА

Изобретение относится к техническим средствам информатики и вычислительной техники и может быть использовано для решения задач символьной обработки текстовой информации и предварительной обработки текстовых данных для информационного поиска. Технический результат достигается тем, что в устройство, содержащее блок сопряжения с памятью, блок ввода-вывода, буферную память ввода-вывода, блок управления, буферную память, блок отображения, входы-выходы которых соединены через магистральную шину друг с другом, память исходного массива, выход которой соединен со входом блока сопряжения с памятью, наборное поле, выход которого соединен со входом блока ввода-вывода, введены блок синтеза текстовых фрагментов, блок структурного анализа текстового фрагмента, блок символьной обработки текстового фрагмента, блок корректировки словаря словосочетаний, блок синтеза первичного словаря, блок фильтрации первичного словаря, блок синтеза вторичных словарей, блок анализа вторичных словарей, блок синтеза архивной карточки, блок архивации текстовых фрагментов, блок корректировки системных словарей, память архивной карточки, входы - выходы которых соединены через магистральную шину друг с другом, при этом вход блока отображения соединен с выходом блока ввода - вывода. 4 з.п. ф-лы, 16 ил., 2 табл.

Формула изобретения RU 2 096 825 C1

1. Устройство обработки информации для информационного поиска, содержащее блок сопряжения с памятью, блок ввода-вывода, буферную память ввода-вывода, блок управления, буферную память, блок отображения, вход и выходы которых соединены через магистральную шину друг с другом, память исходного массива, выход которой соединен с входом блока сопряжения с памятью, наборное поле, выход которого соединен с входом блока ввода-вывода, отличающееся тем, что в него введены блок синтеза текстовых фрагментов, блок структурного анализа текстового фрагмента, блок символьной обработки текстового фрагмента, блок корректировки словаря словосочетаний, блок синтеза первичного словаря, блок фильтрации первичного словаря, блок синтеза вторичных словарей, блок анализа вторичных словарей, блок синтеза архивной карточки, блок архивации текстовых фрагментов, блок корректировки системных словарей, память архивной карточки, входы и выходы которых соединены через магистральную шину друг с другом, при этом вход блока отображения соединен с выходом блока ввода-вывода. 2. Устройство по п.1, отличающееся тем, что блок синтеза вторичных словарей содержит пять блоков памяти слов, блок выделения словосочетаний, блок "Буферная память блока", блок выделения симовола, блок "Память накопленной последовательности символов", блок анализа последовательности символов, блок оценки типа слова и блок проверки допустимости последовательности символов, при этом информационным входом блока синтеза вторичных словарей является вход первого блока памяти слов, а первым шестым управляющими входами блока синтеза вторичных словарей являются соответственно управляющие входы блока выделения словосочетаний, блока выделения символа, блока "Память накопленной последовательности символов", блока анализа последовательности символов, блока оценки типа слова, блока проверки допустимости последовательности символов, при этом выход первого блока памяти слов соединен с информационным входом блока выделения словосочетаний, первый выход блока выделения словосочетаний соединен с входом второго блока памяти слов, второй выход блока выделения словосочетаний соединен с входом блока "Буферная память блока", первый выход блока"Буферная память блока" соединен с информационным входом блока оценки типа слова, второй выход блока "Буферная память блока" соединен с информационным входом блока выделения символа, первый выход блока выделения символа соединен с информационным входом блока проверки допустимости последовательности символов, второй выход блока выделения символа соединен с первым информационным входом блока "Память накопленной последовательности символов", выход блока проверки допустимости последовательности символов соединен с вторым информационным входом блока "Память накопленной последовательности символов", выход блока "Память накопленной последовательности символов" соединен с информационным входом блока анализа последовательности символов, выход блока анализа последовательности символов - с информационным входом блока оценки типа слова, первый, второй и третий выходы блока оценки типа слова соединены соответственно с входами третьего, четвертого и пятого блоков памяти слоя, при этом объединенные выходы второго - пятого блоков памяти слов являются выходом блока синтеза вторичных словарей. 3. Устройство по п.1 или 2, отличающееся тем, что блок анализа вторичных словарей содержит девять блоков памяти слов, четыре блока "Буферная память блока", два блока "Узел сравнения", три блока выделения основы слова, два блока удаления слова из блока памяти слов, два блока "Сумматор количества сигналов успешного распознавания", блок оценки типа словаря, блок сравнения типа словаря с нормой, блок оценки количества однокоренных слов, блок сравнения количества совпадений корней слов с нормой, блок памяти корректировки словаря и блок выбора слова минимальной длины, при этом информационным входом блока анализа вторичных словарей является информационный вход блока оценки типа словаря, а первым четырнадцатым управляющими входами блока анализа вторичных словарей являются соответственно управляющие входы блока оценки типа словаря, первого блока "Узел сравнения", первого блока выделения основы слова, блока выбора слова минимальной длины, первого блока "Сумматор количества сигналов успешного распознавания", блока оценки количества однокоренных слов, первого блока удаления слова из блока памяти слов, блока сравнения количества совпадений корней слов с нормой, второго блока выделения основы слова, блока сравнения типа словаря с нормой, второго блока "Узел сравнения", третьего блока выделения основы слова, второго блока удаления слова из блока памяти слов и второго блока "Сумматор количества сигналов успешного распознавания", при этом вход первого блока "Буферная память блока" соединен с первым выходом первого блока памяти слов, первый выход первого блока "Буферная память блока" соединен с информационным входом первого блока выделения основы слова, второй выход первого блока "Буферная память блока" соединен с вторым входом второго блока памяти слов, вход второго блока "Буферная память блока" соединен с вторым выходом первого блока "Узел сравнения", первый выход второго блока "Буферная память блока" соединен с информационным входом первого блока удаления слова из блока памяти слов, второй выход второго блока "Буферная память блока" соединен с информационным входом блока выбора слова минимальной длины, вход третьего блока "Буферная память блока" соединен с первым выходом третьего блока памяти слов, выход третьего блока "Буферная память блока" соединен с информационным входом третьего блока выделения основы слова, первый вход четвертого блока "Буферная память блока" соединен с вторым выходом второго блока "Узел сравнения", второй вход четвертого блока "Буферная память блока" соединен с выходом второго блока "Сумматор количества сигналов успешного распознавания", первый выход четвертого блока "Буферная память блока" соединен с информационным входом второго блока удаления слова из блока памяти слов, второй выход четвертого блока "Буферная память блока" соединен с входами восьмого и девятого блоков памяти слов, первый вход первого блока памяти слов соединен с первым выходом блока оценки типа словаря, второй вход с выходом первого блока удаления слова из блока памяти слов, второй выход с вторым информационным входом первого блока "Узел сравнения", первый вход второго блока памяти слов соединен с вторым выходом блока оценки количества однокоренных слов, первый выход с информационным входом второго блока выделения основы слова, второй выход с информационным входом блока сравнения количества совпадений корней слов с нормой, первый вход третьего блока памяти слов соединен с первым выходом блока сравнения типа словаря с нормой, второй вход с выходом второго блока удаления слова из блока памяти слов, второй выход с вторым информационным входом второго блока "Узел сравнения", вход четвертого блока памяти слов соединен с вторым выходом блока сравнения типа словаря с нормой, вход пятого блока памяти слов с выходом блока памяти корректировки словаря, вход шестого блока памяти слов с первым выходом блока сравнения количества совпадений корней слов с нормой, вход седьмого блока памяти слов с вторым выходом блока сравнения количества совпадений корней слов с нормой, информационный вход первого блока "Сумматор количества сигналов успешного распознавания" соединен с первым выходом первого блока "Узел сравнения", выход которого соединен с информационным входом блока оценки количества однокоренных слов, информационный вход второго блока "Сумматор сигналов успешного распознавания" соединен с первым выходом второго блока "Узел сравнения", первый информационный вход первого блока "Узел сравнения" соединен с выходом первого блока выделения основы слова, первый информационный вход второго блока "Узел сравнения" соединен с выходом третьего блока выделения основы слова, выход второго блока выделения основы слова с входом блока сравнения количества совпадений корней слов с нормой, второй выход блока оценки типа словаря соединен с информационным входом блока сравнения типа словаря с нормой, первый выход блока оценки количества однокоренных слов соединен с вторым входом блока памяти корректировки словаря, выход блока выбора слова минимальной длины соединен с первым входом блока памяти корректировки словаря, при этом объединенные выходы четвертого девятого блоков памяти слов являются выходом блока анализа вторичных словарей. 4. Устройство по одному из пп.1 3, отличающееся тем, что блок синтеза архивной карточки содержит шесть блоков памяти слов, два блока "Буферная память блока" и блок адресации словарей, при этом объединенные входы блоков памяти слов являются первым информационным входом блока синтеза архивной карточки, объединенные входы блоков "Буферная память блока" являются вторым информационным входом блока синтеза архивной карточки, а управляющий вход блока адресации словарей управляющим входом блока синтеза архивной карточки, при этом объединенные выходы блоков памяти слов соединены с первым информационным входом блока адресации словарей, объединенные выходы блоков "Буферная память блока" соединены с вторым информационным входом блока адресации словарей, при этом выход блока адресации словарей является выходом блока синтеза архивной карточки. 5. Устройство по одному из пп.1 4, отличающееся тем, что блок "Память архивной карточки" содержит шесть блоков памяти слов, блок "Память идентификационной информации архивной карточки", блок "Анализатор способа доступа к архиву" и блок доступа к архивной информации, при этом управляющий вход блока "Анализатор способа доступа к архиву" является управляющим входом блока "Память архивной карточки", при этом выход блока "Память идентификационной информации архивной карточки" соединен с первым информационным входом блока доступа к архивной информации, а вход блока "Память идентификационной информации архивной карточки" соединен с первым выходом блока доступа к архивной информации, при этом объединенные выходы блоков памяти слов соединены с вторым информационным входом блока доступа к архивной информации, а объединенные входы блоков памяти слов соединены с вторым выходом блока доступа к архивной информации, при этом выход блока "Анализатор способа доступа к архиву" соединен с управляющим входом блока доступа к архивной информации, при этом третий информационный вход блока доступа к архивной информации является информационным входом блока "Память архивной карточки", а третий выход блока доступа к архивной информации - выходом блока "Память архивной карточки".

Документы, цитированные в отчете о поиске Патент 1997 года RU2096825C1

Печь для непрерывного получения сернистого натрия 1921
  • Настюков А.М.
  • Настюков К.И.
SU1A1
RU, патент, 2039375, кл.G 06F 17/00, 1995
Аппарат для очищения воды при помощи химических реактивов 1917
  • Гордон И.Д.
SU2A1
RU, патент, 2039376, кл.G 06F 17/30, 1995.

RU 2 096 825 C1

Авторы

Ковалев М.В.

Виргунов И.В.

Наймушин И.А.

Четверов В.В.

Даты

1997-11-20Публикация

1996-10-14Подача