METHOD FOR AUTOMATIC SEMANTIC INDEXING OF NATURAL LANGUAGE TEXT Russian patent published in 2014 - IPC G06F17/27

Abstract RU 2518946 C1

FIELD: information technology.

SUBSTANCE: method for automatic semantic indexing of natural language text comprises segmenting the text into elementary first level units (words) and sentences; forming second level units (standardised word forms); calculating the frequency of occurrence of each first level unit for adjacent first level units and merging the sequence of words into third level units (stable word combinations); identifying in each sentence a semantically significant entity and an attribute thereof (fourth level units); identifying in each sentence semantically significant relationships between semantically significant entities and between semantically significant entities and attributes; determining the frequency of occurrence of second level and third level units; forming, for each semantically significant relationship, a plurality of triads (fifth level units); on the plurality of the formed triads, separately indexing all semantically significant entities linked by semantically significant relationships with their frequency of occurrence, all attributes with their frequency of occurrence and all formed triads.

EFFECT: high accuracy of indexing natural language texts.

6 cl, 2 dwg, 23 tbl

Similar patents RU2518946C1

Title	Year	Author	Number
METHOD FOR AUTOMATIC SEMANTIC CLASSIFICATION OF NATURAL LANGUAGE TEXTS	2013	Kharlamov Aleksandr Aleksandrovich	RU2538304C1
METHOD FOR AUTOMATIC SEMANTIC COMPARISON OF NATURAL LANGUAGE TEXTS	2013	Kharlamov Aleksandr Aleksandrovich	RU2538303C1
METHOD FOR AUTOMATIC TEXT PROCESSING IN NATURAL LANGUAGE THROUGH SEMANTIC INDEXATION, METHOD FOR AUTOMATIC PROCESSING COLLECTION OF TEXTS IN NATURAL LANGUAGE THROUGH SEMANTIC INDEXATION AND COMPUTER READABLE MEDIA	2008	Khoroshevskij Vladimir Fedorovich Klintsov Viktor Petrovich	RU2399959C2
METHOD AND SYSTEM OF SEMANTIC PROCESSING TEXT DOCUMENTS	2016	Mitelkov Dmitrij Vladimirovich Novikov Andrej Yurevich Satin Boris Borisovich	RU2630427C2
METHOD FOR AUTOMATED EXTRACTION OF SEMANTIC COMPONENTS FROM COMPOUND SENTENCES OF NATURAL-LANGUAGE TEXTS IN MACHINE TRANSLATION SYSTEMS AND APPARATUS FOR IMPLEMENTATION THEREOF	2021	Karpov Antonii Gennadevich Khachukaev Eduard Magomedovich Khachukaeva Elina Eduardovna	RU2777693C1
METHOD FOR AUTOMATED EXTRACTION OF SEMANTIC COMPONENTS FROM COMPOUND SENTENCES OF NATURAL LANGUAGE TEXTS IN MACHINE TRANSLATION SYSTEMS AND DEVICE FOR ITS IMPLEMENTATION	2021	Karpov Anton Gennadevich Khachukaev Eduard Magomedovich Khachukaeva Elina Eduardovna	RU2766060C1
METHOD FOR AUTOMATED EXTRACTION OF SEMANTIC COMPONENTS FROM COMPOUND SENTENCES OF NATURAL LANGUAGE TEXTS IN MACHINE TRANSLATION SYSTEMS AND DEVICE FOR IMPLEMENTATION THEREOF	2021	Karpov Anton Gennadevich Khachukaev Eduard Magomedovich Khachukaeva Elina Eduardovna	RU2766821C1
METHOD OF FORMING AN ONTOLOGICAL DATABASE OF A STRUCTURED DATA ARRAY	2019	Rogachev Igor Petrovich	RU2714899C1
METHOD OF FORMING A DATA STRUCTURE CONTAINING SIMPLE JUDGMENTS	2019	Rogachev Igor Petrovich	RU2717719C1
METHOD OF TRANSFORMING A STRUCTURED DATA ARRAY CONTAINING SIMPLE JUDGMENTS	2019	Rogachev Igor Petrovich	RU2717718C1

RU 2 518 946 C1

Authors

Kharlamov Aleksandr Aleksandrovich

Dates

2014-06-10—Published

2012-11-27—Filed