Изобретение относится к вычислительной технике и может быть использовано в системах интеллектуального анализа данных, в том числе при экологическом мониторинге, в медицинской диагностике, при обработке и анализе геолого-геофизической информации и других данных, полученных при исследовании природных и социально-экономических объектов или явлений.
Известны способы для ввода считываемых автоматически цифровых данных в полутоновые изображения (ЕР №0493053 А2, G 06 К 1/12, 19/06, 15/00, 01.07.1992.); для обработки данных (ЕР №0493105 А2, G 06 F 15/17, 01.07.1992.), а также способы отображения амплитудно-частотного спектра виброакустического сигнала (Патент РФ на изобретение RU №1831670 A3, 30.07.1993.), отображения телеметрической информации (Патент РФ на изобретение RU №2060465 С1, 20.05.1996.), контроля и оценки технического состояния многопараметрического объекта по данным телеметрической информации (Патент РФ на изобретение RU №2099792 C1, 20.12.1997.), оперативной диагностики состояний многопараметрического объекта по данным измерительной информации (Патент РФ на изобретение RU №2125294 C1, 20.01,1999.), оперативного динамического анализа состояний многопараметрических объектов (Патент РФ на изобретение RU №2134897 C1, 20.08.1999.), динамического анализа состояний многопараметрического объекта или процесса (Патент РФ на изобретение RU №2138849 C1, 27.09.1999.), контроля и оценки технического состояния многопараметрического объекта диагностики по данным измерительной информации (Патент РФ на изобретение RU №2145735 C1, 20.02.2000.), цветокодового представления и анализа характеристик колебательных процессов (Патент РФ на изобретение RU №2149455 C1, 20.05.2000.), цветокодового представления и анализа динамики состояния многопараметрического объекта или процесса (Патент РФ на изобретение RU №2150742 C1, 10.06.2000.), оперативного динамического анализа нечеткого состояния многопараметрического объекта или процесса (Патент РФ на изобретение RU №2156496 C1, 20.09.2000.).
Рассматриваемые способы, заключающиеся в одновременном выводе на экран многоцветного видеотерминала множества графиков измерительной информации, каждый их которых представляют в виде некоторой полосы цветового спектра, заданный цвет шкалы которого соответствует определенной характеристике сигнала измеряемого значения параметра, изменяющегося во времени. Приведенные способы предлагают различные решения по переходу от традиционной формы представления информации (текущих значений характеристик параметров измерительной информации) в виде графиков, к нетрадиционной форме - цветокодовому описанию состояния объекта исследования. При этом объект исследования является динамическим объектом, а формы (исходные и предлагаемые) являются функциями от времени, т.е. зависимыми от временных характеристик.
Вместе с тем, для визуализации и анализа (диагностики, распознавания, контроля, идентификации) аномальных состояний различных относительно устойчивых или стационарных объектов приведенные способы не пригодны. Для такого класса объектов важен поиск неизвестных зависимостей изменения исследуемых характеристик не от временных, а от других переменных, например от пространственных координат. При этом исследуемые характеристики являются, как правило, стационарными или квазистационарными характеристиками. Весьма часто задачи такого класса встречаются при выделении аномалий в геолого-геофизических данных, в медицинской диагностике, при оценке экологической обстановки, при анализе экономической ситуации и т.п.
Наиболее близким по технической сущности является способ оперативного динамического анализа состояний многопараметрических объектов (Патент РФ на изобретение RU №2134897, С1, 20.08.1999.). Способ позволяет оценить величину и характер изменения интегрального состояния объекта по всему множеству наблюдаемых измерительных параметров.
Основным недостатком способа является невозможность проведения анализа состояний объектов вне временных координат изменения измерительных параметров. Другими словами, способ не обеспечивает оценку величины и характера изменения состояния исследуемого многопараметрического объекта в зависимости от других (не временных) характеристик, например пространственных или топологических.
Цель изобретения - визуализация представления и выявление аномальных значений измерительных параметров (аномалий) на множестве экспериментальных данных (массиве измерительных параметров), обеспечение оценки величины и пространственных координат распределения аномалий, сокращение трудозатрат при подготовке и формировании матриц (таблиц) экспериментальных данных, повышение наглядности представления данных.
Цель достигается реализацией заявляемого способа визуального представления и анализа аномальных значений измерительных параметров многомерного объекта или процесса, сущность которого заключается в преобразовании результатов оценки значений измерительных параметров объекта или процесса в соответствующие информационные цветокодовые сигналы видимого спектра, в представлении информационных цветокодовых сигналов в виде цветокодовой матрицы-гистограммы и отображении на экране видеомонитора. При этом в качестве меры или эталона измерений (оценки) аномальных значений измерительного параметра используют его минимальное, среднее (арифметическое, взвешенное, квадратическое, степенное и пр.), среднестатистическое (математическое ожидание, дисперсия) или фоновое значения.
Выбор измерительных параметров и упомянутой меры измерения их аномальных значений осуществляет эксперт-аналитик, в качестве результатов оценки аномальных значений измерительных параметров используют идентифицированные классы аномальных значений этих параметров соответствующей кратности (степени кратности) изменения выбранной меры, операцию преобразования осуществляют путем формирования соответствующего информационного цветокодового сигнала в зависимости от результатов оценки аномальных значений измерительных параметров и пространственных координат проведенных измерений, представляют информационные цветокодовые сигналы посредством цветокодовой матрицы-гистограммы, строки которой соответствуют относительным величинам результатов оценки аномальных значений измерительных параметров, столбцы - пространственной координате их измерения, цвет ячеек матрицы - идентифицированным классам аномальных значений измерительных параметров, отображают информационные цветокодовые сигналы для анализа на любом материальном носителе информации, в том числе на бумаге, экране монитора, экране видеопроекционной аппаратуры. Для каждой пространственной координаты измерения вычисляют относительную величину измерительных параметров, включенных в соответствующий класс аномальных значений измерительных параметров, визуально по экстремальным значениям, виду и характеру цветокодовых гистограмм изображения аномальных значений измерительных параметров определяют координаты источников аномалий многомерного объекта или процесса.
Кроме того, в качестве меры измерения аномального значения измерительного параметра используют его среднее, среднестатистическое или фоновое значения, в качестве результатов оценки аномальных значений измерительных параметров используют классы аномальных значений этих параметров соответствующей различного знака кратности изменения упомянутой меры, представляющих собой положительные и отрицательные аномальные значения измерительных параметров многомерного объекта или процесса.
Пусть многомерный объект исследования представлен в виде конечного множества М экспериментальных данных. Традиционно такие данные для сложных объектов представляют собой многомерные массивы информации, анализ которых вызывает определенные трудности.
Одной из важных целей анализа является локализация аномалий, характеризующих особые (критические, необычные, нетиповые, нештатные и т.п.) состояния исследуемого объекта и (или) внешней среды.
Под аномалией традиционно понимается отклонение от нормы, от общей закономерности. Соответственно под аномальным состоянием объекта понимаем такое его состояние, которое характеризуется аномалией. Источники аномалий, а следовательно, и цели локализации аномалий могут быть самыми различными. Например, для геолого-геофизических объектов источником аномалий могут быть, с одной стороны, известные геологические возмущающие массы, с другой стороны, случайные погрешности (помехи). В первом случае локализация аномалий (аномальных значений экспериментальных данных) является основой, на которой базируется поиск месторождений полезных ископаемых. Во втором случае целью локализации является подавление (исключение) случайных помех. В экологии источником аномалий могут быть отклонения в содержании различных вредных химических веществ в окружающей природной среде. Важной задачей экологического мониторинга при этом является выявление источников и зон загрязнения природной среды.
Конкретизируем понятие аномалии. Полагаем, что вся необходимая информация о состоянии объекта и внешней среде содержится в исходном множестве (матрице) экспериментальных данных. Будем считать, что результаты некоторых наблюдений по исследуемому объекту представлены в виде некоторой матрицы данных, строки которой соответствуют различным измерительным параметрам, а столбцы - конкретным значениям (скалярам), описывающим значения этих параметров в зависимости от пространственных координат. Пусть исследуемый объект или процесс характеризуется некоторым конечным числом n измерительных параметров с числом m конкретных значений каждого из них. Тогда исходное множество данных по объекту представим в виде матрицы данных:
где аij - элемент матрицы, представляющий собой единичное j-e измерение (наблюдение, проба) по i-му измерительному параметру или по i-й выборке (реализации).
Для анализа больших объемов измерительной информации многомерных объектов, которая, как правило, представляется в детализированном виде, человек (эксперт-аналитик) использует такой прием как обобщение. Предлагается следующий подход.
Известное понятие меры измерения (эталона) является инвариантным к объекту измерения. Другими словами, свойства исследуемого объекта не зависят от принятой меры измерения их свойств. Такое положение дел с точки зрения анализа свойств исследуемого многомерного объекта не всегда является удобным и в ряде случаев может привести к резкому (экспоненциальному) росту массива измерительной информации. Выходом из такого положения является переход к другой более общей шкале измерений, т.е. к изменению меры измерения. Еще более интересные результаты можно получить, используя меру измерения, которая несет в себе информацию о состоянии исследуемого объекта или процесса. Введем понятие меры или некоторого эталона измерения (оценки) аномальных значений измерительного параметра многомерного объекта или процесса.
Полагаем, что значение элемента аij матрицы (1) определяется рассматриваемой физической величиной, характеризуемой исследуемый объект и некоторыми пространственными координатами. Каждый элемент aij в зависимости от состояния объекта, условий получения (измерения) этого элемента и т.п. в принципе может быть нормальным (в допуске, в норме) или аномальным (не в допуске, не в норме). Однако понятие “норма” в рассматриваемом случае является субъективным и размытым (нечетким) понятием. Будем использовать в место “нормы” при определении понятия аномальности другие четкие понятия, такие как минимальное, среднее (арифметическое, взвешенное, квадратическое, степенное и пр.), среднестатистическое (математическое ожидание, дисперсия), фоновое значения измерительных параметров объекта или процесса. Например, среднее значение i-го измерительного параметра можно представить в виде
где - соответственно максимальное и минимальное значения i-го измерительного параметра.
Определим выражение (2) в качестве единицы меры измерения аномальных значений измерительного параметра объекта или процесса. Тогда эту единицу меры можно использовать как эталон для оценки характеристик аномальных значений измерительных параметров и, соответственно, для оценки характеристик аномальных состояний (аномалий) объекта или процесса в целом. Аналогично в качестве единицы меры измерения (оценки) аномальных значений измерительного параметра можно использовать его минимальное, среднестатистическое или фоновое значения.
Множество возможных аномальных значений измерительного параметра может быть представлено некоторой совокупностью классов (классов аномалий). Представим возможные классы аномальных значений i-го измерительного параметра в виде
где - класс значений измерительного параметра, соответствующих некоторой норме, значение которой может быть точно определено путем выбора экспертом-аналитиком конкретной меры измерения значений этого измерительного параметра, например, в виде его минимального, среднего, среднестатистического или фонового значений, - незначительное превышение нормы, - двукратное превышение или двукратная аномалия, - трехкратное превышение или трехкратная аномалия и т.д.
Для некоторых типов объектов характеристики аномалий могут быть представлены классами аномальных значений i-го измерительного параметра в виде
где - незначительное положительное превышение нормы или положительная однократная аномалия, - незначительное отрицательное превышение нормы или отрицательная однократная аномалия, - положительное двукратное превышение или положительная двукратная аномалия, - отрицательное двукратное превышение или отрицательная двукратная аномалия и т.д.
В зависимости от целей анализа и особенностей исследуемого объекта (источника возмущения или аномалии), конкретные значения измерительного параметра могут изменяться в зависимости от тех или иных пространственных переменных Р объекта. Например, в качестве Р могут быть пространственные координаты (l - длина, h - ширина, и g - глубина или высота, где l∈L, h∈H, g∈G). Множество наблюдаемых значений измерительного параметра (строчка в массиве экспериментальных данных), оцененных в соответствии с выражениями (3)-(4) в зависимости от пространственных координат, определяет соответственно состояние исследуемого объекта или процесса с точки зрения влияния аномалий по рассматриваемому параметру.
Множество значений измерительных параметров, оцененных в соответствии с выражениями (3) или (4) в зависимости от той или иной величины Р объекта, определяет соответственно его обобщенное (интегральное) состояние, с точки зрения влияния аномалий.
Для сложных многомерных объектов, ввиду большой размерности массива экспериментальных данных (1), комплексный (интегральный) анализ по выявлению источников аномалий по большому количеству аномальных значений измерительных параметров вызывает определенные трудности. Это связано с рядом причин, среди которых основным является многомерность объекта исследования или так называемое “проклятие размерности”.
Предлагается следующий подход. Введем обобщенную (интегральную) характеристику аномальных значений рассматриваемого множества измерительных параметров
где I - общее количество измерительных параметров (показателей, признаков) исследуемого объекта, по которым оценивается аномалия (класс аномалии ) для некоторой переменной Р, I*(Р,) - количество измерительных параметров, значение которых в зависимости от конкретной величины Р отнесено к одному из классов аномалий в соответствии с выражением (3) или (4), А*(Кk) - относительное количество параметров, отнесенных для конкретной величины Р к классу аномалий Кk.
Далее, используя цветокодовую форму представления, можно преобразовать исходную матрицу данных (1) в цветокодовую матрицу-гистограмму состояния исследуемого объекта. Так, кодируя определенным цветовым кодом видимого спектра каждый из выделенных классов (3)-(4) аномальных значений измерительного параметра исследуемого объекта или процесса и обобщая по всему множеству измерительных параметров, получаем трехмерную цветокодовую матрицу-гистограмму
где z( Р) - цветокодовая информация видимого спектра, соответствующая идентифицированному k-му классу аномалий по i-му измерительному параметру, Р - пространственная координата измерения его значений, которые зависят от расположения источника возмущения (аномалии), × - знак декартова произведения множеств.
Физическое содержание измерительного параметра определяется характеристиками исследуемого объекта или процесса и может быть различным. Следовательно, рассматривать аномалии вида (3)-(4) можно для объектов любой физической природы, например для гравитационных и магнитных (электромагнитных) аномалий, аномалий в содержании химического элемента в пробе или в анализах при медицинской диагностике и т.п. Однако, несмотря на различие задач анализа аномальных значений измерительных параметров, предлагаемый способ является инвариантным по отношению к объекту анализа.
Сущность предложенного способа проиллюстрируем на примере выявления различных аномалий при анализе геолого-геофизических данных. Основной задачей поисковой геологии при поисках месторождений того или иного полезного ископаемого является выявление данных неоднородностей (аномалий) и объяснение их природы.
Конкретизируем источник аномалий (аномальных значений измерительных параметров) многомерного объекта или процесса. Рассмотрим геохимические аномалии, под которыми понимаем участок геологической среды, отличающийся существенно повышенными или пониженными концентрациями каких-либо химических элементов или их соединений по сравнению с фоновыми значениями. Такие значительно различающиеся концентрации химических элементов по своей природе обычно расположены относительно скоплений полезных ископаемых (рудной массы, нефтяных или газовых залежей и др.).
При геохимических исследованиях источником аномалий является значительное отклонение в содержании того или иного химического элемента (измерительного параметра) от нормы (заданной меры измерения). В этом случае в качестве переменной Р могут быть как пространственные координаты (глубина скважины), так и производные от них, например номера проб.
Пусть величина аномального значения анализируемого i-го измерительного параметра, в данном случае содержание i-го химического элемента, характеризуется выражением (2), где - содержание i-го химического элемента в норме, - класс аномалий, характеризующийся незначительным превышением нормы, - класс аномалий, характеризующийся двукратным превышением нормы, - трехкратное превышение, - четырехкратное превышение и т.д. Соответственно, величина аномального значения (i+1)-го измерительного параметра (содержания (i+1)-го химического элемента) характеризуется также выражением (2), где - содержание (i+1)-го химического элемента в норме, - класс аномалий, характеризующийся незначительным превышением нормы, - класс аномалий, характеризующийся двукратным превышением нормы и т. д.
Интегральные оценки всего множества экспериментальных данных можно получить, обобщая выражение (2) по всему множеству измерительных параметров (полученных измерений содержания химических элементов). Например, обобщая содержание всех анализируемых химических элементов по множеству Р пространственных координат (проб по геологическому слою P=h, по глубине скважины Р=I и пр.). Очевидно, конкретное значение меры измерения аномальных значений для каждого измерительного параметра (содержания конкретного химического элемента) будет значительно различаться, что учитывается при расчетах. Однако для рассматриваемого способа представления это не существенно, так как анализ проводится в относительных величинах, на визуальном уровне, для которого важны не конкретные значения аномальных значений измерительных параметров, а их причинно-следственные зависимости распределения.
Применяя предложенный способ, получаем цветокодовую матрицу-гистограмму состояния геологической скважины по рассматриваемому множеству измерительных параметров - содержанию некоторой совокупности химических элементов
где z(, I) - цветокодовая информация, соответствующая определенному (оцененному) значению в зависимости от пространственных координат скважины (местоположения глубины залегания источника возмущения или аномалии).
Визуальный анализ полученного представления (см. чертеж), раскрывающего суть предлагаемого способа, позволяет:
определить местоположение источника аномалий (предполагаемых залежей исследуемого химического элемента и онтологически связанных с ним других полезных ископаемых) по экстремальным значениям и виду цветокодовых гистограмм аномалий различного уровня (кратности). Так, к интервалам (I3-I4) и (I10-I11) по оси абсцисс с наибольшей вероятностью приурочены аномалообразующие объекты;
произвести оценку характера распределения цветокодовых гистограмм классов аномальных значений содержания всей совокупности рассматриваемых химических элементов в зависимости от глубины нахождения источника возмущений (аномалий). Эта оценка проводится на визуальном уровне по характеру распределения различных гистограмм двукратной, трехкратной аномалий;
провести визуальную оценку корреляции (сопоставление и взаимное распределение) гистограмм классов аномальных значений содержания химического элемента в зависимости от пространственных координат нахождения источника аномалии.
Необходимо отметить, что предлагаемая форма представления информации в виде цветокодовых матриц-гистограмм (5)-(6) является весьма емкой и очень наглядной, так как позволяет описать и визуально представлять большие массивы экспериментальных данных. Величина или мощность множества измерительных параметров, обобщаемых с помощью соотношения (4), может быть самой различной и не ограничена в рамках предлагаемой формы цветокодового представления, так как операции преобразования и оценки проводятся не с абсолютными, а с относительными величинами.
Очевидно, такая информация является необходимой для визуального анализа состояния исследуемого объекта или процесса, который проводит опытный эксперт-аналитик.
Таким образом, предлагаемый способ визуального представления и анализа аномальных значений измерительных параметров многомерного объекта или процесса можно рассматривать как новый способ выделения (распознавания, идентификации) аномалий. С другой стороны, предлагаемый способ может рассматриваться как универсальная форма визуализации аномальных значений измерительных параметров любого многомерного объекта или процесса.
Практический пример реализации предлагаемого способа показывает его достаточную простую реализуемость с помощью ЭВМ, следовательно, выполняется требование промышленной реализуемости способа.
Таким образом, предлагаемый способ может быть использован как на малых, так и на больших выборках экспериментальных данных, что подтверждает универсальность предлагаемой формы представления информации и реализуемость предлагаемого способа на ЭВМ.
Совокупность существенных признаков, приводящая к требуемому результату, в патентной и научно-технической литературе не обнаружена, что говорит об “изобретательском уровне” предлагаемого технического решения. Новизна предлагаемого способа, по сравнению с прототипом и известными способами представления и анализа аномалий, заключается в том, что разработана логическая последовательность действий по визуальному представлению и анализу аномальных значений измерительных параметров многомерного объекта, которая приводит к достижению поставленной цели изобретения.
Объект исследования, наблюдаемые измерительные параметры могут быть самыми различными по физическому содержанию. Цветокодовые описания объекта также могут быть различными (по природе аномалии и аномальных значений измерительных параметров, по виду классов аномалий, по цветам описания классов аномалий, по характеристикам распределения аномалий и пр.). Вместе с тем, положенная в основу способа логическая совокупность действий по визуализации и анализу аномальных значений измерительных параметров является инвариантной к природе объекта или процесса, что является несомненным достоинством заявляемого способа. Таким образом, полученное свойство инвариантности описания и представления цветокодовых матриц-гистограмм позволяет добиться максимального обобщения, что обеспечивает возможность широкого внедрения предлагаемого способа в различные практические приложения.
Для проведения оперативного (в реальном масштабе проведения измерений) анализа аномальных значений измерительных параметров многомерных объектов или процессов весьма эффективным применением способа является режим наблюдения или мониторинга (оперативного просмотра данных с применением ЭВМ). Оперативный анализ может проводиться как по конкретному объекту, так и при просмотре интересующих эксперта-аналитика информационных массивов (выборок) из различных баз данных, хранилищ данных, архивов. Например, просмотр и анализ на экране многоцветного видеомонитора различных информационных массивов из баз данных геолого-геофизических материалов на локальном или региональном уровнях и пр.
Изобретение относится к вычислительной технике, а именно к системам интеллектуального анализа данных. Его применение при исследовании природных и социально-экономических объектов или явлений позволяет получить технический результат в виде повышения наглядности представления данных, подлежащих анализу, улучшения качества и достоверности результатов анализа, упрощения процедуры выявления аномальных значений измерительных параметров. Этот результат достигается благодаря тому, что осуществляются следующие действия: преобразование результатов оценки значений измерительных параметров в цветокодовые сигналы, отображение цветокодовых сигналов в виде цветокодовой матрицы-гистограммы на экране видеомонитора; в качестве результатов оценки аномальных значений измерительных параметров используют идентифицированные классы аномальных значении этих параметров, вычисление относительной величины измерительных параметров, визуальное определение координат источников аномалий. 1 з.п. ф-лы, 1 ил.
СПОСОБ АНАЛИЗА ДИНАМИЧЕСКИХ МНОГОПАРАМЕТРИЧЕСКИХ ПРОЦЕССОВ | 2000 |
|
RU2164039C1 |
СПОСОБ КОНТРОЛЯ И ОЦЕНКИ ТЕХНИЧЕСКОГО СОСТОЯНИЯ МНОГОПАРАМЕТРИЧЕСКОГО ОБЪЕКТА ДИАГНОСТИКИ ПО ДАННЫМ ИЗМЕРИТЕЛЬНОЙ ИНФОРМАЦИИ | 1999 |
|
RU2145735C1 |
СПОСОБ ОПЕРАТИВНОЙ ДИАГНОСТИКИ СОСТОЯНИЙ МНОГОПАРАМЕТРИЧЕСКОГО ОБЪЕКТА ПО ДАННЫМ ИЗМЕРИТЕЛЬНОЙ ИНФОРМАЦИИ | 1997 |
|
RU2125294C1 |
СПОСОБ ПОЛУЧЕНИЯ ФОСФОРНОЙ КИСЛОТЫ | 0 |
|
SU245039A1 |
Двухступенчатый проходной редуктор ведущего моста автомобиля | 1974 |
|
SU493105A1 |
Авторы
Даты
2004-09-27—Публикация
2001-04-13—Подача