Показать метаданные Скрыть метаданные

(19)

(11)

2 830 819

(13)

(51)

МПК

G05B13/02(2006-01-01)

G06N5/04(2006-01-01)

(21) (22)

Заявка

2023115276, 2023-06-09

(24)

Дата начала отсчета патента

2023-06-09

(22)

дата подачи заявки

2023-06-09

(45)

опубликовано

2024-11-26

(72)

авторы

Крюков Владимир Германович

(73)

патентообладатели

Крюков Владимир Германович

(56)

Документы, цитированные в отчете о поиске

US 20200265956 A1, 20.08.2020US 20200273304 A1, 27.08.2020US 20180005146 A1, 04.01.2018.

САМООБУЧЕНИЕ СИСТЕМЫ ПРИНЯТИЯ РЕШЕНИЙ В МУЛЬТИАГЕНТНОЙ СРЕДЕ Российский патент 2024 года по МПК G05B13/02 G06N5/04

Описание патента на изобретение RU2830819C1

ОБЛАСТЬ ТЕХНИКИ

[000] Реализации изобретения в целом относятся к области вычислительных систем, а более конкретно к системам, предназначенным для принятия решений без участия человека, и средствам самообучения таких систем.

УРОВЕНЬ ТЕХНИКИ

[0002] В настоящее время мультиагентные (многоцелевые, многоагентные) системы имеют большую актуальность и широкое применение в различных областях, например, таких как робототехника, безопасность, медицина, логистика, бизнес, маркетинг и т.д. Система принятия решений является ключевым элементом и основой всего функционирования для создания «Сильного» Искусственного Интеллекта (Сильный ИИ / AGI). Мышление - непрерывное принятие решений на различном уровне в отношении разных целей или задач. Одной из целей изобретения является реализация системы, способной принимать совокупное решение с учётом актуальности целей. При этом решение должно быть оптимальным, дающим лучшее развитие системы как в текущем моменте времени, так и в будущем. Новая система для принятия решений в мультиагентной среде описана в патенте РФ 2791840.

[0003] Современные попытки создать ИИ сводятся в общем случае к разработке отдельных фрагментов интеллекта, каждый из которых решает одноцелевую задачу, пригодную для формализации. Однако существует множество сложностей при сборке общей/целой многозадачной системы. Если сравнивать процесс мышления человека с ИИ, то человек способен ставить перед собой определенные цели на будущее и намечать планы их реализации. Человек способен принимать различные решения в каждый момент времени. Однако не все решения доступны сознательному контролю и пониманию. То есть решения могут приниматься и исполняться независимо от сознания человека/параллельно, что не всегда выглядит логичным решением со стороны ИИ.

[0004] Мышление имеет аналитическую и прогностическую функцию, соответственно мышление о прошлом и о будущем. Мышление также отвечает за управление текущим моментом (оперативные решения и их исполнение). Задача идеального мышления - находить оптимальные решения для текущего момента времени с учётом будущего развития событий и накопленного ранее опыта.

[0005] Основная задача системы принятия решений - адекватно реагировать как на внешние воздействия, так и на внутренние изменения, происходящие в самой системе как таковой, выбирая правильное решение в каждый момент времени. При этом система должна неуклонно стремиться к достижению одной или нескольких стоящих перед ней и конкурирующих между собой целей. Цели или задачи системы имеют иерархическую структуру. Из целей разного уровня образуются планы. Система принятия решений главным образом стремится к достижению поставленных целей и сохранению/ поддержанию равновесного состояния с наибольшей эффективностью.

[0006] Еще одной основополагающей сущностью для построения системы принятия решения, как и для любого интеллекта, является опыт, который накапливается с течением времени, как это и присуще человеческому сознанию. Однако, в отличие от человека, сложная инженерная, особенно такая, как направленная на обеспечение жизнедеятельности человека (например, автопилот автомобиля, самолета, система безопасности, система - ассистент для хирургических вмешательств) система не имеет право на ошибки, которые присущи человеку несмотря на накопленный опыт. Признаем себе, что любому человеку и его интеллекту присуще ошибаться в виду обманчивого восприятия реальности или в виду недостаточной проработки последствий того или иного действия.

[0007] Разработанная система, несмотря на лежащей в ее основе в некотором роде интеллект, смоделированный на принципах психики человека и мышления, способна гораздо эффективнее принимать именно оптимальные решения, основываясь на накопленном опыте самой обучаемой системы, подлежащем динамическому пересчету и переосмысливанию с течением времени.

[0008] Как уже было сказано выше, основой всей системы обучения для принятия оптимальных решений является опыт. Под опытом подразумеваются все обработанные системой события и деятельность между моментом определения цели и моментом получения конечного результата. Размеры опыта могут простираться от одного такта работы системы до всего времени работы, в зависимости от заданной кластеризации. Для большей эффективности восприятия описания системы в настоящем документе введено понятие «единичного опыта», являющимся элементарным фрагментом «единицей» опыта, где множество единиц опыта подлежат комбинации и классификации полного опыта системы, подлежащего динамической модификации, перерасчету, пересмотру, кластеризации и классификации, как этого требует реализация заявленной самообучающейся системы, в том числе согласно принципам кодирования опыта.

[0009] Конкретные цели задаются на этапе проектирования системы, основываясь на иерархии целей. Цели или задачи системы в некотором смысле можно сопоставить с потребностями человека (Иерархия потребностей Маслоу). Каждая потребность - это отдельная цель. Взаимоотношение целей между собой является самой сложной проблемой, которая может быть решена, например, через систему приоритетов при принятии решений. Результатом чего становится строка или матрица состояний (в зависимости от сложности проектируемой системы). В контексте настоящего описания помимо всего предлагаются решения для формирования многоуровневых иерархических целей и потребностей системы для принятия оптимальных решений.

[0010] Каждая цель отражается в строке (матрице) состояния и реализуется одним отдельным процессом. Процесс или отдельная задача, способная реализовать одну цель, может быть сделана в виде нейронной сети различного типа либо в виде универсального аналитического процесса.

[0011] Настоящее изобретение создано с целью повышения эффективности работы системы для принятия решений в мультиагентной среде и устранение недостатков присущих уровне техники, делая процесс принятия оптимальных решений в мультиагентной среде самообучаемым, быстрым и обладающим абсолютной точностью, сводя количество ошибок при принятии решений системы практически к околонулевому уровню.

РАСКРЫТИЕ ИЗОБРЕТЕНИЯ

[0012] Согласно принципам и методам, подробно раскрытым в настоящем описании, указанные выше достижения и эффекты, наряду с дополнительными преимуществами, которые можно подчерпнуть из всего текста и отдельных его частей, настоящее изобретение по меньшей мере характеризует указанные ниже средства, так же подлежащие подробному описанию в настоящем документе, согласно детально описываемым в нем алгоритмам.

[0013] В одном альтернативном варианте заявленное изобретение характеризует Автономную самообучающуюся систему принятия решений, включающую блок получения внешних воздействий; блок обработки внешних воздействий; библиотеку внутренних образов ВО; блок текущего состояния системы; супервизор состояний; блок принятия решений, связанный с супервизором состояний; исполнительный блок; блок оперативного обучения, сконфигурированный для формирования опыта системы на основании принимаемых решений; общий блок обучения, дополнительно содержащая: блок коррекции, взаимосвязанный с библиотекой ВО, блоком оперативного обучения и библиотекой знаний, где указанный блок коррекции выполнен с возможностью, по меньшей мере, динамического перерасчета элементарного опыта на основании принципов матрицы потребностей МП, ассоциированных с одной и более целью системы принятия решений, способной самостоятельно детерминировать указанные одну или более цели, и где блок оперативного обучения, дополнительно включает хранилище, предназначенное для хранения одного или более элементарного опыта, подлежащего формированию с учетом изменения показателей состояния при принятии решений при достижении цели текущего момента времени и затрачиваемой энергии для такого одного или более элементарного опыта.

[0014] В другом альтернативном варианте заявленное изобретение характеризует Автономную самообучающуюся систему принятия решений, в которой потребности системы оцениваются с учетом коэффициентов коррекции и/или коэффициентов уровней.

[0015] В другом альтернативном варианте заявленное изобретение характеризует Автономную самообучающуюся систему принятия решений, в которой один или более элементарный опыт подлежит оценке с помощью меры эффективности опыта ЭО для детерминирования доминанта, при этом рассчитанные данные ЭО поступают в блок оперативного обучения.

[0016] В другом альтернативном варианте заявленное изобретение характеризует Автономную самообучающуюся систему принятия решений, в которой в блоке коррекции осуществляется перерасчет значений МП.

[0017] В другом альтернативном варианте заявленное изобретение характеризует Автономную самообучающуюся систему принятия решений, в которой МП включает одну или более базовую матрицу потребностей БМП.

[0018] В другом альтернативном варианте заявленное изобретение характеризует Автономную самообучающуюся систему принятия решений, в которой МП включает одну или более легкую матрицу потребностей ЛМП.

[0019] В другом альтернативном варианте заявленное изобретение характеризует Автономную самообучающуюся систему принятия решений, в которой МП включает одну или более тяжелую матрицу потребностей ТМП.

[0020] В другом альтернативном варианте заявленное изобретение характеризует Автономную самообучающуюся систему принятия решений, в которой МП обладает динамически расширяемой наполняемой структурой.

[0021] В другом альтернативном варианте заявленное изобретение характеризует Автономную самообучающуюся систему принятия решений, в которой ТМП имеет одно или более расширений, представляющих собой один или более кластер целей, где каждый указанный кластер цели характеризуется наличием одной доминирующей потребности.

[0022] В другом альтернативном варианте заявленное изобретение характеризует Автономную самообучающуюся систему принятия решений, в которой ТМП выполнена с возможностью группирования целей по отношению к потребностям.

[0023] В другом альтернативном варианте заявленное изобретение характеризует Автономную самообучающуюся систему принятия решений, в которой МП включает одну или более матрицу потребностей состояний системы МПСС, включающую значения состояний в ассоциации со значениям приоритетов и весовых коэффициентов текущих потребностей.

[0024] В другом альтернативном варианте заявленное изобретение характеризует Автономную самообучающуюся систему принятия решений, в которой решение для принятия на текущий момент определяется на основе данных, содержащихся в МПCC с учетом вычисляемого интегрального результата.

[0025] В другом альтернативном варианте заявленное изобретение характеризует Автономную самообучающуюся систему принятия решений, в которой МП используется для отображения ВО, которому присваиваются значения весового коэффициента ВО, отражающего эффективность удовлетворения потребности за момент времени, и структура МП наполняется весовыми коэффициентами ВО, отражающими меру участия конкретного объекта в удовлетворении потребностей системы или степень важности образа для исполнения стоящей цели.

[0026] Еще в одном альтернативном варианте реализации заявленное изобретение характеризует Способ самообучения системы принятия решений, реализуемый компьютерной системой, включающий по меньшей мере такие этапы, как получение вычислительной системой данных внешнего воздействия от датчиков и/или устройств системы, включающих средства для оценки и анализа внутренних параметров системы для конкретного момента времени; оценка вычислительной системой полученных параметров с целью определения соответствия таких параметров потребностям для достижения целей и принятия решения для момента времени; выполнение вычислительной системой поставленной одной или более цели для момента времени; оценка вычислительной системой эффективности достижения указанной одной или более единичной или комбинированной в момент времени и энергии, затраченной на указанные действия; накопление вычислительной системой одного или более элементарного опыта, характеризующего указанную вычисленную оценку эффективности; динамический перерасчет вычислительной системой одного или более указанного элементарного опыта на основании принципов матрицы потребностей МП, ассоциированных с одной и более целью системы принятия решений, способной самостоятельно детерминировать указанные одну или более цели; оперативное обучение вычислительной системы, включающей хранилище, предназначенное для хранения одного или более элементарного опыта, подлежащего формированию с учетом изменения показателей состояния при принятии решений при достижении цели текущего момента времени и затрачиваемой энергии для такого одного или более элементарного опыта; накопление опыта вычислительной системой по результатам указанного оперативного обучения, включающим указанные один или более элементарные опыты для текущего времени с момента инициализации обучения системы принятия решений; принятие одного или более решений системой принятия решений; динамическая коррекция полученного опыта вычислительной системой для принятия последующих одного и более решений.

[0027] Еще в одном альтернативном варианте реализации заявленное изобретение характеризует Способ самообучения системы принятия решений, в котором потребности системы оцениваются с учетом коэффициентов важности КВ, коэффициента значимости КЗ, коэффициента неважности КНВ, коэффициента незначимости КНЗ.

[0028] Еще в одном альтернативном варианте реализации заявленное изобретение характеризует Способ самообучения системы принятия решений, в котором один или более элементарный опыт подлежит оценке с помощью меры эффективности опыта ЭО для детерминирования доминанта, при этом рассчитанные данные ЭО учитываются для оперативного обучения.

[0029] Еще в одном альтернативном варианте реализации заявленное изобретение характеризует Способ самообучения системы принятия решений, в котором дополнительно осуществляется перерасчет значений МП.

[0030] Еще в одном альтернативном варианте реализации заявленное изобретение характеризует Способ самообучения системы принятия решений, в котором МП включает одну или более базовую матрицу потребностей БМП.

[0031] Еще в одном альтернативном варианте реализации заявленное изобретение характеризует Способ самообучения системы принятия решений, в котором МП включает одну или более легкую матрицу потребностей ЛМП.

[0032] Еще в одном альтернативном варианте реализации заявленное изобретение характеризует Способ самообучения системы принятия решений, в котором МП включает одну или более тяжелую матрицу потребностей ТМП.

[0033] Еще в одном альтернативном варианте реализации заявленное изобретение характеризует Способ самообучения системы принятия решений, в котором МП обладает динамически расширяемой наполняемой структурой.

[0034] Еще в одном альтернативном варианте реализации заявленное изобретение характеризует Способ самообучения системы принятия решений, в котором ТМП имеет одно или более расширений, представляющих собой один или более кластер целей, где каждый указанный кластер цели характеризуется наличием одной доминирующей потребности.

[0035] Еще в одном альтернативном варианте реализации заявленное изобретение характеризует Способ самообучения системы принятия решений, в котором ТМП выполнена с возможностью группирования целей по отношению к потребностям.

[0036] Еще в одном альтернативном варианте реализации заявленное изобретение характеризует Способ самообучения системы принятия решений, в котором МП включает одну или более матрицу потребностей состояний системы МПСС, включающую значения состояний в ассоциации со значениям приоритетов и весовых коэффициентов текущих потребностей.

[0037] Еще в одном альтернативном варианте реализации заявленное изобретение характеризует Способ самообучения системы принятия решений, в котором решение для принятия на текущий момент определяется на основе данных, содержащихся в МПCC с учетом вычисляемого интегрального результата.

[0038] Еще в одном альтернативном варианте реализации заявленное изобретение характеризует Способ самообучения системы принятия решений, в котором МП используется для отображения ВО, которому присваиваются значения весового коэффициента ВО, отражающего эффективность удовлетворения потребности за момент времени, и структура МП наполняется весовыми коэффициентами ВО, отражающими меру участия конкретного объекта в удовлетворении потребностей системы или степень важности образа для исполнения стоящей цели.

[0039] Еще в одном альтернативном варианте реализации заявленное изобретение характеризует Способ самообучения системы принятия решений, в котором МП является основным инструментом расчётов для принятия решений.

[0040] Еще в одном альтернативном варианте реализации заявленное изобретение характеризует Способ самообучения системы принятия решений, в котором указанный элементарный опыт может быть интегрирован в пространство смыслов, а также может быть одним из одного или более фрагментов комбинированного опыта.

[0041] Еще в одном альтернативном варианте реализации заявленное изобретение характеризует Способ самообучения системы принятия решений, в котором при указанной динамической коррекции осуществляется коррекция ВО, при этом рассчитывается необходимость коррекции значений коэффициентов потребностей в МП.

[0042] Еще в одном альтернативном варианте реализации заявленное изобретение характеризует Способ самообучения системы принятия решений, в котором при осуществлении коррекции и накопления опыта интегрируется накопленный опыт, с учетом значения его эффективности.

[0043] Еще в одном альтернативном варианте реализации заявленное изобретение характеризует Способ самообучения системы принятия решений, в котором интеграция осуществляется в случае, если значение эффективности текущего опыта превосходит значение эффективности прошлого накопленного опыта.

Еще в одном альтернативном варианте реализации заявленное изобретение характеризует Машиночитаемый энергонезависимый носитель данных, содержащий исполняемые инструкции, которые при исполнении компьютерной системой побуждают компьютерную систему выполнять способ самообучения системы принятия решений.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

[0044] Изобретение станет более понятным благодаря приведенному ниже подробному описанию и прилагаемым чертежам различных вариантов реализации изобретения. Однако чертежи не должны использоваться для ограничения изобретения конкретными вариантами реализации, а предназначены только для пояснения и понимания сущности настоявшего изобретения.

[0045] На Фиг. 1 представлена примерная блок-схема системы для принятия решений.

[0046] На Фиг. 2 представлена блок-схема функционирования системы принятия решений.

[0047] На Фиг. 3 представлена блок-схема одного из возможных вариантов реализации настоящего изобретения, при котором применяется облачное хранилище данных.

[0048] На Фиг. 4 представлена блок-схема способа принятия решений в соответствии с некоторыми вариантами реализации настоящего изобретения.

[0049] На Фиг. 5 представлена блок-схема компьютерной системы, которая может использоваться для реализации вариантов способов принятия решений системы принятия решений с самообучением.

[0050] На Фиг. 6 изображена примерная блок-схема системы принятия решений с самообучением.

[0051] На Фиг. 7 изображена примерная схематичная диаграмма накопления опыта.

[0052] На Фиг. 8 схематично показана коррекция опыта.

[0053] На Фиг. 9 показана примерная схема развития и динамической коррекции МП и ВО.

[0054] На Фиг. 10 изображена примерная схема расчета опыта в системе принятия решений с самообучением.

[0055] На Фиг. 11 схематично показано использование КВ, КЗ, КНЗ, КНВ.

[0056] На Фиг. 12 схематически изображена структура базовой МП БМП.

[0057] На Фиг. 13 показа структурная схема матрицы МП.

ПОДРОБНОЕ ОПИСАНИЕ

[0058] Для обеспечения однозначного понимания и восприятия принципов работы заявленной системы необходимо выделить следующие термины и определения, присущие изобретению.

[0059] Матрица потребностей (системы) МП - матричная иерархически-кластерная структура, отражающая актуальность текущих потребностей системы.

[0060] Внутренний образ (системы) ВО - набор данных, характеризующий отношение объекта к различным потребностям системы в моменте времени.

[0061] Внешнее воздействие ВВ - внешнее воздействие на систему в момент времени, данные о внешнем воздействии (окружении).

[0062] ЛМП - легкая матрица потребностей

[0063] БМП - базовая матрица потребностей

[0064] НМП - нормальная матрица потребностей

[0065] ЭО - эффективность опыта

[0066] E - энергия, необходимая для текущего удовлетворения потребности(ей)

[0067] КЗ - коэффициент значимости

[0068] КВ - коэффициент важности

[0069] КНВ - коэффициент неважности

[0070] КНЗ - коэффициент незначимости

[0071] КК - коэффициент коррекции.

МАТРИЦА ПОТРЕБНОСТЕЙ

[0072] Матрица Потребностей - это матричная иерархически-кластерная структура, отражающая актуальность текущих потребностей системы.

[0073] Также Матрица Потребностей может называться Матрицей Приоритетов, так как её содержание отражает значение текущих приоритетов для соответствующих потребностей.

[0074] Матрица Потребностей (МП) является основным структурным элементом из которых строится вся интеллектуальная система.

[0075] МП - основной рабочий элемент для библиотеки внутренних образов, для системы принятия решения, для матрицы смежности в библиотеке знаний, для системы фильтрации внешних воздействий, для Супервизора состояний.

[0076] Матрица Потребностей в одинаковой структурной конфигурации, но с разным содержанием и с разными источниками данных, используется для решения различных задач и блоков данных в системе.

[0077] Матрица Потребностей используется для определения состояния Системы.

[0078] МПСС. Это главная матрица системы.

[0079] Состояние системы - это значения приоритетов или весовых коэффициентов текущих потребностей, которые сведены в специальную матрицу со структурой, которая может корректироваться в процессе накопления опыта и развития системы.

[0080] На основе данных, содержащихся в матрице потребностей, вычисляется интегральный результат того, какое решение будет принято к исполнению в настоящий момент времени. Или, другими словами, выбирается наиболее значимая цель, исполнение которой даст системе наибольшую пользу. Цель может быть одиночной или составленной из различных целей.

[0081] Матрица Потребностей используется для отображения внутреннего образа. МПВО. Структура матрицы наполняется весовыми коэффициентами, которые отражают участие данного объекта в удовлетворении соответствующих потребностей. Или степень важности данного образа для исполнения цели, стоящей перед Системой. В математическом смысле весовой коэффициент представляет собой эффективность удовлетворения указанной потребности этим внутренним образом за равный момент времени.

[0082] ВО, по существу, в контексте технологической системы принятия решений являются отражением внешних объектов, взаимодействующих с системой. Они отражают качество внешних объектов или потенциальную пользу или вред, которые были обозначены в процессе обучения или осмысления полученного опыта.

[0083] Таким образом, основной смысл внутреннего образа - это отношение какого-либо взаимодействующего с системой «объекта» объекта к потребностям. То есть, отдельным элементом (ячейкой матрицы потребностей) является коэффициент значимости образа объекта в удовлетворении конкретной потребности. Эти коэффициенты сводятся в матрицу потребностей МП для внутреннего образа, где для каждой потребности предусмотрена отдельная ячейка. Эта матрица имеет такую же структуру, как матрица потребностей для всей системы. Содержимое такой матрицы стабильно в рамках оперативной деятельности системы, а коррекция допустима только посредством средств самообучения для системы принятия решений, являющейся существом настоящего изобретения.

[0084] Для каждого ВО вычисляется коэффициент эффективности (расхода ресурсов) КЭ, который позволяет сравнивать относительную значимость ВО. КЭ рассчитывается для энергии выживания, а также для ценности соответствующих уровней иерархии потребностей.

[0085] На примере интеллекта человека, в процессе мышления и его работы участвуют не внешние объекты, а внутренние образы. Эти образы формируются и корректируются в Психике в течение жизнедеятельности. Каждый тип объекта формирует свой внутренний образ. На тысячу кошек формируется один ВО, который отражает "потребительские свойства" кошек.

[0086] Таким образом, однотипным объектам соответствует единственный Внутренний образ.

[0087] Помимо обычных Внутренних образов в Интеллекте используются Макрообразы, которые являются более значимыми элементами Библиотеки Внутренних образов (обладают повышенной ценностью). Они присутствуют в каждой индивидуальной психике и выполняют схожие функции. Кроме того, их наполнение смыслом имеет не только внешнее физическое содержание, но и внутреннее психологическое.

[0088] Матрица Потребностей также используется как точка на графе Пространства смыслов (матрицы смежности). МПМС. Точками графа являются целевые состояния. Целевое состояние описывает комбинацию значений потребностей в некий момент времени. Если система принимает решение выбора какого-то целевого состояния, то это целевое состояние является оптимальным для системы в будущем, и тогда будут выполняться исполнительные алгоритмы, которые предусмотрены переходом из текущего состояния в следующее оптимальное целевое состояние.

[0089] Переход между точками определяет степень решения задачи и необходимые затраты энергии на ее реализацию. Построение графа дает "осмысление" опыта. То есть, что можно получить в результате исполнения алгоритмов и какие затраты для этого предстоят. Именно эта информация используется интеллектом для выбора и планирования будущей деятельности.

СТРУКТУРА МАТРИЦЫ ПОТРЕБНОСТЕЙ.

[0090] Для пояснения принципа работы системы, на примере человеческого интеллекта, можно описать следующую многоуровневую организацию МП. Схожая структура МП так же применяется и в заявленной системе. Описанная ниже структура, применительно к человеческому интеллекту носит пояснительный характер. Очевидно, что, например, система принятия решений не может иметь, например, семейно-бытовых потребностей, однако аналогичные потребности у системы имеются.

[0091] Человек стоит на верхушке эволюционной цепочки и в настоящее время никто, кроме обученного интеллекта не способно принимать оптимальные решения. Человеческая Психика формируется под воздействием случайных влияний. А Интеллект должен будет формироваться исключительно под целенаправленными воздействиями, выбирая при этом только оптимальные решения. В принципах заявленной системы в большой степени применяются принципы психологии человека, структурированные именно таким образом, как это устроено в природе. Однако, заявленная система способна принимать оптимальные решения и обучаться даже с большей эффективностью, поскольку накопленный негативный опыт также подлежит учету, оценке и переоценке, что не всегда способен осуществить интеллект в меру особенностей конкретного индивида и других факторов, способных наложить отпечаток на принятии оптимального решения или помешать таковому. В качестве примера, можно привести стандартную ситуацию, в которой подросток в зимний период времени, после длительной болезни снимает на улице шапку, поскольку в данной среде носить шапку «не модно», несмотря на то, что обеспечение тепла для оптимального функционирования является базовой потребностью и ему об этом известно, но в данном случае социо-культурные наслоения мешают ему принять оптимальное решение, связанное с выживанием, несмотря на прошлый опыт, известность последствий неверного решения и возможность гибели организма (тяжелое заболевание).

[0092] 1-й уровень МП потребностей. Базовые Необходимые.

[0093] В человеческом интеллекте такой набор содержит такие, как: Физиологические. Возникают с момента рождения. Считаются через энергию выживания;

[0094] Пища, как энергия для деятельности;

[0095] Потребности естественно-биологические (вода, воздух, атмосферное давление, процессы выделения отходов жизнедеятельности). Их можно воспринимать как компоненты и катализаторы для выработки энергии для обеспечения работы системы.;

[0096] Потребности соблюдения теплового режима организма;

[0097] Потребности в необходимых условиях для обеспечения деятельности. Комфортные условия;

[0098] - Безопасность;

[0099] - Здоровье;

[00100] - Достаточные (психологические) потребности (психологические), т.е. такие потребности могут рассчитываться через ценность, как потенциальную энергию выживания.

[00101] - Потребность обмена в социальном тепле, любви семьи и общества. Увеличение ценности;

[00102] - Сексуальность (после 5-летнего возраста);

[00103] 2-й уровень МП.

[00104] Витальные или Семейно-бытовые (область формирования потребностей).

[00105] Физиологические. Считаются через ценность как потенциальную энергию выживания:

[00106] 1. Перемещение самого себя и объектов в пространстве.->Средства транспорта.

[00107] 2. Кров, дом, квартира.

[00108] 3. Одежда (сохранение тепла, повышение социальной ценности).

[00109] 4. Лекарства, медицина, оздоровление (деятельность для продления жизни).

[00110] 5. Удобство и комфортные (полезные бытовые) предметы, улучшающие качество жизни.

[0011] Психологические. Считаются через ценность, как потенциальную энергию выживания.

[00112] 6. Архетипы. Мать, Отец, Бог, Я, Семья, Группа общности.

[00113] 7. Познание или любопытство. Это движущий фактор развития интеллекта, а значит и поступательного движения эволюционного процесса.

[00114] Вышеозначенные потребности носят первичный характер и обладают свойством неделимости. Формируются они естественным путем в процессе развития любого организма. Таким образом, потребности можно назвать первичными физиологическими и первичными психологическими.

[00115] Помимо них на этом уровне образуются составные потребности, которые становятся различными комбинациями первичных потребностей. Новые потребности сначала появляются как цели, но по мере работы системы могут перейти в категорию потребностей, если цель приобретает устойчивый и постоянный характер.

[00116] Для этого уровня потребностей вводится коэффициент значимости 2 уровня. К2У.

[00117] Первые два уровня потребностей описываются с помощью Легкой матрицы потребностей ЛМП.

[00118] 3. Социально-экономические потребности.

[00119] Они возникают при интеграции человека в социальные структуры. Участие в экономической деятельности для товарообмена. Считаются через социально-экономическую ценность. Анализ проводится на уровне отдельной личности.

[00120] Среди таких потребностей можно перечислить такие, как обучение полезным навыкам, работа, познание, развитие интеллекта через опыт, через книги, социальная адаптация в обществе, участие в общей деятельности социума.

[00121] Для этого вводится коэффициент значимости 3 уровня К3У. Он меньше чем К2У. Тем самым этот уровень оказывает меньшее влияние на принятие решений.

[00122] Этот уровень описывается с помощью Средней матрицы потребностей СМП.

[00123] 4. Цивилизационный уровень и его потребности.

[00124] Потребности возникают для решения цивилизационных вопросов. Для этого формируются экономические и политические кластеры. Добыча ресурсов, Энергетика, Логистика, Производство товаров потребления, Производство оборудования, Услуги, Финансы, Наука, Религия. Политические кластеры.

ИНФОРМАЦИОННОЕ ОПИСАНИЕ СИСТЕМЫ ПРИНЯТИЯ РЕШЕНИЙ В МУЛЬТИАГЕНТНОЙ СРЕДЕ

[00125] В настоящем документе описаны средства самообучения, необходимые для функционирования системы принятия оптимальных решений. Описываемые средства и методы самообучения являются технически реализуемыми сущностями, нашедшими свое применение, например, в системах автоматического пилотирования, банковских системах, системах автоматизированного проектирования составов лекарственных средств и их тестирования на эффективность и многих других сферах инженерии. Сама же система принятия (оптимальных) решений является универсальными механизмами для принятия оптимальных решений и может использоваться (или являться конкретной реализацией системы как таковой), например, в финансовых или экономических системах, например, для оптимизации прибыли/доходов (биржевой брокер), маркетинговых системах, сложных диагностических системах различной направленности (например, система автоматического жизнеобеспечения и др.), не накладывая ограничений на область применения универсального средства.

[00126] Кроме того, система принятия решений и методы ее самообучения или реализуемый способ могут быть использованы в системах автоматического/автоматизированного управления для транспортных средств, роботов (автопилоты, дроны (БПЛА) и т.п.). Чаще всего автопилоты используются для пилотирования летательных аппаратов (поскольку там меньше всего препятствий), однако современные технологии постепенно внедряют автономные функции в повседневные транспортные средства. Рассмотрим чуть подробнее одну из возможных систем автоматизированного управления для транспортных средств (ТС).

[00127] Многие современные автомобили оснащены всем необходимым оборудованием для автономного движения и планирования пути, как минимум, на основе систем глобального позиционирования. При помощи беспроводного взаимодействия и систем позиционирования современные ТС способны образовывать многоагентную систему. Концепция автономного дорожно-транспортного движения подразумевает использование принципов известных многоагентных систем (МАС). Автомобили, как агенты могут обмениваться сообщениями с навигационным устройством, расположенным, например, на перекрестке и состоящим из компьютера и беспроводного передатчика. При приближении к перекрестку ТС налаживает контакт с таким навигационным устройством.

[00128] Основным элементом МАС является универсальный агент. Поэтому для создания транспортной системы на основе МАС необходимо выделить как минимум следующие агенты: агент-водитель и агент-менеджер. Агент-водитель - это транспортное средство, управляемое человеком или автономное транспортное средство. Причем, в случае ТС, управляемого человеком, агент-водитель может выдавать подсказки водителю для достижения поставленной цели (звуковые, визуальные подсказки и т.д). Агент-менеджер - это система, которая может быть установлена, например, в светофор (или на перекрестке) и осуществляющая управление агентами-водителями.

[00129] Основная цель для агента-водителя - достигнуть пункта назначения за минимальное время, при этом, по возможности, использовать самый короткий маршрут, чтобы затратить меньше топлива на поездку. Основная цель агента-менеджера управление агентами-водителями, подъезжающими к перекрестку, их перестроение и создание на перекрестке безостановочного и бесконфликтного проезда транспортных средств, за минимально возможное время. Для выполнения поставленных целей агенты должны согласовывать свои цели, стратегии поведения, координировать свои действия и разрешать конфликты.

[00130] Агенты-водители и агенты-менеджеры могут обмениваться полученными знаниями, используя некоторый специальный язык и подчиняясь установленным правилам/протоколам системы. МАС должна находить оптимальное решение задачи без внешнего вмешательства. В данном случае под оптимальным решением понимается решение, на которое будет потрачено наименьшее количество времени и топлива.

[00131] Таким образом, набор базовых характеристик агента может включать, например, такие свойства, как: 1) активность - агент-менеджер должен быть способен организовать и реализовать проезд на перекрестке без конфликтов и без остановок, за минимальное время; 2) реактивность - агенты-водители должны воспринимать всю необходимую информацию от окружающей среды. При этом окружающая среда для агента-водителя включает: дорожные знаки, дорожную разметку, других агентов-водителей, различные препятствия для движения, погодные явления (дождь, туман) и т.д. 3) автономность - агенты-водители и агенты-менеджеры должны достигать поставленных целей без участия человека; и 4) общительность - для достижения своих целей агенты-водители должны активно обмениваться информацией между собой по специально установленным протоколам коммуникации.

[00132] Далее для примера рассмотрим экономическую мультиагентную систему управления фондовым рынком. Открытый характер современного информационного общества и глобальной рыночной экономики приводит к активному развитию научно-технического прогресса, повышению уровня конкуренции на рынках, расширению доступа к ресурсам глобальной сети Интернет, что стимулирует развитие Интернет-экономики, частью которой является электронный рынок ценных бумаг.

[00133] Рост процессов глобализации выдвигает новые требования к инновационной управленческой деятельности, в частности в контексте того, что на реальном рынке ценных бумаг основную роль играют люди-торговцы (брокеры, трейдеры и др.), а на электронном рынке им соответствуют интеллектуальные агенты, которые могут принимать решения, объединяться в группы и учиться в процессе функционирования рынка, то есть выполнять почти все действия, которые выполняют реальные люди. В связи с этим возникает потребность в интеллектуальных методах, способных непрерывно получать новые знания и менять свою структуру и функции, развиваясь и адаптируясь к решаемым задачам и условиях внешней среды.

[00134] Для достижения обозначенных целей управления в распределенном взаимодействии различных участников могут быть применены мультиагентные системы. Основу мультиагентного подхода составляет понятие агента, который функционирует в качестве самостоятельного алгоритма/программы или адаптивного элемента системы искусственного интеллекта.

[00135] В отличие от традиционного метода, когда производится поиск некоторого строго определенного алгоритма, позволяющего найти лучшее решение проблемы, в мультиагентных системах решение является результатом взаимодействия некоторого множества самостоятельных модулей - агентов или процессов. Главная особенность в данном случае - динамика и непредсказуемость процесса принятия решений. На практике это означает, что оптимизация решения достигается за счет многочисленных взаимодействий, которые практически невозможно отследить. Агентам системы ставят цели, которых они должны достигать, при этом не определяют жестких сценариев их достижения.

[00136] Кроме того, мультиагентная система принятия решений позволяет учитывать поведение отдельно взятых агентов, в результате чего становится возможным выявлять достаточно тонкие особенности коллективного поведения элементов системы, учитывать их взаимосвязи друг с другом и с окружающей средой. Такая система может быть предназначена, например, для: 1) поиска данных о финансовых инструментах; 2) мониторинга статуса ценных бумаг и управления рисками; 3) поддержки принятия решений о купле-продаже финансовых активов. И в каждом отдельном случае будут свои агенты.

[00137] Приведенные выше примеры применения мультиагентных систем объединяет общая концепция и цель - принятие оптимального решения в данный момент времени для конкретной задачи. Автономная система принятия решений имеет как собственную, так и структуру самообучения, которая может быть оптимально спроектирована для любой вышеприведенной в качестве примера цели или ситуации. В данном случае будет меняться только набор агентов или процессов в соответствии с поставленными перед системой задачами.

[00138] Ниже приведено описания системы принятия решений для разъяснения принципов ее работы для информации, до детального описания средств ее самообучения.

[00139] На фиг. 1 представлена блок-схема системы принятия решений. В примерном варианте система (100) содержит: блок получения внешних воздействий (ВВ) (102), выход которого соединен со входом блока обработки внешних воздействий (104), выход которого соединен с входом библиотеки внутренних образов (ВО) (106), выход которого соединен с входом блока текущего состояния системы (108), со вторым входом которого соединена библиотека знаний (118); выход блока текущего состояния системы (108) соединен с входом супервизора состояний (110) и со входом блока принятия решений (112), причем супервизор состояний (110) и блок принятия решений (112) имеют двустороннюю связь и их соответствующие выходы соединены с входами исполнительного блока (114), который имеет двухстороннюю связь с блоком оперативного обучения (116), имеющего дополнительную двухстороннюю связь с супервизором состояний (110); при этом библиотека знаний (118) и библиотека ВО (106) имеют двухстороннюю связь с общим блоком обучения (120), вход которого соединен с выходом супервизора состояний (110).

[00140] Взаимодействие между упомянутыми блоками системы реализуется путем передачи пакетов данных по сети связи. Данная система (100) реализует несколько формализуемых одноцелевых процессов (задач, агентов), что приводит к принятию системой оптимального решения, о чем подробнее будет указано ниже. Следует обратить внимание на то, что в принципе построения системы (100) применен блочный/модульный подход. Блоки системы являются автономными, что обеспечивает возможность замены каждого из них под конкретную прикладную задачу, а также возможность исключения некоторых блоков и возможность добавления новых блоков. Каждый процесс/агент системы имеет свою цель, которая задается на этапе проектирования. Простые процессы собираются под конкретную задачу.

[00141] Внешние воздействия (ВВ) на систему регистрируются блоком получения внешних воздействий (102), который содержит множество датчиков и/или устройств системы. Примерами упомянутых датчиков и/или устройств могут выступать, по меньшей мере известные, как: видеокамера, микрофон, устройства ввода данных (клавиатура, мышь и т.д.), сенсорный датчик, датчик движения, датчик температуры, датчик влажности, датчик дыма, датчик освещенности, газоанализатор, сейсмический датчик и т.п. Специалисту в данной области техники будет понятно, что для каждой конкретной системы будет использоваться свой индивидуальный набор датчиков и/или устройств для регистрации внешних воздействий.

[00142] Полученные блоком получения внешних воздействий (102) данные поступают в блок обработки внешних воздействий (104), который может быть реализован, например, искусственной нейронной сетью. В другом альтернативном варианте может применяться множество обученных известными методами нейронных сетей, каждая из которых обучена на формирование конкретных внутренних образов, присущих конкретному внешнему воздействию (ВВ), согласно его сущности. В другом альтернативном варианте вместо нейронной сети может быть использована аналитическая система или иной механизм обработки ВВ, если ВВ является «простым» и не требуется сложного механизма для формирования внутреннего образа (ВО). Нейронная сеть идентифицирует поступающие на её вход данные и применяет к ним набор функциональных преобразований для формирования внутренних образов (ВО) системы (получения внутренней информации).

[00143] Например, в одном из альтернативных вариантов реализации изобретения, полученный видеоряд может быть разбит на последовательности кадров, идентифицированные обученной моделью нейронной сети в качестве относящихся к одному событию (например, проезд автомобиля через перекресток, продвижение железнодорожного состава через контрольный пункт и др.).

[00144] В другом альтернативном варианте, например, если в качестве данных внешних воздействий (102) используются фото, например, полученные с помощью фотокамеры, оснащённой датчиком присутствия, то данные могут быть идентифицированы обученной моделью нейронной сети, например, посредством выявления области интереса на изображении и идентификации и классификации объекта, содержащегося в границах детектированной области интереса. Стоит отметить, что указанные выше примеры не являются ограничивающими применение настоящего изобретения. Для каждого вида/типа внешних воздействий (102) при получении данных системой могут быть применены специализированные средства, характерные для обработки таких данных и присущие соответствующему типу данных. Заявленное изобретение является масштабируемым/расширяемым/адаптивным и универсальным средством для принятия решений.

[00145] В некоторых реализациях нейронная сеть (НС) может быть представлена рекуррентной нейронной сетью. В других реализациях нейронная сеть может быть представлена сверточной нейронной сетью, которая в различных реализациях системы может включать в себя любое подходящее количество сверточных слоев, слоев ReLU, слоев пула и/или любые другие слои. Порядок расположения слоев, количество слоев, количество фильтров или любой другой параметр сверточной нейронной сети может быть отрегулирован, например, с использованием эмпирических данных. В других вариантах реализации, не ограничиваясь, могут использоваться модели полносвязных нейронных сетей, модели глубинного обучение и др., в зависимости от конкретной задачи.

[00146] Однако, указанные выше варианты не ограничивают применение других моделей нейронных сетей для получения внутренних образов системы (ВО). Например, конкретная модель НС может зависеть от внешних воздействий (ВВ). Так же стоит учесть, что помимо одной модели НС может применяться, например, ансамбль разного рода обученных известными методами НС для получения консолидированной информации внешних воздействий при их многообразии. Предположим, что на систему оказывается множество разнородных воздействий и каждый тип воздействия подлежит обработке для выделения значимых для системы признаков внешних воздействий (ВВ) и их последующей консолидации для обеспечения работы заявляемой системы.

[00147] Ансамбль НС может включать, но не ограничиваясь, например, модели полносвязных НС, рекуррентных НС, НС прямого прохода, автоэнкодеров, деконволюционных НС и моделей нейронных сетей другого вида.

[00148] Указанный ансамбль НС может быть скомбинирован, например, исходя из видов внешних воздействий (ВВ) на систему принятия решений. Данный ансамбль может быть расширен/сужен в зависимости от внешних воздействий для конкретной имплементационной задачи системы. Все данные полученные в таком варианте реализации системы принятия решений подлежат конкатенации известными методами для дальнейшей обработки в рамках обеспечения работы указанной заявленной системы принятия решений.

[00149] Внутренние образы (ВО), полученные блоком обработки внешних воздействий (104), поступают в библиотеку ВО (106), где хранятся и постоянно корректируются на основании текущего состояния системы (ассоциативная память/база данных системы). Для способствования идентификации ВО внутри системы могут применяться, но не ограничиваясь, например, метаданные, присвоенные ВО и иные атрибуты.

[00150] Каждый ВО системы имеет свой идентификатор и набор ассоциаций (ассоциативных/обратных связей). В контексте данного изобретения ассоциация - это отношение ВО (значимость или приоритет) к конкретной цели или потребности системы. В общем, в контексте настоящего изобретения, можно сказать, что в совокупности ВО содержит в себе отношение «образа» объекта к целям системы, подлежащим достижению. Каждый ВО из библиотеки ВО (106) способен оказывать влияние на текущее состояние системы, то есть на состояние системы в настоящий момент времени. Каждому ВО соответствует свое значение значимости (или приоритет), которое отличается для различных макросостояний системы, с учетом коэффициентов коррекции. В процессе работы системы и внутренних алгоритмов обучения системы, ВО наполняются содержанием: ассоциациями (изменения состояния системы) и причинно-следственными связями, закономерностями (реакции системы, принятие решений).

[00151] В качестве указанных значений значимости ВО могут применяться, например, заданные в системе коэффициенты коррекции (КК), на основании которых возможна корректировка указанных приоритетов (например, в диапазоне от 0 до 1). Указанные коэффициенты значимости могут быть получены на основании экспертного опыта системы или, например, эмпирическим путем, или в процессе обучения (накопления опыта) в системе. Примерами таких коэффициентов могут выступать, например, такие, но не ограничиваясь, как коэффициент незначимости ВО (КНЗ), коэффициент важности ВО (КВ), коэффициент значимости ВО (КЗ), коэффициент малозначимости ВО (КМЗ).Например, в одном варианте можно принять, что если К меньше КНЗ, имеющего значение 0,1 (или иное значение), то такой ВО не имеет отношения к цели, решаемой на настоящий момент времени и, следовательно, такой ВО может быть отброшен. Если К больше КВ и имеет значение 0,85 и более, то чем больше К, тем большую важность он имеет для конкретной цели и принятия решения в текущий момент времени. Однако, стоит учесть, что максимальный К, больший КВ (например, 1,0 или значение крайне близкое к 1,0) приводит к возможности подавления других целей для настоящего момента времени (выживание). В качестве примера максимального К и его влияния для системы автоматического пилотирования можно предположить принятие решения об аварийной посадке в случае полного исчерпания запаса топлива; столкновения с препятствием, дающее большую возможность на выживание системы (автономное автотранспортное средство принимает решение уйти от столкновения в снег, нежели таранить встречный автомобиль при неизбежности столкновения). Так же заданный КЗ равный 0,5, или иное значение, при К большем КЗ свидетельствует об обязательном участии ВО для принятия конкретного решения. Далее, можно предположить, что при К большем КМЗ (то есть К в правильно пределах 0,1 - 0,5), он малозначим для конкретного решения и имеет маленький приоритет. При этом, в данном случае, чем больше К, тем больший приоритет имеет ВО.

[00152] Целью указанных коэффициентов является детерминация принадлежности ВО для принятия решения/несоответствие или неприменимость ВО конкретной задаче, принимаемому решению и цели как таковой. Таким образом, незначительный или малозначительный ВО может не приниматься во внимание системой, что обеспечивает снижение ресурсных затрат системой. Однако, стоит учесть, что малозначимый ВО может иметь больший приоритет для другого решения в другой момент времени.

[00153] В одном из вариантов реализации системы библиотека ВО (106) может быть сконфигурирована для самообучения, например, на основании данных, получаемых от супервизора состояний (110) через общий блок обучения (120). В альтернативном варианте общий блок обучения (120) предназначен для взаимного обучения библиотеки ВО (106) и для обучения библиотеки знаний (118). Общий блок обучения (120) обучается/учит распознавать ВО, описывать ВО и формировать для них соответствующий контекст/содержание.

[00154] В одном из вариантов реализации, контекст, например, может быть представлен в текстовой форме, например, с применением методов дистрибутивной семантики. В другом, альтернативном варианте реализации, контекст может быть представлен, например, в качестве метаданных. Еще в одном альтернативном варианте реализации, контекст может быть представлен в комбинированной форме. Данное утверждение не призвано ограничивать способы и методы формирования контекста. В любом варианте реализации способ формирования контекста можно подобрать, например, на основании экспертного опыта и знаний, в зависимости от сущности ВО (множества разнородных ВО) и его атрибутов, присущих конкретному ВО. При этом, если заявленной системе принятия решений присуще множество разнородных ВО, то каждой группе однородных ВО присуще формирование контекста схожим образом.

[00155] Следует отметить, что в библиотеке ВО (106) внутренние образы подвергаются кластеризации. Алгоритм кластеризации может представлять собой стандартную статистическую процедуру, реализующую сбор данных, содержащих информацию о выборке ВО и анализ ВО. Далее выполняется процесс упорядочивания/группировки схожих ВО в сравнительно однородные кластеры. В данном случае могут быть применены такие классические алгоритмы кластеризации как: к-средних, ЕМ алгоритм, иерархическая кластеризация и т.п.

[00156] ВО из библиотеки образов (106) поступают в блок текущего состояния системы (108), который на основании данных из библиотеки знаний (118) закономерности кластеров преобразует ВО в ΔВО (дельта ВО), соответствующие текущему состоянию системы. В данном блоке (106) формируется текущая картина окружающего мира (оперативная память системы). То есть отбираются только действующие в настоящий момент времени ВО, имеющие наивысший приоритет, не ниже значения КЗ.

[00157] Полученные ΔВО поступают далее в супервизор состояний (110), а также и в блок принятия решений (112). Супервизор состояний (110) отвечает за определение, управление и коррекцию текущего состояния системы (100), которое влияет на последующее принятие системой оптимального решения. Супервизор состояний (110) разделяет действующие ВО на значимые и незначимые для каждого определенного последующего процесса с учетом коэффициентов значимости. Таким образом, в текущем состоянии для каждого ВО формируется значимость/приоритет самого ВО при воздействии на систему (100).

[00158] В одном дополнительном варианте реализации системы, супервизор состояний (110) может включать в себя корректор ценностей ВО (на чертежах не показан). Корректор ценностей ВО предназначен для пересчета коэффициентов значимости ВО при каждом такте работы системы методами, подробно раскрытыми в настоящем описании.

[00159] Для последующей обработки с учетом значимости и матрицы приоритетов отбираются только те ВО, которые превышают установленный порог значимости, который может быть предустановлен или же подобран эмпирическим путем. Например, порог может быть выбран от 0 до 1 (например, 0,5 или иное значение), как это подробно описано выше в отношении коэффициентов значимости ВО. Состояние или матрица приоритетов отражают не только текущее, но и увязывают между собой понятия полезности/ценности, что можно выразить через понятие «энергия». Энергия в контексте настоящего изобретения представляет собой определенную метрику. Например, значение энергии может быть предзадано диапазоном значений, в зависимости от конкретной реализации системы принятия решений. Энергия может иметь как положительные, так и отрицательные значения (например, -1, 0, 1 или иное значение из предзаданного диапазона). При этом отрицательное значение энергии означает неверный «путь» системы принятия решений. Система принятия решений должна стремиться к оптимальному равновесному энергетическому состоянию, то есть к фундаментальному состоянию. В данном случае можно принять во внимание принцип свободной энергии Фристона, призванный формализовать процесс принятия решений методом, в каком-то смысле схожим с принципом наименьшего действия в классической механике, который описывает эволюцию физических систем. В целом, базовым принципом любой автоматической системы является ее стремление к достижению равновесного состояния, аналогично принципам психики человека. Супервизор состояний (110) может быть реализован как стандартный вычислительный алгоритм или программа. В другом альтернативном варианте, супервизор состояний (110) может быть реализован в качестве обучаемой определенной модели нейронной сети, которая обучается пересчитывать и детерминировать взаимосвязи между значениями матриц приоритетов в разные момент времени.

[00160] Текущее состояние системы определяется в супервизоре состояний (110) набором приоритетов (матрица приоритетов). Микросостояния системы изменяются, если происходят действия в рамках текущего набора ВО. Макросостояние системы может меняться только в случае появления нового ВО или существенных внутренних изменений в системе. При этом стоит учесть, что переход в другое макросостояние системы возможен лишь при достаточном количестве энергии, в зависимости от изменений приоритетов.

[00161] Как было отмечено выше, полученные ΔВО также поступают на вход блока принятия решений (112), который непосредственно взаимодействует с супервизором состояний (110) путем взаимных обратных связей для генерации множества процессов, каждый из которых имеет свой приоритет, о чем более подробно будет указано ниже.

[00162] Полученное оптимальное решение в блоке принятия решений (112) для текущего момента времени отправляется далее в исполнительный блок (114), результатом которого является определенное действие системы. Под действием в контексте данного описания понимается единичная исполнительная программа/алгоритм, передаваемая на выход системы. Созданная информация в системе, а также имеющаяся в виде текущего состояния, обрабатываются, результатом чего становится ответное действие системы в соответствии с правильным оптимальным решением. Важно отметить, что конкретное действие является правильным и оптимальным для системы только в текущем моменте времени и только для такой конфигурации системы.

[00163] Данные о принятом решении из исполнительного блока (114) дополнительно поступают в блок оперативного обучения (116), который связан двусторонней связью с супервизором состояний (110). Блок оперативного обучения (116) сконфигурирован для формирования опыта.

[00164] Чтобы понять принцип работы системы рассмотрим его более подробно с раскрытием процессов/агентов системы. На фиг. 2 представлена блок-схема функционирования системы принятия решений (200). Работа блока принятия решений (112), соответствующего фиг. 1, базируется на обработке, выполнении и анализе множества сформированных системой процессов.

[00165] Каждый отдельный процесс - это некоторая подзадача, являющаяся частью общей задачи/цели системы. Разделение на отдельные процессы - единственная возможность построения прикладной системы. Простые процессы легко поддаются формализации и автоматизации. Система приоритетов для параллельных процессов позволяет переключаться на наиболее значимый в настоящий момент процесс и соответственно задачу, что позволяет системе принимать единственно верное оптимальное решение.

[00166] Основная характеристика простого процесса - единственная целевая функция. Именно по этому принципу и происходит разделение на процессы. Одна цель - один процесс (или агент). Каждому выделенного процессу присваивается ячейка приоритета в строке или матрице состояния. Каждая задача отражается в строке (матрице) состояния и реализуется одним отдельным процессом.

[00167] Процесс (или отдельная задача) может быть реализован в виде нейронной сети различного типа (рекуррентная нейронная сеть, сверточная нейронная сеть и т.д.) либо в виде универсального аналитического процесса. Как уже было указано ранее, процесс может представлять из себя универсального агента. Универсальным агентом или интеллектуальным агентом в контексте настоящего описания является программно-техническое средство, автономно действующее в некоторой среде (физической или информационной) и решающее конкретную задачу, в соответствии с поставленными перед системой целями.

[00168] Как показано на фиг. 2, все ВО системы хранятся в библиотеке ВО (106). Библиотека ВО хранит все новые ВО, старые ВО, данные о ВО процессов изменения, а также закономерности кластеризации ВО. При этом в системе может быть предусмотрена фильтрация старых ВО, для снижения затрат на обработку. Так, например, при поступлении идентичного старому нового ВО, старый ВО может быть удален и, например, могут остаться лишь данные о том, что поступил ВО идентичный старому. Новому ВО может быть присвоен аналогичный строму ВО контекст/метаданные и временная метка о поступлении старого ВО и, например, количество поступивших старых ВО. Эти данные могут быть добавлены, например, в метаданные нового поступившего ВО в качестве исторических данных. Как было указано ранее, ВО в библиотеке (106) могут быть разделены на кластеры по схожести. Внутренние образы поступают на вход блока текущего состояния системы (108). Один выход упомянутого блока (108) идет к супервизору состояний (110), откуда на основании матрицы приоритетов и текущего состояния системы отбираются/формируются ΔВО целевого состояния системы. Затем ΔВО попадают в фильтр целей (212), который фильтрует цели и задачи системы по степени их важности для текущего момента и строит оперативно-тактические планы работы системы по принятию решений. Фильтр целей может содержать подблок мышления (не показан на фиг. 2), который отвечает за разработку планов и стратегий.

[00169] Подблок мышления выполняет анализ предыдущего опыта системы (анализ реакций системы на внешнее воздействие) и моделирования будущих целей и задач системы. Работа системы моделируется в фоновом режиме для прошедшего и будущего времени. То есть моделируются/прогнозируются реакции и действия системы (прошлые или возможные в будущем) на внешние воздействия. Прогнозирование может быть основано, но не ограничиваясь на методах экстраполяции, методах корреляционного и факторного анализа, причинно-следственных методах прогнозирования. Моделирование будущих действий системы с учетом имеющегося опыта. Моделирование может выполняться, но не ограничиваясь, например на основании подходов моделирования Лотки-Вольтерры, Бохёффера - ван дер Поля, модели Мальтуса, финансово-экономических математических моделей (например, расчет оптимального расходования ограниченных ресурсов; оптимизации прибыли от размера капиталовложений и др., в зависимости от конкретной реализации системы принятия решений). Результаты моделирования анализируются и корректируются.

[00170] Фактически подблок мышления реализует внутреннюю деятельность системы, как реакцию на возможные возникающие ситуации (входные данные). Подблок мышления помогает расставлять приоритеты целей и создавать планы и стратегии, однако в самом подблоке не принимаются окончательные решения по дальнейшим действиям системы.

[00171] Процесс работы подблока мышления можно свести к моделированию или анализу последовательности действий. При этом результатом подблока мышления является не конкретное действие, а план, стратегия действий, подчинённых глобальной/общей задаче. Цель - задача для действия в текущий момент. План - направление действий в перспективе. План задает вектор (совокупность) целей (целевых состояний). При этом подблок мышления косвенно принимает участие в обучении системы, поскольку в нем анализируются нетипичные/нестандартных ситуаций, после чего такие ситуации переводятся в стандартные - то есть формируется опыт. Формируемый опыт может динамически кластеризоваться известными методами (например, метод к-средних или иной метод динамической кластеризации).

[00172] После фильтра целей (212) на вход каждого процесса (или агента) в качестве входных данных поступают отфильтрованные в соответствии с актуальными целями и планами действующие ΔВО. В данном контексте Δ-дельта - это метрика отличия одного ВО от другого (в предыдущий момент времени). Каждый процесс-агент является простым и быстрым, а также универсальным, способным решать разные задачи при соответствующем обучении, поскольку он будет применяться множество раз во всей системе для решения любых частных задач или процессов.

[00173] Разделение конкретной задачи по созданию прикладной системы на простые параллельные процессы проводится на этапе проектирования и создания конкретной прикладной системы. Перед работой система предварительно конфигурируется и тестируется, например, вручную для проверки правильности разделения на процессы. Для тестирования работы могут быть использованы так же автоматические методы тестирования, например, с ручной валидацией. Цель отдельного процесса - найти максимально ценное решение в рамках своей локальной задачи. При этом каждый процесс должен быть максимально быстрым.

[00174] Следует также отметить, что, когда процессы-агенты системы сформированы, их требуется обучить, например, стандартными методами глубокого обучения до требуемого рабочего уровня. При этом в процессе работы системы в фоновом режиме будет реализовано бесконечное дообучение в режиме реального времени (самосовершенствование).

[00175] Каждый отдельный процесс или агент поддается формализации. По каждому процессу может быть принято правильное для него решение. Результаты каждого выполненного процесса системы сохраняются в блок результатов процессов (214) вместе с приоритетом решения. Однако отдельные решения по каждому процессу необходимо интегрировать в совокупное решение, где каждый процесс будет иметь текущую значимость/приоритет, действительную в реальном времени.

[00176] Общее оптимальное решение для системы определяется в интеграторе (216) решений, в том числе с учетом приоритетов, и представляет собой объединение и корреляцию совокупности правильных решений, полученных из отдельных процессов для достижения поставленной цели. Далее полученное оптимальное решение поступает в исполнительный блок (114) системы, который инициирует выполнение системой соответствующего действия.

[00177] Данные, хранящиеся в блоке результатов процессов (214), также поступают на вход супервизора состояний (110), который на основании прошлых решений корректирует текущую матрицу приоритетов. Обновленные данные от супервизора состояний поступают в библиотеку ВО (106) для своевременного изменения содержания ВО на основании процессов системы.

[00178] Далее рассмотрим один такт работы системы принятия решений (100). В ответ на изменение внешних воздействий в системе предусмотрено два типа реакций. Разные реакции соответствуют следующим ситуациям: (1) появление нового ВО и (2) изменение значимости/состояния актуальных ВО (в ответ на некоторое действие в окружающем мире). Один такт работы системы составляет приблизительно 1 секунду, или иное значение, в рамках требования к конкретной прикладной задаче.

[00179] Первая ситуация - когда нет нового ВО или каких-либо кардинальных изменений в действующих ВО. В таком случае системой вычисляется незначительное изменение действий, на основании чего выполняется коррекция выходных решений системы. Макросостояние системы в таком случае не меняется, а для микросостояний системы в супервизоре состояний (110) вычисляются колебания. Такой такт быстрый и простой.

[00180] На основании вычисленных колебаний в супервизоре состояний (110) в фоновом режиме продолжает работать фильтр целей (212), расположенный в блоке принятия решений (112), а точнее его подблок мышления. Мышление системы актуально для текущего состояния (соответствует макросостоянию системы) и изменяется в режиме реального времени в связи с внешними воздействиями на систему. Подблок мышления реализует обработку информации в пространстве системы.

[00181] Вторая ситуация - появление нового ВО для системы. Новый ВО характеризуется своим содержанием (набором ассоциаций и причинно-следственных связей, атрибутов), которое может влиять как на микросостояния, так и на макросостояние системы. Упомянутые состояния в таком случае подвергаются пересчету. В основе расчетов/перерасчетов состояний может лежать подход по принципу цепи Маркова, математические методы нечеткой логики (например, адаптивная нейро-нечеткая система вывода, описанная в универсальной форме аппроксиматоров и др.).

[00182] Цепь Маркова - последовательность случайных событий с конечным или счётным числом исходов, где вероятность наступления каждого события зависит только от состояния, достигнутого в предыдущем событии. Цепь Маркова характеризуется тем, что при фиксированном настоящем будущее независимо от прошлого. Каждый отдельный процесс в каждый момент времени находится в одном из n состояний. При этом, если он находится в состоянии с номером i, то он перейдет в состояние j с вероятностью p_ij. Матрицу Р=|| p_ij || называют матрицей переходов. Марковскую цепь можно также представить в виде графа, в котором вершины - это состояния процесса, а ребра - переходы между состояниями, и на ребре из i в j написана вероятность перехода из i в j, то есть p_ij.

[00183] Возвращаясь ко второй ситуации, если меняется макросостояние системы, то в блок текущего состояния системы (108), отражающий картину мира, подгружаются внутренние образы (ВО), соответствующие этому состоянию. Для прошлой ситуации новые подгруженные ВО были незначимыми, а для текущего состояния они становятся действующими. Микросостояние системы соответственно тоже вычисляется заново. Новое/текущее микросостояние становится некоторой стартовой/исходной точкой для последующего анализа новых микросостояний.

[00184] Если же новый ВО недостаточно "силен", чтобы изменить макросостояние системы, то в таком случае изменяются только микросостояния, причем изменения могут быть достаточно кардинальными.

[00185] В каждом такте системы вычисляется текущее оптимальное решение. Оно вычисляется на основе состояния, в котором начинался данный такт. То есть на основе матрицы приоритетов, которая сформирована супервизором состояний (110) по результатам работы предыдущего такта. Новая матрица приоритетов с текущего такта будет использована только в следующем такте. Аналогичным образом рассчитывается в каждом новом такте матрица значимости внутренних образов для следующего момента времени.

[00186] На фиг. 3 представлена блок-схема одного из возможных вариантов реализации настоящего изобретения, при котором применяется облачное хранилище данных. Проиллюстрирована передача данных между системой принятия решений (100) и облаком (302). Важно отметить, что библиотека ВО (106) и библиотека знаний (118) могут располагаться в облаке. Такой известный подход организации распределенного хранения библиотек в некоторых вариантах реализации позволяет сократить ресурсы системы на локальное хранение данных и позволить быстрее обращаться системе принятия решений (100) к указанным библиотекам из любой точки мира. Однако, такой подход организации хранения библиотек не является приоритетным, а лишь одним из возможных вариантов реализации. Упомянутый подход хранения требует постоянного доступа к сети, что не всегда возможно, в случае реализации системы в качестве локальной и не предполагающей доступа к сети, либо имеющей ограничения на доступ к сети (например, автономная система автоматического пилотирования и принятия решений подводной лодки, космического корабля и др.). С другой стороны, в перспективе совершенствования технологий доступа к сети интернет и техники, распределенный облачный подход хранения данных может быть возможен в качестве базового для системы принятия решений при некоторых конкретных вариантах ее реализации.

[00187] На фиг. 4 представлена блок-схема примерного способа принятия решений 400. Способ 400 и/или каждая из его отдельных функций, программ, подпрограмм или операций могут выполняться одним или несколькими процессорами компьютерной системы (в частности, компьютерной системы 500, изображенной на фиг. 5), реализующей способ 400. В некоторых вариантах осуществления способ 400 может выполняться с помощью одного потока обработки. В альтернативном варианте осуществления способ 400 может выполняться двумя или несколькими потоками обработки, каждый из которых выполняет одну или несколько отдельных функций, программ, подпрограмм или операций, относящихся к данному способу. В одном из вариантов реализации потоки обработки, реализующие способ 400, могут быть синхронизированы (например, с использованием семафоров, критических секций и/или других механизмов синхронизации потоков). В альтернативном варианте осуществления потоки обработки, реализующие способ 400, могут выполняться асинхронно по отношению друг к другу. Поэтому, несмотря на то что на фиг. 4 и в связанных с ним описаниях, операции способа 400 выполняются в определенном порядке, в различных вариантах осуществления данного способа как минимум некоторые из описанных операций могут выполняться параллельно и/или в произвольно выбранном порядке.

[00188] Способ 400 в одном из примерных вариантов реализации содержит следующие этапы:

[00189] Этап 402. Получение вычислительной системой данных внешнего воздействия от датчиков или устройств системы.

[00190] Этап 404. Формирование внутренних образов (ВО) системы, на основании полученных данных внешнего воздействия, при этом ВО хранятся в библиотеке ВО.

[00191] Этап 406. Отбор действующих ВО, соответствующих текущему состоянию системы в настоящий момент времени.

[00192] Этап 408. Вычисление матрицы приоритетов для действующих ВО.

[00193] Этап 410. Принятие оптимального решения на основании выполнения множества процессов, причем входными данными для данного этапа являются действующие ВО и матрица приоритетов.

[00194] Этап 412. Исполнение вычислительной системой принятого решения.

[00195] Этап 414. Формирование опыта системы на основании принимаемых решений.

[00196] Способ принятия решений 400 может быть расширен и уточнен всеми частными вариантами исполнения, которые уже были описаны выше для вариантов реализаций системы принятия решений 100.

[00197] Выше были описаны варианты реализации системы принятия решений, однако для ее эффективного функционирования была разработана система самообучения, которая описана далее в подробностях и в деталях со ссылками на позиции чертежей, что и является объектом настоящего изобретения, без которой система принятия решений не будет функционировать с достаточной степенью эффективности.

СИСТЕМА (ПОДСИСТЕМА) САМООБУЧЕНИЯ. ПОДРОБНОЕ ОПИСАНИЕ

[00198] На фиг. 6 представлена принципиальная схема системы (подсистемы) самообучения для системы принятия оптимальных решений.

[00199] Для реализации в систему принятия решений включен дополнительный блок 622 коррекции библиотеки ВО и библиотеки знаний, взаимосвязанный с блоками 116, 118 и 106.

[00200] Блок 622 коррекции осуществляет динамический пересчет значений элементарного опыта 624 после каждого такта работы системы, то есть после каждого достижения той или иной цели системы принятия решений. В блоке оперативного обучения 116 дополнительно формируется и накапливается единичный (элементарный) опыт 624. При достижении цели системой оценивается процентное соотношение правильности принятого решения, как это описано далее.

[00201] После осуществленного пересчета элементарного опыта, данные поступают в блок 116 оперативного обучения, интегрируются в системе библиотек, осуществляется их обработка и отправка другим блокам системы принятия решений согласно описанным принципам ее работы.

[00202] Все расчеты осуществляются посредством принципов Матрицы потребностей, как это подробно описано далее. Принципы Матрицы потребностей (МП), не ограничиваясь, могут быть разработаны в двоичном коде, что показало эффективность на этап разработки, тестирования и применения.

[00203] На фиг. 7 схематически показан элементарный опыт 624 и схема его построения.

[00204] Опыт сам по себе является основой самообучения. В случае описываемой системы самообучения можно сказать, что опыт системы строится из «кирпичей» - единиц, элементарного опыта 624, который можно так же назвать единичным опытом. Под опытом понимаются все события и деятельность между моментом определения цели системы и моментом получения результата. Размер опыта является динамически наполняемой архитектурой и варьируется от одного такта работы системы принятия решений и до всего времени работы при достижении каждой из целей и каждого принятого решения, подлежащего оценке и верификации успешности достижения, верности и оптимальности при обучении системы. Опыт от момента определения первой цели до текущего момента времени считается полным опытом, состоящим из набора элементарных опытов, каждый из которых соответствует накопленному за один такт работы системы.

[00205] В качестве примера можно привести системы принятия решения для самообучающегося автопилота, где единичный опыт соответствует одному такту его работы, например от начала движения до принятия первого решения (остановка, поворот, предупреждение и т.д.).

[00206] Для того, чтобы создать элементарный опыт 624 как фрагмент работы системы для дальнейших действий, необходимо четко определить момент, когда начинается отслеживание действий, и момент, когда заканчивается принятие решения.

[00207] Момент начала возникает, когда формируется ближайшая цель. То есть, один из коэффициентов в МП становится больше КВ (коэффициента важности). С этого момента начинает формироваться "тело" элементарного опыта 624.

[00208] При формировании элементарного опыта 624 осуществляется отслеживание изменение состояний системы для достижения конечного результата- заданной цели. В ассоциативную память системы записываются алгоритмические действия, осуществляемые системой в исполнительном блоке 114. Дополнительно рассчитывается «энергия» Е, затрачиваемая системой на реализацию указанных действий.

[00209] После записи в ассоциативную память такие данные могут использоваться в составе обучающей выборки данных при нейросетевом подходе реализации.

[00210] На примере автомобильного автопилота можно пояснить формирование элементарного опыта таким образом.

[00211] На первом этапе отслеживается изменение состояние системы требуемое для достижения конечной цели. Например, для осуществления «потребности», как поворот автомобиля при движении необходимо совершить определенные действия, например, осуществить замедление скорости до минимального безопасного уровня, обеспечить поворот рулевого колеса и др. Для накопления опыта отслеживается скорость, получаемая от датчика скорости, координаты в пространстве (Глонасс, GPS), угол поворота рулевого колеса и др. Так же, например, отслеживается температура воздуха, можно задействовать сонары, датчики контроля мертвых зон, детектирование полосы движения, положение иных детектированных на заданном расстоянии объектов, соответствие реального движения электронной карте местности, угол уклона (гиро датчик), давление в шинах от датчиков давления и многое другое. Все параметры после достижения цели, т.е. осуществления поворота за определенное время отправляются в ассоциативную память системы. Такие данные после каждого такта работы системы становятся, например, набором данных, соответствующих элементарному опыту 624. Для каждого элементарного опыта 624 рассчитывается затраченная «энергия» Е.

[00212] При этом, основополагающую роль играет достижение результата деятельности системы, которым следует считать изменение доминирующей потребности (Пt, Пtransform), которая отражается в цели системы. Для пояснения в качестве примеры можно привести потребность с следующем действии системы после осуществления поворота для осуществления конечной цели - пилотирование автомобиля в определенную заданную точку за определенное время с погрешностями на условия движения и пилотирования, внешние и внутренние факторы

[00213] В настоящей системе конкретная потребность может оцениваться рассчитываемым коэффициентами, например как КНЗ (коэффициент незначимости) или КНВ (коэффициент неважности). При достижении этого значения элементарный опыт признается закрытым. И он становится готов к дальнейшей работе в системе.

[00214] Отдельным аспектом настоящего изобретения стоит раскрыть принципы коррекции предыдущего опыта (фиг. 8), который также по своей структуре является «подсистемой».

[00215] В данной подсистеме предыдущий опыт рассчитывается с помощью определенной меры ЭО эффекта опыта. Опыт, который достигает максимального значения ЭО выигрывает среди опытов с меньшим ЭО и можно сказать, что становится наиболее востребованным доминантом среди опытов или элементарных опытов, направленных на удовлетворение однотипных или идентичных потребностей системы с целью достижения одного и того же результата.

[00216] Указанное выше касательно ЭО будет более понятным при объяснении на примере того же автопилота автотранспортного средства. Предположим результатом элементарного опыта должен стать поворот в одном и том же месте при движения из одной и той же точки, т.е. цикличное движение пилота по одному и тому же маршруту.

[00217] В данном случае, при пилотировании человеком для сбора обучающих данных системы автопилотирования, проезжается один и тот же маршрут, элементарным опытом (один такт работы системы) является осуществление поворота в одном и том же месте при близких к идентичным условиях.

[00218] На основании полученных данных для каждого элементарного опыта рассчитывается энергия, затрачиваемая на его осуществление с учетом всех собираемых параметров участвующих в процессе сбора информации для элементарного опыта.

[00219] Очевидно, что в каждом случае количество затрачиваемой энергии на удовлетворение потребности системы будет отличаться, где меньшее значение энергии при достижении оптимального результата будет выигрывать у большего количества энергии, поскольку целью достижения цели является осуществление потребности системы оптимальным образом с минимальным количеством накопленной затрачиваемой энергии для ее сохранения для дальнейшей работы системы.

[00220] Очень грубый пример в данном случае (для пояснения) - топливо, затрачиваемое на дорогу. Цель оптимизации является безопасное достижение конечной точки движения при внешних и внутренних условиях автотранспортного средства в кратчайший срок с минимальным потреблением топлива, необходимого для следующего отрезка движения. В нашем случае можно провести аналогию, что максимальная мера ЭО соответствует минимальной затрачиваемой энергии, взаимосвязанной с элементарным опытом, где ЭО является взвешенной мерой. Таким образом, выигрывает элементарный опыт.

[00221] Расчеты энергии, ЭО могут быть произведены стандартными математическими статистическими методами, например с учетом теорий робастного управления, основанных на принципах нечеткой логики, или элементарных известных из уровня техники обученных нейронных сетей, способных выдать оценку ЭО. Рассчитанные данные ЭО так же поступают в блок 116 оперативного обучения.

[00222] Для настоящей системы является присущим, с целью оптимизации затрачиваемой памяти, что ЭО является атрибутивным по отношению как к элементарного опыту, так и к полному опыту, для которого ЭО так же является присущим, являющимся суммарной оценкой ЭО элементарных опытов. Т.о. элементарный опыт или полный опыт подлежит перезаписи в системе в случае «выигрыша» опыта с меньшим значением ЭО, и далее не участвует при работе системы с целью оптимизации затрат памяти.

[00223] Матрица Потребностей (описана подробно далее) также используется как точка на графе матрицы смежности. МПМС. Точками графа является целевое состояние системы. Целевое состояние описывает комбинацию значений потребностей в момент времени.

[00224] Особенность заявленной интеллектуальной системы заключается в том, что она способна определять или предсказывать свое собственное последующее целевое состояние. При этом система принятия решения предусматривает условие, что если в системе автоматически принимается решение выбора определенного целевого состояния, то это целевое состояние является оптимальным для системы в будущем, и тогда будут выполняться описанные ниже подробно исполнительные алгоритмы, которые предусмотрены переходом из текущего состояния в следующее оптимальное целевое состояние системы.

[00225] Опыт, который дает максимальный эффект в удовлетворении потребностей системы и соответственно при достижении определенной цели, становится наиболее востребованным среди аналогичных опытов, т.е. как полных опытов, так и элементарных опытов 624.

[00226] Вышесказанное означает, что если новый элемент опыта оказывается более эффективным, нежели предыдущий опыт, то тогда им следует заменить предыдущий аналогичный опыт с целью повышения эффективности работы всей системы. Такой принцип заложен в системе заявленной системе самообучения.

[00227] Однако, стоит понимать, что, например, при нейросетевой реализации, обучающие выборки должны включать как положительные так и отрицательные примеры, например, как в качестве сырых данных, так и в качестве размеченных данных, в зависимости от подходов к обучению и моделей нейронных сетей задействованных. Обучение может происходить. Например, по принципу обратного распространения ошибки. Однако, далее, при работе обученной системы, так же происходит накопление и анализ текущего опыта (с целью анализа текущего состояния и с целью дальнейшего дообучения или переобучения), где для сокращения ресурсных затрат сохраняется лишь опыт с максимальной мерой ЭО.

[00228] Переход между точками указанного выше графа определяет степень решения задачи системы, т.е. определяет численную характеристику «степени достижения цели» в процентном или ином выражении, где, например, порог 0.875 характеризует достижение цели или не достижение цели, соответственно значения от 0.875 до 1.0 показывают качество, эффективность достижения цели. Также переход между точками позволяет определить необходимые затраты энергии на ее реализацию по заданному алгоритму. Можно сказать, что построение графа дает "осмысление" опыта. То есть, что можно получить в результате исполнения алгоритмов и какие затраты для этого предстоят. Именно эта информация используется для выбора и планирования будущей деятельности (предсказание).

[00229] Очевидно, что успешностью работы системы при объемной и комплексной задаче (например, в случае автопилотирования - достижение конечной точки из начальной точки) принятия решений с подсистемой самообучения является последовательность совокупностей оптимальных и предсказанных действий системы в автоматическом режиме.

[00230] Также, совокупность элементарных опытов 624 представляет собой пространство смыслов (не показано на чертежах). Пространство смыслов представляет собой покрытие Маркова, где узлами являются целевые МП, а переходы между точками описаны затратами энергии и алгоритмами реализации потребностей и достижения целей.

[00231] На фиг. 9 показана схема развития и динамической коррекции МП и ВО.

[00232] Система коррекции МП и ВО является неотъемлемой частью самообучения системы принятия решения. Процесс познания системы находится в постоянном динамическом развитии, обновляясь на основании полученного в процессе функционирования опыта, оценки его ЭО, классификации, кластеризации.

[00233] Система предусматривает возможность не вносить изменения после каждого такта работы. Изменения генерируются и накапливаются в блоке 916 оперативного опыта блока оперативного обучения 116. В том же блоке они кластеризуются, после чего поступают в блок 622 коррекции. Блок 622 коррекции в свою очередь отвечает за перерасчет значений МП, куда помещает пересчитанные значения в требуемые ячейки матриц МП.

[00234] Пересчет значений матрицы осуществляется с учетом интеграционного коэффициента 944 яркости записи. Коэффициент яркости записи 944 зависит прямолинейно от значимости 966 оцененного опыта для системы. Значимость 966 определяется как функция, зависящая от энергии состояния Системы в момент получения опыта, коэффициента ЭО и количества итераций опыта (накопительный эффект).

[00235] На фиг. 10 приведена схема расчета опыта 1000 в системе принятия решений с самообучением.

[00236] Все действия и расчеты, связанные с опытом, осуществляются с помощью МП. При этом расчёты МП могут производиться, например, в двоичном коде. При расчёте опыта, блок базовых потребностей 1001 представляет собой основной элемент структуры расчета. Блок базовых потребностей 1001 содержит рассчитываемые приоритеты потребностей для разных видов матриц потребностей.

[00237] При двоичной кодовой реализации МП, ее каждая ячейка имеет размер один байт, представляющий ее весовой коэффициент ячейки в двоичном коде.

[00238] Одним из видов МП является Легкая Матрица Потребностей ЛМП.

[00239] Постоянная работа по расчётам матриц требует особо выверенный подход к быстродействию математического аппарата. Вопрос скорости работы системы, безусловно, является ключевым в жизнеспособности и конкурентоспособности любой интеллектуальной системы. В традиционных нейросетевых системах используются вычисления весовых коэффициентов в формате цифр с плавающей точкой. Они отражают процент от целого.

[00240] Для реализации описываемого самообучения системы принятия решений, возможно, в отличие от традиционного подхода, в качестве целой величины не 100 как в десятичной системе исчислений, а 128 двоичной системы исчислений. При такой реализации точность системы расчёта увеличивается, как показала реализация, при этом уменьшается количество байт в двоичном коде, сокращается число байт для отражения величины, давая дополнительную эффективность использования памяти и вычислительных ресурсов.

[00241] Кроме того, операции с целыми двоичными числами выполняются гораздо быстрее. Что в результате даст огромный накопительный эффект быстродействия в рамках всей системы.

[00242] Например, коэффициент 0,5313 будет представлен числом 68 в двоичном коде. Что будет означать коэффициент 68/128. Этот коэффициент в системе будет занимать всего лишь один байт. Для вычислений системы принятия решений с самообучением применяются быстродействующие системы расчёта, способные обрабатывать упомянутые в тексте МП разных видов в двоичном коде, включая обработку в режиме реального времени.

[00243] Такой подход позволяет оперативно обрабатывать значения м выделять значимые потребности системы.

[00244] На фиг. 11 схематично показано использование КВ, КЗ, КНЗ, КНВ.

[00245] При реализации в двоичном коде, коэффициенты в заявленной системе в значительной степени легче определять, так они соответствуют первым четырем численным позициям вектора (значения), т.е. являясь по сути первыми четырьмя битами байта.

[00246] Используя КВ, КЗ, КНЗ, КНВ, отсутствует необходимость складывания нулевых коэффициентов, что оптимизирует и ускоряет расчеты, позволяя быстрее осуществлять самообучение и принятие решений системой.

[00247] На фиг. 12 схематически изображена структура базовой МП БМП 1201

[00248] БМП 1201 представляет собой основной элемент интеллектуальной системы. Например, она состоит из 16 байтов, расположенных в последовательных ячейках памяти.

[00249] Из матриц БМП 1201 строятся тяжелые матрицы потребностей ТМП 1202. ТМП 1202 детерминирует точное состояние системы принятия решений в каждый момент времени, отслеживаемый системой принятия решений.

[00250] В основе каждой ТМП 1202 лежит БМП 1201, описывающая текущее состояние системы принятия решений с самообучением. ТМП 1202 также имеет ряд расширений, например, таких, как кластеры 1203 целей, где каждый кластер 1203 цели определяется наличием одной доминирующей потребности.

[00251] Такая организация ТМП 1202 позволяет группировать цели по отношению к потребностям, тем самым ограничивая анализ целей в рамках одного кластера за счет того, что каждая цель в кластере описывается в БМП 1201 комбинацией потребностей с учетом их рассчитанной системой актуальности для конкретной цели.

[00252] В качестве основ для средств для произведения расчета с матрицами, но не ограничиваясь, можно привести технические методы, описанные в /1/ М.Б. Игнатьев, Теория сложных систем и кибернетическая картина мира, Информатика и её применения, 2011, том 5, выпуск 2, 58-68

[00253] Далее следует раскрыть особенности описываемых матрицы потребностей во взаимосвязи с ВО системы. Как уже было упомянуто выше, МП (матрица потребностей или матрица приоритетов) представляет собой техническо-инженерную сущность в форме матричной иерархической кластерной структуры, которая в свою очередь отражает актуальность текущих потребностей системы принятия решений с самообучением, содержащиеся в МП значения так же отражают значения приоритетов для текущих и предстоящих потребностей системы принятия решений. МП является основой структуры интеллектуальной системы.

[00254] Матрица Потребностей является основным структурным элементом из которых строится интеллектуальная система.

[00255] МП - основа для библиотеки ВО, для системы принятия решения, для матрицы смежности в библиотеке знаний, для фильтрации внешних воздействий, для Супервизора состояний. МП используется для определения состояния системы в текущий момент времени.

[00256] Еще одной технической сущностью системы является Матрица Потребностей Состояний Системы МПСС, так же являющаяся базовой матрицей системы. В настоящей системе принятия решений состояния системы соответствуют значениям приоритетов и весовых коэффициентов текущих потребностей. Указанные значения помещаются в МПСС.

[00257] Структура МПСС, включая размерность МПСС, корректируется в процессе накопления опыта и развития (обучения) системы как таковой.

[00258] На основе данных, содержащихся в МПCC, вычисляется интегральный результат того, какое решение будет принято к исполнению в настоящий момент времени. Или, другими словами, выбирается наиболее значимая подлежащая достижению цель, достижение которой дает системе наибольшую пользу (удовлетворение потребности). Настоящая система предполагает, что цель может быть как единичной так и комбинированной, т.е. являться комбинацией различных целей при многоцелевой реализации.

[00259] Указанный интегральный результат может быть получен с помощью реализацией на процессорном устройстве системы, например, но не ограничиваясь, интеллектуальных методов нечеткой логики, например, таких, как метод интегральных нечетких взвешенных оценок при принятии решений (/2/ Береза А.Н. и др. «Текст научной статьи по специальности «Компьютерные и информационные науки»» 2012). В других альтернативных вариантах может применяться, например, методы классической регрессии, к-ближайших, random forest (метод случайного леса) наряду с Марковскими методами и др.

[00260] Матрица Потребностей используется для отображения внутреннего образа ВО, которому присваиваются значения весового коэффициента ВО. Структура матрицы наполняется весовыми коэффициентами ВО, которые отражают меру участия конкретного объекта в удовлетворении потребностей системы или степень важности данного образа для исполнения цели, стоящей перед системой. В математическом смысле весовой коэффициент представляет собой эффективность удовлетворения указанной потребности этим ВО за момент времени.

[00261] Так, например, для расчёта весовых коэффициентов могут быть применены методы, схожие с описанными в публикации /3/ (Оценка защищенности автоматизированных систем управления от компьютерных атак, Дроботун Е.Б., БЕЗОПАСНЫЕ ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ Сборник трудов Восьмой всероссийской научно-технической конференции. НУК «Информатика и системы управления». Под. ред. М.А. Басараба. 2017, Издательство: Московский государственный технический университет имени Н.Э. Баумана (национальный исследовательский университет), БЕЗОПАСНЫЕ ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ Москва, 06-07 декабря 2017 года).

ОПИСАНИЕ СТРУКТУРЫ МАТРИЦЫ ПОТРЕБНОСТЕЙ МП

[00262] Матрица Потребностей МП может иметь классическую матричную форму. Однако, с учетом сложности системы принятия решений, также можно принять следующий описываемый вид структуры МП.

[00263] Структурно (см. фиг. 13) можно представить МП в следующем виде. МП включает три "концентрических объема", представляющими элементы иерархической структуры, подлежащие интеграции один в последующий.

[00264] Первый I элемент МП включает базовые потребности технологической системы. Аналогичным образом в такой же матрице, в случае человеческого интеллекта, это были бы базовые физиологические и психологические потребности, которые свойственны всем типам интеллекта. Такой элемент I элемент является легкой матрицей ЛМП потребностей в контексте настоящего изобретения.

[00265] В качестве примера, как это реализовано в настоящем изобретении, можно привести базовые потребности автомобильного автопилота, как, например, потребности в отсутствии сигналов неисправностей от датчиков автомобиля (например, датчик ABS, датчик температуры окружающего воздуха, отсутствие сигналов неисправностей, получаемых через OBD); потребности в достижении необходимой скорости в моменте времени при начале движения на конкретном участке дороги, отсутствие отклонений от требуемого положений транспортного средства сверх заданных пределов (например. Сонар, GPS, Глонасс), и др.

[00266] Второй II элемент - потребности, являющиеся комбинациями наборов базовых потребностей, которые обеспечивают их реализацию в текущем моменте и в перспективе, либо не способны в такой комбинации достичь удовлетворения требуемых потребностей, с маркировкой эффективности такой комбинации (оценка, накопления опыта ЭО). Элемент II представляет собой расширенную комбинированную матрицу, обладающего большей размерностью нежели ЛМП соответственно. Размерность Элемента II является кратной комбинации Элемента(ов) I. При этом также может иметь место равенство размерностей I и II, например, в случае единичного элемента I на начальном этапе реализации и запуска системы принятия решений (инициализация). В контексте настоящего изобретения II элемент обозначается Нормальной Матрицей НМП.

[00267] Объединение Первого и Второго элементов I и II является Базовой матрицей БМП.

[00268] БМП характеризует собой текущие и перспективные цели системы принятия решений, взвешенные и взаимосвязанные, как это описано выше, которые являются комбинациями потребностей первого и второго элементов I и II. В контексте настоящего документа, БМП является тяжелой матрицей (целевой матрицей).

[00269] Элементы I и II на соответствующих этапах работы системы принятия решений подлежат кластеризации по заданным условиям.

[00270] Кластеризация может осуществляться, но не ограничиваясь по алгоритму k-means, агломеративными методами, графовыми методами, BDSCAN и др. Кластеризация осуществляется по принципу доминирования базовой потребности.

[00271] Такой принцип также присущ человеческому интеллекту, где доминирующими являются базовые потребности, например, такие, как связанные с выживаем, равновесным состоянием, и другие.

[00272] Аналогичным принципом кластеризация осуществляется в реализации технологической системы, например, при реализации пилота. Потребности кластеризуются по принципу доминирования базовых. Например, потребность обеспечения начала движения для инициального момента времени работы обученной системы является доминирующие, соответственно все ассоциированные потребности имеют кластерную близость с базовой потребностью, входящую в соответствующий кластер.

[00273] По мере самообучения системы принятия решений, кластеры подлежат перерасчету, например, при достижении максимума количества предзаданных кластеров (например, 2000 либо иное значение). При перерасчёте, для снижения затрат, могут быть удалены классы, например, похожие на больше чем 0,995 меры межкластерной близости либо иное значение. При недостаточном количестве кластеров могут быть применены методы динамической кластеризации, при котором при значении параметра кластера существенно отличающимся от имеющихся значений параметров кластеров, автоматически порождаются новые кластеры, подлежащие наполнению присущим таким кластерам параметров. Пример метода модели динамической кластеризации можно найти в /4/ (Печеный Е.А., Аль-Хашеди А.А., Нуриев Н.К. Математическая модель динамической кластеризации в задачах распознавания образов // Современные наукоемкие технологии. - 2018. - № 5. - С. 124-130).

[00274] После полученных результатов, кластеризации может быть оценена, например, по средним внутрикластерным и межкластенрным расстояниям, гомогенности, полноты.

[00275] Стоит отметить, что заявляемая самообучающаяся система принятия решений представляет собой адаптивно масштабируемое технологическое решение, в зависимости от типа решаемой задачи. При реализации и развертке системы может быть достаточно использовать легкую матрицу ЛМП с градацией на 8 или менее базовых потребностей. При этом задание базовых потребностей осуществляется оператором системы, который обеспечивает детерминирование базовых потребностей по их сущности и их инициальную приоритезацию.

[00276] Более сложные технологические системы могут потребовать развертку базовой матрицы БМП. Такая БМП может включать 16 потребностей.

[00277] Небольшая историческая ремарка далее служит для понимания специалистом части сущности подхода принятия решений заявляемой интеллектуальной самообучающейся системой.

[00278] Впервые идея использовать потребности для описания деятельности (человека) была высказана древнегреческим философом Эпикуром. Это направление человеческой мысли сформировалось в раздел психологии как бихевиоризм в ХХ веке. Наивысшее развитие получило в работах американского психоаналитика Абрахама Маслоу ("Новые рубежи человеческой природы", ООО «Альпина нон-фикшн», 2011).

[00279] Маслоу сформулировал, что вся человеческая деятельность осуществляется для удовлетворения различных потребностей. Причём потребности более высокого порядка можно рассматривать, как комбинацию базовых потребностей. Но никаких алгоритмов комбинаторики Маслоу не описывал. Иерархия Маслоу является плодом деятельности его последователей. Она представляет собой лишь пояснительную картинку к идее Маслоу.

[00280] Теория потребностей была с энтузиазмом принята в советской школе психологии и кибернетики. Общая теория функциональных систем академика Анохина основана на работе потребностей (Анохин П. К. Теория функциональной системы. "Успехи физиол. наук", 1970, т. 1, № 1, с. 19-54). Но попытки применить к решению Марксистскую политэкономию противоречили утверждению самого Анохина о конкурентности и взаимозависимости потребностей, что и предопределило недостижимость поставленной задачи.

[00281] Его сподвижник академик Симонов П.В. вывел "формулу эмоций", но также как и Анохин не смог применить использование энергии и работы для расчетов (Павел Васильевич Симонов "Эмоциональный мозг", © ООО Издательство «Питер», 2021).

[00282] Продолжил эти исследования нейробиолог Дубынин В.А. (Вячеслав Дубынин. "Мозг и его потребности. От питания до признания", «Альпина нон-фикшн», 2021). Он уже сумел выделить приоритеты потребностей ("яркости"), вскрыл взаимодействие потребностей и разделил их на уровни, поддерживая идею Симонова.

[00283] Но ближе всех к решению подошёл профессор МГУ Петренко В.Ф. Его идея о карте ментальности уже напоминает матрицу потребностей ("Ментальная карта сознания и представление физической реальности в пространстве и времени". Исследования проводятся при финансовой поддержке РФФИ, грант № 19-013-00603, Ярославский педагогический вестник - 2019 - № 4 (109)).

[00284] На фиг. 5 представлена блок-схема компьютерной системы в соответствии с некоторыми вариантами реализации настоящего изобретения. Компьютерная система может быть подключена (например, по сети) к другим компьютерным системам в локальной сети, интрасети, экстрасети или сети Интернет. Компьютерная система может работать в качестве сервера в сетевой среде клиент-сервер. Компьютерная система может быть персональным компьютером (PC), планшетным компьютером, ТВ-приставкой (STB), персональным цифровым помощником (PDA), мобильным телефоном или любым устройством, способным выполнять набор инструкций (последовательных или иных), определяющих действия, которые должны выполняться этим устройством. Кроме того, несмотря на то что проиллюстрирована только одна компьютерная система, термин «компьютер» также следует понимать как любую совокупность компьютеров, которые индивидуально или совместно выполняют набор (или несколько наборов) инструкций для выполнения любого одного или нескольких способов, описанных в настоящем описании. В качестве компьютера так же может выступать суперкомпьютер, например, под управлением Linux.

[00285] Примерная компьютерная система 500 состоит из устройства 502 обработки данных, оперативного запоминающего устройства 504 (например, постоянного запоминающего устройства (ROM), флеш-памяти, динамической памяти с произвольным доступом (DRAM), такой как синхронная динамическая память с произвольным доступом (SDRAM)), и устройства 508 хранения данных, которые взаимодействуют друг с другом через шину 522.

[00286] Устройство 502 обработки данных представляет собой одно или несколько устройств обработки общего назначения, таких как микропроцессор, центральный процессор и т.п. Устройство 502 обработки данных может быть микропроцессором с полным наборов команд (CISC), микропроцессором для вычисления сокращенных наборов команд (RISC), микропроцессором с очень длинным командным словом (VLIW), процессором, реализующим другие наборы команд, или процессором, реализующим сочетание наборов команд.

[00287] Устройство 502 обработки данных также может представлять собой одно или несколько устройств обработки специального назначения, таких как специализированная интегральная схема (ASIC), программируемая на месте матрица логических элементов (FPGA), цифровой сигнальный процессор (DSP), сетевой процессор и т.п. Устройство 502 обработки данных сконфигурировано для выполнения инструкций 530 с целью реализации способа принятия решений, а также для выполнения любых описанных выше операций.

[00288] Компьютерная система 500 может дополнительно включать сетевой интерфейс 506, устройство 512 визуального отображения (например, жидкокристаллический дисплей), буквенно-цифровое устройство 514 ввода (например, клавиатуру), устройство 516 управления курсором и устройство принятия внешнего воздействия 518. В одном варианте реализации устройство 512 визуального отображения, устройство 514 буквенно-цифрового ввода и устройство 516 управления курсором могут быть объединены в единый компонент или устройство (например, сенсорный жидкокристаллический дисплей).

[00289 ]Устройство принятия внешнего воздействия 518 представляет собой одно или несколько устройств или датчиков для принятия внешнего воздействия. В качестве устройства принятия внешнего воздействия может выступать видеокамера, микрофон, сенсорный датчик, датчик движения, датчик температуры, датчик влажности, датчик дыма, датчик освещенности и т.п.

[00290] Устройство 508 хранения данных может включать машиночитаемый носитель 510 данных, на котором хранятся инструкции 530, воплощающие любую одну или несколько методик или функций, описанных в настоящем документе. Инструкции 530 также могут полностью или, по крайней мере, частично находиться в оперативной памяти 504 и/или на устройстве 502 обработки данных во время их выполнения компьютерной системой 500. Оперативная память 504 и устройство обработки 502 данных также представляют собой машиночитаемые носители данных. В некоторых реализациях инструкции 530 могут дополнительно передаваться или приниматься по сети 520 через сетевое интерфейсное устройство 506.

[00291] Несмотря на то, что в иллюстративных примерах машиночитаемый носитель данных представлен в единственном числе, термин «машиночитаемый носитель» следует понимать как включающий в себя один или несколько носителей (например, централизованную или распределенную базу данных и (или) связанные с ней кэши и серверы), в которых хранится один или несколько наборов инструкций. Термин «машиночитаемый носитель» также следует понимать как включающий в себя какой-либо носитель, способный хранить, кодировать или переносить набор инструкций для выполнения машиной и вынуждающий машину выполнять любую одну или несколько методик настоящего изобретения. Следовательно, термин «машиночитаемый носитель» должен включать, помимо прочего, твердотельные запоминающие устройства, оптические и магнитные носители данных.

[00292] Несмотря на то, что операции описанных в настоящем документе способов показаны и описаны в определенном порядке, порядок операций каждого способа может быть изменен таким образом, чтобы определенные операции могли выполняться в обратном порядке или чтобы определенные операции могли выполняться по меньшей мере частично одновременно с другими операциями. В некоторых реализациях инструкции или подоперации отдельных операций могут быть прерывающимися и (или) чередующимися.

[00293] Следует понимать, что приведенное выше описание является иллюстративным, а не ограничительным. Специалистам в данной области техники станут очевидны многие другие варианты реализации после прочтения и понимания приведенного выше описания. Поэтому объем изобретения определяется со ссылкой на прилагаемую формулу изобретения, а также на полный объем эквивалентов, в отношении которых такая формула изобретения дает право предъявлять претензии.

[00294] В приведенном выше описании излагаются многочисленные детали. Однако специалисту в данной области техники будет очевидно, что аспекты настоящего изобретения могут быть реализованы на практике без этих конкретных деталей. В некоторых случаях, чтобы избежать затруднения понимания настоящего изобретения, хорошо известные структуры и устройства представлены в виде блок-схемы, а не подробно.

[00295] Следует отметить, что при отсутствии других конкретных указаний, как стало очевидно из последующего обсуждения, на протяжении всего описания такие термины в обсуждении, как «получение», «определение», «выбор», «хранение», «анализ» и т. п., относятся к действиям и процессам компьютерной системы или аналогичного электронного вычислительного устройства, которое манипулирует данными и преобразует данные, представленные в виде физических (электронных) величин в регистрах и памяти компьютерной системы, в другие данные, аналогичным образом представленные в виде физических величин в памяти или регистрах компьютерной системы или других таких устройствах хранения, передачи или отображения информации.

[00296] Настоящее изобретение также относится к устройству для выполнения операций, описанных в настоящем документе. Это устройство может быть специально сконструировано для требуемых целей или может содержать компьютер общего назначения, избирательно активируемый или реконфигурируемый компьютерной программой, хранящейся в компьютере. Такая компьютерная программа может храниться на машиночитаемом носителе данных, например, на дисках любого типа, включая дискеты, оптические диски, компакт-диски и магнитно-оптические диски, постоянные запоминающие устройства (ROM), оперативную память (RAM), программируемые постоянные запоминающие устройства (EPROM), электронно-перепрограммируемые постоянные запоминающие устройства (EEPROM), магнитные или оптические карты или носители любого типа, пригодные для хранения электронных инструкций, каждый из которых подключен к компьютерной системной шине.

[00297] Представленные в настоящем документе алгоритмы, по своей сути, не связаны с конкретным компьютером или другим устройством. Различные системы общего назначения могут использоваться с программами в соответствии с приведенными в настоящем документе положениями, либо же будет удобнее создать более специализированное устройство для выполнения требуемых этапов способа. Требуемая структура для разнообразных таких систем будет выглядеть так, как указано в описании. Кроме того, аспекты настоящего изобретения не описаны со ссылкой на конкретный язык программирования. Следует иметь в виду, что для реализации положений настоящего изобретения могут использоваться различные языки программирования, как описано в настоящем документе.

[00298] Варианты реализации настоящего изобретения могут быть представлены в виде программного продукта или программного обеспечения, включающего машиночитаемый носитель с сохраненными на нем инструкциями, которые могут использоваться для программирования компьютерной системы (или других электронных устройств) с целью выполнения процесса в соответствии с настоящим изобретением. Машиночитаемый носитель включает любой механизм для хранения или передачи информации в форме, читаемой машиной (например, компьютером). К примеру, машиночитаемый (например, читаемый компьютером) носитель включает машиночитаемый (например, читаемый компьютером) носитель информации (например, постоянное запоминающее устройство (ROM), оперативную память (RAM), носитель информации на магнитных дисках, оптический носитель информации, устройства флэш-памяти).

[00299] Слова «пример» или «приведенный в качестве примера» в настоящем документе означают пример, случай или иллюстрацию. Любой аспект или решение, описанные в настоящем документе как «пример» или «приведенный в качестве примера», необязательно должны рассматриваться как предпочтительный или преимущественный по сравнению с другими аспектами или решениями. Скорее, использование слов «пример» или «приведенный в качестве примера» предназначено для представления концепций с практической точки зрения. При использовании в настоящей заявке термин «или» предназначен для обозначения включающего «или», а не исключающего «или». Кроме того, использование термина «реализация», «один вариант реализации», «пример реализации» или «один пример реализации» во всем тексте не означает один и тот же вариант или пример реализации, если только они не описаны как таковые. Кроме того, термины «первый», «второй», «третий», «четвертый» и т. д., используемые в настоящем документе, предназначены для обозначения различных элементов и необязательно имеют порядковое значение в соответствии с их числовым обозначением.

[00300] В то время как многие изменения и модификации изобретения без сомнения станут очевидными для специалиста, обладающего обычной квалификацией в данной области техники, после прочтения приведенного выше описания следует понимать, что любой конкретный вариант реализации, показанный и описанный в качестве иллюстрации, никоим образом не должен рассматриваться как ограничивающий.

Поэтому ссылки на детали различных вариантов реализации не предназначены для ограничения объема формулы изобретения, которая сама по себе содержит только признаки, рассматриваемые как раскрытие изобретения.

Иллюстрации к изобретению RU 2 830 819 C1

Реферат патента 2024 года САМООБУЧЕНИЕ СИСТЕМЫ ПРИНЯТИЯ РЕШЕНИЙ В МУЛЬТИАГЕНТНОЙ СРЕДЕ

Изобретение относится к области вычислительной техники. Техническим результатом является повышение быстродействия и точности системы, а также снижение ошибок при работе системы. Система содержит блок получения внешних воздействий, блок обработки внешних воздействий, библиотеку внутренних образов, блок текущего состояния системы, супервизор состояний, блок принятия решений, исполнительный блок, блок оперативного обучения, общий блок обучения, блок коррекции, при этом блок оперативного обучения дополнительно включает хранилище, предназначенное для хранения одного или более элементарного опыта, подлежащего формированию с учетом изменения показателей состояния при принятии решений в мультиагентной среде. 12 з.п. ф-лы, 13 ил.

Формула изобретения RU 2 830 819 C1

1. Автономная технологическая самообучающаяся система принятия решений в мультиагентной среде, включающая:

блок получения внешних воздействий, выполненный с возможностью регистрации внешних воздействий посредством индивидуального набора датчиков и/или сенсоров;

блок обработки внешних воздействий, выполненный с возможностью детерминации отношения набора полученных данных внешних воздействий к событию посредством по меньшей мере обученной нейронной сети или ансамбля нейронных сетей или аналитического механизма;

библиотеку внутренних образов ВО, характеризующих данные отношения объекта к потребностям системы принятия решений в мультиагентной среде в моменте времени, выполненную с возможностью локального хранения данных или облачного распределенного хранения данных;

блок текущего состояния системы, выполненный с возможностью формирования текущей картины мира, являющийся оперативной памятью системы принятия решений в мультиагентной среде;

супервизор состояний, выполненный с возможностью определения, управления и коррекции текущего состояния системы принятия решений в мультиагентной среде;

блок принятия решений, выполненный с возможностью генерации приоритезированных процессов посредством анализа данных указанных процессов, связанный с супервизором состояний, выполненным с возможностью отбора и формирования данных, характеризующих целевое состояние системы принятия решений в мультиагентной среде;

исполнительный блок, выполненный с возможностью исполнения реального одного или более действия системы принятия решений в мультиагентной среде в текущий момент времени для конкретной конфигурации указанной системы;

блок оперативного обучения, сконфигурированный для формирования опыта системы на основании принимаемых решений;

общий блок обучения, выполненный с возможностью обучения распознаванию данных ВО, описания данных ВО и формирования присущих указанным данным ВО отношения контекста и/или содержания, дополнительно включающий:

блок коррекции, взаимосвязанный с библиотекой ВО, блоком оперативного обучения и библиотекой знаний и выполненный с возможностью по меньшей мере динамического пересчета элементарного опыта на основании принципов матрицы потребностей МП, ассоциированных с одной и более целью системы принятия решений, способной самостоятельно детерминировать указанные одну или более цели, и где

блок оперативного обучения дополнительно включает хранилище, предназначенное для хранения одного или более элементарного опыта, подлежащего формированию с учетом изменения показателей состояния при принятии решений в мультиагентной среде при достижении по меньшей мере одной цели текущего момента времени и затрачиваемой энергии для такого одного или более элементарного опыта.

2. Система по п.1, в которой потребности системы оцениваются с учетом коэффициентов коррекции и/или коэффициентов уровней иерархий потребностей.

3. Система по п.1, в которой один или более элементарный опыт подлежит оценке с помощью меры эффективности опыта ЭО для детерминирования доминанта, при этом рассчитанные данные ЭО поступают в блок оперативного обучения.

4. Система по п.1, в которой в блоке коррекции осуществляется перерасчет значений МП.

5. Система по п.1, в которой МП включает одну или более базовую матрицу потребностей БМП.

6. Система по п.1, в которой МП включает одну или более легкую матрицу потребностей ЛМП.

7. Система по п.1, в которой МП включает одну или более тяжелую матрицу потребностей ТМП.

8. Система по п.1, в которой МП обладает динамически расширяемой наполняемой структурой.

9. Система по п.7, в которой ТМП имеет одно или более расширений, представляющих собой один или более кластер целей, где каждый указанный кластер цели характеризуется наличием одной доминирующей потребности.

10. Система по п.9, в которой ТМП выполнена с возможностью группирования целей по отношению к потребностям.

11. Система по п.1, в которой МП включает одну или более матрицу потребностей состояний системы МПСС, включающую значения состояний в ассоциации с по меньшей мере одним из значений приоритетов и весовых коэффициентов текущих потребностей.

12. Система по п.11, в которой решение для принятия на текущий момент времени определяется по меньшей мере на основе данных, содержащихся в МПCC с учетом вычисляемого интегрального результата.

13. Система по п.1, в которой МП используется для отображения ВО, которому присваиваются значения весового коэффициента ВО, отражающего эффективность удовлетворения потребности за момент времени, и структура МП наполняется весовыми коэффициентами ВО, отражающими меру участия конкретного объекта в удовлетворении потребностей системы или степень важности образа для исполнения стоящей цели.

Документы, цитированные в отчете о поиске Патент 2024 года RU2830819C1

СИСТЕМА ПРИНЯТИЯ РЕШЕНИЙ В МУЛЬТИАГЕНТНОЙ СРЕДЕ	2021	Крюков Владимир Германович	RU2791840C2
РУЧНАЯ ПЕРЕНОСНАЯ ЛЕБЕДКА	1949	Лебедев К.Е. Назаров Д.И. Лисичкин Ф.И.	SU87549A1
US 20200265956 A1, 20.08.2020
US 20200273304 A1, 27.08.2020
US 20180005146 A1, 04.01.2018.

RU 2 830 819 C1

Авторы

Крюков Владимир Германович

Даты

2024-11-26—Публикация

2023-06-09—Подача

название	год	авторы	номер документа
СИСТЕМА ПРИНЯТИЯ РЕШЕНИЙ В МУЛЬТИАГЕНТНОЙ СРЕДЕ	2021	Крюков Владимир Германович	RU2791840C2
СИСТЕМА САМООБУЧЕНИЯ ИНТЕЛЛЕКТУАЛЬНЫХ АГЕНТОВ УПРАВЛЕНИЯ СУДОВЫМ ДВИГАТЕЛЕМ	2023	Епихин Алексей Иванович	RU2821616C1
СИСТЕМА УПРАВЛЕНИЯ ПРОЦЕССОМ БУРЕНИЯ	2001	Григашкин Г.А. Кульчицкий В.В. Коновалов А.М. Инчаков А.В.	RU2208153C2
СРЕДСТВО ЦВЕТОВОЙ ИДЕНТИФИКАЦИИ СОСТОЯНИЯ СИСТЕМЫ	2023	Куделькин Владимир Андреевич Лавров Владимир Васильевич	RU2824435C1
СПОСОБ НЕЙРОСЕТЕВОГО КООРДИНИРОВАННОГО УПРАВЛЕНИЯ ТРАНСПОРТНЫМИ ПОТОКАМИ В РАЙОНЕ РЕГУЛИРОВАНИЯ	1997	Бабанин В.Б. Смолянинова Л.Г. Абовский Н.П. Черноусов В.Н. Жуков В.И. Омышев М.Г. Шевелева А.М.	RU2134453C1
Способ децентрализованного управления распределенной обобщенной сетью, включающей подвижные роботизированные средства и стыковочные станции	2020	Пшихопов Вячеслав Хасанович Медведев Михаил Юрьевич Костюков Владимир Александрович Савченко Василий Владимирович Евтушенко Валентин Юрьевич	RU2781391C2
СПОСОБ АДАПТАЦИИ КАНАЛОВ РАДИОСВЯЗИ С ИСПОЛЬЗОВАНИЕМ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА И УСТРОЙСТВО ДЛЯ ЕГО ОСУЩЕСТВЛЕНИЯ	2008	Беда Сергей Иванович Катанович Андрей Андреевич Пашкевич Лидия Алексеевна Коваленко Юрий Георгиевич	RU2405265C2
СПОСОБ ПЕРЕРАСПРЕДЕЛЕНИЯ ВХОДЯЩИХ ВЫЗОВОВ В СИСТЕМЕ ВИРТУАЛЬНОГО КОЛЛ ЦЕНТРА	2019	Крюков Сергей Олегович Крюкова Наталья Николаевна	RU2724633C1
СИСТЕМА И СПОСОБ ФОРМИРОВАНИЯ БАЗЫ РЕШЕНИЙ	2014	Лавущенко Владимир Павлович Беспалов Алексей Петрович Грицишин Сергей Николаевич Зубарев Виктор Владимирович Ахметшин Рамиль Галимович Гарипов Айрат Камилевич Юртаев Дмитрий Александрович	RU2601150C2
СПОСОБ И СИСТЕМА ПРЕДОТВРАЩЕНИЯ ВРЕДОНОСНЫХ АТАК НА СЕТЕВУЮ ИНФРАСТРУКТУРУ С ПРИМЕНЕНИЕМ КАСКАДОВ САМООБУЧАЮЩИХСЯ НЕЙРОННЫХ СЕТЕЙ	2024	Чуянов Владимир Александрович Высоцкий Алексей Вадимович	RU2841480C1

САМООБУЧЕНИЕ СИСТЕМЫ ПРИНЯТИЯ РЕШЕНИЙ В МУЛЬТИАГЕНТНОЙ СРЕДЕ Российский патент 2024 года по МПК G05B13/02 G06N5/04

Описание патента на изобретение RU2830819C1

Похожие патенты RU2830819C1

Иллюстрации к изобретению RU 2 830 819 C1

Реферат патента 2024 года САМООБУЧЕНИЕ СИСТЕМЫ ПРИНЯТИЯ РЕШЕНИЙ В МУЛЬТИАГЕНТНОЙ СРЕДЕ

Формула изобретения RU 2 830 819 C1

Документы, цитированные в отчете о поиске Патент 2024 года RU2830819C1

RU 2 830 819 C1