ЗАЩИЩЕННАЯ СИСТЕМА МАШИННОГО ОБУЧЕНИЯ НА ОСНОВЕ ДАННЫХ ОГРАНИЧЕННОГО ДОСТУПА, ПОСТУПИВШИХ ИЗ РАЗНЫХ ИСТОЧНИКОВ Российский патент 2024 года по МПК G06F21/62 G06N20/00 

Описание патента на изобретение RU2830283C1

Изобретение относится к области компьютерной техники и информационных технологий, в частности, к одной из основных технологий в искусственном интеллекте (ИИ) - машинному обучению при построении прогнозных моделей.

Известно, что объединение данных, поступивших из различных источников, является эффективным инструментом для повышения качества моделей и прогнозов на их основе [1]. Но если объединяемые данные относятся к категории данных ограниченного доступа - в частности, персональным - то этому препятствует законодательные ограничения возможностей обмена такими данными, накапливаемыми разными операторами, и их совместной обработки [2].

Таким образом, сформировалось противоречие между потребностями хозяйствующих субъектов в сборе и обработке больших данных и ограниченными возможностями осуществлять эту деятельность в рамках существующих технических решений и норм правового регулирования, причем не только отечественных.

Преодоление данного противоречия явилось актуальной проблемой, потребовавшей создания в России и за рубежом новых решений, в частности, разработки специализированных технологий, методов и средств обработки защищаемых данных без ознакомления с ними - вслепую [3]. Этот тип технологий назван технологиями слепой обработки данных (СОД), а средства вычислительной техники (СВТ), реализующие СОД - СВТ СОД.

Наиболее полно отечественным нормам и требованиям отвечает способ безопасного построения прогнозных моделей [4], в котором на этапе машинного обучения используют объединенные данные ограниченного доступа, поступившие из разных источников, начальная обработка которых осуществляется полностью автономно - без участия человека.

Однако специализированные защищенные системы машинного обучения на основе данных ограниченного доступа, поступивших из разных источников, в которых этот и подобные способы могли бы осуществляться наиболее эффективно и, вместе с тем, безопасно, отсутствуют. Наиболее близкой к предложенной системе является система, построенная, согласно мультипликативной парадигме защиты [5, с. 46], по меньшей мере, с двумя вложенными один в другой контурами защиты.

Задачей изобретения является создание защищенной системы, специально предназначенной для машинного обучения на основе данных ограниченного доступа, поступивших из разных источников. Технический результат состоит в качественном повышении уровня защищенности таких данных, полностью исключающим все их - в том числе, внутрисистемные (считая персонал системы ее составной частью) - утечки.

Указанный технический результат достигнут тем, что защищенная система машинного обучения, построенная, по меньшей мере, с двумя вложенными один в другой контурами защиты, содержит программно-аппаратный комплекс слепой обработки данных (ПАК СОД), расположенный во внешнем контуре защиты, за пределами которого находятся внешние терминалы, и средство вычислительной техники слепой обработки данных (СВТ СОД), расположенное во внутреннем контуре защиты, в границах которого защищаемые данные обрабатываются в открытом виде,

В этой системе все функциональные подсистемы, кроме подсистемы машинного обучения, обрабатывающей защищаемые данные в открытом виде, реализованы так, что их части, обрабатывающие данные разной степени критичности, расположены на структурных элементах разных уровней вложенности контуров, а подсистема машинного обучения полностью реализована в пределах внутреннего контура защиты.

Поэтому обеспечивается, что каждый более глубокий контур защиты защищен всеми средствами защиты, защищающими предыдущие уровни, плюс теми средствами защиты, что свойственны именно ему. Исходя из этого, расположены и компоненты функциональных подсистем, входящих в состав системы: те, что работают с более критичными данными, расположены на структурных компонентах во вложенных контурах, расположенных на более глубоких уровнях. А именно, все функциональные подсистемы системы, кроме подсистемы машинного обучения (ПМО), непосредственно обрабатывающей защищаемые данные в открытом виде, реализованы распределенно: их части, обрабатывающие данные разной степени критичности, расположены на структурных элементах разных уровней вложенности. ПМО же полностью реализована в пределах внутреннего контура защиты, окружающего СВТ СОД.

При этом система обеспечивает выполнение вычислительных процессов построения прогнозной модели машинного обучения, ее валидации и применения, включая расшифровывание данных с использованием ключа поставщика, их обработку и зашифровывайте данных с использованием ключа хранения, подготовленных для выдачи в качестве результирующих отчетов, без раскрытия данных, объединяемых из разных источников, исключая ознакомление с ними, копирование и модификацию, но с возможностью их использования для извлечения знаний на этапе машинного обучения. Для этого в систему загружают данные из разных источников в предварительно зашифрованном виде, после чего в системе на этапе машинного обучения выполняют процесс их автоматической обработки, включающий в себя зафиксированную последовательность команд обработки данных, не приводящую к ознакомлению с ними персонала и к утечке данных в пределах информационной системы. Причинно-следственная связь между совокупностью приведенных отличительных признаков и указанным техническим результатом очевидна и в пояснениях не нуждается.

Целесообразно, чтобы система содержала ПАК СОД, в состав которого входили бы, по меньшей мере, один сервер работы с метаданными, и, по меньшей мере, один сервер сетевой защиты. Сетевая защита может быть реализована сертифицированными средствами VPN, МЭ или СОВ.

Кроме того, целесообразно, чтобы система содержала СВТ СОД, в состав которого входили бы, по меньшей мере, один сервер вычислений и, по меньшей мере, один сервер безопасности - криптосервер. Последний может представлять собой совокупность серверов криптографической защиты информации, крипто-шлюза, канального шифратора (при наличии кластера серверов вычислений), сервера регистрации, сервера мониторинга и сервера физической защиты.

Еще в отдельных случаях целесообразно, чтобы система содержала подсистему хранения данных ПАК СОД в зашифрованном виде, а также хранилище, предназначенное для загрузки данных в систему извне, расположенные за рамками внешнего контура защиты.

ИСТОЧНИКИ ИНФОРМАЦИИ

1. Data Fusion https://en.wikipedia.org/wiki/Data_fusion

2. Федеральный закон «О персональных данных» от 27.07.2006 №152-ФЗ https://www.consultant.ru/document/cons_doc_LAW_61801/

3. Gharib Gharibi et al., "Blind Learning: Facilitating Data Access for Informatics Innovators while Protecting Providers Information", 2023, URL:https://www.researchgate.net/publication/371407192_Blind Lear_ning_Facilitaing_Data_Access_for_Informatics_Innovators_while_Protecting_Providers_Information

4. Конявский В.А. "Цифровые данные и искусственный интеллект", Международная конференция "Правовые аспекты цифрового развития общества", 02.12.2022 г., дата публикации 15.02.2023, URL: https://web.archive.org/web/20230329170436/https://www.okbsapr.ru/librarv/links/tsifrovye-dannye-i-iskusstvennyy-intellekt/

5. Конявский В.А. Управление защитой информации на базе СЗИ НСД «Аккорд». - М.: Радио и связь, 1999 - 325 с.

Похожие патенты RU2830283C1

название год авторы номер документа
СПОСОБ ЗАЩИТЫ ОТ НЕСАНКЦИОНИРОВАННОГО ДОСТУПА К ИНФОРМАЦИИ, ХРАНИМОЙ В КОМПЬЮТЕРНЫХ СИСТЕМАХ 2011
  • Бажитов Игорь Анатольевич
  • Конявская Светлана Валерьевна
  • Счастный Дмитрий Юрьевич
RU2470349C1
СПОСОБ БЕЗОПАСНОГО РАСШИРЕНИЯ ФУНКЦИЙ АППАРАТНЫХ СРЕДСТВ ЗАЩИТЫ ИНФОРМАЦИИ 2014
  • Алтухов Андрей Андреевич
  • Конявский Валерий Аркадьевич
  • Счастный Дмитрий Юрьевич
RU2574347C2
СРЕДСТВО ДОВЕРЕННОЙ ЗАГРУЗКИ СО ВСТРОЕННЫМ БИНАРНЫМ ТРАНСЛЯТОРОМ ОПЕРАЦИОННОЙ СИСТЕМЫ И БЕСПРОВОДНЫМ КАНАЛОМ УПРАВЛЕНИЯ 2023
  • Молчанов Игорь Анатольевич
  • Чучко Павел Александрович
  • Бычков Игнат Николаевич
  • Лобанов Игорь Николаевич
  • Коренев Павел Валерьевич
  • Михайлова Ирина Александровна
RU2820971C1
СПОСОБ ЗАЩИТЫ НЕЙРОННЫХ СЕТЕЙ И ПРОГРАММНО-АППАРАТНЫЙ КОМПЛЕКС ДЛЯ ЕГО ОСУЩЕСТВЛЕНИЯ 2021
  • Душин Илья Алексеевич
  • Рытвинский Дмитрий Юрьевич
  • Елагин Дмитрий Анатольевич
RU2779846C1
Программно-технический комплекс автоматизации системы каталогизации предметов снабжения Вооруженных Сил Российской Федерации 2017
  • Аношко Юрий Геннадьевич
  • Щеглов Сергей Валерьевич
  • Демидов Алексей Александрович
  • Широбоков Павел Сергеевич
  • Поленков Александр Владимирович
  • Насонов Александр Сергеевич
  • Лучанкин Дмитрий Николаевич
  • Нагорный Андрей Александрович
  • Горшков Егор Алексеевич
  • Чагина Анна Олеговна
  • Котов Константин Евгеньевич
  • Галушко Александр Александрович
  • Леньшин Сергей Викторович
  • Брежнев Дмитрий Юрьевич
  • Брежнев Евгений Юрьевич
RU2687216C2
АТТЕСТАЦИЯ ХОСТА, СОДЕРЖАЩЕГО ДОВЕРИТЕЛЬНУЮ СРЕДУ ИСПОЛНЕНИЯ 2015
  • Фергюсон Нильс Т.
  • Самсонов Евгений Анатольевич
  • Кинсхуманн
  • Чандрашекар Самартха
  • Мессек Джон Энтони
  • Новак Марк Фишел
  • Маккаррон Кристофер
  • Тэмхейн Амитабх Пракаш
  • Ван Цян
  • Крус Дэвид Мэттью
  • Бен-Зви Нир
  • Винберг Андерс Бертил
RU2679721C2
СПОСОБ ОДНОЗНАЧНОГО ХЭШИРОВАНИЯ НЕОДНОЗНАЧНЫХ БИОМЕТРИЧЕСКИХ ДАННЫХ 2010
  • Язов Юрий Константинович
  • Иванов Александр Иванович
  • Назаров Игорь Григорьевич
  • Фунтиков Вячеслав Александрович
  • Иванов Сергей Михайлович
  • Майоров Александр Викторович
  • Ефимов Олег Владимирович
RU2451409C2
Способ сеансовой аутентификации пользователей по изображениям их лиц 2024
  • Тельный Андрей Викторович
  • Монахов Михаил Юрьевич
RU2830390C1
СИСТЕМА И СПОСОБ ПРЕДОСТАВЛЕНИЯ ИНФОРМАЦИИ И УСЛУГ ПОЛЬЗОВАТЕЛЯМ 2014
  • Шмид Александр Викторович
  • Савченко Александр Анатольевич
  • Галахов Илья Владимирович
  • Чугунов Виталий Рудольфович
  • Коханов Александр Юрьевич
  • Ефимов Константин Николаевич
RU2614537C2
СПОСОБ И СИСТЕМА ЗАЩИТЫ ПОДЛИННОСТИ ИЗОБРАЖЕНИЙ, ГЕНЕРИРУЕМЫХ МОДЕЛЬЮ МАШИННОГО ОБУЧЕНИЯ 2024
  • Вышегородцев Кирилл Евгеньевич
RU2829566C1

Реферат патента 2024 года ЗАЩИЩЕННАЯ СИСТЕМА МАШИННОГО ОБУЧЕНИЯ НА ОСНОВЕ ДАННЫХ ОГРАНИЧЕННОГО ДОСТУПА, ПОСТУПИВШИХ ИЗ РАЗНЫХ ИСТОЧНИКОВ

Изобретение относится к защищенной системе машинного обучения на основе данных ограниченного доступа, поступивших из разных источников. Технический результат заключается в повышении уровня защищенности данных. Система содержит два вложенных один в другой контура защиты, программно-аппаратный комплекс слепой обработки данных (ПАК СОД), расположенный во внешнем контуре защиты, за пределами которого находятся внешние терминалы, и средство вычислительной техники слепой обработки данных (СВТ СОД), расположенное во внутреннем контуре защиты, в границах которого защищаемые данные обрабатываются в открытом виде, причем все функциональные подсистемы, кроме подсистемы машинного обучения, обрабатывающей защищаемые данные в открытом виде, реализованы так, что их части, обрабатывающие данные разной степени критичности, расположены на структурных элементах разных уровней вложенности контуров, а подсистема машинного обучения полностью реализована в пределах внутреннего контура защиты, при этом система обеспечивает выполнение вычислительных процессов построения прогнозной модели машинного обучения, ее валидации и применения, включая расшифровывание данных с использованием ключа поставщика, их обработку и зашифровывание данных с использованием ключа хранения, подготовленных для выдачи в качестве результирующих отчетов, без раскрытия данных, объединяемых из разных источников, исключая ознакомление с ними, копирование и модификацию, но с возможностью их использования для извлечения знаний на этапе машинного обучения, для чего в систему загружают данные из разных источников в предварительно зашифрованном виде, после чего в системе на этапе машинного обучения выполняют процесс их автоматической обработки, включающий в себя зафиксированную последовательность команд обработки данных, не приводящую к ознакомлению с ними персонала и к утечке данных в пределах информационной системы. 3 з.п. ф-лы.

Формула изобретения RU 2 830 283 C1

1. Защищенная система машинного обучения на основе данных ограниченного доступа, поступивших из разных источников, построенная, по меньшей мере, с двумя вложенными один в другой контурами защиты, отличающаяся тем, что она содержит:

программно-аппаратный комплекс слепой обработки данных (ПАК СОД), расположенный во внешнем контуре защиты, за пределами которого находятся внешние терминалы, и

средство вычислительной техники слепой обработки данных (СВТ СОД), расположенное во внутреннем контуре защиты, в границах которого защищаемые данные обрабатываются в открытом виде,

причем все функциональные подсистемы, кроме подсистемы машинного обучения, обрабатывающей защищаемые данные в открытом виде, реализованы так, что их части, обрабатывающие данные разной степени критичности, расположены на структурных элементах разных уровней вложенности контуров, а подсистема машинного обучения полностью реализована в пределах внутреннего контура защиты,

при этом система обеспечивает выполнение вычислительных процессов построения прогнозной модели машинного обучения, ее валидации и применения, включая расшифровывание данных с использованием ключа поставщика, их обработку и зашифровывание данных с использованием ключа хранения, подготовленных для выдачи в качестве результирующих отчетов, без раскрытия данных, объединяемых из разных источников, исключая ознакомление с ними, копирование и модификацию, но с возможностью их использования для извлечения знаний на этапе машинного обучения,

для чего в систему загружают данные из разных источников в предварительно зашифрованном виде, после чего в системе на этапе машинного обучения выполняют процесс их автоматической обработки, включающий в себя зафиксированную последовательность команд обработки данных, не приводящую к ознакомлению с ними персонала и к утечке данных в пределах информационной системы.

2. Система по п. 1, отличающаяся тем, что она содержит ПАК СОД, в состав которого входят, по меньшей мере, один сервер работы с метаданными, и, по меньшей мере, один сервер сетевой защиты.

3. Система по п. 1, отличающаяся тем, что она содержит СВТ СОД, в состав которого входят, по меньшей мере, один сервер вычислений и, по меньшей мере, один сервер безопасности в виде совокупности серверов криптографической защиты информации, криптошлюза, канального шифратора при наличии кластера серверов вычислений, сервера регистрации, сервера мониторинга и сервера физической защиты.

4. Система по пп. 1-3, отличающаяся тем, что она содержит подсистему хранения данных ПАК СОД в зашифрованном виде, а также хранилище, предназначенное для загрузки данных в систему извне, расположенные за рамками внешнего контура защиты.

Документы, цитированные в отчете о поиске Патент 2024 года RU2830283C1

Конявский В
А
"Цифровые данные и искусственный интеллект", Международная конференция "Правовые аспекты цифрового развития общества", 02.12.2022 г., дата публикации 15.02.2023, URL: https://web.archive.org/web/20230329170436/https://www.okbsapr.ru/library/links/tsifrovye-dannye-i-iskusstvennyy-intellekt/, вся статья
Gharib Gharibi и др., "Blind

RU 2 830 283 C1

Авторы

Счастный Дмитрий Юрьевич

Даты

2024-11-18Публикация

2024-05-22Подача