Изобретение относится к области компьютерной техники и информационных технологий, в частности, к одной из основных технологий в искусственном интеллекте (ИИ) - машинному обучению при построении прогнозных моделей.
Известно, что объединение данных, поступивших из различных источников, является эффективным инструментом для повышения качества моделей и прогнозов на их основе [1]. Но если объединяемые данные относятся к категории данных ограниченного доступа - в частности, персональным - то этому препятствует законодательные ограничения возможностей обмена такими данными, накапливаемыми разными операторами, и их совместной обработки [2].
Таким образом, сформировалось противоречие между потребностями хозяйствующих субъектов в сборе и обработке больших данных и ограниченными возможностями осуществлять эту деятельность в рамках существующих технических решений и норм правового регулирования, причем не только отечественных.
Преодоление данного противоречия явилось актуальной проблемой, потребовавшей создания в России и за рубежом новых решений, в частности, разработки специализированных технологий, методов и средств обработки защищаемых данных без ознакомления с ними - вслепую [3]. Этот тип технологий назван технологиями слепой обработки данных (СОД), а средства вычислительной техники (СВТ), реализующие СОД - СВТ СОД.
Наиболее полно отечественным нормам и требованиям отвечает способ безопасного построения прогнозных моделей [4], в котором на этапе машинного обучения используют объединенные данные ограниченного доступа, поступившие из разных источников, начальная обработка которых осуществляется полностью автономно - без участия человека.
Однако специализированные защищенные системы машинного обучения на основе данных ограниченного доступа, поступивших из разных источников, в которых этот и подобные способы могли бы осуществляться наиболее эффективно и, вместе с тем, безопасно, отсутствуют. Наиболее близкой к предложенной системе является система, построенная, согласно мультипликативной парадигме защиты [5, с. 46], по меньшей мере, с двумя вложенными один в другой контурами защиты.
Задачей изобретения является создание защищенной системы, специально предназначенной для машинного обучения на основе данных ограниченного доступа, поступивших из разных источников. Технический результат состоит в качественном повышении уровня защищенности таких данных, полностью исключающим все их - в том числе, внутрисистемные (считая персонал системы ее составной частью) - утечки.
Указанный технический результат достигнут тем, что защищенная система машинного обучения, построенная, по меньшей мере, с двумя вложенными один в другой контурами защиты, содержит программно-аппаратный комплекс слепой обработки данных (ПАК СОД), расположенный во внешнем контуре защиты, за пределами которого находятся внешние терминалы, и средство вычислительной техники слепой обработки данных (СВТ СОД), расположенное во внутреннем контуре защиты, в границах которого защищаемые данные обрабатываются в открытом виде,
В этой системе все функциональные подсистемы, кроме подсистемы машинного обучения, обрабатывающей защищаемые данные в открытом виде, реализованы так, что их части, обрабатывающие данные разной степени критичности, расположены на структурных элементах разных уровней вложенности контуров, а подсистема машинного обучения полностью реализована в пределах внутреннего контура защиты.
Поэтому обеспечивается, что каждый более глубокий контур защиты защищен всеми средствами защиты, защищающими предыдущие уровни, плюс теми средствами защиты, что свойственны именно ему. Исходя из этого, расположены и компоненты функциональных подсистем, входящих в состав системы: те, что работают с более критичными данными, расположены на структурных компонентах во вложенных контурах, расположенных на более глубоких уровнях. А именно, все функциональные подсистемы системы, кроме подсистемы машинного обучения (ПМО), непосредственно обрабатывающей защищаемые данные в открытом виде, реализованы распределенно: их части, обрабатывающие данные разной степени критичности, расположены на структурных элементах разных уровней вложенности. ПМО же полностью реализована в пределах внутреннего контура защиты, окружающего СВТ СОД.
При этом система обеспечивает выполнение вычислительных процессов построения прогнозной модели машинного обучения, ее валидации и применения, включая расшифровывание данных с использованием ключа поставщика, их обработку и зашифровывайте данных с использованием ключа хранения, подготовленных для выдачи в качестве результирующих отчетов, без раскрытия данных, объединяемых из разных источников, исключая ознакомление с ними, копирование и модификацию, но с возможностью их использования для извлечения знаний на этапе машинного обучения. Для этого в систему загружают данные из разных источников в предварительно зашифрованном виде, после чего в системе на этапе машинного обучения выполняют процесс их автоматической обработки, включающий в себя зафиксированную последовательность команд обработки данных, не приводящую к ознакомлению с ними персонала и к утечке данных в пределах информационной системы. Причинно-следственная связь между совокупностью приведенных отличительных признаков и указанным техническим результатом очевидна и в пояснениях не нуждается.
Целесообразно, чтобы система содержала ПАК СОД, в состав которого входили бы, по меньшей мере, один сервер работы с метаданными, и, по меньшей мере, один сервер сетевой защиты. Сетевая защита может быть реализована сертифицированными средствами VPN, МЭ или СОВ.
Кроме того, целесообразно, чтобы система содержала СВТ СОД, в состав которого входили бы, по меньшей мере, один сервер вычислений и, по меньшей мере, один сервер безопасности - криптосервер. Последний может представлять собой совокупность серверов криптографической защиты информации, крипто-шлюза, канального шифратора (при наличии кластера серверов вычислений), сервера регистрации, сервера мониторинга и сервера физической защиты.
Еще в отдельных случаях целесообразно, чтобы система содержала подсистему хранения данных ПАК СОД в зашифрованном виде, а также хранилище, предназначенное для загрузки данных в систему извне, расположенные за рамками внешнего контура защиты.
ИСТОЧНИКИ ИНФОРМАЦИИ
1. Data Fusion https://en.wikipedia.org/wiki/Data_fusion
2. Федеральный закон «О персональных данных» от 27.07.2006 №152-ФЗ https://www.consultant.ru/document/cons_doc_LAW_61801/
3. Gharib Gharibi et al., "Blind Learning: Facilitating Data Access for Informatics Innovators while Protecting Providers Information", 2023, URL:https://www.researchgate.net/publication/371407192_Blind Lear_ning_Facilitaing_Data_Access_for_Informatics_Innovators_while_Protecting_Providers_Information
4. Конявский В.А. "Цифровые данные и искусственный интеллект", Международная конференция "Правовые аспекты цифрового развития общества", 02.12.2022 г., дата публикации 15.02.2023, URL: https://web.archive.org/web/20230329170436/https://www.okbsapr.ru/librarv/links/tsifrovye-dannye-i-iskusstvennyy-intellekt/
5. Конявский В.А. Управление защитой информации на базе СЗИ НСД «Аккорд». - М.: Радио и связь, 1999 - 325 с.
название | год | авторы | номер документа |
---|---|---|---|
СПОСОБ ЗАЩИТЫ ОТ НЕСАНКЦИОНИРОВАННОГО ДОСТУПА К ИНФОРМАЦИИ, ХРАНИМОЙ В КОМПЬЮТЕРНЫХ СИСТЕМАХ | 2011 |
|
RU2470349C1 |
СПОСОБ БЕЗОПАСНОГО РАСШИРЕНИЯ ФУНКЦИЙ АППАРАТНЫХ СРЕДСТВ ЗАЩИТЫ ИНФОРМАЦИИ | 2014 |
|
RU2574347C2 |
СРЕДСТВО ДОВЕРЕННОЙ ЗАГРУЗКИ СО ВСТРОЕННЫМ БИНАРНЫМ ТРАНСЛЯТОРОМ ОПЕРАЦИОННОЙ СИСТЕМЫ И БЕСПРОВОДНЫМ КАНАЛОМ УПРАВЛЕНИЯ | 2023 |
|
RU2820971C1 |
СПОСОБ ЗАЩИТЫ НЕЙРОННЫХ СЕТЕЙ И ПРОГРАММНО-АППАРАТНЫЙ КОМПЛЕКС ДЛЯ ЕГО ОСУЩЕСТВЛЕНИЯ | 2021 |
|
RU2779846C1 |
Программно-технический комплекс автоматизации системы каталогизации предметов снабжения Вооруженных Сил Российской Федерации | 2017 |
|
RU2687216C2 |
АТТЕСТАЦИЯ ХОСТА, СОДЕРЖАЩЕГО ДОВЕРИТЕЛЬНУЮ СРЕДУ ИСПОЛНЕНИЯ | 2015 |
|
RU2679721C2 |
СПОСОБ ОДНОЗНАЧНОГО ХЭШИРОВАНИЯ НЕОДНОЗНАЧНЫХ БИОМЕТРИЧЕСКИХ ДАННЫХ | 2010 |
|
RU2451409C2 |
Способ сеансовой аутентификации пользователей по изображениям их лиц | 2024 |
|
RU2830390C1 |
СИСТЕМА И СПОСОБ ПРЕДОСТАВЛЕНИЯ ИНФОРМАЦИИ И УСЛУГ ПОЛЬЗОВАТЕЛЯМ | 2014 |
|
RU2614537C2 |
СПОСОБ И СИСТЕМА ЗАЩИТЫ ПОДЛИННОСТИ ИЗОБРАЖЕНИЙ, ГЕНЕРИРУЕМЫХ МОДЕЛЬЮ МАШИННОГО ОБУЧЕНИЯ | 2024 |
|
RU2829566C1 |
Изобретение относится к защищенной системе машинного обучения на основе данных ограниченного доступа, поступивших из разных источников. Технический результат заключается в повышении уровня защищенности данных. Система содержит два вложенных один в другой контура защиты, программно-аппаратный комплекс слепой обработки данных (ПАК СОД), расположенный во внешнем контуре защиты, за пределами которого находятся внешние терминалы, и средство вычислительной техники слепой обработки данных (СВТ СОД), расположенное во внутреннем контуре защиты, в границах которого защищаемые данные обрабатываются в открытом виде, причем все функциональные подсистемы, кроме подсистемы машинного обучения, обрабатывающей защищаемые данные в открытом виде, реализованы так, что их части, обрабатывающие данные разной степени критичности, расположены на структурных элементах разных уровней вложенности контуров, а подсистема машинного обучения полностью реализована в пределах внутреннего контура защиты, при этом система обеспечивает выполнение вычислительных процессов построения прогнозной модели машинного обучения, ее валидации и применения, включая расшифровывание данных с использованием ключа поставщика, их обработку и зашифровывание данных с использованием ключа хранения, подготовленных для выдачи в качестве результирующих отчетов, без раскрытия данных, объединяемых из разных источников, исключая ознакомление с ними, копирование и модификацию, но с возможностью их использования для извлечения знаний на этапе машинного обучения, для чего в систему загружают данные из разных источников в предварительно зашифрованном виде, после чего в системе на этапе машинного обучения выполняют процесс их автоматической обработки, включающий в себя зафиксированную последовательность команд обработки данных, не приводящую к ознакомлению с ними персонала и к утечке данных в пределах информационной системы. 3 з.п. ф-лы.
1. Защищенная система машинного обучения на основе данных ограниченного доступа, поступивших из разных источников, построенная, по меньшей мере, с двумя вложенными один в другой контурами защиты, отличающаяся тем, что она содержит:
программно-аппаратный комплекс слепой обработки данных (ПАК СОД), расположенный во внешнем контуре защиты, за пределами которого находятся внешние терминалы, и
средство вычислительной техники слепой обработки данных (СВТ СОД), расположенное во внутреннем контуре защиты, в границах которого защищаемые данные обрабатываются в открытом виде,
причем все функциональные подсистемы, кроме подсистемы машинного обучения, обрабатывающей защищаемые данные в открытом виде, реализованы так, что их части, обрабатывающие данные разной степени критичности, расположены на структурных элементах разных уровней вложенности контуров, а подсистема машинного обучения полностью реализована в пределах внутреннего контура защиты,
при этом система обеспечивает выполнение вычислительных процессов построения прогнозной модели машинного обучения, ее валидации и применения, включая расшифровывание данных с использованием ключа поставщика, их обработку и зашифровывание данных с использованием ключа хранения, подготовленных для выдачи в качестве результирующих отчетов, без раскрытия данных, объединяемых из разных источников, исключая ознакомление с ними, копирование и модификацию, но с возможностью их использования для извлечения знаний на этапе машинного обучения,
для чего в систему загружают данные из разных источников в предварительно зашифрованном виде, после чего в системе на этапе машинного обучения выполняют процесс их автоматической обработки, включающий в себя зафиксированную последовательность команд обработки данных, не приводящую к ознакомлению с ними персонала и к утечке данных в пределах информационной системы.
2. Система по п. 1, отличающаяся тем, что она содержит ПАК СОД, в состав которого входят, по меньшей мере, один сервер работы с метаданными, и, по меньшей мере, один сервер сетевой защиты.
3. Система по п. 1, отличающаяся тем, что она содержит СВТ СОД, в состав которого входят, по меньшей мере, один сервер вычислений и, по меньшей мере, один сервер безопасности в виде совокупности серверов криптографической защиты информации, криптошлюза, канального шифратора при наличии кластера серверов вычислений, сервера регистрации, сервера мониторинга и сервера физической защиты.
4. Система по пп. 1-3, отличающаяся тем, что она содержит подсистему хранения данных ПАК СОД в зашифрованном виде, а также хранилище, предназначенное для загрузки данных в систему извне, расположенные за рамками внешнего контура защиты.
Конявский В | |||
А | |||
"Цифровые данные и искусственный интеллект", Международная конференция "Правовые аспекты цифрового развития общества", 02.12.2022 г., дата публикации 15.02.2023, URL: https://web.archive.org/web/20230329170436/https://www.okbsapr.ru/library/links/tsifrovye-dannye-i-iskusstvennyy-intellekt/, вся статья | |||
Gharib Gharibi и др., "Blind |
Авторы
Даты
2024-11-18—Публикация
2024-05-22—Подача