Показать метаданные Скрыть метаданные

(19)

(11)

2 538 913

(13)

(51)

МПК

G06F21/00(2013-01-01)

(21) (22)

Заявка

2012144274/08, 2012-10-16

(24)

Дата начала отсчета патента

2012-10-16

(22)

дата подачи заявки

2012-10-16

(45)

опубликовано

2015-01-10

(72)

авторы

Куракин Александр Сергеевич

(73)

патентообладатели

Федеральное Государственное Автономное Образовательное Учреждение Высшего Образования Национальный Исследовательский Университет Информационных Технологий, Механики И Оптики" Итмо)

(56)

Документы, цитированные в отчете о поиске

US 7975149 B2, 05.07.2011US 8074283 B2, 06.12.2011

СПОСОБ ДЕПЕРСОНАЛИЗАЦИИ ПЕРСОНАЛЬНЫХ ДАННЫХ Российский патент 2015 года по МПК G06F21/00

Описание патента на изобретение RU2538913C2

Известен способ защиты от несанкционированного доступа к информации пользователя в системе обработки информации (патент RU №2309450, МПК G06F 12/14, дата приоритета 26.04.2006, дата публикации 27.10.2007) [1], основанный на том, что формирование сервисных служб системы обработки информации производится из доступного пользователю набора функциональных блоков, расположенных на различных серверах системы. Рабочая информация пользователя подвергается преобразованию, уникальному для каждого обращения пользователя к системе обработки информации, сведения о хранении учетной записи пользователя также подвергаются уникальному для данного случая преобразованию и сохраняются в других местах системы обработки информации. Недостатком известного технического решения является то, что выполнение указанных в способе требований влечет за собой значительные материальные затраты на внедрение дополнительных функциональных блоков.

Наиболее близким к предлагаемому изобретению по совокупности существенных признаков и принятым в качестве прототипа является способ защиты текстовой информации от несанкционированного доступа (патент RU №2439693, МПК G06F 21/24, дата приоритета 04.06.2010, дата публикации 10.01.2012) [2], использующий искажение в системах передачи данных без использования секретных ключей и пин-кодов. Способ включает: шифрование текстового сообщения А, его передачу, дешифрование принятого текстового сообщения А, предоставление восстановленного сообщения пользователю, при этом перед шифрованием на передающей стороне искажают исходное текстовое сообщение А с помощью известного пин-кода Р путем отображения -ого слова, где $i = \bar{1, I}$ , а - количество слов в исходном сообщении, в соответствующий код D_i по таблице возможных значений, замены кода D_i на код $D_{K_{i}}$ путем сдвига кода D_i по кольцу на заданное в пин-коде Р количество строк k в прямом направлении, а на приемной стороне после дешифрации восстанавливают код D_i принятого -ого слова путем сдвига кода $D_{K_{i}}$ по кольцу на заданное в пин-коде Р количество строк k в обратном направлении, осуществляют отображение кода D_i в соответствующее i-e слово по таблице возможных значений. Под таблицей возможных значений понимается таблица соответствия слов русского языка, находящихся в простой форме, расположенных в алфавитном порядке, которым поставлен в соответствие код W, равный логарифму по основанию 2 порядкового номера слова. При использовании данного способа из-за ошибочного приема злоумышленником хотя бы одного бита информации в силу свойств применяемого алгоритма шифрования, несмотря на то что при шифровании используется открытый ключ, при дешифровании перехваченных сообщений происходит лавинообразное размножение ошибок. После восстановления дешифрованных сообщений с ошибками в силу свойств применяемого алгоритма искажения текстовой информации будет получено множество текстов, слова в которых связаны грамматически, но автоматизированный анализ полученных текстов невозможен, то есть анализ может выполняться только экспертным путем.

К недостаткам данного способа можно отнести то, что при большой размерности задачи приходится хранить большую таблицу возможных значений для кодирования, что понижает защищенность информации. При небольшом количестве слов в текстовой информации высока вероятность успешного применения метода полного перебора и получения исходного сообщения.

Задача, на решение которой направлено предлагаемое изобретение, заключается в разработке надежного способа деперсонализации персональных данных, позволяющего повысить уровень безопасности ИСПДн на стадиях разработки и оптимизации путем перемешивания персональных данных, относящихся к различным субъектам и снизить требования к уровню защищенности данных, сократив, тем самым, соответствующие расходы.

Сущность изобретения заключается в перемешивании персональных данных, хранящихся в ИСПДн, относящихся к различным субъектам. Данный способ обладает следующими преимуществами: персональные данные хранятся в одной информационной системе и значительно снижается вероятность успеха контекстного анализа.

В качестве исходных данных рассматривается таблица персональных данных D(d₁, d₂, …, d_N), где N - число атрибутов, а M - число строк таблицы, множество данных A_i, относящееся к одному атрибуту - d_i(i=1, 2, …, N). Все элементы каждого множества пронумерованы.

Способ обеспечивает перемешивание данных каждого множества атрибутов исходной таблицы пошагово. На каждом шаге используется принцип циклических перестановок.

На первом шаге множество данных A_i, относящееся к одному атрибуту, разбивается на K_i (М>K_i>1) непересекающихся подмножеств, где число элементов подмножества A_ij равно M_ij(M>M_ij>1), j=1, 2, …, K_i. Разбиение каждого множества должно обладать следующими свойствами:

1) подмножества разбиения включают все элементы множества данных одного атрибута;

2) каждое подмножество не пусто, а пересечение любых двух подмножеств пусто;

3) все элементы в подмножествах упорядочены как по внутренним номерам (номера элементов внутри подмножества), там и по внешней нумерации самих подмножеств в разбиении;

4) суммарное число элементов всех подмножеств множества данных одного атрибута равно общему числу элементов этого множества.

Для каждого подмножества из разбиения определяется циклическая перестановка (подстановка) p_ij(r_ij), в которой производится циклический сдвиг всех элементов подмножества на некоторое число, называемое параметром перестановки. Таким образом, перестановки для всех подмножеств множества данных одного атрибута можно задать набором (вектором) параметров этих перестановок. Данный вектор задает первый уровень способа перемешивания, т.е. перестановки первого уровня.

На втором шаге способа рассматривается циклическая перестановка второго уровня p_0i(r_0i), элементами которой выступают подмножества, состоящие из K_i элементов, из описанного ранее разбиения. В результате применения данной перестановки производится циклический сдвиг элементов на некоторую величину - параметр перестановки второго уровня.

В результате последовательного проведения перестановок первого и второго уровней (или одной результирующей перестановки p_i(r_0i, r_i,)) получается перемешивание элементов множества данных одного атрибута так, что меняется нумерация этих элементов по отношению к исходной нумерации.

Доступность персональных данных (получение достоверных персональных сведений при легитимном обращении к ним) обеспечивается посредством решения обратного способа деперсонализации. Решением обратного способа деперсонализации является формирование исходной таблицы.

Для оценки защищенности предложенного способа деперсонализации используют такую характеристику, как число вариантов деперсонализации, получаемых при применении данного способа. При большом количестве записей число вариантов получается очень большим, что обеспечивает очень малую вероятность подбора параметров и соответственно хорошую защиту обезличенных данных.

В совокупности признаков заявленного способа используются следующие терминология и обозначения:

- запись в таблице - совокупность элементов множеств разных атрибутов с одинаковыми номерами, при этом в исходной таблице каждая запись имеет определенный смысл, связанный с конкретным субъектом (физическим лицом), т.е. содержит персональные данные конкретного лица, определенного в этой же записи;

- внешний номер m_ijk - номер элемента в подмножестве A_ij, имеющего внутренний номер k, 1≤m_ijk≤M, т.е. m_ijk - это порядковый номер элемента во множестве A_i, соответствующий элементу с внутренним номером k;

- циклическая перестановка первого уровня - перестановка, в которой элементы первой строки матрицы, стоящей в правой части равенства, соответствуют внутренним номерам элементов подмножества A_ij до перестановки (в исходной таблице), а элементы, стоящие во второй строке, соответствуют внутренним номерами элементов подмножества A_ij, стоящим на местах, с номерами, определенными в верхней строке, после перестановки:

$p_{i j} (r {}_{i j}) = ((M_{i j} - \overset{1}{r_{i j} + 1}) (M_{i j} - \overset{2}{r_{i j}} + 2) (M_{i j} - \overset{3}{r_{i j}} + 3) \overset{...}{...} \overset{(M_{i j} - 1) M_{ij}}{(M_{i j} - r_{i j} - 1) (M_{i j} - r_{i j})});$

- параметр перестановки первого уровня r_ij - некоторое случайное число, задаваемое генератором случайных чисел (ГСЧ) в интервале [1; M_ij-1];

- циклическая перестановка второго уровня - перестановка, в которой элементы верхней строки матрицы перестановки соответствуют исходным номерам подмножеств A_ij, а элементы нижней строки матрицы соответствуют номерам подмножеств A_ij, стоящим на местах с номерами, определенными в верхней строке, после перестановки:

$p_{0 i} (r {}_{0 i}) = ((K_{i} - \overset{1}{r_{0 i} + 1}) (K_{i} - \overset{2}{r_{0 i}} + 2) (K_{i} - \overset{3}{r_{0 i}} + 3) \overset{...}{...} \overset{(K_{i} - 1) K_{i}}{(K_{i} - r_{0 i} - 1) (K_{i} - r_{0 i})});$

- параметр перестановки второго уровня r_0i - некоторое случайное число, задаваемое генератором случайных чисел (ГСЧ) в интервале [1; K_i-1],

- результирующая перестановка - полученная с учетом правил перемножения перестановок первого и второго уровней перестановка, в которой верхняя строка матрицы содержит порядковые номера элементов множества атрибута i, в соответствии с их размещением в столбце после перестановок, а нижняя строка содержит внешние номера элементов множества этого атрибута, соответствующие их размещению в исходной таблице:

Применение данного способа позволяет обеспечить защиту персональных сведений от несанкционированного доступа, в том числе от компрометации информации при ее утечке по техническим каналам, а также обеспечить гарантированный доступ к персональным данным при легитимном обращении. При этом все персональные сведения хранятся в одной таблице, а их получение посредством контекстного анализа или путем перебора весьма трудоемко, а зачастую практически невозможно. Практическое применение данного способа является аналогом абонентского шифрования. Его реализация подразумевает, что персональные данные хранятся на постоянном запоминающем устройстве (ПЗУ) в деперсонализированном виде. При необходимости работы с персональными данными оператор применяет обратный алгоритм деперсонализации (запускает программу работы с персональными данными, реализующую прямой и обратный алгоритм). Следует отметить, что открытая (персонализированная) информация, с которой работает оператор, как правило, хранится в ОЗУ и только по завершении работы (или команде сохранения/синхронизации) записывается в файл в ПЗУ, где она хранится только в закрытом виде.

Эти отличительные признаки по сравнению с прототипом позволяют сделать вывод о соответствии заявляемого технического решения критерию «новизна».

Новое свойство совокупности существенных признаков, приводящих к существенному затруднению НСД к персональной информации, хранящейся и обрабатываемой в ИСПДн, путем перемешивания данных, относящихся к различным субъектам, позволяет сделать вывод о соответствии предлагаемого технического решения критерию «изобретательский уровень».

Предлагаемый способ защиты ПДн от НСД опробован в лабораторных условиях. Способ деперсонализации может быть реализован в виде программного обеспечения на языке программирования С#. Исходные данные могут подаваться на вход в виде текстового файла. Также возможна реализация, в которой данные на вход программы поступают непосредственно из информационной системы. Параметры разбиений исходных множеств данных могут задаваться как пользователем, так и программой, используя генератор случайных чисел (ГСЧ).

В результате работы программы пользователь получает деперсонализированные данные в той же форме, в которой они подавались на вход. Кроме того, создается файл, хранящий параметры перестановок и разбиений, который будут необходимы для решения обратного способа деперсонализации.

Для простоты описания работы устройства представим, что алгоритм перестановки, определенный для множества, соответствующего одному атрибуту, применяется ко всем множествам атрибутов исходной таблицы. В этом случае полный алгоритм перестановки задается следующим набором параметров:

1. (K₁, K₂, …, K_N) - множество, определяющее количество подмножеств для множества каждого атрибута, которое определяет подмножества элементов $(A_{11}, A_{12}, ... {, A}_{{1K}_{1}}), (A {}_{21}, A_{22}, ... {, A}_{{2K}_{2}}), ... {, (A}_{N1} {, A}_{N2}, ... {, A}_{{NK}_{N}})$ ;

2. $((M_{11}, M_{12}, ... {, M}_{{1K}_{1}}), (M {}_{21}, M_{22}, ... {, M}_{{2K}_{2}}), ... {, (M}_{N1} {, M}_{N2}, ... {, M}_{{NK}_{N}})$ - множество, определяющее число элементов в подмножествах для множества каждого атрибута;

3. ((r₀₁, r₁),(r₀₂, r₂), …, (r_0N, r_N)) - множество параметров перестановок для множества каждого атрибута. Этот набор задает параметры алгоритма деперсонализации для исходной таблицы D(d₂, d₂, …, d_N).

В результате применения процедуры вместо исходной таблицы D(d₂, d₂, …, d_N) получается таблица обезличенных данных $\tilde{D} (d_{1}, d_{2}, ... {, d}_{N})$ .

Набор параметров:

C(D(d₁,d₂, …, d_N))={(K₁, K₂,_…,K_N),

$((M_{11}, M_{12}, ... {, M}_{{1K}_{1}}), (M {}_{21}, M_{22}, ... {, M}_{{2K}_{2}}), ... {, (M}_{N1} {, M}_{N2}, ... {, M}_{{NK}_{N}})$ ,

((r₀₁, r₁), (r₀₂, r₂), …, (r_0N, r_N))}

полностью и однозначно задает алгоритм деперсонализации для исходной таблицы D(d₁, d₂, …, d_N).

Пусть исходная таблица D(d₁, d₂, …, d_N) имеет вид (таблица 1):

Таблица 1 Исходная таблица данных Атрибут d₁ Атрибут d₂ Атрибут d₃ Атрибут d₄ Атрибут d₅ Атрибут d₆ q₁ r₁ s₁ t₁ u₁ ν₁ q₂ r₂ s₂ t₂ u₂ ν₂

Атрибут d₁ Атрибут d₂ Атрибут d₃ Атрибут d₄ Атрибут d₅ Атрибут d₆ q₃ r₃ s₃ t₃ u₃ ν₃ q₄ r₄ s₄ t₄ u₄ ν₄ q₅ r₅ s₅ t₅ u₅ ν₅ q₆ r₆ s₆ t₆ u₆ ν₆ q₇ r₇ s₇ t₇ u₇ ν₇ q₈ r₈ s₈ t₈ u₈ ν₈ q₉ r₉ s₉ t₉ u₉ ν₉ q₁₀ r₁₀ s₁₀ t₁₀ u₁₀ ν₁₀

Для этой таблицы заданы следующие параметры алгоритма деперсонализации:

C(D(d₁, d₂, d₃, d₄, d₅, d₆))

={(3,2,4,3,3,2), ((3,3,4), (6,4), (2,3,2,3), (3,4,3), (5,2,3), (3,7)),

((2, (1,2,3)), (1, (3,1)), (3, (1,2,1/1)), (2, (2,1,2)), (2, (4,1,1)), (1, (1/4)))}.

После выполнения алгоритма деперсонализации получаем таблицу 2 - $\tilde{D} (d_{1}, d_{2}, ... {, d}_{N})$ .

Таблица 2 Таблица обезличенных данных Атрибут d₁ Атрибут d₂ Атрибут d₃ Атрибут d₄ Атрибут d₅ Атрибут d₆ q₁₀ r₈ s₉ t₁₀ u₉ ν₈ q₇ r₉ s₁₀ t₈ u₁₀ ν₉ q₈ r₁₀ s₈ t₉ u₈ ν₁₀ q₉ r₇ s₂ t₃ u₅ ν₄ q₂ r₄ s₁ t₁ u₁ ν₅ q₃ r₅ s₅ t₂ u₂ ν₆

Атрибут d₁ Атрибут d₂ Атрибут d₃ Атрибут d₄ Атрибут d₅ Атрибут d₆ q₁ r₆ s₃ t₅ u₃ ν₇ q₆ r₁ s₄ t₆ u₄ ν₂ q₄ r₂ s₇ t₇ u₇ ν₃ q₅ r₃ s₆ t₄ u₆ ν₁

Как видно из примера, в результате применения алгоритма деперсонализации получена преобразованная таблица, в которой записи не соответствуют записям в исходной таблице, что обеспечивает достаточно высокую сложность восстановления исходной таблицы при отсутствии сведений о параметрах алгоритма деперсонализации.

Реализация предлагаемого способа не вызывает затруднений, так как блоки и узлы общеизвестны и широко описаны в технической литературе.

Таким образом, заявляемый способ деперсонализации персональных данных позволяет повысить уровень безопасности ИСПДн на стадиях разработки и оптимизации путем перемешивания персональных данных, относящихся к различным субъектам и снизить требования к обеспечению надлежащего уровня защищенности данных, сократив, тем самым, соответствующие расходы.

Источники информации

1. Патент RU №2309450 «Способ защиты от несанкционированного доступа к информации пользователя в системе обработки информации». G06F 12/14, дата приоритета 26.04.2006, дата публикации 27.10.2007.

2. Патент RU №2439693 «Способ защиты текстовой информации от несанкционированного доступа» МПК G06F 21/24, дата приоритета 04.06.2010, дата публикации 10.01.2012.

3. Куракин А.С. Алгоритм деперсонализации персональных данных // Научно-технический вестник информационных технологий, механики и оптики. СПб НИУ ИТМО, 2012. Выпуск №6.

4. Стенли Р. Перечислительная комбинаторика. М.: Мир, 1990. 440 с.

Реферат патента 2015 года СПОСОБ ДЕПЕРСОНАЛИЗАЦИИ ПЕРСОНАЛЬНЫХ ДАННЫХ

Изобретение относится к области защиты информации, хранимой в информационных системах персональных данных (ИСПДн), от несанкционированного доступа (НСД) и может быть использовано на стадиях разработки и оптимизации ИСПДн в защищенном исполнении. Техническим результатом является повышение уровня безопасности ИСПДн. Способ деперсонализации персональных данных обеспечивает защиту ИСПДн от НСД на стадиях разработки и оптимизации, оперирует персональными данными субъектов, хранящимися и обрабатываемыми в ИСПДН, и осуществляет двухэтапное перемешивание данных, относящихся к разным субъектам, используя перестановки первого и второго уровней, при этом на первом этапе исходное множество данных D(d₁, d₂, …, d_N), где N - число атрибутов, разбивается на непересекающиеся подмножества данных A_i, относящихся к одному атрибуту d_i, а на втором этапе происходит непосредственно перестановка данных сначала внутри подмножеств A_i и затем элементами перестановки являются сами подмножества. При росте количества субъектов ПДн уменьшается вероятность подбора параметров деперсонализации, соответственно повышается защищенность ИСПДн. Разбиение исходного множества данных на подмножества позволяет сократить размерность задачи и упростить ее практическую реализацию. 1 з.п. ф-лы, 2 табл.

Формула изобретения RU 2 538 913 C2

1. Способ деперсонализации персональных данных, заключающийся в производимом при передаче в оперативное запоминающее устройство преобразовании информации, составляющей по совокупности персональные данные, из постоянного запоминающего устройства путем выполнения двухэтапного перемешивания данных, относящихся к разным субъектам, используя перестановки первого и второго уровней, при этом на первом этапе исходное множество данных D(d₁,d₂,…,d_N), где N - число атрибутов, разбивается на непересекающиеся подмножества данных A_i, относящихся к одному атрибуту d_i, и на втором этапе происходит непосредственно перестановка данных сначала внутри подмножеств A_i, а затем элементами перестановки являются сами подмножества; для представления ее пользователю и обратном преобразовании информации при ее записи - передаче из оперативного запоминающего устройства в постоянное запоминающее устройство.

2. Способ по п.1, отличающийся тем, что параметры разбиений исходных множеств данных задаются при помощи генератора случайных чисел.

Документы, цитированные в отчете о поиске Патент 2015 года RU2538913C2

СПОСОБ ЗАЩИТЫ ТЕКСТОВОЙ ИНФОРМАЦИИ ОТ НЕСАНКЦИОНИРОВАННОГО ДОСТУПА	2010	Минаков Владимир Александрович Мирошников Вячеслав Викторович Толстихин Геннадий Николаевич	RU2439693C1
СПОСОБ ЗАЩИТЫ ЧАСТНОЙ ИНФОРМАЦИИ ПОЛЬЗОВАТЕЛЯ В СИСТЕМЕ ОБРАБОТКИ ИНФОРМАЦИИ	2006	Артамонов Сергей Евгеньевич Беспалов Владимир Александрович Веселов Владимир Фёдорович Козлов Владимир Алексеевич Кучеров Алексей Николаевич Путря Михаил Георгиевич Чаплыгин Юрий Александрович	RU2309450C1
УСТРОЙСТВО ЗАЩИТЫ ОТ НЕСАНКЦИОНИРОВАННОГО ДОСТУПА К ИНФОРМАЦИИ, ХРАНИМОЙ В ПЕРСОНАЛЬНОЙ ЭВМ	2003	Бородакий Ю.В. Добродеев А.Ю. Свиридюк Ю.П. Терешкин Н.Л.	RU2263950C2
US 7975149 B2, 05.07.2011
US 8074283 B2, 06.12.2011

RU 2 538 913 C2

Авторы

Куракин Александр Сергеевич

Даты

2015-01-10—Публикация

2012-10-16—Подача

название	год	авторы	номер документа
Способ деперсонализации персональных данных	2016	Ноздрина Анастасия Александровна Спеваков Александр Геннадьевич Применко Дмитрий Владимирович	RU2636106C1
Способ обезличивания персональных данных	2021	Саксонов Евгений Александрович Шередин Роман Валериевич	RU2780957C1
Быстродействующее устройство формирования уникальной последовательности, используемой при обезличивании персональных данных	2016	Спеваков Александр Геннадьевич Плугатарев Алексей Владимирович	RU2665899C1
СПОСОБ МЯГКОГО ДЕКОДИРОВАНИЯ БЛОКОВЫХ КОДОВ	2015	Гладких Анатолий Афанасьевич	RU2580797C1
СПОСОБ РАЗМЕЩЕНИЯ ДАННЫХ В RAID-МАССИВАХ ДЛЯ СБАЛАНСИРОВАННОГО РАСПРЕДЕЛЕНИЯ НАГРУЗКИ ВО ВРЕМЯ ВОССТАНОВЛЕНИЯ МАССИВА	2024	Васенина Анна Игоревна Левицкий Иван Максимович Смирнов Дмитрий Сергеевич	RU2835373C1
СПОСОБ СЖАТИЯ И ВОССТАНОВЛЕНИЯ ДАННЫХ БЕЗ ПОТЕРЬ	2009	Муллов Сергей Борисович	RU2403677C1
Система защиты персональных данных пользователей в информационной системе на основании деперсонализации и миграции в безопасное окружение	2017	Михальский Олег Олегович	RU2698412C2
Система деперсонализации и миграции персональных данных пользователей на веб-сайтах на основе технологии резервного копирования	2018	Михальский Олег Олегович	RU2731110C2
СПОСОБ ФОРМИРОВАНИЯ S-БЛОКОВ С МИНИМАЛЬНЫМ КОЛИЧЕСТВОМ ЛОГИЧЕСКИХ ЭЛЕМЕНТОВ	2014	Борисенко Николай Павлович Васинев Дмитрий Александрович Хоанг Дык Тхо	RU2572423C2
БЫСТРОДЕЙСТВУЮЩИЙ ГЕНЕРАТОР СЛУЧАЙНЫХ ПЕРЕСТАНОВОК И СОЧЕТАНИЙ	2010	Сотов Леонид Сергеевич	RU2427885C1