Область техники, к которой относиться изобретение

Предполагаемое изобретение относится к области информационной безопасности цифровых сетей передачи данных и может быть использовано для защиты отдельных компьютеров в сети и корпоративных сетей от компьютерных атак типа отказ в обслуживании.

Уровень техники

Целью атак типа «отказ в обслуживании» (DoS/DDoS атак) является перегрузка сервера, сети или приложений для того, чтобы замедлить или полностью прекратить обслуживание легитимных пользователей. Такие атаки обычно направлены на исчерпание ресурсов сети или сервера. Для реализации такой атаки, злоумышленник может использовать широкий спектр приемов. Отказ в обслуживании может быть вызван как большим потоком трафика, так и с помощью эксплуатации уязвимостей некоторых сетевых протоколов. Для усиления и усложнения противодействия такому типу атак, злоумышленник может использовать различные методы.

Одним из способов усиления атаки является использование распределенной бот-сети. В случае такой распределенной атаки, количество источников атаки достаточно большое, что затрудняет блокировку такого вида атак и увеличивает общую интенсивность трафика атаки.

Для генерации большого потока трафика не всегда требуется наличие большой распределенной бот-сети. Усиление атаки может производиться за счет техники отражения атаки. Например, злоумышленник может отправить определенный запрос небольшого размера на DNS сервер, при этом ответ сервера будет значительно больше. Если злоумышленник подменит IP-адрес источника в своем запросе на адрес целевого сервера, тогда и ответ с DNS сервера будет отправлен на этот целевой сервер.

Подмена адреса источника может использоваться и в других техниках для реализации подобных атак. Например, злоумышленник может изменять адреса источника атаки на адреса из внутренней сети или другие адреса легитимных пользователей.

Также интенсивность атаки типа отказ в обслуживании не всегда является стационарной. Могут использовать атаки с нарастающей активностью. Таким образом, если способ противодействия основан на вычислении пороговых значений, тогда атака будет заблокирована не сразу, а только в момент, когда интенсивность атаки возрастет настолько, что будет превышать заданные пороговые значения.

Известен способ обнаружения DDoS атак (международная заявка на изобретение CN 107864155, приоритет от 12.12.2017). Способ предполагает сбор сетевого трафика и агрегирование параметров трафика с учетом IP-адресов, пакетов и портов. Таким образом вычисляется ряд статистических характеристик в единичном интервале. Если происходит превышение установленного порогового значения, тогда формируется отчет об атаке. Определение цели атаки и атакующих IP-адресов производится с помощью ранжирования активности. Адреса, на которые приходило наибольшее количество трафика, считаются целью атаки. Адреса, с которых поступало больше всего активности, считаются источником атаки.

Известный способ имеет следующие недостатки:

• уязвимость к распределенным атакам и техникам подмены IP-адресов, так-как источник атаки в таких случаях может определяться некорректно;

• уязвимость к атакам с нарастающей активностью, так-как отчеты об атаке формируются при превышении установленного порога активности;

• уязвимость к отраженным атакам, так как сервер, используемый для отражения атаки, может активно использоваться защищаемым сервером, тогда блокировка трафика с такого сервера может повлечь некорректную работу или отказ в обслуживании целевого сервера.

Известен также способ обнаружения компьютерных атак (патент РФ №2683631, приоритет от 08.12.2017 г.). Способ заключается в том, что

• устанавливают и запоминают пороговые значения параметров, рассчитываемых в единицу времени,

• принимают из сети последовательность пакетов сообщений,

• запоминают принятые пакеты сообщений,

• выделяют из пакетов сообщений характеризующие их данные,

• рассчитывают значения параметров, зависящих от полученных пакетов сообщений,

• сравнивают рассчитанные значения параметров с пороговыми значениями,

• принимают решение о факте наличия или отсутствия компьютерной атаки при сравнении рассчитанных значений параметров с пороговыми значениями,

при этом

• предварительно задают необходимое число определяемых типов атак Z≥1, количество обучающих L и контрольных С примеров для каждого типа атак,

• определяют виды протоколов и необходимые параметры Fij, где i≤Z, требуемые для распознавания атак заданных типов и используют эти параметры в качестве характеризующих пакеты данных,

• задают структуру нейронной сети:

тип нейронной сети R,

количество скрытых слоев U,

количество нейронов во входном слое, скрытых слоях и выходном слое

таким образом, что число нейронов во входном слое N определяется количеством полей протоколов, необходимых для распознавания атак заданных типов, а число нейронов в выходном слое равно K,

• формируют необходимое количество обучающих примеров, представляющих собой векторы размерности N+K, где первые N элементов равны значениям определенных полей протоколов, а последние К равны нулю за исключением значения, соответствующего типу атаки, к которой относится данный элемент выборки, которое равно единице,

• задают требуемую достоверность распознавания D для нейронной сети,

• обучают нейронную сеть с использованием подготовленных примеров,

• завершают обучение нейронной сети после выполнения всех итераций генерации выборок или по достижении требуемой достоверности распознавания,

• при наличии компьютерной атаки определяют тип одиночной компьютерной атаки по сочетанию рассчитанных значений параметров Oj на основе следующих условий:

если значение, полученное только на одном из выходных нейронов, превысило пороговое значение, то определяют тип атаки Aj,

если значение, полученное на нескольких выходных нейронах, превысило пороговое значение, то тип атаки считают комбинированным и добавляют к типу атаки тип Aj.

В качестве нейронной сети для реализации способа была сформирована и обучена нейронная сеть типа многослойный персептрон и произведено ее обучение методом обратного распространения ошибки.

Необходимо отметить, что приводимая таблица результатов работы способа содержит значения точности обнаружения компьютерных атак, при этом термин "точность обнаружения", наиболее вероятно, употреблен не вполне корректно, соответственно, более понятным было бы, видимо, использование термина "доля обнаруженных атак" или, с учетом этого, вероятность обнаружения атак.

В способе используется ряд характеристик сети, рассчитываемых в единицу времени. Таким образом, в способе определяется наличие или отсутствие атаки одного из видов, используемых при обучении.

Однако, известный способ имеет ряд недостатков:

• относительно невысокая вероятность обнаружения распределенных атак, атак с техникой подмены IP-адреса источника атаки, отраженных атак и атак с нарастающей активностью,

• необходимость предварительного формирования значительного количество обучающих примеров для каждого вида атак,

• отсутствие возможности идентифицировать поток, относящийся к атаке.

Раскрытие изобретения

Техническим результатом является:

1) повышение вероятности обнаружения и защиты от разновидностей атак типа отказ в обслуживании с использованием подмены IP-адреса источника атаки, распределенных атак, отраженных атак и атак типа отказ в обслуживании с нарастающей активностью,

2) обеспечение возможности обнаружение конкретных пакетов и потоков, принадлежащих к атаке;

3) обеспечение возможности обучения нейронной сети только на легитимном трафике без необходимости подготовки размеченные данные для каждого вида атак.

Для этого предлагается способ обнаружения и противодействия атакам типа отказ в обслуживании с использованием вычислительной системы, подключенный к внешней цифровой сети передачи данных и локальной цифровой сети передачи данных и включающей, по крайней мере, один компьютер, который имеет установленную операционную систему и прикладные программы, позволяющие

• получать, обрабатывать и хранить многомерные данные сетевого трафика;

• обеспечивать формирование, функционирование и обучение нейронной сети типа автокодировщик;

• блокировать сетевые пакеты, проходящие из внешней цифровой сети передачи данных в локальную цифровую сеть передачи данных;

способ заключающийся в том, что:

• запускают компьютер в режиме контролируемой нормальной работы;

• создают таблицу характеристик сети, изначально заполненную нулевыми значениями;

• создают таблицу статистических характеристик сети, изначально заполненную нулевыми значениями;

• создают таблицу характеристик взаимодействий, изначальной пустую;

• создают таблицу статистических характеристик взаимодействий, изначально пустую;

• создают таблицу для обучения, изначально пустую;

• задают период Т1 для формирования таблиц параметров потоков;

• задают промежуток времени Т2>Т1 для формирования обучающей таблицы;

• принимают и обрабатывают данные из сетевых потоков;

• дополняют таблицу для обучения на протяжении всего промежутка времени Т2, для этого, с периодом Т1 выполняют следующие действия:

получают таблицу параметров потоков;

создают таблицу характеристик потоков, изначально пустую, с количеством строк, равным количеству строк в таблице параметров потоков и со столбцами для значений параметров потоков, характеристик сети и характеристик взаимодействий;

заполняют в таблице характеристик потоков столбцы параметров потоков значениями из столбцов таблицы параметров потоков;

вычисляют характеристики сети для таблицы параметров потоков;

сглаживают значения характеристик сети;

записывают сглаженные характеристики сети в таблицу характеристик сети;

записывают в таблице характеристик потоков значения характеристик сети из таблицы характеристик сети в столбцы для каждой из характеристик сети в виде набора одинаковых значений в каждой строке;

вычисляют значения статистических характеристик сети;

записывают значения статистических характеристик сети в таблицу статистических характеристик сети;

заполняют в таблице характеристик потоков значения в столбцах характеристик взаимодействий, выполняя следующие действия для каждой строки таблицы характеристик потоков:

определяют взаимодействие потока с помощью двух его IP-адресов, протокола и серверного порта;

если в таблице характеристик взаимодействий отсутствует взаимодействие, к которому относиться поток, тогда:

создают новое взаимодействие в таблице характеристик взаимодействий;

задают значения количества потоков, пакетов и байтов в секунду равными нулю в таблице характеристик взаимодействий;

задают значения количества пакетов и байтов равными количеству пакетов и байтов в рассматриваемом потоке;

иначе, если взаимодействие имеется в таблице характеристик взаимодействий, тогда:

вычисляют характеристики взаимодействия для рассматриваемого потока;

сглаживают значения характеристик взаимодействия;

задают момент времени последней активности взаимодействия равным времени появления потока;

записывают сглаженные значения характеристик взаимодействия в таблицу характеристик взаимодействий;

вычисляют статистические характеристики взаимодействия;

записывают значения статистических характеристик взаимодействия в таблицу статистических характеристик взаимодействий;

записывают в столбцы характеристик взаимодействий таблицы характеристик потоков значения из таблицы характеристик взаимодействий для рассматриваемого потока;

дополняют таблицу для обучения строками таблицы характеристик потоков;

• по завершению промежутка времени Т2 осуществляют оцифровку символьных значений в столбцах протокола и серверного порта в таблице для обучения;

• осуществляют оцифровку IP-адресов, путем разделения адреса на 4 значения по байтам в таблице для обучения;

• нормализуют в оцифрованной таблице для обучения значения в столбцах количества байт и пакетов, в восьми столбцах оцифрованных столбцов IP-адресов, характеристик сети, характеристик взаимодействий, а также в столбцах с количеством различных TCP флагов, получая нормализованную таблицу для обучения;

• формируют нейронную сеть типа автокодировщик, имеющую

размерность входного слоя и слоя на выходе равную количеству столбцов в нормализованной таблице для обучения,

один скрытый слой с размерностью меньшей, чем количество столбцов в нормализованной таблице для обучения;

• обучают нейронную сеть с использованием нормализованной таблицы для обучения, причем при обучении минимизируют ошибку реконструкции параметров потока R, которая вычисляется по формуле:

где n - количество столбцов в нормализованной таблице для обучения;

Y_i,j - значение i-ого столбца j-го потока в нормализованной таблице для обучения;

- реконструированное на выходе нейронной сети значение i-го столбца j-го потока в нормализованной таблице для обучения;

• формируют таблицу пороговых значений характеристик сети, изначально пустую;

• вычисляют пороговые значения для каждой характеристики сети TN_i по формуле:

где - оценка математического ожидания i-й характеристики сети из таблицы статистических характеристик сети;

- оценка среднеквадратического отклонения i-й характеристики сети из таблицы статистических характеристик сети;

• записывают пороговые значения характеристик сети в таблицу пороговых значений характеристик сети;

• вычисляют пороговые значения для каждой характеристики взаимодействия TC_i,j по формуле:

где - оценка математического ожидания i-й характеристики j-го взаимодействия из таблицы статистических характеристик взаимодействий;

- оценка среднеквадратического отклонения i-й характеристики j-го взаимодействия из таблицы статистических характеристик взаимодействий;

• записывают пороговые значения характеристик взаимодействий в таблицу пороговых значений характеристик взаимодействий;

• задают длительность промежутка времени для валидации Т3>Т1;

• создают одномерный массив значений средней ошибки реконструкции VR, изначально пустой;

• на протяжении всего промежутка времени Т3 с периодом Т1 выполняют следующие действия:

получают таблицу параметров потоков;

создают таблицу характеристик потоков, изначально пустую, с количеством строк, равным количеству строк в таблице параметров потоков и со столбцами для значений параметров потоков, характеристик сети и характеристик взаимодействий;

в таблице характеристик потоков, заполняют столбцы параметров потоков значениями из столбцов таблицы параметров потоков;

вычисляют характеристики сети для таблицы параметров потоков;

сглаживают значения характеристик сети;

записывают сглаженные характеристики сети в таблицу характеристик сети;

записывают в таблице характеристик потоков значения характеристик сети из таблицы характеристик сети в столбцы для каждой из характеристик сети в виде набора одинаковых значений в каждой строке;

вычисляют значения статистических характеристик сети;

записывают значения статистических характеристик сети в таблицу статистических характеристик сети;

заполняют значения в столбцах характеристик взаимодействий в таблице характеристик потоков, выполняя следующие действия для каждой строки таблицы характеристик потоков:

определяют взаимодействие потока с помощью двух его IP-адресов, протокола и серверного порта;

если в таблице характеристик взаимодействий отсутствует взаимодействие, к которому относиться поток, тогда:

создают новое взаимодействие в таблице характеристик взаимодействий;

задают значения количества потоков, пакетов и байтов в секунду равными нулю в таблице характеристик взаимодействий;

задают значения количества пакетов и байтов равными количеству пакетов и байтов в рассматриваемом потоке;

иначе, если взаимодействие имеется в таблице характеристик взаимодействий, тогда:

вычисляют характеристики взаимодействия для рассматриваемого потока;

сглаживают значения характеристик взаимодействия;

задают момент времени последней активности взаимодействия равным времени появления потока;

записывают сглаженные значения характеристик взаимодействия в таблицу характеристик взаимодействий;

вычисляют статистические характеристики взаимодействия; записывают значения статистических характеристик взаимодействия в таблицу статистических характеристик взаимодействий;

записывают в столбцы характеристик взаимодействий таблицы характеристик потоков значения из таблицы характеристик взаимодействий для рассматриваемого потока;

осуществляют оцифровку символьных значений в столбцах протокола и серверного порта в таблице характеристик потоков;

осуществляют оцифровку IP-адресов, путем разделения адреса на 4 значения по байтам в таблице характеристик потоков;

нормализуют в оцифрованной таблице характеристик потоков значения в столбцах количества байт и пакетов, в восьми столбцах оцифрованных столбцов IP-адресов, характеристик сети, характеристик взаимодействий, а также в столбцах с количеством различных TCP флагов;

получают валидационную таблицу после нормализации оцифрованной таблицы характеристик потоков;

подают на вход автокодировщика валидационную таблицу;

вычисляют среднюю ошибку реконструкции MR по формуле

где n - количество столбцов в валидационной таблице;

m - количество потоков в валидационной таблице;

Y_i,j - значение i-ого параметра j-го потока в валидационной таблице;

- реконструированное на выходе нейронной сети значение i-ого параметра j-ого потока в валидационной таблице;

дополняют массив VR значением MR;

• вычисляют пороговое значение NT для массива VR;

• задают промежуток времени актуальности пороговых значений Т4>Т1;

• задают промежуток времени неактивности взаимодействия Т5>Т1;

• задают промежуток времени блокировки взаимодействия Т6>Т1;

• задают промежуток времени для обнаружения и противодействия атакам Т7>Т1;

• на протяжении всего промежутка времени для обнаружения и противодействия атакам Т7 с периодом Т1 выполняют следующие действия:

этап А: получают таблицу параметров потоков;