ОБЛАСТЬ ТЕХНИКИ

[0001] Заявленное техническое решение относится к автоматизированному способу и системе автоматической полиграфической проверки с помощью алгоритмов машинного обучения.

УРОВЕНЬ ТЕХНИКИ

[0002] Классические полиграфические скрининги регулярно используются значимыми предприятиями такими как банки, правоохранительные структуры и федеральные органы власти. Основное беспокойства научных сообществ заключается в том, что эти скрининги склонны к содержанию ошибок. Однако эти ошибки могут быть следствием не только метода, но и человека (полиграфолога).

[0003] Безопасность клиентских денег и данных (например, транзакций) заложена в основе банковской культуры и репутации. В качестве одного из инструментов защиты клиентов, только с согласия кандидатов и сотрудников, и в соответствии с законодательством, банк использует полиграфические скрининги (ПС). Они применяются при найме кандидатов на рисковых направлениях, чтобы предотвратить наем ненадежного человека. Чтобы обнаружить нарушение, сотрудники на особо рисковых позициях регулярно проходят проверку. ПС включает следующие темы: наркотические вещества, зависимость от азартных игр, инсайдерская торговля, разглашение конфиденциальной информации, взяточничество, коррупция, незаконные присвоение средств и мошенничество. Финансовая отрасль - не единственная, использующая ПС; другие примеры - такие важные отрасли, как авиация, промышленность и правоохранительные структуры во всем мире [1,2].

[0004] Классический полиграф - это устройство, записывающее сердечно-сосудистую активность (такую как сердечный пульс), грудное и брюшное дыхание, гальваническая реакция кожи (электрическая активность кожи или ЭАК) и дрожь. Полиграфолог задает вопросы испытуемому, на которые получает ответы «да» или «нет». Обзоры классического полиграфа и методологии построения вопросов представлены в [3, 4, 5].

[0005] Нетрадиционные исследования обнаружения лжи используют анализ видео и аудио [6] (включая мимику лица [7, 8], реакцию зрачка [9] и задержку между вопросом и ответом [10]), электромиографию (ЭМГ) [11], электроэнцефалографию (ЭЭГ) [12], магнитно-резонансную томографию [13, 14] или письменные последовательности (динамика нажатия клавиш) [15] в дополнение к классическим полиграфическим данным.

[0006] Некоторые из этих исследований даже получили возможность на освоение новой области, так детектор лжи iBorderCtrl тестируется в европейских аэропортах [16, 17] или VeriPol применяется испанской полицией на делах о страховых требованиях [18, 19]. Классический полиграф остается инструментом выбора в традиционных задачах как скрининг при найме и уголовные или внутренние расследования.

[0007] Полиграф имеет длинную историю критики от ученых из области психологии и права, а также и со стороны общества и правительства [1, 23]. Основная обеспокоенность заключается в том, что эта методика надежно не определяет ложь и правду. И все же «парадоксально, хотя Конгресс выражает глубокое беспокойство по поводу эффективности данной технологии, ЕРРА разрешает использование детекторов лжи в случае, если точность результата имеет первостепенное значение: национальная оборона, безопасность и законные текущие расследования» [22].

[0008] Критика данной методики предоставляет много аргументов, почему полиграфический скрининг может потерпеть неудачу при обнаружении лжи или отметить правду как ложь. Например, «Полиграфические тестирования оценивают не обман, а ситуации, которые построены так, чтобы вызвать и оценить страх» [24].

[0009] Правдивый младший менеджер может бояться, что его назовут коррупционером больше, чем хладнокровный старший менеджер боится быть пойманным на лжи полиграфологом. Еще один пример конструктивной критики - призыв к стандартизации процедуры полиграфического скрининга и обучения полиграфолога [25]. Ошибки полиграфолога могут происходить, например, когда полиграфолог неопытен, уставший, отвлечен или предвзят [26].

[0010] Существует простое решение проверки качества: всегда проводить проверку еще одним полиграфологом, который подтвердит или опровергнет заключение предыдущего полиграфолога [27]. Чтобы провести проверку полиграфического отчета, другому полиграфологу требуется пересмотреть запись скрининга, включающую полиграмму (графическое представление данных с датчиков, связанных с вопросами полиграфолога и ответами испытуемого), иногда аудио- и видеозапись и сравнить его заключение с оригинальным. Данная проверка занимает минимум половину времени от скрининга. Стандартный скрининг длится минимум два часа. Таким образом, повторная проверка стоит и времени, и денег. По этой причине, отделения внутренней безопасности проводят повторные проверки редко или не проводят их вообще. Другая причина, по которой проверки вторым полиграфологом могут быть не эффективны: второй полиграфолог может допустить ту же самую ошибку, которую допустил оригинальный полиграфолог.

[0011] Общим недостатком существующих решений в данной области является присутствие человеческого фактора при полиграфической проверке, что негативно сказывается на точности и скорости проверки, а также отсутствие автоматизированного процесса повторной проверки.

РАСКРЫТИЕ ИЗОБРЕТЕНИЯ

[0012] В заявленном техническом решении предлагается новый подход, к автоматической полиграфической проверке с использованием моделей машинного обучения (МО).

[0013] Эффективность данного решения подтверждается существенным приростом точности и скорости проведения автоматической полиграфической проверки.

[0014] Таким образом, решается техническая проблема точной и скоростной автоматической полиграфической проверки.

[0015] Техническим результатом, достигающимся при решении данной проблемы, является повышение точности полиграфической проверки.

[0016] Дополнительным техническим результатом, достигающимся при решении данной проблемы, является повышение скорости полиграфической проверки.

[0017] Также дополнительным техническим результатом, достигающимся при решении данной проблемы, является автоматизация процесса полиграфической проверки.

[0018] Указанные технические результаты достигается благодаря осуществлению компьютерно-реализуемого способа автоматической полиграфической проверки, выполняемый с помощью вычислительной системы, содержащей по меньшей мере три ансамбля моделей машинного обучения, при этом способ выполняет этапы, на которых:

- получают записи полиграфических проверок, содержащие по меньшей мере сигналы датчиков с временными шкалами, на которых промаркированы начало и конец вопроса;

- получают дополнительные данные, содержащие по меньшей мере возраст проверяемого, пол, должностную информацию;

- осуществляют обработку полученных сигналов с помощью первого ансамбля моделей МО, обученного на одной теме, причем в ходе указанной обработки осуществляется:

обработка сигналов первой моделью МО в ходе которой выполняется:

определение временных интервалов для извлечения переменных на основе временных меток начала и конца вопроса и временной метки ответа, и на основе типа и темы вопроса;

извлечение переменных из каждого сигнала на определенных временных интервалах;

обработка полученных переменных из сигналов, при которой выполняется нормализация и конкатенация обработанных переменных и построение на их основе вектора;

подача упомянутого вектора в 1-ю модель МО для получения выходного значения 1-й модели МО;

передача выходного значения 1-й модели МО на вход 2-й модели МО;

с помощью второй модели МО осуществляют обработку выходного значения 1-й модели МО, и дополнительных данных, причем в ходе указанной обработки осуществляется:

разделение дополнительных данных на категориальные и численные переменные;

обработка полученных переменных из дополнительных данных, при которой выполняется векторизация категориальных переменных и нормализация численных переменных;

конкатенация обработанных дополнительных переменных, а также выходного значения 1-й модели МО, и построение на их основе вектора;

подача упомянутого вектора во 2-ю модель МО для получения выходного значения 2-й модели МО;

подача выходного значения 2-ой модели МО в третью модель МО, для формирования выходного значения первого ансамбля;

- осуществляют обработку полученных сигналов с помощью второго ансамбля моделей МО, обученного на комбинации тем, причем в ходе указанной обработки осуществляется: