ОБЛАСТЬ ИЗОБРЕТЕНИЯ
Изобретение относится к области поддержки принятия клинических решений, где значение оценки риска тромбоза для пациента вычисляют на основе специфичных для пациента входных признаков.
ПРЕДПОСЫЛКИ ИЗОБРЕТЕНИЯ
Компьютерные системы поддержки принятия клинических решений (CDSS) определяют как «любое программное обеспечение, разработанное для того, чтобы непосредственно помогать при принятии клинических решений, в которых характеристики отдельных пациентов сопоставляют с компьютерной базой знаний с целью генерации специфичных для пациента оценок или рекомендаций, которые затем представляют клиницистам для рассмотрения и принятия решения». Системы поддержки принятия клинических решений получили поддержку благодаря их потенциалу повышать качество здравоохранения посредством поддержки принятия клинических решений.
Тромбоз глубоких вен представляет собой широко распространенную проблему в западном мире. Большая часть популяции имеет повышенный риск тромбоза, например, престарелые, путешественники и пациенты, которые подвергаются ортопедическим хирургическим вмешательствам. Людям, подверженным риску, можно назначать превентивное лечение антикоагулянтами, но риск кровотечения (1-3% в год), а также издержки и неудобство говорят против этого. Следовательно, желательно иметь более специфичную для пациента меру для того, чтобы оценивать персональный риск тромбоза и облегчать информированный выбор проходить лечение или нет. К сожалению, при существующих клинических способах скрининга и доступных способах нелегко распознать индивидуумов с высоким риском, которые должны принимать антикоагулянты, и точно прогнозировать события. Одна из основных причин того, что это продолжает иметь место, состоит в том, что подавляющее большинство пациентов, которые страдают тромбозом, без очевидных генетических дефектов, имеют системы свертывания крови, которые клинически не идентифицируют как анормальные посредством стандартных инструментов скрининга и анализов факторов. Идентификация индивидуумов, которые подвержены риску венозного тромбоза, представляет собой область исследований, которая может извлечь пользу из инновационных технических способов.
Неопределенность в отношении специфичного для пациента риска тромбоза влечет излишние тромбозы у пациентов с высоким риском (тромбоза), которые не получают лечение антикоагулянтами. С другой стороны, эта неопределенность может вести к кровотечению у пациентов с относительно низким риском, которые получают ненужное лечение антикоагулянтами. Большинство стандартных систем поддержки принятия клинических решений выполнено с возможностью оценивать риск тромбоза на основе множества клинических факторов риска. Идентифицировано множество клинических факторов риска, таких как неподвижность и использование контрацептивов (для пациентов без очевидных генетических дефектов), но этого не достаточно для целей скрининга. На практике, как описано в Durieux et al.: «A Clinical Decision Support System for Prevention of Venous Thromboembolism», используют руководства на основе клинических факторов риска. По сравнению со стратификацией на основе клинических факторов риска, принципиально другой подход раскрыт в US 2009/0298103 A1, где одно моделирование измерения на основе белка, т.е. анализа образования тромбина, связано с риском тромбоза. В US2009/0089079 раскрыт способ определения того, нужно ли выдавать предупреждение рассмотреть профилактику с учетом риска тромбоза субъекта на основе клинических факторов риска субъекта, Penco et al. (2005), Assessment of the role of genetic polymorphism in venous thrombosis through artificial neural networks. Annals of Human Genetics 69:693-706, раскрыто исследование, в котором используют связь между событиями тромбоза вен и мультилокусным генотипом с использованием свойств искусственных нейронных сетей. В Haan et al. (2012). Multiple SNP testing improves risk prediction of first venous thrombosis, Blood 120:656-663 раскрыт способ прогнозирования риска первого венозного тромбоза на основе комбинации генетических маркеров и клинических факторов риска. Novis et al. (2010). В Prevention of thromboembolic events in surgical patients through the creation and implementation of a computerized risk assessment program. Journal of Vascular Surgery 51:648-654 раскрыт способ предотвращения развития тромбоза на основе клинических факторов риска. Однако приведенные выше подходы не достаточно специфичны для скрининга тромбоза, поскольку при использовании способов, доступных в настоящее время, число ошибочно классифицированных пациентов все еще остается высоким.
СУЩНОСТЬ ИЗОБРЕТЕНИЯ
Цель изобретения состоит в том, чтобы предоставить систему поддержки принятия клинических решений с увеличенной точностью для персональной специфичной оценки риска тромбоза.
Эту цель достигают посредством аппарата по п. 1, способа по п. 9 и посредством компьютерного программного продукта по п. 15. Соответственно, комбинируют два принципиально различных подхода на основе клинических факторов риска и молекулярных маркеров. Создание этой предложенной комбинации не является очевидным и требует значительных усилий в подходах на основе машинного обучения и на основе данных. Выбирают наименьший набор факторов риска и концентраций белка, которые вместе имеют оптимальное прогностическое значение для риска тромбоза, и создают численный алгоритм, который переводит числовое значение выбранных факторов и концентраций в одно числовое значение, точно определяющее риск тромбоза. Тем самым, точность персональной специфичной оценки риска тромбоза может быть значительно повышена , в частности, в подгруппе пациентов с повышенным риском с использованием по меньшей мере одного известного присутствующего клинического фактора риска. Эта подгруппа содержат (среди прочих) пациентов, которые госпитализированы, беременны или используют (начинают использовать) пероральные контрацептивы и, таким образом, получают внимание врача. В этом контексте предложенное решение помогает врачу стратифицировать пациентов, у которых лечат или исследуют состояния, о которых известно, что они повышают риск тромбоза, на категории с высоким и низким риском. В частности, предложенное решение можно использовать для того, чтобы принять решение, для каждого пациента, вводить ли лечение антикоагулянтами или нет, основываясь на оценочном риске тромбоза.
Здесь подразумевают, что термин «молекулярный маркер» включает какое-либо использование присутствия или концентрации биологической молекулы или части биологической молекулы, например, белка или полинуклеиновой кислоты в качестве индикатора фенотипа пациента. Такое присутствие или концентрацию можно измерять непосредственно, например, в образце крови или ткани или в качестве (возможно, динамического) измерения молекулы в функциональном тесте, например, количественной полимеразной цепной реакции (ПЦР) в реальном времени или анализе образования тромбина.
Согласно первому аспекту, по меньшей мере одну концентрацию белка можно выбирать из концентрации фактора свертывания FVIII в крови, концентрации фактора свертывания FXI в крови и концентрации фактора свертывания TFPI в крови. На основе массивов данных о пациентах, получаемых в клинических исследованиях, выяснилось, что эти типы концентраций белка служат в качестве надежных индикаторов риска тромбоза.
Согласно второму аспекту, который можно комбинировать с упомянутым выше первым аспектом, по меньшей мере один клинический фактор риска можно выбирать из иммобилизации в течение первого предварительно определяемого периода времени, хирургического вмешательства в течение второго предварительно определяемого периода времени, семейного анамнеза венозного тромбоза, беременности или послеродового периода в течение третьего предварительно определяемого периода времени, текущего использования эстрогенов и ожирения. В конкретном примере первый предварительно определяемый период времени может соответствовать по меньшей мере трем месяцам, второй предварительно определяемый период времени может соответствовать одному месяцу и третий предварительно определяемый период времени может соответствовать по меньшей мере трем месяцам. Эти клинические факторы риска выбирают на основе вышеупомянутых массивов данных о пациентах из конкретного клинического исследования в качестве наиболее надежных в комбинации с вышеупомянутыми конкретными концентрациями белка.
Согласно третьему аспекту, который можно комбинировать вышеупомянутым первым или вторым аспектом, значение оценки риска тромбоза можно сравнивать с предварительно определяемым пороговым значение для того, чтобы классифицировать значение оценки на основе результата сравнения. Тем самым, классификация пациентов по группам с предварительно определяемыми уровнями риска, например, высоким и низким риском тромбоза может поддерживать принятие решения клиницистом.
Согласно конкретной реализации третьего аспекта, пользователю могут позволять вводить или деактивировать предварительно определяемое пороговое значение. Тем самым, механизм поддержки принятия решений можно адаптировать на основе потребностей пользователя (т.е. клинициста).
Согласно четвертому аспекту, который можно комбинировать с любым одним из вышеуказанных с первого до третьего аспектов, может быть предусмотрен механизм оптимизации для применения процесса обучения через процедуру оптимизации на основе массива данных, хранимого в базе данных, чтобы минимизировать ошибку прогнозирования. Это делает возможной непрерывную адаптацию механизма поддержки принятия клинических решений к новым массивам данных новых пациентов или к конкретным массивам данных отдельных пациентов.
Согласно конкретной реализации четвертого аспекта, массив данных можно разделять на обучающий набор, валидационный набор и тестовый набор, где обучающий набор и валидационный набор можно использовать для того, чтобы выбирать тип функции машинного обучения и набор параметров модели, используемых для оптимизации классификаторов, где оптимизированные классификаторы можно использовать для получения специфичных для пациента входных признаков и где тестовый набор можно использовать для мониторинга значения оценки для пациентов из тестового набора на основе получаемых входных признаков. Эта мера делает возможной специфичную подгонку входных признаков системы поддержки принятия клинических решений к набору данных, получаемому от конкретной группы пациентов, чтобы тем самым дополнительно увеличивать надежность оценки риска.
Согласно другому варианту осуществления, упомянутый процессор выполнен с возможностью вычислять показатель риска тромбоза глубоких вен (DVT), представляющий значение оценки риска тромбоза у пациента, на основе клинических факторов риска, однонуклеотидных полиморфизмов (SNP) и уровней белков. Этот показатель риска DVT показывает значительное улучшение в отношении чувствительности/специфичности по сравнению с известными способами, которые вычисляют показатель риска DVT без использования уровней белков.
Следует отметить, что аппарат можно реализовать в виде отдельной схемы аппаратного обеспечения с отдельными компонентами аппаратного обеспечения, в виде интегрированной микросхемы, в виде компоновки микросхемных модулей или в виде устройства или микросхемы обработки сигнала, управляемой подпрограммой или программой программного обеспечения, сохраненной в памяти, записанной на машиночитаемом носителе информации или загруженной из сети, такой как интернет.
Следует понимать, что аппарат по п. 1, способ по п. 9 и компьютерный программный продукт по п. 15 имеют схожие и/или идентичные предпочтительные варианты осуществления, в частности, как определено в зависимых пунктах формулы изобретения.
Следует понимать, что предпочтительный вариант осуществления изобретения также может представлять собой какую-либо комбинацию зависимых пунктов формулы изобретения с соответствующим независимым пунктом формулы изобретения.
Эти и другие аспекты изобретения видны из и разъяснены со ссылкой на варианты осуществления, описанные далее в настоящем документе.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
На чертежах:
на фиг. 1 представлена схематическая блочная диаграмма системы поддержки принятия клинических решений согласно различным вариантам осуществления;
на фиг. 2 представлена блок-схема процедуры оценки риска согласно первому варианту осуществления;
на фиг. 3 представлена блок-схема процедура оптимизации классификатора согласно второму варианту осуществления;
на фиг. 4 приведено схематическое представление пользовательского интерфейса согласно третьему варианту осуществления;
на фиг. 5A и 5B, соответственно, представлена рабочая характеристика приемника (ROC) плюс 95% доверительная область для тромбоза, спрогнозированного с помощью способа опорных векторов с использованием только клинических факторов риска в качестве входных данных, и ROC-характеристика плюс 95% доверительная область для тромбоза, спрогнозированного с помощью классификатора с использованием клинических факторов риска и концентраций белка в качестве входных данных; и
на фиг. 6A и 6B, соответственно, представлена ROC плюс 95% доверительная область для тромбоза, спрогнозированного в подгруппе пациентов с присутствующим одним или несколькими известными клиническими факторами риска, с помощью способа опорных векторов с использованием только клинических факторов риска в качестве входных данных, и ROC-характеристика плюс 95% доверительная область для тромбоза, спрогнозированного с помощью классификатора с использованием клинических факторов риска и концентраций белка в качестве входных данных.
ПОДРОБНОЕ ОПИСАНИЕ ВАРИАНТОВ ОСУЩЕСТВЛЕНИЯ
Далее описаны варианты осуществления на основе компьютерной системе поддержки принятия клинических решений для прогнозирования риска тромбоза на основе комбинированного рассмотрения клинических факторов риска и молекулярных маркеров, например, концентраций белков.
На фиг. 1 представлена схематическая блочная диаграмма системы поддержки принятия клинических решений согласно различным вариантам осуществления, которая содержит алгоритм и/или программное обеспечение поддержки принятия клинических решений. Она содержит интерфейс 10 данных (DI), где информацию о конкретном пациенте делают доступной системе, процессор (P) 20, который применяет интерпретационный алгоритм, и пользовательский интерфейс 30 (UI), который делает интерпретацию вычисленных данных доступной пользователю, например, клиницисту. Кроме того, необязательная система оптимизации может быть предусмотрена для оптимизации классификаторов с тем, чтобы обеспечивать хороший компромисс между хорошей точностью прогнозирования и лаконичностью набора входных признаков или параметров для алгоритма поддержки принятия клинических решений. Система оптимизации содержит блок 40 оптимизации (O), который может быть основан на отдельном процессоре, исполняющем программное обеспечение для оптимизации, или основан на отдельной подпрограмме программного обеспечения, которая управляет процессором 20. Блок 40 оптимизации загружает данные, необходимые для оптимизации, из базы 50 данных (DB).
Интерфейс 10 данных может представлять собой классический пользовательский интерфейс для того, чтобы позволять взаимодействие между пользователем и системой поддержки принятия клинических решений, или прямую связь с базой данных центрального компьютера или электронной картой пациента. В любом случае, интерфейс 10 данных выполнен с возможностью собирать по меньшей мере некоторые из следующих входных признаков пациента в ту дату, когда систему поддержки принятия клинических решений используют для того, чтобы оценивать риск тромбоза:
иммобилизация (гипсовая повязка, длительный постельный режим дома в течение по меньшей мере 4 суток, госпитализация) в течение последних трех месяцев (например, «1» для истины, «0» для лжи);
хирургическое вмешательство в течение последнего месяца (например, «1» для истины, «0» для лжи);
семейный анамнез венозного тромбоза (считают положительным, если по меньшей мере один родитель, брат или сестра перенесли венозный тромбоз (например, «1» для истины, «0» для лжи));
беременность или послеродовой период в течение последних трех месяцев (например, «1» для истины, «0» для лжи);
текущее использование эстрогенов (пероральные контрацептивы или гормональная заместительная терапия (например, «1» для истины, «0» для лжи));
ожирение (индекс массы тела выше 30 (например, «1» для истины, «0» для лжи));
концентрация (Ед/мл) фактора свертывания FVIII в крови;
концентрация (Ед/мл) фактора свертывания FXI в крови; и
концентрация (нг/мл) фактора свертывания TFPI в крови.
В приведенном выше, единицы и возможные числовые значения для каждого входного признака даны для прозрачности, но выбор конкретных единиц не является обязательным.
На основе по меньшей мере некоторых из приведенных выше входных признаков процессор 20 вычисляет численную функцию приведенного выше списка числовых входных данных посредством применения алгоритма поддержки принятия клинических решений. Эта численная функция возвращает число, т.е. показатель риска (R), между нулем и единицей, где ноль представляет собой наименьшее возможное показание риска тромбоза, а единица представляет собой наибольшее. Эти числовые выходные данные могут быть представлены непосредственно в пользовательском интерфейсе 30 и/или их можно сравнивать с пороговым значением (T) между нулем и единицей. Если показатель риска превышает пороговое значение T, антикоагулянтная терапия показана пациенту, значения от которого вошли в вычисление. Иначе превентивную антикоагулянтную терапию обозначают как нецелесообразную. Выбор T, который можно задавать в виде фиксированного значения в системе или может быть настроен пользователем в пользовательском интерфейсе 30, определяет баланс между чувствительностью и специфичностью системы поддержки принятия клинических решений. Низкие значения T будут подразумевать смещение в направлении указания на высокий риск, который ведет к небольшому числу ложноотрицательных результатов (высокая чувствительность), но увеличивает число ложноположительных результатов (низкая специфичность или избыточное лечение). Высокие значения T дают обратный эффект и ведут к недостаточному лечению. За конкретный выбор T отвечает пользователь, например, клиницист, и это может представлять собой предмет для клинического исследования, но здесь это не будет рассмотрено дополнительно.
Систему поддержки принятия клинических решений можно реализовать в виде приложения программного обеспечения на компьютере (системе), доступ к которому может осуществлять клиницист, которому нужно принять решения об антикоагуляционном лечении пациента. Необязательно, приложение программного обеспечения системы поддержки принятия клинических решений можно интегрировать (например, в виде подключаемого расширения) в существующую больничную систему управления информацией.
Интерпретационный алгоритм поддержки принятия клинических решений может представлять собой комплексную математическую функцию, которая принимает числовые (или Булевы) значения для приведенных выше девяти входных признаков в качестве входных данных, использует их в последовательности нелинейных вычислений и возвращает числовое значение между нулем и единицей, где более высокие значения представляют более высокий риск тромбоза. Численная функция состоит из одной или комбинации функций классификатора, которые являются обычными в области машинного обучения, таких как функции нейронной сети или способы опорных векторов или Байесова сеть. Эти классификаторы оптимизируют посредством блока 40 оптимизации на основе базы 50 данных субъектов, т.е. пациентов с тромбозом и здоровых контрольных субъектов, для которых доступны числовые значения для упомянутых выше девяти входных признаков. Оптимизация блока 40 оптимизации включает настройку параметров функций классификаторов таким образом, что максимизируют корреляцию между вычисленным показателем риска для субъектов в базе данных и зарегистрированной частотой тромбоза. Процесс оптимизации требует значительных усилий, для которых необходим большой опыт и понимание в области машинного обучения и численной оптимизации. Кроме того, процесс в значительной мере зависит от качества базы 50 данных, лежащей в основе.
На фиг. 2 представлена блок-схема процесса оценки риска тромбоза согласно первому варианту осуществления. После начала процедуры на стадии S200 интерфейс 10 данных на стадии S201 осуществляет доступ к больничной электронной карте пациента (EPR), если присутствует, и считывает девять признаков пациента, которые перечислены выше. Необязательно у пользователя можно запрашивать или позволять ему вводить вручную, например, через пользовательский интерфейс 30, числовые значения для признаков пациента, которые не доступны в EPR. Затем на стадии S202 интерфейс 10 данных проверяет введенные значения для правильного числового формата, и можно генерировать сообщение об ошибке, если формат ввода не совпадает с требуемым форматом. В случае неправильного формата, данные превращают на стадии S203 в числовые форматы, показанные в вышеуказанном списке, если необходимо. Дополнительно, пользовательский интерфейс 30 может позволять пользователю или вводить числовое значение для порогового значения T между нулем и единицей или деактивировать пороговое значение.
Затем на стадии S204 процедура проверяет, запросил ли пользователь вычисление риска (например, через нажатие на соответствующую кнопку в пользовательском интерфейсе 30). Если нет, система повторяет приведенные выше стадии с S201 до S203 для того, чтобы сделать возможным обновление входных признаков, или просто повторяет стадии S204, пока не будет запрошено вычисление риска. Т.е., стрелка ответвления «Нет» стадии S204 может просто указывать назад на верхнюю часть стадии S204 и не должна возвращаться к стадии S201. Если на стадии S204 обнаруживают запрос, алгоритм поддержки принятия клинических решений вызывают на стадии S205 (например, посредством процессора 20) для того, чтобы вычислять показатель риска на основе входных признаков, собранных на предыдущих стадиях.
На последующей стадии S206 проверяют, активировано ли пороговое значение (T). Если нет, процедура переходит к стадии S209 и вычисленный показатель риска показывают в виде числа или другого графического представления, например, на экране компьютера или другом средстве вывода пользовательского интерфейса 30 прежде, чем процедура закончится на стадии S210. Иначе, если процедура обнаруживает на стадии S206, что пороговое значение не деактивировано, показатель риска сравнивают на стадии S207 с пороговым значением и классифицируют на основе результата сравнения. Наконец, на стадии S208 классификацию «высокий риск тромбоза» или «низкий риск тромбоза» делают видимой, например, на экране пользовательского интерфейса 30, в зависимости от того, показатель риска выше или ниже, чем пороговое значение. Необязательно, числовое и/или графическое сравнение между пороговым значением и показателем риска показывают наряду с классификацией.
Согласно модификации первого варианта осуществления, показатель риска можно вычислять непрерывно (а не по запросу). Это также можно осуществлять с использованием некоторых недостающих входных параметров. В этом случае диапазон возможных показателей риска (например, показываемый с помощью минимальной оценки риска и максимальной оценки риска) предоставляют в виде выходных данных, например, на основе неопределенности в вычислении.
Далее описана оптимизация алгоритма поддержки принятия клинических решений на основе второго варианта осуществления.
Требуемый набор данных базы 50 данных можно извлекать из совокупности данных на основе всестороннего опросника по многим потенциальным факторам риска венозного тромбоза. Более конкретно, совокупность данных может содержать информацию (например, клинические факторы риска), получаемую из опросника и клинических анализов (например, анализы концентрации белков, основанные на активности или антигенах), как описано в соответствующих протоколах анализов.
Способы машинного обучения представляют собой закрытые способы, которые используют паттерны, которые могут быть скрыты, в числовых значениях данных, чтобы спрогнозировать выходные данные. Каждый способ конструирует математическую функцию, которая принимает наблюдаемые количественные (например, концентрации белков) и качественные (например, иммобилизация) значения в качестве входных данных и создает выходные данные, которые прогнозируют определенный желаемый признак. Такую функцию определяют через ее структуру (например, функция нейронной сети) и числовое значение параметров функции (например, веса в нейронной сети). Комбинация структуры функции, значений параметров и численных входных данных создают выходной признак, который может быть бинарным (например, тромбоз или нет тромбоза) или непрерывным (например, вероятность тромбоза). Конкретный тип способа, который используют во втором варианте осуществления, представляет собой способ опорных векторов (SVM), часто используемый способ в области машинного обучения (дополнительные подробности см. например, в Cristianini et al.: «An Introduction to Support Vector Machines and Other Kernel-based Learning Methods», Cambridge University Press, 2000). Скрытый паттерн «обучают» непосредственно на данных, в целом безотносительно идентичности (например, биологического значения) различных входных данных. Обучение проходит через процедуру оптимизации, где минимизируют ошибку прогнозирования (т.е. некоторую числовую меру несоответствия между спрогнозированными выходными данными модели и наблюдениями). Существует множество подпрограмм оптимизации или минимизации ошибок, которые включают вариацию параметров математической функции для того, чтобы найти тот набор значений параметров, который дает наименьшую ошибку прогнозирования. Существует обширная литература по способам машинного обучения и способам оптимизации. За более глубоким взглядом можно обратиться к Kuncheva: «Combining Pattern Classifiers: Methods and Algorithms», Wiley-Blackwell 2004.
На фиг. 3 представлена блок-схема процесса оптимизации согласно второму варианту осуществления.
Классификатор представляет собой конкретный класс закрытой модели, выходные данные которой представляют собой класс или метку элемента данных, где каждый элемент описан с помощью определенного числа числовых признаков. Элементы данных в настоящих вариантах осуществления представляют собой людей-субъектов, для которых через измерения или анамнез известно определенное число клинических признаков. Класс является бинарным: пациент с тромбозом или контрольный субъект. Классификатор обучают на массиве данных базы 50 данных, который содержит числовые признаки каждого участника и соответствующую метку.
После начала процедуры оптимизации на стадии S300 массив данных базы 50 данных разделяют на стадии S301 на три набора равного размера, называемых обучающим набором, валидационным набором и тестовым набором, каждый содержит одинаковое соотношение случаев к контролям. На стадии S302 обучающий набор используют для обучения или настройки параметров, т.е. ищут тот набор значений параметров, который минимизирует прогнозирование или, в этом случае, ошибку классификации. Большинство способов машинного обучения страдают от так называемого «переобучения», когда эффективность способа на обучающем наборе значительно выше, чем его эффективность на новых данных, которые не использовали для обучения. Следовательно, на стадии S303 отдельный валидационный набор используют для того, чтобы тестировать, возникает ли такое переобучение. Комбинация данных для обучения и валидации позволяет найти тот тип функции машинного обучения и выбрать параметры модели, которые позволяют уловить истинный паттерн, который скрыт в данных (для обучения), но при этом остается достаточно общим для того, чтобы хорошо прогнозировать на отдельных данных для валидации и, таким образом, также и на будущих данных. Таким образом, оптимизированные классификаторы используют на стадии S304, чтобы создавать прогнозирование для каждого из пациентов на тестовом наборе, который остался неиспользованным на всем протяжении приведенных выше стадий оптимизации. Качество этого прогнозирования (например, в отношении чувствительности и специфичности) представляет собой финальный тест достоверности выбранного классификатора. Тестовый набор выбирают случайным образом для того, чтобы получать доброкачественную статистику.
Стадии с S301 до S303 описывают выбор оптимального классификатора на основе обучающего и валидационного поднабора из базы данных. Через перестановку субъектов в обучающем и валидационном наборе (перестановка пациентов между двумя наборами) на стадии S305 возможно создавать ансамбль классификаторов, каждый классификатор соответствует одной конкретной перестановке обучающего и валидационного субъектов. Такой ансамбль используют в качестве системы с голосованием. Это обозначает, что каждый классификатор в ансамбле присваивает метку одному и тому же объекту, например, «контрольный субъект» или «пациент с тромбозом». Метку, которая возникает наиболее часто, считают правильной, и фракцию голосов, которая поддерживает эту метку, используют в качестве оценки достоверности: если все классификаторы в ансамбле голосуют за тромбоз, это представляет собой 100% уверенность в том, что участник получит тромбоз, тогда как распределение голосов пятьдесят на пятьдесят делает классификацию не лучшей, чем подбрасывание монеты. Показатель риска (R) сравнивают с пороговым значением (T), где оценка, которая превышает пороговое значение, указывает на случай, а оценка ниже порогового значения указывает на контрольный субъект.
Когда на стадии S305 найден оптимальный классификатор на полном наборе признаков, относительную важность каждого входного признака в классификаторе анализируют на стадии S306. Выбранных субъектов в обучающем и валидационном наборе теперь используют для того, чтобы выбирать те признаки, которые вносят наибольший вклад в правильную классификацию. Чтобы достичь этого, следующую процедуру сокращения входных данных исполняют на стадии S306 для каждого из оптимизированных классификаторов:
Для каждого входного признака i в классификатор
Удалить входной признак i
Повторно оптимизировать сокращенный классификатор на обучающем наборе
Вычислить получаемую ошибку прогнозирования на обучающем наборе
Сохранить входной признак i
Перманентно удалить входной признак с наименьшей ошибкой прогнозирования
Повторять с начала до тех пор, пока не останется только один входной признак.
По мере сокращения числа входных признаков в классификатор, возрастает ошибка прогнозирования. Таким образом, всегда имеет место компромисс между хорошей прогнозирующей способностью и лаконичностью используемого набора входных признаков. Приведенную выше процедуру сокращения используют для того, чтобы провести выбор всех признаков с наибольшей способностью прогнозирования. Это осуществляют для каждого указанного выше (случайного) деления целой базы данных на обучающий, валидационный и тестовый набор. На стадии S307 для каждого деления классификатор сокращают до десяти входных признаков, и каждый оставшийся входной признак помечают. Затем на стадии S309 число раз, когда каждый входной признак остается среди «лучших десяти», подсчитывают и этот подсчет используют для того, чтобы ранжировать входные признаки от наибольшей способности прогнозирования (чаще всего, часть из лучших десяти) до наименьшей способности прогнозирования. Наконец, входные признаки с наибольшей способностью прогнозирования используют для вычисления риска в алгоритме поддержки принятия клинических решений процессора 20 и процедуру заканчивают на стадии S310.
Таким образом, процедуру оптимизации по второму варианту осуществления можно использовать для того, чтобы регулярно обновлять алгоритм поддержки принятия клинических решений процессора 20 на основе новых данных пациентов в базе 50 данных.
На фиг. 4 приведено схематическое представление вида спереди пользовательского интерфейса 30 на фиг. 1. В левой части имя пациента (PN) и его идентификационный номер (ID) указаны как «Jane Doe» и «099812». Под этой информацией обозначены девять входных признаков и их текущие бинарные значения («0» или «1») для указанного выше пациента указаны справа под именем. Первые шесть входных признаков представляют собой клинические факторы риска, указывающие на недавнее хирургическое вмешательство (RS), ожирение (O), семейный анамнез (FH), неподвижность (I), использование контрацептивов (CU) и беременность (P). Последние три входных признака представляют собой уровни концентрации факторов свертывания для фактора VIII (FVIII), фактора XI (FXI) и ингибитора пути тканевого фактора (TFPI). В правой части указан в настоящее время установленный пороговый уровень (T) (т.е. 0,5) и ниже указан статус деактивирующей (DA) функции. Это может быть просто световой или цветовой индикатор. Под ним показана кнопка (CAL) для активации или запуска вычисления риска посредством процессора 20. Под этой кнопкой предоставлено числовое показание вычисленного показателя риска (RS) (т.е. 0,12) и под ним графическая визуализация (RV) этого показателя риска на шкале риска по отношению к пороговому значению T показана в виде стратификации (STR). Столбик, который показывает текущий показатель риска на шкале риска, квалифицируют как низкий риск (LR). Эта визуализация вместе с другой выходной информацией и входными функциями в пользовательском интерфейсе 30 дает пользователю, т.е. клиницисту, возможность быстрой оценки и предоставляет расширенную поддержку принятия решения о лечении.
Следующий пример представлены в качестве иллюстрации настоящего изобретения и не предназначен для того, чтобы каким-либо образом ограничивать настоящее изобретение и варианты осуществления, предоставленные в настоящем документе.
В первом примере, который относится к классификации риска тромбоза, второй вариант осуществления, который объяснен выше, применяли к клиническому исследованию ~500 пациентов с тромбозом и ~500 здоровых контрольных субъектов, и показано, что предложенное решение ведет к значительно более хорошим результатам в отношении точности оценки, чем «стандартный» подход, основанный только на клинических факторах риска. Ансамбль способов опорных векторов использовали в исследовании тромбофилии Лейдена (LETS) (как описано, например, в van der Meer et al.: «The LeidenThrombophilia Study (LETS)», Thromb Haemost. 1997;78(1):631-5) для того, чтобы найти комбинацию известных биологических маркеров, которые позволяют отличать пациентов с тромбозом от здоровых контрольных субъектов. Внимание направлено на два различных типа признаков пациента, т.е. концентрации белков системы свертывания в крови и клинические факторы риска, которые, как известно, относятся к тромбозу. Можно показать, что способность прогнозирования клинических факторов риска в отдельности, или в качестве простого подсчета факторов риска или использованных в подходе с машинным обучением, можно усовершенствовать посредством включения измеренных концентраций белков системы свертывания.
На фиг. 5A и 5B представлены соответствующие диаграммы с рабочей характеристикой приемника (ROC) плюс 95% доверительная область для тромбоза, спрогнозированного с помощью способа опорных векторов с использованием только клинических факторов риска в качестве входных данных, что ведет к площади под ROC-характеристикой (AUC) 0,72 (0,68-0,77) (фиг. 5A), и ROC-характеристикой плюс 95% доверительная область для тромбоза, спрогнозированного с помощью классификатора с использованием клинических факторов риска и концентраций белков в качестве входных данных, что ведет к AUC 0,78 (0,74-0,83) (фиг. 5B). ROC-характеристики графически отражают долю истинно положительных результатов (вертикальная ось) в зависимости от доли ложно положительных результатов (горизонтальная ось) для различных пороговых значений. Площадь под ROC-характеристикой (AUC) используют в качестве меры для качества ансамбля классификаторов. Как можно понять из фиг. 5A и 5B, комбинация признаков обоих типов дает значительно более хорошую классификацию (т.е. AUC 0,78 против 0,72, p<0,001).
Второй пример относится к сокращению входных признаков. Обнаруженным в исследовании наиболее влиятельным белком при классификации тромбоза был фактор свертывания VIII, после чего следовал фактор XI и TFPI (см. ниже таблицу 1). Классификация с использованием всех клинических факторов риска (для которых измерение не требуется) и этих трех концентраций белков достигает почти эквивалентной классификации при AUC 0,77. Улучшение особенно хорошо заметно в популяции с повышенным риском, которую здесь определяют как субъектов, которые демонстрируют один или несколько известных клинических факторов риска.
На фиг. 6A и 6B представлены ROC плюс 95% доверительная область для тромбоза, спрогнозированного с использованием подгруппы пациентов с одним или несколькими присутствующими известными клиническими факторами риска, посредством способа опорных векторов с использованием только клинических факторов риска в качестве входных данных, что ведет к AUC 0,67 (0,60-0,75) (фиг. 6A), и ROC-характеристика плюс 95% доверительная область для тромбоза, спрогнозированного с помощью классификатора с использованием клинических факторов риска и концентраций белков в качестве входных данных, что ведет к AUC 0,75 (0,69-0,81) (фиг. 6B).
Как можно понять из фиг. 6A и 6B, использование значений трех концентраций белков делает возможной дальнейшую стратификацию этой группы риска с ROC оценкой 0,75 против 0,67 на основе использования только клинических факторов риска (число совместно встречающихся факторов или знание о том, какой фактор присутствует).
В таблице 1 представлен список классификационных признаков, сортированных по процентной доле классификаторов (на основе различных случайных выборов для валидационного набора), которые сохраняют признак среди 10 признаков, которые сокращали последними.
Послеро-довой период
Риск тромбоза глубоких вен оценивали с использованием информации из исследования MEGA (Multiple Environment and Genetic Assessment для факторов риска венозного тромбоза) и исследования тромбофилии Лейдена (LETS). Оба являются исследованиями с использованием случаев и контролей, проводившимися для того, чтобы идентифицировать факторы риска для венозного тромбоза, которые выполняли в Нидерландах (Blom, 2005, van der Meer FJ, Koster T, Vandenbroucke JP, Briet E, 1997). Множество переменных в диапазоне от уровней факторов свертывания до экологических факторов риска тромбоза и генетической тромбофилии получали у пациентов с венозным тромбозом и контрольных субъектов. В целях этого исследования подход с нейронными сетями (см., например, Kuncheva, 2004) использовали в исследовании MEGA для того, чтобы оценивать потенциальные факторы риска для тромбоза глубоких вен (DVT) и их прогностическое значение в одном интегрированном подходе. Идентифицированный комбинаторный показатель риска валидировали при внутренней перекрестной валидации в исследовании MEGA и при независимой валидации в исследовании LETS.
Ранее показано, что комбинация клинических факторов риска и однонуклеотидных полиморфизмов (SNP) позволяла проводить различие между пациентами с высоким и низким риском при площади под кривой рабочей характеристики приемника (ROC) (AUC) 0,82 в MEGA и 0,77 в LETS. Теперь показано, что через добавление уровней белков в качестве прогнозирующих факторов можно достичь значительного дополнительного увеличения точности прогнозирования, как количественно выражено в AUC, равных 0,87 и 0,81, соответственно.
Дополнительно четыре клинических фактора риска, которые не были доступны для начального исследования, учтены теперь: иммобилизация в связи с гипсовой повязкой, повреждение ноги в последние три месяца, злокачественная опухоль в период от пяти лет назад до шести месяцев после индексной даты и путешествие в течение больше чем четырех часов в последние 2 месяца. Другие учитываемые факторы риска также представляли собой часть начального исследования: иммобилизация в связи с длительным постельным режимом дома в течение по меньшей мере 4 суток, госпитализация), хирургическое вмешательство, семейный анамнез венозного тромбоза (считают положительным, если по меньшей мере 1 родитель, брат или сестра перенесла венозный тромбоз, беременность или послеродовой период в течение трех месяцев перед индексной датой, или использование эстрогенов (пероральные контрацептивы или гормональная заместительная терапия) на момент индексной даты и присутствие ожирения, определяемого как индекс массы тела 30 кг/м2 или выше).
Наряду с данными из опросника и измеряемыми уровнями белков, были доступны данные о присутствии пяти генетических аспектов, т.е. группа крови и четыре однонуклеотидных полиморфизма (SNP) в F2 (G20210A), фибриногене (№ rs2066865), F1 (№ rs2036914) и F5 (FV Лейдена; № rs6025). Кроме того, данные содержали число аллелей, которые были поражены affected, на каждый SNP.
Учитываемые уровни белков представляют собой поднабор белков, которые были включены до (по причине более ограниченного набора измерений, выполненных в исследовании MEGA). Они представляют собой: антитромбин (AT), протромбин (фактор II), фактор 7 (FVII), FVIII, FIX, FX, FXI, фибриноген и протеин C (все измеряли по активности) и белок S (измеряли по антигену).
Результаты перекрестной валидации в MEGA. Принимали во внимание показатели риска, основанные на нейронных сетях, которые прогнозируют риск на основе клинических факторов риска, генетических эффектов и уровней белков, к показателям риска на основе клинических факторов риска и генетических эффектов (без уровней белков) и клиническим показателям риска на основе только клинических факторов риска. Сравнение осуществляли в исследовании MEGA, но иным образом при той же перекрестной валидационной постановке и с использованием тех же способов, как описано в начальном исследовании. Соответствующие AUC составляют 0,87, 0,83 и 0,78, т.е. каждое добавление повышает точность показателя риска; все улучшения являются значащими (p<0,01 в двустороннем критерии Стьюдента).
Исследование LETS включает на четыре меньше клинических фактора риска, чем исследование MEGA, как описано выше в отношении клинических факторов риска. Перекрестную валидацию, как выполняли в предыдущем абзаце, повторяли без этих четырех факторов риска и с исключением пациентов со злокачественными опухолями, которые также были исключены из исследования LETS. AUC в сокращенном исследовании MEGA составляют 0,84, 0,80 и 0,74, в том же порядке, что и в последнем абзаце. Затем для каждого из выборов входных признаков (клинические факторы риска с использованием/без использования генетических эффектов с использованием/без использования уровней белков) выводили один показатель риска в сокращенном исследовании MEGA (без делений на обучающий и тестовый набор, что будет необходимо при перекрестной валидации) и применяли этот показатель риска без адаптации к индивидуумам из исследования LETS. Получаемые AUC составляли 0,82, 0,79 и 0,74, что демонстрирует, что предложенный показатель риска можно применять в независимом исследовании при небольшой потере эффективности, и улучшение из-за предложенного включения уровней белков сохраняется при внешней валидации.
Те же способы используют в исследовании перекрестной валидации в субпопуляции индивидуумов MEGA с присутствующим одним или несколькими из указанных выше клинических факторов риска (также это выполняли для исследования LETS начальной подаче). Получаемые AUC составляли 0,86, 0,81 и 0,76 для этих способов подсчета, и опять с более низкими значениями для показателей, которые учитывают меньшее число входных признаков.
Придерживаясь тех же способов, как описано выше, ранжировали важность всех признаков, которые использовали в качестве входных данных в нейронные сети, которые предоставляют показатель риска. Результаты представлены в таблице 2. Результаты частично перекрываются с более ранними результатами: F8 без сомнений остается белком с наибольшей способностью прогнозирования, а использование контрацептивов, хирургическое вмешательство, неподвижность и семейный анамнез все также получают высокие оценки. TFPI не измеряли в MEGA и, следовательно, он отсутствует в ранжировании. Fl1 получил значительно более низкую оценку, чем ране.
Перекрестная валидация в MEGA с использованием показателя риска на основе всех клинических факторов риска, одного SNP (FV Лейдена) и уровня белка FVIII обеспечивает точность, которая лишь немного снижена (AUC=0,85 против 0,87). Дополнительное добавление SNP в фибриногене и уровней белков для белка S и FX увеличивает AUC до 0,86.
Как изложено выше, показатель риска DVT на основе клинических факторов риска, SNP и уровней белков демонстрирует значительное улучшение в отношении чувствительности/специфичности относительно известных способов без использования уровней белков при оценке в исследовании MEGA. Вкратце, описаны аппарат и способ поддержки принятия клинических решений для того, чтобы идентифицировать пациентов с высоким риском тромбоза на основе комбинации клинических факторов риска и молекулярных маркеров, например, концентрации белков. Эти клинические факторы риска и молекулярные маркеры комбинируют в алгоритме, основанном на машинном обучении, который возвращает выходное значение, связанное с оценочным риском события тромбоза в будущем.
Хотя изобретение иллюстрировано и описано подробно на рисунках и в приведенном выше описании, такие иллюстрации и описание следует рассматривать как иллюстративные или образцовые и неограничивающие. Изобретение не ограничено раскрытым вариантом осуществления. Его можно применять в любой области поддержки принятия клинических решений, в ситуации, когда нужно принять решение о том, нужно ли назначать пациенту превентивное лечение. Кроме того, число и типы входных признаков (т.е. клинические факторы риска и молекулярные маркеры) не ограничены девятью входными факторами, указанными в вариантах осуществления. На основе процедуры оптимизации из приведенных выше примеров, различные другие клинические факторы риска или молекулярные маркеры (например, концентрация белка Z, связывающего белка C4B, фибриногена, TAFI, фактора II, V, VII, IX, X, XII или XIII, антитромбина, белка C, ингибитора протеина C, белка S или других маркеров) можно выбирать в качестве решающих входных признаков.
Специалисты в данной области могут понять и осуществить другие вариации в раскрытых вариантах осуществления при практическом осуществлении описываемого в заявке изобретения, изучив рисунки, раскрытие и приложенную формулу изобретения. В формуле изобретения слово «содержит» не исключает другие элементы или стадии, а формы единственного числа не исключают множества. Один процессор или другой блок может выполнять функции нескольких элементов, перечисленных в формуле изобретения. Сам факт того, что определенные средства перечислены во взаимно различных зависимых пунктах формулы изобретения, не указывает на то, что комбинация этих средств не может быть использована с пользой.
В приведенном выше описании подробно изложены определенные варианты осуществления изобретения. Однако следует принимать во внимание, что независимо от того, в каких деталях изложено приведенное выше в тексте, изобретение можно осуществлять на практике многими путями и, следовательно, оно не ограничено раскрытыми вариантами осуществления. Следует отметить, что использование конкретной терминологии в описании определенных признаков или аспектов по изобретению не следует брать для того, чтобы предполагать, что терминологию переопределяют в настоящем документе, чтобы ограничить его, чтобы включить какие-либо конкретные характеристики признаков или аспектов по изобретению, с которыми эта терминология связана.
название | год | авторы | номер документа |
---|---|---|---|
Способ анализа медицинских данных с помощью нейронной сети LogNNet | 2021 |
|
RU2754723C1 |
Способ прогнозирования возобновления клиники ишемической болезни сердца с помощью нейронных сетей у пациентов после эндоваскулярного вмешательства | 2017 |
|
RU2675067C1 |
СИСТЕМЫ И СПОСОБЫ ОЦЕНКИ ЭФФЕКТИВНОСТИ ЛЕКАРСТВЕННОГО СРЕДСТВА | 2018 |
|
RU2797170C2 |
СИСТЕМА И СПОСОБ ДЛЯ ОБЪЕДИНЕНИЯ КЛИНИЧЕСКИХ ПРИЗНАКОВ И ПРИЗНАКОВ ИЗОБРАЖЕНИЙ ДЛЯ ДИАГНОСТИКИ С ПРИМЕНЕНИЕМ КОМПЬЮТЕРА | 2009 |
|
RU2533500C2 |
ДОСТОВЕРНЫЙ КЛАССИФИКАТОР | 2016 |
|
RU2720448C2 |
СПОСОБ РАННЕЙ ДИАГНОСТИКИ ХРОНИЧЕСКИХ ЗАБОЛЕВАНИЙ ПАЦИЕНТА, ОСНОВАННЫЙ НА КЛАСТЕРНОМ АНАЛИЗЕ БОЛЬШИХ ДАННЫХ | 2021 |
|
RU2800315C2 |
Способ оценки риска развития болезни Альцгеймера с использованием панели белков крови | 2021 |
|
RU2794040C1 |
СИСТЕМА ДЛЯ ПОДДЕРЖКИ ПРИНЯТИЯ ВРАЧЕБНЫХ РЕШЕНИЙ | 2020 |
|
RU2752792C1 |
МЕДИЦИНСКИЙ ПРОГНОЗ И ПРЕДСКАЗАНИЕ РЕЗУЛЬТАТОВ ЛЕЧЕНИЯ, ИСПОЛЬЗУЯ АКТИВНОСТИ МНОЖЕСТВА КЛЕТОЧНЫХ СИГНАЛЬНЫХ ПУТЕЙ | 2014 |
|
RU2718647C2 |
СИСТЕМЫ И СПОСОБЫ ПОДДЕРЖКИ КЛИНИЧЕСКИХ РЕШЕНИЙ | 2010 |
|
RU2543563C2 |
Группа изобретений относится к медицине, а именно к области поддержки принятия клинических решений, и может быть использована для вычисления значения оценки риска тромбоза у пациента на основе входных признаков. Аппарат содержит: интерфейс данных для приема упомянутых входных признаков; процессор для вычисления упомянутого значения оценки посредством применения алгоритма поддержки принятия решений в качестве функции числовых значений, полученных из упомянутых принятых входных признаков; и пользовательский интерфейс для вывода упомянутого значения оценки; причем упомянутые входные признаки включают комбинацию по меньшей мере одного клинического фактора риска тромбоза, по меньшей мере одного однонуклеотидного полиморфизма и по меньшей мере одного уровня белка упомянутого пациента, являющихся индикаторами тромбоза. Способ включает в себя: выбор упомянутых входных признаков для обеспечения комбинации по меньшей мере одного клинического фактора риска тромбоза, по меньшей мере одного однонуклеотидного полиморфизма и по меньшей мере одного уровня белка упомянутого пациента, являющихся индикаторами тромбоза; и вычисление упомянутого значения оценки посредством применения алгоритма поддержки принятия решений в качестве функции числовых значений, получаемых из упомянутых принятых входных признаков. Машиночитаемый носитель информации, имеющий сохраненный на нем компьютерный программный продукт, содержащий средства программного кода, которые, будучи исполняемыми на компьютерном устройстве, заставляют это компьютерное устройство осуществлять этапы способа на аппарате. Группа изобретений обеспечивает повышение эффективности поддержки принятия клинических решений. 3 н. и 12 з.п. ф-лы, 2 табл., 8 ил.
1. Аппарат для вычисления значения оценки риска тромбоза у пациента на основе входных признаков, содержащий:
интерфейс (10) данных для приема упомянутых входных признаков;
процессор для вычисления упомянутого значения оценки посредством применения алгоритма поддержки принятия решений в качестве функции числовых значений, полученных из упомянутых принятых входных признаков; и
пользовательский интерфейс (30) для вывода упомянутого значения оценки;
причем упомянутые входные признаки включают комбинацию по меньшей мере одного клинического фактора риска тромбоза, по меньшей мере одного однонуклеотидного полиморфизма и по меньшей мере одного уровня белка упомянутого пациента, являющихся индикаторами тромбоза.
2. Аппарат по п. 1, где упомянутый по меньшей мере один уровень белка выбран из уровней концентрации фактора свертывания FVIII в крови, концентрации фактора свертывания FXI в крови и концентрации фактора свертывания TFPI в крови.
3. Аппарат по п. 1, где упомянутый по меньшей мере один клинический фактор риска выбран из иммобилизации в течение первого предварительно определяемого периода времени, хирургического вмешательства в течение второго предварительно определяемого периода времени, семейного анамнеза венозного тромбоза, беременности или послеродового периода в течение третьего предварительно определяемого периода времени, текущего использования эстрогенов и ожирения.
4. Аппарат по п. 3, где упомянутый первый предварительно определяемый период времени соответствует по меньшей мере трем месяцам, упомянутый второй предварительно определяемый период времени соответствует одному месяцу и упомянутый третий предварительно определяемый период времени соответствует по меньшей мере трем месяцам.
5. Аппарат по п. 1, где упомянутый процессор (20) выполнен с возможностью сравнивать упомянутое значение оценки с предварительно определяемым пороговым значением, и классифицировать упомянутое значение оценки на основе результата сравнения.
6. Аппарат по п. 5, где упомянутый аппарат выполнен так, чтобы позволять пользователю вводить или деактивировать упомянутое предварительно определяемое пороговое значение.
7. Аппарат по п. 1, дополнительно содержащий блок (40) оптимизации для применения процесса обучения путем процедуры оптимизации, включающей настройку параметров функций классификаторов таким образом, чтобы максимизировать корреляцию между вычисленным показателем риска для субъектов в базе данных и зарегистрированной частотой тромбоза для минимизации ошибки прогнозирования риска тромбоза.
8. Аппарат по п. 1, где упомянутый процессор (20) выполнен с возможностью вычислять показатель риска тромбоза глубоких вен на основе клинических факторов риска, однонуклеотидных полиморфизмов и уровней белков.
9. Способ вычисления значения оценки риска тромбоза у пациента на основе входных признаков, включающий в себя:
выбор упомянутых входных признаков для обеспечения комбинации по меньшей мере одного клинического фактора риска тромбоза, по меньшей мере одного однонуклеотидного полиморфизма и по меньшей мере одного уровня белка упомянутого пациента, являющихся индикаторами тромбоза; и
вычисление упомянутого значения оценки посредством применения алгоритма поддержки принятия решений в качестве функции числовых значений, получаемых из упомянутых принятых входных признаков.
10. Способ по п. 9, дополнительно включающий оптимизацию упомянутых входных признаков посредством процесса обучения на основе сохраненного массива данных множества пациентов с тем, чтобы минимизировать ошибку прогнозирования.
11. Способ по п. 10, дополнительно включающий деление упомянутого массива данных на обучающий набор, валидационный набор и тестовый набор, использование упомянутого обучающего набора и упомянутого валидационного набора для того, чтобы выбирать тип функции машинного обучения и набор параметров, используемых для оптимизации классификаторов, использование оптимизированных классификаторов для получения упомянутых входных признаков и использование упомянутого тестового набора для вычисления упомянутого значения оценки для пациентов из упомянутого тестового набора на основе упомянутых полученных входных признаков.
12. Способ по п. 9, дополнительно включающий выбор упомянутого по меньшей мере одного уровня белка из уровней концентрации фактора свертывания FVIII в крови, концентрации фактора свертывания FXI в крови и концентрации фактора свертывания TFPI в крови.
13. Способ по п. 9, дополнительно включающий выбор упомянутого по меньшей мере одного клинического фактора риска из иммобилизации в течение первого предварительно определяемого периода времени, хирургического вмешательства в течение второго предварительно определяемого периода времени, семейного анамнеза венозного тромбоза, беременности или послеродового периода в течение третьего предварительно определяемого периода времени, текущего использования эстрогенов и ожирения.
14. Способ по п. 13, дополнительно включающий установление упомянутого первого предварительно определяемого периода времени равным по меньшей мере трем месяцам, упомянутого второго предварительно определяемого периода времени равным одному месяцу и упомянутого третьего предварительно определяемого периода времени равным по меньшей мере трем месяцам.
15. Машиночитаемый носитель информации, имеющий сохраненный на нем компьютерный программный продукт, содержащий средства программного кода, которые, будучи исполняемыми на компьютерном устройстве, заставляют это компьютерное устройство осуществлять этапы по любому одному из пп. 9-14 на аппарате по любому из пп. 1-8.
US 2009089079 A1, 02.04.2009 | |||
PENCO S | |||
et al., Assessment of the Role of Genetic Polymorphism in Venous Thrombosis Through Artificial Neural Networks, Annals of Human Genetics, 2005, N 69, pp | |||
Способ восстановления электрических ламп накаливания с разрушенными нитями | 1921 |
|
SU693A1 |
JENKINS P.V | |||
et al., Elevated factor VIII levels and risk of venous thrombosis, British Journal of Haematology, 25.04.2012, pp | |||
Прибор для перевода единиц одного наименования в другие | 1923 |
|
SU653A1 |
МОЗГОВОЙ П.В | |||
Тромбогеморрагические осложнения после реконструктивных операций на брюшном отделе аорты и магистральных артериях нижних конечностей (профилактика, диагностика, лечение), Автореферат диссертации на соискание ученой степени доктора медицинских наук, Волгоград, 2004, с | |||
Способ изготовления электрических сопротивлений посредством осаждения слоя проводника на поверхности изолятора | 1921 |
|
SU19A1 |
US 2003069528 A1, 10.04.2003 | |||
И.М | |||
СЕЧЕНОВА, Лабораторные Методы Исследования Системы Свертывания Крови, Методические рекомендации, Второе издание, Москва, 2011, cc | |||
Печь для непрерывного получения сернистого натрия | 1921 |
|
SU1A1 |
Авторы
Даты
2019-03-19—Публикация
2013-10-17—Подача