ОБЛАСТЬ ТЕХНИКИ
Изобретение относится к области информационных и коммуникационных технологий для обработки медицинских данных, в частности к способу и системе выявления подозрений на орфанные (редкие) заболевания на основе анализа электронной медицинской карты (ЭМК) пациента с применением искусственного интеллекта и машинного обучения.
Представленное решение может быть использовано, по меньшей мере, врачами и другими медицинскими специалистами в клинической практике, в различных системах поддержки принятия врачебных решений (СППВР) с целью выявления подозрений на различные орфанные заболевания и эффективного оказания медицинской помощи пациентам.
УРОВЕНЬ ТЕХНИКИ
Возросшее использование электронных медицинских карт (ЭМК) в здравоохранении способствует применению интеллектуального анализа данных для выявления различных заболеваний. Перспективным использованием интеллектуального анализа данных ЭМК является разработка алгоритмов для раннего выявления орфанных (редких) заболеваний с применением искусственного интеллекта (ИИ), включая машинное обучение (МО). Однако, выявление орфанных заболеваний с применением ИИ и МО затруднено разнообразием симптомов. Более того, симптоматика орфанных заболеваний часто похожа на более распространенные болезни.
В статьях [1] и [2] описаны способы идентификации орфанных заболеваний с помощью методов машинного обучения. Авторы [1] разработали четыре алгоритма идентификации системной красной волчанки (СКВ), являющейся редким аутоиммунным заболеванием, - алгоритм на основе правил, использующий только структурированные данные (базовый алгоритм), и три алгоритма, использующие различные модели NLP на основе регуляризированной логистической регрессии, которые используют различные наборы признаков. Наиболее эффективной оказалась NLP модель, включающая признаки структурированных данных, концепты регулярных выражений и сопоставленные концептуальные уникальные идентификаторы (CUI). Авторы [2] разработали метод идентификации редких заболеваний, который использует онтологии и слабый контроль. Подход включает два этапа: (i) преобразование текста с помощью Унифицированной Системы Медицинского Языка (UMLS), связывающее упоминания в тексте с понятиями в UMLS с помощью инструмента для связывания именованных сущностей (например, SemEHR) и слабый контроль на основе специализированных правил и двунаправленных кодирующих представлений Трансформеров (BERT) на основе контекстных представлений, и (ii) UMLS-в-ORDO, сопоставление концепций UMLS с редкими заболеваниями в онтологии редких заболеваний Orphanet Rare Disease Ontology (ORDO).
Наиболее близким аналогом заявляемого изобретения является техническое решение, раскрытое в заявке на изобретение US20220093252 A1, дата публикации 24.03.2022. Раскрыта модель машинного обучения для диагностики пациентов с орфанным заболеванием (болезнь Гоше) на основе интерпретации медицинских данных/записей и методы обучения такой модели. В связи с низкой долей лиц с орфанным заболеванием в общей популяции, наборы данных, которые могут быть использованы в обучении моделей машинного обучения для диагностики такого заболевания, часто являются зашумленными и/или несбалансированными. В данном решении описан метод создания набора данных с пониженным уровнем шума и/или сбалансированного набора данных, который, при использовании алгоритмов машинного обучения, позволяет создать более точную модель (т.е. модель с меньшим количеством ложноположительных и/или ложноотрицательных результатов). Метод включает: получение исходного набора данных, включающего медицинские данные, относящиеся к множеству лиц с орфанным заболеванием; определение множества кластеров лиц в исходном наборе данных; определение одного или более кластеров как наименее репрезентативных для редкого заболевания; удаление одного или более лиц из одного или более кластеров, определенных как наименее репрезентативные, на основе медицинских данных указанных одного или более лиц для создания обрезанного набора данных; и объединение обрезанного набора данных с контрольным набором данных, включающим множество лиц без орфанного заболевания для создания обучающего набора данных.
Общими признаками с заявляемым изобретением является анализ электронных медицинских карт (ЭМК) пациента с применением машинного обучения с целью выявления орфанных заболеваний. Однако, в данном решении идентификация орфанных заболеваний осуществляется с помощью обучаемой модели любого типа, которую можно использовать для классификации. Обучение модели происходит на наборе данных, сформированном на основе ЭМК пациентов, имеющих орфанные заболевания, число которых в общей популяции мало, что затрудняет диагностику и не позволяет при обучении модели учитывать разнообразие симптомов каждого орфанного заболевания, а также то, что симптоматика таких заболеваний часто похожа на более распространенные болезни.
Техническая проблема, на решение которой направлено настоящее изобретение, является разработка алгоритма для выявления пациентов с подозрением на орфанные заболевания с применением искусственного интеллекта (ИИ), включая машинное обучение (МО), который позволяет учитывать разнообразие симптомов орфанных заболеваний и возможность маскировки орфанных заболеваний под распространенные болезни.
ТЕРМИНЫ И СОКРАЩЕНИЯ
В описании изобретения использованы следующие термины и сокращения.
NLP - Natural language processing
БА - Бронхиальная астма
БФ - Болезнь Фабри
БГ - Болезнь Гоше
ВИЧ - Вирус иммунодефицита человека
ГЛЖ - Гипертрофия левого желудочка
ГПЖ - Гипертрофия правого желудочка
ЖКТ - Желудочно-кишечный тракт
ИМТ - Индекс массы тела
ИТП - Идиопатическая тромбоцитопеническая пурпура
ЛАГ - Легочная артериальная гипертензия
ЛОД - Лист окончательных диагнозов
МК - Митральный клапан
МКБ - Международная классификация болезней
МРТ - Магнитно-резонансная томография
ОИМ - Острый инфаркт миокарда
ОНМК - Острое нарушение мозгового кровообращения
СКТ - Спиральная компьютерная томография
СКФ - Скорость клубочковой фильтрации
СХ - Синдром Хантера
УЗИ - Ультразвуковое исследование
ХОБЛ - Хроническая обструктивная болезнь лёгких
ЦНС - Центральная нервная система
ЧКВ - Чрезкожное коронарное вмешательство
ЭМК - Электронная медицинская карта
ЭКГ - Электрокардиография
ЭХО-КС - ЭХО-кардиоскопия
ЭКС - Электокардиостимулятор
СУЩНОСТЬ ИЗОБРЕТЕНИЯ
Техническим результатом заявляемого изобретения является разработка способа и системы для выявления пациентов с подозрением на орфанные заболевания с применением искусственного интеллекта (ИИ), включая машинное обучение (МО), которая учитывает разнообразие симптомов орфанных заболеваний и возможность маскировки орфанных заболеваний под распространенные болезни, что повышает вероятность своевременного выявления орфанных заболеваний и, следовательно, эффективность оказания медицинской помощи пациентам.
Указанный технический результат достигается за счёт того, что:
В компьютерно-реализуемом способе выявления подозрений на орфанные заболевания на основе анализа электронной медицинской карты (ЭМК) пациента с применением методов искусственного интеллекта и машинного обучения:
из неструктурированных медицинских записей, содержащихся в ЭМК пациента, с применением методов искусственного интеллекта и машинного обучения с помощью набора модулей осуществляют извлечение признаков, характерных для орфанных заболеваний;
на основании полученных признаков, характерных для орфанных заболеваний, с помощью одного или более модулей решающих правил осуществляют выявление подозрений на орфанные заболевания, причем каждый модуль решающих правил предназначен для выявления подозрения на каждое отдельно взятое орфанное заболевание.
Достижение технического результата обеспечивается за счет анализа ЭМК пациента с применением методов искусственного интеллекта и машинного обучения с помощью набора модулей для извлечения признаков, характерных для орфанных заболеваний, и с помощью модулей решающих правил для выявление подозрений на орфанные заболевания на основе извлеченных признаков, где каждый модуль решающих правил предназначен для выявления подозрения на каждое отдельно взятое орфанное заболевание.
В способе орфанными заболеваниями могут быть, по меньшей мере, болезнь Гоше, болезнь Фабри, синдром Хантера.
В способе могут извлекать из ЭМК пациента признаки, характерные для орфанных заболеваний, с помощью NLP методов и методов регулярных выражений.
В способе каждый модуль из набора модулей может извлекать признаки из каждого отдельно взятого типа медицинской документации.
В способе набор модулей для извлечения признаков, характерных для орфанных заболеваний, может содержать, по меньшей мере:
модуль извлечения признаков из протоколов операций и выписных эпикризов;
модуль извлечения признаков из протоколов ЭКГ;
модуль извлечения признаков из протоколов ЭхоКС;
модуль извлечения признаков патологических симптомов из протоколов МРТ головного мозга;
модуль извлечения признаков из протоколов СКТ;
модуль извлечения патологических симптомов из описаний и заключений УЗИ брюшной полости;
модуль извлечения признаков из протоколов рентгенологических исследований;
модуль извлечения признаков из врачебных осмотров.
В способе с помощью модуля извлечения признаков из протоколов операций и выписных эпикризов могут извлекать признаки, характерные для болезни Гоше; с помощью модуля извлечения признаков из протоколов ЭКГ могут извлекать признаки, характерные для болезни Фабри; с помощью модуля извлечения признаков из протоколов ЭхоКС могут извлекать признаки, характерные для болезни Фабри и синдрома Хантера; с помощью модуля извлечения признаков патологических симптомов из протоколов МРТ головного мозга могут извлекать признаки, характерные для болезни Фабри; с помощью модуля извлечения признаков из протоколов СКТ могут извлекать признаки, характерные для болезни Гоше и синдрома Хантера; с помощью модуля извлечения патологических симптомов из описаний и заключений УЗИ брюшной полости могут извлекать признаки, характерные для болезни Гоше и синдрома Хантера; с помощью модуля извлечения признаков из протоколов рентгенологических исследований могут извлекать признаки, характерные для болезни Гоше и синдрома Хантера; с помощью модуля извлечения признаков из врачебных осмотров могут извлекать признаки, характерные для болезни Гоше, болезни Фабри, синдрома Хантера.
В способе признаки, характерные для орфанных заболеваний, извлекаемые с помощью модуля извлечения признаков из врачебных осмотров, могут быть разделены на наборы признаков с учетом обобщающего критерия.
В способе дополнительно данные пациента могут оценивать на соответствие критериям включения в исследование перед тем, как из неструктурированных медицинских записей, содержащихся в ЭМК пациента, с помощью набора обученных модулей осуществляют извлечение признаков, характерных для орфанных заболеваний.
В способе модулем решающих правил может являться, по меньшей мере: модуль решающих правил для выявления подозрения на болезнь Гоше, модуль решающих правил для выявления подозрения на болезнь Фабри, модуль решающих правил для выявления подозрения на синдром Хантера.
Указанный технический результат достигается также за счет системы для выявления подозрений на орфанные заболевания на основе анализа электронной медицинской карты (ЭМК) пациента с применением методов искусственного интеллекта и машинного обучения для осуществления вышеизложенного способа, которая содержит, по меньшей мере, один процессор, память и инструкции, хранимые в памяти и исполняемые процессором, с помощью которых осуществляют следующие этапы:
из неструктурированных медицинских записей, содержащихся в ЭМК пациента, с помощью набора модулей осуществляют извлечение признаков, характерных для орфанных заболеваний;
на основании полученных признаков, характерных для орфанных заболеваний, с помощью одного или более модулей решающих правил осуществляют выявление подозрений на орфанные заболевания, причем каждый модуль решающих правил предназначен для выявления подозрения на каждое отдельно взятое орфанное заболевание.
ОПИСАНИЕ ЧЕРТЕЖЕЙ
Реализация изобретения будет описана в дальнейшем в соответствии с прилагаемыми чертежами, которые представлены для пояснения сути изобретения и никоим образом не ограничивают область изобретения.
Заявляемое изобретение проиллюстрировано фигурами 1-6, на которых изображены:
Фиг. 1 - иллюстрирует пример общей архитектуры настоящего решения для определения орфанных заболеваний на основе анализа электронных медицинских карт с применением методов искусственного интеллекта и машинного обучения.
Фиг. 2 - иллюстрирует пример блок-схемы определения орфанных заболеваний на основе анализа электронных медицинских карт с применением методов искусственного интеллекта и машинного обучения.
Фиг. 3 - иллюстрирует пример сигнальной информации в ЭМК пациента для включения пациента в исследование.
Фиг. 4 - иллюстрирует пример сигнальной информации в ЭМК пациента для включения пациента в исследование.
Фиг. 5 - иллюстрирует пример отображения результата определения орфанного заболевания у пациента на основе анализа ЭМК пациента с помощью настоящего изобретения.
Фиг. 6 - иллюстрирует общую схему вычислительного устройства для реализации настоящего изобретения.
ДЕТАЛЬНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ
В приведенном ниже подробном описании реализации изобретения приведены многочисленные детали реализации, призванные обеспечить отчетливое понимание настоящего изобретения. Однако, квалифицированному в предметной области специалисту будет очевидно, каким образом можно использовать настоящее изобретение, как с данными деталями реализации, так и без них. В других случаях хорошо известные методы, процедуры и компоненты не были описаны подробно, чтобы не затруднять излишне понимание особенностей настоящего изобретения.
Кроме того, из приведенного изложения будет ясно, что изобретение не ограничивается приведенной реализацией. Многочисленные возможные модификации, изменения, вариации и замены, сохраняющие суть и форму настоящего изобретения, будут очевидными для квалифицированных в предметной области специалистов.
В настоящем изобретении описан способ и система выявления подозрений на орфанные заболевания на основе анализа электронных медицинских карт (ЭМК) с применением методов искусственного интеллекта и машинного обучения.
Для выполнения обработки ЭМК в целях выявления подозрения на орфанные заболевания на вход попадают обезличенные медицинские документы, включающие в себя записи жалоб, врачебных осмотров, данные ЭКГ и ЭХО-КС заключений, заключений МРТ, СКТ, УЗИ, рентгенологических исследований, результаты лабораторных исследований, листов окончательных диагнозов (ЛОД) и т.д. Из неструктурированных медицинских записей, содержащихся в обезличенных медицинских документах, извлекают признаки, характерные для орфанных заболеваний, с помощью NLP методов и методов регулярных выражений. Для извлечения признаков, характерных для орфанных заболеваний, используют набор обученных модулей. Каждый модуль из набора может извлекать признаки из каждого отдельно взятого типа медицинской документации, например, протоколов операций и выписных эпикризов, протоколов ЭКГ, протоколов ЭхоКС, протоколов МРТ головного мозга, протоколов СКТ, описаний и заключений УЗИ брюшной полости, протоколов рентгенологических исследований, протоколов врачебных осмотров и т.д. Число модулей для извлечения признаков, характерных для орфанных заболеваний, не ограничено.
Признаки, характерные для орфанных заболеваний, определяют, например, на основании анализа медицинской литературы (медицинских справочников, исследований, статей и т.д.).
Ниже приведен пример набора модулей для извлечения признаков, характерных для орфанных заболеваний с применением методов искусственного интеллекта и машинного обучения. В набор входят следующие модули, способных извлекать из текста не менее 80 признаков:
модуль извлечения признаков из протоколов операций и выписных эпикризов;
модуль извлечения признаков из протоколов ЭКГ;
модуль извлечения признаков из протоколов ЭхоКС;
модуль извлечения признаков патологических симптомов из протоколов МРТ головного мозга;
модуль извлечения признаков из протоколов СКТ;
модуль извлечения патологических симптомов из описаний и заключений УЗИ брюшной полости;
модуль извлечения признаков из протоколов рентгенологических исследований;
модуль извлечения признаков из врачебных осмотров.
С помощью модуля для извлечения признаков из протоколов операций и выписных эпикризов извлекают симптомы (признаки), характерные для орфанных заболеваний, например:
1. Аденоидэктомия,
2. Тонзиллэктомия,
3. Имплантация ЭКС или имплантация дефибриллятора,
4. Спленэктомия.
Для извлечения признаков из неструктурированных данных протоколов операций и выписных эпикризов используют, например, метод регулярных выражений (поиск по тексту). Альтернативными методами извлечения признаков являются, например, word2vec, модель fast text. Исходными данными для разработки и обучения модели извлечения признаков из протоколов операций и выписных эпикризов являются размеченные тексты описаний и заключений протоколов операций и выписных эпикризов. На вход обученной модели подают неструктурированные данные протоколов операций и выписных эпикризов, например, строку с описанием и заключением, сформированным из документа «протокол операции», и на выходе получают коды признаков, которые модель выявила в переданном тексте.
С помощью модуля для извлечения признаков из описаний и заключений протоколов ЭКГ извлекают симптомы (признаки), характерные для орфанных заболеваний, например:
1. Полная блокада левой ножки пучка Гиса,
2. Короткий интервал PQ,
3. Гипертрофия левого желудочка,
4. Гипертрофия правого желудочка,
5. Атриовентрикулярная блокада,
6. Полная блокада правой ножки пучка Гиса,
7. Фибрилляция предсердий,
8. Желудочковая экстрасистолия.
Для извлечения признаков из неструктурированных данных инструментальных исследований/протоколов ЭКГ используют, например, метод градиентного бустинга. Альтернативными методами извлечения признаков являются, например, word2vec, модель fast text. Исходными данными для разработки и обучения модели извлечения признаков из протоколов ЭКГ являются размеченные тексты описаний и заключений протоколов ЭКГ. На вход обученной модели подают неструктурированные данные из описаний и заключений протоколов ЭКГ, например, предобработанную общей процедурой предпроцессинга текстовую строку, содержащую текст описания и заключения протоколов ЭКГ, и на выходе модели получают словарь, содержащий словарь из тегов найденных признаков.
В Таблице 1 представлены метрики модели градиентного бустинга для извлечения из протоколов ЭКГ признаков, характерных для орфанных заболеваний. Все метрики приведены в виде доверительных интервалов, при CI=95%.
Таблица 1
(0.9507 - 0.9916)
(0.9698 - 1.0)
(0.9659 - 0.9917)
(0.9947 - 0.9994)
(0.9597 - 0.9956)
(0.9329 - 0.9857)
(0.9538 - 0.9872)
(0.9979 - 0.9997)
(0.9398 - 0.9781)
(0.9458 - 0.9835)
(0.9491 - 0.9768)
(0.985 - 0.9969)
(0.9375 - 0.983)
(0.932 - 0.9829)
(0.9421 - 0.9769)
(0.9951 - 0.9993)
(0.9662 - 0.996)
(0.9724 - 1.0)
(0.974 - 0.9958)
(0.9986 - 0.9999)
(0.9288 - 0.978)
(0.9475 - 0.989)
(0.9459 - 0.9781)
(0.9925 - 0.9983)
(0.9126 - 0.99)
(0.9203 - 0.9918)
(0.9289 - 0.9819)
(0.9938 - 0.9998)
(0.8269 - 0.9146)
(0.8283 - 0.9166)
(0.829 - 0.9044)
(0.9821 - 0.9918)
С помощью модуля для извлечения признаков из описаний и заключений протоколов ЭхоКС извлекают симптомы (признаки), характерные для орфанных заболеваний, например:
1. Фракция выброса левого желудочка,
2. Индекс массы миокарда левого желудочка,
3. Систолическое давление легочной артерии,
4. Диастолическая дисфункция,
5. Митральная недостаточность,
6. Легочная гипертензия,
7. Гипертрофия левого желудочка,
8. Гипертрофия правого желудочка,
9. Нарушение локальной сократимости левого желудочка,
10. Имплантация ЭКС или дефибриллятора.
Для извлечения признаков из неструктурированных данных протоколов ЭхоКС используют, например, метод градиентного бустинга, метод наименования именованных сущностей. Альтернативными методами извлечения признаков являются, например, word2vec, модель fast text. Исходными данными для разработки и обучения модели извлечения признаков из инструментальных исследований/протоколов ЭхоКС являются размеченные тексты описаний и заключений протоколов ЭхоКС. На вход обученной модели подают неструктурированные данные из описаний и заключений протоколов ЭхоКС, например, предобработанную общей процедурой предпроцессинга текстовую строку, содержащую текст описания и заключения протоколов ЭхоКС, и на выходе модели получают словарь, содержащий словарь из тегов найденных признаков.
В Таблицах 2 и 3 представлены метрики моделей для извлечения из протоколов ЭхоКС признаков, характерных для орфанных заболеваний. Все метрики приведены в виде доверительных интервалов, при CI=95%.
Таблица 2
(0.9637 - 0.9864)
(0.9786 - 0.9954)
(0.9732 - 0.9886)
(0.9891 - 0.9967)
(0.9183 - 0.9556)
(0.8481 - 0.8961)
(0.8869 - 0.9193)
(0.9499 - 0.9707)
(0.9656 - 0.9892)
(0.9505 - 0.9804)
(0.9618 - 0.9817)
(0.978 - 0.9923)
(0.9662 - 0.9857)
(0.9781- 0.9941)
(0.9749 - 0.9977)
(0.9776 - 0.9935)
(0.8833 - 1.0)
(0.8235 - 0.9787)
(0.8727 - 0.9708)
(0.9937 - 0.9995)
(0.9009 - 0.9715)
(0.8744 - 0.9497)
(0.8965 - 0.9503)
(0.9917 - 0.9979)
(0.8947 - 1.0)
(0.7872 - 0.9655)
(0.8571 - 0.9677)
(0.9981 - 0.9999)
Таблица 3
С помощью модуля для извлечения признаков из описаний и заключений протоколов МРТ головного мозга извлекают симптомы (признаки), характерные для орфанных заболеваний, например:
1. Расширение пространства Вирхова-Робена,
2. Очаги васкулопатии головного мозга.
Для извлечения признаков из неструктурированных данных инструментальных исследований/протокол МРТ головного мозга используют, например, метод градиентного бустинга. Альтернативными методами извлечения признаков являются, например, word2vec, модель fast text. Исходными данными для разработки и обучения модели извлечения признаков из протоколов МРТ головного мозга являются размеченные тексты описаний и заключений протоколов МРТ головного мозга. На вход обученной модели подают неструктурированные данные из описаний и заключений МРТ головного мозга, например, предобработанную общей процедурой предпроцессинга текстовую строку, содержащую текст описания и заключения МРТ, и на выходе модели получают словарь, содержащий словарь из тегов найденных признаков.
В Таблице 4 представлены метрики модели градиентного бустинга для извлечения из протоколов МРТ головного мозга признаков, характерных для орфанных заболеваний. Все метрики приведены в виде доверительных интервалов, при CI=95%.
Таблица 4
(1.0 - 1.0)
(0.6666 - 1.0)
(0.8 - 1.0)
(0.9904 - 1.0)
(0.5 - 1.0)
(1.0 - 1.0)
(0.6666 - 1.0)
(0.9971 - 1.0)
С помощью модуля для извлечения признаков из описаний и заключений протоколов СКТ извлекают симптомы (признаки), характерные для орфанных заболеваний, например:
1. Сколиоз,
2. Изменение формы позвонков,
3. Остеопороз,
4. Кифоз.
Для извлечения признаков из неструктурированных данных инструментальных исследований/протоколов СКТ используют, например, метод градиентного бустинга. Альтернативными методами извлечения признаков являются, например, word2vec, модель fast text. Исходными данными для разработки и обучения модели извлечения признаков из протоколов СКТ являются размеченные тексты описаний и заключений протоколов СКТ. На вход обученной модели подают неструктурированные данные из описаний и заключений протоколов СКТ, например, предобработанную общей процедурой предпроцессинга текстовую строку, содержащую текст описания и заключения протоколов СКТ, и на выходе модели получают словарь, содержащий словарь из тегов найденных признаков.
В Таблице 5 представлены метрики модели градиентного бустинга для извлечения из протоколов СКТ признаков, характерных для орфанных заболеваний. Все метрики приведены в виде доверительных интервалов, при CI=95%.
Таблица 5
(0.8614 - 0.9249)
(0.9466 - 0.9828)
(0.9083 - 0.9472)
(0.9435 - 0.9714)
(0.8773 - 0.9217)
(0.95 - 0.979)
(0.9173 - 0.9444)
(0.8387- 0.9046)
(0.8333 - 0.9218)
(0.9175 - 0.9787)
(0.8837 - 0.9414)
(0.96- 0.9872)
(0.8421 - 0.9452)
(0.915 - 0.9848)
(0.8888 - 0.9541)
(0.9717- 0.9975)
С помощью модуля для извлечения патологических симптомов из описаний и заключений УЗИ брюшной полости извлекают симптомы (признаки), характерные для орфанных заболеваний, например:
1. Спленомегалия,
2. Гепатомегалия,
3. Гепатоспленомегалия.
Для извлечения признаков из неструктурированных данных инструментальных исследований/протоколов УЗИ используют, например, метод градиентного бустинга. Альтернативными методами извлечения признаков являются, например, word2vec, модель fast text. Исходными данными для разработки и обучения модели извлечения признаков из протоколов УЗИ брюшной полости являются размеченные тексты описаний и заключений протоколов УЗИ брюшной полости. На вход обученной модели подают неструктурированные данные из описаний и заключений протоколов УЗИ брюшной полости, например, предобработанную общей процедурой предпроцессинга текстовую строку, содержащую текст описания и заключения протоколов УЗИ, и на выходе модели получают, например, следующую классификацию текста: 1) в тексте не найдено признаков, 2) найдена спленомегалия, 3) найдена гепатомегалия, 4) найдена гепатоспленомегалия. Так как признаки являются взаимоисключающими, может быть найден либо один из данных признаков, либо они не присутствуют в тексте.
В Таблице 6 представлены метрики модели градиентного бустинга для извлечения из протоколов УЗИ брюшной полости признаков, характерных для орфанных заболеваний. Все метрики приведены в виде доверительных интервалов, при CI=95%.
Таблица 6
(0.973 - 0.992)
(0.965 - 0.986)
(0.972 - 0.987)
(0.990 - 0.997)
(0.722 - 1.0)
(0.720 - 1.0)
(0.757 - 0.978)
(0.997 - 1.0)
(0.855 - 0.935)
(0.898 - 0.965)
(0.885 - 0.94)
(0.989 - 0.997)
(0.852 - 1.0)
(0.725 - 0.97)
(0.806 - 0.963)
(0.992 - 1.0)
С помощью модуля извлечения признаков из описаний и заключений протоколов рентгенологических исследований извлекают симптомы (признаки), характерные для орфанных заболеваний, например:
1. Сколиоз,
2. Кифоз,
3. Изменение формы позвонков,
4. Перелом,
5. Остеопороз,
6. Дисплазия тазобедренного сустава,
7. Остеонекроз,
8. Эндопротезирование тазобедренного сустава,
9. Патологический перелом.
Для извлечения признаков из неструктурированных данных инструментальных исследований/протоколов рентгенологического исследования используют, например, метод градиентного бустинга. Альтернативными методами извлечения признаков являются, например, word2vec, модель fast text. Исходными данными для разработки и обучения модели извлечения признаков из протоколов рентгенологического исследования являются размеченные тексты описаний и заключений протоколов рентгенологического исследования. На вход обученной модели подают неструктурированные данные из описаний и заключений протоколов рентгенологического исследования, например, предобработанную общей процедурой предпроцессинга текстовую строку, содержащую текст описания и заключения протоколов рентгенологического исследования, и на выходе модели получают словарь, содержащий словарь из тегов найденных признаков.
В Таблице 7 представлены метрики модели градиентного бустинга для извлечения из протоколов рентгенологического исследования признаков, характерных для орфанных заболеваний. Все метрики приведены в виде доверительных интервалов, при CI=95%.
Таблица 7
(0.8965 - 0.9638)
(0.6644 - 0.7649)
(0.7695 - 0.8439)
(0.9776 - 0.9896)
(0.6666 - 0.9)
(0.4561 - 0.6823)
(0.5611 - 0.7518)
(0.9856 - 0.9954)
(0.7166 - 0.8582)
(0.2463 - 0.3447)
(0.3708 - 0.4875)
(0.853 - 0.8884)
(0.92 - 0.992)
(0.5906 - 0.7291)
(0.7298 - 0.8301)
(0.9507 - 0.9785)
(0.8571 - 0.9642)
(0.4914 - 0.6441)
(0.6342 - 0.761)
(0.9627 - 0.9825)
(0.9444 - 1.0)
(0.913 - 1.0)
(0.9423 - 0.9921)
(0.9825 - 1.0)
(0.9405 - 1.0)
(1.0 - 1.0)
(0.9693 - 1.0)
(0.9998 - 1.0)
(0.915 - 0.9811)
(0.9671 - 1.0)
(0.9476 - 0.9868)
(0.9972 - 1.0)
(0.9444 - 1.0)
(0.7884 - 0.9298)
(0.8695 - 0.9565)
(0.9878 - 0.9989)
С помощью модуля извлечения признаков из протоколов врачебных осмотров извлекают симптомы (признаки), характерные для орфанных заболеваний, например:
Набор 1:
1. Боль в руках,
2. Боль в ногах,
3. Оссалгия,
4. Лихорадка,
5. Покраснение кожи,
6. Носовые кровотечения,
7. Синяки,
8. Боль в кистях, пальцах, стопах,
9. Жжение в ногах, пальцах, кистях,
10. Скованность в суставах.
Набор 2:
1. Запоры,
2. Тошнота,
3. Боли в животе возникающие переодически,
4. Неустойчивый стул,
5. Вздутие живота,
6. Сухость кожи,
7. Увеличение миндалин.
Набор 3:
1. Хронические отиты,
2. Плохо слышит,
3. Шумы в сердце,
4. Судороги,
5. Нарушение глотания,
6. Поперхивается пищей.
Набор 4:
1. Парастезия,
2. Миалгия,
3. Артралгия,
4. Мышечные боли,
5. Суставные боли,
6. Снижение слуха,
7. Звон в ушах,
8. Большая голова,
9. Увеличение языка,
10. Аденоидэктомия,
11. Тонзиллэктомия,
12. Тугоухость,
13. Кифоз,
14. Сколиоз,
15. Туннельный синдром,
16. Слабость,
17. Утомляемость,
18. Астения,
19. Апатия,
20. Синдром когтистой лапы,
21. Задержка речи,
22. Диарея.
Признаки были разделены на несколько наборов, признаки из наборов 1, 2, 3 извлекались при помощи методов машинного обучения, а признаки из набора 4 при помощи регулярных выражений. Наборы были разделены с учетом обобщающего критерия, например, набор 1 содержит обобщающие критерии Костные кризы и Нейропатическая боль, набор 2 - Нарушение функции ЖКТ, Патология миндалин, набор 3 - Патология ушей, Поражение ЦНС при СХ.
Для извлечения признаков из неструктурированных данных протоколов врачебного осмотра (жалобы, анамнез, объективные данные и т.д.) используют, например, метод градиентного бустинга, метод регулярных выражений. Альтернативными методами извлечения признаков являются, например, word2vec, модель fast text. Исходными данными для разработки и обучения модели извлечения признаков из протоколов врачебного осмотра являются размеченные тексты описаний и заключений протоколов врачебного осмотра. На вход обученной модели подают неструктурированные данные из описаний и заключений протоколов врачебного осмотра, например, предобработанные общей процедурой предпроцессинга текстовую строку, содержащую текст описания и заключения протоколов врачебного осмотра, и на выходе модели получают словарь, содержащий словарь из тегов найденных признаков.
В Таблице 8 представлены метрики модели градиентного бустинга для извлечения из протоколов врачебного осмотра признаков, характерных для орфанных заболеваний. Все метрики приведены в виде доверительных интервалов, при CI=95%.
Таблица 8
(0.8865- 0.9875)
(0.7108 - 0.8571)
(0.7976 - 0.9032)
(0.9027 - 0.9743)
(0.8343 - 0.9298)
(0.8761 - 0.9415)
(0.7241 - 0.9687)
(0.7 - 0.9459)
(0.7407 - 0.9275)
(0.9090 - 1.0)
(0.8205 - 0.9545)
(0.8767 - 0.964)
(0.5 - 1.0)
(0.0769 - 0.5)
(0.1379 - 0.64)
(0.8644 - 0.9673)
(0.9647 - 1.0)
(0.9215 - 0.9807)
(0.0 - 1.0)
(0.0- 0.5)
(0.0 - 0.6666)
(0.9166 - 1.0)
(0.574 - 0.8043)
(0.7209 - 0.8863)
(0.8536 - 1.0)
(0.7272 - 0.9361)
(0.8095 - 0.9473)
(1.0 - 1.0)
(0.387 - 0.7027)
(0.5581 - 0.8253)
(0.7425 - 0.8597)
(0.875 - 0.9612)
(0.8143 - 0.8954)
(0.8169 - 0.9126)
(0.9265 - 0.985)
(0.8771 - 0.9396)
(0.447 - 0.6477)
(0.328 - 0.5)
(0.3827 - 0.5479)
(0.8128 - 0.9151)
(0.7347 - 0.8472)
(0.7835 - 0.8691)
(0.858 - 0.9423)
(0.9166 - 0.9801)
(0.8971 - 0.9534)
(0.7338 - 0.8796)
(0.7 - 0.8487)
(0.7326 - 0.8502)
(0.9206 - 0.9864)
(0.9197 - 0.9855)
(0.9306 - 0.9782)
(0.5 - 1.0)
(1.0 - 1.0)
(0.6666 - 1.0)
(0.8952 - 0.9657)
(0.902 - 0.9689)
(0.9071 - 0.9591)
(1.0 - 1.0)
(0.5555 - 1.0)
(0.7142 - 1.0)
(0.7982 - 0.9173)
(0.875 - 0.9655)
(0.8487 - 0.9314)
(0.6363 - 1.0)
(0.4285 - 1.0)
(0.5454 - 0.9629)
(0.5714 - 1.0)
(1.0 - 1.0)
(0.7272 - 1.0)
Далее на основании извлеченных признаков, характерных для орфанных заболеваний, выявляют подозрения на орфанные заболевания с помощью одного или более модулей решающих правил. Каждый модуль решающих правил предназначен для выявления подозрения на каждое отдельно взятое орфанное заболевание.
Признаки, на основании которых с помощью решающих правил определяют каждое отдельно взятое орфанное заболевание, получают на основании анализа медицинской литературы (медицинских справочников, исследований, статей и т.д.).
На Фиг. 1 приведен пример общей архитектуры решения для определения орфанных заболеваний, например, болезни Гоше, болезни Фабри и синдрома Хантера на основе анализа электронных медицинских карт. Пакет деперсонифицированных медицинских данных о пациенте передают на обработку в набор модулей, которые извлекают признаки с помощью NLP метода и метода регулярных выражений (форматно-логический контроль). Далее наборы признаков (для каждого заболевания отдельный набор признаков) передают в модули решающих правил (для каждого заболевания отдельный модуль решающих правил) для выявления подозрений на БГ, БФ, СХ. Алгоритмы решающих правил разрабатываются на основании опубликованных данных по орфанным заболеваниям, например, таких как справочники, составленные на основе шкал, клинические рекомендации, различные публикации и т.д. NLP модели обучают с помощью модуля машинного обучения и выбирают наилучшие методы для анализа деперсонифицированных медицинских данных. В случае выявления подозрений на орфанное заболевание формируют рекомендации с помощью модуля экспертного формирования рекомендаций. Например, в рекомендациях отображают выявленные симптомы, на какое орфанное заболевание выявлено подозрение, а также индивидуальные рекомендации. На основании новых опубликованных данных по орфанным заболеваниям в симптомчекеры (процессоры решающих правил) добавляются новые правила, корректируются существующие правила.
С помощью модуля извлечения признаков из протоколов операций и выписных эпикризов извлекают признаки, характерные для болезни Гоше; с помощью модуля извлечения признаков из протоколов ЭКГ извлекают признаки, характерные для болезни Фабри; с помощью модуля извлечения признаков из протоколов ЭхоКС извлекают признаки, характерные для болезни Фабри и синдрома Хантера; с помощью модуля извлечения признаков патологических симптомов из протоколов МРТ головного мозга извлекают признаки, характерные для болезни Фабри; с помощью модуля извлечения признаков из протоколов СКТ извлекают признаки, характерные для болезни Гоше и синдрома Хантера; с помощью модуля извлечения патологических симптомов из описаний и заключений УЗИ брюшной полости извлекают признаки, характерные для болезни Гоше и синдрома Хантера; с помощью модуля извлечения признаков из протоколов рентгенологических исследований извлекают признаки, характерные для болезни Гоше и синдрома Хантера; с помощью модуля извлечения признаков из врачебных осмотров извлекают признаки, характерные для болезни Гоше, болезни Фабри, синдрома Хантера.
Дополнительно данные пациента оцениваются на соответствие критериям включения в исследование перед тем, как из неструктурированных медицинских записей, содержащихся в ЭМК пациента, с помощью набора обученных модулей осуществляют извлечение признаков, характерных для орфанных заболеваний.
Общие для БГ, БФ, СХ критерии включения пациента в исследование:
1. Возраст до 55 лет;
2. Наличие как минимум одного врачебного осмотра;
3. Наличие как минимум одного лабораторного исследования.
На основании извлеченных признаков, характерных для орфанных заболеваний, выявляют подозрения на орфанные заболевания с помощью одного или более модулей решающих правил. Каждый модуль решающих правил предназначен для выявления подозрения на каждое отдельно взятое орфанное заболевание. Для выявления подозрения на каждое орфанное заболевание формируются дополнительные условия.
Условиями для выявления подозрения на болезнь Фабри с помощью модели на основе решающих правил являются следующие:
Диагнозы исключения: СД и ВИЧ-инфекция, врожденные пороки сердца
4 проверки:
1. Мужской пол от7 до 18 лет; женский пол от 10 до 18 лет.
+ Нейропатическая боль (исключить пациентов с травмой и ожогами коды МКБ-10 S50-S69, S80-S99, T00-T07, T23, T25, T29).
+ Протеинурия (протеинурия> 0,15 г/л, встречаемость > 2 раз).
2. Пациенты от 19 до 55 лет (исключить беременных коды МКБ-10 O00-O99) с нарушением функции почек (протеинурия> 0,15 г/л, встречаемость > 3 раз плюс СКФ˂60 мл/мин).
3. Пациенты 20-50 лет с ГЛЖ или ГПЖ или с гипертрофической кардиомиопатией (исключить из расчета алгоритма: - БА (коды МКБ-10 J45-46), ХОБЛ (коды МКБ-10 J43-44), АГ (коды МКБ-10 I10-15), ЛАГ (коды МКБ-10 I27-28), заболевания печени (коды МКБ-10 K74)).
4. Пациенты 20-35 лет с ОНМК в анамнезе.
Условиями для выявления подозрения на болезнь Гоше с помощью модели на основе решающих правил являются следующие:
Все пациенты от 2 до 55 лет.
Диагнозы исключения: ВИЧ-инфекция (коды МКБ-10 B20-B24), алкоголизм (код МКБ-10 F10), наркомания (коды МКБ-10 F11-F19), злокачественные новообразования (коды МКБ-10 C00-C97), токсический цирроз печени (коды МКБ-10 K70.3-K71.7).
После получения оценки из результатов исключить инфекционные заболевания, как возможные причины спленомегалии (столбец с признаком «инфекционное заболевание» (включает в себя ккоды МКБ-10 А0.1.0, А02.1, B25.1, D82.3, B58.1) и столбец с датами признака «инфекционное заболевание»).
5 проверок:
1. Пациенты до 18 лет со спленомегалией 1 раз.
2. Пациенты после 18 лет со спленомегалией 2 и более раза (исключить отсутствие спленомегалии в динамике).
3. Пациенты со спленэктомией (исключение коды МКБ-10: S30-S39, T00-T07).
4. Пациенты с тромбоцитопенией и спленомегалией.
5. Пациенты с ИТП.
Условиями для выявления подозрения на синдром Хантера с помощью модели на основе решающих правил являются следующие:
Все пациенты от 1 года до 7 лет.
Диагноз исключения: ВИЧ-инфекция.
3 проверки:
1. Пациенты с патологией ушей (хронические отиты), встречаемость 2 и более раз и с грыжами или герниопластикой в анамнезе.
2. Пациенты с патологией миндалин и с грыжами или герниопластикой в анамнезе
3. Пациенты с патологией ушей (хронические отиты) и с грыжами или герниопластикой в анамнезе и с патологией миндалин.
Приведен пример осуществления настоящего изобретения, который не должен использоваться как ограничивающий иные, частные примеры осуществления настоящего изобретения, которые не выходят за рамки испрашиваемого объема правовой охраны и являются очевидными для специалистов в соответствующей области техники.
Данные пациента из ЭМК передаются автоматически как в формализованном виде, так и в неформализованном виде для обработки с помощью настоящего изобретения. Данные в формализованном виде поддаются форматно-логическому контролю с использованием правил, основанных на логических выражениях. Данные в неформализованном виде обрабатываются с помощью NLP моделей с дальнейшим извлечением признаков (симптомов) для анализа. Модели работают независимо друг от друга. Каждая обрабатывает текст ЭМК, извлекает признаки, которые объединяются в итоговый набор по документу. Кроме того, перед тем как данные поддаются обработке с помощью набора NLP моделей и логических выражений для извлечения признаков, характерных для орфанных заболеваний, данные оцениваются на соответствие критериям включения в исследование. Далее обработанные данные попадают на автоматическую оценку по заданным алгоритмам выявления подозрений на орфанные заболевания на основе решающих правил (алгоритм выявления подозрения на болезнь Фабри, алгоритм выявления подозрения на болезнь Гоше, алгоритм выявления подозрения на синдром Хантера) с помощью одного или более модулей решающих правил. Каждый модуль решающих правил выявляет подозрение на отдельно взятое орфанное заболевание. Результатом оценки является подозрение на наличие заболевания с указанием списка выявленных симптомов по нозологии (Фиг. 2).
Например, пациент 123 (ХХХ) (женский пол, 02.06.2009 г.р.).
Изначально пациент подходит под основные критерии включения:
1. Возраст до 55 лет;
2. Наличие как минимум одного врачебного осмотра;
3. Наличие как минимум одного лабораторного исследования.
Сигнальная информация в ЭМК пациента для включения пациента в исследование показана на Фиг. 3, 4 - 02.06.2009 г.р. (возраст до 55 лет), наличие УЗИ органов брюшной полости (наличие врачебного осмотра и лабораторного исследования).
После анализа ЭМК пациента с помощью NLP моделей и логических выражений был выявлен ряд признаков, в том числе спленомегалия (Фиг. 4).
Так как пациент младше 18 лет и встречается признак спленомегалия, то срабатывает подозрение на Болезнь Гоше. На экране в платформе прогнозной аналитики и управления рисками в здравоохранении на основе искусственного интеллекта отображается данное выявленное подозрение (Фиг. 5).
На Фиг. 6 представлена общая схема вычислительного устройства (600), обеспечивающего обработку данных, необходимую для реализации заявленного решения.
В общем случае устройство (600) содержит такие компоненты, как: один или более процессоров (601), по меньшей мере одну память (602), средство хранения данных (603), интерфейсы ввода/вывода (604), средство В/В (605), средства сетевого взаимодействия (606).
Процессор (601) устройства выполняет основные вычислительные операции, необходимые для функционирования устройства (600) или функциональности одного или более его компонентов. Процессор (601) исполняет необходимые машиночитаемые команды, содержащиеся в оперативной памяти (602).
Память (602), как правило, выполнена в виде ОЗУ и содержит необходимую программную логику, обеспечивающую требуемый функционал.
Средство хранения данных (603) может выполняться в виде HDD, SSD дисков, рейд массива, сетевого хранилища, флэш-памяти, оптических накопителей информации (CD, DVD, MD, Blue-Ray дисков) и т.п. Средство (603) позволяет выполнять долгосрочное хранение различного вида информации.
Интерфейсы (604) представляют собой стандартные средства для подключения и работы с серверной частью, например, USB, RS232, RJ45, LPT, COM, HDMI, PS/2, Lightning, FireWire и т.п.
Выбор интерфейсов (604) зависит от конкретного исполнения устройства (600), которое может представлять собой персональный компьютер, мейнфрейм, серверный кластер, тонкий клиент, смартфон, ноутбук и т.п.
В качестве средств В/В данных (605) в любом воплощении системы должна использоваться клавиатура. Аппаратное исполнение клавиатуры может быть любым известным: это может быть, как встроенная клавиатура, используемая на ноутбуке или нетбуке, так и обособленное устройство, подключенное к настольному компьютеру, серверу или иному компьютерному устройству. Подключение при этом может быть, как проводным, при котором соединительный кабель клавиатуры подключен к порту PS/2 или USB, расположенному на системном блоке настольного компьютера, так и беспроводным, при котором клавиатура осуществляет обмен данными по каналу беспроводной связи, например, радиоканалу, с базовой станцией, которая, в свою очередь, непосредственно подключена к системному блоку, например, к одному из USB-портов. Помимо клавиатуры, в составе средств В/В данных также может использоваться: джойстик, дисплей (сенсорный дисплей), проектор, тачпад, манипулятор мышь, трекбол, световое перо, динамики, микрофон и т.п.
Средства сетевого взаимодействия (606) выбираются из устройств, обеспечивающих сетевой прием и передачу данных, например, Ethernet карту, WLAN/Wi-Fi модуль, Bluetooth модуль, BLE модуль, NFC модуль, IrDa, RFID модуль, GSM модем и т.п. С помощью средств (605) обеспечивается организация обмена данными по проводному или беспроводному каналу передачи данных, например, WAN, PAN, ЛВС (LAN), Интранет, Интернет, WLAN, WMAN или GSM, 3G, 4G, 5G.
Компоненты устройства (600) сопряжены посредством общей шины передачи данных (607).
В настоящих материалах заявки представлено предпочтительное раскрытие осуществления заявленного технического решения, которое не должно использоваться как ограничивающее иные, частные воплощения его реализации, которые не выходят за рамки испрашиваемого объема правовой охраны и являются очевидными для специалистов в соответствующей области техники.
Специалисту в данной области техники должно быть понятно, что различные вариации заявляемого способа и системы не изменяют сущность изобретения, а лишь определяют его конкретные воплощения и применения.
Источники
[1] Yu Deng и др, Natural language processing to identify lupus nephritis phenotype in electronic health records, опубликовано в Интернет 20.12.2021 https://arxiv.org/ftp/arxiv/papers/2112/2112.10821.pdf.
[2] Hang Dong и др., Rare Disease Identification from Clinical Notes with Ontologies and Weak Supervision, опубликовано в Интернет 05.05.2021
https://arxiv.org/pdf/2105.01995.pdf.
название | год | авторы | номер документа |
---|---|---|---|
СИСТЕМА ДЛЯ ПОДДЕРЖКИ ПРИНЯТИЯ ВРАЧЕБНЫХ РЕШЕНИЙ | 2020 |
|
RU2752792C1 |
СПОСОБ РАННЕЙ ДИАГНОСТИКИ ХРОНИЧЕСКИХ ЗАБОЛЕВАНИЙ ПАЦИЕНТА, ОСНОВАННЫЙ НА КЛАСТЕРНОМ АНАЛИЗЕ БОЛЬШИХ ДАННЫХ | 2021 |
|
RU2800315C2 |
Способ и система поддержки принятия врачебных решений с использованием математических моделей представления пациентов | 2017 |
|
RU2703679C2 |
СИСТЕМА ПОДДЕРЖКИ ПРИНЯТИЯ ВРАЧЕБНЫХ РЕШЕНИЙ | 2023 |
|
RU2818874C1 |
СИСТЕМА ПОДДЕРЖКИ ПРИНЯТИЯ ВРАЧЕБНЫХ РЕШЕНИЙ НА ОСНОВЕ АНАЛИЗА МЕДИЦИНСКИХ ИЗОБРАЖЕНИЙ | 2021 |
|
RU2789260C1 |
УСТРОЙСТВО И СПОСОБ ДЛЯ ОПРЕДЕЛЕНИЯ ГРАНИЦ ПАТОЛОГИИ НА МЕДИЦИНСКОМ ИЗОБРАЖЕНИИ | 2022 |
|
RU2813938C1 |
УСТРОЙСТВО И СПОСОБ ДЛЯ ОПРЕДЕЛЕНИЯ ПАТОЛОГИИ ОРГАНОВ ГРУДНОЙ КЛЕТКИ НА ОСНОВЕ РЕНТГЕНОВСКИХ ИЗОБРАЖЕНИЙ | 2021 |
|
RU2782518C1 |
УСТРОЙСТВО И СПОСОБ ДЛЯ АНАЛИЗА МЕДИЦИНСКИХ ИЗОБРАЖЕНИЙ | 2022 |
|
RU2806982C1 |
Способ формирования математических моделей пациента с использованием технологий искусственного интеллекта | 2017 |
|
RU2720363C2 |
Аппаратно-программный комплекс электрокардиографических измерений | 2020 |
|
RU2759404C1 |
Группа изобретений относится к медицине и может быть использована для выявления подозрений на орфанные заболевания на основе анализа электронной медицинской карты (ЭМК) пациента с применением методов искусственного интеллекта (ИС) и машинного обучения (МО). В способе из неструктурированных медицинских записей, содержащихся в ЭМК пациента, с применением методов искусственного интеллекта и машинного обучения с помощью набора модулей осуществляют извлечение признаков, характерных для орфанных заболеваний, на основании полученных признаков, характерных для орфанных заболеваний, с помощью одного или более модулей решающих правил осуществляют выявление подозрений на орфанные заболевания, причем каждый модуль решающих правил предназначен для выявления подозрения на каждое отдельно взятое орфанное заболевание. Группа изобретений обеспечивает выявление пациентов с подозрением на орфанные заболевания. 2 н. и 5 з.п. ф-лы, 6 ил., 8 табл.
1. Компьютерно-реализуемый способ выявления подозрений на орфанные заболевания на основе анализа электронной медицинской карты (ЭМК) пациента с применением методов искусственного интеллекта и машинного обучения, содержащий следующие этапы:
из неструктурированных медицинских записей, содержащихся в ЭМК пациента, с применением методов искусственного интеллекта и машинного обучения с помощью набора модулей осуществляют извлечение признаков, характерных для, по меньшей мере, следующих орфанных заболеваний - болезни Гоше, болезни Фабри, синдрома Хантера,
причем с помощью набора модулей извлекают из протоколов операций и выписных эпикризов признаки, характерные для болезни Гоше; извлекают из протоколов ЭКГ признаки, характерные для болезни Фабри; извлекают из протоколов ЭхоКС признаки, характерные для болезни Фабри и синдрома Хантера; извлекают из протоколов МРТ головного мозга признаки, характерные для болезни Фабри; извлекают из протоколов СКТ признаки, характерные для болезни Гоше и синдрома Хантера; извлекают из описаний и заключений УЗИ брюшной полости признаки, характерные для болезни Гоше и синдрома Хантера; извлекают из протоколов рентгенологических исследований признаки, характерные для болезни Гоше и синдрома Хантера; извлекают из врачебных осмотров признаки, характерные для болезни Гоше, болезни Фабри, синдрома Хантера;
на основании полученных признаков, характерных для орфанных заболеваний, с помощью модулей решающих правил осуществляют выявление подозрений на орфанные заболевания - болезнь Гоше, болезнь Фабри, синдром Хантера, причем каждый модуль решающих правил предназначен для выявления подозрения на каждое отдельно взятое орфанное заболевание - модуль решающих правил для выявления подозрения на болезнь Гоше, модуль решающих правил для выявления подозрения на болезнь Фабри, модуль решающих правил для выявления подозрения на синдром Хантера.
2. Способ по п. 1, характеризующийся тем, что извлекают из ЭМК пациента признаки, характерные для орфанных заболеваний, с помощью NLP методов и методов регулярных выражений.
3. Способ по п. 1, характеризующийся тем, что набор модулей для извлечения признаков, характерных для орфанных заболеваний, содержит, по меньшей мере:
модуль извлечения признаков из протоколов операций и выписных эпикризов;
модуль извлечения признаков из протоколов ЭКГ; модуль извлечения признаков из протоколов ЭхоКС;
модуль извлечения признаков патологических симптомов из протоколов МРТ головного мозга;
модуль извлечения признаков из протоколов СКТ;
модуль извлечения патологических симптомов из описаний и заключений УЗИ брюшной полости;
модуль извлечения признаков из протоколов рентгенологических исследований;
модуль извлечения признаков из протоколов врачебных осмотров.
4. Способ по п. 1, характеризующийся тем, что с помощью модуля извлечения признаков из протоколов операций и выписных эпикризов извлекают признаки, характерные для болезни Гоше; с помощью модуля извлечения признаков из протоколов ЭКГ извлекают признаки, характерные для болезни Фабри; с помощью модуля извлечения признаков из протоколов ЭхоКС извлекают признаки, характерные для болезни Фабри и синдрома Хантера; с помощью модуля извлечения признаков патологических симптомов из протоколов МРТ головного мозга извлекают признаки, характерные для болезни Фабри; с помощью модуля извлечения признаков из протоколов СКТ извлекают признаки, характерные для болезни Гоше и синдрома Хантера; с помощью модуля извлечения патологических симптомов из описаний и заключений УЗИ брюшной полости извлекают признаки, характерные для болезни Гоше и синдрома Хантера; с помощью модуля извлечения признаков из протоколов рентгенологических исследований извлекают признаки, характерные для болезни Гоше и синдрома Хантера; с помощью модуля извлечения признаков из врачебных осмотров извлекают признаки, характерные для болезни Гоше, болезни Фабри, синдрома Хантера.
5. Способ по п. 1, характеризующийся тем, что признаки, характерные для орфанных заболеваний, извлекаемые с помощью модуля извлечения признаков из врачебных осмотров, разделяют на наборы признаков с учетом обобщающего критерия.
6. Способ по п. 1, характеризующийся тем, что дополнительно данные пациента оцениваются на соответствие критериям включения в исследование перед тем, как из неструктурированных медицинских записей, содержащихся в ЭМК пациента, с помощью набора модулей осуществляют извлечение признаков, характерных для орфанных заболеваний.
7. Система для выявления подозрений на орфанные заболевания на основе анализа электронной медицинской карты (ЭМК) пациента с применением методов искусственного интеллекта и машинного обучения для осуществления способа по пп. 1-6, которая содержит, по меньшей мере, один процессор, память и инструкции, хранимые в памяти и исполняемые процессором, с помощью которых осуществляют следующие этапы:
из неструктурированных медицинских записей, содержащихся в ЭМК пациента, с применением методов искусственного интеллекта и машинного обучения с помощью набора модулей осуществляют извлечение признаков, характерных для, по меньшей мере, следующих орфанных заболеваний - болезни Гоше, болезни Фабри, синдрома Хантера,
причем с помощью набора модулей извлекают из протоколов операций и выписных эпикризов признаки, характерные для болезни Гоше; извлекают из протоколов ЭКГ признаки, характерные для болезни Фабри; извлекают из протоколов ЭхоКС признаки, характерные для болезни Фабри и синдрома Хантера; извлекают из протоколов МРТ головного мозга признаки, характерные для болезни Фабри; извлекают из протоколов СКТ признаки, характерные для болезни Гоше и синдрома Хантера; извлекают из описаний и заключений УЗИ брюшной полости признаки, характерные для болезни Гоше и синдрома Хантера; извлекают из протоколов рентгенологических исследований признаки, характерные для болезни Гоше и синдрома Хантера; извлекают из врачебных осмотров признаки, характерные для болезни Гоше, болезни Фабри, синдрома Хантера;
на основании полученных признаков, характерных для орфанных заболеваний, с помощью модулей решающих правил осуществляют выявление подозрений на орфанные заболевания - болезнь Гоше, болезнь Фабри, синдром Хантера, причем каждый модуль решающих правил предназначен для выявления подозрения на каждое отдельно взятое орфанное заболевание - модуль решающих правил для выявления подозрения на болезнь Гоше, модуль решающих правил для выявления подозрения на болезнь Фабри, модуль решающих правил для выявления подозрения на синдром Хантера.
US 2020202974 A1, 25.06.2020 | |||
US 11145400 B1, 12.10.2021 | |||
US 2021090694 A1, 25.03.2021 | |||
US 2021210205 A1, 08.07.2021. |
Авторы
Даты
2024-08-07—Публикация
2022-06-06—Подача