СПОСОБ РАННЕЙ ДИАГНОСТИКИ ХРОНИЧЕСКИХ ЗАБОЛЕВАНИЙ ПАЦИЕНТА, ОСНОВАННЫЙ НА КЛАСТЕРНОМ АНАЛИЗЕ БОЛЬШИХ ДАННЫХ Российский патент 2023 года по МПК A61B5/00 G16H10/60 G16H50/20 

Описание патента на изобретение RU2800315C2

ОБЛАСТЬ ТЕХНИКИ

Изобретение относится к области медицины, а также к области информационных и коммуникационных технологий для обработки медицинских данных, в частности к способу ранней диагностики хронических заболеваний пациента, основанный на кластерном анализе больших данных.

Представленное решение может быть использовано, по меньшей мере, в клинической практике врачами и другими медицинскими специалистами, которые занимаются диагностикой, лечением и профилактикой заболеваний, при прогнозе наступления различных медицинских событий для пациента.

УРОВЕНЬ ТЕХНИКИ

Из уровня техники известен источник информации RU 2698007 С1, опубликованный 21.08.2019 года и раскрывающий автоматическую систему поддержки медицинских решений при сочетанной патологии. Система содержит блок интерфейса, блок входных данных, выполненный в формате электронной истории болезней, блок хранения решений для каждой из терапевтических областей, вычислительный блок, блок проверки на противоречивость вводимых данных, блок выдачи решений, блок рекомендаций по лечению, при этом блок интерфейса выполнен с возможностью получения данных от клинициста, или от баз данных с электронными историями болезней, или из хранилищ «больших данных», при этом блок интерфейса выполнен с возможностью обмена данными с блоком входных данных, с блоком выдачи решений и с блоком рекомендаций по лечению, при этом блок входных данных выполнен в формате электронной истории болезни с возможностью передачи вводимой информации в вычислительный блок и с возможностью хранения эталонных моделей различных заболеваний, соответствующих разным органам и системам человека, при этом блок входных данных выполнен с возможностью передачи данных в блок проверки на противоречивость вводимых данных, а вычислительный блок выполнен с возможностью пересчета весовых коэффициентов, приписанных к симптомам или признакам для каждого заболевания конкретного органа или системы организма человека, и баллов в пользу конкретных заболеваний, при этом блок интерфейса, блок входных данных и блок проверки на противоречивость, блок хранения решений, вычислительный блок, блок выдачи решений, блок рекомендаций по лечению выполнены с возможностью работы на вызовах, и/или в удаленных районах, и/или в зонах чрезвычайных ситуаций без устойчивого доступа в интернет, блок выдачи решений выполнен с возможностью вывода информации обо всех эталонных историях заболеваний с выделением признаков или симптомов, выявленных при обследовании пациента, или вывода информации о тех эталонных заболеваниях, в которых есть общие признаки или симптомы с данными, полученными в ходе обследования, и с возможностью сопоставления каждой эталонной модели заболевания с введенными данными обследования пациента; анализа достаточности данных обследования для определения заболеваний; запроса дополнительных обследований в случае невозможности определения заболевания или назначения плана лечения; группирования заболеваний по органам или системам организма человека, при этом блок рекомендаций по лечению выполнен с возможностью получения данных из блока входных данных и блока выдачи решений и вывода оптимального плана лечения на блок интерфейса.

Недостатком предлагаемого решения является то, что диагностика заболеваний осуществляется на основе симптомов заболевания. В предлагаемом решении используются только сведения о здоровье пациента и факторы риска, извлеченные из электронной медицинской карты пациента. Также отличием предлагаемого решения является определение диагностирования хронических заболеваний посредством ансамбля классификаторов.

СУЩНОСТЬ ИЗОБРЕТЕНИЯ

Технической задачей, на решение которой направлено заявленное решение, является необходимость разработки способа ранней диагностики хронических заболеваний пациента, а также создании набора классификаторов для определения хронических заболеваний., Предлагаемое решение решает заявленную техническую проблему, путем разработки способа ранней диагностики хронических заболеваний пациента на основе использования набора классификаторов, которое охарактеризовано в независимом пункте формулы. Дополнительные варианты реализации настоящего изобретения представлены в зависимых пунктах изобретения.

Технический результат заключается в повышении точности раннего диагностирования хронических заболеваний пациента и определения риска развития осложнений хронических заболеваний, за счет использования набора классификаторов, так как по полученным данным будет происходить проверка по всем хроническим заболеваниям, на которые обучен классификатор, и оценивать риски развития хронических болезней у пациента. Дополнительным техническим результатом является увеличение производительности серверной инфраструктуры, на которой реализуется способ при решении поставленной задачи (т.е. за счет реализации описываемого способа появляется возможность производить обработку данных с получением результата за меньшее количество времени), тем самым снижая нагрузку на центральные процессоры вычислительных устройств/серверов, за счет уменьшения количества обрабатываемых запросов.

Заявленный результат достигается за счет применения способа ранней диагностики хронических заболеваний пациента, выполняющийся на вычислительном устройстве, содержащем процессор и память, хранящую инструкции, исполняемые процессором и содержащие следующие этапы:

получают деперсонифицированные медицинские данные электронной медицинской карты от медицинской информационной системы на вычислительное устройство;

на вычислительном устройстве осуществляют извлечение медицинских и социальных признаков о состоянии здоровья пациента, а также признаки факторов риска посредством Natural language processing;

извлеченные признаки поступают на вход обученного набора классификаторов для отнесения признаков к классу вероятности наличия хронических заболеваний, при это обучение набора классификатора заключается в обучении по меньшей мере одного классификатора на по меньшей мере одно хроническое заболевание и содержит следующие этапы:

осуществляют деление извлеченных медицинских и социальных признаков о состоянии здоровья пациента на группы;

осуществляют деление полученных групп на кластеры по диагностированным у них заболеваниям, согласно данным электронной медицинской карты и медицинских и социальных признаков о состоянии здоровья пациента, причем объединяют группы в кластеры с общими диагнозами;

получают значения медицинских и социальных признаков о состоянии здоровья пациента и признаков факторов риска в каждом кластере, по которым будет происходит отнесение извлеченных признаков к классам вероятности наличия хронических заболеваний;

осуществляют оценку риска развития осложнений хронических заболеваний, отнесенных к классу вероятности наличия хронических заболеваний по классу МКБ;

на выходе ансамбля классификаторов получают класс вероятности наличия хронических заболеваний, по классу МКБ, и оценку риска развития осложнений хронических заболеваний.

В частном варианте реализации предлагаемого решения, медицинские и социальные признаки о состоянии здоровья пациента включают в себя: пол, возраст, социальный статус, регион проживания, физиологические параметры, лабораторные показатели.

В другом частном варианте реализации предлагаемого решения, признаки фактора риска характеризуют признаки, негативно влияющие на здоровье пациента.

В другом частном варианте реализации предлагаемого решения, объединение групп в кластеры осуществляется посредствам метода k-средних и/или метода c-средних и/или послойная кластеризация и/или выделение связных компонент и/или метод минимального покрывающего дерева.

ОПИСАНИЕ ЧЕРТЕЖЕЙ

Реализация изобретения будет описана в дальнейшем со ссылкой на Фиг. 1, иллюстрирующую пример диагностирования сердечно-сосудистых заболеваний, представленную для пояснения сути изобретения и никоим образом не ограничивающую область изобретения.

ДЕТАЛЬНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ

В приведенном ниже подробном описании реализации изобретения приведены многочисленные детали реализации, призванные обеспечить отчетливое понимание настоящего изобретения. Однако, квалифицированному в предметной области специалисту будет очевидно, каким образом можно использовать настоящее изобретение, как с данными деталями реализации, так и без них. В других случаях хорошо известные методы, процедуры и компоненты не были описаны подробно, чтобы не затруднять излишне понимание особенностей настоящего изобретения.

Кроме того, из приведенного изложения будет ясно, что изобретение не ограничивается приведенной реализацией. Многочисленные возможные модификации, изменения, вариации и замены, сохраняющие суть и форму настоящего изобретения, будут очевидными для квалифицированных в предметной области специалистов.

В медицинской информационной системе, используемой в медицинской организации, в процессе работы аккумулируются различные данные о пациентах, включая общую и медицинскую информацию: рост, вес, цифры артериального давления и т.д., зарегистрированные заболевания и обращения в медицинские организации, протоколы обследований, данные врачебных осмотров, хирургических вмешательств и др.

Предлагаемое решение интегрируется с медицинской информационной системой медицинской организации посредством открытых API систем.

От медицинской информационной системы на вычислительное устройства, по запросу, автоматически формируется и отправляется пакет деперсонифицированных медицинских данных пациента из электронной медицинской карты пациента.

Электронная медицинская карта, (электронный паспорт пациента) - ЭМК; англ. electronic health record - EHR) - база данных, содержащая сведения о пациенте: физиологические параметры пациента, анамнез, истории болезней и их лечение (методы и ход лечения, прописанные препараты и т.п.), которая создается в медицинском учреждении. В том числе электронная медицинская карта пациентов содержит записи пациентов, включающих, по меньшей мере, следующие данные: дату добавления записи, коды диагнозов, симптомов, процедур и лекарств, текстовое описание истории болезни на естественном языке, ассоциированные с историей болезни биомедицинские изображения, результаты исследований и анализов пациентов.

Посредством методов Natural language processing, на вычислительном устройстве происходит извлечение медицинских и социальных признаков о состоянии здоровья пациента, а также признаков факторов риска из полученного пакета деперсонифицированных медицинских данных пациента из электронной медицинской карты пациента.

Под медицинскими признаками о состоянии здоровья пациента понимаются признаки, характеризующие индекс массы тела, артериальное давление, пульсовое давление и др., лабораторные показатели (общий и клинический анализ крови, биохимия крови и т.д.).

Под социальными признаками о состоянии здоровья пациента понимаются признаки, характеризующие пол, возраст, социальный статус, регион проживания.

Под факторами риска понимаются признаки, характеризующие негативное влияние на здоровье пациента, например, но не ограничиваясь курение, личный и семейный анамнез, гиподинамия, ожирение и др.

Извлеченные признаки поступают на вход обученному набору классификаторов для отнесения признаков к классу вероятности наличия хронических заболеваний, таких как сердечно-сосудистых заболеваний, эндокринологических заболеваний, заболеваний почек, заболеваний органов дыхания. Каждый классификатор из набора обучен на определение одного хронического заболевания. У каждого классификатора есть свой набор данных, который он определяет для отнесения признаков к классу вероятности наличия хронических заболеваний. В случае, если в извлеченных признаках отсутствует один параметр из набора данных у классификатора, то данный классификатор не используется при оценке. Например, классификатор на определение хронической сердечной недостаточности не будет использован при оценке, если в извлеченных признаках будет отсутствовать уровень гемоглобина.

Обучение набора классификаторов заключается в обучении по меньшей мере одного классификатора на определение по меньшей мере одного хронического заболевания (определение риска наличия атеросклероза, хронической болезни легких и хронической сердечной недостаточности, хроническая болезнь почек, диабет). Этапы обучения классификатора указаны ниже.

Обучение классификаторов осуществляется с помощью библиотек scikit-learn, tensorflow, catboost, xgboost, и др. На одном и том же наборе данных проводится обучение классификаторов, после чего анализируются полученные метрики точности и матрицы ошибок, что позволяет определить оптимальный для каждой из задач алгоритм. Набор анализируемых метрик точности включает в себя:

Для алгоритмов классификации:

- accuracy (доля правильных ответов);

- точность (precision);

- полнота (recall);

- f-мера (гармоническое среднее полноты и точности);

- auc -roc (площадь под кривой ошибок);

- логистическая функция потерь.

Данные для прогнозирования заболеваний включают в себя:

демографические данные (пол, возраст, регион проживания);

анамнез пациентов (коды хронических неинфекционных заболеваний);

медицинская история пациента (частота обращений и госпитализаций, диагностических манипуляций etc);

извлеченные из ЭМК пациентов признаки в их динамической интерпретации - определенные в виде функций тенденции изменчивости физиологических и лабораторных параметров.

Реализация настоящего технического решения позволяет проводить первичный этап определения подозрений на заболевания без задействования точных медицинских сведений. На основе принадлежности пациента к одному из выделенных кластеров определяется вероятность наличия у него хронических заболеваний.

Интерпретация выходных данных классификаторов происходит с использованием порога достоверности, выше которого вероятность наличия у пациента хронических заболеваний определяется как высокая, ниже - как низкая. Например, для представителей кластера «мужчины 45-50 лет, страдающие ожирением и артериальной гипертензией, с малой историей обращений в ЛПУ» вероятность наличия сердечно-сосудистых заболеваний определяется как высокая.

Для развертывания модели прогнозирования хронических заболеваний на основе кластерного анализа больших данных необходимо выполнение следующих минимальных технических требований.

Минимальные характеристики вычислительных элементов:

Процессор: не менее 6 ядер частотой от 2.0 ГГЦ с поддержкой инструкций AVX;

Оперативная память: не менее 24 ГБ;

Дисковая подсистема: 100 ГБ свободного дискового пространства. Операционная система одна из следующих:

• Ubuntu 18.04 LTS;

• Ubuntu 20.04 LTS;

• Astra Linux Common Edition 2.12.29;

• CentOS 7.7. Необходимое ПО:

• docker 19.03 и выше

• docker-compose 1.25.5 и выше 1. Осуществляют деление извлеченных медицинских и социальных признаков о состоянии здоровья пациента на группы посредством алгоритма иерархической кластеризации. Группы составляются по ограниченному количеству признаков: пол, возрастная категория, территория проживания. Выделяются возрастные группы (согласно классификации Всемирной организации здравоохранения, а также на основе опубликованных клинических исследований, в зависимости от заболевания, например, для сердечно-сосудистых заболеваний используется шаг в 5 лет внутри возрастной группы 40+ или, например, для исследования гинекологических синдромов, принципиальной отсечкой является возраст менопаузы), после выделения возрастных группы на данных производится совместная разбивка по полу (мужчины и женщины), после разбивки по полу добавляется 3-й признак - территория проживания (согласно данным ЭМК). В результате работ алгоритма получаются группы такого типа «мужчины 40-50 лет, проживающие в условиях Крайнего Севера», или «женщины 60-65 лет, проживающие в Южном Федеральном округе».

2. Осуществляют деление полученных групп на кластеры по диагностированным у них заболеваниям, согласно данным электронной медицинской карты, медицинским и социальным признакам о состоянии здоровья пациента, причем объединяют группы в кластеры с общими диагнозами. Объединение групп в кластеры с общим диагнозом происходит посредством алгоритмов: метод k-средних или метод c-средних, или послойная кластеризация, или выделение связных компонент, или метод минимального покрывающего дерева. Методы кластеризации используют меры связи, полученные в результате сравнения диагнозов между собой. Соответственно, внутри выделенного кластера будет сформирована общность, характеризующаяся наличием общих диагнозов. Например, для группы «мужчины 40-55 лет, жители крупных городов» будет выделен подкластер «с наличием атеросклероза» или «перенесшие инфаркт». Код подкластера передается в модель в виде категорийного значения (например, 0 и 1 для инфаркта, 1 - есть инфаркт в анамнезе, 0 - не было инфаркта).

Метод k-средних: - определяется число кластеров k; - из исходного набора данных случайным образом выбирается к рядов, которые выполняют роль начальных центров кластеров; -для каждого ряда данных определяется ближайший к нему центр кластера; - вычисляются центроиды (центры тяжести кластеров); - центр кластера смещается в его центроид; - шаги от определения центра тяжести до смещения его в центроид итеративно повторяются, что обеспечивает рост межкластерных расстояний, чем меньше межкластерное расстояние, тем больше вероятность отнести пациента к нескольким кластерам и если межкластерное расстояние большое, то относят пациента к кластеру с общим диагнозом.

Метод c-средних: формируется матрица принадлежности для разбиения объектов на k кластеров; - определяются значения критерия ошибки; - все объекты перегруппируются для уменьшения значения критерия ошибки; - последние две процедуры повторяются пока изменения матрицы при перегруппировке не станут незначительными, которые свидетельствуют об определении общего диагноза.

Алгоритм минимального покрывающего дерева: - строится минимальное покрывающее дерево, а затем последовательно убираются ребра с наибольшим весом. Критерием принадлежности к общему диагнозу кластера будут - минимальные веса.

Послойная кластеризация: выделяются связные компоненты графа, алгоритмом кластеризации формирую последовательность подграфов, которые отражают связи между кластерами. Задается порог расстояния, с помощью изменения которого можно контролировать глубину иерархии кластеров. По значению этого порога (он рассчитывается на основе выделения связных компонент на некотором уровне расстояний между объектами) происходит выделение древовидной структуры.

3. Получают значения медицинских и социальных признаков о состоянии здоровья пациента и признаков факторов риска в каждом кластере, по которым будет происходит отнесение извлеченных признаков к классам вероятности наличия хронических заболеваний. Данные значения являются обучающей выборкой. После того как пациент отнесен к одному из кластеров, для него получают категорийное значение, например, 5, будет значить что пациент отнесен группе «мужчины 40-55 лет, проживающие в крупных городах» Именно это значение становится входным параметром для моделей оценки рисков, т.е. на вход подаются не только данные по каждому пациенту (исходные данные), но и значение его кластера.

4. Осуществляют обучение каждого классификатора из набора на основе многослойной (не менее 3 слоев) нейронной сети прямого распространения с нормализацией во входном слое и/или градиентного бустинга, которые относят пациентов каждого кластера к положительному или отрицательному классу (положительный класс по вероятности атеросклероза, положительный класс по вероятности инсульта, отрицательный класс по вероятности хронической болезни почек и т.д.).

5. В результате получают класс (1 или 0, где 0 - вероятность заболевания отсутствует, 1 - заболевание разовьется) вероятности наличия хронических заболеваний, по классу МКБ, каждого кластера. Например, для атеросклероза брахиоцефальных артерий риск вероятности развития диагноза у представителей возрастной группы 20-30 лет любого пола при отсутствии избыточной массы тела=0.1, что интерпретируется как низкая вероятность.

6. Осуществляют оценку риска развития осложнений хронических заболеваний пациентов, отнесенных к классу вероятности наличия хронических заболеваний по классу МКБ. Данная оценка риска развития осложнений хронических заболеваний осуществляется на основе алгоритмов машинного обучения (нейронная сеть, градиентный бустинг или алгоритм случайного леса). Под оценкой риска подразумевается численный выход модели и его интерпретация. Для каждого алгоритма рассчитывается определенный порог, выше которого риск наступления события (развития осложнения) считают высоким, ниже - низким. Возможно введение множественных порогов для интерпретации, по которым степень риска оценивается как низкая, умеренная, высокая, очень высокая и т.д. При тренировке моделей алгоритмы учатся на наборах больших данных пациентов, у которых данные осложнения развились, и у которых таковых не было. Для численной оценки риска развития осложнения применяются алгоритмы регрессии, позволяющие не просто классифицировать данные пациента, как, к примеру «есть риск инсульта» или «нет риска», а дать количественную оценку вероятности развития осложнения, которую платформа интерпретирует в зависимости от степени риска, например, оценка вероятности развития у данного пациента инсульта выдается в виде «высокий риск», что относит пациента к группе повышенного внимания.

Качественная интерпретация разрабатывается с участием медицинских экспертов и в реализации выглядит как цветовая схема с пояснениями (красный - высокий риск, зеленый - низкие риски или риски отсутствуют). Например, вероятность наличия атеросклеротических бляшек брахиоцефальных артерий у мужчин с ожирением (индекс массы тела >=25) в возрасте 45-50 лет, без диагностированных хронических сердечно-сосудистых заболеваний, при наличии факторов риска (курение, гиподинамия, семейный анамнез, дислипедемия) модель оценила, как 0.6. Порог отсечения для этой модели, рассчитанный по критерию Юдена, составляет 0.55. Таким образом, у пациента из описанной группы высок риск наличия атеросклеротических бляшек.

На выходе набора классификаторов получают класс вероятности наличия хронических заболеваний, по классу МКБ, и оценку риска развития осложнений хронических заболеваний.

На фиг. 1 проиллюстрирован пример, где на основе медицинских и социальных признаков здоровья пациента (таких как: возраст-65 лет, социальный статус - военный пенсионер, территория проживания - крайний север, у которого присутствует -гиподинамия, повышенный холестерин, артрит, артериальная гипертензия, был инфаркт, проводилась антигипертензиваня терапия, наличие травм), а также на основе признаков факторов риска (, высокий индекс массы тела, курит, указана частота сердечных сокращений, окружность талии) была определена вероятность ишемической болезни сердца более 50%, а также вероятность развития сахарного диабета 2 типа более 45%.

Степень риска сердечно-сосудистых заболеваний сцеплена с такими факторами, как пол, возраст, регион проживания и социальный статус. Следующим этапом сегментирования пациентов будет выделение внутри половозрастных групп категорий пациентов с отягощенным анамнезом (например, пациентов с диабетом 2 типа, пациентов с почечными заболеваниями и т.д) и выделение факторов риска (семейный анамнез, ожирение, курение, гиподинамия). С помощью комбинированного метода кластеризации, используя иерархическую кластеризацию, а также другие методы кластеризации, описанные выше, присваивают каждой группе пациентов с определенным набором признаков номер группы со сходными факторами отягощенного анамнеза и факторами риска (например, мужчина 68 лет, пенсионер, индекс массы тела=34, курит, в анамнезе имеются заболевания опорно-двигательного аппарата (артрозы, которые приводят к гиподинамии). Данный номер группы и данные о пациенте поступают на вход обученного набора классификаторов. Набор классификатор содержит классификаторы для определения следующих заболевании: определение риска наличия атеросклероза, хронической болезни легких и хронической сердечной недостаточности, хроническая болезнь почек, наличие атеросклероза брахиоцефальных артерий, диабет. Так как вход набора классификатор попадают данные здоровья пациента (повышенный холестерин, артрит, артериальная гипертензия, был инфаркт, проводилась антигипертензиваня терапия, наличие травм) и факторы риска (семейный анамнез, ожирение, курение, гиподинамия), то по этим данным начинает осуществлять работу классификаторы: определение риска сахарного диабета и определение риска ишемической болезни сердца, остальные классификаторы не участвуют в работе, так как для них отсутствуют данные для работы. На выходе получают класс вероятности наличия у пациента хронических заболеваний по классу МКБ.

Далее осуществляют оценку риска развития осложнений хронических заболеваний пациентов, пороговое значение определяется для каждого алгоритма с помощью статистики Юдена.

Если необходимо определить оценку на наличие атеросклероза брахиоцефальных артерий, то на вход набора классификатора подаются следующие данные:

общие сведения о пациенте (возраст, курение);

общемедицинские сведения (вес, рост, окружность талии, индекс массы тела);

данные медицинских осмотров (артериальное давление, частота сердечных сокращений, частота дыхания);

сведение об анамнезе (COVID-19, подагра, сахарный диабет, псориаз, ревматоидный артрит, фибрилляция предсердий);

лабораторные показатели (холестерин, ЛПНП, ЛПВП, глюкоза крови, креатинин, ACT, АЛТ, белок крови, триглицериды);

данные инструментальных измерений (масса миокарда левого желудочка).

Набор классификаторов основывается на алгоритме решающих деревьев. Для определения атеросклероза брахиоцефальных артерий, запускается только классификатор для атеросклероза брахиоцефальных артерий, остальные классификаторы из набора не участвуют в анализе.

При анализе решений посредством «дерева решений» используют визуальный и аналитический инструмент поддержки принятия решений для расчета ожидаемых значений (или ожидаемой пользы) конкурирующих альтернатив. Структура дерева представляет собой «листья» и «ветки». На ребрах («ветках») дерева решения записаны признаки, от которых зависит целевая функция, в «листьях» записаны значения целевой функции, а в остальных узлах - признаки, по которым различаются случаи. Чтобы классифицировать новый случай, надо спуститься по дереву до листа и выдать соответствующее значение.

Дерево решений в общем виде может быть описано следующей формулой:

(х, Y)=(x1,x2, х3, … xk, Y)

Зависимая переменная Y является целевой переменной, которую необходимо проанализировать, классифицировать и обобщить. Вектор х состоит из входных переменных х1, х2, х3 и т.д., которые используются для выполнения этой задачи.

Дерево решений состоит из трех типов узлов:

Узлы решения

Вероятностные узлы

Замыкающие узлы

В результате работы ансамбля решающих деревьев представляется выход модели:

Вероятность наличия бляшек брахиоцефальных артерий в виде числа от 0 до 1. Интерпретация выхода осуществляется с применением порогового значения (0.55), выходное значение больше которого оценивается как высокий риск, меньше - как низкий риск наличия бляшек брахиоцефальных артерий.

В настоящих материалах заявки было представлено предпочтительное раскрытие осуществление заявленного технического решения, которое не должно использоваться как ограничивающее иные, частные воплощения его реализации, которые не выходят за рамки испрашиваемого объема правовой охраны и являются очевидными для специалистов в соответствующей области техники.

Похожие патенты RU2800315C2

название год авторы номер документа
СИСТЕМА ДЛЯ ПОДДЕРЖКИ ПРИНЯТИЯ ВРАЧЕБНЫХ РЕШЕНИЙ 2020
  • Гусев Александр Владимирович
  • Новицкий Роман Эдвардович
RU2752792C1
СПОСОБ ПОСТРОЕНИЯ ЕДИНОГО ИНФОРМАЦИОННОГО ПРОСТРАНСТВА ДЛЯ ПРАКТИЧЕСКОГО ВРАЧА 2004
  • Черешнев Валерий Александрович
  • Гайнанов Дамир Насибуллович
  • Аргучинская Ольга Николаевна
  • Юрченко Любовь Николаевна
  • Поникаровских Александр Эдуардович
  • Гусев Евгений Юрьевич
RU2299470C2
МЕДИЦИНСКАЯ СИСТЕМА УДАЛЕННОГО МОНИТОРИНГА, АНАЛИЗА И ПРОГНОЗИРОВАНИЯ СОСТОЯНИЯ ПАЦИЕНТА ПО ПОСЛЕДОВАТЕЛЬНОСТИ ЭЛЕКТРОКАРДИОГРАММ СЕРДЦА ПЕРВОГО ОТВЕДЕНИЯ И КОМПЬЮТЕРИЗИРОВАННЫЙ СПОСОБ МОНИТОРИНГА, АНАЛИЗА И ПРОГНОЗИРОВАНИЯ СОСТОЯНИЯ ПАЦИЕНТА 2018
  • Шмид Александр Викторович
  • Березин Андрей Александрович
  • Новопашин Максим Александрович
  • Зимина Екатерина Юрьевна
RU2752707C1
СПОСОБ ОТБОРА В ГРУППУ РИСКА ПО ФОРМИРОВАНИЮ ХРОНИЧЕСКИХ ВИДОВ ПАТОЛОГИИ У ДЕТЕЙ РАЗЛИЧНЫХ ВОЗРАСТНЫХ ГРУПП 1999
  • Крыночкина М.Ю.
  • Бережанская С.Б.
  • Амелина С.С.
  • Спивак И.Г.
RU2172139C2
СПОСОБ АВТОМАТИЗИРОВАННОЙ ДИАГНОСТИКИ ЗАБОЛЕВАНИЙ 2013
  • Чикало Олег Владимирович
RU2540831C2
Способ анализа медицинских данных с помощью нейронной сети LogNNet 2021
  • Величко Андрей Александрович
  • Величко Татьяна Васильевна
RU2754723C1
Способ биогибридного скрининга рака легкого, рака желудка, сахарного диабета и туберкулеза легких по выдыхаемому обследуемым воздуху 2022
  • Синютина Ольга Николаевна
  • Саволюк Антонина Васильевна
  • Мишин Никита Александрович
  • Медведев Дмитрий Сергеевич
RU2797334C1
Способ оценки риска развития болезни Альцгеймера с использованием панели белков крови 2021
  • Кононихин Алексей Сергеевич
  • Семенов Савва Дмитриевич
  • Бржозовский Александр Геннадьевич
  • Гаврилова Светлана Ивановна
  • Борхерс Кристоф Германн
  • Николаев Евгений Николаевич
RU2794040C1
Способ превентивной диагностики снижения уровня здоровья у детей, прибывших из зоны социальной катастрофы 2018
  • Дербенев Димитрий Павлович
  • Жуков Сергей Владимирович
  • Рыбакова Маргарита Викторовна
  • Шатохина Наталья Александровна
  • Самойлова Наталья Юрьевна
  • Самойлов Павел Алексеевич
RU2694193C1
Автоматическая система поддержки медицинских решений при сочетанной патологии 2018
  • Богданов Михаил Борисович
RU2698007C1

Иллюстрации к изобретению RU 2 800 315 C2

Реферат патента 2023 года СПОСОБ РАННЕЙ ДИАГНОСТИКИ ХРОНИЧЕСКИХ ЗАБОЛЕВАНИЙ ПАЦИЕНТА, ОСНОВАННЫЙ НА КЛАСТЕРНОМ АНАЛИЗЕ БОЛЬШИХ ДАННЫХ

Изобретение относится к области медицины, а также к области информационных и коммуникационных технологий для обработки медицинских данных, в частности к способу ранней диагностики хронических заболеваний пациента, основанному на кластерном анализе больших данных. Предложен способ ранней диагностики хронических заболеваний пациента, выполняющийся на вычислительном устройстве, содержащем процессор и память, хранящую инструкции, исполняемые процессором и содержащие следующие этапы: получают деперсонифицированные медицинские данные электронной медицинской карты от медицинской информационной системы на вычислительное устройство; на вычислительном устройстве осуществляют извлечение медицинских и социальных признаков о состоянии здоровья пациента, а также признаков факторов риска посредством Natural language processing; извлеченные признаки поступают на вход обученного ансамбля классификаторов для отнесения признаков к классу вероятности наличия хронических заболеваний, при этом обучение ансамбля классификатора заключается в обучении по меньшей мере одного классификатора на по меньшей мере одно хроническое заболевание и содержит следующие этапы. Осуществляют деление извлеченных медицинских и социальных признаков о состоянии здоровья пациента на группы. Осуществляют деление полученных групп на кластеры по диагностированным у них заболеваниям, согласно данным электронной медицинской карты и медицинских и социальных признаков о состоянии здоровья пациента, причем объединяют группы в кластеры с общими диагнозами; получают значения медицинских и социальных признаков о состоянии здоровья пациента и признаков факторов риска в каждом кластере, по которым будет происходит отнесение извлеченных признаков к классам вероятности наличия хронических заболеваний. Осуществляют оценку риска развития осложнений хронических заболеваний. На выходе ансамбля классификаторов получают класс вероятности наличия хронических заболеваний, по классу МКБ, и оценку риска развития осложнений хронических заболеваний. Изобретение обеспечивает повышение точности раннего диагностирования хронических заболеваний пациента и определение риска развития осложнений хронических заболеваний. 3 з.п. ф-лы, 1 ил.

Формула изобретения RU 2 800 315 C2

1. Компьютерно-реализуемый способ ранней диагностики хронических заболеваний пациента, выполняющийся на вычислительном устройстве, содержащем процессор и память, хранящую инструкции, исполняемые процессором и содержащие следующие этапы:

получают деперсонифицированные медицинские данные электронной медицинской карты от медицинской информационной системы на вычислительное устройство;

на вычислительном устройстве осуществляют извлечение медицинских и социальных признаков о состоянии здоровья пациента, а также признаков факторов риска посредством Natural language processing;

осуществляют отнесение извлеченных медицинских и социальных признаков о состоянии здоровья пациента к группе пациентов;

осуществляют отнесение группы пациентов к определенному кластеру по диагностированным у пациента заболеваниям, согласно данным электронной медицинской карты и медицинских и социальных признаков о состоянии здоровья пациента, причем объединяют группу пациентов в кластеры с общими диагнозами;

получают значения медицинских и социальных признаков о состоянии здоровья пациента и признаков факторов риска в каждом кластере, по которым будет происходит отнесение извлеченных признаков к классам вероятности наличия хронических заболеваний;

кластеры с извлеченными признаками поступают на вход обученного набора классификаторов для отнесения признаков к классу вероятности наличия хронических заболеваний, при этом обучение набора классификатора заключается в обучении по меньшей мере одного классификатора на по меньшей мере одно хроническое заболевание, причем классификатор из набора не участвует в классификации, если в извлеченных признаках отсутствуют входные признаки для данного классификатора;

осуществляют оценку риска развития осложнений хронических заболеваний, отнесенных к классу вероятности наличия хронических заболеваний;

на выходе набора классификаторов получают класс вероятности наличия хронических заболеваний, по классу МКБ, и оценку риска развития осложнений хронических заболеваний.

2. Способ по п. 1, отличающийся тем, что медицинские и социальные признаки о состоянии здоровья пациента включают в себя: пол, возраст, социальный статус, регион проживания, физиологические параметры, лабораторные показатели.

3. Способ по п. 1, отличающийся тем, что признаки фактора риска характеризуют признаки, негативно влияющие на здоровье пациента.

4. Способ по п. 1, отличающийся тем, что отнесение групп в кластеры осуществляется посредством метода k-средних, и/или метода с-средних, и/или послойной кластеризации, и/или выделения связных компонент, и/или метода минимального покрывающего дерева.

Документы, цитированные в отчете о поиске Патент 2023 года RU2800315C2

US 2020335219 А1, 22.10.2020
US 2009287837 А1, 19.11.2009
US 2018330828 A1, 15.11.2018
US 2021106288 A1, 15.04.2021
WO 2015142708 A1, 24.09.2015.

RU 2 800 315 C2

Авторы

Новицкий Роман Эдвардович

Гусев Александр Владимирович

Даты

2023-07-20Публикация

2021-12-27Подача