СПОСОБЫ И СИСТЕМЫ ОЦЕНКИ РИСКА РАЗВИТИЯ ЗЛОКАЧЕСТВЕННОЙ ОПУХОЛИ ЛЕГКОГО Российский патент 2019 года по МПК A61B5/08 A61B5/145 G01N33/49 

Описание патента на изобретение RU2677742C2

Область техники

Настоящее изобретение, в соответствии с некоторыми его вариантами осуществления, относится к диагностике злокачественных опухолей и, более конкретно, но не исключительно, к способам и системам оценки риска развития злокачественной опухоли.

Уровень техники

Злокачественная опухоль легкого является основной причиной смерти от злокачественной опухоли во всем мире. Кроме того, злокачественная опухоль легкого характеризуется одним из наиболее низких показателем выживаемости для любой злокачественной опухоли, поскольку более двух третей пациентов диагностируют на поздней стадии, когда радикальное лечение уже не является возможным. Эффективный скрининг злокачественной опухоли легкого приведет к более раннему выявлению заболевания (до того, как у пациента проявятся симптомы, и когда лечение более вероятно будет эффективным) и уменьшит смертность. В настоящее время, большинство случаев злокачественной опухоли легкого клинически диагностируют, когда у пациентов проявляются симптомы (такие как кашель, боль в груди, снижение массы тела), к сожалению, пациенты с такими симптомами обычно имеют запущенную злокачественную опухоль легкого.

До самого последнего времени программы скрининга злокачественной опухоли легкого по всему миру редко практиковались, и раннее выявление злокачественной опухоли легкого происходило случайным образом при помощи рентгенографии органов грудной клетки. Недавние исследования показали, что для скрининга пациентов, которые имеют высокий риск возникновения злокачественной опухоли легкого, можно применять компьютерную томографию с низкой дозой облучения (LDCT). В ходе Национального исследования, посвященного скринингу болезней легких (The National Lung Screening Trial (NLST)), сравнивали применение LDCT и рентгенографию органов грудной клетки по результатам скрининга 53454 людей с высоким риском возникновения злокачественной опухоли легкого. Из результатов исследование было видно 20% уменьшение смертности от злокачественной опухоли легкого при LDCT по сравнению со скринингом с помощью рентгенографии органов грудной клетки. После NLST и дополнительных сопровождающих исследований были изданы новые руководства по скринингу злокачественной опухоли легкого, рекомендующие применение на практике программ для скрининга злокачественной опухоли легкого на основе LDCT.

Несмотря на рекомендации, скрининг злокачественной опухоли легкого при помощи LDCT имеет унаследованные риски: (А) высокую степень ложноположительных результатов, приводящую к излишнему тестированию и инвазивным процедурам, повышенным затратам и пониженному качеству жизни по причине моральных страданий; (В) ложноотрицательные результаты, которые могут отсрочить или препятствовать диагностике и лечению; (С) неспособность выявить малоагрессивные опухоли; (D) гипердиагностика; (Е) лучевая нагрузка. Таким образом, существует острая потребность в точной идентификации индивидуумов с высоким риском и предупреждения нанесения потенциального вреда индивидуумам с более низким риском. В связи с этим, руководства по скринингу злокачественной опухоли легкого предлагают критерии для определения какие пациенты подвержены высокому риску. Такие критерии основаны на комбинации возраста, анамнеза курения и дополнительных факторов риска. К сожалению, с помощью таких критериев нельзя точно выявить пациентов на поддающейся лечению стадии злокачественной опухоли. Фактически, результаты NLST указывают на то, что для предупреждения одной смерти от злокачественной опухоли легкого (в США) необходимо при помощи LDCT подвергнуть скринингу 320 индивидуумов, подверженных высокому риску. Возможные последствия такого относительно низкого уровня следует исследовать для определения того, превышают ли преимущества вред от такого скринингового процесса. В целом, существует острая необходимость в разработке модели, которая выявляет пациентов с высоким риском развития злокачественной опухоли легкого (на доскрининговой стадии) и обеспечивает эффективную программу скрининга с минимальным риском лишь тех индивидуумов, которые имеют высокий шансом развития злокачественной опухоли.

Краткое описание чертежей

В настоящем документе некоторые варианты осуществления настоящего изобретения описаны лишь в качестве примера со ссылкой на прилагаемые графические материалы. Теперь, отдельно обращаясь к подробному описанию графических материалов, следует отметить, что конкретные варианты приведены лишь для примера и с иллюстративными целями для наглядного рассмотрения вариантов осуществления по настоящему изобретению. В связи с этим, настоящее описание, с учетом графических материалов, делает понятным специалистам в настоящей области как на практике можно осуществить варианты осуществления по настоящему изобретению.

На графических материалах изображено следующее:

фиг. 1 представляет собой блок-схему способа создания одного или нескольких классификаторов для получения оценки риска развития злокачественной опухоли легкого на основании анализа множества индивидуальных записей в соответствии с некоторыми вариантами осуществления по настоящему изобретению; и

фиг. 2 является схематической иллюстрацией системы создания одного или нескольких классификаторов, например, путем реализации способа, изображенного на фиг. 1, в соответствии с некоторыми вариантами осуществления по настоящему изобретению.

Подробное описание изобретения

В соответствии с некоторыми вариантами осуществления настоящее изобретение относится к компьютеризированному способу оценки риска развития злокачественной опухоли легкого. Способ предусматривает создание перечня признаков, содержащего множество текущих результатов анализа крови, полученных в результате забора крови от целевого индивидуума, получение по меньшей мере одного классификатора, созданного на основе анализа множества соответствующих ретроспективных результатов анализов крови каждого из множества индивидуумов, у которых был взят образец, и оценку при помощи процессора риска развития злокачественной опухоли легкого у целевого индивидуума посредством классификации набора признаков при помощи по меньшей мере одного классификатора. Каждый из множества ретроспективных и текущих результатов анализов крови включает результаты по меньшей мере одного из следующих анализов крови: результаты анализа крови на лейкоциты, включающие по меньшей мере один из анализов на количество нейтрофилов, количество базофилов, количество эозинофилов, количество лимфоцитов, количество моноцитов, количество WBC, относительное содержание нейтрофилов, относительное содержание базофилов, относительное содержание эозинофилов, относительное содержание лимфоцитов и относительное содержание моноцитов, причем набор признаков включает множество ретроспективных результатов анализа крови из крови, забранной от целевого индивидуума, результатов биохимического анализа, результатов анализа крови на тромбоциты, включающего по меньшей мере одно из количества тромбоцитов и среднего объема тромбоцитов (MPV), и сочетания анамнеза курения и результатов анализа на эритроциты, включающего по меньшей мере один из анализов на количество эритроцитов (RBC), ширины распределения эритроцитов по объему (RDW), анализов крови на гемоглобин (МСН), среднеклеточного объема (MCV), среднеклеточной концентрации гемоглобина (МСНС), гематокрита и гемоглобина.

Необязательно, результаты биохимического анализа выбраны из группы, состоящей из анализов на скорость оседания эритроцитов (ESR), глюкозы, мочи, азота мочевины крови (BUN), креатинина, натрия, калия, хлора, кальция, фосфора, мочевой кислоты, общего количества билирубина, лактатдегидрогеназы (LDH), глутаминовой оксалоацетиновой трансаминазы (GOT), глутаминовой оксалоацетиновой трансаминазы в сыворотке крови (SGOT), глютамат оксалоацетата, аспарагиновой трансаминазы (AST), аспартатаминотрансферазы, глутамат-пируват-трансаминазы (GPT) глутамат-пируват-трансаминазы в сыворотке (SGPT), аланин-аминотрансферазы (ALT), щелочной фосфатазы (щелоч. фосф./ALP), гамма-глутамилтранспептидазы (GGT), альбумина, CK (креатинкиназы), железа, HbA1, В12, витамина D, G-6-PD, лития, фолиевой кислоты, CRP (C-реактивного белка), липопротеина низкой плотности (LDL), липопротеина высокой плотности (HDL), триглицеридов, общего содержания холестерина, амилазы, РТ (протромбинового времени), частичного тромбопластинового времени (РТТ), активированного частичного тромбопластинового времени (АРРТ), (международного нормализационного индекса (INR), фибриногена, цитидинтрифосфата (СРТ), ферритина, скорости гломерулярной фильтрации (GFR), трансферрина, общей железосвязывающей способности (TIBC), остаточной железосвязывающей способности (UIBC).

Необязательно, по меньшей мере один классификатор создают в результате сочетания множества ретроспективных и текущих результатов анализов крови и по меньшей мере одного демографического параметра каждого из множества индивидуумов, у которых был взят образец.

Еще более необязательно, по меньшей мере один демографический параметр является членом группы, состоящей из пола, возраста, зоны проживания, расы и социально-экономической характеристики.

Необязательно, каждый из множества ретроспективных и текущих результатов анализов крови содержит результаты из результатов анализа крови на лейкоциты, включающего по меньшей мере одно из количества нейтрофилов, количества базофилов, количества эозинофилов, количества лимфоцитов, количества моноцитов, количества WBC, относительного содержания нейтрофилов, относительного содержания базофилов, относительного содержания эозинофилов, относительного содержания лимфоцитов, относительного содержания моноцитов.

Еще более необязательно, каждый из множества ретроспективных и текущих результатов анализов крови включает анамнез курения.

Необязательно, каждый из множества ретроспективных и текущих результатов анализов крови включает результаты анализа крови на тромбоциты, включающие по меньшей мере одно из количества тромбоцитов и MPV.

Еще более необязательно, каждый из множества ретроспективных и текущих результатов анализов крови включает анамнез курения.

Еще более необязательно, каждый из множества ретроспективных и текущих результатов анализов крови включает анамнез курения.

Необязательно, каждый из множества ретроспективных и текущих результатов анализов крови включает комбинацию из анамнеза курения и результатов анализа на эритроциты, включающего по меньшей мере одно из RBC, RDW, МСН, MCV, МСНС, гематокрита и гемоглобина.

Необязательно, каждый из множества ретроспективных и текущих результатов анализов крови включает результаты как на относительное содержание нейтрофилов/количество нейтрофилов, так и на относительное содержание лимфоцитов/количество лимфоцитов.

Необязательно, по меньшей мере один классификатор включает члена группы, состоящей из классификатора взвешенной линейной регрессии, классификатора K-ближайших соседей (KNN) и классификатора решающих деревьев.

Необязательно, каждый из множества ретроспективных и текущих результатов анализов крови включает результаты на тромбокрит (РСТ).

Необязательно, каждый из множества ретроспективных и текущих результатов анализов крови включает результаты как на HGB, так и на НСТ.

Необязательно, набор признаков включает возраст целевого индивидуума, причем по меньшей мере один классификатор получают на основании анализа возраста одного из множества индивидуумов, у которых был взят образец.

Необязательно, каждый из множества ретроспективных и текущих результатов анализов крови включает по меньшей мере один из следующих анализов крови: количество эозинофилов, относительное содержание нейтрофилов, относительное содержание моноцитов, относительное содержание эозинофилов, относительное содержание базофилов и количество нейтрофилов, количество моноцитов.

Необязательно, набор признаков включает возраст целевого индивидуума, причем по меньшей мере один классификатор получают на основании анализа возраста одного из множества индивидуумов, у которых был взят образец.

Необязательно, каждый из множества ретроспективных и текущих результатов анализов крови включает результаты анализа на ширину распределения эритроцитов по объему (RDW).

Необязательно, каждый из множества ретроспективных и текущих результатов анализов крови включает результаты биохимического анализа, выбранные из анализов на скорость оседания эритроцитов (ESR), глюкозы, мочи, азота мочевины крови (BUN), креатинина, натрия, калия, хлора, кальция, фосфора, мочевой кислоты, общего количества билирубина, лактатдегидрогеназы (LDH), глутаминовой оксалоацетиновой трансаминазы (GOT), глутаминовой оксалоацетиновой трансаминазы в сыворотке крови (SGOT), глютамат оксалоацетата, аспарагиновой трансаминазы (AST), аспартатаминотрансферазы, глутамат-пируват-трансаминазы (GPT) глутамат-пируват-трансаминазы в сыворотке (SGPT), аланин-аминотрансферазы (ALT), щелочной фосфатазы (щелоч. фосф./ALP), гамма-глутамилтранспептидазы (GGT), альбумина, CK (креатинкиназы), железа, HbA1, В12, витамина D, G-6-PD, лития, фолиевой кислоты, CRP (C-реактивного белка), липопротеина низкой плотности (LDL), липопротеина высокой плотности (HDL), триглицеридов, общего содержания холестерина, амилазы, РТ (протромбинового времени), частичного тромбопластинового времени (РТТ), активированного частичного тромбопластинового времени (АРРТ), (международного нормализационного индекса (INR), фибриногена, цитидинтрифосфата (СРТ), ферритина, скорости гломерулярной фильтрации (GFR), трансферрина, общей железосвязывающей способности (TIBC), остаточной железосвязывающей способности (UIBC).

Необязательно, каждый из множества ретроспективных и текущих результатов анализов крови включает результаты на тромбокрит (РСТ).

Необязательно, каждый из множества ретроспективных и текущих результатов анализов крови включает результаты анализа на среднеклеточный объем (MCV).

Необязательно, каждый из множества ретроспективных и текущих результатов анализов крови включает по меньшей мере один из следующих анализов крови: результатов анализа крови на лейкоциты - WBC (СВС), среднего объема тромбоцитов (MPV), среднего количества тромбоцитов (СВС), количества эозинофилов, относительного содержания нейтрофилов, относительного содержания моноцитов, относительного содержания эозинофилов, относительного содержания базофилов и количества нейтрофилов, количество моноцитов.

Необязательно, по меньшей мере один классификатор включает члена группы, состоящей из классификатора взвешенной линейной регрессии, классификатора K-ближайших соседей (KNN), классификатора машины градиентного бустинга (GBM) и классификатора решающих деревьев.

Необязательно, набор признаков включает по меньшей мере одну демографическую характеристику целевого индивидуума и по меньшей мере один классификатор, созданный на основании анализа соответствующей по меньшей мере одной демографической характеристики каждого из множества индивидуумов, у которых был взят образец.

Необязательно, способ дополнительно предусматривает отбор по меньшей мере одного классификатора в соответствии по меньшей мере с одной демографической характеристикой индивидуума из множества классификаторов, каждый из которых получен в соответствии со множеством соответствующих ретроспективных результатов анализов крови индивидуумов, у которых был взят образец, имеющих по меньшей мере одну отличающуюся демографическую характеристику.

Необязательно, множество результатов анализов крови включает по меньшей мере один результат из следующего множества анализов крови: результаты биохимического анализа могут включать любой из следующих результатов анализов крови: альбумин, кальций, хлор, холестерин, креатинин, липопротеин высокой плотности (HDL), липопротеин низкой плотности (LDL), калий, натрий, триглицериды, мочевина и/или мочевая кислоту.

В соответствии с некоторыми вариантами осуществления настоящее изобретение относится к системе оценки злокачественной опухоли легкого. Система содержит процессор, блок памяти, который хранит по меньшей мере один классификатор, созданный на основании анализа множества ретроспективных результатов анализов крови каждого следующего множества индивидуумов, у которых был взят образец, блок ввода, который получает множество текущих результатов анализа крови, полученных из крови целевого индивидуума, и модуль оценки злокачественной опухоли легкого, который при помощи процессора оценивает риск развития злокачественной опухоли легкого у целевого индивидуума посредством классификации при помощи по меньшей мере одного классификатора, набора признаков, полученных из множества текущих результатов анализа крови. Каждый из множества ретроспективных и текущих результатов анализов крови включает результаты по меньшей мере одного из следующих анализов крови: результаты анализа крови на лейкоциты, включающие по меньшей мере один из анализов на количество нейтрофилов, количество базофилов, количество эозинофилов, количество лимфоцитов, количество моноцитов, количество WBC. относительное содержание нейтрофилов, относительное содержание базофилов, относительное содержание эозинофилов, относительное содержание лимфоцитов, относительное содержание моноцитов, причем набор признаков включает множество ретроспективных результатов анализа крови из крови, забранной от целевого индивидуума, результатов биохимического анализа и результатов анализа крови на тромбоциты, включающего по меньшей мере одно из количества тромбоцитов и среднего объема тромбоцитов (MPV), и сочетания анамнеза курения и результатов анализа на эритроциты, включающего по меньшей мере один из анализов на количество эритроцитов (RBC), ширины распределения эритроцитов по объему (RDW), анализов крови на гемоглобин (МСН), среднеклеточного объема (MCV), среднеклеточной концентрации гемоглобина (МСНС), гематокрита и гемоглобина.

Необязательно, каждый из множества ретроспективных и текущих результатов анализов крови включает результаты анализа на ширину распределения эритроцитов по объему (RDW).

Необязательно, каждый из множества ретроспективных и текущих результатов анализов крови включает результаты на тромбокрит (РСТ).

Необязательно, каждый из множества ретроспективных и текущих результатов анализов крови включает среднеклеточный объем (MCV).

В соответствии с некоторыми вариантами осуществления настоящее изобретение относится к способу создания классификатора для оценки риска развития злокачественной опухоли легкого. Способ предусматривает получение множества ретроспективных результатов анализов крови одного из множества индивидуумов, у которых был взят образец, создание набора данных, имеющего множество наборов признаков, при этом каждый набор создан на основе соответствующего множества ретроспективных результатов анализов крови другого из множества индивидуумов, у которых был взят образец, создание по меньшей мере одного классификатора для оценки риска развития злокачественной опухоли легкого на основании анализа набора данных и вывод по меньшей мере одного классификатора.

Необязательно, создание включает расчет и добавление по меньшей мере одной обрабатываемой версии ретроспективного результата анализа крови, полученного из соответствующего множества ретроспективных результатов анализов крови, в качестве признака для соответствующего набора признаков.

Необязательно, создание включает взвешивание каждого набора признаков в соответствии с датой соответствующего множества ретроспективных результатов анализов крови.

Необязательно, создание включает фильтрование множества наборов признаков для удаления выпадающих значений в соответствии с максимальным пороговым значением среднеквадратичного отклонения.

Необязательно, множество наборов признаков взвешивают в соответствии с датой соответствующего множества ретроспективных результатов анализов крови.

Необязательно, множество результатов анализов крови по меньшей мере одного из следующих анализов крови: количество эритроцитов (RBC), гемоглобин (HGB) и гематокрит (НСТ), и по меньшей мере один результат следующих анализов крови: гемоглобин (МСН) и среднеклеточная концентрация гемоглобина (МСНС).

Необязательно, каждый из множества ретроспективных и текущих результатов анализов крови включает результаты анализа на ширину распределения эритроцитов по объему (RDW).

Необязательно, каждый из множества ретроспективных и текущих результатов анализов крови включает результаты на тромбокрит (РСТ).

Необязательно, каждый из множества ретроспективных и текущих результатов анализов крови включает результаты анализа на среднеклеточный объем (MCV).

Еще более необязательно, способ дополнительно предусматривает добавление по меньшей мере одного демографического параметра каждого из множества индивидуумов, у которых был взят образец, к соответствующему набору признаков.

Еще более необязательно, по меньшей мере один демографический параметр является членом группы, состоящей из пола, возраста, зоны проживания, расы и социально-экономической характеристики.

Еще более необязательно, создание включает расчет и добавление по меньшей мере одной обрабатываемой версии по меньшей мере одного демографического параметра в качестве признака к соответствующему набору признаков.

Если не указано иное, все технические и/или научные термины в контексте настоящей заявки имеют такое же значение, которое обычно понимается рядовым специалистом в настоящей области, к которой относится настоящее изобретение. Несмотря на то, что при осуществлении на практике или при тестировании вариантов осуществления по настоящему изобретению можно применять способы и материалы, сходные или эквивалентные описанным в настоящем документе, ниже описаны иллюстративные способы и/или материалы. В случае противоречий настоящая заявка на выдачу патента, включающая приведенные в ней определения, будет иметь преобладающую силу. Кроме того, материалы, способы и примеры являются всего лишь иллюстративными и не подразумеваются как обязательно ограничивающие.

Реализация способа и/или системы в соответствии с вариантами осуществления по настоящему изобретению может включать выполнение или решение избранных задач ручным способом, автоматически или их комбинацией. Кроме того, согласно существующему инструментарию и оборудованию в соответствии с вариантами осуществления способа и/или системы по настоящему изобретению, несколько избранных задач можно реализовать при помощи аппаратного оборудования, при помощи программного обеспечения или при помощи программно-аппаратного средства или их комбинации при помощи операционной системы.

Например, аппаратное оборудование для осуществления избранных задач в соответствии с вариантами осуществления по настоящему изобретению может быть реализовано в виде микросхемы или интегральной схемы. Что касается программного обеспечения, то избранные задачи в соответствии с вариантами осуществления по настоящему изобретению могут быть реализованы в виде множества инструкций для программного обеспечения, выполняемых посредством компьютера при помощи любой подходящей операционной системы. В соответствии с иллюстративным вариантом осуществления настоящего изобретения одну или несколько задач в соответствии с иллюстративными вариантами осуществления способа и/или системы, которые описаны в настоящем документе, осуществляют с помощью процессора для обработки данных, такого как компьютерная платформа для выполнения множества инструкций. Необязательно, процессор для обработки данных включает энергозависимое запоминающее устройство для хранения инструкций и/или данных и/или энергонезависимое запоминающее устройство, например, магнитный жесткий диск и/или съемный носитель, для хранения инструкций и/или данных. Необязательно также предоставляют доступ к сети. Также необязательно предоставляют дисплей и/или пользовательское устройство ввода, такое как клавиатура или мышь.

В соответствии с некоторыми вариантами осуществления настоящего изобретения, оно относится к способам и системам оценки риска развития злокачественной опухоли легкого посредством классификации набора текущих результатов анализа крови целевого индивидуума при помощи одного или нескольких классификаторов, которые созданы на основании анализа ретроспективных результатов анализов крови множества индивидуумов.

Теперь обратимся к фиг. 1, на которой представлена блок-схема способа 100 создания одного или нескольких классификаторов для получения оценки риска развития злокачественной опухоли легкого на основании анализа множества ретроспективных результатов анализа множества диагностированных индивидуумов, в соответствии с некоторыми вариантами осуществления по настоящему изобретению.

Также обратимся к фиг. 2, на которой представлена схематическая иллюстрация системы 200 для создания классификатора(классификаторов) для оценки показателей риска развития злокачественной опухоли легкого, например, путем реализации способа, изображенного на фиг. 1, в соответствии с некоторыми вариантами осуществления по настоящему изобретению.

Система 200 включает одну или несколько баз данных 201 медицинских карт и/или подключена к интерфейсу базы данных медицинских карт. База данных(базы данных) 201 включает множество индивидуальных записей, также называемых множеством индивидуальных образцов, которые описывают, для одного из множества индивидуумов, у которых был взят образец, один или несколько наборов множества ретроспективных результатов анализов каждого набора другого индивидуума, и необязательно один или несколько демографических параметров и диагноз злокачественной опухоли легкого. Набор из множества ретроспективных результатов анализов, демографического параметра(демографических параметров), таких как возраст и/или прогноз злокачественной опухоли легкого, можно хранить в записи образца общего типа и/или могут быть собраны из ряда независимых и/или связанных баз данных. Необязательно, прогноз злокачественной опухоли легкого представляет собой двоичный набор индикаторов, соответствующий регистрационной записи о злокачественной опухоли. Результаты различных анализов могут состоять из традиционно проводимых анализов крови, биохимических анализов и/или анализов крови, назначенных в течение одного периода. Необязательно, некоторые наборы множества ретроспективных результатов анализов имеют пропущенные результаты анализов крови. Такие результаты необязательно дополняют посредством средневзвешенной величины доступных результатов анализов крови других индивидуумов. Способ дополнительно предусматривает процессор 204, модуль для создания классификаторов 205 и интерфейсный блок 206, такой как сетевой интерфейс.

В контексте настоящей заявки демографический параметр включает возраст, пол, расу, массу, национальную принадлежность, географическую зону проживания и/или т.п.

Сначала, как показано на 101, получают одну или несколько баз данных множества индивидуальных образцов.

Необязательно, как показано на 102, множество индивидуальных образцов подвергают скринингу и/или отбору согласно соответствующим критериям. Например, записи образцов получены от индивидуумов в возрасте 30 лет или старше, которые либо находятся в регистре злокачественных опухолей со злокачественной опухолью легкого, и необязательно без других типов злокачественной опухоли, или не появляются в регистре злокачественных опухолей. Необязательно, записи образцов индивидуумов, которые находятся в регистре злокачественных опухолей, берут только если наиболее последний набор множества ретроспективных результатов анализов, которые в нем собраны, был получен за определенный период до регистрации соответствующего индивидуума в реестре злокачественных опухолей, например, за период по меньшей мере 30 дней до текущей даты и не больше 2 лет. Необязательно, записи образцов индивидуумов, которые не находятся в регистре злокачественных опухолей, берут только если они включают набор множества ретроспективных результатов анализов, который дает равное распределение по времени (распределение по времени анализов крови) для групп с положительным и отрицательным диагнозом на злокачественную опухоль легкого. Процесс выравнивания распределения по времени положительных и отрицательных образцов также приводит к исключению по меньшей мере некоторых отрицательных (незарегистрированных) образцов и к изменению доли злокачественной опухоли легкого в наборе данных.

Теперь, как показано на 103, деривационный набор данных, такой как матрица, создают в соответствии с данными образца, полученными из записи образца, например, с помощью модуля 205 для создания классификатора. Деривационный набор данных включает множество наборов необязательно используемых признаков. Каждый набор признаков создают из каждой одной из полученных в результате скрининга и/или отбора записей образца. Набор признаков являются необязательно необработанными признаками, которые включают актуальные значения анализа крови и/или демографической характеристики.

Каждая запись образца включает один или несколько наборов множества ретроспективных результатов анализов индивидуума, при этом каждый включает комбинацию результатов анализов крови и/или результатов биохимического анализа, например, комбинацию из более 10, 15, 20 и/или любое промежуточное число результатов анализов крови или менее. В соответствии с одним примером каждый извлеченный набор необработанных признаков включает по меньшей мере следующие 18 результатов анализов крови: количество эритроцитов (RBC), количество лейкоцитов - WBC (СВС), средний объем тромбоцитов (MPV), гемоглобин (HGB), гематокрит (НСТ), среднеклеточный объем (MCV), среднее количество гемоглобина в отдельном эритроците (МСН), среднеклеточная концентрация гемоглобина (МСНС), ширина распределения эритроцитов по объему (RDW), количество тромбоцитов (СВС), количество эозинофилов, относительное содержание нейтрофилов, относительное содержание моноцитов, относительное содержание эозинофилов, относительное содержание базофилов, количество нейтрофилов, количество моноцитов и тромбокрит (РСТ). Необязательно, этот извлеченный набор необработанных признаков дополнительно включает один или несколько из следующих анализов крови: RDW, тромбоциты и MCV. Кроме того, этот извлеченный набор необработанных признаков может дополнительно включать один или несколько из следующих анализов крови: WBC, количество эозинофилов, относительное содержание нейтрофилов и/или количество нейтрофилов, относительное содержание базофилов и/или количество базофилов и относительное содержание моноцитов и/или количество моноцитов.

Набор текущих результатов анализа крови включает несколько или более из следующих результатов биохимического анализа: скорости оседания эритроцитов (ESR), глюкозы, мочевины, азота мочевины крови (BUN), креатинина, натрия, калия, хлора, кальция, фосфора, мочевой кислоты, общего количества билирубина, лактатдегидрогеназы (LDH), глутаминовой оксалоацетиновой трансаминазы (GOT), глутаминовой оксалоацетиновой трансаминазы в сыворотке крови крови (SGOT) и глютамат оксалоацетат трансаминазы, аспарагиновой трансаминазы (AST), аспартатаминотрансферазы, глутамат-пируват-трансаминазы (GPT) глутамат-пируват-трансаминазы в сыворотке крови (SGPT), аланин-аминотрансферазы (ALT), щелочной фосфатазы (щелоч. фосф./ALP), гамма-глутамилтранспептидазы (GGT), альбумина, CK (креатинкиназы), железа, HbA1, В12, витамина D, G-6-PD, лития, фолиевой кислоты, CRP (C-реактивного белка), липопротеина низкой плотности (LDL), липопротеина высокой плотности (HDL), триглицеридов, общего содержания холестерина, амилазы, РТ (протромбинового времени), частичного тромбопластинового времени (РТТ), активированного частичного тромбопластинового времени (АРРТ), (международного нормализационного индекса (INR), фибриногена, цитидинтрифосфата (СРТ), ферритина, скорости гломерулярной фильтрации (GFR), трансферрина, общей железосвязывающей способности (TIBC), остаточной железосвязывающей способности (UIBC).

Необязательно используют набор необработанных признаков. Используемый набор признаков включает такие признаки, как изложенные выше необработанные результаты анализов крови, и/или результаты биохимического анализа, и/или данные о курении, и/или один или несколько демографических параметров и необязательно обрабатываемые результаты анализов крови и/или комбинация результатов анализов крови, например, как те, что описаны выше. Например, каждый признак в наборе используемых признаков основан на результате анализа крови, демографической характеристике, анамнеза курения, результатах биохимического анализа, комбинации результата(ов) крови и/или демографической характеристики(демографических характеристик), и/или результатов обработки результата(ов) анализа крови и/или демографической характеристики(демографических характеристик). Например, если набор необработанных признаков включает 18 результатов анализов, можно создать используемый набор из 95-190, например, из 114 признаков.

Необязательно, создают различные деривационные наборы данных, например, матрицы, имеющие различные наборы используемых признаков, для создания различных классификаторов, которые классифицируют целевых индивидуумов, имеющих различные демографические характеристики, например, пол, различный анамнез курения и/или различные текущие данные.

Необязательно, деривационные наборы данных, например, матрица, подвергают фильтрации для удаления итерационно выпадающих значений. Необязательно, рассчитывают среднее отклонение и/или среднее квадратичное отклонение каждого признака и признаки, имеющие опускаемые значения, например, больше максимального порогового значения среднего квадратичного отклонения, например, 10, отсекают до максимального порогового значения среднего квадратичного отклонения. Например, процесс итерационно повторяют 10 раз (или менее, если не осуществляют отсечения). В то же время, как показано в 104, деривационные наборы данных применяют для создания классификатора(классификаторов), каждый из которых классифицирует риск развития злокачественной опухоли легкого у целевого индивидуума на основе одной или нескольких их демографических характеристик и текущего набора множества результатов анализа, например, с помощью модуля 205 для создания классификатора. Необязательно, один или несколько из следующих классификаторов можно создать на основе деривационных наборов данных:

классификатор взвешенной линейной регрессии, где положительные записи образцов получают оценку, которая приблизительно в 100 раз превышает оценку отрицательных записей образцов;

классификатор K-ближайших соседей (KNN), например, 100-кратная субдискретизация записи отрицательного образца;

классификатор, основанный на применении комитетов из решающих деревьев, например, где каждое дерево строят при помощи соотношения 2:1 отрицательной к положительной записи образцов; и

классификатор машины градиентного бустинга (GBM).

Необязательно, характеристику каждого одного из классификаторов оценивают при помощи 10-кратной перекрестной проверки результата на достоверность, при которой деривационные наборы данных, называемые в настоящем документе как группой, рандомно разделяют на десять частей равного размера. Для каждой части можно осуществлять следующее:

отбор приемлемых наборов результатов анализов крови от 90% группы, не попавших в соответствующую часть;

формирование классификатора в соответствии с выбранными наборами результатов анализов крови;

отбор наборов результатов анализов крови от 10% группы в соответствующей части; и

применение классификатора на выбранных наборах результатов анализов крови от 10% группы.

Теперь, как показано на 105, классификатор(ы) выводят, необязательно как модуль, который позволяет классифицировать целевых индивидуумов, например, посредством интерфейсного блока 206. Необязательно, определяют различные классификаторы для индивидуумов, имеющих различные демографические характеристики, например, один классификатор для мужчин, а другой для женщин. В соответствии с другим примером один классификатор применяют для курильщиков, а другой для некурящих.

Необязательно, классификаторы позволяют оценить злокачественную опухоль легкого путем сочетания набора результатов текущего анализа крови с анамнезом курения. Набор текущих результатов анализа крови включает несколько или более из следующих анализов крови: количество эозинофилов, относительное содержание эозинофилов, количество нейтрофилов, относительное содержание нейтрофилов, количество моноцитов, относительное содержание моноцитов, количество базофилов, относительное содержание базофилов, количество лимфоцитов, относительное содержание лимфоцитов и количество лейкоцитов (WBC); или по меньшей мере один результат из следующих анализов: количество эритроцитов (RBC), ширина распределения эритроцитов по объему (RDW), среднеклеточный объем (MCV), среднеклеточная концентрация гемоглобина (МСНС), гематокрит (НСТ), гемоглобин (HGB) и среднее содержание гемоглобина в отдельном эритроците (МСН); или по меньшей мере один результат из количества тромбоцитов и среднего объема тромбоцитов (MPV).

Необязательно, риск развития злокачественной опухоли легкого оценивают по результату по меньшей мере 2 вышеуказанных групп анализа крови.

Необязательно, риск развития злокачественной опухоли легкого оценивают посредством классифицирования результатов биохимических анализов крови целевого индивидуума. В соответствии с такими вариантами осуществления классификаторы создают на основании анализа ретроспективных результатов биохимических анализов крови множества индивидуумов, например, которые описаны выше. Результаты биохимических анализов крови могут включать результаты любых вышеуказанных биохимических анализов, включая, например, следующие анализы крови: альбумин, кальций, хлор, холестерин, креатинин, липопротеин высокой плотности (HDL), липопротеин низкой плотности (LDL), калий, натрий, триглицериды, мочевину и/или мочевую кислоту.

Необязательно, риск развития злокачественной опухоли легкого оценивают посредством классифицирования демографических характеристик целевого индивидуума. В соответствии с такими вариантами осуществления классификаторы создают на основании анализа демографических характеристик множества индивидуумов.

Необязательно, как текущие результаты анализа крови целевого индивидуума, так и ретроспективные результаты анализов крови индивидуумов, у которых был взят образец, применяют для создания используемых наборов признаков, которые включают обработанные и/или взвешенные значения. Необязательно, такой используемый набор признаков основывается на демографических характеристиках соответствующего индивидуума, например, как описано ниже.

Необязательно, один или несколько классификаторов адаптируют для одной или нескольких демографических характеристик целевого индивидуума. Необязательно, классификаторы выбирают так, чтобы они соответствовали одной или нескольким демографическим характеристикам целевого индивидуума. В соответствии с такими вариантами осуществления для женщин и мужчин и/или для различных возрастных групп можно применять различные классификаторы.

В соответствии с некоторыми вариантами осуществления настоящее изобретение относится к способам и системам создания одного или нескольких классификаторов для оценки риска для легкого. Способы и системы основываются на анализе множества ретроспективных результатов анализов крови одного множества индивидуумов, у которых был взят образец, и соответственно создании набора данных, имеющего множество наборов признаков, каждый из которых создан на основании соответствующих ретроспективных результатов анализов крови. Набор данных затем используют для создания и вывода одного или нескольких классификаторов, таких как классификаторы K-ближайших соседей (KNN), классификатор, основанный на применении комитетов из решающих деревьев, и классификатор взвешенной линейной регрессии, например, как описано выше. Классификатор может быть представлен в виде модулей для выполнения на клиентских терминалах, или его применяют в виде онлайн сервиса для оценки риска развития злокачественной опухоли легкого у целевых индивидуумов на основании их текущих результатов анализа крови.

Классификаторы необязательно создают как изложено в международной патентной заявке № PCT/IL2013/050368, поданной 2 мая 2013 года, которая включена в настоящий документ при помощи ссылки.

В приведенной далее таблице подытожены характеристики различных классификаторов, каждый из которых создан на основе анализа множества соответствующих ретроспективных результатов анализов крови от множества индивидуумов, у которых был взят образец, причем результаты анализов крови включают данные от одной или двух групп, в соответствии с некоторыми вариантами осуществления по настоящему изобретению.

Классификатор(ы) создают на основании анализа множества соответствующих ретроспективных результатов анализа крови от множества индивидуумов, у которых был взят образец, при этом результаты анализа крови включают по меньшей мере одно из следующих:

1) результаты анализа на лейкоциты, которые для краткости называют "лейкоцитами" и включают по меньшей мере одно из количества нейтрофилов, количества базофилов, количества эозинофилов, количества лимфоцитов, количества моноцитов, количества лейкоцитов, относительного количества нейтрофилов, относительного количества базофилов, относительного количества эозинофилов, относительного количества лимфоцитов, относительного количества моноцитов;

2) результаты анализа на тромбоциты, которые для краткости называют "тромбоцитами" и включают их количество и/или MPV;

3) результаты биохимического анализа, которые выбраны из группы, состоящей из скорости оседания эритроцитов (ESR), глюкозы, мочевины, азота мочевины крови (BUN), креатинина, натрия, калия, хлора, кальция, фосфора, мочевой кислоты, общего количества билирубина, лактатдегидрогеназы (LDH), глутаминовой оксалоацетиновой трансаминазы (GOT), глутаминовой оксалоацетиновой трансаминазы в сыворотке крови крови (SGOT) и глютамат оксалоацетат трансаминазы, аспарагиновой трансаминазы (AST), аспартатаминотрансферазы, глутамат-пируват-трансаминазы (GPT) глутамат-пируват-трансаминазы в сыворотке крови (SGPT), аланин-аминотрансферазы (ALT), щелочной фосфатазы (щелоч. фосф./ALP), гамма-глутамилтранспептидазы (GGT), альбумина, CK (креатинкиназы), железа, HbA1, В12, витамина D, G-6-PD, лития, фолиевой кислоты, CRP (C-реактивного белка), липопротеина низкой плотности (LDL), липопротеина высокой плотности (HDL), триглицеридов, общего содержания холестерина, амилазы, РТ (протромбинового времени), частичного тромбопластинового времени (РТТ), активированного частичного тромбопластинового времени (АРРТ), (международного нормализационного индекса (INR), фибриногена, цитидинтрифосфата (СРТ), ферритина, скорости гломерулярной фильтрации (GFR), трансферрина, общей железосвязывающей способности (TIBC), остаточной железосвязывающей способности (UIBC);

4) результаты анализа эритроцитов, которые для краткости называют "эритроцитами" и включают по меньшей мере один из следующих параметров: RBC, RDW, MCV, МСНС, гематокрит, гемоглобин и МСН.

Например, классификаторы основаны только на лейкоцитах и тромбоцитах. Следует отметить, что классификатор, основанный только на лейкоцитах или тромбоцитах, дает лучший результат, чем классификатор, основанный только на стаже курения (см. приведенную выше таблицу). Это необычно, поскольку имеется множество документальных подтверждений, что анамнез курения коррелирует со злокачественной опухолью легкого.

Необязательно, классификаторы основаны только на 2 из приведенных выше групповых параметров, например, стаж курения и лейкоциты, стаж курения и тромбоциты, стаж курения и эритроциты, эритроциты и лейкоциты, тромбоциты и лейкоциты и тромбоциты и эритроциты.

Классификатор(ы) создает(создают) на основе анализа возраста и/или пола каждого индивидуума.

Классификатор(ы) создает(создают) классификации, также называемые прогнозами. Классификации необязательно собирают для измерения характеристики каждого классификатора. Например, критерии оценки характеристики выбирают в соответствии с рабочей характеристической кривой (ROC). Необязательно, для выявления таких критериев оценки используют специфичность при различных значениях чувствительности (полноты) (5%, 10%, 20%, 50% и 70%). Характеристики различных иллюстративных классификаторов сводят в таблицах, которые соответственно имеют различные площади под кривой (AUC).

Необязательно, для каждого из множества индивидуумов, у которых был взят образец, в индивидуальных записях включено прошлое значение(я), а также текущее значение(я) каждого из множества параметров лейкоцитарной формулы. Иллюстративные данные в таких вариантах осуществления могут представлять собой следующие: AUC = 0,94 [0,93, 0,96] ИЛИ при чувствительности (SENS 10%) SENS10 = 438 [123, 626], SENS при относительном числе ложно-позитивных результатов (FPR 10) = 85.4% [80,7, 89,8], SENS при FPR1 = 41,8% [34,9, 50,5]. Иллюстративные данные, приведенные в данном документе ниже, подтверждаются оптимальной характеристикой, которая приведена в записях результатов медицинских анализов в Memorial Healthcare System (MHS) за временной интервал 0-30 дней у пациентов в возрастной группе 50-75 лет. Записи выбирают в соответствии с чувствительностью при FPR 10%.

Необязательно, для каждого из множества индивидуумов, у которых был взят образец, в индивидуальных записях включено прошлое значение(я), а также текущее значение(я) каждого из множества параметров, представляющих собой количество лейкоцитов. Иллюстративные данные в таких вариантах осуществления могут представлять собой следующие: AUC = 0,94 [0,92, 0,95], ИЛИ при SENS10 = 260 [87, 624], SENS при FPR10 = 79,4% [74,7, 84,0], SENS при FPR1 = 38,0% [30,6, 45,4].

Необязательно, для каждого из множества индивидуумов, у которых был взят образец, в индивидуальных записях включено прошлое значение(я), а также текущее значение(я) каждого из множества параметров, представляющих собой количество эритроцитов. Иллюстративные данные в таких вариантах осуществления могут представлять собой следующие: AUC = 0,88 [0,86, 0,90], ИЛИ при SENS10 = 88 [36, 208], SENS при FPR10 = 64,1% [58,8, 70,0], SENS при FPR1 = 27,4% [20,7, 33,9].

Необязательно, для каждого из множества индивидуумов, у которых был взят образец, в индивидуальных записях включено прошлое значение(я), а также текущее значение(я) каждого из множества параметров, представляющих собой количество тромбоцитов. Иллюстративные данные в таких вариантах осуществления могут представлять собой следующие: AUC = 0,91 [0,89, 0,92], ИЛИ при SENS10 = 149 [41, 614], SENS при FPR10 = 72,9% [66,9, 78,3], SENS при FPR1 = 35,4% [28,1, 42,3].

Необязательно, для каждого из множества индивидуумов, у которых был взят образец, в индивидуальных записях включено прошлое значение(я), а также текущее значение(я) каждого значения из объема информации о тромбоцитах. Иллюстративные данные в таких вариантах осуществления могут представлять собой следующие: AUC = 0,94 [0,92, 0,95], ИЛИ при SENS10 = 232 [76, 621], SENS при FPR10 = 80,7% [75,6, 85,2], SENS при FPR1 = 37,7% [31,2, 44,7].

Необязательно, для каждого из множества индивидуумов, у которых был взят образец, в индивидуальных записях включено прошлое значение(я), а также текущее значение(я) каждого из количества лейкоцитов и любого параметра количества эритроцитов. Иллюстративные данные в таких вариантах осуществления могут представлять собой следующие: AUC = 0,93 [0,92, 0,95], ИЛИ при SENS10 = 326 [77, 625], SENS при FPR10 = 80,1% [75,0, 84,8], SENS при FPR1 = 38,2% [32,3, 45,2].

Необязательно, для каждого из множества индивидуумов, у которых был взят образец, в индивидуальных записях включено прошлое значение(я), а также текущее значение(я) любого параметра количества лейкоцитов и любого параметра из объема информации о тромбоцитах или любого параметра количества клеток лейкоцитарного ряда и любого биохимического параметра.

Необязательно, для каждого из множества индивидуумов, у которых был взят образец, в индивидуальных записях включено прошлое значение(я), а также текущее значение(я) любого параметра количества эритроцитов и любого параметра из объема информации о тромбоцитах. В соответствии с такими вариантами осуществления AUC = 0,92 [0,90, 0,93], ИЛИ при SENS10 = 194 [57, 619], SENS при FPR10 = 76,6% [71,1, 81,6], SENS при FPR1 = 35,2% [27,4, 42,2].

Необязательно, для каждого из множества индивидуумов, у которых был взят образец, в индивидуальных записях включено прошлое значение(я), а также текущее значение(я) из объема информации о тромбоцитах и любого биохимического параметра.

Необязательно, для каждого из множества индивидуумов, у которых был взят образец, в индивидуальных записях включено прошлое значение(я), а также текущее значение(я) количества эритроцитов и любого биохимического параметра.

Необязательно, для каждого из множества индивидуумов, у которых был взят образец, в индивидуальных записях включено прошлое значение(я), а также текущее значение(я) количества нейтрофилов. В соответствии с такими вариантами осуществления AUC = 0,90 [0,89, 0,92], ИЛИ при SENS10 = 44 [23, 89], SENS при FPR10 = 69,2% [62,9, 74,8], SENS при FPR1 = 22,2% [16,9, 28,6].

Необязательно, для каждого из множества индивидуумов, у которых был взят образец, в индивидуальных записях включено прошлое значение(я), а также текущее значение(я) гематокрита. В соответствии с такими вариантами осуществления AUC = 0,88 [0,86, 0,90], ИЛИ при SENS10 = 88 [36, 208], SENS при FPR10 = 64,1% [58,8, 70,0], SENS при FPR1 = 27,4% [20,7, 33,9].

Необязательно, для каждого из множества индивидуумов, у которых был взят образец, в индивидуальных записях включено прошлое значение(я), а также текущее значение(я) количества тромбоцитов. Иллюстративные данные в таких вариантах осуществления могут представлять собой следующие: AUC = 0,91 [0,89, 0,92], ИЛИ при SENS10 = 149 [41, 614], SENS при FPR10 = 72,9% [66,9, 78,3], SENS при FPR1 = 35,4% [28,1, 42,3].

Необязательно, для каждого из множества индивидуумов, у которых был взят образец, в индивидуальных записях включено прошлое значение(я), а также текущее значение(я) количества клеток лейкоцитарного ряда и любого параметра количества клеток эритроцитарного ряда и любого параметра из объема информации о тромбоцитах. Иллюстративные данные в таких вариантах осуществления могут представлять собой следующие: AUC = 0,94 [0,93, 0,96], ИЛИ при SENS10 = 438 [123, 626], SENS при FPR10 = 85,4% [80,7, 89,8], SENS при FPR1 = 41,8% [34,9, 50,5].

Необязательно, для каждого из множества индивидуумов, у которых был взят образец, в индивидуальных записях включено прошлое значение(я), а также текущее значение(я) любого параметра количества клеток лейкоцитарного ряда и любого параметра количества клеток эритроцитарного ряда или любого параметра из объема информации о тромбоцитах и любого биохимического параметра.

Необязательно, для каждого из множества индивидуумов, у которых был взят образец, в индивидуальных записях включено прошлое значение(я), а также текущее значение(я) любого параметра из СВС или биохимии и семейный анамнез злокачественной опухоли легкого, любого параметра количества лейкоцитов и семейный анамнез злокачественной опухоли легкого, любой информации о количестве эритроцитов и семейный анамнез злокачественной опухоли легкого, любого параметра из СВС или биохимии и индекс массы тела (BMI), любого параметра количества лейкоцитов и BMI, любой информации о количестве эритроцитов и BMI, любого параметра из СВС или биохимии и сопутствующую патологию (например, COPD), любого параметра количества лейкоцитов и сопутствующую патологию, любой информации о количестве эритроцитов и сопутствующую патологию, любого параметра из СВС или биохимии и социально-экономические показатели (например, уровень образования), любого параметра количества лейкоцитов и социально-экономические показатели и/или любой информации о количестве эритроцитов и социально-экономические показатели.

Ожидается, что в ходе срока экспертизы патента, начиная от момента подачи заявки, будет разработано множество соответствующих систем и способов, и подразумевают, что объем термина процессор, дисплей и пользовательский интерфейс a priori включает все такие новые технологии.

В контексте настоящей заявки термин "приблизительно" относится к ±10%.

Выражения "содержит", "содержащий", "включает", "включающий", "имеющий" и их сочетания означают "включающий без ограничения". Такое выражение охватывает выражения "состоящий из" и "фактически состоящий из".

Фраза "фактически состоящий из" означает, что композиция или способ могут включать дополнительные ингредиенты и/или стадии, но только если дополнительные ингредиенты и/или стадии существенно не изменяют основные и новые характеристики заявляемые композицию или способ.

В контексте настоящей заявки форма единственного числа включает формы множественного числа, если контекст явно не предписывает иное. Например, термин "соединение" или "по меньшей мере одно соединение" может включать множество соединений, в том числе смеси с ними.

Слово "иллюстративный" в контексте настоящей заявки понимают как "служащий в качестве примера, образца или иллюстрации". Любой вариант осуществления, описываемый как "иллюстративный" не обязательно истолковывать как предпочтительный или преимущественный по отношению к другим вариантам осуществления и/или как исключающий включения признаков других вариантов осуществления.

Слово "необязательно" в контексте настоящей заявки понимают как "используется в соответствии с одними вариантами осуществления и не используется в соответствии с другими вариантами осуществления". Любой отдельный вариант осуществления может включать множество "необязательных" признаков, если такие признаки не входят в противоречие друг с другом.

По всей настоящей заявке различные варианты осуществления настоящего изобретения могут быть представлены в формате диапазона. Следует понимать, что описание в формате диапазонов используется лишь для удобства и краткости и не должно истолковываться как жесткое ограничение объема настоящего изобретения. Соответственно, описание диапазонов необходимо рассматривать как включающее отдельно раскрытые все возможные поддиапазоны, а также отдельные числовые значения в пределах такого диапазона. Например, описание такого диапазона, как от 1 до 6, следует понимать как включающее отдельно раскрытые поддиапазоны, такие как от 1 до 3, от 1 до 4, от 1 до 5, от 2 до 4, от 2 до 6, от 3 до 6 и т.д., а также отдельные числа в пределах такого диапазона, например, 1, 2, 3, 4, 5 и 6. Это применимо независимо от ширины диапазона.

Независимо от указанного в настоящей заявке числового диапазона, его понимают как включающий любое указанное число (дробное или целое) в пределах указанного диапазона. Фразы "варьирующий в диапазоне/варьирует в диапазоне между" первым указанным числом и вторым указанным числом и "варьирующий в диапазоне/варьирует в диапазоне от" первого указанного числа "до" второго указанного числа в настоящей заявке используют взаимозаменяемо и понимают с включением первого и второго указанного числа и всех дробных и целых чисел между ними.

Следует понимать, что некоторые признаки настоящего изобретения, которые для наглядности описаны в контексте отдельных вариантов осуществления, также могут быть представлены в сочетании в отдельном варианте осуществления. И наоборот, различные признаки настоящего изобретения, которые для краткости описаны в контексте отдельного варианта осуществления, также могут быть представлены отдельно или в любых подходящих подкомбинациях или как подходящие в соответствии с любым другим описанным вариантом осуществления настоящего изобретения. Некоторые признаки, описанные в контексте различных вариантов осуществления, не следует рассматривать как неотъемлемые признаки таких вариантов осуществления, если такой вариант осуществления не является неосуществимым без этих элементов.

Несмотря на то, что настоящее изобретение было описано в сочетании с его конкретными вариантами осуществления, очевидно, что специалистам в настоящей области техники будут понятны многие альтернативы, модификации и варианты. Соответственно, подразумевают, что оно охватывает все такие альтернативы, модификации и варианты, которые подпадают под идею и максимально возможный широкий объем прилагаемой формулы изобретения.

Все публикации, патенты, заявки на выдачу патентов, упомянутые в настоящем описании, включены в настоящий документ в полном их объеме с помощью ссылки, приведенной в описании, до той де степени, как если бы каждая отдельная публикация, патент или заявка на выдачу патента была специально и отдельно указана как включенная в настоящий документ с помощью ссылки. Кроме того, цитирование или указание любого источника в настоящей заявке не следует интерпретировать как допущение, что такой источник может быть противопоставлен настоящему изобретению. В случае использования заголовков разделов, их не следует интерпретировать как обязательно ограничивающие.

Похожие патенты RU2677742C2

название год авторы номер документа
СПОСОБЫ И СИСТЕМЫ ДЛЯ ОЦЕНКИ РИСКА РАКА ЖЕЛУДОЧНО-КИШЕЧНОГО ТРАКТА 2013
  • Калкстейн Нир
  • Кинар Иарон
  • Шалев Варда
  • Чодик Гэбриел
  • Голдштейн Инбал
RU2640568C2
СПОСОБ ЛЕЧЕНИЯ НЕМЕЛКОКЛЕТОЧНОГО РАКА ЛЕГКОГО 2012
  • Мус Виктор Федорович
  • Немкова Елена Васильевна
  • Виноградов Александр Владимирович
  • Шутко Алексей Николаевич
  • Бочкарева Татьяна Николаевна
RU2490037C1
Способ прогнозирования развития рецидива диффузной В-крупноклеточной лимфомы 2021
  • Франциянц Елена Михайловна
  • Бандовкина Валерия Ахтямовна
  • Куштова Луиза Беслановна
  • Николаева Надежда Владимировна
  • Ишонина Оксана Георгиевна
RU2758126C1
СПОСОБ ЛЕЧЕНИЯ МЕСТНОРАСПРОСТРАНЕННОГО НЕМЕЛКОКЛЕТОЧНОГО РАКА ЛЕГКОГО 2012
  • Мус Виктор Федорович
  • Немкова Елена Васильевна
  • Виноградов Александр Владимирович
  • Шутко Алексей Николаевич
  • Бочкарева Татьяна Николаевна
RU2489181C1
СПОСОБ ДИФФЕРЕНЦИАЛЬНОЙ ДИАГНОСТИКИ РАКА И ПРЕДРАКОВОЙ ПАТОЛОГИИ 1992
  • Кшивец Олег Михайлович
RU2045072C1
СПОСОБ ДИАГНОСТИКИ ГЕНЕРАЛИЗАЦИИ ЗЛОКАЧЕСТВЕННЫХ НОВООБРАЗОВАНИЙ У ОНКОЛОГИЧЕСКИХ БОЛЬНЫХ 1995
  • Кшивец Олег Михайлович
RU2132059C1
СПОСОБ ДИФФЕРЕНЦИАЛЬНОЙ ДИАГНОСТИКИ ЗЛОКАЧЕСТВЕННЫХ НОВООБРАЗОВАНИЙ И ДОБРОКАЧЕСТВЕННОЙ ПАТОЛОГИИ 1994
  • Кшивец Олег Михайлович
RU2114431C1
Способ эндоскопической диссекции эпителиальных образований пищеварительного тракта 2022
  • Шишин Кирилл Вячеславович
  • Недолужко Иван Юрьевич
  • Павлов Иван Александрович
  • Чернокозинская Софья Владимировна
RU2790240C1
Способ маркировки регионарных лимфатических узлов при хирургическом лечении рака ободочной кишки 2022
  • Стрельцов Юрий Александрович
  • Данилов Михаил Александрович
  • Леонтьев Александр Владимирович
  • Гришина Елена Александровна
  • Шишин Кирилл Вячеславович
RU2800848C1
Способ лечения новообразований большого сосочка двенадцатиперстной кишки 2022
  • Недолужко Иван Юрьевич
  • Хон Екатерина Игоревна
  • Шишин Кирилл Вячеславович
RU2783850C1

Иллюстрации к изобретению RU 2 677 742 C2

Реферат патента 2019 года СПОСОБЫ И СИСТЕМЫ ОЦЕНКИ РИСКА РАЗВИТИЯ ЗЛОКАЧЕСТВЕННОЙ ОПУХОЛИ ЛЕГКОГО

Группа изобретений относится к медицине, а именно к диагностике злокачественных опухолей, и может быть использована для оценки риска развития злокачественной опухоли легкого. Система содержит машиночитаемый носитель для реализации компьютеризированного способа, предусматривающий: создание набора признаков, содержащего множество текущих результатов анализа крови от крови, забранной у целевого индивидуума; получение по меньшей мере одного классификатора, созданного на основе множества соответствующих ретроспективных результатов анализов крови каждого другого из множества индивидуумов, у которых был взят образец; создание комбинации по меньшей мере из 10 необработанных признаков на основе указанного множества текущих результатов анализов крови, причем указанные по меньшей мере 10 необработанных признаков включают актуальные значения анализов крови по меньшей мере 10 результатов различных анализов крови; и оценку при помощи процессора риска развития злокачественной опухоли легкого у указанного целевого индивидуума посредством классификации указанной комбинации по меньшей мере из 10 необработанных признаков актуальных значений анализов крови по меньшей мере 10 результатов различных анализов крови при помощи указанного по меньшей мере одного классификатора; причем каждый из указанного множества ретроспективных и текущих результатов анализов крови включает результаты по меньшей мере одного результата биохимического анализа и актуальные значения анализов крови, выбранные из каждой из следующих групп анализов крови: (i) результаты анализа крови на лейкоциты, включающие по меньшей мере одно из количества нейтрофилов, количества базофилов, количества эозинофилов, количества лимфоцитов, количества моноцитов, количества WBC, относительного содержания нейтрофилов, относительного содержания базофилов, относительного содержания эозинофилов, относительного содержания лимфоцитов и относительного содержания моноцитов, причем указанный набор признаков содержит множество ретроспективных результатов анализов крови от указанной крови, забранной от указанного целевого индивидуума; (ii) результаты анализа крови на тромбоциты, включающие по меньшей мере одно из количества тромбоцитов и среднего объема тромбоцитов (MPV); и сочетание (iii) анамнеза курения и (iv) результатов анализа на эритроциты, включающего по меньшей мере один из анализов на количество эритроцитов (RBC), ширины распределения эритроцитов по объему (RDW), анализов крови на гемоглобин (МСН), среднеклеточного объема (MCV), среднеклеточной концентрации гемоглобина (МСНС), гематокрита и гемоглобина. Группа изобретений обеспечивает эффективный скрининг злокачественных опухолей. 3 н. и 12 з.п. ф-лы, 2 ил.

Формула изобретения RU 2 677 742 C2

1. Компьютеризированный способ оценки риска развития злокачественной опухоли легкого, предусматривающий:

создание набора признаков, содержащего множество текущих результатов анализа крови от крови, забранной у целевого индивидуума;

получение по меньшей мере одного классификатора, созданного на основе множества соответствующих ретроспективных результатов анализов крови каждого другого из множества индивидуумов, у которых был взят образец;

создание комбинации по меньшей мере из 10 необработанных признаков на основе указанного множества текущих результатов анализов крови, причем указанные по меньшей мере 10 необработанных признаков включают актуальные значения анализов крови по меньшей мере 10 результатов различных анализов крови; и

оценку при помощи процессора риска развития злокачественной опухоли легкого у указанного целевого индивидуума посредством классификации указанной комбинации по меньшей мере из 10 необработанных признаков актуальных значений анализов крови по меньшей мере 10 результатов различных анализов крови при помощи указанного по меньшей мере одного классификатора;

причем каждый из указанного множества ретроспективных и текущих результатов анализов крови включает результаты по меньшей мере одного результата биохимического анализа и актуальные значения анализов крови, выбранные из каждой из следующих групп анализов крови:

(i) результаты анализа крови на лейкоциты, включающие по меньшей мере одно из количества нейтрофилов, количества базофилов, количества эозинофилов, количества лимфоцитов, количества моноцитов, количества WBC, относительного содержания нейтрофилов, относительного содержания базофилов, относительного содержания эозинофилов, относительного содержания лимфоцитов и относительного содержания моноцитов, причем указанный набор признаков содержит множество ретроспективных результатов анализов крови от указанной крови, забранной от указанного целевого индивидуума;

(ii) результаты анализа крови на тромбоциты, включающие по меньшей мере одно из количества тромбоцитов и среднего объема тромбоцитов (MPV); и

сочетание (iii) анамнеза курения и (iv) результатов анализа на эритроциты, включающего по меньшей мере один из анализов на количество эритроцитов (RBC), ширины распределения эритроцитов по объему (RDW), анализов крови на гемоглобин (МСН), среднеклеточного объема (MCV), среднеклеточной концентрации гемоглобина (МСНС), гематокрита и гемоглобина.

2. Компьютеризированный способ по п. 1, предусматривающий, что указанные результаты биохимического анализа выбирают из группы, состоящей из анализов на скорость оседания эритроцитов (ESR), глюкозы, мочи, азота мочевины крови (BUN), креатинина, натрия, калия, хлорида, кальция, фосфора, мочевой кислоты, общего количества билирубина, лактатдегидрогеназы (LDH), глутаминовой оксалоацетиновой трансаминазы (GOT), глутаминовой оксалоацетиновой трансаминазы в сыворотке крови (SGOT), глютамат оксалоацетата, аспарагиновой трансаминазы (AST), аспартатаминотрансферазы, глутамат-пируват-трансаминазы (GPT) глутамат-пируват-трансаминазы в сыворотке (SGPT), аланин-аминотрансферазы (ALT), щелочной фосфатазы (щелоч. фосф./ALP), гамма-глутамилтранспептидазы (GGT), альбумина, СК (креатинкиназы), железа, HbA1, В12, витамина D, G-6-PD, лития, фолиевой кислоты, CRP (С-реактивного белка), липопротеина низкой плотности (LDL), липопротеина высокой плотности (HDL), триглицеридов, общего содержания холестерина, амилазы, РТ (протромбинового времени), частичного тромбопластинового времени (РТТ), активированного частичного тромбопластинового времени (АРРТ), международного нормализационного индекса (INR), фибриногена, цитидинтрифосфата (СРТ), ферритина, скорости гломерулярной фильтрации (GFR), трансферрина, общей железосвязывающей способности (TIBC), остаточной железосвязывающей способности (UIBC).

3. Компьютеризированный способ по п. 1, предусматривающий, что указанный по меньшей мере один классификатор создают в результате сочетания указанного множества ретроспективных и текущих результатов анализов крови и по меньшей мере одного демографического параметра каждого из указанного множества индивидуумов, у которых был взят образец.

4. Компьютеризированный способ по п. 3, предусматривающий, что указанный по меньшей мере один демографический параметр является членом группы, состоящей из пола, возраста, зоны проживания, расы и социально-экономической характеристики.

5. Компьютеризированный способ по п. 1, предусматривающий, что указанный каждый из указанного множества ретроспективных и текущих результатов анализов крови содержит результаты из результатов анализа крови на лейкоциты, включающего по меньшей мере одно из количества нейтрофилов, количества базофилов, количества эозинофилов, количества лимфоцитов, количества моноцитов, количества WBC, относительного содержания нейтрофилов, относительного содержания базофилов, относительного содержания эозинофилов, относительного содержания лимфоцитов, относительного содержания моноцитов.

6. Компьютеризированный способ по п. 1, предусматривающий, что указанный каждый из указанного множества ретроспективных и текущих результатов анализов крови включает результаты анализа крови на тромбоциты, включающие по меньшей мере одно из количества тромбоцитов и MPV.

7. Компьютеризированный способ по п. 6, предусматривающий, что указанный каждый из указанного множества ретроспективных и текущих результатов анализов крови включает анамнез курения.

8. Машиночитаемый носитель, содержащий выполняемые компьютером инструкции, адаптированные для осуществления способа по п. 1.

9. Способ по п. 1, предусматривающий, что каждый из указанного множества ретроспективных и текущих результатов анализов крови включает результаты как на относительное содержание нейтрофилов/количество нейтрофилов, так и на относительное содержание лимфоцитов/количество лимфоцитов.

10. Способ по п. 1, предусматривающий, что указанный по меньшей мере один классификатор включает члена группы, состоящей из классификатора взвешенной линейной регрессии, классификатора К-ближайших соседей (KNN) и классификатора решающих деревьев.

11. Способ по п. 1, предусматривающий, что каждый из указанного множества ретроспективных и текущих результатов анализов крови включает результаты на тромбокрит (РСТ).

12. Способ по п. 1, предусматривающий, что каждый из указанного множества ретроспективных и текущих результатов анализов крови включает результаты как на HGB, так и на НСТ.

13. Способ по п. 1, предусматривающий, что указанный набор признаков включает возраст указанного целевого индивидуума, причем указанный по меньшей мере один классификатор получают на основании анализа возраста каждого другого из множества индивидуумов, у которых был взят образец.

14. Способ по п. 1, предусматривающий, что каждый из указанного множества ретроспективных и текущих результатов анализов крови включает по меньшей мере один из следующих анализов крови: количество эозинофилов, относительное содержание нейтрофилов, относительное содержание моноцитов, относительное содержание эозинофилов, относительное содержание базофилов и количество нейтрофилов, количество моноцитов.

15. Система для оценки злокачественной опухоли легкого, содержащая:

процессор;

блок памяти, которых хранит по меньшей мере один классификатор для оценки риска развития злокачественной опухоли легкого, по меньшей мере один классификатор создан на основе анализа множества ретроспективных результатов анализов крови каждого другого из множества индивидуумов, у которых был взят образец, причем по меньшей мере один классификатор создан на основе:

набора данных, имеющего множество комбинаций по меньшей мере из 10 необработанных признаков на основе соответствующего множества ретроспективных результатов анализа крови другого из указанного множества индивидуумов, у которых был взят образец, где указанные по меньшей мере 10 необработанных признаков включают актуальные значения анализов крови по меньшей мере 10 результатов различных анализов крови;

причем каждый из указанного множества ретроспективных и текущих результатов анализов крови включает результаты по меньшей мере одного результата биохимического анализа и актуальные значения анализов крови, выбранные из каждой из следующих групп анализов крови:

(i) результаты анализа крови на лейкоциты, включающие по меньшей мере одно из количества нейтрофилов, количества базофилов, количества эозинофилов, количества лимфоцитов, количества моноцитов, количества WBC, относительного содержания нейтрофилов, относительного содержания базофилов, относительного содержания эозинофилов, относительного содержания лимфоцитов и относительного содержания моноцитов, причем указанный набор признаков содержит множество ретроспективных результатов анализов крови от указанной крови, забранной от указанного целевого индивидуума;

(ii) результаты анализа крови на тромбоциты, включающие по меньшей мере одно из количества тромбоцитов и среднего объема тромбоцитов (MPV); и

сочетание (iii) анамнеза курения и (iv) результатов анализа на эритроциты, включающего по меньшей мере один из анализов на количество эритроцитов (RBC), ширины распределения эритроцитов по объему (RDW), анализов крови на гемоглобин (МСН), среднеклеточного объема (MCV), среднеклеточной концентрации гемоглобина (МСНС), гематокрита и гемоглобина.

Документы, цитированные в отчете о поиске Патент 2019 года RU2677742C2

US 6059724 A, 09.05.2000
WO 2013048292 A2, 04.04.2013
US 4733354 A, 22.03.1988
WO 9612187 A1, 25.04.1996.

RU 2 677 742 C2

Авторы

Калкстейн Нир

Кинар Иарон

Шалев Варда

Чодик Гэбриел

Голдштейн Инбал

Даты

2019-01-21Публикация

2014-11-05Подача