ОБЛАСТЬ ТЕХНИКИ
Настоящее изобретение в некоторых вариантах осуществления относится к диагностике рака и, более конкретно, к способам и системам оценки риска возникновения рака, но не ограничивается ими.
УРОВЕНЬ ТЕХНИКИ
Диагностика колоректального рака включает диагностику на основе иммунологического анализа на скрытую кровь в кале, диагностику посредством колоноскопии и другие подобные методы. Однако диагностика на основе анализа на скрытую кровь в кале не является доказательным методом диагностики, и для большей части индивидуумов с положительным результатом анализа результат является ложноположительным. Кроме того, имеются опасения, что при диагностике на основе анализа на скрытую кровь в кале или диагностике посредством колоноскопии, чувствительность обнаружения и специфичность обнаружения уменьшаются в отношении ранней стадии колоректального рака. В частности, рак правой половины толстой кишки на ранней стадии зачастую не обнаруживают при использовании диагностики методом анализа на скрытую кровь в кале. Диагностическая визуализация с помощью СТ (компьютерная томография), MRI (магнитно-резонансная томография), PET (позитронная эмиссионная компьютерная томография) и подобные им методы не подходят для диагностики колоректального рака.
С другой стороны, колоректальная биопсия при колоноскопии является доказательным методом диагностики, но она является высоко инвазивной процедурой, и проведение колоноскопии на этапе скрининга не является практически осуществимым. Кроме того, инвазивная диагностика, такая как колоноскопия, оказывает негативное влияние на пациентов, например, при обследовании возникает сопутствующая боль, при обследовании также имеется риск кровотечения или тому подобное.
В последнее время для диагностики колоректального рака были разработаны новые методы. Например, опубликованная заявка US 2010/0009401 описывает способ оценки колоректального рака, в котором измеряют концентрацию аминокислот в крови, собранной от субъектов, которых подвергают анализу, и состояние колоректального рака у субъекта оценивают на основе значения концентрации, по меньшей мере, одной из аминокислот Arg, Cys, Om, Trp, Glu, ABA, Val, Phe, Leu, GIn, Ile и His, содержащейся в данных по измеренным концентрациям аминокислот у субъекта.
СУЩНОСТЬ ИЗОБРЕТЕНИЯ
В соответствии с некоторыми вариантами осуществления настоящего изобретения предусмотрен компьютеризированный способ оценки риска рака желудочно-кишечного тракта. Способ включает создание набора характеристик, включающего множество результатов текущих анализов крови, собранной у целевого индивидуума, обеспечение, по меньшей мере, одного классификатора, созданного в соответствии с анализом множества соответствующих результатов проведенных ранее анализов крови каждого индивидуума из другого множества подвергнутых анализу индивидуумов; и оценку с использованием процессора риска рака желудочно-кишечного тракта у целевого индивидуума с помощью классификации набор характеристик с использованием, по меньшей мере, одного классификатора. Каждый из множества результатов проведенных ранее и текущих анализов крови включает результаты, по меньшей мере, одного из следующих анализов крови: анализ на эритроциты (RBC), гемоглобин (HGB) и гематокрит (НСТ), и, по меньшей мере, один результат следующих анализов крови: анализ на среднее содержание гемоглобина в эритроците (МСН) и среднюю концентрацию гемоглобина в эритроците (МСНС). Необязательно, результаты анализа крови берут из данных общего анализа крови (СВС).
Необязательно, набор характеристик включает возраст целевого индивидуума; где, по меньшей мере, один классификатор создан в соответствии с анализом возраста каждого индивидуума из другого множества подвергнутых анализу индивидуумов.
Необязательно, каждый из множества результатов проведенных ранее и текущих анализов крови включает результаты анализа ширины распределения эритроцитов по объему (RDW).
Необязательно, каждый из множества результатов проведенных ранее и текущих анализов крови включает результаты анализа на тромбокрит (РСТ).
Необязательно, каждый из множества результатов проведенных ранее и текущих анализов крови включает результаты анализа на средний объем эритроцитов (MCV).
Необязательно, каждый из множества результатов проведенных ранее и текущих анализов крови включает, по меньшей мере, один из следующих анализов крови: уровень лейкоцитов - WBC (СВС); средний объем тромбоцитов (MPV); средний уровень тромбоцитов (СВС); уровень эозинофилов; процент нейтрофилов; процент моноцитов; процент эозинофилов; процент базофилов; уровень нейтрофилов; уровень моноцитов.
Необязательно, по меньшей мере, один классификатор включает классификатор, выбранный из группы, состоящей из классификатора на основе взвешенной линейной регрессии, классификатора на основе метода К-ближайших соседей (KNN) и классификатора на основе алгоритма случайный лес.
Необязательно, набор характеристик включает, по меньшей мере, одну демографическую характеристику целевого индивидуума и, по меньшей мере, один классификатор создан в соответствии с анализом соответствующей, по меньшей мере, одной демографической характеристики каждого индивидуума из множества подвергнутых анализу индивидуумов.
Необязательно, способ дополнительно включает выбор, по меньшей мере, одного классификатора в соответствии, по меньшей мере, с одной демографической характеристикой индивидуума из множества классификаторов, каждый из которых создан в соответствии с множеством соответствующих результатов проведенных ранее анализов крови у подвергнутых анализу индивидуумов, имеющих, по меньшей мере, одну различную демографическую характеристику.
Необязательно, множество результатов анализа крови включает, по меньшей мере, один результат из следующего множества анализов крови: результаты биохимического анализа крови могут включать в себя любые из результатов анализа крови на альбумин, кальций, хлорид, холестерин, креатинин, липопротеин высокой плотности (HDL), липопротеин низкой плотности (LDL), калий, натрий, триглицериды, мочевину и/или мочевую кислоту.
В соответствии с некоторыми вариантами осуществления настоящего изобретения предусмотрена система оценки рака желудочно-кишечного тракта. Система включает процессор, блок памяти, который хранит, по меньшей мере, один классификатор, созданный в соответствии с анализом множества результатов проведенных ранее анализов крови каждого индивидуума из другого множества подвергнутых анализу индивидуумов, и блок ввода, на который поступает множество результатов текущих анализов крови, полученных для крови целевого индивидуума, и модуль оценки рака желудочно-кишечного тракта, который оценивает с использованием процессора риск рака желудочно-кишечного тракта у целевого индивидуума с помощью классификации, с использованием, по меньшей мере, одного классификатора, набора характеристик, полученных из множества результатов текущих анализов крови. Множество результатов проведенных ранее и текущих анализов крови включает результаты, по меньшей мере, одного анализа из следующего множества анализов крови: анализ на эритроциты (RBC), гемоглобин (HGB) и гематокрит (НСТ) и, по меньшей мере, один результат из следующих анализов крови: анализ на среднее содержание гемоглобина в эритроците (МСН) и среднюю концентрацию гемоглобина в эритроците (МСНС).
Необязательно, каждый из множества результатов проведенных ранее и текущих анализов крови включает результаты анализа на ширину распределения эритроцитов по объему (RDW).
Необязательно, каждый из множества результатов проведенных ранее и текущих анализов крови включает результаты анализа на тромбокрит (РСТ).
Необязательно, каждый из множества результатов проведенных ранее и текущих анализов крови включает средний объем эритроцитов (MCV).
В соответствии с некоторыми вариантами осуществления настоящего изобретения предусмотрен способ создания классификатора для оценки риска CRC. Способ включает обеспечение множества результатов проведенных ранее анализов крови каждого индивидуума из другого множества подвергнутых анализу индивидуумов, создание набора данных, имеющего множество наборов характеристик, где каждый набор создан в соответствии с соответствующим множеством результатов проведенных ранее анализов крови индивидуумов из другого множества подвергнутых анализу индивидуумов, создание, по меньшей мере, одного классификатора в соответствии с анализом набора данных и вывод, по меньшей мере, одного классификатора.
Необязательно, создание включает расчет и добавление, по меньшей мере, одной обработанной версии результата проведенного ранее анализа крови, взятого из соответствующего множества результатов проведенных ранее анализов крови, как характеристики к соответствующему набору характеристик.
Необязательно, создание включает задание веса каждого набора характеристик в соответствии с данными соответствующего множества результатов проведенных ранее анализов крови.
Необязательно, создание включает фильтрование множества наборов характеристик для удаления выпадающих значений в соответствии с максимальным пороговым значением стандартного отклонения.
Необязательно, множеству наборов характеристик задают вес в соответствии с данными соответствующего множества результатов проведенных ранее анализов крови.
Необязательно, множество результатов анализа крови включает, по меньшей мере, один из следующих анализов крови: анализ на эритроциты (RBC), гемоглобин (HGB) и гематокрит (НСТ) и, по меньшей мере, один результат следующих анализов крови: анализ на среднее содержание гемоглобина в эритроците (МСН) и среднюю концентрацию гемоглобина в эритроците (МСНС).
Необязательно, каждый из множества результатов проведенных ранее и текущих анализов крови включает результаты анализа на ширину распределения эритроцитов по объему (RDW).
Необязательно, каждый из множества результатов проведенных ранее и текущих анализов крови включает результаты анализа на тромбокрит (РСТ).
Необязательно, каждый из множества результатов проведенных ранее и текущих анализов крови включает результаты анализа на средний объем эритроцитов (MCV).
Необязательно, способ дополнительно включает добавление, по меньшей мере, одного демографического параметра каждого множества подвергнутых анализу индивидуумов к соответствующему набору характеристик.
Необязательно, по меньшей мере, один демографический параметр выбран из группы, состоящей из пола, возраста, места проживания, расы и социально-экономической характеристики.
Необязательно, создание включает расчет и добавление, по меньшей мере, одной обработанной версии, по меньшей мере, одного демографического параметра как характеристики к соответствующему набору характеристик.
Если не определено иное, все технические и/или научные термины, используемые в настоящем документе, имеют такое значение, которое обычно понимает специалист области, к которой принадлежит изобретение. Несмотря на то, что для практического осуществления или анализа вариантов осуществления изобретения могут быть использованы способы и материалы, подобные или эквивалентные способам и материалам, описанным в настоящем документе, примеры способов и/или материалов описаны ниже. В случае конфликта описание патента, включая приведенные в нем определения, будет превалировать. Кроме того, материалы, способы и примеры приведены только в иллюстративных целях и не предназначены для ограничения изобретения.
Реализация вариантов осуществления способа и/или системы изобретения может включать в себя выполнение или завершение выбранных задач вручную, автоматически или комбинировано. Кроме того, в отношении приборов и оборудования для вариантов осуществления способа и/или системы изобретения некоторые выбранные задачи могут быть выполнены аппаратными средствами, программным обеспечением или встроенным программным обеспечением, или комбинированно с использованием операционной системы.
Например, аппаратные средства для выполнения выбранных задач в соответствии с вариантами осуществления изобретения могут быть реализованы как микросхема или цепь. В программном обеспечении выбранные задачи в соответствии с вариантами осуществления изобретения могут быть реализованы в виде множества программных команд, выполняемых с помощью компьютера при использовании любой подходящей операционной системы. В примере варианта осуществления изобретения одна или более задач в соответствии с примерами вариантов осуществления способа и/или системы, которые описаны в настоящем документе, выполняются процессором данных, таким как компьютерная платформа для выполнения множества команд. Необязательно, процессор данных включает энергонезависимую память для хранения команд и/или данных и/или энергонезависимое запоминающее устройство, например, магнитный жесткий диск и/или съемный носитель для хранения команд и/или данных. Необязательно, предусмотрено также подключение к сети. Также необязательно предусмотрены дисплей и/или устройство ввода пользователя, такое как клавиатура или мышь.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
Некоторые варианты осуществления изобретения описаны в настоящем документе только в качестве примера со ссылкой на прилагаемые фигуры. Что касается фигур, подчеркивается, что сведения показаны в качестве примера и в целях иллюстративного обсуждения вариантов осуществления изобретения. В связи с этим описание вместе с Фигурами делает понятной специалистам в данной области возможность применения вариантов осуществления изобретения.
Фиг. 1 представляет блок-схему способа создания одного или более классификаторов для оценки количественного показателя риска рака желудочно-кишечного тракта в соответствии с анализом множества записей индивидуумов в соответствии с некоторыми вариантами осуществления настоящего изобретения;
Фиг. 2 представляет схематичное изображение системы для создания одного или более классификаторов, например, путем выполнения способа, изображенного на Фиг. 1, в соответствии с некоторыми вариантами осуществления настоящего изобретения;
Фиг. 3 представляет собой рабочую характеристическую кривую (ROC) в соответствии с некоторыми вариантами осуществления настоящего изобретения;
Фиг. 4А-4С представляют таблицы, обобщающие характеристики различных примеров классификаторов, в соответствии с некоторыми вариантами осуществления настоящего изобретения;
Фиг. 5А представляет изображение таблицы расширенного набора характеристик, которые перечислены в соответствии с их значимостью в классификаторе типа случайный лес для мужчин;
Фиг. 5В представляет таблицу с указанием корреляции между парами результатов анализов крови;
Фиг. 6 представляет изображение таблицы, показывающей производительность способа для нескольких временных промежутков;
Фиг. 7 представляет изображение таблицы, показывающей производительность классификатора типа случайный лес;
Фиг. 8 представляет блок-схему способа с использованием классификатора (классификаторов) для оценки количественного показателя риска желудочно-кишечного тракта для целевого индивидуума, в соответствии с некоторыми вариантами осуществления настоящего изобретения;
Фиг. 9 представляет таблицу, отражающую производительность классификаторов для каждого из раков толстой кишки, желудка, прямой кишки и пищевода при различных чувствительностях для различных групп популяции, в соответствии с некоторыми вариантами осуществления настоящего изобретения; и
Фиг. 10 представляет набор таблиц, обобщающих анализ результатов с использованием описанных выше классификаторов для классификации индивидуумов с анемией и без анемии (белые американцы), в соответствии с некоторыми вариантами осуществления настоящего изобретения.
ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ
Настоящее изобретение в некоторых вариантах осуществления относится к диагностике рака и, более конкретно, но не исключительно, к способам и системам для оценки риска рака.
В соответствии с некоторыми вариантами осуществления настоящего изобретения, предусмотрены способы и системы оценки риска рака желудочно-кишечного тракта с помощью классификации набора результатов текущих анализов крови у целевого индивидуума с использованием одного или более классификаторов, которые созданы в соответствии с анализом результатов проведенных ранее анализов крови множества индивидуумов. Набор результатов текущих анализов крови включает, по меньшей мере, один результат из анализов крови на гемоглобин (HGB), гематокрит (НСТ) и эритроциты (RBC) и, по меньшей мере, один результат из анализов крови на среднее содержание гемоглобина в эритроците (МСН) и среднюю концентрацию гемоглобина в эритроците (МСНС), и возраст целевого индивидуума. Необязательно, набор результатов текущих анализов крови дополнительно включает один или более из следующих анализов крови: анализ на уровень лейкоцитов - WBC (СВС); средний объем тромбоцитов (MPV); средний объем эритроцитов (MCV); ширина распределения эритроцитов по объему (RDW); уровень тромбоцитов (СВС); уровень эозинофилов; процент нейтрофилов; процент моноцитов; процент эозинофилов; процент базофилов; уровень нейтрофилов; уровень моноцитов; тромбокрит (РСТ).
Необязательно, риск рака желудочно-кишечного тракта оценивается с помощью классификации результатов биохимического анализа крови у целевого индивидуума. В таких вариантах осуществления классификаторы созданы в соответствии с результатами проведенного ранее биохимического анализа крови множества индивидуумов. Результаты биохимического анализа крови могут включать результаты любого из следующих анализов крови: анализ на альбумин, кальций, хлорид, холестерин, креатинин, липопротеины высокой плотности (HDL), липопротеины низкой плотности (LDL), калий, натрий, триглицериды, мочевину и/или мочевую кислоту.
Необязательно, риск рака желудочно-кишечного тракта оценивается с помощью классификации демографических характеристик целевого индивидуума. В таких вариантах осуществления классификаторы созданы в соответствии с анализом демографических характеристик множества индивидуумов.
Необязательно, текущие результаты анализа крови у целевого индивидуума и результаты проведенных ранее анализов крови подвергнутых анализу индивидуумов используют для создания расширенных наборов характеристик, которые включают обработанные и/или взвешенные значения. Необязательно, каждый расширенный набор характеристик основывается на демографических характеристиках соответствующего индивидуума, например, как описано ниже.
Необязательно, один или более классификаторов адаптированы к одной или более демографическим характеристикам целевого индивидуума. Необязательно, классификаторы выбраны для соответствия одной или более демографическим характеристикам целевого индивидуума. В таких вариантах осуществления, для женщин и мужчин могут быть использованы различные классификаторы.
В соответствии с некоторыми вариантами осуществления настоящего изобретения, предусмотрены способы и системы для создания одного или более классификаторов для оценки риска рака желудочно-кишечного тракта. Способы и системы основаны на анализе множества результатов проведенных ранее анализов крови каждого из другого множества подвергнутых анализу индивидуумов и создании, соответственно, набора данных, имеющего множество наборов характеристик, каждый из которых создан в соответствии с соответствующими результатами проведенных ранее анализов крови. Набор данных затем используется для создания и вывода одного или более классификаторов, такого как классификаторы на основе метода К-ближайщих соседей (KNN), классификаторы типа случайный лес и классификаторы взвешенной линейной регрессии. Классификаторы могут быть предусмотрены как модули для выполнения на клиентских терминалах или использоваться в качестве онлайн-сервиса для оценки риска рака желудочно-кишечного тракта у целевых индивидуумов на основе их текущих результатов анализа крови.
Перед пояснением, по меньшей мере, одного варианта осуществления изобретения в деталях необходимо понять, что изобретение не обязательно ограничивается в своем применении деталями конструкции и расположением компонентов и/или способами, представленными в следующем описании, и/или иллюстрирующими фигурами, и/или Примерами. Изобретение может быть воплощено в других вариантах осуществления или может осуществляться на практике, или применяться различными путями.
Согласно некоторым вариантам осуществления настоящего изобретения дается ссылка на Фиг. 1, которая является блок-схемой способа 100 для создания одного или более классификаторов для оценки количественного показателя риска рака желудочно-кишечного тракта в соответствии с анализом множества результатов проведенных ранее анализов каждого из множества индивидуумов с диагнозом. В настоящем документе раком желудочно-кишечного тракта может быть рак толстой кишки, желудка, прямой кишки или пищевода.
В соответствии с некоторыми вариантами осуществления настоящего изобретения дается также ссылка на Фиг. 2, которая представляет собой схематическую иллюстрацию системы 200 для создания классификатора (классификаторов) для оценки количественных показателей риска рака желудочно-кишечного тракта, например, путем осуществления способа, изображенного на Фиг. 1.
Система 200 включает одну или более баз данных медицинских записей 201 и/или связана с интерфейсом баз данных медицинских записей. База (базы) данных 201 включают множество записей индивидуумов, также именуемых множеством образцов индивидуумов, которые описывают для каждого из другого множества подвергнутых анализу индивидуумов один или более наборов из множества результатов проведенных ранее анализов, где каждый набор для другого индивидуума, и необязательно один или более демографических параметров, и прогноз рака желудочно-кишечного тракта. Набор множества результатов проведенных ранее анализов, демографических параметров, таких как возраст, и/или прогноз рака желудочно-кишечного тракта можно хранить в обычной записи образца и/или отбирать из множества независимых и/или связанных баз данных. Необязательно прогноз рака желудочно-кишечного тракта является набором двоичных данных в соответствии с записью системы регистрации онкологических больных. Другие результаты анализа могут быть обычно выполняемыми анализами крови и/или анализами крови, выполняемыми в тот же период. Необязательно в некоторых наборах множества результатов проведенных ранее анализов отсутствуют результаты анализа крови. Такие результаты необязательно дополняются путем взвешивания среднего доступных результатов анализа крови других индивидуумов. Способ дополнительно включает процессор 204, модуль создания классификатора 205 и блок интерфейса 206, такой как сетевой интерфейс.
В настоящем документе демографический параметр включает возраст, пол, расу, вес, национальность, географический регион проживания и/или подобные данные.
Сначала, как показано на 101, предусмотрены один или более наборов данных для множества образцов индивидуумов.
Необязательно, как показано на 102, множество образцов индивидуумов подвергается скринингу и/или отбору в соответствии с критериями соответствия. Например, записи образцов принадлежат индивидуумам в возрасте 40 лет или старше, которые либо присутствуют в системе регистрации онкологических больных с обнаруженным раком толстой кишки и, необязательно, не имеют других типов рака, либо которые не присутствуют в системе регистрации онкологических больных. Необязательно, записи образцов индивидуумов, которые присутствуют в системе регистрации онкологических больных, отбирают только в том случае, если последний задокументированный набор множества результатов проведенных ранее анализов был проведен в течение определенного периода перед регистрацией соответствующего индивидуума в системе регистрации онкологических больных, например в течение периода, по меньшей мере, 30 дней до текущей даты и не более чем за 2 года. Необязательно, записи образцов индивидуумов, которые не присутствуют в системе регистрации онкологических больных, отбирают только в том случае, если они включают набор множества результатов проведенных ранее анализов, которые создают равное распределение по времени (время отбора анализов крови) для позитивных и негативных по раку желудочно-кишечного тракта популяций. Процесс выравнивания временного распределения позитивных и негативных образцов также приводит к отбрасыванию, по меньшей мере, некоторых негативных (незарегистрированных) образцов и изменению распространенности рака желудочно-кишечного тракта в наборе данных.
В настоящее время, как показано в 103, оценочный набор данных, такой как матрица, создается в соответствии с данными образцов, полученными из записей образцов, например, с помощью модуля создания классификатора 205. Оценочный набор данных включает множество наборов характеристик, необязательно расширенных. Каждый набор характеристик создан из каждого набора скринированных и/или отобранных записей образцов. Набор характеристик является необязательно необработанными характеристиками, которые включают фактические значения анализов крови и/или демографических характеристик.
Как описано выше, каждая запись образца включает один или более наборов множества результатов проведенных ранее анализов индивидуума, где каждый набор включает комбинацию результатов анализов крови, например комбинацию из более чем 10, 15, 20 и/или любого промежуточного количества результатов анализов крови. В одном примере каждый выделенный набор необработанных характеристик включает, по меньшей мере, следующие 18 результатов анализов крови: анализ на эритроциты (RBC); уровень лейкоцитов - WBC (СВС); средний объем тромбоцитов (MPV); гемоглобин (HGB); гематокрит (НСТ); средний объем эритроцитов (MCV); среднее содержание гемоглобина в эритроците (МСН); среднюю концентрацию гемоглобина в эритроците (МСНС); ширину распределения эритроцитов по объему (RDW); уровень тромбоцитов (СВС); уровень эозинофилов; процент нейтрофилов; процент моноцитов; процент эозинофилов; процент базофилов; уровень нейтрофилов; уровень моноцитов и тромбокрит (РСТ). В другом примере каждый выделенный набор необработанных характеристик включает, по меньшей мере, результат одного из следующих анализов крови: HGB, НСТ и RBC, по меньшей мере, один результат из следующих анализов крови: МСН и МСНС, и дополнительные данные, отражающие возраст целевого индивидуума. Необязательно, этот выделенный набор необработанных характеристик дополнительно включает один или более из следующих анализов крови: RDW, анализ на тромбоциты и MCV. Кроме того, этот выделенный набор необработанных характеристик может дополнительно включать один или более из следующих анализов крови: WBC, уровень эозинофилов, процент и/или уровень нейтрофилов, процент и/или уровень базофилов и процент и/или уровень моноцитов.
Необязательно, набор необработанных характеристик является расширенным. Расширенный набор характеристик содержит характеристики, такие как представленные выше необработанные результаты анализов крови, и/или один или более демографических параметров и, необязательно, обработанные результаты анализа крови и/или комбинации результатов анализов крови, например, как описано ниже. Например, каждая характеристика в наборе расширенных характеристик основана на результате анализа крови, демографической характеристике, комбинации результата (результатов) анализа крови и/или демографической характеристики (характеристик) и/или обработанном результате (результатах) анализа крови и/или демографической характеристике (характеристиках). Например, когда набор необработанных характеристик включает 18 результатов анализа, расширенный набор из 114 характеристик создается на основе следующего:
1. 18 характеристик, каждая включает один результат из 18 результатов анализа крови.
2. 18 характеристик, каждая включает различие (например, отношение) между одним из 18 результатов анализа крови и первым виртуальным результатом. Первый виртуальный результат необязательно расчитывается путем нахождения взвешенного среднего значения соответствующих доступных результатов из записей образцов. Необязательно, каждому доступному анализу задают вес в соответствии с прошедшим периодом с момента его проведения и целевой датой, необязательно, датой набора множества результатов проведенных ранее анализов целевого индивидуума, которая упоминается в настоящем документе как целевая дата. Необязательно, доступные анализы являются анализами, проведенными в течение первого периода, например, за 540 дней до целевой даты. Например, вес может быть рассчитан как абсолютное значение из времени, прошедшего с момента его записи (например, когда был выполнен анализ). Вес может быть рассчитан как квадратичная функция или любая другая функция, которая является монотонной по отношению к абсолютному значению.
3. 18 характеристик, каждая из которых включает различие (например, соотношение) между одним из 18 результатов анализа крови и вторым виртуальным результатом, который необязательно рассчитывается, как описанный выше первый виртуальный результат, на основе доступных анализов, полученных в течение второго периода, например в течение 1080 дней перед целевой датой.
4. 1 характеристика - число наборов множества результатов проведенных анализов в течение периода от года до целевой даты.
5. 1 характеристика - число наборов множества результатов проведенных анализов в течение периода между 180*6 и 180*10 днями до целевой даты.
6. 1 характеристика - возраст индивидуума, например год рождения индивидуума.
7. 57 характеристик, которые являются квадратичными оценками всех описанных выше характеристик (детально описаны в пунктах 1-6).
Необязательно, один или более результатов биохимического анализа крови может быть задокументирован для индивидуума и необязательно добавлен как характеристика к набору характеристик. Такие характеристики могут быть обработаны, как результаты анализов крови, описанные выше. Результаты биохимического анализа крови могут включать любой из следующих результатов анализов крови: на альбумин, кальций, хлорид, холестерин, креатинин, липопротеины высокой плотности (HDL), липопротеины низкой плотности (LDL), калий, натрий, триглицериды, мочевину и/или мочевую кислоту.
Для создания других классификаторов, которые классифицируют целевых индивидуумов, имеющих различные демографические характеристики, например пол, необязательно, создают другие оценочные наборы данных, например матрицы, имеющие другие наборы расширенных характеристик.
Необязательно, оценочный набор данных, например матрица, фильтруется, чтобы итерационно удалить выпадающие значения. Необязательно, рассчитывают среднее отклонение и/или стандартное отклонение каждой характеристики, и характеристики, имеющие исключительные значения, например, большее, чем максимальное пороговое значение стандартного отклонения, например 10, уменьшают до максимального порогового значения стандартного отклонения. Например, процесс повторяется 10 раз (или менее, если уменьшение не проводят). Пример псевдокода, который описывает процесс очистки, следующий
Повторить 10 раз
Для каждой характеристики -
Расчитать среднее и стандартное отклонения (sdv).
Для каждого образца -
If (Значение {образец, характеристика}>
среднее {характеристика} +10*sdv {характеристика})
Значение {образец, характеристика}=
среднее {характеристика} +9
*sdv{характеристика})
If (Значение {образец, характеристика} <
среднее {характеристика} - 10*sdx {характеристика})
Значение {образец, характеристика} =
среднее {характеристика} –
9*sdv {характеристика}
конец цикла образца
конец цикла характеристики
выход, если не было внесено изменений
конец повтора
Как показано в 104, оценочный набор данных используется для создания классификаторов, каждый из которых классифицирует риск рака желудочно-кишечного тракта у целевого индивидуума на основе одной или более его демографических характеристик и текущего набора множества результатов анализов, например, с помощью модуля для создания классификатора 205. Необязательно, один или более следующих классификаторов могут быть созданы на основе оценки набора данных:
классификатор взвешенной линейной регрессии, в котором записи положительных образцов получают количественный показатель, примерно в 100 раз превышающий количественный показатель записей отрицательных образцов;
классификатор К-ближайших соседей (KNN), в котором имеется, например, 100-кратная понижающая дискретизация записи отрицательного образца; и
классификатор типа случайный лес, в котором, например, каждое дерево строится с использованием соотношения записей отрицательного к положительному образцу 2:1.
Необязательно, производительность каждого из классификаторов оценивается с использованием процесса 10-проходной перекрестной проверки, в котором оценочный набор данных, упоминаемый в настоящем документе как популяция, случайно разбивается на десять равных частей. Для каждой части может быть выполнено следующее:
выбор приемлемых наборов результатов анализа крови из 90% популяции не в соответствующей части;
обучение классификатора в соответствии с выбранными наборами результатов анализа крови;
выбор наборов результатов анализа крови из 10% популяции в соответствующей части; и
использование классификатора для выбранных наборов результатов анализа крови из 10% популяции.
В настоящее время классификации, также называемые предсказаниями, собирают для измерения производительности каждого классификатора. Например, измерения производительности выбирают в соответствии с рабочей характеристической кривой (ROC), например, как описано на Фиг. 3. Необязательно, для идентификации значений используют специфичность при различных (5%, 10%, 20%, 50% и 70%) значениях чувствительности (полнота поиска). Производительности других примеров классификаторов обобщены в таблицах, представленных на Фиг. 4А-4С, которые, соответственно, имеют площадь под кривой (AUC) 0,840±0,001, 0,820±0,001 и 0,833±0,001. Необходимо отметить, что Фиг. 3 и Фиг. 4А-4С рассчитаны на основе популяции из 217246 мужчин старше 40, где 1415 были идентифицированы как положительные по раку прямой кишки (CRC). Необязательно, каждое из чисел в таблице (точность прогноза, расчетная точность и специфичность) представлены в виде среднее ± стандартное отклонение (std), рассчитанное по различным схемам перекрестной проверки, например 10.
В настоящем документе полнота поиска обозначает частоту истинно положительных (TP) результатов для TP-классифицируемых индивидуумов, которая равна проценту CRC-индивидуумов (как TP, так и ложно отрицательные (FN) результаты), например TP/(TP+FN). В настоящем документе точность обозначает процент популяции, классифицированной как имеющие CRC, например TP/(TP+FP). В настоящем документе точность прогноза (lift) обозначает отношение точности к общей распространенности CRC в популяции. Например, среди полной популяции из 217246 мужчин старше 401415 были идентифицированы как положительные по CRC. В этом примере распространенность составляет 0,65%. Отбор отрицательных образцов для создания правильного временного распределения (см. выше) создает отклонение в популяциях для обучения и тестирования, что приводит к распространенности CRC 1,2%. Таким образом, точность прогноза может быть найдена напрямую, но она только косвенно может быть использована для нахождения расчетной точности, регулируя измеренную точность.
Необязательно, набор характеристик, который используется определенным классификатором для классификации, является взвешенным в соответствии с значимостью классификации. Значимость характеристики может быть определена как среднее значение понижения нечистоты узлов по всем деревьям данных, что измеряется коэффициентом Gini (статистическая дисперсия) в связи с расщеплением. В качестве примера Фиг. 5А отражает таблицу расширенного набора характеристик, который представлен в соответствии со своей значимостью в классификаторе типа случайный лес для мужчин.
Необходимо отметить, что результаты проведенных ранее анализов крови классификаторов и текущих анализов крови могут включать пары результатов анализа крови из анализов крови, считающихся сходными по своему характеру. Такие пары включают одну или более из следующих пар: гемоглобин (HGB) и гематокрит (НСТ), процент/уровень нейтрофилов и процент/уровень лимфоцитов (например, взятые из анализа СВС), MCV и МСН, RBC и гематокрит (НСТ), RBC и MCV. Проверка обоих результатов анализов крови такой пары не является тривиальной, так как для специалиста в данной области такие результаты анализа крови имеют общие назначения и не обладают кумулятивным значением и, таким образом, специалист в данной области использует только результаты одного анализа из пары аналогичных анализов крови, а не оба анализа из пары аналогичных анализов крови. Изобретатели неожиданно обнаружили, что корреляция между членами такой пары не является абсолютной, и что их вклад в производительность вышеописанного классификатора (классификаторов) является существенным. Например, см. Таблицу на Фиг. 5В.
Необходимо отметить, что производительность классификатора зависит от времени между датой последнего набора результатов анализа крови и датой обнаружения рака, например, которая регистрируется в системе регистрации онкологических больных. Такая зависимость выявляется с учетом классификаторов, в которых приемлемые анализы крови для положительных образцов находятся в пределах ограниченного временного интервала (например, 30-90 дней перед регистрацией в системе регистрации онкологических больных, 90-180 дней и/или в подобных пределах). Например, Фиг. 6 отражает таблицу, показывающую характеристики для нескольких временных интервалов. Таблица показывает скорректированные на возраст данные СВС, полученные за 30-720 дней перед постановкой диагноза, для случаев CRC по сравнению с контрольными данными для здоровых индивидуумов, что отражает изменения за длительный период времени. Кроме того, для каждого случая, выбранные значение параметра/результат сравнивали с соответствующими параметрами результатов за 1,5 года (дельта 1,5) и за 3 года (дельта 3) до оценки выбранных значений параметра/результата. Как показано в таблице на Фиг. 6, специфичность понижается для более старых данных.
Необходимо отметить, что анемия в крови может быть вызвана несколькими состояниями желудочно-кишечного тракта и другими состояниями, по сравнению с которыми рак GI встречается наименее часто. Необъяснимая анемия является одним из основных прогностических маркеров CRC у пожилых людей и, вместе с геморроем, является распространенной причиной для задержки диагностики CRC. Кровотечения присутствуют в 60% случаев CRC, и ежедневные кровотечения около 3 мл в стуле могут привести к железодефицитной анемии. В примерно 18% случаев CRC анемию диагностируют более чем за год до диагностики 14, однако, значительная часть пациентов не имеет анемию 1. Может присутствовать положительная скрытая кровь. Однако кровь в кале, в настоящее время используемая для скрининга CRC, детектирует только текущее кровотечение, в то время как для CRC кровотечение является хроническим.
В Spell DW, Jones DV, Jr., Harper WF, David Bessman J. показатели клинического анализа крови используют при предсказании рака толстой кишки. В Cancer Detect Prev 2004; 28(1): 37-42 сообщается, что 88% пациентов с CRC имеют, по меньшей мере, одно нарушение, связанное с кровью. Таким образом, попытки предсказывать CRC по клиническому анализу крови (СВС) активно исследуются. В проведенном ранее исследовании у пациентов с впервые диагностированным CRC параметры СВС были доступны за 0-122 дня до постановки диагноза, и было показано, что ширина распределения эритроцитов по объему (RDW) превышала нормальный уровень и имела 84% чувствительности и 88% специфичности, главным образом, для случаев CRC правой половины толстой кишки. Улучшений чувствительности при комбинации RDW, анализа на гемоглобин и средний объем эритроцитов (MCV) обнаружено не было.
В соответствии с некоторыми вариантами осуществления настоящего изобретения, производительность созданного классификатора, как описано в настоящем документе, может быть использована для классификации как индивидуумов с состоянием анемии, так и индивидуумов без состояния анемии. Например, Фиг. 11 является набором таблиц, обобщающих результаты анализов с использованием описанных выше классификаторов для классификации индивидуумов с анемией и без анемии (белые американцы). Набор включает множество таблиц, каждая из которых обобщает вероятность для индивидуума с анемией в определенной группе индивидуумов по отношению к индивидууму без анемии из другой группы индивидуумов. Группы необязательно делятся на основе комбинации между давностью результатов анализов крови и возрастом индивидуума. Фиг. 10 доказывает, что независимые измерения уровней параметров крови связаны с CRC, и что комбинации изменений в параметрах СВС, даже незначительные, в пределах нормального диапазона, могут быть использованы как часть процесса скрининга на CRC, например, путем определения количественных показателей, для индивидуума с анемией или без анемии.
Как показано в 105, классификатор (классификаторы) выводят, необязательно как модуль, который позволяет классифицировать целевых индивидуумов, например с помощью интерфейсного блока 206. Необязательно, для индивидуумов, имеющих разные демографические характеристики, определены разные классификаторы, например один классификатор для мужчин и другой - для женщин. Например, если классификатор, основанный на группе характеристик из описанных выше 18 характеристик, предназначен для мужчин, то классификатор типа случайный лес без биохимических анализов используется для женщин. Классификатор типа случайный лес имеет AUC 0,833±0,001 и производительность, как показано на Фиг. 7, где точность оценена в соответствии с общей распространенностью 0,45%.
Дается ссылка на Фиг. 8, которая является блок-схемой 400 способа применения классификатора (классификаторов), такого классификатора (классификаторы), как описано выше, для оценки количественного показателя риска рака желудочно-кишечного тракта для целевого индивидуума, в соответствии с некоторыми вариантами осуществления настоящего изобретения. При использовании классификатор (классификаторы) может быть размещен на веб-сервере, который принимает данные целевых индивидуумов и оценивает с использованием модуля оценки рака желудочно-кишечного тракта, который использует классификатор (классификаторы), количественный показатель риска рака желудочно-кишечного тракта у субъекта, который должен быть оценен. Данные целевого индивидуума могут быть получены через коммуникационную сеть, такую как Интернет, с клиентского терминала, такого как ноутбук, настольный ПК, смартфон, планшет и/или т.п., что обеспечивает набор результатов анализа крови и демографические характеристики субъекта или ссылку на эти целевые данные.
Сначала, как показано в 401 и 402, предусмотрены классификатор (классификаторы) и данные целевого индивидуума. Данные целевого индивидуума включают один или более демографических параметров и набор множества результатов текущих анализов крови, проводимых в целевую дату, которые включают множество результатов текущих анализов целевого индивидуума. Данные целевого индивидуума могут быть введены вручную пользователем, например, с использованием графического интерфейса пользователя (GUI), выбраны пользователем, необязательно с использованием GUI, и/или предоставлены автоматически, например, с помощью модуля и/или системы компьютерной медицинской диагностики (CAD). Необязательно, данные целевого индивидуума включают множество наборов результатов анализа крови, проведенных в течение прошедшего года, прошедшей декады и/или любого промежуточного периода. Каждый из наборов результатов анализа крови включает результаты анализа крови, например группу, выбранную из результатов описанных выше 18 различных анализов крови.
Как показано в 403, набор характеристик целевого индивидуума выделяют из данных целевого индивидуума и набор характеристик целевого индивидуума необязательно является расширенным, как описано выше.
Затем, как показано в 404, классификатор (классификаторы) используют для рассчета количественного показателя риска рака желудочно-кишечного тракта для целевого индивидуума путем задания веса каждой характеристики в наборе характеристик целевого индивидуума. Как показано в 405, количественный показатель риска рака желудочно-кишечного тракта выводится.
Необходимо отметить, что описанные выше классификаторы могут быть использованы для оценки количественного показателя риска рака желудочно-кишечного тракта, который может быть раком толстой кишки, желудка, прямой кишки или пищевода. Например, Фиг. 9 является таблицей, отражающей производительности классификаторов для каждого из раков толстой кишки, желудка, прямой кишки и пищевода при различных чувствительностях для различных групп популяций. Группы популяций определяются в соответствии с комбинацией между давностью результатов соответствующего анализа крови (приведена в днях, например 90-540, 90-540, 30-270 и 360-720) и диапазоном возрастов, например 40-100 и 50-75. Необходимо отметить, что таблица на Фиг. 9 отражает характеристики классификаторов для другой популяции, чем использовалась для классификаторов, подтвержденных ссылками на Фиг. 4А и 4В. На Фиг. 9 данные включают результаты анализа крови от группы из 81641 индивидуумов англичан старше 40, у 3099 из которых был диагностирован рак толстой кишки, у 1286 - рак прямой кишки, у 578 - рак желудка и у 1061 - рак пищевода.
Ожидается, что в течение срока действия патента, основанного на данной заявке, будет разработано много соответствующих систем и способов, и объем терминов процессор, дисплей и интерфейс пользователя предназначен для включения всех таких новых технологий a priori.
В настоящем документе термин ʹʹоколоʹʹ относится к ±10%.
Термины ʹʹвключаетʹʹ, ʹʹвключающийʹʹ, ʹʹвключаетʹʹ, ʹʹвключенийʹʹ, ʹʹимеющийʹʹ и их сочетания обозначают ʹʹвключает без ограниченийʹʹ. Этот термин охватывает термины ʹʹсостоящий изʹʹ и ʹʹсостоящий по существу изʹʹ.
Фраза ʹʹсостоящий по существу изʹʹ обозначает, что композиция или способ могут включать дополнительные ингредиенты и/или этапы, но только если дополнительные ингредиенты и/или этапы не изменяют по существу основные и новые характеристики заявленной композиции или способа.
В настоящем документе форма единственного числа включает также указание на множественное число, если из контекста явно не следует иное. Например, термин ʹʹвеществоʹʹ или ʹʹпо меньшей мере, одно веществоʹʹ может включать множество веществ, включая их смеси.
Слово ʹʹпримерыʹʹ используется в настоящем документе для обозначения ʹʹслужит примером, образцом или иллюстрациейʹʹ. Любой вариант осуществления, описанный как ʹʹпримерʹʹ, не обязательно должен быть истолкован как предпочтительный или преимущественный над другими вариантами осуществления и/или исключать включение признаков из других вариантов осуществления.
Слово ʹʹнеобязательноʹʹ используется в настоящем документе для обозначения ʹʹпредусмотрены в некоторых вариантах осуществления и не предусмотрены в других вариантах осуществленияʹʹ. Любой определенный вариант осуществления изобретения может включать множество ʹʹнеобязательныхʹʹ характеристик, если такие характеристики не конфликтуют.
В данной заявке различные варианты осуществления этого изобретения могут быть представлены в формате диапазона. Следует иметь в виду, что описание в формате диапазона применяется просто для удобства и краткости, и его не следует рассматривать в качестве негибкого ограничения объема изобретения. Соответственно, описание диапазона должно быть рассмотрено как специально раскрывающее все возможные поддиапазоны, а также отдельные числовые значения в пределах этого диапазона. Например, описание диапазона, такого как от 1 до 6, должно быть рассмотрено, как конкретно раскрывающее поддиапазоны, такие как от 1 до 3, от 1 до 4, от 1 до 5, от 2 до 4, от 2 до 6, от 3 до 6 и т.д., а также индивидуальные числа в пределах этого диапазона, например 1, 2, 3, 4, 5, и 6. Это применяется независимо от широты диапазона.
В каждом случае, когда в настоящем документе приведен численный диапазон, это обозначает включение любого числа (дробного или целого) в пределах установленного диапазона. Фразы ʹʹв диапазоне междуʹʹ первым указанным числом и вторым указанным числом и ʹʹв диапазоне отʹʹ первого указанного числа ʹʹдоʹʹ второго указанного числа используются здесь взаимозаменяемо и предназначены для включения первого и второго указанных чисел и всех дробных и целых чисел между ними.
Следует понимать, что некоторые признаки изобретения, которые для ясности описаны в контексте отдельных вариантов осуществления, также могут быть предусмотрены в комбинации в одном варианте осуществления. Наоборот, различные признаки изобретения, которые, для краткости, описаны в контексте одного варианта осуществления, могут также быть предусмотрены отдельно или в любой подходящей подкомбинации, или каким-либо иным подходящим образом в любом другом описанном варианте осуществления настоящего изобретения. Определенные признаки, описанные в контексте различных вариантов осуществления, не следует рассматривать как существенные признаки этих вариантов осуществления, если вариант осуществления не является нефункциональным без этих элементов.
Несмотря на то, что изобретение было описано в связи с конкретными вариантами осуществления, очевидно, что многие альтернативы, модификации и вариации изобретения будут очевидны специалистам в данной области. Соответственно, изобретение охватывает все такие альтернативы, модификации и вариации, которые соответствуют смыслу и попадают в пределы широкого объема прилагаемой формулы изобретения.
Все публикации, патенты и патентные заявки, упомянутые в этом описании, включены в данное описание во всей своей полноте посредством ссылки в описании, в той же степени, как если бы каждая отдельная публикация, патент или патентная заявка были конкретно и индивидуально указаны как включенные в настоящее описание посредством ссылки. Кроме того, цитирование или указание любой ссылки в этой заявке не должны быть истолкованы как признание того, что такая ссылка является частью предшествующего уровня техники для настоящего изобретения. Помимо этого используемые заголовки разделов не должны быть истолкованы как обязательно ограничивающие.
название | год | авторы | номер документа |
---|---|---|---|
СПОСОБЫ И СИСТЕМЫ ОЦЕНКИ РИСКА РАЗВИТИЯ ЗЛОКАЧЕСТВЕННОЙ ОПУХОЛИ ЛЕГКОГО | 2014 |
|
RU2677742C2 |
СПОСОБ ДИАГНОСТИКИ КОЛОРЕКТАЛЬНОГО РАКА ИЗ ОБРАЗЦА КАЛА ЧЕЛОВЕКА С ПОМОЩЬЮ КОЛИЧЕСТВЕННОЙ ПЦР, ПРАЙМЕРОВ И НАБОРА | 2015 |
|
RU2692555C2 |
СПОСОБЫ ВЫЯВЛЕНИЯ И МОНИТОРИНГА РАКА ПУТЕМ ПЕРСОНАЛИЗИРОВАННОГО ВЫЯВЛЕНИЯ ЦИРКУЛИРУЮЩЕЙ ОПУХОЛЕВОЙ ДНК | 2019 |
|
RU2811503C2 |
ПРИМЕНЕНИЕ ПРОСОМАТОСТАТИНА В ДИАГНОСТИКЕ | 2012 |
|
RU2573985C2 |
СПОСОБ ЛЕЧЕНИЯ ПАЦИЕНТОВ С МАССИВНОЙ ПОТЕРЕЙ КРОВИ | 2003 |
|
RU2325924C2 |
ПРИМЕНЕНИЕ LACTOBACILLUS PLANTARUM ДЛЯ ПОВЫШЕНИЯ БАКТЕРИАЛЬНОГО РАЗНООБРАЗИЯ | 2008 |
|
RU2521364C2 |
СПОСОБ ДИАГНОСТИКИ ФУНКЦИОНАЛЬНОЙ ПАТОЛОГИИ ЖЕЛУДОЧНО-КИШЕЧНОГО ТРАКТА БОЛЬНЫХ РОЗАЦЕА | 2020 |
|
RU2751656C1 |
СПОСОБ НЕИНВАЗИВНОЙ ДИАГНОСТИКИ КОЛОРЕКТАЛЬНОГО РАКА | 2015 |
|
RU2586775C1 |
СПОСОБ ПРОГНОЗА ДЛЯ ИНДИВИДУУМОВ С РАКОМ ПРЕДСТАТЕЛЬНОЙ ЖЕЛЕЗЫ | 2013 |
|
RU2669809C2 |
КОМПОЗИЦИЯ ФЕКАЛЬНОЙ МИКРОБИОТЫ ДЛЯ ПРИМЕНЕНИЯ ДЛЯ УМЕНЬШЕНИЯ ИНДУЦИРОВАННОГО ЛЕЧЕНИЕМ ВОСПАЛЕНИЯ | 2019 |
|
RU2816462C2 |
Группа изобретений относится к области медицины, а именно к диагностике. Для оценки риска рака желудочно-кишечного тракта создают в базе данных множество классификаторов в соответствии с множеством соответствующих результатов проведенных ранее анализов крови у множества подвергнутых анализу индивидуумов. Проводят оценку с использованием аппаратного процессора риска рака желудочно-кишечного тракта у указанного целевого индивидуума с помощью указанной комбинации, по меньшей мере, 10 различных характеристик анализа крови с использованием указанного, по меньшей мере, одного классификатора. Проведенные ранее и текущие анализы крови включают результаты, по меньшей мере, одного из следующих анализов крови: анализ на эритроциты (RBC), гемоглобин (HGB) и гематокрит (НСТ), и, по меньшей мере, один результат из следующих анализов крови: анализ на среднее содержание гемоглобина в эритроците (МСН) и среднюю концентрацию гемоглобина в эритроците (МСНС). Количественный показатель риска рака желудочно-кишечного тракта выводят на клиентский терминал. Группа изобретений позволяет с высокой точностью автоматически рассчитать количественный показатель риска рака желудочно-кишечного тракта на основании набора результатов анализов крови. 2 н. и 13 з.п. ф-лы, 13 ил.
1. Компьютеризированный способ обеспечения клиентского терминала оценкой риска рака желудочно-кишечного тракта в ответ на показатель текущих анализов крови пациента, включающий:
получение компьютерной системой, связанной с базой данных, на которой хранится множество классификаторов, и с клиентского терминала и через сеть показание значений множества результатов текущих анализов крови, рассчитанных на основе анализа крови, собранной у целевого индивидуума;
создание указанной компьютерной системой комбинации по меньшей мере 10 характеристик анализа крови на основании указанного множества результатов текущих анализов крови, каждая из указанных 10 различных характеристик анализа крови основана на значении анализа крови одного из указанного множества текущих анализов крови;
выбор, по меньшей мере, одного классификатора в соответствии, по меньшей мере, с одной демографической характеристикой указанного целевого индивидума из указанного множества классификаторов, каждый из указанного множества классификаторов создан в соответствии с множеством соответствующих результатов проведенных ранее анализов крови у множества подвергнутых анализу индивидуумов, имеющих, по меньшей мере, одну различную демографическую характеристику, указанный, по меньшей мере, один классификатор создан в соответствии с анализом указанного множества соответствующих результатов проведенных ранее анализов крови каждого индивидуума из указанного множества подвергнутых анализу индивидуумов; и
оценку с использованием аппаратного процессора указанной компьютерной системы риска рака желудочно-кишечного тракта у указанного целевого индивидуума с помощью классификации указанной комбинации, по меньшей мере, 10 различных характеристик анализа крови с использованием указанного, по меньшей мере, одного классификатора; и вывод указанного риска рака желудочно-кишечного тракта;
где каждый из указанного множества результатов проведенных ранее и текущих анализов крови включает результаты, по меньшей мере, одного из следующих анализов крови: анализ на эритроциты (RBC), гемоглобин (HGB) и гематокрит (НСТ), и, по меньшей мере, один результат из следующих анализов крови: анализ на среднее содержание гемоглобина в эритроците (МСН) и среднюю концентрацию гемоглобина в эритроците (МСНС),
где указанный по меньшей мере один классификатор создан в соответствии с каждым из указанного множества проведенных ранее анализов.
2. Способ по п. 1, где указанный риск рака желудочно-кишечного тракта представляет собой риск рака, выбранного из группы, состоящей из рака толстой кишки, рака желудка, рака прямой кишки и рака пищевода.
3. Способ по п. 1, где указанный, по меньшей мере, один классификатор создан в соответствии с анализом возраста указанного множества подвергнутых анализу индивидуумов.
4. Способ по п. 1, где каждое из множества результатов проведенных ранее и текущих анализов крови включает результаты анализа на тромбокрит (РСТ).
5. Способ по п. 1, где указанный, по меньшей мере, один классификатор включает классификатор, выбранный из группы, состоящей из классификатора на основе взвешенной линейной регрессии, классификатора на основе метода K-ближайщих соседей (KNN) и классификатора на основе алгоритма случайный лес.
6. Способ по п. 1, где указанный, по меньшей мере, один классификатор создан в соответствии с анализом, по меньшей мере, одной демографической характеристики каждого индивидуума из указанного множества подвергнутых анализу индивидуумов.
7. Способ по п. 1, где каждый из указанного множества проведенных ранее и комбинации по меньшей мере 10 текущих анализов крови включает результаты анализа на тромбокрит (РСТ).
8. Система оценки рака желудочно-кишечного тракта, включающая:
процессор;
блок памяти, который хранит множество классификаторов;
блок ввода, который принимает с клиентского терминала и через сеть показание значений множества результатов текущих анализов крови, рассчитанных на основании анализа крови, взятой у целевого индивидуума; и
где указанный процессор выполняет следующее:
создание комбинации, по меньшей мере, 10 характеристик анализа крови на основании указанного множества результатов текущих анализов крови, каждая из указанных 10 различных характеристик анализа крови основана на значении анализа крови одного из указанного множества текущих анализов крови,
выбор, по меньшей мере, одного классификатора в соответствии, по меньшей мере, с одной демографической характеристикой указанного целевого индивидума из указанного множества классификаторов, каждый из указанного множества классификаторов создан в соответствии с множеством соответствующих результатов проведенных ранее анализов крови у множества подвергнутых анализу индивидуумов, имеющих, по меньшей мере, одну различную демографическую характеристику, указанный, по меньшей мере, один классификатор создан в соответствии с анализом указанного множества соответствующих результатов проведенных ранее анализов крови каждого индивидуума из другого указанного множества подвергнутых анализу индивидуумов; и
оценку риска рака желудочно-кишечного тракта у указанного целевого индивидуума с помощью классификации указанной комбинации из, по меньшей мере, 10 различных характеристик анализа крови с использованием указанного, по меньшей мере, одного классификатора, и
вывод указанного риска рака желудочно-кишечного тракта;
где каждый из указанного множества результатов проведенных ранее и текущих анализов крови включает результаты, по меньшей мере, одного из следующих анализов крови: анализ на эритроциты (RBC), гемоглобин (HGB) и гематокрит (НСТ), и, по меньшей мере, один результат следующих анализов крови: анализ на среднее содержание гемоглобина в эритроците (МСН) и среднюю концентрацию гемоглобина в эритроците (МСНС);
где указанный, по меньшей мере, один классификатор создан в соответствии с каждым из указанного множества результатов проведенных ранее анализов.
9. Система по п. 8, где указанный, по меньшей мере, один классификатор создан в соответствии с анализом набора данных, имеющего множество наборов характеристик, где каждый набор характеристик создан в соответствии с соответствующим множеством результатов проведенных ранее анализов крови одного из указанного множества подвергнутых анализу индивидуумов.
10. Система по п. 9, где указанный анализ включает расчет и добавление, по меньшей мере, одной обработанной версии результата проведенного ранее анализа крови, взятого из соответствующего указанного множества результатов проведенных ранее анализов крови, как характеристика к набору характеристик.
11. Система по п. 9, где указанный анализ включает задание веса каждого указанного набора характеристик в соответствии с датой указанного соответствующего множества результатов проведенных ранее анализов крови.
12. Система по п. 9, где указанный анализ включает фильтрацию указанного множества наборов характеристик для удаления выпадающих значений в соответствии с максимальным пороговым значением стандартного отклонения.
13. Система по п. 9, где указанному множеству наборов характеристик задают вес в соответствии с датой указанного соответствующего множества результатов проведенных ранее анализов крови.
14. Система по п. 8, где указанный, по меньшей мере, один демографический параметр выбран из группы, состоящий из пола, возраста, места проживания, расы и социально-экономической характеристики.
15. Система по п. 9, где указанный анализ включает расчет и добавление, по меньшей мере, одной обработанной версии указанного, по меньшей мере, одного демографического параметра как характеристики к соответствующему указанному набору характеристик.
US 2009150315 A1, 11.06.2009 | |||
US 20040122703 A1, 24.06.2004 | |||
US 20100076787 A1, 25.03.2010 | |||
US 6059724 A, 09.05.2000 | |||
SPELL D.W | |||
et al., The value of a complete blood count in predicting cancer of the colon, Cancer Detection and Prevention, 28(2004), c.37-42. |
Авторы
Даты
2018-01-09—Публикация
2013-05-02—Подача