МЕДИЦИНСКИЙ ПРОГНОЗ И ПРЕДСКАЗАНИЕ РЕЗУЛЬТАТОВ ЛЕЧЕНИЯ, ИСПОЛЬЗУЯ АКТИВНОСТИ МНОЖЕСТВА КЛЕТОЧНЫХ СИГНАЛЬНЫХ ПУТЕЙ Российский патент 2020 года по МПК G01N33/48 C12Q1/6886 

Описание патента на изобретение RU2718647C2

Описанный здесь объект изобретения в общем относится к биоинформатике, обработке геномных данных, обработке протеомных данных и родственным областям техники.

Уровень техники

Геномный и протеомный анализы имеют в существенной степени реализованную и потенциальную перспективу для клинического применения в областях медицины, такой как онкология, где, как известно, различные типы рака связаны с определенными комбинациями геномных мутаций/вариаций/аномальных паттернов метилирования и/или высокими или низкими уровнями экспрессии определенных генов, которые важны для роста и развития рака, например, клеточной пролиферации и метастазирования. Например, сигнальный путь Wnt оказывает влияние на регуляцию клеточной пролиферации и является жестко регулируемым. Была выявлена корреляция с раком, в том числе со злокачественными опухолями прямой кишки, высокой активности пути Wnt из-за потери регуляции. Не ограничиваясь какой-либо конкретной теорией, считается, что нарушение регуляции пути Wnt в злокачественных клетках в прямой кишке приводит к высокой активности пути Wnt, что, в свою очередь, вызывает клеточную пролиферацию злокачественных клеток в прямой кишке, т.е. к распространению рака прямой кишки. С другой стороны, аномально низкая активность пути также может представлять интерес, например, в случае остеопороза. Другие сигнальные пути, которые играют аналогичные роли в делении, функционировании и/или дифференцировке клеток в здоровом состоянии и в случае болезни, представляют собой клеточные сигнальные пути (например, ER, PR, AR, PPAR, GR, VitD, TGFbeta, Notch, Hedgehog, FGF, NFkappaB, VEGF и PDGF).

Методы получения геномных и протеомных данных стали легко доступными в клинических условиях. Например, измерения с использованием микрочипов обычно применяются для оценки уровней экспрессии генов, уровней белков, метилирования и т.д. Автоматизированное секвенирование генов позволяет выполнять эффективную по стоимости идентификацию генетических изменений/мутаций/паттернов аномального метилирования в ДНК и РНК. Количественная оценка уровней мРНК в процессе секвенирования является перспективной в качестве клинического инструмента для оценки уровней генной экспрессии.

Одной из основных задач для терапевта, например, онколога, является эмпирическая оценка прогноза для пациента, поскольку эта информация влияет на выбор метода терапии. Анализ геномики на основе тканевого образца рака, транскриптомики и протеомики (и других "омик") для отдельного пациента дает информацию, которая может оказать потенциальный вклад в прогностическую оценку состояния пациента. Однако можно с уверенностью утверждать, что интерпретация этих комплексных данных для выделения релевантной клинической информации до сих пор остается нерешенной задачей. Прогноз для пациента может быть представлен в виде количественных данных несколькими способами, например: “время до появления рецидива” или “время до появления метастазов”, или “время выживания”, или “риск смертельного исхода из-за болезни или лечения”.

Сущность изобретения

Настоящее изобретение предоставляет новые и улучшенные способы и устройства, описанные в этом документе.

Согласно основному аспекту настоящего изобретения, указанная выше проблема решается конкретным способом определения степени риска, которая указывает на риск возникновения клинического события в течение определенного промежуток времени, а именно, способ содержит:

Вывод об активности двух или более клеточных сигнальных путей в ткани и/или клетках, и/или в жидкости организма субъекта, сделанный на основании, по меньшей мере, уровней экспрессии одного или нескольких целевых генов клеточных сигнальных путей, измеренных в извлеченном образце ткани и/или клеток, и/или жидкости организма субъекта, и

определение степени риска, которая указывает на риск возникновения клинического события в течение определенного промежутка времени, где степень риска основана, по меньшей мере, частично на комбинации выведенных активностей (активностей, относительно которых сделан вывод),

где клеточные сигнальные пути содержат путь Wnt, путь ER (эстрогеновый рецептор), путь НН (Hedgehog) и/или путь AR (андрогеновый рецептор),

где клеточные сигнальные пути содержат путь ER, путь Wnt и путь HH, и где степень риска определяется таким образом, что указанный риск возникновения клинического события в течение определенного промежутка времени уменьшается с увеличением PER и увеличивается с увеличением max(PWnt, PHH),

где PER, PWnt и PHH означают выведенные активности пути ER, пути Wnt и пути HH, соответственно.

Субъектом может быть человек или животное и, в частности, медицинский субъект. Помимо этого, "целевой ген(целевые гены)" может представлять собой "непосредственный целевой ген" и/или "опосредованный целевой ген" (как описано здесь).

Путь Wnt, путь ER, путь HH и путь AR предпочтительно определены как клеточный сигнальный путь, который, в конечном итоге, приводит к транскрипционной активности комплексов фактора транскрипции (TF), связанных с этим путем. Предпочтительно, они состоят из, по меньшей мере, β-катенина/TCF4, ERα димера, члена семейства GLI и AR, соответственно.

Вывод об активности клеточных сигнальных путей в ткани и/или клетках и/или жидкости организма у субъекта может быть сделан, например, помимо прочего, по (i) оценке, по меньшей мере, части вероятностной модели, предпочтительно Байесовской сети, представляющей клеточные сигнальные пути, для набора входных данных, включая, по меньшей мере, уровни экспрессии одного или нескольких целевых генов указанных клеточных сигнальных путей, измеренные в ткани и/или клетках и/или жидкости организма (например, путем окрашивания среза ткани или клеток) или в извлеченном образце ткани и/или клетках и/или жидкости организма субъекта, (ii) оценке уровня в ткани субъекта, по меньшей мере, одного элемента фактора транскрипции (TF), причем указанный, по меньшей мере, один элемент TF, управляет транскрипцией одного или нескольких целевых генов клеточных сигнальных путей, и указанная оценка основывается, по меньшей мере, частично на условных вероятностях, относящихся к указанному, по меньшей мере, одному элементу TF и уровням экспрессии указанного одного или нескольких целевых генов клеточного сигнального пути, измеренным в извлеченном образце субъекта, и (iii) выводу об активности клеточных сигнальных путей, сделанному на основании оцененного уровня фактора транскрипции в образце ткани и/или образце клеток и/или образце жидкости организма. Более подробно об этом описано в опубликованной Европейской заявке на патент EP 2 549 399 A1 (“Оценка активности пути Wnt с применением вероятностного моделирования экспрессии целевых генов”) и, в частности, в опубликованной международной заявке на патент WO 2013/011479 A2 (“Оценка активности клеточных сигнальных путей с применением вероятностного моделирования экспрессии целевых генов”), содержание которых включено в настоящую заявку во всей своей полноте в качестве ссылки.

В одной из иллюстративных альтернатив вывод об активности одного или нескольких клеточных сигнальных путей в ткани и/или клетках и/или жидкости организма субъекта может быть сделан, помимо прочего, путем (i) определения уровня элемента фактора транскрипции (TF) в извлеченном образце ткани и/или клеток и/или жидкости организма субъекта, где элемент TF управляет транскрипцией одного или нескольких целевых генов сигнального пути, при этом определение основано, по меньшей мере, частично на оценке математической модели, относящейся к уровням экспрессии одного или нескольких целевых генов клеточного сигнального пути для уровня элемента TF, при этом указанная модель основана, по меньшей мере, частично на одной или нескольких линейных комбинациях уровней экспрессии одного или нескольких целевых генов, и по (ii) выводу об уровне активности клеточного сигнального пути в ткани и/или клетках и/или жидкости организма субъекта, сделанному на основании определенного уровня элемента TF в извлеченном образце ткани и/или клеток и/или жидкости организма субъекта. Более подробно об этом описано в неопубликованной предварительной заявке на патент US 61/745839, соответствующей неопубликованной международной заявке на патент PCT/IB2013/061066 (“Оценка активности клеточного сигнального пути с применением линейной(ых) комбинации(й) экспрессии целевых генов”).

Предпочтительно, клеточные сигнальные пути содержат, по меньшей мере, один клеточный сигнальный путь, который принимает участие в развитии рака.

Особо предпочтительным является способ, в котором клеточные сигнальные пути содержат путь Wnt и/или путь HH, и где степень риска определяется таким образом, что указанный риск возникновения клинического события в течение определенного промежутка времени монотонно увеличивается с увеличением выведенной активности пути Wnt и/или увеличением выведенной активности пути HH.

Также особо предпочтительным является способ, в котором клеточные сигнальные пути содержат путь ER, где оценка риска определяется таким образом, что указанный риск возникновения клинического события в течение определенного промежутка времени монотонно уменьшается с увеличением выведенной активности пути ER.

Предпочтительным также является способ, в котором комбинация выведенных активностей содержит выражение:

-α · PER + β · max(PWnt, PHH),

где PER, PWnt и PHH означают выведенную активность пути ER, пути Wnt и пути HH, соответственно, α и β представляют собой положительные постоянные масштабирующие коэффициенты, и указанный риск возникновения клинического события в течение определенного промежутка времени монотонно увеличивается с увеличением значения экспрессии.

Особо предпочтительным является способ, в котором вывод содержит:

вывод об активности пути Wnt в ткани и/или клетках и/или жидкости организма субъекта, сделанный на основании, по меньшей мере, уровней экспрессии, по меньшей мере, одного или нескольких, предпочтительно, по меньшей мере, трех целевых генов пути Wnt, измеренных в извлеченном образце ткани и/или клеток и/или жидкости организма субъекта, выбранных из группы, состоящей из: KIAA1199, AXIN2, RNF43, TBX3, TDGF1, SOX9, ASCL2, IL8, SP5, ZNRF3, KLF6, CCND1, DEFA6 и FZD7,

и/или

вывод об активности пути ER в ткани и/или клетках и/или жидкости организма субъекта, сделанный на основании, по меньшей мере, уровней экспрессии, по меньшей мере, одного или нескольких, предпочтительно, по меньшей мере, трех целевых генов пути ER, измеренных в извлеченном образце ткани и/или клеток и/или жидкости организма субъекта, выбранных из группы, состоящей из: GREB1, PGR, XBP1, CA12, SOD1, CTSD, IGFBP4, TFF1, SGK3, NRIP1, CELSR2, WISP2 и AP1B1,

и/или

вывод об активности пути HH в ткани и/или клетках и/или жидкости организма субъекта, сделанный на основании, по меньшей мере, уровней экспрессии, по меньшей мере, одного или нескольких, предпочтительно, по меньшей мере, трех целевых генов пути HH, измеренных в извлеченном образце ткани и/или клеток и/или жидкости организма субъекта, выбранных из группы, состоящей из: GLI1, PTCH1, PTCH2, IGFBP6, SPP1, CCND2, FST, FOXL1, CFLAR, TSC22D1, RAB34, S100A9, S100A7, MYCN, FOXM1, GLI3, TCEA2, FYN и CTSL1,

и/или

вывод об активности пути AR в ткани и/или клетках и/или жидкости организма субъекта, сделанный на основании, по меньшей мере, уровней экспрессии, по меньшей мере, одного или нескольких, предпочтительно, по меньшей мере, трех целевых генов пути AR, измеренных в извлеченном образце ткани и/или клеток и/или жидкости организма субъекта, выбранных из группы, состоящей из: KLK2, PMEPA1, TMPRSS2, NKX3_1, ABCC4, KLK3, FKBP5, ELL2, UGT2B15, DHCR24, PPAP2A, NDRG1, LRIG1, CREB3L4, LCP1, GUCY1A3, AR и EAF2.

Особо предпочтительным является способ, в котором вывод дополнительно основан на:

уровнях экспрессии, по меньшей мере, одного целевого гена пути Wnt, измеренных в извлеченном образце ткани и/или клеток и/или жидкости организма субъекта, выбранного из группы, состоящей из: NKD1, OAT, FAT1, LEF1, GLUL, REG1B, TCF7L2, COL18A1, BMP7, SLC1A2, ADRA2C, PPARG, DKK1, HNF1A и LECT2,

и/или

уровнях экспрессии, по меньшей мере, одного целевого гена пути ER, измеренных в извлеченном образце ткани и/или клеток и/или жидкости организма субъекта, выбранного из группы, состоящей из: RARA, MYC, DSCAM, EBAG9, COX7A2L, ERBB2, PISD, KRT19, HSPB1, TRIM25, PTMA, COL18A1, CDH26, NDUFV3, PRDM15, ATP5J и ESR1,

и/или

уровнях экспрессии, по меньшей мере, одного целевого гена пути HH, измеренных в извлеченном образце ткани и/или клеток и/или жидкости организма субъекта, выбранного из группы, состоящей из: BCL2, FOXA2, FOXF1, H19, HHIP, IL1R2, JAG2, JUP, MIF, MYLK, NKX2.2, NKX2.8, PITRM1 и TOM1,

и/или

уровнях экспрессии, по меньшей мере, одного целевого гена пути AR, измеренных в извлеченном образце ткани и/или клеток и/или жидкости организма субъекта, выбранного из группы, состоящей из: APP, NTS, PLAU, CDKN1A, DRG1, FGF8, IGF1, PRKACB, PTPN1, SGK1 и TACC2.

Другой аспект настоящего изобретения относится к способу (описанному в настоящей заявке), дополнительно содержащему:

отнесение субъекта к, по меньшей мере, одной из множества групп риска, связанных с разными указанными рисками возникновения клинического события в течение определенного промежутка времени,

и/или

принятие решения о лечении, рекомендуемом для субъекта, на основе, по меньшей мере, частично, указанного риска возникновения клинического события в течение определенного промежутка времени.

Настоящее изобретение также относится к способу (описанному в настоящей заявке), содержащему:

вывод об активности пути Wnt в ткани и/или клетках и/или жидкости организма субъекта, сделанный на основании, по меньшей мере, уровней экспрессии двух, трех или более целевых генов из набора целевых генов пути Wnt, измеренных в извлеченном образце ткани и/или клеток и/или жидкости организма субъекта,

и/или

вывод об активности пути ER в ткани и/или клетках и/или жидкости организма субъекта, сделанный на основании, по меньшей мере, уровней экспрессии двух, трех или более целевых генов из набора целевых генов пути ER, измеренных в извлеченном образце ткани и/или клеток и/или жидкости организма субъекта,

и/или

вывод об активности пути HH в ткани и/или клетках и/или жидкости организма субъекта, сделанный на основании, по меньшей мере, уровней экспрессии двух, трех или более целевых генов из набора целевых генов пути HH, измеренных в извлеченном образце ткани и/или клеток и/или жидкости организма субъекта,

и/или

вывод об активности пути AR в ткани и/или клетках и/или жидкости организма субъекта, сделанный на основании, по меньшей мере, уровней экспрессии двух, трех или более целевых генов из набора целевых генов пути AR, измеренных в извлеченном образце ткани и/или клеток и/или жидкости организма субъекта.

Предпочтительно,

набор целевых генов пути Wnt включает, по меньшей мере, девять, предпочтительно, все целевые гены, выбранные из группы, состоящей из: KIAA1199, AXIN2, RNF43, TBX3, TDGF1, SOX9, ASCL2, IL8, SP5, ZNRF3, KLF6, CCND1, DEFA6 и FZD7,

и/или

набор целевых генов пути ER включает, по меньшей мере, девять, предпочтительно, все целевые гены, выбранные из группы, состоящей из: GREB1, PGR, XBP1, CA12, SOD1, CTSD, IGFBP4, TFF1, SGK3, NRIP1, CELSR2, WISP2 и AP1B1,

и/или

набор целевых генов пути HH включает, по меньшей мере, девять, предпочтительно, все целевые гены, выбранные из группы, состоящей из: GLI1, PTCH1, PTCH2, IGFBP6, SPP1, CCND2, FST, FOXL1, CFLAR, TSC22D1, RAB34, S100A9, S100A7, MYCN, FOXM1, GLI3, TCEA2, FYN и CTSL1,

и/или

набор целевых генов пути AR включает, по меньшей мере, девять, предпочтительно, все целевые гены, выбранные из группы, состоящей из: KLK2, PMEPA1, TMPRSS2, NKX3_1, ABCC4, KLK3, FKBP5, ELL2, UGT2B15, DHCR24, PPAP2A, NDRG1, LRIG1, CREB3L4, LCP1, GUCY1A3, AR и EAF2.

Особо предпочтительным является способ, в котором

набор целевых генов пути Wnt дополнительно включает, по меньшей мере, один целевой ген, выбранный из группы, состоящей из: NKD1, OAT, FAT1, LEF1, GLUL, REG1B, TCF7L2, COL18A1, BMP7, SLC1A2, ADRA2C, PPARG, DKK1, HNF1A и LECT2,

и/или

набор целевых генов пути ER дополнительно включает, по меньшей мере, один целевой ген, выбранный из группы, состоящей из: RARA, MYC, DSCAM, EBAG9, COX7A2L, ERBB2, PISD, KRT19, HSPB1, TRIM25, PTMA, COL18A1, CDH26, NDUFV3, PRDM15, ATP5J и ESR1,

и/или

набор целевых генов пути HH дополнительно включает, по меньшей мере, один целевой ген, выбранный из группы, состоящей из: BCL2, FOXA2, FOXF1, H19, HHIP, IL1R2, JAG2, JUP, MIF, MYLK, NKX2.2, NKX2.8, PITRM1 и TOM1,

и/или

набор целевых генов пути AR дополнительно включает, по меньшей мере, один целевой ген, выбранный из группы, состоящей из: APP, NTS, PLAU, CDKN1A, DRG1, FGF8, IGF1, PRKACB, PTPN1, SGK1 и TACC2.

Образец(образцы), предназначенные для использования согласно настоящему изобретению, могут представлять собой, например, образец, полученный из пораженного раком участка, или из очага поражения с подозрением на злокачественную опухоль, или из метастатической опухоли, или из полости тела, в которой присутствует жидкость, загрязненная раковыми клетками (например, плевральная или брюшная полость или полость мочевого пузыря), или из других жидкостей организма, содержащих раковые клетки, и т.д., предпочтительно методом биопсии или другим способом извлечения образца. Клетки, из которых был извлечен образец, также могут быть опухолевыми клетками гематологических злокачественных опухолей (таких как лейкемия или лимфома). В некоторых случаях образец клеток также может представлять собой циркулирующие опухолевые клетки, т.е., опухолевые клетки, которые могут попадать в кровоток и могут быть извлечены с помощью подходящего способа выделения, например, с помощью афереза или обычного забора крови из вены. Помимо крови, жидкость организма, из которой извлекают образец, может представлять собой мочу, содержимое желудочно-кишечного тракта или экссудат. Термин “извлеченный образец”, используемый в настоящем документе, также включает случаи, когда ткань и/или клетки и/или жидкость организма субъекта получают от субъекта и, например, помещают на предметное стекло микроскопа, и когда для выполнения заявленного способа извлекают часть образца, например с помощью лазерной захватывающей микродиссекции (LCM), или путем соскабливания представляющих интерес клеток с предметного стекла, или способами сортировки флуоресцентно-активированных клеток.

Еще более предпочтительным является способ, который дополнительно содержит объединение степени риска и/или, по меньшей мере, одной выведенной активности с одной иди несколькими дополнительными степенями риска, полученными из одного или нескольких дополнительных прогностических тестов для получения объединенной степени риска, где объединенная степень риска указывает на риск возникновения клинического события в течение определенного промежутка времени. Один или несколько дополнительных прогностических тестов могут содержать, в частности, тест Oncotype DX® для рака молочной железы, тест Mammostrat® для рака молочной железы, тест MammaPrint® для рака молочной железы, тест BluePrint™ для рака молочной железы, тест CompanDx® для рака молочной железы, тест IndexSM (HOXB13/IL17BR) для рака молочной железы, тест OncotypeDX® для рака толстой кишки и/или пролиферативный тест, выполняемый для измерения экспрессии гена/белка Ki67.

Предпочтительно, клиническое событие представляет собой рак, в частности, рак молочной железы. Риск возникновения клинического события в течение определенного промежутка времени представляет собой, таким образом, предпочтительно риск повторного появления, т.е. риск рецидива рака после лечения. Он может быть либо локальным (т.е., на том же месте, где была первоначальная опухоль), либо удаленным (т.е., метастаз, находящийся за пределами первоначальной опухоли). Альтернативно, риск может представлять собой риск прогрессирования заболевания или смерть.

Согласно другому раскрытому аспекту, устройство содержит цифровой процессор, выполненный с возможностью осуществления способа по изобретению, описанному в данном документе.

Согласно другому раскрытому аспекту, не меняющаяся во времени запоминающая среда хранит инструкции, которые исполняются цифровым процессорным устройством для осуществления способа по изобретению, описанному в настоящей заявке. Не меняющаяся во времени запоминающая среда может представлять собой читаемую компьютером запоминающую среду, такую как жесткий диск, или другую магнитную запоминающую среду, оптический диск, или другую оптическую запоминающую среду, запоминающее устройство с произвольным доступом (RAM), постоянное запоминающее устройство (ROM), флэш-память, или другую электронную запоминающую среду, сетевой сервер и т.д. Цифровое процессорное устройство может представлять собой мобильное устройство (например, персональный электронный помощник или смартфон), ноутбук, настольный компьютер, планшетный компьютер или устройство, удаленный сетевой сервер и т.д.

Согласно другому раскрытому аспекту, компьютерная программа содержит средство программных кодов для обеспечения осуществления цифровым процессорным устройством способа по изобретению, как описано в настоящей заявке. Цифровое процессорное устройство может представлять собой мобильное устройство (например, персональный электронный помощник или смартфон), ноутбук, настольный компьютер, планшетный компьютер или устройство, удаленный сетевой сервер и т.д.

Согласно другому раскрытому аспекту, сигнал представляет собой степень риска возникновения клинического события в течение определенного промежутка времени, где оценка риска является результатом выполнения способа по изобретению, описанного в настоящей заявке. Сигнал может представлять собой аналоговый сигнал или цифровой сигнал.

Одно из преимуществ заключается в системе подтверждения принятия клинического решения (CDS), которая выполнена с возможностью предоставления клинических рекомендаций, например, путем вынесения решения относительно лечения субъекта, принятого на основании анализа двух или нескольких клеточных сигнальных путей, например, с применением прогностической или другой математической модели пути Wnt, пути ER, пути AR и/или пути HH, в частности, на основании риска возникновения клинического события, например, рака, в частности рака молочной железы, в течение определенного промежутка времени, в виде указанной степени риска, которая основана, по меньшей мере, частично, на комбинации выведенной активности клеточных сигнальных путей.

Другое преимущество заключается в CDS системе, которая сконфигурирована с возможностью отнесения субъекта к, по меньшей мере, одной из множества групп риска, связанных с различными рисками возникновения клинического события, например, рака, в частности, рака молочной железы, в течение определенного промежутка времени, в виде указанной степени риска, которая основана, по меньшей мере, частично, на комбинации выведенной активности одного или нескольких клеточных сигнальных путей.

Другое преимущество заключается в комбинировании степени риска возникновения клинического события в течение определенного промежутка времени, который основан, по меньшей мере, частично, на комбинации выведенных активностей одного или нескольких клеточных сигнальных путей, с одной или несколькими дополнительными степенями риска, полученными из одного или нескольких прогностических тестов.

Настоящее изобретение также может применяться, например, совместно с

- прогностической диагностикой, частично основанной на комбинации выведенной активности одного или нескольких клеточных сигнальных путей,

- предсказанием эффективности лекарственного средства, например, химиотерапии и/или гормональной терапии, частично основанном на комбинации выведенной активности одного или нескольких клеточных сигнальных путей,

- мониторингом эффективности лекарственного средства, частично основанном на комбинации выведенной активности одного или нескольких клеточных сигнальных путей,

- разработкой лекарственного средства, частично основанной на комбинации выведенной активности одного или нескольких клеточных сигнальных путей,

- разработкой способа анализа, частично основанного на комбинации выведенной активности одного или нескольких клеточных сигнальных путей,

- определением стадии рака, частично основанным на комбинации выведенной активности одного или нескольких клеточных сигнальных путей.

Дополнительные преимущества станут очевидными специалисту в области техники после ознакомления и изучения прилагаемых чертежей, приведенного ниже описания и, в частности, изучения подробного описания примеров представленных ниже.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

На Фиг.1 показана гистограмма MPS, вычисленная согласно уравнению (7), где α=1 и β=1, для группы пациентов с разной тяжестью рака молочной железы (n=1294) из GSE6532, GSE9195, GSE20685, GSE20685, GSE21653 и E-MTAB-365.

На Фиг.2 приведен график Каплана-Мейера безрецидивной выживаемости ER положительных пациентов, которым была проведена операция и которые прошли гормональное лечение, опубликованное в GSE6532 и GSE9195. Разделение пациентов по группам осуществляли на основании выделения групп с высоким риском в соответствии с MPS, степени возникновения рецидива (RS) Oncotype DX®, и выделения групп с высоким риском для обоих степеней (MPS & RS).

На Фиг.3 приведен график Каплана-Мейера безрецидивной выживаемости пациентов с первичным раком молочной железы, как указано в E-MTAB-365. Разделение пациентов по группам осуществляли, используя алгоритм выделения групп риска, основанный на степени, полученной для множества путей, согласно тому как описано в настоящей заявке. Значение р вычисляли между группами пациентов с низкой степенью риска и высокой степенью риска, используя логарифмический ранговый критерий.

На Фиг.4 приведен график Каплана-Мейера безрецидивной выживаемости группы пациентов с разной тяжестью рака молочной железы, как описано в GSE20685. Разделение пациентов по группам осуществляли, используя алгоритм выделения групп риска, основанный на степени, полученной для множества путей, согласно тому, как описано в настоящей заявке. Указанное значение p вычисляли между группами пациентов с низкой степенью риска и высокой степенью риска, используя логарифмический ранговый критерий.

На Фиг.5 приведен график Каплана-Мейера безрецидивной выживаемости группы пациентов, имеющих раннюю стадию рака молочной железы, как опубликовано в GSE21653. Разделение пациентов по группам осуществляли, используя алгоритм выделения групп риска, основанный на степени, полученной для множества путей, согласно тому, как описано в настоящей заявке. Указанное значение р вычисляли между группами пациентов с низкой степенью риска и высокой степенью риска, используя логарифмический ранговый критерий.

На Фиг.6 приведена диаграмма, демонстрирующая систему подтверждения принятия клинического решения (CDS), сконфигурированную с возможностью определения степени риска возникновения клинического события в течение определенного промежутка времени, как описано в настоящей заявке.

На Фиг.7 показан график, демонстрирующий результаты экспериментов, содержащие две степени риска, определенные разными способами.

ПОДРОБНОЕ ОПИСАНИЕ ВАРИАНТОВ ОСУЩЕСТВЛЕНИЯ

Приведенные ниже примеры иллюстрируют особенно предпочтительные способы и выбранные аспекты, связанные с этими способами. Приведенные в настоящей заявке сведения можно использовать для разработки нескольких тестов и/или наборов. Приведенные ниже примеры не следует рассматривать как ограничивающие объем настоящего изобретения.

Пример 1. Вывод об активности двух или более клеточных сигнальных путей

Как подробно описано в опубликованной Европейской заявке на патент ЕР5493992 A1 ("Оценка активности пути WNT с применением вероятностного моделирования экспрессии целевых генов") и, в частности, в опубликованной международной заявке на патент WO 2013/011479 A2 ("Оценка активности клеточных сигнальных путей с применением вероятностного моделирования экспрессии целевых генов"), путем создания вероятностной модели (например, байесовской модели) и включения условных вероятностных отношений между уровнями экспрессии нескольких разных целевых генов и активностью клеточного сигнального пути, такая модель может быть использована для определения активности клеточного сигнального пути с высокой степенью точности. Кроме того, эту вероятностную модель можно легко обновлять для включения дополнительных данных, полученных в более поздних клинических исследованиях, путем корректировки условных вероятностей и/или добавления в модель новых узлов для отображения дополнительных источников информации. Таким образом, вероятностную модель можно обновлять, по мере необходимости, позволяя учитывать самые последние данные, полученные в области медицины.

Целевые гены соответствующих путей предпочтительно можно выбрать, используя способы, описанные в разделах "Пример 3: Выбор целевых генов" и "Пример 4: Сравнение списка отобранных свидетельств с широким списком, полученным на основании литературных источников" в заявке на патент WO 2013/011479 A2, а обучение вероятностной модели можно осуществлять, используя способы, описанные в разделе “Пример 5: Обучение и применение Байесовской сети” в заявке на патент WO 2013/011479 A2. Соответствующий выбор целевого(ых) гена(ов), который используется для определения активности приведенных в качестве примера пути Wnt, пути ER, пути AR и/или пути AR определен в прилагаемой формуле изобретения.

В другом подходе, который является легким для понимания и интерпретации и который подробно описан в неопубликованной предварительной заявке на патент US 61/745839, соответствующей неопубликованной международной заявке на патент РСТ/IB2013/061066 ("Оценка активности клеточных сигнальных путей с применением линейной(ых) комбинации(ий) экспрессии целевых генов"), активность определенного клеточного сигнального пути определяют путем построения математической модели (например, линейной или (псевдо)линейной модели), включающей отношения между уровнями экспрессии одного или более целевых генов клеточного сигнального пути и уровнем элемента фактора транскрипции (TF), TF элемента, контролирующего транскрипцию одного или более целевых генов клеточного сигнального пути, причем эта модель основана, по меньшей мере, частично, на одной или более линейных комбинациях уровней экспрессии одного или более целевых генов.

Что касается последнего подхода, предпочтительным может оказаться измерение уровней экспрессии одного или более целевых генов по уровням мРНК, которые можно получить в результате, например, анализа ПЦР в реальном времени или анализа микрочипов с использованием проб, связанных с мРНК последовательностями целевого(ых) гена(ов), и метода секвенирования РНК. В другом варианте осуществления уровни экспрессии одного или более целевых генов могут быть измерены по уровням белка, например, концентрации белков, кодируемых целевыми генами.

Указанные уровни экспрессии необязательно подвергают преобразованию тем или иным способом, который может, или может не, быть более подходящим для данного приложения. Например, четыре разных преобразования уровней экспрессии, например, уровней мРНК, полученных в результате анализа микрочипов, могут быть следующими:

- "непрерывные данные", т.е., уровни экспрессии, полученные после предварительной обработки микрочипов, с помощью хорошо известных алгоритмов, таких как MAS5.0 и fRMA,

- "Z-критерий" ("z-score"), т.е. непрерывные уровни экспрессии масштабируются таким образом, что среднее значение по всем образцам равно 0, а стандартное отклонение равно 1,

- "дискретное", т.е., уровни экспрессии, превышающие определенный порог, устанавливаются равными 1, а уровни экспрессии, которые ниже этого порога, устанавливаются равными 0 (например, порог для набора проб может быть выбран в виде медианы значений некоторого количества положительных и такого же количества отрицательных клинических образцов),

- "нечеткие", то есть, непрерывные уровни экспрессии преобразуются в значения от 0 до 1 с помощью сигмовидной функции следующего формата: 1/(1+exp((thr-expr)/se)), где expr представляет собой непрерывные уровни экспрессии, thr представляет собой порог, как указывалось выше, и se представляет собой параметр смягчения, отвечающий за разницу между 0 и 1.

Одной из самых простых моделей, которые могут быть построены, является модель, в которой узел в первом слое представляет собой элемент фактора транскрипции (TF), и взвешенные узлы представляют прямые измерения уровней интенсивности экспрессии целевого(ых) гена(ов), например, с применением одного набора проб, который особенно сильно коррелирует с определенным целевым геном, например, в экспериментах с использованием микрочипов или количественной ПЦР, во втором слое. Веса могут быть получены либо на основании расчетов из набора данных обучения, либо на основании экспертных знаний. Такой подход использования только одного уровня экспрессии целевого гена, в случае, когда для одного целевого гена можно измерить множество уровней экспрессии (например, в случае экспериментов с использованием микрочипов, где один целевой ген может быть измерен с помощью нескольких наборов проб), является особенно простым. Конкретным способом выбора одного уровня экспрессии, применяемого для конкретного целевого гена, является использование уровня экспрессии, полученного из набора проб, который обеспечивает наилучшее разделение активных и пассивных образцов обучающего набора данных. Одним из способов определения такого набора проб является выполнение статистического теста, например, t-теста, и выбор набора проб с низким значением р. Уровни экспрессии обучающего набора данных для пробы с самым низким значением р являются по определению пробой, которая имеет самую низкую вероятность того, что уровни экспрессии (известных) активных и пассивных образцов перекрываются. Другой метод выбора основан на отношении шансов. В такой модели, для каждого из одного или более целевых генов предусмотрен один или более уровней экспрессии, и одна или более линейных комбинаций содержат линейную комбинацию, включающую взвешенный показатель для каждого одного или более целевых генов, где каждый взвешенный показатель основан только на одном уровне экспрессии из одного или более уровней экспрессии, предусмотренных для соответствующего целевого гена. Если для одного целевого гена выбирается только один уровень экспрессии, как описано выше, модель можно назвать моделью "наибольших дискриминантных наборов проб".

В качестве альтернативы модели "наибольших дискриминантных наборов проб", в случае, когда можно измерить множество уровней экспрессии для одного целевого гена, можно использовать все уровни экспрессии, предоставленные для одного целевого гена. В такой модели, для каждого одного или нескольких целевых генов предоставляется один или несколько уровней экспрессии, и одна или несколько линейных комбинаций содержат линейную комбинацию всех уровней экспрессии одного или нескольких уровней экспрессии, предоставленных для одного или нескольких целевых генов. Другими словами, для каждого одного или нескольких целевых генов каждый один или более уровней экспрессии, предоставленных для соответствующего целевого гена, могут быть взвешены в линейной комбинации посредством его собственного (индивидуального) веса. Этот вариант можно назвать моделью "все наборы проб". Преимуществом этой модели является простота использования всех предоставленных уровней экспрессии.

Сходство двух описанных выше моделей заключается в том, что их можно рассматривать как "однослойные" модели, в которых уровень TF элемента вычисляется на основе линейной комбинации уровней экспрессии.

После определения уровня TF элемента путем оценки соответствующей модели, определенный уровень TF элемента может быть пороговым для выведенной активности клеточного сигнального пути. Способ вычисления такого соответствующего порога заключается в сравнении определенного уровня TF элемента wlc обучающих образцов, относительно которых известно, что они имеют пассивный путь, и обучающих образцов с активным путем. Способ, который позволяет это осуществить и при этом учитывает дисперсию в этих группах, осуществляется с применением порога:

где σ и μ представляют собой стандартное отклонение и среднее значение обучающих образцов. В случае доступности лишь небольшого количества образцов в активных и/или пассивных обучающих образцах к вычисленным дисперсиям может быть добавлен псевдоотсчет на основании среднего значения дисперсий двух групп:

где v представляет собой дисперсию групп, а x представляет собой положительный псевдоотсчет. Затем может быть получено стандартное отклонение σ путем извлечения квадратного корня из дисперсии v.

Пороговое значение может быть вычтено из определенного уровня FT элемента wlc для простоты интерпретации, что дает в результате оценку активности клеточного сигнального пути такую, что отрицательные значения соответствуют пассивному клеточному сигнальному пути, а положительные значения соответствуют активному клеточному сигнальному пути.

В качестве альтернативы описанным "однослойным" моделям, может быть использована "двухслойная" модель представляющая собой экспериментальное определение активной передачи сигналов в пути. Для каждого целевого гена вычисляется суммарный уровень с помощью линейной комбинации, основанной на измеренных интенсивностях связанных с ним наборами проб ("первый (нижний) слой"). Вычисленное суммарное значение впоследствии объединяют с суммарными значениями других целевых генов пути с использованием дополнительной линейной комбинации ("второй (верхний) слой"). Веса могут быть получены путем использования либо набора обучающих данных, либо экспертных знаний, либо их комбинации. Выражаясь иначе, в "двухслойной" модели для каждого из одного или более целевых генов предусмотрен один или более уровней экспрессии, и одна или более линейных комбинаций одержат для каждого одного или более целевых генов первую линейную комбинацию всех уровней экспрессии одного или более уровней экспрессии, предусмотренных для соответствующего целевого гена ("первый (нижний) слой"). Модель также основана, по меньшей мере, частично, на дополнительной линейной комбинации, включающей взвешенный показатель для каждого одного или более целевых генов, причем взвешенный показатель основан на первой линейной комбинации для соответствующего целевого гена ("второй (верхний слой").

В предпочтительном варианте "двухслойной" модели расчет суммарных значений может включать определение порога для каждого целевого гена с применением обучающих данных и путем вычитания порога из расчетной линейной комбинации, получая таким образом указанную краткую сводку по генам. Здесь порог может быть выбран таким образом, что отрицательный суммарный уровень генов будет соответствовать целевому гену с пониженной экспрессией, а положительный суммарный уровень генов будет соответствовать целевому гену с повышенной экспрессией. Кроме того, полученные для генов суммарные значения можно преобразовать с использованием, например одного из вышеуказанных преобразований (нечеткого, дискретного и т.д.) до их объединения со "вторым (верхним) слоем".

После определения уровня TF элемента путем оценки "двухслойной" модели, определенный уровень TF элемента может быть пороговым для выведенной активности клеточного сигнального пути, как указано выше.

Все описанные выше модели со ссылкой на US 61/745839, соответствующую РСТ/IB2013/061066, далее по тексту обозначены как "(псевдо-)линейные модели".

Целевые гены соответствующих путей предпочтительно можно выбрать, используя способы, описанные в разделах "Пример 2: Выбор целевых генов" и "Пример 3: Сравнение списка отобранных свидетельств с широким списком, полученным на основании литературных источников" в US 61/745839, соответствующей PCT/IB2013/061066, а обучение вероятностной модели можно осуществлять, используя способы, описанные в разделе “Пример 4: Обучение и применение Байесовской сети” в US 61/745839, соответствующей PCT/IB2013/061066. Выбор целевого(ых) гена(ов), определенного в прилагаемой формуле изобретения, также полезен для определения активности приведенных в качестве примера пути Wnt, пути ER, пути АР и/или пути AR, используя этот последний подход.

Далее, приводится краткий обзор выбора целевых генов соответствующих путей согласно способам, описанным в разделах “Пример 2: Выбор целевых генов” и "Пример 3: Сравнение списка отобранных свидетельств с широким списком, полученным на основании литературных источников" в US 61/745839, соответствующей PCT/IB2013/061066, и обучения вероятностной модели согласно способам, описанным в разделе “Пример 4: Обучение и применение Байесовской сети” в US 61/745839, соответствующей PCT/IB2013/061066.

Выбор целевых генов согласно примеру 2US 61/745839, соответствующей PCT/IB2013/061066

Фактор транскрипции (TF) представляет собой белковый комплекс (то есть, сочетание белков, связанных вместе в определенной структуре) или белок, который способен регулировать транскрипцию целевых генов путем связывания со специфическими ДНК-последовательностями, тем самым контролируя транскрипцию генетической информации из ДНК в РНК. мРНК получают непосредственно за счет этого действия транскрипционного комплекса, обозначенного в настоящем описании "непосредственно вовлеченным целевым геном". Пути активации также могут привести ко вторичной транскрипции генов, обозначенных "опосредованно вовлеченными целевыми генами". В дальнейшем, предпочтительными являются (псевдо)линейные модели, содержащие или состоящие из непосредственно вовлеченных целевых генов, в виде прямых связей между активностью пути и уровнем мРНК, однако различие между непосредственно и опосредованно вовлеченными целевыми генами не всегда очевидно. В данном документе представлен способ выбора непосредственно вовлеченных целевых генов с помощью функции оценки, основанной на имеющихся литературных данных. Тем не менее, случайный выбор опосредованно вовлеченных целевых генов не может быть исключен из-за ограниченной информации и биологических вариаций и неопределенностей.

Конкретные целевые гены мРНК пути отбирали из научной литературы, используя систему ранжирования, в которой научному свидетельству, описанному для конкретного целевого гена, присваивали рейтинг, в зависимости от типа научных экспериментов, в которых было получено данное свидетельство. Хотя некоторое экспериментальное свидетельство является простым предположением о гене, являющемся целевым геном, как, например, увеличение мРНК на микрочипе эмбриона, для которого, как известно, путь HH является активным, другое свидетельство может быть очень весомым, как, например, комбинация идентифицированного сайта связывания фактора транскрипции пути и нахождение этого сайта в анализе иммунопреципитации хроматина (ChIP) после стимуляции конкретного пути в клетке и увеличения мРНК после конкретной стимуляции пути в клеточной линии.

В научной литературе можно идентифицировать несколько типов экспериментов для нахождения конкретных целевых генов пути, например, (без ограничения):

1. ChIP эксперименты, в которых показано прямое связывание фактора транскрипции пути с его сайтом связывания на геноме. Пример: В результате использования метода иммунопреципитации хроматина (ChIP) были определены предполагаемые функциональные сайты связывания фактора транскрипции TCF4 в ДНК клеточных линий толстой кишки с и без активного пути Wnt в виде подмножества сайтов связывания, распознанных исключительно, основываясь на нуклеотидной последовательности. Предполагаемая функциональность была идентифицирована как ChIP-полученное свидетельство того, что фактор транскрипции, как было найдено, связывается с ДНК-связывающим сайтом.

2. Анализ сдвига электрофоретической подвижности (EMSA), который показал in vitro связывание фактора транскрипции с фрагментом ДНК, содержащим определенную последовательность связывания. По сравнению с основанным на ChIP свидетельством, свидетельство, основанное на EMSA, является менее сильным, поскольку оно не может быть переведено в in vivo ситуацию.

3. Стимуляция пути и измерение профилей мРНК на микрочипе или при помощи РНК секвенирования, используя клеточные линии с индуцируемыми путями, и измерение профилей мРНК, измеренных в нескольких временных точках после индукции, в присутствии циклогексимида, который ингибирует трансляцию в белок, при этом предполагается, что таким образом индуцированные мРНК являются прямыми целевыми генами.

4. Аналогично 3, но с применением количественной ПЦР для измерения количества мРНК.

5. Идентификация сайтов связывания фактора транскрипции в геноме с помощью подхода биоинформатики. Примеры пути Wnt: Используя ДНК-связывающие последовательности фактора транскрипции Tcf4-бета катенина, была запущена компьютерная программа на последовательность генома человека, и были определены потенциальные сайты связывания как в промоторных областях генов, так и в других геномных областях.

6. Аналогично 3 только в отсутствие циклогексимида.

7. Аналогично 4 только в отсутствие циклогексимида.

8. Создание профиля экспрессии мРНК для образцов конкретных тканей или клеток, для которых известно, что путь является активным, однако в отсутствие условия надлежащего отрицательного контроля.

В простейшем случае можно присвоить 1 балл каждой потенциальной целевой мРНК для каждого из этих экспериментальных подходов, в которых была идентифицирована указанная целевая мРНК.

В качестве альтернативы, баллы могут присваиваться инкрементно, т.е. один способ дает один балл, второй способ добавляет второй балл и т.д. Используя такую относительную стратегию ранжирования, можно составить список наиболее надежных целевых генов.

Кроме того, ранжирование может быть использовано иным способом для идентификации целевых генов, которые вероятнее всего представляют собой непосредственно вовлеченные целевые гены, путем присваивания самого высокого балла способу, который обеспечивает наилучшее свидетельство для in vivo непосредственно вовлеченного целевого гена, в приведенном выше списке это будет означать 8 баллов для экспериментального подхода 1), 7 для 2), и далее по убыванию до одного балла для экспериментального подхода 8). Такой список можно назвать "общим списком целевых генов".

Несмотря на биологические вариации и неопределенности, изобретатели предположили, что непосредственно вовлеченные целевые гены вероятнее всего будут индуцированы не зависящим от типа ткани способом. Список этих целевых генов можно назвать "отобранным на основании свидетельств списком целевых генов". Этот отобранный целевой список использовали для построения вычислительных моделей, которые могут быть применены к образцам, полученным из разных тканей и/или источников клеток.

"Общий список целевых генов" может содержать гены, которые более специфичны для той или иной ткани, и может быть потенциально использован для оптимизации и повышения чувствительности и специфичности модели для применения к образцам, полученным из конкретной ткани, таким как образцы рака молочной железы.

Ниже приведен пример того, как для пути ER был произведен выбор отобранного на основе свидетельств списка целевых генов.

Для выбора целевых генов ER, используемых в качестве входных данных для описанных здесь (псевдо-)линейных моделей, были использованы следующие три критерия:

1. Промоторная/энхансерная область гена содержит мотив элемента ответа на эстроген (ERE):

а. Должно быть показано, что мотив ERE является чувствительным к эстрогену, например, с помощью анализа временной трансфекции, в котором специфический ERE мотив связан с геном-репортером, и

b. наличие мотива ERE должно быть подтверждено, например, с помощью анализа обогащенного мотива промоторной/энхансерной области гена.

2. ER (дифференциально) связывается in vivo с изучаемой промоторной/энхансерной областью гена, продемонстрированной, например, в ChIP/CHIP эксперименте или анализе иммунопреципитации хроматина:

a. доказано, что ER связывается с промоторной/энхансерной областью гена, когда путь ER является активным, и

b. (предпочтительно) не связывается (или слабо связывается) с промоторной/энхансерной областью гена, когда путь ER является неактивным.

3. Осуществляется дифференциальная транскрипция гена, когда путь ER является активным, что продемонстрировано, например,

a. кратным обогащением мРНК исследуемого гена методом ПЦР в реальном времени или в экспериментах с микрочипами, или

b. демонстрацией с помощью анализа иммунопреципитации того, что РНК Pol II связывается с промоторной областью гена.

Выбор был сделан путем определения в качестве целевых генов ER таких генов, для которых было собрано достаточное количество хорошо задокументированных экспериментальных свидетельств о том, что выполнены все три упомянутые выше критерии. Подходящим экспериментом для сбора сведений о дифференциальном связывании ER является сравнение результатов, например, ChIP/CHIP эксперимента в клеточной линии рака, которая является чувствительной к эстрогену (например, клеточной линии MCF-7) при воздействии или без воздействия на нее эстрогена. То же самое относится к сбору сведений о транскрипции мРНК.

Вышеизложенное представляет собой обсуждение общего подхода и более конкретного примера процедуры выбора целевых генов, которая был использована для выбора нескольких целевых генов на основании из свидетельств, найденных с помощью указанного выше подхода. Списки целевых генов, используемых в (псевдо-)линейных моделях для приведенных в качестве примера путей, а именно путей Wnt, ER, HH и AR, показаны в таблице 1, таблице 2, таблице 3 и таблице 4, соответственно.

Целевые гены пути ER, использованные для описанных здесь (псевдо-)линейных моделей пути ER (показаны в таблице 2), содержат выбор целевых генов, исходя из их оценки, сделанной на основании описанных в литературе свидетельств; в этот короткий список были добавлены только целевые гены с наибольшими доказательственными баллами (предпочтительные целевые гены по изобретению). Полный список целевых генов ER, в том числе указанных генов с наибольшими доказательственными баллами, показан в таблице 5.

Дополнительный этап выбора или ранжирования целевых генов путей Wnt, ER, HH и AR, показанный в таблице 1, таблице 2, таблице 3 и таблице 4, выполняли путем комбинации полученного из литературы доказательственного балла с отношениями шансов, вычисленных с применением наборов обучающих данных, связывающих узлы набора данных с соответствующими узлами целевых генов. Отношения шансов вычисляли, используя значение отсечки, например медиану всех обучающих образцов, если используется одинаковое количество активных и пассивных обучающих образцов; каждое значение, превышающее значение отсечки, объявляется высоким, а значение, которое ниже значения отсечки, объявляется низким. Это делается для обучающих образцов, для которых известно, что путь является активным или пассивным. Затем для конкретного целевого гена или набора проб можно рассчитано отношение шансов следующим образом:

f(активный, низкий) = n(активный, низкий)/(n(активный, низкий) + n(активный, высокий)) (3)

f(пассивный, низкий) = n(пассивный, низкий)/(n(пассивный, низкий) + n(пассивный, высокий))

Отношение шансов = f(пассивный, низкий)/(1 - f(пассивный, низкий)) * (1 - f(активный, низкий))/f(активный, низкий),

где n(активный, низкий) представляет собой количество обучающих выборок, для которых известно, что они имеют активный путь и которые, как было найдено, имеют уровень экспрессии ниже значения отсечки, n(пассивный, низкий) представляет собой количество обучающих выборок, для которых известно, что они имеют пассивный путь и которые, как было найдено, имеют уровень экспрессии ниже значения отсечки, и так далее; f(активный, низкий) и f(пассивный, низкий) представляет собой долю образцов, относительно которых известно, что они имеют активный или пассивный путь, соответственно, и для которых было найдено, чтобы они имеют уровень экспрессии ниже значения отсечки.

Альтернативно, чтобы избежать неопределенных отношений шансов (деление на ноль), можно добавить, например, псевдоотсчет для расчета указанной доли, например:

f(активный, низкий)псевдо = (n(активный, низкий) + 1)/(n(активный, низкий) + n(активный, высокий) + 2) (4)

f(пассивный, низкий)псевдо = (n(пассивный, низкий) + 1)/(n(пассивный, низкий) + n(пассивный, высокий) + 2)

Альтернативно, можно также заменить абсолютное количество образцов с доказательной активностью, предполагая некоторую неопределенность (шум) в настройках измерения, и вычислить для каждого обучающего образца вероятность значения "низкий" или "высокий", предполагая, например, нормальное распределение (так называемое "мягкое свидетельство"). Затем можно вычислить доли, следуя описанным выше вычислениям.

f(активный, низкий)мягкий = (Σp(активный, низкий) + 1)/( Σp(активный, низкий) + Σp(активный, высокий) + 2) (5)

f(пассивный, низкий)мягкий = (Σp(пассивный, низкий) + 1)/( Σp(пассивный, низкий) + Σp(пассивный, высокий) + 2),

где р(активный, низкий) и р(пассивный, низкий) представляют собой для каждого образца вероятность того, что он находится ниже значения отсечки, исходя из предположения о наличии стандартного распределения со средним значением, равным измеренному уровню экспрессии соответствующего обучающего образца, и стандартным отклонением, равным оценке неопределенности, связанной с измерением уровня экспрессии, например, 0,25 по шкале log2. Эти вероятности суммируются по всем образцам и затем добавляется псевдоотсчет.

Отношение шансов представляет собой оценку важности целевого гена, позволяющей сделать вывод об активности путей. В общем случае, можно ожидать, что уровень экспрессии целевого гена с более высоким отношением шансов, вероятно, будет более информативным относительно общей активности пути по сравнению с целевыми генами с более низкими отношениями шансов. Однако из-за сложности клеточных сигнальных путей следует понимать, что между целевыми генами могут существовать более сложные взаимосвязи, и активность пути, например, с учетом уровней экспрессии различных комбинаций целевых генов с низкими отношениями шансов, может быть более доказательной, чем с учетом отдельно взятых целевых генов с более высокими отношениями шансов. В описанном здесь моделировании Wnt, ER, HH и АР было найдено, что целевые гены, показанные в таблице 6, таблица 7, таблице 8 и таблице 9, имеют более высокую доказательную силу для предсказания активности путей Wnt, Er, HH и Аr по сравнению с целевыми генами с более низким рейтингом (таким образом, целевые гены, приведенные в таблицах 6-9 являются особенно предпочтительными согласно настоящему изобретению). Тем не менее, учитывая относительную легкость получения уровней экспрессии для больших наборов генов с помощью методов сбора данных, таких как микрочипы,, предполагается использовать некоторые или все целевые гены, приведенные в таблице 6, таблица 7, таблице 8 и таблице 9 и необязательно дополнительно использовать один, два, несколько или все дополнительные целевые гены рангов, показанных в таблице 1, таблице 2, таблице 3 и таблице 4, в описанных (псевдо-)линейных моделях.

Таблица 1 Отобранный на основании свидетельств список целевых генов пути Wnt, использованный в (псевдо-)линейных моделях, и соответствующих наборов проб, использованных для измерения уровня экспрессии мРНК целевых генов Целевой ген Набор проб Целевой ген Набор проб ADRA2C 206128_at HNF1A 210515_at ASCL2 207607_at 216930_at 229215_at IL8 202859_x_at AXIN2 222695_s_at 211506_s_at 222696_at KIAA1199 1554685_a_at 224176_s_at 212942_s_at 224498_x_at KLF6 1555832_s_at BMP7 209590_at 208960_s_at 209591_s_at 208961_s_at 211259_s_at 211610_at 211260_at 224606_at CCND1 208711_s_at LECT2 207409_at 208712_at LEF1 210948_s_at 214019_at 221557_s_at CD44 1557905_s_at 221558_s_at 1565868_at LGR5 210393_at 204489_s_at 213880_at 204490_s_at MYC 202431_s_at 209835_x_at 244089_at 210916_s_at NKD1 1553115_at 212014_x_at 229481_at 212063_at 232203_at 216056_at OAT 201599_at 217523_at PPARG 208510_s_at 229221_at REG1B 205886_at 234411_x_at RNF43 218704_at 234418_x_at SLC1A2 1558009_at COL18A1 209081_s_at 1558010_s_at 209082_s_at 208389_s_at DEFA6 207814_at 225491_at DKK1 204602_at SOX9 202935_s_at EPHB2 209588_at 202936_s_at 209589_s_at SP5 235845_at 210651_s_at TBX3 219682_s_at 211165_x_at 222917_s_at EPHB3 1438_at 225544_at 204600_at 229576_s_at FAT1 201579_at TCF7L2 212759_s_at FZD7 203705_s_at 212761_at 203706_s_at 212762_s_at GLUL 200648_s_at 216035_x_at 215001_s_at 216037_x_at 217202_s_at 216511_s_at 217203_at 236094_at 242281_at TDGF1 206286_s_at ZNRF3 226360_at

Таблица 2 Отобранный на основании свидетельств список целевых генов пути ER, использованный в (псевдо-)линейных моделях, и соответствующих наборов проб, использованных для измерения уровня экспрессии мРНК целевых генов. “Наибольшие дискриминантные наборы проб” подчеркнуты Целевой ген Набор проб Целевой ген Набор проб AP1B1 205423_at RARA 1565358_at ATP5J 202325_s_at 203749_s_at COL18A1 209081_s_at 203750_s_at 209082_s_at 211605_s_at COX7A2L 201256_at 216300_x_at CTSD 200766_at SOD1 200642_at DSCAM 211484_s_at TFF1 205009_at 237268_at TRIM25 206911_at 240218_at 224806_at EBAG9 204274_at XBP1 200670_at 204278_s_at 242021_at ESR1 205225_at GREB1 205862_at 211233_x_at 210562_at 211234_x_at 210855_at 211235_s_at IGFBP4 201508_at 211627_x_at MYC 202431_s_at 215551_at 244089_at 215552_s_at SGK3 227627_at 217163_at 220038_at 217190_x_at WISP2 205792_at 207672_at ERBB2 210930_s_at HSPB1 201841_s_at 216836_s_at KRT19 201650_at 234354_x_at 228491_at CA12 203963_at NDUFV3 226209_at 204508_s_at 226616_s_at 204509_at NRIP1 202599_s_at 210735_s_at 202600_s_at 214164_x_at PGR 208305_at 215867_x_at 228554_at 241230_at PISD 202392_s_at CDH26 232306_at PRDM15 230553_at 233391_at 230777_s_at 233662_at 231931_at 233663_s_at 234524_at CELSR2 204029_at 236061_at 36499_at PTMA 200772_x_at 200773_x_at 208549_x_at 211921_x_at

Таблица 3 Отобранный на основании свидетельств список целевых генов пути HH, использованный в (псевдо-)линейных моделях, и соответствующих наборов проб, использованных для измерения уровня экспрессии мРНК целевых генов Целевой ген Набор проб Целевой ген Набор проб GLI1 206646_at CTSL1 202087_s_at PTCH1 1555520_at TCEA2 203919_at 208522_s_at 238173_at 209815_at 241428_x_at 209816_at MYLK 1563466_at 238754_at 1568770_at PTCH2 221292_at 1569956_at HHIP 1556037_s_at 202555_s_at 223775_at 224823_at 230135_at FYN 1559101_at 237466_s_at 210105_s_at SPP1 1568574_x_at 212486_s_at 209875_s_at 216033_s_at TSC22D1 215111_s_at PITRM1 205273_s_at 235315_at 239378_at 243133_at CFLAR 208485_x_at 239123_at 209508_x_at CCND2 200951_s_at 209939_x_at 200952_s_at 210563_x_at 200953_s_at 210564_x_at 231259_s_at 211316_x_at H19 224646_x_at 211317_s_at 224997_x_at 211862_x_at IGFBP6 203851_at 214486_x_at TOM1 202807_s_at 214618_at JUP 201015_s_at 217654_at FOXA2 210103_s_at 235427_at 214312_at 237367_x_at 40284_at 239629_at MYCN 209756_s_at 224261_at 209757_s_at IL1R2 205403_at 211377_x_at 211372_s_at 234376_at S100A7 205916_at 242026_at S100A9 203535_at NKX2_2 206915_at CCND1 208711_s_at NKX2_8 207451_at 208712_at RAB34 1555630_a_at 214019_at 224710_at JAG2 209784_s_at MIF 217871_s_at 32137_at GLI3 1569342_at FOXM1 202580_x_at 205201_at FOXF1 205935_at 227376_at FOXL1 216572_at FST 204948_s_at 243409_at 207345_at 226847_at BCL2 203684_s_at 203685_at 207004_at 207005_s_at

Таблица 4 Отобранный на основании свидетельств список целевых генов пути AR, использованный в (псевдо-)линейных моделях, и соответствующих наборов проб, использованных для измерения уровня экспрессии мРНК целевых генов Целевой ген Набор проб Целевой ген Набор проб ABCC4 1554918_a_at LCP1 208885_at 1555039_a_at LRIG1 211596_s_at 203196_at 238339_x_at APP 200602_at NDRG1 200632_s_at 211277_x_at NKX3_1 209706_at 214953_s_at 211497_x_at AR 211110_s_at 211498_s_at 211621_at NTS 206291_at 226192_at PLAU 205479_s_at 226197_at 211668_s_at CDKN1A 1555186_at PMEPA1 217875_s_at 202284_s_at 222449_at CREB3L4 226455_at 222450_at DHCR24 200862_at PPAP2A 209147_s_at DRG1 202810_at 210946_at EAF2 1568672_at PRKACB 202741_at 1568673_s_at 202742_s_at 219551_at 235780_at ELL2 214446_at KLK3 204582_s_at 226099_at 204583_x_at 226982_at PTPN1 202716_at FGF8 208449_s_at 217686_at FKBP5 204560_at SGK1 201739_at 224840_at TACC2 1570025_at 224856_at 1570546_a_at GUCY1A3 221942_s_at 202289_s_at 227235_at 211382_s_at 229530_at TMPRSS2 1570433_at 239580_at 205102_at IGF1 209540_at 211689_s_at 209541_at 226553_at 209542_x_at UGT2B15 207392_x_at 211577_s_at 216687_x_at KLK2 1555545_at 209854_s_at 209855_s_at 210339_s_at

Таблица 5 Символы генов для целевых генов ER, для которых из литературных источников было выявлено значимое свидетельство (= длинный список целевых генов ER) Символ гена Символ гена Символ гена Символ гена AP1B1 SOD1 MYC ENSA COX7A2L TFF1 ABCA3 KIAA0182 CTSD TRIM25 ZNF600 BRF1 DSCAM XBP1 PDZK1 CASP8AP2 EBAG9 GREB1 LCN2 CCNH ESR1 IGFBP4 TGFA CSDE1 HSPB1 SGK3 CHEK1 SRSF1 KRT19 WISP2 BRCA1 CYP1B1 NDUFV3 ERBB2 PKIB FOXA1 NRIP1 CA12 RET TUBA1A PGR CELSR2 CALCR GAPDH PISD CDH26 CARD10 SFI1 PRDM15 ATP5J LRIG1 ESR2 PTMA COL18A1 MYB MYBL2 RARA CCND1 RERG

Таблица 6 Короткий список целевых генов Wnt, полученный на основании доказательственного балла, основанного на литературных источниках, и отношении шансов Целевой ген KIAA1199 AXIN2 CD44 RNF43 MYC TBX3 TDGF1 SOX9 ASCL2 IL8 SP5 ZNRF3 EPHB2 LGR5 EPHB3 KLF6 CCND1 DEFA6 FZD7

Таблица 7 Короткий список целевых генов ER, полученный на основании доказательственного балла, основанного на литературных источниках, и отношении шансов Целевой ген CDH26 SGK3 PGR GREB1 CA12 XBP1 CELSR2 WISP2 DSCAM ERBB2 CTSD TFF1 NRIP1

Таблица 8 Короткий список целевых генов HH, полученный на основании доказательственного балла, основанного на литературных источниках, и отношении шансов Целевой ген GLI1 PTCH1 PTCH2 IGFBP6 SPP1 CCND2 FST FOXL1 CFLAR TSC22D1 RAB34 S100A9 S100A7 MYCN FOXM1 GLI3 TCEA2 FYN CTSL1

Таблица 9 Короткий список целевых генов AR, полученный на основании доказательственного балла, основанного на литературных источниках, и отношении шансов Целевой ген KLK2 PMEPA1 TMPRSS2 NKX3_1 ABCC4 KLK3 FKBP5 ELL2 UGT2B15 DHCR24 PPAP2A NDRG1 LRIG1 CREB3L4 LCP1 GUCY1A3 AR EAF2

Сравнение отобранного на основании свидетельств списка и широкого списка, полученного на основании литературных источников, согласно примеру 3 US 61/745839, соответствующей PCT/IB2013/061066ю

Список целевых генов Wnt, созданный на основании свидетельств из литературных источников согласно описанному в настоящем документе способу (таблица 1), сравнивали с другим списком целевых генов, который был создан согласно процедуре, не описанной выше. Альтернативный список представляет собой компиляцию генов, полученных из множества разных данных, полученных благодаря использованию различных экспериментальных подходов в изучении целевых генов Wnt, опубликованных в трех открытых источниках лабораториями, известными экспертам в области молекулярной биологии и изучения пути Wnt. Альтернативный список представляет собой комбинацию генов, указанных в таблице S3 у Hatzis др. (Hatzis Р, 2008), в тексте и Таблице S1A у de Sousa e Melo (de Sousa E Melo F, 2011) и в списке целевых генов, собранном и поддерживаемом Roel Nusse, пионером в области изучения передачи сигналов Wnt (Nusse, 2012). В результате комбинации этих трех источников был получен список из 124 генов (= широкий список, полученный на основании литературных источников, см. таблицу 10). Здесь обсуждается вопрос эффективности предсказания активности Wnt в клинических образцах с помощью алгоритма, полученного из этого альтернативного списка, а именно, выполняется ли этот прогноз с такой же или более высокой эффективностью по сравнению с моделью, построенной на основе существующего списка генов (= отобранный на основании свидетельств список, таблица 1).

Таблица 10 Альтернативный список целевых генов Wnt (= широкий список, полученный на основании литературных источников) Целевой ген Ссылка Целевой ген Ссылка ADH6 de Sousa e Melo et al. L1CAM Nusse ADRA2C Hatzis et al. LBH Nusse APCDD1 de Sousa e Melo et al. LEF1 Hatzis et al., de Sousa e Melo
et al., Nusse
ASB4 de Sousa e Melo et al. LGR5 de Sousa e Melo et al., Nusse ASCL2 Hatzis et al., de Sousa e Melo
et al.
LOC283859 de Sousa e Melo et al.
ATOH1 Nusse MET Nusse AXIN2 Hatzis et al., de Sousa e Melo
et al., Nusse
MMP2 Nusse
BIRC5 Nusse MMP26 Nusse BMP4 Nusse MMP7 Nusse BMP7 Hatzis et al. MMP9 Nusse BTRC Nusse MRPS6 Hatzis et al. BZRAP1 de Sousa e Melo et al. MYC Hatzis et al., Nusse SBSPON de Sousa e Melo et al. MYCBP Nusse CCL24 de Sousa e Melo et al. MYCN Nusse CCND1 Nusse NANOG Nusse CD44 Nusse NKD1 de Sousa e Melo et al. CDH1 Nusse NOS2 Nusse CDK6 Hatzis et al. NOTUM de Sousa e Melo et al. CDKN2A Nusse NRCAM Nusse CLDN1 Nusse NUAK2 Hatzis et al. COL18A1 Hatzis et al. PDGFB Hatzis et al. CTLA4 Nusse PFDN4 Hatzis et al. CYP4X1 de Sousa e Melo et al. PLAUR Nusse CYR61 Nusse POU5F1 Nusse DEFA5 de Sousa e Melo et al. PPARD Nusse DEFA6 de Sousa e Melo et al. PROX1 de Sousa e Melo et al. DKK1 de Sousa e Melo et al., Nusse PTPN1 Hatzis et al. DKK4 de Sousa e Melo et al. PTTG1 Nusse DLL1 Nusse REG3A de Sousa e Melo et al. DPEP1 de Sousa e Melo et al. REG4 de Sousa e Melo et al. EDN1 Nusse RPS27 Hatzis et al. EGFR Nusse RUNX2 Nusse EPHB2 Hatzis et al., de Sousa e Melo
et al., Nusse
SALL4 Nusse
EPHB3 Hatzis et al., Nusse SLC1A1 de Sousa e Melo et al. ETS2 Hatzis et al. SLC7A5 Hatzis et al. FAT1 Hatzis et al. SNAI1 Nusse FGF18 Nusse SNAI2 Nusse FGF20 Nusse SNAI3 Nusse FGF9 Nusse SIK1 Hatzis et al. FLAD1 Hatzis et al. SOX17 Nusse AK122582 Hatzis et al. SOX2 de Sousa e Melo et al. FN1 Nusse SOX4 Hatzis et al. FOSL1 Nusse SOX9 Nusse FOXN1 Nusse SP5 Hatzis et al., de Sousa e
Melo et al.
FST Nusse SP8 Hatzis et al. FZD2 de Sousa e Melo et al. TCF3 Nusse FZD7 Nusse TDGF1 Hatzis et al. GAST Nusse TIAM1 Nusse GMDS Hatzis et al. TNFRSF19 Nusse GREM2 Nusse TNFSF11 Nusse HES6 Hatzis et al. TRIM29 de Sousa e Melo et al. HNF1A Nusse TSPAN5 de Sousa e Melo et al. ID2 Nusse TTC9 de Sousa e Melo et al. IL22 de Sousa e Melo et al. VCAN Nusse IL8 Nusse VEGFA Nusse IRX3 de Sousa e Melo et al. VEGFB Nusse IRX5 de Sousa e Melo et al. VEGFC Nusse ISL1 Nusse WNT10A Hatzis et al. JAG1 Nusse WNT3A Nusse JUN Nusse ZBTB7C de Sousa e Melo et al. KIAA1199 de Sousa e Melo et al. PATZ1 Hatzis et al. KLF4 Hatzis et al. ZNRF3 Hatzis et al.

Следующий этап заключался в поиске наборов проб матрицы Affymetrix® GeneChip Human Genome U133 Plus 2.0, которая соответствует этим генам. Этот процесс проводили с использованием пакета Bioconductor языка программирования R и отбора вручную для определения релевантности набора проб с применением геномного браузера UCSC, аналогично описанным здесь (псевдо)линейным моделям, тем самым удаляя, например, наборы проб, расположенные на противоположных нитях или находящиеся за пределами экзона гена. Для двух из 124 генов отсутствовали наборы проб, доступные на этом микроматричном чипе и, следовательно, они не могли быть включены в (псевдо)линейную модель, это гены LOC283859 и WNT3A. Было найдено, что 287 наборов проб соответствуют оставшимся 122 генам (таблица 11).

Таблица 11 Наборы проб, связанные с целевыми генами Wnt в широком списке генов, полученном на основании литературных источников Условное обозначение гена Набор проб Условное обозначение гена Набор проб Условное обозначение гена Набор проб ADH6 207544_s_at FAT1 201579_at PFDN4 205360_at 214261_s_at FGF18 206987_x_at 205361_s_at ADRA2C 206128_at 211029_x_at 205362_s_at APCDD1 225016_at 211485_s_at PLAUR 210845_s_at ASB4 208481_at 231382_at 211924_s_at 217228_s_at FGF20 220394_at 214866_at 217229_at FGF9 206404_at POU5F1 208286_x_at 235619_at 239178_at PPARD 208044_s_at 237720_at FLAD1 205661_s_at 210636_at 237721_s_at 212541_at 37152_at ASCL2 207607_at AK122582 235085_at 242218_at 229215_at FN1 1558199_at PROX1 207401_at ATOH1 221336_at 210495_x_at 228656_at AXIN2 222695_s_at 211719_x_at PTPN1 202716_at 222696_at 212464_s_at 217686_at 224176_s_at 214701_s_at 217689_at 224498_x_at 214702_at PTTG1 203554_x_at BIRC5 202094_at 216442_x_at REG3A 205815_at 202095_s_at FOSL1 204420_at 234280_at 210334_x_at FOXN1 207683_at REG4 1554436_a_at BMP4 211518_s_at FST 204948_s_at 223447_at BMP7 209590_at 207345_at RPS27 200741_s_at 209591_s_at 226847_at RUNX2 216994_s_at 211259_s_at FZD2 210220_at 221282_x_at 211260_at 238129_s_at 232231_at BTRC 1563620_at FZD7 203705_s_at 236858_s_at 204901_at 203706_s_at 236859_at 216091_s_at GAST 208138_at SALL4 229661_at 222374_at GMDS 204875_s_at SLC1A1 206396_at 224471_s_at 214106_s_at 213664_at BZRAP1 205839_s_at GREM2 220794_at SLC7A5 201195_s_at SBSPON 214725_at 235504_at SNAI1 219480_at 235209_at 240509_s_at SNAI2 213139_at 235210_s_at HES6 226446_at SNAI3 1560228_at CCL24 221463_at 228169_s_at SIK1 208078_s_at CCND1 208711_s_at HNF1A 210515_at 232470_at 208712_at 216930_at SOX17 219993_at 214019_at ID2 201565_s_at 230943_at CD44 1557905_s_at 201566_x_at SOX2 213721_at 204489_s_at 213931_at 213722_at 204490_s_at IL22 221165_s_at 228038_at 209835_x_at 222974_at SOX4 201416_at 210916_s_at IL8 202859_x_at 201417_at 212014_x_at 211506_s_at 201418_s_at 212063_at IRX3 229638_at 213668_s_at 217523_at IRX5 210239_at SOX9 202935_s_at 229221_at ISL1 206104_at 202936_s_at CDH1 201130_s_at JAG1 209097_s_at SP5 235845_at 201131_s_at 209098_s_at SP8 237449_at 208834_x_at 209099_x_at 239743_at CDK6 207143_at 216268_s_at TCF3 209151_x_at 214160_at JUN 201464_x_at 209152_s_at 224847_at 201465_s_at 209153_s_at 224848_at 201466_s_at 210776_x_at 224851_at KIAA1199 1554685_a_at 213730_x_at 231198_at 212942_s_at 213811_x_at 235287_at KLF4 220266_s_at 215260_s_at 243000_at 221841_s_at 216645_at CDKN2A 207039_at L1CAM 204584_at TDGF1 206286_s_at 209644_x_at 204585_s_at TIAM1 206409_at 211156_at LBH 221011_s_at 213135_at CLDN1 218182_s_at LEF1 210948_s_at TNFRSF19 223827_at 222549_at 221557_s_at 224090_s_at COL18A1 209081_s_at 221558_s_at TNFSF11 210643_at 209082_s_at LGR5 210393_at 211153_s_at CTLA4 221331_x_at 213880_at TRIM29 202504_at 231794_at MET 203510_at 211001_at 234362_s_at 211599_x_at 211002_s_at 236341_at 213807_x_at TSPAN5 209890_at CYP4X1 227702_at 213816_s_at 213968_at CYR61 201289_at MMP2 1566678_at 225387_at 210764_s_at 201069_at 225388_at DEFA5 207529_at MMP26 220541_at TTC9 213172_at DEFA6 207814_at MMP7 204259_at 213174_at DKK1 204602_at MMP9 203936_s_at VCAN 204619_s_at DKK4 206619_at MRPS6 224919_at 204620_s_at DLL1 224215_s_at MYC 202431_s_at 211571_s_at 227938_s_at MYCBP 203359_s_at 215646_s_at DPEP1 205983_at 203360_s_at 221731_x_at EDN1 218995_s_at 203361_s_at VEGFA 210512_s_at 222802_at MYCN 209756_s_at 210513_s_at EGFR 1565483_at 209757_s_at 211527_x_at 1565484_x_at 211377_x_at 212171_x_at 201983_s_at 234376_at VEGFB 203683_s_at 201984_s_at NANOG 220184_at VEGFC 209946_at 210984_x_at NKD1 1553115_at WNT10A 223709_s_at 211550_at 229481_at 229154_at 211551_at 232203_at ZBTB7C 217675_at 211607_x_at NOS2 210037_s_at ZBTB7C 227782_at EPHB2 209588_at NOTUM 228649_at PATZ1 209431_s_at 209589_s_at NRCAM 204105_s_at 211391_s_at 210651_s_at 216959_x_at 210581_x_at 211165_x_at NUAK2 220987_s_at 209494_s_at EPHB3 1438_at PDGFB 204200_s_at ZNRF3 226360_at 204600_at 216061_x_at ETS2 201328_at 217112_at 201329_s_at

Затем была построена (псевдо-)линейная модель, аналогичная описанной модели "все наборы проб", используя метод "черное и белое" расчета весовых параметров согласно тому, как описано в настоящем документе. Аналогично описанию (псевдо)линейной модели Wnt, основанной на отобранном на основании свидетельств списке, веса связанные с ребрами между наборами проб и соответствующими им генами, оба отобранный на основании свидетельств список и широкий список, полученный на основании литературных источников, получали в результате обучения, используя непрерывные, обработанные при помощи fRMA данные для 32 образцов нормальной толстой кишки и 32 образцов аденомы из набора данных GSE8671 из базы данных Gene Expression Omnibus (см. http://www.ncbi.nlm.nih.gov/geo/, дата последнего обращения 13 июля 2011).

Затем обученные (псевдо-)линейные модели тестировали на различных наборах данных для того, чтобы сделать вывод об оценке активности пути Wnt.

Из тестов можно сделать заключение, что модель, созданная для широкого списка, полученного на основании литературных источников, как правило, предсказывала более экстремальные степени активности для активной (положительный уровень активности) или пассивной передачи сигналов Wnt. Кроме того, альтернативная модель предсказывала аналогичные результаты для наборов данных для рака толстой кишки (GSE20916, GSE4183, GSE15960), но которые превышали результаты для ожидаемых образцов с предсказанной активной передачей сигналов Wnt при раке молочной железы (GSE12777) и для наборов данных образцов медуллобластомы (GSE10327).

В заключение, широкий список целевых генов, полученный на основании литературных источников, позволяет практически так же хорошо предсказать активность Wnt в раке толстой кишки, с одной стороны, но, с другой стороны, дает более худшее предсказание (больше ложных срабатываний) для других видов рака. Это может быть результатом альтернативного списка целевых генов, которые слишком сильно смещены в сторону клеток толстой кишки, в частности, которые, таким образом, являются в высокой степени тканеспецифичным; de Sousa E Melo et al. и Hatzis et al. изучали в основном колоректальный рак, хотя также могут быть включены целевые гены, которые не являются специфичными для Wnt. Кроме того, целевые гены Wnt, которые не являются специфичными для прямой кишки. Кроме того, случайно включенные в эти списки целевые гены, которые не являются специфичными для Wnt, могут быть причиной более худшего предсказания активности Wnt для других видов рака. Альтернативный список может содержать более опосредованно регулируемые целевые гены, что может сделать этот список более тканеспецифичным. Исходный список подобран таким образом, чтобы он содержал целевые гены, которые, наиболее вероятно, представляют собой гены, чувствительные к Wnt во всех тканях, тем самым уменьшая тканевую специфичность.

Обучение и использование математической модели в соответствии с примером 4 US 61/745839, соответствующей РСТ/IB2013/061066.

Перед использованием (псевдо)линейных моделей, описанных здесь в качестве иллюстрации, для того, чтобы сделать вывод об активности пути в тестируемом образце, необходимо определить веса, указывающие знак и величину корреляции между узлами и порогом, чтобы назвать узел "присутствующий" или "отсутствующий". Для априорного заполнения весов и порога можно использовать экспертные знания, но обычно модели обучают, используя репрезентативный набор обучающих выборок, относительно которых предпочтительно известна реальная ситуация, например, данные экспрессии для набора проб в образцах с известным имеющимся комплексом фактора транскрипции (= активный путь) или отсутствующим комплексом фактора транскрипции (= пассивный путь). Тем не менее, получение обучающих образцов из многих различных видов рака, о которых известно, что статус активности принадлежит тому пути, который предназначен для моделирования, является плохо реализуемым на практике. В результате имеющиеся обучающие наборы состоят из ограниченного числа образцов, как правило, только одного вида рака. В этой работе описан способ определения параметров, необходимых для классификации тестовых образцов, как имеющих активный или пассивный путь.

В данной области техники известно множество обучающих алгоритмов (например, регрессия), которые учитывают топологию модели и изменяют параметры модели, в данном случае вес и порог, с тем, чтобы оптимизировать выходные данные модели, в данном случае взвешенную линейную оценку. В настоящем документе демонстрированы два иллюстративных способа, которые могут быть использованы для вычисления весов непосредственно из уровней экспрессии без необходимости оптимизации алгоритма.

Предпочтительно, обучение (псевдо-)линейных моделей путей Wnt, ER, НН и AR осуществляется с применением общедоступных данных, которые можно получить из базы данных Gene Expression Omnibus (http://www.ncbi.nlm.nih.gov/geo/, см. выше).

Первый способ, определенный здесь как способ "черное и белое", сводится к тройной системе с весовыми коэффициентами, представляющими собой элемент (-1, 0, 1). В контексте биологии, -1 и 1 соответствовали бы генам или пробам, которые имеют пониженную и повышенную активность пути, соответственно. Если в отношении пробы или гена не может быть статистически показано, какую он имеет активность, пониженную или повышенную, ему присваивается вес, равный 0. В данном случае использован левосторонний и правосторонний, t-критерий с двумя образцами для уровней экспрессии образцов с активным путем относительно уровней экспрессии образцов с пассивным путем, чтобы определить, имеет ли проба или ген повышенный или пониженный уровень экспрессии, учитывая используемые обучающие данные. В случаях, когда среднее значение активных образцов статистически выше, чем у пассивных образцов, т.е. значение р ниже определенной пороговой величины, например 0,3, то набор проб или целевой ген определяется как имеющий повышенный уровень экспрессии. И наоборот, в тех случаях, когда среднее значение активных образцов статистически ниже, чем у пассивных образцов, такой набор проб или целевой ген определяется как имеющий пониженный уровень экспрессии при активации пути. В случае, если самая низкая (левосторонняя или правосторонняя) величина р превышает вышеупомянутый порог, вес такой пробы или гена определяется равным 0.

В другом предпочтительном варианте используется альтернативный способ получения весов и порога(ов). Этот альтернативный способ основан на логарифме (например, по основанию е) отношения шансов и, в этой связи, называется веса "логарифма отношения шансов". Отношение шансов для каждой пробы или гена рассчитывается на основании количества положительных и отрицательных обучающих образцов, для которых уровень пробы/гена выше и ниже соответствующего порога, например, медианы всех обучающих образцов (уравнение 3). Для того, чтобы избежать деления на ноль может быть добавлен псевдоотсчет (уравнение 4). Дальнейшее оптимизация заключается в подсчете образцов выше/ниже порога, в некотором смысле, более вероятностным методом, исходя из предположения, что уровни пробы/гена имеют, например, нормальное распределение вокруг его наблюдаемого значения с некоторым определенным стандартным отклонением (например, 0,25 по шкале 2-log), и подсчета вероятностной меры выше и ниже порога (уравнение 5).

Альтернативно, можно использовать известные в данной области алгоритмы оптимизации, такие как регрессия, чтобы определить веса и порог(и) описанных здесь (псевдо-)линейных моделей.

Особое внимание следует обратить на способ определения параметров для (псевдо-)линейных моделей для получения хорошей генерализации. Альтернативно, можно использовать другие методы машинного обучения, такие как байесовские сети, которые как известно в этой области, обеспечивают хорошую генерализацию благодаря использованию особых мер во время процедуры обучения.

Предпочтительно, обучение (псевдо-)линейных моделей путей Wnt, ER, НН и AR осуществляется с помощью общедоступных данных, которые можно получить из базы данных Gene Expression Omnibus (http://www.ncbi.nlm.nih.gov/geo/). В качестве примера, модели обучали с помощью таких общедоступных данных.

Особо следует отметить, что в соответствии с WO 2013/011479 А2 и US 61/745839, соответствующей РСТ/IB2013/061066, порядок ранга целевых генов ER, определенных в прилагаемой формуле изобретения, немного изменен из-за добавления новых свидетельств, полученных на основании литературных источников. Целевые гены ER выбирали и ранжировали аналогично тому, как описано в примере 3 US 61/745839, соответствующей РСТ/IB2013/061066. Гены ранжировали путем объединения доказательственного балла, полученного на основании литературных источников, и индивидуальных способностей каждого гена быть дифференцированным между активным и неактивным путем в модели Affymetrix. Это ранжирование основано на линейной комбинации взвешенных ложноположительных и ложноотрицательных результатов, полученных для каждого гена при обучении модели с помощью обучающего набора образцов клеточных линий MCF7, истощенной по эстрогену, которая впоследствии оставалась истощенной или получала 1 нМ эстроген в течение 24 часов (GSE35428), путем тестирования модели с применением обучающего набора и двух других обучающих наборов, в которых клетки MCF7 были истощены по эстрогену и оставались далее истощенными или получали 10 нМ или 25 нМ эстроген (GSE11352 и GSE8597, соответственно).

(Следует отметить, что комбинация взвешенных ложноположительных и ложноотрицательных результатов (вместо отношения шансов) была использована для учета различных экспериментальных условий, использованных в различных наборах. Различные веса устанавливали в соответствии с учетом мнения авторов настоящего изобретения о том, что ложноположительные (отрицательные) результаты являются следствием модели, а не различий в условиях проведения экспериментов с образцом. Например, во всех экспериментах образцы клеточной линии MCF7 были изначально истощены по эстрогену в течение какого-то промежутка времени до получения эстрогена или дополнительного истощения еще в течение 24 часов. Более короткое время истощения может привести к тому, что путь все еще остается активным, несмотря на истощение по эстрогену, в этом случае ложные результаты будут иметь меньший вес, чем в случае истощения в течение такого же промежутка времени и тестовых и обучающих образцов.)

Пример 2. Определение степени риска

В общем случае, можно разработать много разных формул для определения степени риска, которая указывает на риск возникновения клинического события в течение определенного промежутка времени, при этом степень риска основана, по меньшей мере, частично, на комбинации выведенных активностей двух или более клеточных сигнальных путей в ткани и/или клетках и/или жидкости организма субъекта, то есть:

MPS = F(P1, … ,PN) + X, (6),

где MPS представляет собой степень риска (термин "MPS" используется здесь в виде аббревиатуры термина "степень для множества путей" (“Multi-Pathway Score”), обозначающего степень риска, полученную на основании выведенных активностей двух или более клеточных сигнальных путей), где Pi представляет собой степень активности клеточного сигнального пути i, N представляет собой общее число рассматриваемых клеточных сигнальных путей, и Х является плейсхолдером для возможных дальнейших факторов или параметров, которые могут быть использованы в уравнении. Более конкретно, такая формула может представлять собой полином определенной степени при заданных переменных или линейной комбинацией переменных. Весовые коэффициенты и степени в таком полиноме могут быть установлены на основании экспертных знаний, но, как правило, для получения оценок для весовых коэффициентов и степеней в уравнении (6) используется обучающий набор данных с известной реальной ситуацией, например, данные по выживанию. Выведенные активности объединяют, используя уравнение (6), и затем получают MPS. После этого весовые коэффициенты и оценочную функцию оптимизируют таким образом, чтобы высокий MPS коррелировал с более длинным периодом времени, прошедшим до возникновения клинического события, и наоборот. Оптимизацию корреляции оценочной функции с данными возникновения события можно осуществлять, используя множество методов анализа, например, при помощи критерия пропорциональных рисков Кокса (используемого в настоящем описании в качестве иллюстрации), логарифмического рангового критерия, метода оценки Каплана-Мейера в сочетании со стандартными способами оптимизации, такими как метод сопряженных градиентов или ручной подгонкой.

В этом примере, клиническое событие представляет собой рак, в частности, рак молочной железы, а выведенная активность пути Wnt, пути ER (эстрогенный рецептор), пути HH (Hedgehog) и пути AR (андрогенный рецептор) рассматривается согласно тому, как подробно описано в опубликованной международной заявке на патент WO 2013/011479 А2 ("Оценка активности клеточных сигнальных путей с применением вероятностного моделирования экспрессии целевых генов") или в неопубликованной предварительной заявке на патент US 61/745839, соответствующей неопубликованной международной заявке на патент РСТ/IB2013/061066 ("Оценка активности клеточных сигнальных путей с применением линейной комбинации(ий) экспрессии целевых генов").

Формула, которая используется в настоящем описании в качестве примера, учитывает активность пути Wnt, пути ER и пути HH. Авторы настоящего изобретения исходили из наблюдений, полученных при изучении биологии рака, а также в виде корреляций, найденных в общедоступных наборах проб, между выживаемостью и активностью путей Wnt, ER, и НН. Предполагается, что пути раннего развития, такие как Wnt и Hedgehog, играют определенную роль в метастазировании раковых клеток, которые возвращаются к фенотипу, более похожему на стволовые клетки, и которые называются раковыми стволовыми клетками. Действительно, авторы изобретения считают, что существует достаточное количество указаний на то, что пути раннего развития, такие как путь Wnt, являются важными в метастазировании рака, способствуя началу деления метастатических раковых клеток в месте оседания в другом органе или ткани. Метастаз связан с плохим прогнозом и представляет собой форму рецидива рака, таким образом, активность путей раннего развития, таких как пути Wnt и HH, в раковых клетках, согласно ожиданиям авторов изобретения, будет давать плохой прогноз, в то время как пассивность пути ER, по-видимому, будет коррелировать с плохим результатом у больных раком молочной железы. Предполагаемая роль путей Wnt и Hedgehog в прогрессировании и метастазировании рака основана на доклинических исследованиях, и не была показана для субъектов, поскольку отсутствуют способы для измерения их активности.

Эти наблюдения авторов настоящего изобретения, полученные из биологических исследований и клинических корреляций, согласно которым активность Wnt и HH может играть определенную роль в рецидиве рака, а активность ER,

по-видимому, связана с хорошим клиническим результатом, объединены в приведенной ниже в качестве примера формуле

MPS = -α · PER + β · max(PWnt, PHH), (7)

где PER, PWnt и PHH означают выведенную активность пути ER, пути Wnt и пути HH, соответственно (например, в пределах от 0 до 1), и α и β представляют собой неотрицательные, предпочтительно положительные, постоянные масштабирующие коэффициенты. В этом примере α и β выбраны в качестве иллюстрации равными 1, а вероятности путей Wnt, ER и HH, находящихся в активном состоянии, были использованы как выведенные методом, описанным более подробно в опубликованной международной заявке на патент WO 2013/011479 А2 ("Оценка активности клеточных сигнальных путей с применением вероятностного моделирования экспрессии целевых генов"). В используемой здесь модели байесовской сети пути ER, Wnt и HH включают А) узел верхнего уровня для уровня представляющего интерес фактора транскрипции, В) уровень узлов, представляющих наличие представляющих интерес целевых генов (таблица 2, таблица 1 и таблица 3 в WO 2013/011479 А2, соответственно) и С) уровень узлов, представляющих наборы проб, связанные с представляющими интерес целевыми генами (таблица 2, таблица 1 и таблица 3 в WO 2013/011479 А2, соответственно). Априорная вероятность присутствующего или отсутствующего элемента TF устанавливается, равной 0,5. Условные вероятности между уровнями А и В тщательно подбирались вручную согласно тому, как описано в WO 2013/011479 А2, следующим образом: (а) отсутствующий TF/сниженный уровень экспрессии целевого гена: 0,95, (ii) отсутствующий TF/повышенный уровень экспрессии целевого гена: 0,05, (iii) присутствующий TF/сниженный уровень экспрессии целевого гена: 0,30, и (iv) присутствующий TF/повышенный уровень экспрессии целевого гена: 0,70, при этом условные вероятности между уровнями B и C были получены в результате обучения с применением датах, полученных из GSE8597, GSE8671 и GSE7553, соответственно.

В качестве обучающих данных, для пути ER использовали GSE8597, для пути Wnt использовали GSE8671 и для пути HH использовали GSE7553. Для того, чтобы сделать вывод, учитывали следующие целевые гены: GREB1, PGR, XBP1, CA12, SOD1, CTSD, IGFBP4, TFF1, SGK3, NRIP1, CELSR2, WISP2, AP1B1, RARA, MYC, DSCAM, EBAG9, COX7A2L, ERBB2, PISD, KRT19, HSPB1, TRIM25, PTMA, COL18A1, CDH26, NDUFV3, PRDM15, ATP5J и ESR1 для пути ER; KIAA1199, AXIN2, RNF43, TBX3, TDGF1, SOX9, ASCL2, IL8, SP5, ZNRF3, KLF6, CCND1, DEFA6, FZD7, NKD1, OAT, FAT1, LEF1, GLUL, REG1B, TCF7L2, COL18A1, BMP7, SLC1A2, ADRA2C, PPARG, DKK1, HNF1A и LECT2 для пути Wnt; и GLI1, PTCH1, PTCH2, IGFBP6, SPP1, CCND2, FST, FOXL1, CFLAR, TSC22D1, RAB34, S100A9, S100A7, MYCN, FOXM1, GLI3, TCEA2, FYN, CTSL1, BCL2, FOXA2, FOXF1, H19, HHIP, IL1R2, JAG2, JUP, MIF, MYLK, NKX2.2, NKX2.8, PITRM1 и TOM1 для пути HH.

Полученный MPS находился в пределах от -1, что указывало на низкий риск рецидива клинического случая, в данном случае рака, либо местного или отдаленного, в частности, рака молочной железы, в течение определенного промежутка времени, до +1 для пациентов с высоким риском рецидива.

Следует отметить, что, хотя в дальнейшем используется MPS, вычисленный по уравнению (7), в другом подходящем способе вычисления степени риска (MPS) на основании выведенной активности путей Wnt, ER, и HH используется следующая приведенная в качестве примера формула:

MPS = -α · PER + β · PWnt + γ · PHH, (8)

где PER, PWnt и PHH означают выведенную активность пути ER, пути Wnt и пути HH, соответственно (например, в пределах от 0 до 1), и α, β и γ представляют собой неотрицательные постоянные масштабирующие коэффициенты.

Два способа для квантования такого прогностического значения, используемого в настоящем описании в качестве примера, представляют собой модели пропорциональных рисков Кокса и графики Каплан-Мейера в сочетании с логарифмическим ранговым критерием:

Первый способ подходит для модели рисков, в которой используются данные по выживанию с одной или несколькими ковариатами. Вкратце, такая модель рисков объясняет разброс в выживаемости (клиническое событие) среди населения, исходя из (численного) значения ковариат. В результате фитирования каждой включенной ковариате будет присвоен уровень риска (HR), который количественно выражает связанный риск возникновения клинического события, исходя из значения ковариаты, например, HR, равный двум, соответствует увеличенному в два раза риску возникновения представляющего интерес клинического события для пациентов с увеличением значения указанной ковариаты на единицу. Более подробно, значение HR, равное единице, означает, что это ковариата не влияет на выживаемость, в то время как для HR < 1, увеличение числа ковариаты означает более низкий риск, а уменьшение числа ковариаты означает более высокий риск, и для HR > 1, увеличение числа ковариаты означает более высокий риск, а уменьшение числа ковариаты означает более низкий риск. Наряду с уровнями риска, приводятся 95% доверительный интервал и значения р (т.е. односторонняя вероятность того, что уровень риска значительно меньше или больше единицы). Все ковариаты масштабируются между нулем и единицей для обеспечения непосредственного прямого сравнения уровней рисков.

Последний способ включает построение кривой Каплана-Мейера, которая представляет собой вероятность выживания клинического события в виде функции от времени. Например, путем построения кривых Каплана-Мейера для различных групп риска в популяции, используя иллюстративный прогностический тест, можно визуализировать качество выделения риска приведенного в качестве примера клинического события. Это качество можно дополнительно квантировать с помощью логарифмического рангового критерия, который вычисляет вероятность (значение р), при котором две функции выживания равны.

Для стратификации пациентов по степени риска, в качестве примера используется следующий алгоритм: пациенты, у которых MPS меньше -0,1, коррелируют с вероятностью высокой активности пути ER и, таким образом, обозначены, как имеющие низкий риск рецидива, тогда как MPS больше +0,1 связан высокой активностью с высокого риска пути Wnt и/или пути НН и, таким образом, коррелирует с высоким риском рецидива. Пациенты с МПС между -0.1 и +0.1 классифицируются как имеющие промежуточный риск развития рецидива, поскольку эта группа включает пациентов с активным путем с низкий риском, таким как путь ER, а также активацию сигнальных путей с высоким риском, таких как Wnt или НН, либо пациентов, у которых отсутствуют пути, относительно которых был сделан вывод о том, что они могут запустить рост опухоли. Пороги -0,1 и +0,1 основаны на анализе распределения оценок MPS, полученных из нескольких баз данных, включающих 1294 различных пациентов с раком молочной железы, опубликованных в базах данных Gene Expression Omnibus (GSE6532, GSE9195, GSE20685, GSE20685 и GSE21653; см. http://www.ncbi.nlm.nih.gov/geo/, дата последнего обращения - 13 февраля 2013) и ArrayExpress (Е-MTAB-365, см. http://www.ebi.ac.uk/arrayexpress/experiments/, дата последнего обращения - 13 февраля 2013), как можно видеть на фиг. 1.

В качестве контрольного теста использовали активности отдельных путей и тест Oncotype DX® для рака молочной железы из Genomic Health, в отношении которого было показано, что он является хорошим прогностическим фактором рецидива и согласуется с другими прогностическими факторами для рака молочной железы, основанными на экспрессии генов. Тест Oncotype DX® выдает оценку риска или рецидива (RS) в интервале от 0 до 100, которая рассчитывается на основании комбинации уровней экспрессии, измеренных для панели генов. RS оптимизирован по отношению к 10-летней выживаемости пациентов с раком молочной железы без метастазов в лимфоузлах при положительном ER, отрицательном HER2 (окрашивания белка или FISH) (см. Paik, S., et al.: “A multi-gene assay to predict recurrence of Tamoxifen-treated, node-negative breast cancer,” The New England Journal of Medicine, 351(27), (2004), стр. 2817-2826; Fan, C., et al.: “Concordance among gene-expression-based predictors for breast cancer,” The New England Journal of Medicine, 355(6), (2006), стр. 560-569). RS рассчитывали, используя данные экспрессии, полученные на микрочипах, представленные в упомянутых выше базах данных, в соответствии с процедурой, опубликованной Fan et al. (см. Fan, C., et al. (2006)), и пациентов затем делили на пациентов с низким риском, промежуточным риском и высоким риском в соответствии с алгоритмом стратификации риска Oncotype DX®.

Результаты

(i) Данные по Erasmus

Все 204 пациента в группе GSE12276, полученной из базы данных Gene Expression Omnibus (см. http://www.ncbi.nlm.nih.gov/geo/, дата последнего обращения 13 февраля 2013), имели рецидив (медиана времени до рецидива: 21 месяц, диапазон: 0-115 месяцев), что делает ее хорошим набором данных для изучения прогностической ценности оценки активности пути и полученной из нее MPS относительно риска рецидива с тем, чтобы определить возможность отделения случаев ранних рецидивов от случаев поздних рецидивов.

Одномерные модели пропорциональных рисков Кокса были подстроены с применением путей Wnt, ER, HH и AR, а также нормированных значений (т.е., значений между 0 и 1) для RS и MPS, см. таблицу 12 ниже. Одномерный анализ показывает, что как RS, так и MPS имеют уровень риска значительно превышающее 1, в то время как PER имеет уровень риска значительно ниже 1. Многомерный анализ, который включает в себя комбинацию RS либо с PER, либо с MPS, дает в результате два важных прогностических фактора (р<0,05). При этом комбинация MPS и PER приводит к потере значимости одного из прогностических факторов (MPS: р>0,05), что объясняется тем, что PER также является элементом степени для множества путей. Следовательно, многомерный анализ с использованием RS, MPS и PER также нелогичен.

Таблица 12 Пропорциональные уровни риска Кокса для всех пациентов в GSE12276 HR HR 95% CI p Одномерный RS (нормализованный) 2,66 1,81 3,93 <0,01 PWnt 1,18 0,79 1,77 0,21 PER 0,42 0,28 0,64 <0,01 PHH 0,78 0,51 1,21 0,14 PAR 0,98 0,46 2,06 0,48 MPS (нормализованный) 2,09 1,26 3,47 <0,01 Многомерный RS (нормализованный) 2,50 1,68 3,72 <0,01 MPS (нормализованный) 1,66 0,98 2,80 0,03 Многомерный RS (нормализованный) 2,18 1,41 3,35 <0,01 PER 0,61 0,39 0,96 0,017 Многомерный MPS (нормализованный) 0,87 0,40 1,86 0,35 PER 0,39 0,22 0,71 <0,01 Многомерный RS (нормализованный) 2,22 1,43 3,46 <0,01 MPS (нормализованный) 1,18 0,54 2,58 0,34 PER 0,68 0,35 1,31 0,12

В заключение, одномерный анализ показал, что оценка возникновения рецидивов (RS) по Oncotype DX® из Genomic Health имеет более сильную предсказательную мощность в отношении рецидива, чем основанные на пути прогностические факторы PWnt, PHH и PAR, что не является неожиданным, поскольку RS был специально оптимизирован для прогнозирования рецидива, в то время как PWnt, PHH и PAR нацелены на предсказание активности пути. Тем не менее, PER и полученный из него MPS в комбинации с PWnt и PHH также являются сильными, значимыми прогностическими факторами возникновения рецидива. При этом, объединение RS либо с PER, либо с MPS приводит к улучшенной стратификации рисков, превосходящей отдельные прогностические факторы (незначимые, p≈0,14). К тому же, это также означает, что оценка возникновения рецидивов по Oncotype DX® (RS) и степень для множества путей (MPS) являются взаимодополняющими прогностическими факторами рецидива, и обе рассматривают различные механизмы, лежащие в основе роста опухолей.

Принимая во внимание то, что только 71 пациентов оказались пригодными для проведения теста Oncotype DX® на рак молочной железы (т.е., пациенты, которые были ER положительными с отсутствием метастазов в лимфатических узлах с неизвестным статусом HER2) из того же набора данных, было отмечено, что RS и PER остаются по-прежнему сильными прогностическими факторами возникновения рецидива (р<0,05); см. таблицу 13 ниже. С другой стороны, следует отметить, что MPS больше не является значимым прогностическим фактором, что, скорее всего, является результатом более однородной группы пациентов (только с несколькими Wnt- и HH-активными опухолями). Поразительным оказалось то, что самым сильным прогностическим фактором в прогнозе рецидива у ER положительных (окрашивание белка) пациентов без метастазов в лимфатических узлах является PER, а не оценка рецидива по Oncotype DX® (RS).

Таблица 13 Пропорциональные уровни риска Кокса для ER положительных пациентов без метастазов в лимфатических узлах в GSE12276 HR HR 95% CI p Одномерный RS (нормализованный) 1,78 0,98 3,26 0,03 PWnt 0,54 0,25 1,17 0,058 PER 0,48 0,26 0,89 <0,01 PHH 0,68 0,32 1,44 0,16 PAR 1,40 0,35 5,69 0,32 MPS (нормализованный) 1,59 0,68 3,68 0,14 Многомерный RS (нормализованный) 1,19 0,55 2,60 0,33 PER 0,54 0,25 1,17 0,060

(ii) Клинические данные Гая (Guy)

Набор данных GSE12276 Erasmus имеет уклон в сторону рецидива, поскольку он включает только пациентов с рецидивами, возникшими при последующем наблюдении. Для изучения прогностической ценности предсказаний на основании пути были использованы более релевантные, с клинической точки зрения, наборы пациентов, которые получены в клинике Гая: GSE6532 и GSE9195 (в общей сложности, 164 пациента). Пациенты в этих наборах данных были диагностированы как имеющие положительную опухоль ER и после операции получали адъюванту гормональную терапию в течение 5 лет.

Прямое сравнение оценки рецидива (RS) по Oncotype DX® с MPS (см. таблицу 14) показывает, что оба теста примерно одинаково хорошо предсказывают риск возникновения рецидива (HR: 4,41 (1,93-10,091) против 6,43 (1,66-24,90)). Предсказательная мощность обоих тестов остается значимой и после объединения в многомерном анализе. Это подтверждает результаты, полученные в наборе данных Erasmus GSE12276; оценка возникновения рецидивов (RS), полученная в результате теста Oncotype DX® для рака молочной железы, и MPS являются взаимодополняющими прогностическими факторами возникновения рецидива и оба рассматривают различные механизмы, лежащие в основе роста опухоли. Объединение этих двух тестов дополнительно улучшает прогноз безрецидивной выживаемости, как можно видеть на Фиг.2 (обратите внимание, что на Фиг.2.А показан срез из Фиг.2.В, увеличенный по оси времени) и ниже в таблице 14.

Таблица 14 Пропорциональные уровни риска Кокса для всех пациентов в GSE6532 и GSE9195 HR HR 95% CI p Одномерный RS (нормализованный) 4,41 1,93 10,09 <0,01 MPS (нормализованный) 6,43 1,66 24,90 <0,01 Многомерный RS (нормализованный) 3,99 1,71 9,29 <0,01 MPS 4,57 1,19 17,47 0,026

(iii) Данные Cartes d’Identité des Tumeurs

Чтобы продемонстрировать, что MPS также применим для всей популяции пациентов с первичным раком молочной железы, например, базальными видами HER2-амплифицируемого рака молочной железы, он был применен к другому набору образцов пациентов (n=537, ER +/-, HER +/-, PGR +/-, другой степени, и т.д., средняя продолжительность наблюдения 65±(SD), 40 месяцев), полученному из общедоступной базы данных E-MTAB-365 через ArrayExpress. Это привело к хорошему разделению по выживаемости при высоком риске и промежуточном риске по сравнению с пациентами с низким риском (как при р<0,01), как можно видеть на фиг.3 (обратите внимание, что на фиг.3.A показан срез из фиг.3.B, увеличенный по оси времени), и HR, равный 2,72 (1,25-5,92, p<0,01).

(iv) Данные из онкоцентра Koo Foundation Sun-Yat-Sen

MPS был протестирован на другой когорте пациентов, состоящей из другой группы пациентов, больных раком молочной железы (n=327, GSE20685, ER+/-, HER +/-, PGR +/-, с метастазами и без и т.д.). Это привело к HR, равном 3,53 (1,34-9,30, р<0,01) и хорошему разделению на группы пациентов с низким, промежуточным и высоким рисками, см. Фиг.4 (обратите внимание, что на Фиг.4.A показан срез Фиг.4.В, увеличенный по оси времени).

(v) Данные, полученные из института Institut Paoli-Calmattes

Следующий прогностический фактор рецидива MPS был применен к группе, состоящей из 266 пациентов с раком молочной железы, которые были прооперированы в Институте Paoli-Calmattes. У пациентов наблюдался разный набор видов рака молочной железы: ER+/-, HER +/-, PGR +/-, с метастазами и без, степени 1/2/3, KI67 +/- и P53 +/-. Микрочипы этих образцов общедоступны в виде набора данных GSE21653. HR MPS было значимым при 2,8 (1,20-6,51, р<0,01), причем разделение риска на кривых выживаемости Каплана-Мейера с низким риском и высоким риском было также значимым (р = 0,017), Фиг.5 (обратите внимание, что на Фиг.5.A показан срез Фиг.5.В, увеличенный по оси времени).

Пример 3. Разработка анализа

Вместо применения, например, упомянутых байесовской или (псевдо)линейной моделей, ко входным данным мРНК, полученным из микрочипов или секвенирования РНК, в клинической практике может оказаться полезной разработка специального анализа для выполнения измерений образцов, например, на интегрированной платформе с применением количественной ПЦР для определения уровня мРНК целевых генов, которые являются частью MPS. Последовательности РНК/ДНК раскрытых целевых генов можно затем использовать для определения того, какие праймеры и пробы выбрать на такой платформы.

Проверка такого специализированного анализа MPS может быть выполнена с помощью байесовской или (псевдо)линейной модели, основанной на микрочипах, используемой в качестве референсной модели, чтобы оценить, дает ли разработанный анализ аналогичные результаты на проверочной выборке. Далее специализированный анализ также может быть разработан для создания и калибровки аналогичной байесовской или (псевдо)линейной модели, используя данные секвенирования мРНК в качестве входных измерений.

Пример 4. Применение CDS

Ссылаясь на фиг.6 (схематично показывающую систему поддержки принятия клинических решений (CDS), выполненную с возможностью определения степени риска, который указывает на риск возникновения клинического события в течение определенного промежутка времени, как описано в настоящем документе), система 10 поддержки принятия клинических решений (CDS) реализована в виде соответствующим образом сконфигурированного компьютера 12. Компьютер 12 может быть сконфигурирован для работы в качестве системы 10 CDS путем выполнения соответствующей программы, блоков программы или других инструкций, хранящихся на не меняющаяся во времени среда (не показан), такая как жесткий диск или другая магнитная запоминающая среда, оптический диск или другая оптическая запоминающая среда, запоминающее устройство с произвольным доступом (RAM), постоянное запоминающее устройство (ROM), флэш-память или другая электронная запоминающая среда, сетевой сервер или т.п.Хотя иллюстративная система 10 CDS реализована на иллюстративном компьютере 12, в более общем случае система CDS может быть реализована с помощью цифрового процессорного устройства или устройства, содержащего цифровой процессор, сконфигурированный с возможностью выполнения методов поддержки принятия клинических решений, как изложено в настоящем описании. Например, цифровое процессорное устройство может представлять собой мобильное устройство (например, персональный электронный помощник или смартфон, исполняющий приложения CDS), ноутбук, настольный компьютер, планшетный компьютер или устройство, удаленный сервер или так далее. Компьютер 12 или другое цифровое процессорное устройство обычно включает в себя или соединено в рабочем состоянии с устройством 14 отображения, на котором для медицинского персонала отображается информация, содержащая рекомендации по принятию клинических решений. Компьютер 12 или другое цифровое процессорное устройство также обычно включает в себя или соединено в рабочем состоянии с одним или несколькими устройствами ввода пользовательских данных, например, иллюстративной клавиатурой 16 или мышью, трекболом, сенсорной панелью, сенсорным экраном (возможно интегрированным с устройством 14 отображения), или другим устройством ввода указательного типа, с помощью которого медицинский персонал может вводить информацию, такую как операционные команды для управления системой 10 CDS, данные для использования в системе 10 CDS и т.д.

Система CDS 10 принимает в качестве входной информации, относящейся к субъекту (например, пациент лежит в больнице или проходит амбулаторное лечение у онколога, врача или другого медицинского персонала, или пациент проходит обследование на наличие рака или для постановки какого-либо другого медицинского диагноза, который известен, или диагноза на подозрение на определенный тип рака, такой как рак толстой кишки, рак молочной железы или рак печени, или т.п.). В системе 10 CDS применяются различные алгоритмы анализа данных такой входной информации для получения рекомендаций для принятия клинических решений, которые предоставляются медицинскому персоналу через устройство 14 отображения (или с помощью синтезатора голоса или другого устройства, предоставляющего воспринимаемые человеком выходные данные). В некоторых вариантах осуществления эти алгоритмы могут включать применение клинических рекомендаций к пациенту. Клинические рекомендации представляют собой хранящийся набор стандартных или "канонических" рекомендаций по лечению, как правило, созданный на основе рекомендаций группы медицинских экспертов и, возможно, отформатированный в виде клинической "блок-схемы", для облегчения навигации по клиническим рекомендациям. В различных вариантах осуществления алгоритмы обработки данных CDS 10 могут дополнительно или альтернативно включать в себя различные алгоритмы диагностических или клинических испытаний, которые выполняются на входной информации для извлечения рекомендаций по принятию клинических решений, такие как методы машинного обучения, раскрытые здесь.

В раскрытых здесь иллюстративных системах CDS (например, системе 10 CDS) алгоритмы анализа данных CDS включают в себя один или более алгоритмов диагностических или клинических испытаний, которые выполняются на входной геномной и/или протеомной информации, полученной из одной или нескольких медицинских лабораторий 18. Эти лаборатории могут быть располагаться различным образом "на месте", то есть, в больнице или в другом месте, где субъект проходит медицинское обследование и/или лечение, или "за пределами", например, специализированные и централизованные лаборатории, которые принимают (по почте или используя другие службы доставки) образцы ткани и/или клеток, и/или жидкости организма субъекта, полученные от субъекта (например, образец, полученный из пораженного раком участка или из участка с подозрением на наличие рака, или из метастатической опухоли, или из полости тела, жидкость которого заражена раковыми клетками (например, плевральной или брюшной полости или полости мочевого пузыря), или из других жидкостей организма, содержащих раковые клетки, и т.д., предпочтительно с помощью биопсии или другой процедуры извлечения образца). Клетки, из которых был извлечен образец также могут быть опухолевыми клетками из гематологических злокачественных опухолей (таких как лейкемия или лимфома). В некоторых случаях образец клеток также может представлять собой циркулирующие опухолевые клетки, т.е., опухолевые клетки, которые могут попадать в кровоток и могут быть извлечены с помощью подходящего способа выделения, например, с помощью афереза или обычного забора крови из вены. Помимо крови, жидкость организма, из которой извлекают образец, может представлять собой мочу, содержимое желудочно-кишечного тракта или экссудат.

Извлеченный образец обрабатывается в лаборатории для получения геномной или протеомной информации. Например, извлеченный образец может быть обработан с помощью микрочипа (также называемого в данной области техники как генный чип, ДНК чип, биочип или т.п.) или путем обработки методом количественной полимеразной цепной реакции (кПЦР) для измерения доказательной геномной или протеомной информации, такой как уровни экспрессии представляющих интерес генов, например, в виде уровня матричной рибонуклеиновой кислоты (мРНК), которая транскрибируется с гена, или в виде уровня белка, который транслируется с мРНК, транскрибируемой с гена. В качестве другого примера, извлеченный образец может быть обработан в лаборатории путем секвенирования гена для получения последовательностей дезоксирибонуклеиновой кислоты (ДНК), или получения последовательности РНК, вариации количества копий, метилирования т.п.Другие рассматриваемые подходы измерения включают иммуногистохимию (IHC), цитологическое исследование, флуоресценцию гибридизации in situ (FISH), метод близкого лигирования т.д., выполняемые на слайде с патологией. Другая информация, которая может быть получена путем обработки микрочипов, с помощью масс-спектрометрии, секвенирования генов или других лабораторных методов исследования, включает в себя информацию о метилировании. Также возможны различные комбинации таких геномных и/или протеомных измерений.

В некоторых вариантах осуществления медицинские лаборатории 18 выполняют ряд стандартных методов сбора данных из извлеченного образца ткани и/или клеток и/или жидкости организма субъекта для получения большого количества геномных и/или протеомных данных. Например, методы сбора стандартизованных данных могут генерировать (необязательно выровненную) последовательность ДНК одной или нескольких хромосом или хромосомных участков, или всего генома ткани и/или клеток и/или жидкости организма. Применение стандартного микрочипа позволяет получить тысячи или десятки тысяч элементов данных, таких как уровень экспрессии для большого числа генов, различные данные по метилированию и т.д. Аналогично, для измерения уровня экспрессии выбранных генов можно использовать измерения, основанные на ПЦР. Это множество геномных и/или протеомных данных, или выбранных групп этих данных вводятся в систему 10 CDS для обработки с тем, чтобы разработать клинически полезную информацию для составления рекомендаций для принятия клинических решений.

Раскрытые системы CDS и связанные с ними способы относятся к обработке геномных и/или протеомных данных для оценки активности различных клеточных сигнальных путей и определения степени риска, которая указывает на риск возникновения клинического события (например, рака) в течение определенного промежутка время. Тем не менее, следует понимать, что раскрытые системы CDS (например, система 10 CDS) необязательно могут дополнительно включать в себя различные дополнительные возможности, такие как создание рекомендаций для принятия клинических решений в соответствии с сохраненным клиническим руководством, основанным на различных данных о пациенте, таких как данные мониторинга жизненно важных показателей, данные анамнеза, демографические данные пациента (например, пол, возраст и т.д.), данные пациента по медицинской визуализации и т.д. Альтернативно, в некоторых вариантах осуществления возможности системы 10 CDS могут быть ограничены только выполнением анализа геномных и/или протеомных данных для оценки активности клеточных сигнальных путей и определения степени риска, который указывает на риск возникновения клинического события (например, рак) в течение определенного промежутка времени, как описано здесь.

Вновь ссылаясь на пример, показанный на Фиг.6, система 10 CDS делает вывод об активности 22 двух или более клеточных сигнальных путей, в данном случае пути Wnt, пути ER и пути HH, в ткани и/или клетках и/или жидкости организма субъекта, исходя из, по меньшей мере, без ограничения, уровней 20 экспрессии одного или более целевых генов клеточных сигнальных путей, измеренных в извлеченном образце ткани и/или клеток, и/или жидкости организма субъекта. Описанные здесь примеры относятся к путям Wnt, ER, AR и НН, приведенным в качестве иллюстративных клеточных сигнальных путей. Эти пути представляют интерес в различных областях онкологии, поскольку потеря регуляции этих путей может быть причиной развития рака. Существует около 10-15 релевантных сигнальные путей, и каждый вид рака возникает в результате нарушения регуляции, по меньшей мере, одного доминантного пути. Не ограничиваясь какой-либо конкретной теорией, эти пути регулируют клеточную пролиферацию, и, как следствие, потеря регуляции этих путей в раковых клетках может привести к тому, что путь будет "всегда" иметь повышенную активность, таким образом, ускоряя пролиферацию раковых клеток, что, в свою очередь, проявится как рост, инвазия или метастазирование (распространение) рака.

Измерение уровней экспрессии мРНК для генов, кодирующих регуляторные белки клеточного сигнального пути, такие как промежуточный белок, который является частью каскада белков, формирующего клеточный сигнальный путь, является косвенной мерой уровня экспрессии регуляторного белка и может сильно коррелировать или не коррелировать с фактическим уровнем экспрессии регуляторного белка (что проявляется в значительно меньшей степени в отношении общей активности клеточного сигнального пути). Клеточный сигнальный путь непосредственно регулирует транскрипцию целевых генов, следовательно, уровни экспрессии мРНК, транскрибированной с целевых генов, являются прямым результатом такой регуляторной активности. Таким образом, система 10 CDS делает вывод об активности двух или более клеточных сигнальных путей (в данном случае пути Wnt, пути ER и пути HH) на основе, по меньшей мере, уровней экспрессии одного или нескольких целевых генов (уровня мРНК или белка в качестве суррогатного измерения) этих клеточных сигнальных путей. Это гарантирует, что система 10 CDS делает вывод об активности пути, основываясь на непосредственной информации, предоставленной измеренными уровнями экспрессии целевого(ых) гена(ов).

Выведенные активности, в этом примере, PWnt, PER и PHH, т.е. выведенные активности пути Wnt, пути ER и пути HH, затем используются для определения 24 степени риска, который указывает на риск возникновения клинического события, в этом примере рака, в частности рака молочной железы, в течение определенного промежутка времени, о чем подробно описано в настоящей заявке. Степень риска основана, по меньшей мере, частично, на комбинации выведенных активностей. Например, степень риска может быть "Степенью множества путей" (MPS) вычисленной согласно тому, как подробно описано со ссылкой на уравнение (7).

На основании определенной MPS, система 10 CDS, в этом примере, определяет 26 субъекта, по меньшей мере, в одну из множества групп риска, связанных с различными указанными рисками возникновения клинического события в течение определенного промежутка времени, и/или принимает решение 28 о лечении, рекомендованном для пациента, основываясь, по меньшей мере, частично, на указанном риске возникновения клинического события в течение определенного промежутка времени.

Определение MPS и/или классификация риска для конкретного пациента по системе CDS или независимая реализация MPS и классификация рисков, как описано в данном документе, позволяет онкологу, врачу или другому медицинскому персоналу, принимающему участие в постановке диагноза или в лечении, или мониторинге/наблюдении пациента адаптировать лечение с тем, чтобы улучшить шансы пациента на долгосрочное выживание, при этом сведя к минимуму развитие нежелательных побочных эффектов, особенно эффектов, вызванных агрессивной химиотерапией и/или таргетной терапией и/или иммунотерапией и/или лучевой терапией и/или хирургическим вмешательством. Таким образом, например, больные с низким риском рецидива рака, т.е., больные с низким MPS и/или классифицированные как имеющие низкий риск, согласно алгоритму стратификации риска, как описано в настоящем документе, в настоящее время, как правило, проходят курс лечения только на основе гормональной терапии или комбинации гормональной терапии, например, антиэстрогеном и/или ингибиторами ароматазы, и менее токсичного химиотерапевтического агента. С другой стороны, пациенты с промежуточным или высоким риском рецидива рака, то есть пациенты с MPS от среднего до высоких значений и/или классифицированные как имеющие промежуточный или высокий риск, согласно алгоритму стратификации риска, как описано в настоящем документе, в настоящее время, как правило, проходят курс лечения с применением более агрессивной химиотерапии, например, режимы терапии на основе антрациклина и/или таксана. Кроме того, MPS, возможно, в комбинации с результатами других тестов, полученными для пациента, такими как PER, PWnt, PHH, PAR и/или другого прогностического (например, дополняющего диагностического) теста, может улучшить процесс принятия решения относительно лечения пациента с использованием целевых средств, таких как тамоксифен, трастузумаб, бевацизумаб и/или других лекарственных препаратов (например иммунотерапии), которые в настоящее время не являются частью основного протокола лечения конкретного рака у пациента и/или других вариантов лечения, таких как лучевая терапия, например брахитерапии и/или другого времени лечения, например, до и/или после первичного лечения.

Следует отметить, что вместо непосредственного использования определенной оценки риска (MPS) в качестве показателя риска возникновения клинического события (например, рака) в течение определенного промежутка времени, можно сконфигурировать систему 10 CDS таким образом, чтобы она объединяла степень риска и/или, по меньшей мере, одну из выведенных активностей с оценкой одной или нескольких дополнительных степеней риска, полученных из одного или нескольких дополнительных прогностических тестов для получения объединенной степени риска, где объединенная степень риска показывает риск возникновения клинического события в течение определенного промежутка времени. Один или несколько дополнительных прогностических тестов могут содержать, в частности, тест Oncotype DX® для рака молочной железы, тест Mammostrat® для рака молочной железы, тест MammaPrint® для рака молочной железы, тест BluePrintTM для рака молочной железы, тест CompanDx® для рака молочной железы, тест IndexSM (HOXB13/IL17BR) для рака молочной железы, тест OncotypeDX® для рака толстой кишки и/или пролиферативный тест, выполняемый для измерения экспрессии гена/белка Ki67.

Пример 5. Набор и инструменты анализа для определения степени риска

Набор целевых генов, которые, как было найдено, лучше всего указывают на активность конкретного пути с использованием микрочипа/анализа секвенирования РНК, используя, например, байесовский модель или (псевдо)линейную модель, может быть переведен, например, в мультиплексный количественный ПЦР анализ или специализированные биочипы, предназначенные для ткани, клеток или образца жидкости организма. Выбор последовательности гена, как описано здесь, может быть использован для выбора, например, набора проб-праймеров для ПЦР в реальном времени или олигонуклеотидов для разработки микрочипов. Для разработки такого одобренного FDA теста на активность пути и определение степени риска, требуется разработка стандартизированного набора тестов, который должен быть клинически подтвержден в клинических испытаниях для получения одобрения регулирующих органов.

Пример 6. Сравнение степеней риска

На Фиг.7 показан график, демонстрирующий результаты экспериментов, содержащих две степени риска, определенные разными способами. В частности, первая степень риска (MPS) была рассчитана в соответствии с уравнением (8), а вторая степень риска была рассчитана в соответствии с уравнением (7). Первая степень риска был оптимизирована для образцов рака молочной железы путем присвоения логарифмов уровней риска, определенных на образцах рака молочной железы (GSE6532 и GSE9195), которые дали в результате следующие значения: α=log(1/0,36), β=log(3,67) и γ=log(2,29). Значения α и β второй степени риска были выбраны в качестве примера равными 1. Эксперимент проводили на наборах данных GSE21653, GSE20685 и Е-TABM-365 и определяли долю больных, у которых наблюдали рецидив через 10 лет после включения (отбора проб) в виде функции соответствующей степени риска (где степени риска масштабировали таким образом, чтобы их легко можно было сравнить). Всего в полученном списке было 1130 пациентов среди которых 1005 пациентов имели полный комплект данных по выживанию. Пунктирная кривая показывает результаты для первой степени риска, рассчитанной по уравнению (8), а сплошная кривая показывает результаты для второй степени риска, рассчитанной по уравнению (7).

На этих графиках видно, что вторая степень риска, вычисленная по уравнению (7) (сплошная кривая), дает монотонно возрастающий риск, а первая степень риска, вычисленная по уравнению (8) (пунктирная кривая), является ровной при высоких степенях риска (даже кажется, что слегка падает вниз). Это означает, что на верхнем конце первой степени риска, вычисленной по уравнению (8), нельзя определить риск пациента, в то время как используя вторую степень риска, вычисленную по уравнению (7), риск постоянно увеличивается с увеличением степени риска.

Кроме того, на графике также видно, что вторая степень риска, вычисленная по уравнению (7) (сплошная кривая), позволяет лучше распознать пациентов с высоким риском (0,84 против 0,78), но также обеспечивает более точное определение пациентов с низким уровнем риска (0,43 против 0,45), чем в случае первой степени риска, вычисленной по уравнению (8) (пунктирная кривая).

В общем случае, очевидно, что хотя примеры, относящиеся к пути Wnt, пути ER, пути AR и/или пути HH, предусмотрены в качестве иллюстративных примеров, описанные здесь подходы для анализа клеточных сигнальных путей могут быть легко применены к другим клеточным сигнальным путям, помимо указанных путей, например, для путей межклеточной передачи сигналов с рецепторами в клеточной мембране и путей внутриклеточной передачи сигналов с рецепторами внутри клетки. Дополнительно: В настоящей заявке описано несколько предпочтительных вариантов. После прочтения и осмысления предшествующего подробного описания специалисты могут признать наличие возможности для модификаций и изменений. Предполагается, что настоящая заявка включает все такие модификации и изменения в той части, в которой они входят в объем прилагаемой формулы изобретения или ее эквивалентов.

Изучив чертежи, описание и прилагаемую формулу изобретения, специалисты в данной области смогут понять и осуществить на практике другие модификации описанных вариантов осуществления описанного в заявке изобретения.

В формуле изобретения слово “содержит” не исключает другие элементы и стадии, а формы единственного числа не исключают множественное число.

Один блок или устройство может выполнять функции нескольких блоков, указанных в формуле изобретения. Сам факт того, что определенные меры перечислены в различных взаимно зависящих пунктах не указывает на то, что сочетание этих мер нельзя использовать для получения преимуществ.

Вычисления, подобные определению степени риска, выполненные одним или несколькими блоками или устройствами, могут быть выполнены любым другим количеством блоков или устройств.

Компьютерная программа может храниться/распространяться на подходящий носитель, такой как оптический носитель или твердотельный носитель, поставляемый вместе с или как часть другого аппаратного средства, но также может распространяться в других формах, таких как через Интернет или другие проводные или беспроводные телекоммуникационные системы.

Любые ссылки в формуле изобретения не следует толковать как ограничение объема.

Настоящая заявка относится в основном к конкретному способу определения оценки риска, которая указывает на риск возникновения клинического события в течение определенного промежутка времени, причем степень риска основана, по меньшей мере, частично, на комбинации выведенных активностей двух или более клеточных сигнальных путей в ткани и/или клетках и/или жидкости организма субъекта. Настоящая заявка также относится к устройству, содержащему цифровой процессор, сконфигурированный для выполнения таких методов, не меняющийся во времени запоминающей среде, хранящей инструкции, которые исполняются цифровым процессорным устройством для выполнения таких методов, и к компьютерной программе, содержащей средство программного кода для обеспечения осуществления цифровым процессорным устройством таких методов.

Литература:

de Sousa E Melo F, C. S. (2011). Methylation of cancer-stem-cell-associated Wnt target genes predicts poor prognosis in colorectal cancer patients. Cell Stem Cell., 476-485.

Hatzis P, v. d. (2008). Genome-wide pattern of TCF7L2/TCF4 chromatin occupancy in colorectal cancer cells. Mol Cell Biol., 2732-2744.

Nusse, R. (2012, May 1). Wnt target genes. Retrieved from The Wnt homepage: http://www.stanford.edu/group/nusselab/cgi-bin/wnt/target_genes.

Söderberg O, G. M. (2006). Direct observation of individual endogenous protein complexes in situ by proximity ligation. Nat Methods., 995-1000

van de Wetering M, S. E.-P.-F. (2002). The beta-catenin/TCF-4 complex imposes a crypt progenitor phenotype on colorectal cancer cells. Cell, 241-250.

Похожие патенты RU2718647C2

название год авторы номер документа
ОЦЕНКА АКТИВНОСТИ ПУТЕЙ КЛЕТОЧНОЙ СИГНАЛИЗАЦИИ С ПОМОЩЬЮ ЛИНЕЙНОЙ КОМБИНАЦИИ(ИЙ) ЭКСПРЕССИЙ ГЕНОВ-МИШЕНЕЙ 2013
  • Ван Ойен Хендрик Ян
  • Верхаг Вильхельмус Франсискус Йоханнес
  • Ван Де Вил Пауль Арнольд
RU2721130C2
УСОВЕРШЕНСТВОВАННАЯ СТРАТИФИКАЦИЯ ПАЦИЕНТОВ ДЛЯ ОЦЕНКИ ПРИГОДНОСТИ ТЕРАПИИ 2015
  • Хальтер Дэвид
  • Вимбергер-Фридль Райнхольд
  • Ван Де Стольпе Аня
  • Ван Хемерт Фрек
  • Дам-Де Вен Геске Кристина
RU2711452C2
ОЦЕНКА АКТИВНОСТИ КЛЕТОЧНЫХ СИГНАЛЬНЫХ ПУТЕЙ С ПРИМЕНЕНИЕМ ВЕРОЯТНОСТНОГО МОДЕЛИРОВАНИЯ ЭКСПРЕССИИ ЦЕЛЕВЫХ ГЕНОВ 2012
  • Верхаг Вильхельмус Франсискус Йоханнес
  • Ван Де Стольпе Аня
  • Ван Ойен Хендрик Ян
  • Дулла Кальяна Чакравартхи
  • Алвес Де Инда Марсия
  • Хоффманн Ральф
RU2719194C2
ОТБОР БОЛЬНЫХ РАКОМ ДЛЯ ВВЕДЕНИЯ ИНГИБИТОРОВ СИГНАЛЬНОГО ПУТИ Wnt НА ОСНОВАНИИ СТАТУСА МУТАЦИИ RNF43 2013
  • Цун Фэн
  • Хао Хуайсян
  • Хсиех Хсин-И
  • Цзян Сяомо
  • Лю Цзюнь
  • Нг Николас
RU2636000C2
БИОМАРКЕРЫ СТАРЕНИЯ СЕРДЦА И СПОСОБЫ ИХ ПРИМЕНЕНИЯ 2010
  • Ли Цюинхун
RU2562174C2
СПОСОБЫ ПРОГНОЗИРОВАНИЯ РАКА ПРЕДСТАТЕЛЬНОЙ ЖЕЛЕЗЫ 2016
  • Хоффманн Ральф
  • Ден Бизен-Тиммерманс Эвелин
  • Ван Стрейп Дианне Арнольдина Маргарета Вильхельмина
  • Ван Брюссел Анна Годефрида Катарина
  • Алвес Де Инда Марсия
  • Вробел Яннеке
  • Ван Зон Йоаннес Баптист Адрианус Дионисиус
RU2760577C2
СПОСОБЫ И ФАРМАЦЕВТИЧЕСКИЕ КОМПОЗИЦИИ ДЛЯ ЛЕЧЕНИЯ РАКА ПОЧКИ 2017
  • Зигфрид, Жеральдин
  • Хатиб, Абдель-Маджид
  • Хёпфнер, Жан-Люк
  • Эврар, Серж
RU2752322C2
ИММУННЫЕ КЛЕТКИ, ДЕФЕКТНЫЕ ПО Suv39h1 2018
  • Амигорена, Себастьян
  • Пьяджо, Эльяне
  • Гудо, Кристель
  • Паче, Луиджа
  • Алмузни, Женевьева
  • Ниборски, Летиция
RU2784531C2
МОНОКЛОНАЛЬНЫЕ АНТИТЕЛА ПРОТИВ КЛАУДИНА 1 ДЛЯ ПРОФИЛАКТИКИ И ЛЕЧЕНИЯ ГЕПАТОЦЕЛЛЮЛЯРНОЙ КАРЦИНОМЫ 2016
  • Баумерт Томас
  • Робине Эрик
  • Цайзель Мирьям
RU2770021C2
ОРГАНОИД ПЕЧЕНИ, ВАРИАНТЫ ЕГО ПРИМЕНЕНИЯ И СПОСОБ КУЛЬТИВИРОВАНИЯ ДЛЯ ЕГО ПОЛУЧЕНИЯ 2011
  • Уч Ортега Меритксель
  • Клеверс Йоханнес Каролус
RU2579995C2

Иллюстрации к изобретению RU 2 718 647 C2

Реферат патента 2020 года МЕДИЦИНСКИЙ ПРОГНОЗ И ПРЕДСКАЗАНИЕ РЕЗУЛЬТАТОВ ЛЕЧЕНИЯ, ИСПОЛЬЗУЯ АКТИВНОСТИ МНОЖЕСТВА КЛЕТОЧНЫХ СИГНАЛЬНЫХ ПУТЕЙ

Предложенная группа изобретений относится к области медицины, в частности к биоинформатике. Предложены способ, устройство и носитель долговременного хранения информации для определения степени риска, которая указывает на риск рецидива рака после лечения или риск прогрессирования рака или смерти, где степень риска основана на комбинации выведенных активностей двух или более клеточных сигнальных путей в ткани, и/или клетках, и/или жидкости организма субъекта. Клеточные сигнальные пути содержат путь Wnt, путь ER и/или путь HH. Степень риска определяется таким образом, что указанный риск возникновения клинического события в течение определенного промежутка времени уменьшается с увеличением PER и увеличивается с увеличением max(PWnt, PHH), где PER, PWnt и PHH означают выведенную активность пути ER, пути Wnt и пути HH соответственно. Предложенная группа изобретений позволяет эффективно определять степень риска рецидива рака после лечения, риска прогрессирования рака или смерти. 3 н. и 9 з.п. ф-лы, 7 ил., 14 табл., 6 пр.

Формула изобретения RU 2 718 647 C2

1. Способ определения степени риска, которая указывает на риск рецидива рака после лечения или риск прогрессирования рака или смерти, включающий:

вывод об активности двух или более клеточных сигнальных путей в ткани, и/или клетках, и/или жидкости организма субъекта, сделанный на основании по меньшей мере уровней экспрессии одного или более целевых генов, включая уровни мРНК или белка в качестве суррогатного измерения, указанных клеточных сигнальных путей, измеренных в извлеченном образце ткани, и/или клеток, и/или жидкости организма субъекта, и

определение степени риска, которая указывает на риск рецидива рака после лечения или риск прогрессирования рака или смерти, где степень риска основана, по меньшей мере частично, на комбинации выведенных активностей,

где клеточные сигнальные пути содержат путь Wnt, путь ER и/или путь HH,

где клеточные сигнальные пути содержат путь ER, путь Wnt и путь HH и где степень риска определяется таким образом, что указанный риск рецидива рака после лечения или риск прогрессирования рака или смерти уменьшается с увеличением PER и увеличивается с увеличением max(PWnt, PHH),

где PER, PWnt и PHH означают выведенную активность пути ER, пути Wnt и пути HH соответственно.

2. Способ по п.1, в котором комбинация выведенных активностей содержит выражение

-α · PER + β · max(PWnt, PHH),

где α и β представляют собой положительные постоянные масштабирующие коэффициенты, и указанный риск рецидива рака после лечения или риск прогрессирования рака или смерти монотонно увеличивается с увеличением значения экспрессии.

3. Способ по любому из пп.1 и 2, в котором вывод содержит:

вывод об активности пути Wnt в ткани, и/или клетках, и/или жидкости организма субъекта, сделанный на основании по меньшей мере уровней экспрессии одного или более, предпочтительно по меньшей мере трех целевых генов пути Wnt, измеренных в извлеченном образце ткани, и/или клетках, и/или жидкости организма субъекта, выбранных из группы, состоящей из KIAA1199, AXIN2, RNF43, TBX3, TDGF1, SOX9, ASCL2, IL8, SP5, ZNRF3, KLF6, CCND1, DEFA6 и FZD7,

и/или

вывод об активности пути ER в ткани, и/или клетках, и/или жидкости организма субъекта, сделанный на основании по меньшей мере уровней экспрессии одного или более, предпочтительно по меньшей мере трех целевых генов пути ER, измеренных в извлеченном образце ткани, и/или клетках, и/или жидкости организма субъекта, выбранных из группы, состоящей из GREB1, PGR, XBP1, CA12, SOD1, CTSD, IGFBP4, TFF1, SGK3, NRIP1, CELSR2, WISP2 и AP1B1,

и/или

вывод об активности пути HH в ткани, и/или клетках, и/или жидкости организма субъекта, сделанный на основании по меньшей мере уровней экспрессии одного или более, предпочтительно по меньшей мере трех целевых генов пути HH, измеренных в извлеченном образце ткани, и/или клетках, и/или жидкости организма субъекта, выбранных из группы, состоящей из GLI1, PTCH1, PTCH2, IGFBP6, SPP1, CCND2, FST, FOXL1, CFLAR, TSC22D1, RAB34, S100A9, S100A7, MYCN, FOXM1, GLI3, TCEA2, FYN и CTSL1.

4. Способ по п.3, в котором вывод дополнительно основан на:

уровнях экспрессии по меньшей мере одного целевого гена пути Wnt, измеренных в извлеченном образце ткани, и/или клеток, и/или жидкости организма субъекта, выбранного из группы, состоящей из NKD1, OAT, FAT1, LEF1, GLUL, REG1B, TCF7L2, COL18A1, BMP7, SLC1A2, ADRA2C, PPARG, DKK1, HNF1A и LECT2,

и/или

уровнях экспрессии по меньшей мере одного целевого гена пути ER, измеренных в извлеченном образце ткани, и/или клеток, и/или жидкости организма субъекта, выбранного из группы, состоящей из RARA, MYC, DSCAM, EBAG9, COX7A2L, ERBB2, PISD, KRT19, HSPB1, TRIM25, PTMA, COL18A1, CDH26, NDUFV3, PRDM15, ATP5J и ESR1,

и/или

уровнях экспрессии по меньшей мере одного целевого гена пути HH, измеренных в извлеченном образце ткани, и/или клеток, и/или жидкости организма субъекта, выбранного из группы, состоящей из BCL2, FOXA2, FOXF1, H19, HHIP, IL1R2, JAG2, JUP, MIF, MYLK, NKX2.2, NKX2.8, PITRM1 и TOM1.

5. Способ по п.1, дополнительно содержащий:

отнесение субъекта к по меньшей мере одной из множеств групп риска, связанных с разными указанными рисками рецидива рака после лечения или рисками прогрессирования рака или смерти,

и/или

принятие решения о лечении, рекомендуемом для субъекта на основании, по меньшей мере частично, указанном риске рецидива рака после лечения или риске прогрессирования рака или смерти.

6. Способ по п.1, содержащий:

вывод об активности пути Wnt в ткани, и/или клетках, и/или жидкости организма у субъекта, сделанный на основании по меньшей мере уровней экспрессии двух, трех или более целевых генов из набора целевых генов пути Wnt, измеренных в извлеченном образце ткани, и/или клеток, и/или жидкости организма субъекта,

и/или

вывод об активности пути ER в ткани, и/или клетках, и/или жидкости организма у субъекта, сделанный на основании по меньшей мере уровней экспрессии двух, трех или более целевых генов из набора целевых генов пути ER, измеренных в извлеченном образце ткани, и/или клеток, и/или жидкости организма субъекта,

и/или

вывод об активности пути HH в ткани, и/или клетках, и/или жидкости организма у субъекта, сделанный на основании по меньшей мере уровней экспрессии двух, трех или более целевых генов из набора целевых генов пути HH, измеренных в извлеченном образце ткани, и/или клеток, и/или жидкости организма субъекта.

7. Способ по п. 6, в котором

набор целевых генов пути Wnt включает по меньшей мере девять, предпочтительно по меньшей мере все целевые гены, выбранные из группы, состоящей из KIAA1199, AXIN2, RNF43, TBX3, TDGF1, SOX9, ASCL2, IL8, SP5, ZNRF3, KLF6, CCND1, DEFA6 и FZD7,

и/или

набор целевых генов пути ER включает по меньшей мере девять, предпочтительно по меньшей мере все целевые гены, выбранные из группы, состоящей из GREB1, PGR, XBP1, CA12, SOD1, CTSD, IGFBP4, TFF1, SGK3, NRIP1, CELSR2, WISP2 и AP1B1,

и/или

набор целевых генов пути HH включает по меньшей мере девять, предпочтительно по меньшей мере все целевые гены, выбранные из группы, состоящей из GLI1, PTCH1, PTCH2, IGFBP6, SPP1, CCND2, FST, FOXL1, CFLAR, TSC22D1, RAB34, S100A9, S100A7, MYCN, FOXM1, GLI3, TCEA2, FYN и CTSL1.

8. Способ по п. 7, в котором

набор целевых генов пути Wnt дополнительно включает по меньшей мере один целевой ген, выбранный из группы, состоящей из NKD1, OAT, FAT1, LEF1, GLUL, REG1B, TCF7L2, COL18A1, BMP7, SLC1A2, ADRA2C, PPARG, DKK1, HNF1A и LECT2,

и/или

набор целевых генов пути ER дополнительно включает по меньшей мере один целевой ген, выбранный из группы, состоящей из RARA, MYC, DSCAM, EBAG9, COX7A2L, ERBB2, PISD, KRT19, HSPB1, TRIM25, PTMA, COL18A1, CDH26, NDUFV3, PRDM15, ATP5J и ESR1,

и/или

набор целевых генов пути HH дополнительно включает по меньшей мере один целевой ген, выбранный из группы, состоящей из BCL2, FOXA2, FOXF1, H19, HHIP, IL1R2, JAG2, JUP, MIF, MYLK, NKX2.2, NKX2.8, PITRM1 и TOM1.

9. Способ по п.1, который дополнительно содержит объединение степени риска и/или по меньшей мере одной выведенной активности с одной или несколькими дополнительными степенями риска, полученными из одного или нескольких дополнительных прогностических тестов для получения объединенной степени риска, где объединенная степень риска указывает на риск рецидива рака после лечения или риск прогрессирования рака или смерти.

10. Способ по п.1, в котором клиническое событие представляет собой рак, в частности рак молочной железы.

11. Устройство для определения степени риска, которая указывает на риск рецидива рака после лечения или риск прогрессирования рака или смерти, содержащее цифровой процессор (12), выполненный с возможностью осуществления способа согласно любому одному из пп.1-10.

12. Носитель долговременного хранения информации для определения степени риска, которая указывает на риск рецидива рака после лечения или риск прогрессирования рака или смерти, где не меняющаяся во времени запоминающая среда хранит инструкции, которые могут исполняться цифровым процессорным устройством (12) для осуществления способа согласно любому одному из пп.1-10, где не меняющаяся во времени запоминающая среда выбрана из таких, как жесткий диск, оптический диск, запоминающее устройство с произвольным доступом (RAM), постоянное запоминающее устройство (ROM), флэш-память, сетевой сервер.

Документы, цитированные в отчете о поиске Патент 2020 года RU2718647C2

US 2011003707 A1, 06.01.2011
СПОСОБ ГЕНЕТИЧЕСКОЙ ДИАГНОСТИКИ ПОДВЕРЖЕННОСТИ К СЕРДЕЧНО-СОСУДИСТЫМ ЗАБОЛЕВАНИЯМ 2007
  • Гончарова Ирина Александровна
  • Макеева Оксана Алексеевна
  • Минайчева Лариса Ивановна
  • Пузырев Валерий Павлович
  • Степанов Вадим Анатольевич
RU2376372C2
WO 2013011479 A2, 24.01.2013
DEROO B.J
et al
Estrogen receptors and human disease
J Clin Invest
Пломбировальные щипцы 1923
  • Громов И.С.
SU2006A1

RU 2 718 647 C2

Авторы

Верхаг, Вильхельмус, Франсискус, Йоханнес

Ван Ойен, Хендрик, Ян

Ван Де Стольпе, Аня

Алвес Де Инда, Марсия

Даты

2020-04-10Публикация

2014-04-24Подача