ПЕРЕКРЕСТНАЯ ССЫЛКА НА РОДСТВЕННЫЕ ЗАЯВКИ
[1] Данная заявка испрашивает приоритет на основании предварительной заявки на патент США № 62/657727, поданной 14 апреля 2018 года; предварительной заявки на патент США № 62/669330, поданной 9 мая 2018 года; предварительной заявки на патент США № 62/693843, поданной 3 июля 2018 года; предварительной заявки на патент США № 62/715143, поданной 6 августа 2018 года; предварительной заявки на патент США № 62/746210, поданной 16 октября 2018 года; предварительной заявки на патент США № 62/777973, поданной 11 декабря 2018 года; предварительной заявки на патент США № 62/804566, поданной 12 февраля 2019 года. Каждая из указанных выше заявок полностью включена в настоящее описание посредством ссылки.
УРОВЕНЬ ТЕХНИКИ
[2] Выявление раннего рецидива или метастазирования рака традиционно основывалось на визуализации и биопсии ткани. Биопсия опухолевой ткани является инвазивной процедурой и несет в себе риск потенциальной вероятности возникновения метастазов или хирургических осложнений, в то время как обнаружение на основе визуализации недостаточно чувствительно для выявления рецидива или метастазирования на ранней стадии. Для выявления рецидива или метастазирования необходимы более эффективные и менее инвазивные способы выявления раков.
КРАТКОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ
[3] Один из аспектов изобретения, представленного в настоящем документе, относится к способу мониторинга и обнаружения раннего рецидива или метастазирования рака (например, рака молочной железы, рака мочевого пузыря или колоректального рака), включающего получение набора ампликонов путем выполнения реакции мультиплексной амплификации нуклеиновых кислот, выделенных из образца крови или мочи или их фракции от пациента, получавшего лечение от рака (например, рака молочной железы, рака мочевого пузыря или колоректального рака), где каждый ампликон из набора ампликонов охватывает по меньшей мере один локус однонуклеотидного варианта из набора локусов однонуклеотидных вариантов, специфичных для пациента, ассоциированных с раком (например, раком молочной железы, раком мочевого пузыря или колоректальным раком); и определение последовательности по меньшей мере сегмента каждого ампликона из набора ампликонов, который содержит специфичный для пациента локус однонуклеотидного варианта, где обнаружение одного или более (или двух или более, или трех или более, или четырех или более, или пяти или более, или шести или более, или семи или более, или восьми или более, или девяти или более, или десяти или более) специфичных для пациента однононуклеотидных вариантов указывает на ранний рецидив или метастазирование рака (например, рака молочной железы, рака мочевого пузыря или колоректального рака).
[4] В дополнение к раку молочной железы, раку мочевого пузыря и колоректальному раку, способы, представленные в данном документе, также можно использовать для мониторинга и выявления раннего рецидива или метастазирования других типов рака, таких как: острый лимфобластный лейкоз; острый миелоидный лейкоз; адренокортикальная карцинома; рак, связанный со СПИДом; лимфома, связанная со СПИДом; анальный рак; рак аппендикса; астроцитомы; атипичная тератоидная/рабдоидная опухоль; базально-клеточная карцинома; глиома ствола головного мозга; опухоль головного мозга (в том числе глиома ствола головного мозга, атипичная тератоидная/рабдоидная опухоль центральной нервной системы, эмбриональные опухоли центральной нервной системы, астроцитомы, краниофарингиома, эпендимобластома, эпендимома, медуллобластома, медуллоэпителиома, пинеальные паренхиматозные опухоли промежуточной дифференцировки, супратенториальные недифференцированные нейроэктодермальные опухоли и пинеобластома); бронхиальные опухоли; лимфома Беркита; рак неизвестной первичной локализации; карциноидная опухоль; карцинома неизвестной первичной локализации; атипичная тератоидная/рабдоидная опухоль центральной нервной системы; эбриональные опухоли центральной нервной системы; рак шейки матки; раковые заболевания у детей; хордома; хронический лимфолейкоз; хронический миелогенный лейкоз; хронические миелопролиферативные расстройства; рак толстой кишки; краниофарингиома; кожная Т-клеточная лимфома; опухоли островковых клеток эндокринной системы поджелудочной железы; рак эндометрия; эпендимобластома; эпендимома; рак пищевода; эстезионейробластома; саркома Юинга; экстракраниальная герминогенная опухоль; внегонадная герминогенная опухоль; рак внепеченочного желчного протока; рак желчного пузыря; рак желудочно-кишечного тракта (желудка); желудочно-кишечные карциноидные опухоли; желудочно-кишечные стромально-клеточные опухоли; желудочно-кишечные стромальные опухоли (GIST); гестационная трофобластическая опухоль; глиома; волосатоклеточный лейкоз; рак головы и шеи; рак сердца; лимфома Ходжкина; гипофарингеальный рак; внутриглазная меланома; опухоли островковых клеток; саркома Капоши; рак почки; гистиоцитоз клеток Лангерганса; рак гортани; рак губы; рак печени; злокачественная фиброзная гистиоцитома, рак кости; медуллобластома; медуллоэпителиома; меланома; карцинома клеток Меркеля; рак кожи из клеток Меркеля; мезотелиома; метастатический плоскоклеточный рак шеи с первичным раком неизвестного происхождения; рак ротовой полости; синдромы множественной эндокринной неоплазии; множественная миелома; множественная миелома/новообразование плазмоцитов; грибовидный микоз; миелодиспластические синдромы; миелопролиферативные новообразования; рак полости носа; рак носоглотки; нейробластома; неходжкинская лимфома; немеланомный рак кожи; немелкоклеточный рак легких; рак ротовой полости; рак полости рта; рак ротоглотки; остеосаркома; другие опухоли головного и спинного мозга; рак яичников; эпителиальный рак яичников; герминоклеточная опухоль яичников; пограничная опухоль яичников; рак поджелудочной железы; папилломатоз; рак околоносовых пазух; рак паращитовидной железы; рак таза; рак полового члена; рак глотки; пинеальные паренхиматозные опухоли промежуточной дифференцировки; пинеобластома; опухоль гипофиза; новообразование плазматических клеток/множественная миелома; плевропульмональная бластома; первичная лимфома центральной нервной системы (ЦНС); первичный гепатоцеллюлярный рак печени; рак простаты; рак прямой кишки; рак почки; почечно-клеточный (почечный) рак; почечно-клеточный рак; рак респираторного тракта; ретинобластома; рабдомиосаркома; рак слюнных желез; синдром Сезари; мелкоклеточный рак легких; рак тонкой кишки; саркома мягких тканей; плоскоклеточная карцинома; плоскоклеточный рак шеи; желудочно-кишечный рак (рак желудка); супратенториальные недифференцированные нейроэктодермальные опухоли; Т-клеточная лимфома; рак яичек; рак горла; карцинома тимуса; тимома; рак щитовидной железы; переходно-клеточный рак; переходно-клеточный рак почечной лоханки и мочеточника; трофобластическая опухоль; рак мочеточника; рак уретры; рак матки; саркома матки; рак влагалища; рак вульвы; макроглобулинемия Вальденстрема; или опухоль Вильма.
[5] В некоторых вариантах воплощения нуклеиновые кислоты выделяют из опухоли пациента, и соматические мутации в опухоли идентифицируют для набора специфичных для пациента локусов однонуклеотидных вариантов перед определением последовательности по меньшей мере сегмента каждого ампликона набора ампликонов для образца крови или мочи, или их фракции, и где имеются однонуклеотидные варианты.
[6] В некоторых вариантах воплощения способ включает сбор и секвенирование образцов крови или мочи у пациента в динамике.
[7] В некоторых вариантах воплощения обнаруживают по меньшей мере 2 или по меньшей мере 5 ОНВ, и наличие по меньшей мере 2 или по меньшей мере 5 ОНВ свидетельствует о раннем рецидиве или метастазировании рака молочной железы, рака мочевого пузыря или колоректального рака.
[8] В некоторых вариантах воплощения рак молочной железы, рак мочевого пузыря или колоректальный рак представляет собой рак молочной железы, рак мочевого пузыря или колоректальный рак стадии 1 или стадии 2. В некоторых вариантах воплощения рак молочной железы, рак мочевого пузыря или колоректальный рак представляет собой рак молочной железы, рак мочевого пузыря или колоректальный рак стадии 3 или стадии 4.
[9] В некоторых вариантах воплощения индивидуум подвергался хирургическому лечению перед выделением образца крови или мочи.
[10] В некоторых вариантах воплощения индивидуум подвергался лечению химиотерапией перед выделением образца крови или мочи.
[11] В некоторых вариантах воплощения индивидуум подвергался лечению адъювантной или неоадъювантной терапией перед выделением образца крови или мочи.
[12] В некоторых вариантах воплощения индивидуум подвергался лечению лучевой терапией перед выделением образца крови или мочи.
[13] В некоторых вариантах воплощения способ дополнительно включает введение соединения индивидууму, где, как известно, это соединение особенно эффективно при лечении рака молочной железы, рака мочевого пузыря или колоректального рака, имеющего один или более из определенных однонуклеотидных вариантов.
[14] В некоторых вариантах воплощения способ дополнительно включает определение частоты вариантного аллеля для каждого из однонуклеотидных вариантов на основе определения последовательности.
[15] В некоторых вариантах воплощения план лечения рака молочной железы, рака мочевого пузыря или колоректального рака определяют на основании определений частоты вариантного аллеля.
[16] В некоторых вариантах воплощения способ дополнительно включает введение соединения индивидууму, где, как известно, это соединение особенно эффективно для лечения рака молочной железы, рака мочевого пузыря или колоректального рака, имеющего один из однонуклеотидных вариантов с переменной частотой аллеля, большей чем по меньшей мере половина других определенных однонуклеотидных вариантов.
[17] В некоторых вариантах воплощения последовательность определяют с помощью высокопроизводительного секвенирования ДНК множества локусов однонуклеотидной вариации.
[18] В некоторых вариантах воплощения способ дополнительно включает обнаружение клонального однонуклеотидного варианта при раке молочной железы, раке мочевого пузыря или колоректальном раке путем определения частоты вариантного аллеля для каждого из локусов ОНВ на основе последовательности множества копий серии ампликонов, где большая относительная частота аллелей по сравнению с другими однонуклеотидными вариантами множества локусов однонуклеотидных вариантов указывает на клональный однонуклеотидный вариант при раке молочной железы, раке мочевого пузыря или колоректальном раке.
[19] В некоторых вариантах воплощения способ дополнительно включает введение индивидууму соединения, которое нацелено на один или более клональных однонуклеотидных вариантов, но не на другие однонуклеотидные варианты.
[20] В некоторых вариантах воплощения частота вариантного аллеля более 1,0% указывает на клональный однонуклеотидный вариант.
[21] В некоторых вариантах воплощения способ дополнительно включает формирование реакционной смеси для амплификации путем объединения полимеразы, нуклеотидтрифосфатов, фрагментов нуклеиновых кислот из библиотеки нуклеиновых кислот, полученных из образца, и набора праймеров, каждый из которых связывается в пределах 150 пар оснований локусов однонуклеотидного варианта, или набора пар праймеров, каждый из которых охватывает область из 160 пар оснований или менее, содержащую локусы однонуклеотидного варианта, и подвергают реакционную смесь для амплификации условиям амплификации для получения набора ампликонов.
[22] В некоторых вариантах воплощения определение того, присутствует ли в образце однонуклеотидный вариант, включает идентификацию значения достоверности для каждого определения аллеля в каждом из наборов локусов однонуклеотидных вариантов на основе по меньшей мере частично, глубины считывания локусов.
[23] В некоторых вариантах воплощения распознавание однонуклеотидного варианта выполняют, если значение достоверности для присутствия однонуклеотидного варианта превышает 90%.
[24] В некоторых вариантах воплощения распознавание однонуклеотидного варианта выполняют, если значение достоверности для присутствия однонуклеотидного варианта превышает 95%.
[25] В некоторых вариантах воплощения набор локусов однонуклеотидной вариации содержит все локусы однонуклеотидной вариации, определенные в наборах данных TCGA и COSMIC для рака молочной железы, рака мочевого пузыря или колоректального рака.
[26] В некоторых вариантах воплощения набор сайтов однонуклеотидной вариации содержит все сайты однонуклеотидной вариации, определенные в наборах данных TCGA и COSMIC для рака молочной железы, рака мочевого пузыря или колоректального рака.
[27] В некоторых вариантах воплощения способ выполняют с глубиной считывания для набора локусов однонуклеотидной вариации по меньшей мере 1000.
[28] В некоторых вариантах воплощения набор локусов однонуклеотидных вариантов содержит от 25 до 1000 локусов однонуклеотидной вариации, которые, как известно, связаны с раком молочной железы, раком мочевого пузыря или колоректальным раком.
[29] В некоторых вариантах воплощения эффективность и коэффициент ошибок на цикл определяют для каждой реакции амплификации мультиплексной реакции амплификации локусов однонуклеотидных вариаций, а для определения наличия однонуклеотидного варианта в наборе локусов однонуклеотидного варианта в образце используют эффективность и частоту ошибок.
[30] В некоторых вариантах воплощения реакция амплификации представляет собой реакцию ПЦР, и температура отжига на 1-15 °С выше температуры плавления по меньшей мере 50% праймеров из набора праймеров.
[31] В некоторых вариантах воплощения реакция амплификации представляет собой реакцию ПЦР, и продолжительность стадии отжига в реакции ПЦР составляет от 15 до 120 минут.
[32] В некоторых вариантах воплощения реакция амплификации представляет собой реакцию ПЦР, и продолжительность стадии отжига в реакции ПЦР составляет от 15 до 120 минут.
[33] В некоторых вариантах воплощения концентрация праймера в реакции амплификации составляет от 1 до 10 нМ.
[34] В некоторых вариантах воплощения праймеры в наборе праймеров предназначены для минимизации образования димера праймера.
[35] В некоторых вариантах воплощения реакция амплификации представляет собой реакцию ПЦР, температура отжига на 1-15 °С выше, чем температура плавления по меньшей мере 50% праймеров набора праймеров, продолжительность стадии отжига в реакции ПЦР составляет от 15 до 120 минут, концентрация праймеров в реакции амплификации составляет от 1 до 10 нМ, и праймеры в наборе праймеров предназначены для минимизации образования димеров праймеров.
[36] В некоторых вариантах воплощения реакцию мультиплексной амплификации проводят в условиях ограничивающего праймера.
[37] Другой аспект изобретения, представленного в настоящем документе, относится к композиции, содержащей циркулирующие в опухоли фрагменты нуклеиновой кислоты, содержащие универсальный адаптор, где циркулирующие в опухоли нуклеиновые кислоты получены из рака молочной железы, рака мочевого пузыря или колоректального рака.
[38] В некоторых вариантах воплощения циркулирующие опухолевые нуклеиновые кислоты, получены из образца крови или мочи или их фракции от индивидуума с раком молочной железы, раком мочевого пузыря или колоректальным раком.
[39] Другой аспект изобретения, представленного в настоящем документе, относится к композиции, содержащей твердую подложку, содержащую множество клональных популяций нуклеиновых кислот, где клональные популяции содержат ампликоны, полученные из образца циркулирующих свободных нуклеиновых кислот, где циркулирующие опухолевые нуклеиновые кислоты получены из рака молочной железы, рака мочевого пузыря или колоректального рака.
[40] В некоторых вариантах воплощения циркулирующие свободные нуклеиновые кислоты получены из образца крови или мочи или их фракции от индивидуума с раком молочной железы, раком мочевого пузыря или колоректальным раком.
[41] В некоторых вариантах воплощения фрагменты нуклеиновой кислоты в разных клональных популяциях содержат один и тот же универсальный адаптор.
[42] В некоторых вариантах воплощения клональные популяции нуклеиновых кислот получены из фрагментов нуклеиновых кислот из набора образцов от двух или более индивидуумов.
[43] В некоторых вариантах воплощения фрагменты нуклеиновой кислоты содержат один из ряда молекулярных штрих-кодов, соответствующих образцу в наборе образцов.
[44] Еще один аспект изобретения, представленного в настоящем документе, относится к способу мониторинга и выявления раннего рецидива или метастазирования рака молочной железы, рака мочевого пузыря или колоректального рака, включающему выбор набора из по меньшей мере 8 или 16 специфичных для пациента локусов однонуклеотидных вариантов на основе соматических мутаций, выявленных в образце опухоли пациента, у которого был диагностирован рак молочной железы, рак мочевого пузыря или колоректальный рак; отбор в динамике одного или более образцов крови или мочи у пациента после того, как пациент подвергся хирургическомулечению, химиотерапии первой линии и/или адъювантной терапии; получение набора ампликонов путем проведения реакции мультиплексной амплификации на нуклеиновых кислотах, выделенных из каждого образца крови или мочи или их фракции, где каждый ампликон из набора ампликонов охватывает по меньшей мере один локус однонуклеотидного варианта из набора специфичного для пациента локусов однонуклеотидного варианта, связанных с раком молочной железы, раком мочевого пузыря или колоректальным раком; и определение последовательности по меньшей мере сегмента каждого ампликона из набора ампликонов, который содержит специфичный для пациента локус однонуклеотидного варианта, в котором обнаруживают один или более (или два или более, или три или более, или четыре или более, или пять или более, или шесть или более, или семь или более, или восемь или более, или девять или более, или десять или более) специфичных для пациента однонуклеотидных вариантов из образца крови или мочи, свидетельствующих о раннем рецидиве или метастазировании рака молочной железы, рака мочевого пузыря или колоректального ракa.
[45] Еще один аспект изобретения, представленного в настоящем документе, относится к способу лечения рака молочной железы, рака мочевого пузыря или колоректального рака, включающему лечение пациента, у которого был диагностирован рак молочной железы, рак мочевого пузыря или колоректальный рак, при помощи операции, химиотерапии первой линии и/или адъювантной терапии; отбор в динамике одного или более образцов крови или мочи у пациента; получение набора ампликонов путем проведения реакции мульплексной амплификации на нуклеиновых кислотах, выделенных из каждого образца крови или мочи или их фракции, причем каждый ампликон из набора ампликонов охватывает по меньшей мере один локус однонуклеотидного варианта из набора из по меньшей мере 8 или 16 специфичных для пациента локусов однонуклеотидного варианта, связанных с раком молочной железы, раком мочевого пузыря или колоректальным раком, которые были отобраны на основе соматических мутаций, выявленных в образце опухоли пациента; определение последовательности по меньшей мере сегмента каждого ампликона из набора ампликонов, который содержит специфичный для пациента локус однонуклеотидного варианта, где обнаружение одного или более (или двух или более, или трех или более, или четырех или более, или пяти или более, или шести или более, или семи или более, или восьми или более, или девяти или более, или десяти или более) специфичных для пациента однонуклеотидных вариантов из образца крови или мочи указывает на ранний рецидив или метастазирование рака молочной железы, рака мочевого пузыря или колоректального рака; и введение соединения индивидууму, где известно, что это соединение эффективно для лечения рака молочной железы, рака мочевого пузыря или колоректального рака, имеющих один или более однонуклеотидных вариантов, выявленных из образца крови или мочи.
[46] Еще один аспект изобретения, представленного в настоящем документе, относится к способу мониторинга или прогнозирования ответа на лечение рака молочной железы, рака мочевого пузыря или колоректального рака, включающему отбор в динамике одного или более образцов крови или мочи у пациента, который подвергается лечению рака молочной железы, рака мочевого пузыря или колоректального рака; получение набора ампликонов путем выполнения реакции мультиплексной амплификации на нуклеиновых кислотах, выделенных из каждого образца крови или мочи или их фракции, где каждый ампликон из набора ампликонов охватывает по меньшей мере один локус однонуклеотидного варианта из набора по меньшей мере 8 или 16 специфичных для пациента локусов однонуклеотидного варианта, связанных с раком молочной железы, раком мочевого пузыря или колоректальным раком, которые были отобраны на основе соматических мутаций, выявленных в образце опухоли пациента; и определение последовательности по меньшей мере сегмента каждого ампликона из набора ампликонов, который содержит специфичный для пациента локус однонуклеотидного варианта, в котором обнаруживают один или более (или два или более, или три или более, или четыре или более, или пять или более, или шесть или более, или семь или более, или восемь или более, или девять или более, или десять или более) специфичных для пациента однонуклеотидных варианта из образца крови или мочи, что указывает на слабый ответ на лечение рака молочной железы, рака мочевого пузыря или колоректального рака.
[47] В некоторых вариантах воплощения способы, представленные в настоящем документе, включают обнаружение цоДНК в плазме пациентов с раком молочной железы до терапии и/или во время неоадъювантной терапии (например, после цикла 1, цикла 2, цикла 3, цикла 4 и т. д.). В некоторых вариантах воплощения предоставляется план лечения на основе определения концентрации цоДНК (например, наличия/отсутствия) и скорости снижения во время неоадъювантной терапии.
[48] В некоторых вариантах воплощения способы, представленные в настоящем документе, включают оценку присутствия и уровней цоДНК для каждого больного раком (то есть нацеливание на мутации, которые фактически присутствуют в опухоли). В некоторых вариантах воплощения способы, представленные в настоящем документе, включают обнаружение 2 или более, 4 или более, 10 или более, 16 или более, 32 или более, 50 или более, 64 или более или 100 или более мутаций, которые фактически присутствуют в опухоли(ях) пациентов.
[49] В соответствии с некоторыми вариантами воплощения настоящего изобретения по меньшей мере 50% или по меньшей мере 60%, или по меньшей мере 70%, или по меньшей мере 80%, или по меньшей мере 90%, или приблизительно 100% пациентов, у которых будет метастатический рецидив (например, после неоадъювантной терапии и операции) имеют цоДНК, выявляемую на исходном уровне.
[50] В соответствии с некоторыми вариантами воплощения настоящего изобретения по меньшей мере 50% или по меньшей мере 60%, или по меньшей мере 70%, или по меньшей мере 80%, или по меньшей мере 90%, или приблизительно 100% пациентов, у которых будет метастатический рецидив (например, после неоадъювантной терапии и хирургии), имеют цоДНК, выявляемую после цикла 1 неоадъювантной терапии.
[51] В соответствии с некоторыми вариантами воплощения настоящего изобретения по меньшей мере 50% или по меньшей мере 60%, или по меньшей мере 70%, или по меньшей мере 80%, или по меньшей мере 90%, или приблизительно 100% пациентов, у которых будет метастатический рецидив (например, после неоадъювантной терапии и хирургии), имеют цоДНК, выявляемую после цикла 2 неоадъювантной терапии.
[52] В соответствии с некоторыми вариантами воплощения настоящего изобретения по меньшей мере 50% или по меньшей мере 60%, или по меньшей мере 70%, или по меньшей мере 80%, или по меньшей мере 90%, или приблизительно 100% пациентов, у которых будет метастатический рецидив (например, после неоадъювантной терапии и хирургии), имеют цоДНК, выявляемую после неоадъювантной терапии и перед операцией.
[53] В соответствии с некоторыми вариантами воплощения настоящего изобретения по меньшей мере 50% или по меньшей мере 60%, или по меньшей мере 70%, или по меньшей мере 80%, или по меньшей мере 90%, или приблизительно 100% пациентов, у которых будет метастатический рецидив (например, после неоадъювантной терапии и операции), имеют цоДНК, выявляемую после операции.
[54] В соответствии с некоторыми вариантами воплощения настоящего изобретения по меньшей мере 50% или по меньшей мере 60%, или по меньшей мере 70%, или по меньшей мере 80%, или по меньшей мере 90%, или приблизительно 100% пациентов, у которых обнаруживают цоДНК (например, после операции), будут иметь метастазирование без дальнейшего лечения рецидива (например, после неоадъювантной терапии и операции).
[55] В соответствии с некоторыми вариантами воплощения настоящего изобретения по меньшей мере 50% или по меньшей мере 60%, или по меньшей мере 70%, или по меньшей мере 80%, или по меньшей мере 90%, или приблизительно 100% пациентов, которые имеют повышенные уровни цоДНК между исходным уровнем и циклом 1, или циклом 2 и т.д., будут иметь метастатический рецидив после операции, если не проводится дополнительное лечение.
[56] В некоторых вариантах воплощения способы, представленные в настоящем документе, включают обнаружение возникновения, рецидива или метастазирования определенных подтипов рака, включая определенные подтипы рака молочной железы. В некоторых вариантах воплощения способы, представленные в настоящем документе, включают обнаружение возникновения, рецидива или метастазирования опухоли HR+/HER2-, включая рак молочной железы HR+/HER2- (например, рецептор-гормона-положительный-ERα+ и/или PR+). Опухоли HR+ обычно менее агрессивны и имеют благоприятный прогноз с 5-летней выживаемостью более 90%.
[57] В некоторых вариантах воплощения способы, представленные в настоящем документе, включают обнаружение возникновения, рецидива или метастазирования опухоли HER2+, включая рак молочной железы HER2+ (положительный по рецептору 2 эпидермального фактора роста человека). Опухоли HER2+, как правило, более инвазивные, имеют худший прогноз и более подвержены рецидивам и метастазированию, чем рак молочной железы HR+/HER2-.
[58] некоторых вариантах воплощения способы, представленные в настоящем документе, включают обнаружение возникновения, рецидива или метастазирования опухоли HR-/HER2-, включая рак молочной железы HR-/HER2 (TNBC или трижды негативный РМЖ). Трижды негативный рак молочной железы (TNBC) не экспрессирует ERα, PR или HER2. Эти опухоли имеют тенденцию быть наиболее агрессивными и имеют худший прогноз среди всех подтипов рака молочной железы.
[59] В некоторых вариантах воплощения представленный в данном документе способ позволяет обнаруживать специфичные для пациента однонуклеотидные варианты по меньшей мере у 75%, по меньшей мере у 80%, по меньшей мере у 85%, по меньшей мере у 90% или по меньшей мере у 95% пациентов, имеющих ранний рецидив или метастазирование рака.
[60] В некоторых вариантах воплощения представленный в данном документе способ способен обнаруживать специфичные для пациента однонуклеотидные варианты по меньшей мере у 80%, по меньшей мере у 85%, по меньшей мере у 90%, по меньшей мере у 95% или по меньшей мере у 98% пациентов, имеющих ранний рецидив или метастазирование рака молочной железы HER2+.
[61] В некоторых вариантах воплощения представленный в данном документе способ способен обнаруживать специфичные для пациента однонуклеотидные варианты по меньшей мере у 80%, по меньшей мере у 85%, по меньшей мере у 90%, по меньшей мере у 95% или по меньшей мере у 98% пациентов, имеющих ранний рецидив или метастазирование трижды негативного рака молочной железы.
[62] В некоторых вариантах воплощения представленный в данном документе способ способен обнаруживать специфичные для пациента однонуклеотидные варианты по меньшей мере у 75%, по меньшей мере у 80%, по меньшей мере у 85%, по меньшей мере у 90% или по меньшей мере у 95% пациентов, имеющих ранний рецидив или метастазирование рака молочной железы HR+/HER2-.
[63] В некоторых вариантах воплощения представленный в данном документе способ способен обнаруживать специфичные для пациента однонуклеотидные варианты у пациентов, имеющих ранний рецидив или метастазирование рака по меньшей мере за 100 дней, по меньшей мере за 150 дней, по меньшей мере за 200 дней, по меньшей мере за 250 дней или по меньшей мере за 300 дней до клинического рецидива или метастазирования рака, обнаруживаемого посредством визуализации, и/или по меньшей мере за 100 дней, по меньшей мере за 150 дней, по меньшей мере за 200 дней, по меньшей мере за 250 дней или по меньшей мере за 300 дней до повышения уровня CA15-3.
[64] В некоторых вариантах воплощения представленный в данном документе способ способен обнаруживать специфичные для пациента однонуклеотидные варианты у пациентов, имеющих ранний рецидив или метастазирование рака молочной железы HER2+ по меньшей мере за 100 дней, по меньшей мере за 150 дней, по меньшей мере за 200 дней, по меньшей мере за 250 дней или по меньшей мере за 300 дней до клинического рецидива или метастазирования рака молочной железы HER2+, обнаруживаемого посредством визуализации, и/или по меньшей мере за 100 дней, по меньшей мере за 150 дней, по меньшей мере за 200 дней, по меньшей мере за 250 дней или по меньшей мере за 300 дней до повышения уровня CA15-3.
[65] В некоторых вариантах воплощения представленный в данном документе способ способен обнаруживать специфичные для пациента однонуклеотидные варианты у пациентов, имеющих ранний рецидив или метастазирование трижды негативного рака молочной железы по меньшей мере за 100 дней, по меньшей мере за 150 дней, по меньшей мере за 200 дней, по меньшей мере за 250 дней или по меньшей мере за 300 дней до клинического рецидива или метастазирования трижды негативного рака молочной железы, обнаруживаемого посредством визуализации, и/или по меньшей мере за 100 дней по меньшей мере, за 150 дней, по меньшей мере за 200 дней, по меньшей мере за 250 дней или по меньшей мере за 300 дней до повышения уровня CA15-3.
[66] В некоторых вариантах воплощения представленный в данном документе способ способен обнаруживать специфичные для пациента однонуклеотидные варианты у пациентов, имеющих ранний рецидив или метастазирование рака молочной железы HR+/HER2- по меньшей мере за 100 дней, по меньшей мере за 150 дней, по меньшей мер, за 200 дней, по меньшей мере за 250 дней или по меньшей мере за 300 дней до клинического рецидива или метастазирования рака молочной железы HR+/HER2-, обнаруживаемого посредством визуализации и/или по меньшей мере за 100 дней, по меньшей мере за 150 дней, по меньшей мере за 200 дней, по меньшей мере за 250 дней или по меньшей мере за 300 дней до повышения уровня CA15-3.
[67] В некоторых вариантах воплощения представленный в данном документе способ не обнаруживает специфичные для пациента однонуклеотидные варианты по меньшей мере у 95%, по меньшей мере у 98%, по меньшей мере у 99%, по меньшей мере у 99,5%, по меньшей мере у 99,8% или по меньшей мере у 99,9% пациентов, у которых отсутствует ранний рецидив или метастазирование рака.
[68] В некоторых вариантах воплощения представленный в данном документе способ не обнаруживает специфичные для пациента однонуклеотидные варианты по меньшей мере у 95%, по меньшей мере у 98%, по меньшей мере у 99%, по меньшей мере у 99,5%, по меньшей мере у 99,8% или по меньшей мере у 99,9% пациентов, у которых отсутствует ранний рецидив или метастазирование рака молочной железы HER2+.
[69] В некоторых вариантах воплощения представленный в данном документе способ не обнаруживает специфичные для пациента однонуклеотидные варианты по меньшей мере у 95%, по меньшей мере у 98%, по меньшей мере у 99%, по меньшей мере у 99,5%, по меньшей мере у 99,8% или по меньшей мере у 99,9% пациентов, у которых отсутствует ранний рецидив или метастазирование трижды негативного рака молочной железы.
[70] В некоторых вариантах воплощения представленный в данном документе способ не обнаруживает специфичные для пациента однонуклеотидные варианты по меньшей мере у 95%, по меньшей мере у 98%, по меньшей мере у 99%, по меньшей мере у 99,5%, по меньшей мере у 99,8% или по меньшей мере у 99,9% пациентов, у которых отсутствует ранний рецидив или метастазирование рака молочной железы HR+/HER2-.
[71] В некоторых вариантах воплощения представленный в данном документе способ имеет специфичность по меньшей мере 95%, по меньшей мере 98%, по меньшей мере 99%, по меньшей мере 99,5%, по меньшей мере 99,8% или по меньшей мере 99,9% в выявлении раннего рецидива или метастазирования рака, когда два или более специфичных для пациента однонуклеотидных варианта выявляются выше предопределенного порога достоверности (например, 0,95, 0,96, 0,97, 0,98 или 0,99).
[72] В некоторых вариантах воплощения представленный в данном документе способ имеет специфичность по меньшей мере 95%, по меньшей мере 98%, по меньшей мере 99%, по меньшей мере 99,5%, по меньшей мере 99,8% или по меньшей мере 99,9% в выявлении раннего рецидива или метастазирования рака молочной железы HER2+, когда два или более специфичных для пациента однонуклеотидных варианта выявляются выше предопределенного порога достоверности (например, 0,95, 0,96, 0,97, 0,98 или 0,99).
[73] В некоторых вариантах воплощения представленный в данном документе способ имеет специфичность по меньшей мере 95%, по меньшей мере 98%, по меньшей мере 99%, по меньшей мере 99,5%, по меньшей мере 99,8% или по меньшей мере 99,9% в выявлении раннего рецидива или метастазирования трижды негативного рака молочной железы, когда два или более специфичных для пациента однонуклеотидных варианта выявляются выше предопределенного порога достоверности (например, 0,95, 0,96, 0,97, 0,98 или 0,99).
[74] В некоторых вариантах воплощения представленный в данном документе способ имеет специфичность по меньшей мере 95%, по меньшей мере 98%, по меньшей мере 99%, по меньшей мере 99,5%, по меньшей мере 99,8% или по меньшей мере 99,9% в выявлении раннего рецидива или метастазирования рака молочной железы HR+/HER2-, когда два или более специфичных для пациента однонуклеотидных варианта выявляются выше предопределенного порога достоверности (например, 0,95, 0,96, 0,97, 0,98 или 0,99).
[75] В некоторых вариантах воплощения представленный в данном документе способ выявляет специфические для пациента однонуклеотидные варианты по меньшей мере у 75%, по меньшей мере у 80%, по меньшей мере у 85%, по меньшей мере у 90% или по меньшей мере у 95% пациентов, имеющих ранний рецидив или метастазирование мышечно-инвазивного рака мочевого пузыря (МИРМП).
[76] В некоторых вариантах воплощения представленный в данном документе способ выявляет специфические для пациента однонуклеотидные варианты у пациентов, имеющих ранний рецидив или метастазирование рака по меньшей мере за 100 дней, по меньшей мере за 150 дней, по меньшей мере за 200 дней или по меньшей мере за 250 дней до клинического рецидива или метастазирования МИРМП, обнаруживаемого посредством визуализации.
[77] В некоторых вариантах воплощения представленный в данном документе способ не выявляет специфичные для пациента однонуклеотидные варианты по меньшей мере у 95%, по меньшей мере у 98%, по меньшей мере у 99%, по меньшей мере у 99,5%, по меньшей мере у 99,8% или по меньшей мере у 99,9% пациентов, у которых отсутствует ранний рецидив или метастазирование МИРМП.
[78] В некоторых вариантах воплощения представленный в данном документе способ имеет специфичность по меньшей мере 95%, по меньшей мере 98%, по меньшей мере 99%, по меньшей мере 99,5% по меньшей мере 99,8% или по меньшей мере 99,9% при обнаружении раннего рецидива или метастазирования МИРМП, когда два или более специфичных для пациента однонуклеотидных варианта выявляются выше предопределенного порога достоверности (например, 0,95, 0,96, 0,97, 0,98 или 0,99).
[79] В дополнение или в качестве альтернативы однонуклеотидным вариантам способы, представленные в настоящем документе, также могут быть основаны на обнаружении других геномных вариантов, таких, как вставки/делеции, варианты с множеством нуклеотидов и/или слияния генов.
[80] Соответственно, дополнительный аспект изобретения, представленного в настоящем документе, относится к способу мониторинга и выявления раннего рецидива или метастазирования рака молочной железы, рака мочевого пузыря или колоректального рака, включающему выбор множества локусов геномных вариантов (например, ОНВ, вставка/делеция, вариант с множеством нуклеотидов и слияние генов) на основе соматических мутаций, выявленных в образце опухоли пациента, у которого был диагностирован рак молочной железы, рак мочевого пузыря или колоректальный рак; отбор в динамике одного или более образцов крови или мочи у пациента после того, как пациент подвергся хирургическому вмешательству, химиотерапии первой линии и/или адъювантной терапии; получение набора ампликонов путем проведения реакции мультиплексной амплификации на нуклеиновых кислотах, выделенных из каждого образца крови или мочи или их фракции, где каждый ампликон из набора ампликонов охватывает по меньшей мере один локус геномных вариантов из набора специфичных для пациента локусов геномных вариантов, связанных с раком молочной железы, раком мочевого пузыря или колоректальным раком; и определение последовательности по меньшей мере сегмента каждого ампликона из набора ампликонов, который содержит специфичный для пациента локус геномных вариантов, в которых обнаруживают один или более (или два или более, или три или более, или четыре или более, или пять или более, или шесть или более, или семь или более, или восемь или более, или девять или более, или десять или более) специфичных для пациента вариантов генома из образца крови или мочи, указывающие на ранний рецидив или метастазирование рака молочной железы, рака мочевого пузыря или колоректального ракa.
[81] Дополнительный аспект изобретения, представленного в настоящем документе, относится к способу лечения рака молочной железы, рака мочевого пузыря или колоректального рака, включающему лечение пациента, у которого был диагностирован рак молочной железы, рак мочевого пузыря или колоректальный рак, при помощи операции, химиотерапии первой линии и/или адъювантной терапии; отбор в динамике одного или более образцов крови или мочи от пациента; получение набора ампликонов путем проведения реакции мультиплексной амплификации на нуклеиновых кислотах, выделенных из каждого образца крови или мочи или их фракции, где каждый ампликон из набора ампликонов охватывает по меньшей мере один локус геномных вариантов (например, ОНВ, вставка/делеция, вариант с множеством нуклеотидов и слияние генов) из набора из по меньшей мере 8 или 16 специфичных для пациента локусов геномных вариантов, связанных с раком молочной железы, раком мочевого пузыря или колоректальным раком, которые были отобраны на основе соматических мутаций, идентифицированных в образце опухоли пациента; определение последовательности по меньшей мере сегмента каждого ампликона из набора ампликонов, который содержит специфичный для пациента локус геномных вариантов, при этом обнаружение одного или более (или двух или более, или трех или более, или четырех или более, или пяти или более, или шести или более, или семи или более, или восьми или более, или девяти или более, или десяти или более) специфичных для пациента вариантов генома из образца крови или мочи указывают на ранний рецидив или метастазирование рака молочной железы, рака мочевого пузыря или колоректального рака; и введение соединения индивидууму, где, как известно, соединение эффективно для лечения рака молочной железы, рака мочевого пузыря или колоректального рака, имеющего один или более геномных вариантов, обнаруженных в образце крови или мочи.
[82] Дополнительный аспект изобретения, представленного в настоящем документе, относится к способу мониторинга или прогнозирования ответа на лечение рака молочной железы, рака мочевого пузыря или колоректального рака, включающему отбор в динамике одной или более проб крови или мочи от пациента, который подвергается лечению рака молочной железы, рака мочевого пузыря или колоректального рака; получение набора ампликонов путем проведения реакции мультиплексной амплификации на нуклеиновых кислотах, выделенных из каждого образца крови или мочи или их фракции, где каждый ампликон из набора ампликонов охватывает по меньшей мере один локус геномных вариантов (например, ОНВ, вставка/делеция, вариант с множеством нуклеотидов и слияние генов) из набора из по меньшей мере 8 или 16 специфичных для пациента локусов геномных вариантов, связанных с раком молочной железы, раком мочевого пузыря или колоректальным раком, которые были отобраны на основе соматических мутаций, идентифицированных в образце опухоли пациента; и определение последовательности по меньшей мере сегмента каждого ампликона из набора ампликонов, который содержит специфичный для пациента локус геномных вариантов, в которых обнаруживают один или более (или два или более, или три или более, или четыре или более, или пять или более, или шесть или более, или семь или более, или восемь или более, или девять или более, или десять или более) специфичных для пациента вариантов генома из образца крови или мочи, указывающих на слабый ответ на лечение рака молочной железы, рака мочевого пузыря или колоректального ракa.
[83] В дополнение или в качестве альтернативы специфичным для пациента геномным вариантам способы, представленные в настоящем документе, также могут быть основаны на обнаружении повторяющихся мутаций, связанных с раком (например, раковые мутации горячей точки, маркеры, связанные с лекарственной устойчивостью, мутации раковой панели), которые повторяются у многих пациентов с раком.
[84] Соответственно, дополнительный аспект изобретения, представленного в настоящем документе, относится к способу мониторинга и выявления раннего рецидива или метастазирования рака молочной железы, рака мочевого пузыря или колоректального рака, включающему выбор множества повторяющихся, связанных с раком мутаций; отбор в динамике одного или более образцов крови или мочи от пациента после того, как пациент подвергся хирургическому вмешательству, химиотерапии первой линии и/или адъювантной терапии; получение набора ампликонов путем проведения реакции мультиплексной амплификации на нуклеиновых кислотах, выделенных из каждого образца крови или мочи или их фракции, где каждый ампликон из набора ампликонов охватывает по меньшей мере одну из набора повторяющихся мутаций, связанных с раком молочной железы, раком мочевого пузыря или колоректальным раком; и определение последовательности по меньшей мере сегмента каждого ампликона из набора ампликонов, который включает повторяющуюся, ассоциированную с раком мутацию, где обнаружение одной или более (или двух или более, или трех или более, или четырех или более, или пяти или более, или шести или более, или семи или более, или восьми или более, или девяти или более, или десяти или более) повторяющихся, связанных с раком мутаций из образца крови или мочи, указывает на ранний рецидив или метастазирование рака молочной железы, рака мочевого пузыря или колоректального рака.
[85] Дополнительный аспект изобретения, представленного в настоящем документе, относится к способу лечения рака молочной железы, рака мочевого пузыря или колоректального рака, включающему лечение пациента, у которого был диагностирован рак молочной железы, рак мочевого пузыря или колоректальный рак, при помощи оперпции, химиотерапии первой линии и/или адъювантной терапии; отбор в динамике одного или более образцов крови или мочи от пациента; получение набора ампликонов путем проведения реакции мультиплексной амплификации на нуклеиновых кислотах, выделенных из каждой пробы крови или мочи или их фракции, где каждый ампликон из набора ампликонов охватывает по меньшей мере одну повторяющуюся связанную с раком мутацию (например, раковая мутация горячей точки, маркер, связанный с лекарственной устойчивостью, мутация раковой панели) из набора из по меньшей мере 8 или 16 повторяющихся мутаций, связанных с раком молочной железы, раком мочевого пузыря или колоректальным раком; определение последовательности по меньшей мере сегмента каждого ампликона из набора ампликонов, который содержит повторяющуюся, ассоциированную с раком мутацию, причем обнаружение одной или более (или двух или более, или трех или более, или четырех или более, или пяти или более, или шести или более, или семи или более, или восьми или более, или девяти или более, или десяти или более) повторяющихся, связанных с раком мутаций из образца крови или мочи, указывает на ранний рецидив или метастазирование рака молочной железы, рака мочевого пузыря или колоректального рака; и введение соединения индивидууму, где известно, что это соединение эффективно для лечения рака молочной железы, рака мочевого пузыря или колоректального рака, имеющих одну или более повторяющихся, связанных с раком мутаций, обнаруженных в образце крови или мочи.
[86] Дополнительный аспект изобретения, представленного в настоящем документе, относится к способу мониторинга или прогнозирования ответа на лечение рака молочной железы, рака мочевого пузыря или колоректального рака, включающему отбор в динамике одной или более проб крови или мочи от пациента, который подвергается лечению рака молочной железы, рака мочевого пузыря или колоректального рака; получение набора ампликонов путем проведения реакции мультиплексной амплификации на нуклеиновых кислотах, выделенных из каждой пробы крови или мочи или их фракции, где каждый ампликон из набора ампликонов охватывает по меньшей мере одну повторяющуюся, связанную с раком мутацию (например, раковая мутация горячей точки, маркер, связанный с лекарственной устойчивостью, мутация раковой панели) из набора из по меньшей мере из 8 или 16 повторяющихся мутаций, связанных с раком молочной железы, раком мочевого пузыря или колоректальным раком; и определение последовательности по меньшей мере сегмента каждого ампликона из набора ампликонов, который включает повторяющуюся, ассоциированную с раком мутацию, где обнаружение одной илиболее (или двух или более, или трех или более, или четырех или более, или пяти или более, или шести или более, или семи или более, или восьми или более, или девяти или более, или десяти или более) повторяющихся, связанных с раком мутаций из образца крови или мочи указывают на слабый ответ на лечение рака молочной железы, рака мочевого пузыря или колоректального рака.
[87] В дополнение или в качестве альтернативы первоначальному выявлению соматических мутаций из образца опухоли пациента, у которого диагностирован рак молочной железы, рак мочевого пузыря или колоректальный рак, способы, представленные в настоящем документе, также могут основываться на выявлении соматических мутаций из других биологические образцов пациентов, таких как кровь, сыворотка, плазма, моча, волосы, слезы, слюна, кожа, ногти, кал, желчь, лимфа, цервикальная слизь или сперма.
[88] Соответственно, дополнительный аспект изобретения, представленного в настоящем документе, относится к способу мониторинга и выявления раннего рецидива или метастазирования рака молочной железы, рака мочевого пузыря или колоректального рака, включающему выбор множества локусов геномных вариантов (например, ОНВ, вставка/делеция, вариант с множеством нуклеотидов и слияние генов) на основе соматических мутаций, идентифицированных в биологическом образце, включающем связанные с раком мутации (например, кровь, сыворотка, плазма, моча, волосы, слезы, слюна, кожа, ногти, кал, желчь, лимфа, цервикальная слизь или сперма) пациента, у которого был диагностирован рак молочной железы, рак мочевого пузыря или колоректальный рак; отбор в динамике одного или более образцов крови или мочи от пациента после того, как пациент подвергся операции, химиотерапии первой линии и/или адъювантной терапии; получение набора ампликонов путем проведения реакции мультиплексной амплификации на нуклеиновых кислотах, выделенных из каждой пробы крови или мочи или их фракции, причем каждый ампликон из набора ампликонов охватывает по меньшей мере один локус геномных вариантов из набора специфичных для пациента локусов геномных вариантов, связанных с раком молочной железы, раком мочевого пузыря или колоректальным раком; и определение последовательности по меньшей мере сегмента каждого ампликона из набора ампликонов, который содержит специфичный для пациента локус геномных вариантов, в котором обнаруживают один или более (или два или более, или три или более, или четыре или более, или пять или более, или шесть или более, или семь или более, или восемь или более, или девять или более, или десять или более) специфичных для пациента геномных вариантов из образца крови или мочи, что указывает на ранний рецидив или метастазирование рака молочной железы, рака мочевого пузыря или колоректального ракa.
[89] Дополнительный аспект изобретения, представленного в настоящем документе, относится к способу лечения рака молочной железы, рака мочевого пузыря или колоректального рака, включающему лечение пациента, у которого был диагностирован рак молочной железы, рак мочевого пузыря или колоректальный рак, при помощи операции, химиотерапии первой линии и/или адъювантной терапии; отбора в динамике одного или более образцов крови или мочи от пациента; получение набора ампликонов путем проведения реакции мультиплексной амплификации на нуклеиновых кислотах, выделенных из каждого образца крови или мочи или их фракции, причем каждый ампликон из набора ампликонов охватывает по меньшей мере один локус геномных вариантов (например, ОНВ, вставка/делеция, вариант с множеством нуклеотидов и слияние генов) набора из по меньшей мере 8 или 16 специфичных для пациента локусов геномных вариантов, связанных с раком молочной железы, раком мочевого пузыря или колоректальным раком, которые были отобраны на основе соматических мутаций, идентифицированных в биологическом образце пациента, содержащего мутации, связанные с раком (например, кровь, сыворотка, плазма, моча, волосы, слезы, слюна, кожа, ногти, кал, желчь, лимфа, цервикальная слизь или сперма); определение последовательности по меньшей мере сегмента каждого ампликона из набора ампликонов, который содержит специфичный для пациента локус геномных вариантов, при этом обнаружение одного или более (или двух или более, или трех или более, или четырех или более, или пяти или более, или шести или более, или семи или более, или восьми или более, или девяти или более, или десяти или более) специфичных для пациента вариантов генома из образца крови или мочи указывают на ранний рецидив или метастазирование рака молочной железы, рака мочевого пузыря или колоректального рака; и введение соединения индивидууму, где, как известно, соединение эффективно для лечения рака молочной железы, рака мочевого пузыря или колоректального рака, имеющего один или более геномных вариантов, обнаруженных из образца крови или мочи.
[90] Дополнительный аспект изобретения, представленного в настоящем документе, относится к способу мониторинга или прогнозирования ответа на лечение рака молочной железы, рака мочевого пузыря или колоректального рака, включающему отбор в динамике одной или более проб крови или мочи от пациента, который подвергается лечению рака молочной железы, рака мочевого пузыря или колоректального рака; получение набора ампликонов путем проведения реакции мультиплексной амплификации на нуклеиновых кислотах, выделенных из каждого образца крови или мочи или их фракции, причем каждый ампликон из набора ампликонов охватывает по меньшей мере один локус геномных вариантов (например, ОНВ, вставка/делеция, вариант с множеством нуклеотидов и слияние генов) набора из по меньшей мере 8 или 16 специфичных для пациента локусов геномных вариантов, связанных с раком молочной железы, раком мочевого пузыря или колоректальным раком, которые были отобраны на основе соматических мутаций, идентифицированных в биологическом образце пациента, содержащем мутации, ассоциированные с раком (например, кровь, сыворотка, плазма, моча, волосы, слезы, слюна, кожа, ногти, кал, желчь, лимфа, цервикальная слизь или сперма); и определение последовательности по меньшей мере сегмента каждого ампликона из набора ампликонов, который содержит специфичный для пациента локус геномных вариантов, в которых обнаруживают один или более (или два или более, или три или более, или четыре или более, или пять или более, или шесть или более, или семь или более, или восемь или более, или девять или более, или десять или более) специфичных для пациента вариантов генома из образца крови или мочи, что указывает на слабый ответ на лечение рака молочной железы, рака мочевого пузыря или колоректального ракa.
[91] Другие варианты воплощения, особенности и преимущества раскрываемых изобретений будут очевидны из следующего подробного описания и из формулы изобретения.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
[92] Файл патента или заявки содержит по меньшей мере один чертеж, выполненный в цвете. Копии этого патента или публикации патентной заявки с цветным(и) чертежом(ами) будут предоставлены Ведомством по запросу и при уплате необходимой пошлины.
[93] Раскрываемые в настоящем документе варианты воплощения будут дополнительно объяснены со ссылкой на приложенные чертежи, на которых одинаковые структуры обозначены одинаковыми номерами на нескольких видах. Показанные чертежи не обязательно выполнены в масштабе, вместо этого, как правило, делается акцент на иллюстрации принципов вариантов воплощения, раскрываемых в настоящее время.
[94] ФИГ. 1 представляет собой диаграмму рабочего процесса.
[95] ФИГ. 2 Верхняя панель: количество ОНВ на образец; нижняя панель: рабочие тесты, отсортированные по категории драйвера.
[96] ФИГ. 3. Измеренная концентрация скДНК. Каждая точка данных относится к образцу плазмы.
[97] ФИГ.4. Образцы, демонстрирующие хорошую корреляцию между измерениями ЧВА ткани, определенными ранее (ось х), и в данном случае с использованием мПЦР-СНП (ось у). Каждый образец показан в отдельной рамке, а точки данных ЧВА окрашены соответственно участку ткани.
[98] ФИГ. 5. Образцы, демонстрирующие слабую корреляцию между измерениями ЧВА ткани, определенными ранее (ось х), и в данном случае с использованием мПЦР-СНП (ось у). Каждый образец показан в отдельной рамке, а точки данных ЧВА окрашены соответственно участку ткани.
[99] ФИГ. 6A-B. Гистограмма глубины считывания в зависимости от полученного распознавания. Вверху: анализ не обнаружил ожидаемого ОНВ плазмы. Внизу: анализ обнаружил ожидаемый ОНВ плазмы.
[100] ФИГ.7. Количество ОНВ, обнаруженных в плазме, в соответствии с гистологическим типом.
[101] ФИГ.8. Обнаружение ОНВ (слева) и обнаружение образца (справа) в плазме по стадии опухоли.
[102] ФИГ.9. ЧВА плазмы как функция стадии опухоли и клональности ОНВ.
[103] ФИГ.10. Количество ОНВ, обнаруженных в плазме из каждого образца, как функция количества вводимой скДНК.
[104] ФИГ.11. ЧВА плазмы как функция средней ЧВА опухоли. Средняя ЧВА опухоли была рассчитана по всем опухолевым участкам, проанализированным по каждой опухоли.
[105] ФИГ. 12 показывает соотношение клонов (красный к синему) и частоту мутантов вариантного аллеля (MутЧВА) каждого обнаруженного ОНВ. Общее количество ОНВ, обнаруженное в каждом образце, помещается в один столбец, и образцы классифицируются по стадии опухоли (стадия pTNM). Включены образцы без обнаруженных ОНВ. Клональное соотношение определяется как отношение между количеством опухолевых участков, в которых наблюдался ОНВ, и общим количеством участков, проанализированных из этой опухоли.
[106] ФИГ. 13 демонстрирует клональный статус (синий для клонального и красный для субклонального) и мутантную частоту вариантного аллеля (МутЧВА) каждого обнаруженного ОНВ. Общее количество ОНВ, обнаруженных в каждом образце, помещается в один столбец, и образцы классифицируются по стадии опухоли (стадия pTNM). Включены образцы без обнаруженных ОНВ. Клональный статус был определен с помощью PyCloneCluster с использованием данных полноэкзомного секвенирования из опухолевой ткани.
[107] ФИГ. 14 показывает клональный статус (синий для клонального и красный для субклонального) и частоту мутантного вариантного аллеля (МутЧВА) каждого обнаруженного ОНВ, где верхняя панель показывает только клональные ОНВ, а нижняя панель показывает только субклональные ОНВ. Общее количество ОНВ, обнаруженное в каждом образце, помещается в один столбец, и образцы классифицируются по стадии опухоли (стадия pTNM). Включены образцы без обнаруженных ОНВ. Клональный статус был определен с помощью PyCloneCluster с использованием данных о полноэкзомном секвенировании всего экзома из опухолевой ткани.
[108] ФИГ. 15 демонстрирует количество ОНВ, выявленных в плазме, как функцию гистологического типа и размера опухоли. Гистологический тип и размер опухоли определены на основе патологического отчета. Каждая точка данных окрашена в соответствии с размером, где красный означает наибольший размер опухоли, а синий означает наименьший размер опухоли.
[109] ФИГ. 16 представляет собой таблицу анализа скДНК, показывающую концентрацию ДНК, эквиваленты копий генома в подготовке библиотеки, степень гемолиза в плазме и профиль кДНК во всех образцах.
[110] ФИГ. 17 представляет собой таблицу ОНВ, выявленных в плазме для каждого образца.
[111] ФИГ. 18 представляет собой таблицу дополнительных ОНВ, выявленных в плазме.
[112] ФИГ. 19 является примером выявленных анализов и их исходных аллельных фракций для образца плазмы во время рецидива (LTX103).
[113] ФИГ. 20A-B: Схема клинического и молекулярного протоколов.
[114] ФИГ. 21: Обзор исследования.
[115] ФИГ. 22: Резюме пациентов за 36 месяцев наблюдения и сбора плазмы.
[116] ФИГ. 23A-B: Риск рецидива после терапии, стратифицированный по послеоперационному статусу цоДНК.
[117 ФИГ. 24A-B: Риск рецидива после терапии, стратифицированный по послеоперационному статусу цоДНК.
[118] ФИГ. 25: Эффективность адъювантной терапии в профилактике рецидивов.
[119] ФИГ. 26A-B: Время до рецидива на основе радиологических исследований и цоДНК.
[120] ФИГ. 27A-D: Раннее выявление рецидива и прогнозирование ответа на лечение.
[121] ФИГ. 28: Схема сбора клинических образцов.
[122] ФИГ. 29: КК секвенирования плазмы.
[123] ФИГ. 30A-F: Ранее выявление рецидива.
[124] ФИГ. 31: Безрецидивная выживаемость и статус цоДНК на момент постановки диагноза и после цистэктомии.
[125] ФИГ. 32A-B: Ответ на неоадъювантное лечение.
[126] ФИГ. 33: Процесс Signatera (RUO).
[127] ФИГ. 34: КК секвенирования плазмы.
[128] ФИГ. 35: Чувствительность выявления единичного ОНВ.
[129] ФИГ. 36: Ожидаемый ввод против Наблюдаемая ЧВА с Signatera (RUO).
[130] ФИГ. 37: Резюме пациентов для исследования рака молочной железы в Примере 6.
[131] ФИГ. 38A-H: представляет собой таблицу информации об образцах, проанализированных в исследовании Примера 6. ФИГ. 38А является частью 1 таблицы. ФИГ. 38B является продолжением таблицы. ФИГ. 38С является продолжением таблицы. ФИГ. 38D является продолжением таблицы. ФИГ. 38Е является продолжением таблицы. 38F является продолжением таблицы. ФИГ. 38G является продолжением таблицы. ФИГ. 38Н является продолжением таблицы.
[132] ФИГ. 39: Демография пациентов в исследовании рака молочной железы из Примера 6. Исходные данные ПЭС, полученные от 50 пациентов (с вариантами драйвера для 35 пациентов). Было получено 218 образцов плазмы в различные моменты времени (от 1 до 8). Было получено 108 дополнительных выделенных образцов ДНК. Также был собран статус рецидива. Образцы крови были собраны после адъювантной терапии с интервалами в 6 месяцев.
[133] ФИГ. 40: Резюме анализа ПЭС и дизайна пула для исследования рака молочной железы в Примере 6. Пул A основан на способе Signatera. Пул B включает 25 пациентов и обозначен звездочкой на столбчатой диаграмме и диаграмме типа «ящик с усами». 19 пациентов в пуле В имели низкую беспримесность опухоли. У 6 пациентов были очень ранние стадии опухолей HER2-. Пул B содержит варианты драйверов.
[134] ФИГ. 41: Образцы плазмы для исследования рака молочной железы в Примере 6. Медианный объем плазмы составлял 4 мл. Медианный ввод ДНК составлял 26 нг. Медианный ввод ДНК ниже, чем у образцов КРР и МИРМП (соответственно, 45 нг и 66 нг).
[135] ФИГ. 42: Контроль качества секвенирования, отображающий медианную частоту ошибок процесса для каждого типа и медианную глубину анализа для исследования рака молочной железы в Примере 6. Всего было обработано 326 образцов секвенирования плазмы. Коэффициент ложных распознаваний мутаций оценивается в 0,28%.
[136] ФИГ. 43: Повторные исследования для образцов плазмы для исследования рака молочной железы в Примере 6. 319 секвенированных образцов с 214 уникальными образцами плазмы представлены для 49 пациентов.
[137] ФИГ. 44: Результаты из Пула А для исследования рака молочной железы в Примере 6. Из 49 пациентов 11 были исходно положительными. 3 имеют только одну временную точку. Оставшиеся 8 пациентов все время остаются положительными. Пул B и драйвер дали аналогичные результаты. Информация о драйвере: 16 образцов с рецидивом имеют мутации драйвера. 11 образцов с рецидивом имеют по меньшей мере один анализ с драйвером.
[138] ФИГ. 45: Резюме 16 пациентов с обнаруженной цоДНК.
[139] ФИГ. 46: Графическое изображение данных, соответствующих пациенту CD047 (TNBC) на ФИГ. 38.
[140] ФИГ. 47: Графическое изображение данных, соответствующих пациенту CD033 (TNBC) на ФИГ. 38.
[141] ФИГ. 48: Графическое изображение данных, соответствующих пациенту CD037 (HER2+) на ФИГ. 38.
[142] ФИГ. 49: Графическое изображение данных, соответствующих пациенту CD040 (HER2+) на ФИГ. 38.
[143] ФИГ. 50: Графическое изображение данных, соответствующих пациенту CD048 (HER2-) на ФИГ. 38.
[144] ФИГ. 51: Графическое изображение данных, соответствующих пациенту CD005 (HER2-) на ФИГ. 38.
[145] ФИГ. 52: Графическое изображение данных, соответствующих пациенту CD036 (HER2-) на ФИГ. 38.
[146] ФИГ. 53: Графическое изображение данных, соответствующих пациенту CD044 (HER2-) на ФИГ. 38.
[147] ФИГ. 54: Графическое изображение данных, соответствующих пациенту CD049 на ФИГ. 38.
[148] ФИГ. 55: Графическое изображение данных, соответствующих пациенту CD029 на ФИГ. 38.
[149] ФИГ. 56: Графическое изображение данных, соответствующих пациенту CD026 на ФИГ. 38.
[150] ФИГ. 57: Графическое изображение данных, соответствующих пациенту CD017 на ФИГ. 38.
[151] ФИГ. 58: Графическое изображение данных, соответствующих пациенту CD031 на ФИГ. 38. HW: SHC2, PKD1, COLEC12.
[152] ФИГ. 59: Графическое изображение данных, соответствующих пациенту CD025 на ФИГ. 38. У этого пациента цоДНК исследовали на наличие мутации в FGF9 в течение 2 последовательных временных точек. Этот пациент может иметь рецидив в ближайшем будущем.
[153] ФИГ. 60: Включение пациентов и сбор клинических образцов. Для 49 женщин с раком молочной железы, находящихся под наблюдением в этом исследовании, собранные образцы опухолевой ткани и серийные образцы плазмы были проанализированы слепым методом с использованием рабочего процесса Signatera™ RUO. Изменения экзома определяли путем секвенирования спаренных концов в зафиксированных формалином и залитых парафином (FFPE) образцах опухолевой ткани и в соответствующей нормальной ДНК. Были разработаны специальные панели для пациентов, включающие 16 соматических мутаций, идентифицированных с помощью ПЭС. Образцы плазмы были обработаны с использованием соответствующих индивидуальных панелей. Для выявления цоДНК было проанализировано 208 образцов.
[154] ФИГ. 61A-C: Краткий обзор и результаты анализа цоДНК. (A) Краткое изложение схемы лечения каждого пациента (n=49) и результаты анализа серийных образцов плазмы (n=208). (B) Сводная таблица, показывающая общее количество пациентов в каждом подтипе рака молочной железы, число рецидивов, процент, обнаруженный с помощью анализа цоДНК, и медианное время упреждения в днях. (C) Сравнение молекулярного и клинического рецидива, окрашенного в соответствии с подтипом рака молочной железы - HR+, HER2+, TNBC, с использованием парного рангового критерия Вилкоксона (значение p меньше 0,001).
[155] ФИГ. 62A-B: Обнаружение цоДНК в серийных образцах плазмы предсказывает безрецидивную выживаемость (A) Безрецидивная выживаемость в соответствии с обнаружением цоДНК в любых последующих образцах плазмы после операции [ОР: 35,84 (7,9626 - 161,32] значение p меньше 0,001. (B Безрецидивная выживаемость по данным выявления цоДНК в первом послеоперационном образце плазмы [ОР: 11,784 (4,2784 - 32,457]. Данные получены от n = 49 пациентов со значением p меньше 0,001.
[156] ФИГ. 63: (A-E) Уровни в плазме цоДНК в нескольких временных точках плазмы для пяти пациентов с раком молочной железы (по одному на панель). Полноэкзомное секвенирование первичной опухоли и соответствующего контроля идентифицировало специфические для пациента соматические мутации. Используя аналитически подтвержденный рабочий процесс Signatera™ RUO, каждый анализ для конкретного пациента был разработан для определения 16 соматических ОНВ и вариантов вставок/делеций с использованием массового параллельного секвенирования (медианная глубина более 100000X на мишень). Медианные значения ЧВА обозначены синим кружком, а сплошная линия представляет средний профиль ЧВА по времени. Время упреждения рассчитывается по разнице для клинического рецидива и молекулярного рецидива. Уровни CA15-3 отображаются в зависимости от времени, а исходные уровни отмечены светло-голубым оттенком. (F) Сводная информация о ЧВА и количестве мишеней, обнаруженных при молекулярном и клиническом рецидиве, для всех положительных по цоДНК образцов, за исключением пациентов с одной временной точкой.
[157] ФИГ. 64A-C: Стратегия Signatera выбора варианта для 49 специфических для пациентов панелей. (Вверху) Распределение ЧВА опухолевой ткани на индивидуальной панели пациента. Разные цвета представляют разные подтипы: HER2- (темно-синий), трижды негативный (оранжевый) и HER2+ (зеленый). (В центре) Количество предполагаемых клональных и субклональных вариантов на индивидуальной панели пациентов. Медианное число клональных вариантов на 49 индивидуальных панелях составляет 13 из 16. (Внизу) Количество предполагаемых клональных и субклональных вариантов в данных ПЭС пациентов.
[158] ФИГ. 65: (A-L) Уровни цоДНК в плазме во множественных временных точках плазмы для 12 (11 рецидивных и 1 безрецидивный) пациентов с раком молочной железы. Полноэкзомное секвенирование первичной опухоли и соответствующего контроля идентифицировало специфические для пациента соматические мутации. Используя аналитически подтвержденный рабочий процесс Signatera™, каждый анализ для конкретного пациента был разработан для определения 16 соматических ОНВ и вариантов вставок/делеций с использованием массового параллельного секвенирования (средняя глубина более 100000X на мишень). Средние значения ЧВА обозначены синим кружком, а сплошная линия представляет средний профиль ЧВА в зависимости от времени. Время упреждения рассчитывается по разнице для клинического рецидива и молекулярного рецидива. Уровни CA15-3 отображаются в зависимости от времени, а исходные уровни отмечены светло-голубым оттенком.
[159] ФИГ. 66: Распределение ЧВА и количества мутантов. Всего в цоДНК-позитивных образцах плазмы обнаружена 251 мишень. ЧВА обнаруженных мишеней варьировалась от 0,01% до 64% с медианным значением 0,82%. Мы использовали наблюдаемую ЧВА с мутациями и общее количество молекул ДНК в каждом образце для расчета количества молекул опухоли, присутствующих в образце плазмы пациента. Количество обнаруженных мутантных молекул в 251 положительной мишени варьировалось от 1 до 6500 мутантных молекул, с медианным значением 39 молекул.
[160] ФИГ. 67A-D: Процесс контроля качества Signatera: Контроль качества проводился на каждом этапе рабочего процесса. Всего из 215 образцов плазмы 208 прошли процесс контроля качества образцов, и из 784 разработанных уникальных анализов 767 анализов прошли контроль качества анализа (что соответствует, в общей сложности, 3237 тестам, из которых 3328 были пройдены по всем образцам). A) Экстрагированная скДНК на мл. скДНК, экстрагированную из каждого образца плазмы количественно оценивали при помощи набора для теста Quant-iT High Sensitivity dsDNA Assay Kit. Образцы, где количество скДНК было менее 5 нг отмечались как ВНИМАНИЕ. Экстрагированная скДНК на мл была в диапазоне от 1 до 21,4 нг при медиане 4,7 нг. B) Подготовка ввода количества ДНК для библиотеки. В протоколе подготовки библиотеки в качестве ввода использовали до 66 нг скДНК из каждого образца плазмы. Количество вводимой ДНК для библиотеки варьировалось от 1 до 66 нг при медиане 25,02. Очищенные библиотеки перед переходом к следующему этапу подвергались контролю качества. C) Охват секвенированием. Тестирования с охватом менее 5000х были исключены из анализа. Впоследствии образцы, прошедшие менее 8 тестирований, не прошли контроль качества охвата последовательности. Медианная глубина считывания для анализов, прошедших тестирование КК, составила 110000x. D) Согласованность образцов. Для отслеживания целостности пробы использовались теги ОНП для измерения согласованности между образцами пациента. Для каждого образца плазмы был рассчитан показатель согласованности генотипирования по сравнению с их соответствующими парными данными генотипирования нормы. Образцы считаются происходящими от одних и тех же пациентов, когда по меньшей мере 85% их ОНВ имели идентичные генотипы. Шесть образцов плазмы, идентифицированных как замена, были исключены из анализов цоДНК.
[161] ФИГ. 68A-B: Результаты аналитической валидации. (A) Чувствительность обнаружения одиночной мишени. С помощью Signatera была достигнута аналитическая чувствительность приблизительно 60% для выявления мутаций при приблизительно 0,03% добавленной опухолевой ДНК. (б) Оценка чувствительности на уровне образца для Signatera, когда из набора из 16 вариантов-мишеней обнаружены по меньшей мере две мутации.
[162] ФИГ. 69: После скрининга и набора пациентов было проведено 6 ежемесячных заборов крови. Статус HER2 определяли с помощью иммуногистохимического анализа и флуоресцентного анализа гибридизации in situ. Если любой анализ оказывался положительным, считалось, что у пациента рак, положительный по HER2. НАХТ: неоадъювантная химиотерапия АХТ: адъювантная химиотерапия.
[163] ФИГ. 70: Диаграмма рабочего процесса для исследования мышечно-инвазивного рака мочевого пузыря в Примере 9.
[164] ФИГ. 71A-G: Резюме пациента для исследования мышечно-инвазивного рака мочевого пузыря в примере 9. ФИГ. 71А показывает частоту синонимичных и несинонимичных мутаций, распознанных из ПЭС. Опухоль одного пациента была подвергнута гипермутации с мутационной нагрузкой 126 мутаций/т.п.н. и она продемонстрировала мутацию POLD1, которая ранее была связана с гипермутаторами. (Campbell, B. B. et al. Comprehensive Analysis of Hypermutation in Human Cancer. Cell 171, 1042-1056.e10 (2017). ФИГ. 71B показывает относительный вклад мутационных сигнатур, связанных с раком мочевого пузыря. ФИГ. 71C показывает мутации в часто мутирующих генах при раке мочевого пузыря (TCGA) (Robertson, A. G. et al. Comprehensive Molecular Characterization of Muscle-Invasive Bladder Cancer. Cell 171, 540-556.e25 (2017)). ФИГ. 71D показывает вредные мутации в генах, связанных с реакцией на повреждения ДНК (DNA damage response - DDR), мутировавших в более чем 5% из 68 образцов. ФИГ. 71E показывает общее количество вредных мутаций DDR. ФИГ. 71F показывает клинические и гистопатологические характеристики. ФИГ. 71G показывает суммарный статус цоДНК.
[165] ФИГ. 72: Диаграмма с изложением клинического протокола и графика отбора проб для исследования мышечно-инвазивного рака мочевого пузыря в Примере 9.
[166] ФИГ. 73: Диаграмма с изложением рабочего процесса Signatera™.
[167] ФИГ. 74: Последовательное представление результатов цоДНК для всех проанализированных образцов, соответствующих исследованию мышечно-инвазивного рака мочевого пузыря в Примере 9. Пациенты разделены на три группы на основе статуса цоДНК: на верхней панели показаны пациенты с положительной цоДНК до и после цистэктомии (ЦЭ); средняя панель показывает пациентов, положительных по цоДНК только перед ЦЭ; нижняя панель показывает пациентов, отрицательных по цоДНК. Горизонтальные линии обозначают течение болезни каждого пациента, а кружки обозначают состояние цоДНК, красные кружки указывают образцы с по меньшей мере 2 положительными анализами. Информация о лечении и визуализации указана для каждого пациента.
[168] ФИГ. 75A-E: Графическое изображение прогностической ценности выявления цоДНК для исследования мышечно-инвазивного рака мочевого пузыря в Примере 9. Анализ выживаемости по Каплану-Мейеру, показывающий вероятность безрецидивной выживаемости (БРВ) и общей выживаемости (ОВ), стратифицированной по статусу цоДНК до химиотерапии (ФИГ. 75A), перед цистэктомией (ЦЭ) (ФИГ. 75B) и после цитэктомии (ЦЭ) (ФИГ. 75C). ФИГ. 75D показывает связь между рецидивом заболевания и состоянием цоДНК до химиотерапии, до цистэктомии и после цистэктомии, а также с рецидивом заболевания и состоянием лимфатического узла до цистэктомии. ФИГ. 75E показывает связь между состоянием цоДНК до цистэктомии (ЦЭ) и патологическим статусом при цистэктомии (ЦЭ). Оценка статистической значимости проводилась с использованием рангового критерия Уилкоксона для непрерывных переменных и точного критерия Фишера для категорийных переменных.
[169] ФИГ. 76: Графики, показывающие изменения цоДНК при отдельных течениях заболевания для исследования мышечно-инвазивного рака мочевого пузыря в Примере 9. ФИГ. 76 показывает представление детальных течений заболевания, применяемых способов лечения и связанных с ними последовательных анализов цоДНК от избранных пациентов. Статус цоДНК, применяемое лечение и результаты визуализации представлены согласно подписи. Указано положительное время упреждения для выявления рецидива на основе цоДНК.
[170] ФИГ. 77: Графики, показывающие разницу во времени между молекулярным рецидивом (позитивность по цоДНК) и клиническим рецидивом (положительная рентгенограмма) для исследования мышечно-инвазивного рака мочевого пузыря в Примере 9. Значение р рассчитывали с использованием парного рангового критерия Уилкоксона.
[171] ФИГ. 78A-H: Графики, показывающие прогностические маркеры ответа на химиотерапию для исследования мышечно-инвазивного рака мочевого пузыря в Примере 9. ФИГ. 78А показывает связь между рецидивом заболевания и реакцией на химиотерапию. ФИГ. 78B показывает, соответственно, относительный вклад сигнатуры 5 для всех пациентов, стратифицированных по реакции на химиотерапию, и статус мутации ERCC2. ФИГ. 78C показывает долю пациентов, отвечающих на терапию, относительно статуса мутации ERCC2. ФИГ. 78D Фигура подтипа РНК figures_NEW. ФИГ. 78E показывает связь между цоДНК и реакцией на химиотерапию для пациентов, отрицательных по цоДНК на протяжении всего течения заболевания, у пациентов, у которых уровень цоДНК падает до нуля, и у пациентов, у которых уровень цоДНК остается положительным. ФИГ. 78F показывает уровень цоДНК для всех пациентов с обнаруживаемой цоДНК до, во время и после химиотерапии. Пациенты сгруппированы по реакции на химиотерапию и указан статус рецидива.
[172] ФИГ. 79A-D: Графики, показывающие общее количество выявленных мутаций на пациента в зависимости от статуса ERCC2 или числа мутаций повреждения повреждающей реакции ДНК (DDR) для исследования мышечно-инвазивного рака мочевого пузыря в Примере 9.
[173] ФИГ. 80: Графики, изображающие гетерогенность генома в первичной опухоли и метастатическом рецидиве для исследования мышечно-инвазивного рака мочевого пузыря в Примере 9. Данные полноэкзомного секвенирования (ПЭС) первичных опухолей сравнивали с цоДНК. Данные ПЭС из образцов плазмы с высокой частотой вариантного аллеля (ЧВА) в цоДНК, обнаруженных при метастатическом рецидиве. Геномные позиции с мутациями, идентифицированными либо в плазме, либо в данных экзома опухоли, были исследованы для подсчета оснований. Показаны результирующие частоты аллелей, идентифицированные в плазме и данных экзома опухоли. Отдельные мутации имеют цветовую кодировку в соответствии со статистической вероятностью (силой) распознавания мутации. Диаграммы Венна представляют количество мутаций, идентифицированных исключительно в опухоли, плазме или в обеих.
[174] ФИГ. 81: Графики, отражающие частоту вариантного аллеля (% ЧВА) в разные дни относительно цистэктомии (ЦЭ) у 8 пациентов из исследования мышечно-инвазивного рака мочевого пузыря в Примере 9.
[175] ФИГ. 82: Графики, показывающие уровень цоДНК в плазме у 10 пациентов, ранее проанализированных с помощью цифровой капельной ПЦР, по сравнению со сверхглубоким секвенированием для исследования мышечно-инвазивного рака мочевого пузыря в Примере 9.
[176] ФИГ. 83A-E: Графики, показывающие клинические, гистопатологические и молекулярные параметры для всех 125 пациентов. ФИГ. 83А показывает относительный вклад пяти наиболее распространенных мутационных признаков, связанных с колоректальным раком. ФИГ. 83B показывает частоту синонимичных и несинонимичных мутаций, распознанных из ПЭС. ФИГ. 83C изображает график, показывающий мутации в часто мутирующих генах при колоректальном раке (TCGA) {Cancer Genome Atlas, 2012 # 52}. ФИГ. 83D показывает клинические и гистопатологические характеристики. ФИГ. 83E показывает график, суммирующий статус цоДНК до и после операции.
[177] ФИГ. 84: Диаграмма, показывающая включение пациентов, сбор образцов и определения подгрупп пациентов, используемых для решения определенных клинических вопросов. Сокращения: цоДНК, циркулирующая опухолевая ДНК; КТ, компьютерная томография; после-опер., послеоперационный; TTR, время до рецидива.
[178] ФИГ. 85A-C: Графики, показывающие тесты контроля качества (КК) рабочего процесса для всей последовательности экзома образцов пациентов. 793 (99%) из 795 образцов плазмы прошли процесс контроля качества образца. 194 пробы (из 70 пациентов) прогоняли с маркером ОНП для проверки соответствия между образцом плазмы и соответствующей биопсией ткани. Все 194 образца плазмы прошли КК. ФИГ. 85А показывает количество вводимой ДНК в подготовку библиотеки. В качестве ввода в протокол подготовки библиотеки использовалось до 66 нг свободно-клеточной ДНК (скДНК) из каждого образца плазмы. Количество вводимой ДНК библиотеки варьировалось от 1 до 66 нг при медиане 45,66. Очищенные библиотеки подвергались контролю качества перед переходом к следующему этапу. Один образец не прошел КК подготовки библиотеки. ФИГ. 85B показывает охват секвенирования. Анализы с охватом менее 5000х были исключены из анализа. Впоследствии образцы с менее чем 8 прохождением анализов не прошли контроль качества охвата последовательности. Один образец не соответствует требованию охвата последовательности. Медианная глубина считывания для анализов, прошедших КК охвата, составила 105000x. ФИГ. 85C показывает частоту ошибок секвенирования, измеренную во всех образцах плазмы. Средний коэффициент ошибок при транзициях составляет 5e-5, а средний коэффициент ошибок при трансверсиях - 8e-6.
[179] ФИГ. 86 показывает результаты и динамику циркулирующей опухолевой ДНК (цоДНК) для каждого отдельного пациента.
[180] ФИГ. 87A-F показывает состояние цоДНК до операции, на 30 день после операции и во время адъювантной химиотерапии (АХТ). ФИГ. 87А показывает предоперационное обнаружение цоДНК. ФИГ. 87B показывает частоту рецидивов. ФИГ. 87C показывает оценки TTR Каплана-Мейера для 94 пациентов I-III стадии, стратифицированных по послеоперационному состоянию на 30-й день и по статусу цоДНК. ФИГ. 87D показывает влияние АХТ на пациентов, позитивных по цоДНК, оцениваемых по частоте рецидивов и статусу цоДНК в динамике. ФИГ. 87E показывает частоту рецидивов, стратифицированную по статусу цоДНК при первом посещении после АХТ. ФИГ. 87F показывает оценки TTR Каплана-Мейера для 58 пациентов, лечившихся АХТ, стратифицированных по статусу цоДНК при первом посещении после АХТ.
[181] ФИГ. 88 демонстрирует предоперационное выявление раково-эмбрионального антигена (РЭА) у 125 пациентов с I-III стадией КРР.
[182] ФИГ. 89 показывает схематический обзор результатов профилирования цоДНК образцов плазмы, включенных в анализ цоДНК в день 30, упорядоченный по статусу рецидива и стадии заболевания. Пациенты, отмеченные знаком(ами) а, имеют синхронный КРР. Плазма, отмеченная **, является положительной только во втором пуле (n=1).
[183] ФИГ. 90A-B показывает схематический обзор результатов профилирования цоДНК для подмножества образцов плазмы, включенных в анализ цоДНК в день 30 и получавших АХТ, упорядоченный по статусу рецидива и стадии заболевания. Пациенты, отмеченные знаком(ами) а, имеют синхронный КРР.
[184] ФИГ. 91 показывает схематический обзор результатов профилирования цоДНК образцов плазмы, включенных в последовательный пост-АХТ анализ цоДНК, упорядоченный по статусу рецидива, послеоперационному состоянию цоДНК и продолжительности наблюдения. Пациенты, отмеченные знаком(ами) а, имеют синхронный КРР (n=2). Образцы плазмы, отмеченные **, являются положительными только во втором пуле (n=1).
[185] ФИГ. 92 показывает схематический обзор результатов профилирования СЕА образцов плазмы, включенных в последовательный анализ цоДНК после АХТ, упорядоченный по статусу рецидива, послеоперационному состоянию цоДНК и продолжительности наблюдения. Пациенты, отмеченные буквой(ами) а, имеют синхронный КРР (n=2). Плазма, отмеченная **, является положительной только во втором пуле (n=1).
[186] ФИГ. 93A-D: Графики, показывающие связь между статусом цоДНК и рецидивом после радикального лечения. ФИГ. 93А показывает частоту рецидивов, стратифицированных по статусу цоДНК в динамике. ФИГ. 93B показывает оценки TTR Каплана-Мейера для 75 пациентов с образцами в динамике, стратифицированными по статусу цоДНК в динамике. ФИГ. 93C показывает график, сравнивающий время до радиологического рецидива и рецидива по цоДНК. ФИГ. 93D показывает, что частота вариантного аллеля (ЧВА) цоДНК в плазме увеличивается в направлении радиологического рецидива. Ранние сроки до и во время АХТ опущены.
[187] ФИГ. 94: Схематический обзор результатов профилирования по цоДНК образцов плазмы в динамике у пациентов с рецидивами и без рецидивов. Пациенты с одним положительным образцом плазмы во время наблюдения считаются положительными.
[188] ФИГ. 95: Схематический обзор результатов профилирования РЭА для образцов сыворотки в динамике у пациентов с рецидивами и без рецидивов. Пациенты с одним положительным образцом плазмы во время наблюдения считаются положительными.
[189] ФИГ. 96: График, сравнивающий время до радиологического рецидива и рецидива по РЭА.
[190] ФИГ. 97A-C: Выявление значимой мутации у пациентов с рецидивом. На фигуре 97А показан процент рецидивов по цоДНК+ у пациентов со значимыми мутациями, обнаруженными во время наблюдения. Первый образец цоДНК+ (левая колонка) и все образцы цоДНК+ плазмы (правая колонка). ФИГ. 97B показывает значимые варианты, распознанные в крови. Корреляция между средними значениями ЧВА в крови, рассчитанными с использованием анализов цоДНК+ Signatera, и частотами вариантных аллелей (ЧВА) значимых мутаций построена в логарифмическом масштабе по горизонтальной и вертикальной осям. ФИГ. 97C показывает серийное профилирование цоДНК двух репрезентативных рецидивных пациентов с значимыми мутациями.
[191] ФИГ. 98: Схематическое сравнение текущего стандарта медицинской практики и потенциального послеоперационного ведения пациента, определяемого по цоДНК.
[192] ФИГ. 99: График, показывающий снижение цоДНК при адъювантной химиотерапии (АХТ).
[193] ФИГ. 100A-B: Графики, показывающие связь между состоянием цоДНК и рецидивом после радикального лечения. ФИГ. 100A показывает частоту рецидивов, стратифицированную по состоянию цоДНК в динамике, и оценки TTR Каплана-Мейера для 58 пациентов с образцами в динамике, стратифицированными по анализу цоДНК в динамике. ФИГ. 100B показывает частоту рецидивов, стратифицированную с помощью анализа РЭА, и оценки TTR Каплана-Мейера для 58 пациентов с образцами в динамике, стратифицированные с помощью анализа РЭА.
[194] Вышеуказанные фигуры представлены в порядке представления, а не ограничения.
ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ
[195] Способы и композиции, представленные в настоящем документе, улучшают обнаружение, диагностику, стадирование, скрининг, лечение и ведение рака (например, рака молочной железы, рака мочевого пузыря или колоректального рака). Способы, предоставленные в данном документе, в иллюстративных вариантах воплощения анализируют мутации однонуклеотидного варианта (ОНВ) в циркулирующих жидкостях, особенно в циркулирующей опухолевой ДНК. Способы обеспечивают преимущество выявления большего количества мутаций, обнаруживаемых в опухоли, и клональных, а также субклональных мутаций в одном тесте, а не в нескольких тестах, которые потребуются, если вообще они будут эффективными, в случае использования образцов опухоли. Способы и композиции могут быть полезны сами по себе, или они могут быть полезны при использовании вместе с другими способами для обнаружения, диагностики, установления стадии, скрининга, лечения и ведения рака (например, рака молочной железы, рака мочевого пузыря или колоректального рака), например, чтобы помочь поддержать результаты этих других способов для того, чтобы обеспечить большую уверенность и/или определенный результат.
[196] Соответственно, в настоящем документе в одном варианте воплощения представлен способ определения однонуклеотидных вариантов, присутствующих при раке (например, раке молочной железы, раке мочевого пузыря или колоректальном раке), путем определения однонуклеотидных вариантов, присутствующих в образце цоДНК от индивидуума, например, лица, имеющего или подозреваемого на наличие рака (например, рака молочной железы, рака мочевого пузыря или колоректального рака) с использованием рабочего процесса амплификации/секвенирования ОНВ цоДНК, представленного в настоящем документе.
[197] Термины «рак» и «раковый» относятся или описывают физиологическое состояние у животных, которое обычно характеризуется нерегулируемым ростом клеток. «Опухоль» включает одну или более раковых клеток. Существует несколько основных видов рака. Карцинома представляет собой это рак, который начинается на коже или в тканях, которые выстилают или покрывают внутренние органы. Саркома представляет собой рак, который начинается в кости, хряще, жире, мышцах, кровеносных сосудах или других соединительных или поддерживающих тканях. Лейкемия представляет собой рак, который начинается в кроветворной ткани, такой как костный мозг, и вызывает образование большого количества аномальных клеток крови и попадание их в кровь. Лимфома и множественная миелома представляет собой рак, который начинается в клетках иммунной системы. Рак центральной нервной системы представляет собой рак, который начинается в тканях головного и спинного мозга.
[198] В некоторых вариантах воплощения рак включает острый лимфобластный лейкоз; острый миелоидный лейкоз; адренокортикальную карциному; рак, связанный со СПИДом; лимфому, связанную со СПИДом; анальный рак; рак аппендикса; астроцитомы; атипичную тератоидную/рабдоидную опухоль; базально-клеточную карциному; рак мочевого пузыря; глиому ствола головного мозга; опухоль головного мозга (в том числе глиому ствола головного мозга, атипичную тератоидную/рабдоидную опухоль центральной нервной системы, эмбриональные опухоли центральной нервной системы, астроцитомы, краниофарингиому, эпендимобластому, эпендимому, медуллобластому, медуллоэпителиому, пинеальные паренхиматозные опухоли промежуточной дифференцировки, супратенториальные недифференцированные нейроэктодермальные опухоли и пинеобластому); рак груди; бронхиальные опухоли; лимфому Беркита; рак неизвестной первичной локализации; карциноидную опухоль; карциному неизвестной первичной локализации; атипичную тератоидную/рабдоидную опухоль центральной нервной системы; эбриональные опухоли центральной нервной системы; рак шейки матки; раковые заболевания у детей; хордому; хронический лимфолейкоз; хронический миелогенный лейкоз; хронические миелопролиферативные нарушения; рак толстой кишки; колоректальный рак; краниофарингиому; кожную Т-клеточную лимфому; опухоли островковых клеток эндокринной системы поджелудочной железы; рак эндометрия; эпендимобластому; эпендимому; рак пищевода; эстезионейробластому; саркому Юинга; экстракраниальную герминогенную опухоль; внегонадную герминогенную опухоль; рак внепеченочного желчного протока; рак желчного пузыря; рак желудочно-кишечного тракта (желудка); желудочно-кишечную карциноидную опухоль; желудочно-кишечную стромально-клеточную опухоль; желудочно-кишечную стромальную опухоль (GIST); гестационную трофобластическую опухоль; глиому; волосатоклеточный лейкоз; рак головы и шеи; рак сердца; лимфому Ходжкина; гипофарингеальный рак; внутриглазную меланому; опухоли островковых клеток; саркому Капоши; рак почки; гистиоцитоз клеток Лангерганса; рак гортани; рак губы; рак печени; злокачественную фиброзную гистиоцитому, рак кости; медуллобластому; медуллоэпителиому; меланому; карциному клеток Меркеля; рак кожи из клеток Меркеля; мезотелиому; метастатический плоскоклеточный рак шеи с первичным раком неизвестного происхождения; рак ротовой полости; синдромы множественной эндокринной неоплазии; множественную миелому; множественную миелому/новообразование плазмоцитов; грибовидный микоз; миелодиспластические синдромы; миелопролиферативные новообразования; рак полости носа; рак носоглотки; нейробластому; неходжкинскую лимфому; немеланомный рак кожи; немелкоклеточный рак легких; рак ротовой полости; рак полости рта; рак ротоглотки; остеосаркому; другие опухоли головного и спинного мозга; рак яичников; эпителиальный рак яичников; герминоклеточную опухоль яичников; пограничную опухоль яичников; рак поджелудочной железы; папилломатоз; рак околоносовых пазух; рак паращитовидной железы; рак таза; рак полового члена; рак глотки; пинеальные паренхиматозные опухоли промежуточной дифференцировки; пинеобластому; опухоль гипофиза; новообразование плазматических клеток/множественную миелому; плевропульмональную бластому; первичную лимфому центральной нервной системы (ЦНС); первичный гепатоцеллюлярный рак печени; рак простаты; рак прямой кишки; рак почки; почечно-клеточный (почечный) рак; почечно-клеточный рак; рак респираторного тракта; ретинобластому; рабдомиосаркому; рак слюнных желез; синдром Сезари; мелкоклеточный рак легких; рак тонкой кишки; саркому мягких тканей; плоскоклеточную карциному; плоскоклеточный рак шеи; желудочно-кишечный рак (рак желудка); супратенториальные недифференцированные нейроэктодермальные опухоли; Т-клеточную лимфому; рак яичек; рак горла; карциному тимуса; тимому; рак щитовидной железы; переходно-клеточный рак; переходно-клеточный рак почечной лоханки и мочеточника; трофобластическую опухоль; рак мочеточника; рак уретры; рак матки; саркому матки; рак влагалища; рак вульвы; макроглобулинемию Вальденстрема; или опухоль Вильма.
[199] В другом варианте воплощения в настоящем документе представлен способ обнаружения рака (например, рака молочной железы, рака мочевого пузыря или колоректального рака) в образце крови или ее фракции от индивидуума, такого как индивидуум, предположительно имеющий рак. Это включает определение однонуклеотидных вариантов, присутствующих в образце, путем определения однонуклеотидных вариантов, присутствующих в образце цоДНК, с использованием рабочего процесса амплификации/секвенирования ОНВ цоДНК, представленного в настоящем документе. Наличие 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 или 15 ОНВ на нижней границе диапазона, а также 2, 3, 4, 5 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 40 или 50 ОНВ на верхней границе диапазона в образце на множестве однонуклеотидных локусов свидетельствует о наличии рака (например, рака молочной железы, рака мочевого пузыря или колоректального рака).
[200] В другом варианте воплощения в настоящем документе предложен способ выявления клонального однонуклеотидного варианта в опухоли индивидуума (например, рак молочной железы, рак мочевого пузыря или колоректальный рак). Способ включает выполнение рабочего процесса амплификации/секвенирования ОНВ цоДНК, как предусмотрено в настоящем документе, и определение частоты вариантного аллеля для каждого из локусов ОНВ на основе секвенирования множества копий серий ампликонов. Более высокая относительная частота аллелей по сравнению с другими однонуклеотидными вариантами множества локусов однонуклеотидного варианта свидетельствует о клональном однонуклеотидном варианте в опухоли. Частоты вариантных аллелей хорошо известны в области секвенирования. Поддержка этого варианта воплощения предоставляется, например, на ФИГ. 12-14.
[201] В некоторых вариантах воплощения способ дополнительно включает определение плана лечения, терапии и/или введения индивидууму соединения, которое нацелено на один или более клональных однонуклеотидных вариантов. В некоторых примерах субклональные и/или другие клональные ОНВ не являются мишенью для терапии. Конкретные способы лечения и связанные с ними мутации представлены в других разделах данного описания и известны в данной области техники. Соответственно, в определенных примерах способ дополнительно включает введение соединения индивидууму, где, как известно, это соединение особенно эффективно для лечения рака (например, рака молочной железы, рака мочевого пузыря или колоректального рака), имеющего один или более из определенных однонуклеотидных вариантов.
[202] В определенных аспектах этого варианта воплощения частота вариантного аллеля более 0,25, 0,5, 0,75, 1,0, 5 или 10% указывает на клональный однонуклеотидный вариант. Эти точки отсечения подтверждаются данными в табличной форме на ФИГ. 20A-B.
[203] В определенных примерах этого варианта воплощения рак представляет собой рак молочной железы стадии 1а, 1b или 2а, рак мочевого пузыря или колоректальный рак. В некоторых примерах этого варианта воплощения рак представляет собой рак молочной железы стадии 1a или 1b, рак мочевого пузыря или колоректальный рак. В определенных примерах этого варианта воплощения индивидуум не подвергается хирургическому вмешательству. В определенных примерах этого варианта воплощения индивидуум не подвергается биопсии.
[204] В некоторых примерах этого варианта воплощения клональный ОНВ идентифицируется или дополнительно идентифицируется, если другие тесты, такие как прямое тестирование опухоли, предполагают, что в тесте ОНВ является клональным ОНВ, для любого ОНВ в тесте, который имеет переменную частоту аллеля, превышающую по меньшей мере одну четверть, одну треть, одну половину или три четверти других определенных однонуклеотидных вариантов.
[205] В некоторых вариантах воплощения приведенные в данном документе способы выявления ОНВ в цоДНК могут быть использованы вместо прямого анализа ДНК из опухоли. Представленные в данном документе результаты показывают, что ОНВ, которые с большей вероятностью являются клональными ОНВ, имеют более высокие ЧВА (см., например, ФИГ. 12-14).
[206] В определенных примерах любого из вариантов воплощения способа, представленного в данном документе, до того, как выполнена целевая амплификация на цоДНК от индивидуума, предоставляются данные об ОНВ, которые были обнаружены в опухоли от индивидуума. Соответственно, в этих вариантах воплощения реакция амплификации/секвенирования ОНВ выполняется на одном или более образцов опухоли от индивидуума. В этих способах реакция амплификации/секвенирования ОНВ цоДНК, представленная в настоящем документе, все еще является преимущественной, поскольку она обеспечивает жидкую биопсию клональных и субклональных мутаций. Кроме того, как предусмотрено в настоящем документе, клональные мутации могут быть более однозначно идентифицированы у индивидуума, у которого есть рак (например, рак молочной железы, рак мочевого пузыря или колоректальный рак), если определяется высокий процент ЧВА для ОНВ, например, более 1, 2, 3, 4, 5, 6, 7, 8, 9, 10% ЧВА в образце цоДНК от индивидуума.
[207] В определенном варианте воплощения способ, предоставленный в настоящем документе, можно использовать для определения того, следует ли изолировать и анализировать цоДНК из циркулирующих свободных нуклеиновых кислот от индивидуума с раком (например, раком молочной железы, раком мочевого пузыря или колоректальным раком). Во-первых, определяется, является ли рак раком молочной железы, раком мочевого пузыря или колоректальным раком. Если рак представляет собой рак молочной железы, рак мочевого пузыря или колоректальный рак, от индивидуума выделяют циркулирующие свободные нуклеиновые кислоты. Способ в некоторых примерах дополнительно включает определение стадии рака.
[208] В некоторых способах в настоящем изобретении предложены композиции по изобретению и/или твердые носители. Композиция, содержащая циркулирующие опухолевые фрагменты нуклеиновой кислоты, содержащие универсальный адаптор, где циркулирующие опухолевые нуклеиновые кислоты получены из рака молочной железы, рака мочевого пузыря или колоректального рака.
[209] В некоторых вариантах воплощения в данном документе предложена композиция по изобретению, которая включает циркулирующие в опухоли фрагменты нуклеиновой кислоты, содержащие универсальный адаптор, где циркулирующие в опухоли нуклеиновые кислоты получены из образца крови или его фракции от индивидуума с раком (например, раком молочной железы, раком мочевого пузыря или колоректальным раком). Эти способы обычно включают образование фрагмента цоДНК, который включает универсальный адаптор. Кроме того, такие способы обычно включают образование твердой подложки, особенно твердой подложки для высокопроизводительного секвенирования, которая включает множество клональных популяций нуклеиновых кислот, где клональные популяции содержат ампликоны, полученные из образца циркулирующих свободных нуклеиновых кислот, где имеется цоДНК. В иллюстративных вариантах воплощения изобретения, основанных на неожиданных результатах, представленных в настоящем документе, цоДНК происходит от рака (например, рака молочной железы, рака мочевого пузыря или колоректального рака).
[210] Аналогичным образом, в настоящем документе в качестве варианта воплощения изобретения предлагается твердая подложка, содержащая множество клональных популяций нуклеиновых кислот, где клональные популяции содержат фрагменты нуклеиновых кислот, полученные из образца циркулирующих свободных нуклеиновых кислот из образца крови или его фракции, от индивидуума с раком (например, раком молочной железы, раком мочевого пузыря или колоректальным раком).
[211] В некоторых вариантах воплощения фрагменты нуклеиновой кислоты в разных клональных популяциях содержат один и тот же универсальный адаптор. Такая композиция обычно образуется во время реакции секвенирования с высокой пропускной способностью в способах по настоящему изобретению.
[212] Клональные популяции нуклеиновых кислот могут быть получены из фрагментов нуклеиновых кислот из набора образцов от двух или более индивидуумов. В этих вариантах воплощения фрагменты нуклеиновой кислоты содержат один из ряда молекулярных штрих-кодов, соответствующих образцу в наборе образцов.
[213] Подробные аналитические способы представлены в данном документе в аналитическом разделе как Способ 1 ОНВ и Способ 2 ОНВ. Любой из способов, представленных в настоящем документе, может дополнительно включать аналитические этапы, представленные в данном документе. Соответственно, в некоторых примерах способы определения того, присутствует ли однонуклеотидный вариант в образце, включают в себя идентификацию значения достоверности для каждого определения аллеля в каждом из наборов локусов однонуклеотидных вариаций, которые могут быть основаны по меньшей мере частично на глубине считывания для локусов. Доверительный предел может быть установлен как по меньшей мере 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% или 99%. Доверительный предел для разных типов мутаций может быть установлен на разных уровнях.
[214] Способ может быть выполнен с глубиной считывания для множества локусов однонуклеотидных вариаций по меньшей мере 5, 10, 15, 20, 25, 50, 100, 150, 200, 250, 500, 1000, 10000, 25000, 50000, 100000, 250000, 500000 или 1 миллион.
[215] В некоторых вариантах воплощения, способ любого из вариантов воплощения, представленных в настоящем документе, включает в себя определение эффективности, и/или определение частоты ошибок для цикла для каждой реакции амплификации мультиплексной реакции амплификации локусов однонуклеотидных вариантов. Затем эффективность и частоту ошибок можно использовать для того, чтобы определить, присутствует ли в образце однонуклеотидный вариант из набора локусов однонуклеотидных вариантов. Также в некоторые варианты воплощения могут быть включены более подробные аналитические этапы, представленные в Способе 2 ОНВ, представленном в аналитическом способе.
[216] В иллюстративных вариантах воплощения любого из представленных в данном документе способов набор локусов однонуклеотидных вариаций включает в себя все локусы однонуклеотидных вариаций, идентифицированные в наборах данных TCGA и COSMIC для рака (например, рака молочной железы, рака мочевого пузыря или колоректального рака).
[217] В некоторых вариантах воплощения любого из приведенных в данном документе способов набор локусов однонуклеотидных вариантов включает 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 40, 50, 75, 100, 250, 500, 1000, 2500, 5000 или 10000 локусов однонуклеотидных вариаций, о которых известно, что они связаны с раком (например, раком молочной железы, раком мочевого пузыря или колоректальным раком) на нижнем конце диапазона, и, 5, 6 , 7, 8, 9, 10, 15, 20, 25, 30, 40, 50, 75, 100, 250, 500, 1000, 2500, 5000, 10000, 20000 и 25000 на верхнем конце диапазона.
[218] В любом из представленных в данном документе способов обнаружения ОНВ, которые включают рабочий процесс амплификации/секвенирования ОНВ цоДНК, можно использовать улучшенные параметры амплификации для мультиплексной ПЦР. Например, где реакция амплификации представляет собой реакцию ПЦР, а температура отжига на 1, 2, 3, 4, 5, 6, 7, 8, 9 или 10 °C больше, чем температура плавления на нижнем конце диапазона и 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 или 15 ° на верхнем конце диапазона, для по меньшей мере 10, 20, 25, 30, 40, 50, 60, 70, 75, 80, 90, 95 или 100% праймеров из набора праймеров.
[219] В некоторых вариантах воплощения, в которых реакция амплификации представляет собой реакцию ПЦР, продолжительность стадии отжига в реакции ПЦР составляет от 10, 15, 20, 30, 45 и до 60 минут в нижнем конце диапазона, и 15 20, 30, 45, 60, 120, 180 или 240 минут в верхнем конце диапазона. В некоторых вариантах воплощения концентрация праймера при амплификации, такой как реакция ПЦР, составляет от 1 до 10 нМ. Кроме того, в примерных вариантах воплощения праймеры в наборе праймеров предназначены для минимизации образования димера праймера.
[220] Соответственно, в примере любого из представленных в данном документе способов, которые включают стадию амплификации, реакция амплификации представляет собой реакцию ПЦР, температура отжига на 1-10 °С выше, чем температура плавления по меньшей мере 90% праймеров из набора праймеров, продолжительность стадии отжига в реакции ПЦР составляет от 15 до 60 минут, концентрация праймеров в реакции амплификации составляет от 1 до 10 нМ, и праймеры в наборе праймеров предназначены для минимизации образования димера праймера. В дополнительном аспекте этого примера реакцию мультиплексной амплификации проводят в условиях ограничивающего праймера.
[221] В другом варианте воплощения в настоящем документе представлен способ поддержки диагноза рака (например, рака молочной железы, рака мочевого пузыря или колоректального рака) для индивидуума, такого как индивидуум, у которого предположительно имеется рак (например, рак молочной железы, рак мочевого пузыря или колоректальный рак), из образца крови или его фракции от индивидуума, который включает выполнение рабочего процесса амплификации/секвенирования ОНВ цоДНК, как предусмотрено в настоящем документе, для определения наличия одного или более однонуклеотидных вариантов во множестве локусов однонуклеотидного варианта. В данном варианте воплощения применяются следующие элементы, утверждения, рекомендации или правила: отсутствие однонуклеотидного варианта подтверждает диагноз аденокарциномы стадии 1a, 1b или 2a, наличие однонуклеотидного варианта поддерживает диагноз плоскоклеточного рака или стадии аденокарциномы 2b или 3a и/или наличие десяти или более однонуклеотидных вариантов подтверждают диагноз плоскоклеточного рака или аденокарциномы стадии 2b или 3.
[222] Эти результаты идентифицируют анализ с использованием рабочего процесса амплификации/секвенирования ОНВ цоДНК образцов аденокарциномы и мелкоклеточного рака легкого от индивидуума в качестве ценного способа для идентификации ОНВ, обнаруженного в опухоли аденокарциномы, особенно для опухолей аденокарциномы стадии 2b и 3a, и особенно опухоли мелкоклеточного рака на любой стадии (см., например, ФИГ. 15 и ФИГ. 20A-B).
[223] В некоторых вариантах воплощения способы, представленные в данном документе для обнаружения ОНВ, могут использоваться для руководства схемой терапии. Существует доступная терапия и терапия, находящаяся на стадии разработки, которая направлена на специфические мутации, связанные с аденокарциномой и мелкоклеточным раком (Nature Review Cancer. 14:535-551 (2014). Например, обнаружение мутации EGFR в L858R или T790M может быть информативным для выбора терапии. Эрлотиниб, гефитиниб, афатиниб, AZK9291, CO-1686 и HM61713 являются современными способами лечения, одобренными в США или в клинических испытаниях, которые нацелены на специфические мутации EGFR. В другом примере мутация G12D, G12C или G12V в KRAS может использоваться для направления индивидуума на терапию комбинацией селуметиниба плюс доцетаксел. В качестве другого примера, мутация V600E в BRAF может использоваться для направления субъекта на лечение вемурафенибом, дабрафенибом и траметинибом.
[224] Образец, анализируемый способами по настоящему изобретению, в некоторых иллюстративных вариантах воплощения, представляет собой образец крови или его фракцию. Способы, представленные в настоящем документе, в некоторых вариантах воплощения специально адаптированы для амплификации фрагментов ДНК, особенно фрагментов ДНК опухоли, которые обнаруживают в циркулирующей опухолевой ДНК (цоДНК). Такие фрагменты обычно имеют длину приблизительно 160 нуклеотидов.
[225] В данной области техники известно, что свободно-клеточная нуклеиновая кислота (скНК), например, ДНК, может высвобождаться в кровоток посредством различных форм гибели клеток, таких как апоптоз, некроз, аутофагия и некроптоз. СкДНК фрагментирована, и распределение фрагментов по размерам варьируется от 150-350 п.н. до более, чем 10000 п.н. (см. Kalnina et al. World J Gastroenterol. 2015 Nov 7; 21(41): 11636-11653). Например, распределение размеров фрагментов ДНК плазмы у пациентов с гепатоцеллюлярной карциномой (ГЦК) охватывало диапазон 100-220 п.н. с пиком частоты подсчета приблизительно 166 п.н. и самой высокой концентрацией опухолевой ДНК в фрагментах длиной 150-180 п.н. (см.: Jiang et al. Proc Natl Acad Sci USA 112:E1317-E1325).
[226] В иллюстративном варианте воплощения циркулирующую опухолевую ДНК (цоДНК) выделяют из крови с использованием пробирки с EDTA-2Na после удаления клеточного дебриса и тромбоцитов путем центрифугирования. Образцы плазмы могут храниться при минус 80 °C до тех пор, пока ДНК не будет экстрагирована с использованием, например, набора QIAamp DNA Mini Kit (Qiagen, Hilden, Германия), (например, Hamakawa et al., Br J Cancer. 2015; 112:352-356). Hamakava et al. сообщали о медианной концентрации экстрагированной свободно-клеточной ДНК во всех образцах, составляющей 43,1 нг на мл плазмы (диапазон 9,5-1338 нг/мл) и о диапазоне мутантной фракции 0,001-77,8% с медианой 0,90%.
[227] В некоторых иллюстративных вариантах воплощения образец представляет собой опухоль. В данной области техники известны способы выделения нуклеиновой кислоты из опухоли и создания библиотеки нуклеиновых кислот из такого образца ДНК с учетом приведенных в данном документе указаний. Кроме того, принимая во внимание приведенные в данном документе указания, специалист в данной области техники поймет, как, в дополнение к образцам цоДНК, создать библиотеку нуклеиновых кислот, подходящую для представленных в данном документе способов, из других образцов, таких, как другие жидкие образцы, где ДНК свободно плавает,
[228] Способы по настоящему изобретению в некоторых вариантах воплощения обычно включают этап получения и амплификации библиотеки нуклеиновых кислот из образца (т.е. получение библиотеки). Нуклеиновые кислоты из образца во время этапа подготовки библиотеки могут иметь адапторы для лигирования, часто упоминаемые как теги библиотеки или теги адаптора лигирования (ligation tags - LT), которые добавляются там, где адапторы лигирования содержат универсальную инициирующую последовательность с последующей универсальной амплификацией. В одном варианте воплощения это может быть сделано с использованием стандартного протокола, предназначенного для создания библиотек секвенирования после фрагментации. В одном варианте воплощения образец ДНК может иметь тупые концы, а затем на 3'-конце можно добавить А. Можно добавить и лигировать Y-адаптор с T-«липким» концом. В некоторых случаях могут быть использованы другие липкие концы, кроме «липкого» конца A или T. В некоторых случаях могут быть добавлены другие адапторы, например петлевые лигирующие адапторы. В некоторых случаях заявленные адапторы могут иметь метку, предназначенную для амплификации в ПЦР.
[229] Ряд вариантов воплощения, представленных в настоящем документе, включают в себя обнаружение ОНВ в образце цоДНК. Такие способы в иллюстративных вариантах воплощения включают в себя этап амплификации и этап секвенирования (иногда упоминаемый в данном документе как «рабочий процесс амплификации/секвенирования ОНВ цоДНК»). В иллюстративном примере рабочий процесс амплификации/секвенирования цоДНК может включать в себя создание набора ампликонов путем проведения реакции мультиплексной амплификации на нуклеиновых кислотах, выделенных из образца крови или его фракции от индивидуума, такого как индивидуум, подозреваемый на наличие рака, например, рака молочной железы, рака мочевого пузыря или колоректального рака, где каждый ампликон из набора ампликонов охватывает по меньшей мере один локус однонуклеотидного варианта из набора локусов однонуклеотидного варианта, такого как локусы ОНВ, о которых известно, что они связаны с раком (например, раком молочной железы, раком мочевого пузыря или колоректальным раком); и определение последовательности по меньшей мере сегмента в каждом ампликоне из набора ампликонов, где сегмент содержит локусы однонуклеотидного варианта. Таким образом, этот примерный способ определяет однонуклеотидные варианты, присутствующие в образце.
[230] Примерные рабочие процессы амплификации/секвенирования ОНВ цоДНК могут более детально включать формирование реакционной смеси для амплификации путем объединения полимеразы, нуклеотидтрифосфатов, фрагментов нуклеиновых кислот из библиотеки нуклеиновых кислот, сгенерированных из образца, и набора праймеров, каждый из которых связывает эффективное расстояние от локусов однонуклеотидного варианта или набора пар праймеров, каждая из которых охватывает эффективную область, включающую локус однонуклеотидного варианта. Локусы однонуклеотидного варианта в примерных вариантах воплощения, как известно, связаны с раком, например раком молочной железы, раком мочевого пузыря или колоректальным раком. Затем, подвергая реакционную смесь для амплификации условиям амплификации, генерируют набор ампликонов, включающих по меньшей мере один локус однонуклеотидного варианта из набора локусов однонуклеотидного варианта, которые, как известно, предпочтительно связаны с раком (например, раком молочной железы, раком мочевого пузыря или колоректальным раком); и определение последовательности по меньшей мере сегмента каждого ампликона из набора ампликонов, где сегмент содержит локусы однонуклеотидного варианта.
[231] Эффективное расстояние связывания праймеров может быть в пределах 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 75, 100, 125 или 150 пар оснований локуса ОНВ. Эффективный диапазон, который охватывает пара праймеров, обычно включает ОНВ и обычно составляет 160 пар оснований или менее, и может составлять 150, 140, 130, 125, 100, 75, 50 или 25 пар оснований или менее. В других вариантах воплощения эффективный диапазон, который охватывает пара праймеров, составляет 20, 25, 30, 40, 50, 60, 70, 75, 100, 110, 120, 125, 130, 140 или 150 нуклеотидов из локусов ОНВ на нижнем конце диапазона и 25, 30, 40, 50, 60, 70, 75, 100, 110, 120, 125, 130, 140 или 150, 160, 170, 175 или 200 на верхнем конце диапазона.
[232] Дополнительные подробности, касающиеся способов амплификации, которые можно использовать в процессе амплификации/секвенирования ОНВ цоДНК для обнаружения ОНВ для использования в способах по изобретению, представлены в других разделах данного описания.
[233] Аналитика распознавания ОНВ
[234] Во время выполнения способов, представленных в настоящем документе, генерируют данные о секвенировании нуклеиновых кислот для ампликонов, созданных с помощью мультиплексной ПЦР с тайлингом. Существуют инструменты разработки алгоритма, которые можно использовать и/или адаптировать для анализа этих данных с тем, чтобы определить в определенных пределах достоверности, присутствует ли в целевом гене такая мутация, как ОНВ.
[235] Считывания секвенирования могут быть демультиплексированы с использованием собственного инструмента и отображены с помощью программного обеспечения Burrows-Wheeler, функция Bwa mem (BWA, Burrows-Wheeler Alignment Software (см. Li H. and Durbin R. (2010) Fast and accurate long-read alignment with Burrows-Wheeler Transform. Bioinformatics, Epub. [PMID: 20080505]) в однопользовательском режиме с использованием считываний генома hg19 при помощи программы PEAR. КК статистики амплификации может быть выполнен путем анализа общего числа считываний, количества картированных считываний, количества картированных считываний на мишени и количества подсчитанных считываний.
[236] В некоторых вариантах воплощения любой аналитический способ для обнаружения ОНВ по данным определения последовательности нуклеиновых кислот можно использовать со способами по настоящему изобретению, которые включают этап обнаружения ОНВ или определения наличия ОНВ. В некоторых иллюстративных вариантах воплощения изобретения используются способы изобретения, которые используют представленный ниже СПОСОБ 1 ОНВ. В других, еще более иллюстративных вариантах воплощения способы по изобретению, которые включают в себя этап обнаружения ОНВ или определения того, присутствует ли ОНВ в локусах ОНВ, используют СПОСОБ 2 ОНВ ниже.
[237] СПОСОБ 1 ОНВ: Для этого варианта воплощения модель фоновой ошибки строится с использованием нормальных образцов плазмы, которые были секвенированы в одном и том же прогоне секвенирования для учета специфических для прогона артефактов. В некоторых вариантах воплощения 5, 10, 15, 20, 25, 30, 40, 50, 100, 150, 200, 250 или более 250 нормальных образцов плазмы анализируются в одном и том же прогоне секвенирования. В некоторых иллюстративных вариантах воплощения 20, 25, 40 или 50 нормальных образцов плазмы анализируют в одном и том же прогоне секвенирования. Помехонасыщенные позиции с нормальной медианной частотой вариантного аллеля больше значения отсечения удаляются. Например, это значение отсечения в некоторых вариантах воплощения составляет более 0,1, 0,2, 0,25, 0,5, 1, 2, 5 или 10%. В некоторых иллюстративных вариантах воплощения помехонасыщенные положения с нормальной медиальной частотой вариантного аллеля больше 0,5% удаляются. Отклоняющиеся образцы были итеративно удалены из модели, чтобы учесть помехи и загрязнение. В некоторых вариантах воплощения образцы с оценкой Z более 5, 6, 7, 8, 9 или 10 удаляются из анализа данных. Для каждой замены основания каждого геномного локуса вычисляется взвешенное среднее значение глубины и стандартное отклонение ошибки. Позиции опухолевых или бесклеточных образцов плазмы с по меньшей мере 5 вариантами считывания и Z-счетом 10, например, на фоне фоновой ошибки, можно назвать мутацией-кандидатом.
[238] СПОСОБ 2 ОНВ: Для этого варианта воплощения определяют одиночные нуклеотидные варианты (ОНВ) с использованием данных цоДНК плазмы. Процесс ПЦР моделируется как стохастический процесс, оценка параметров с использованием обучающего набора и осуществление окончательного распознавания ОНВ требует отдельного набора тестирования. Определяется распространение ошибки по нескольким циклам ПЦР, вычисляются среднее значение и дисперсия фоновой ошибки, а в иллюстративных вариантах воплощения фоновая ошибка отличается от реальных мутаций.
[239] Для каждого основания оцениваются следующие параметры:
[240] p = эффективность (вероятность того, что каждое считывание реплицируется в каждлом цикле)
[241] pe = частота ошибок на цикл для мутаций типа e (вероятность того, что случится ошибка типа e )
[242] X0 = первоначальное количество молекул
[243] По мере репликации считываний в ходе процесса ПЦР возникает больше ошибок. Следовательно, профиль ошибки считываний определяется степенями отделения от исходного чтения. Мы называем считывание генерацией kth когда оно прошло k репликаций, пока не было сгенерировано.
[244] Давайте определим следующие переменные для каждого основания:
[245] Xij = количество генераций i считываний, сгенерированных в цикле ПЦР j
[246] Yij = общее количество генераций i считываний в конце цикла j
[247] Xije = количество генераций i считываний с мутацией e, сгенерированных в цикле ПЦP j
[248] Более того, помимо нормальных молекул X0, если существуют дополнительные молекулы feX0 с мутацией e в начале процесса ПЦР (следовательно, fe/(1+fe) будет фракцией мутантных молекул в исходной смеси).
[249] Учитывая общее число генераций i-1 считываний в цикле j-1, количество генераций i считываний, сгенерированных в цикле j, имеет биномальное распределение с размером выборки Yi-1,j-1 и параметром вероятности p. Следовательно, E(Xij, |Yi-1,j-1, p) = p Yi-1,j-1 и Var(Xij, |Yi-1,j-1, p)= p(1-p) Yi-1,j-1.
[250] Мы также имеем . Следовательно, с помощью рекурсии, моделирования или аналогичных способов мы можем определить E(Xij,). Подобным образом, используя распределение p, мы можем определить Var(Xij) = E(Var(Xij, | p)) + Var(E(Xij, | p)).
[251] наконец, E(Xije|Yi-1,j-1, pe) = peYi-1,j-1 и Var(Xije|Yi-1,j-1, p)= pe(1- pe) Yi-1,j-1, и мы можем это использовать для расчета E(Xije) и Var(Xije).
[252] В некоторых вариантах воплощения Способ 2 ОНВ выполняется следующим образом:
[253] a) Оценивают эффективность ПЦР и частоту ошибок за цикл, используя обучающий набор данных;
[254] б) Оценивают количество исходных молекул для обучающего набора данных на каждом основании, используя распределение эффективности, оцененное на этапе (a);
[255] в) При необходимости обновляют оценку эффективности для обучающего набора данных, используя начальное количество молекул, оцененное на этапе (б);
[256] г) Оценивают среднее значение и дисперсию для общего количества молекул, молекул фоновой ошибки и реальных молекул мутации (для пространства поиска, состоящего из начального процента реальных молекул мутации), используя данные обучающего набора и параметры, оцененные на этапах (a), (б) и (в);
[257] д) Подбирают распределение по числу молекул с общей ошибкой (фоновая ошибка и реальная мутация) во всех молекулах и рассчитывают вероятность для каждого процента реальных мутаций в пространстве поиска; и
[258] е) Определяют наиболее вероятный процент реальных мутаций и рассчитывают достоверность, используя данные из этапа (д).
[259] Для идентификации ОНВ на локусах ОНВ можно использовать доверительный предел. Например, для распознавания ОНВ может использоваться 90-процентный, 95-процентный, 96-процентный, 97-процентный, 98-процентный или 99-процентный доверительный предел.
[260] Примерный алгоритм СПОСОБА 2 ОНВ
[261] Алгоритм начинается с оценки эффективности и частоты ошибок за цикл с использованием обучающего набора. Пусть n означает общее количество циклов ПЦР.
[262] Количество считываний Rb на каждом основании б может быть аппроксимировано (1+pb) n X0, где pb является эффективностью на основании б. Тогда (Rb/X0)1/n может использоваться для аппроксимирования 1+pb. Тогда мы можем определить среднее и стандартное отклонение pb по всем обучающим образцам для оценки параметров вероятностного распределения (такого, как нормальное, бета или аналогичное распределение) для каждого основания.
[263] Подобным образом, количество считываний с ошибкой e Rbe в каждом основании b маожет быть оценено как . После определения среднего значения и стандартного отклонения частоты ошибок по всем обучающим образцам мы аппроксимируем его вероятностное распределение (например, нормальное, бета или аналогичное распределение), параметры которого оцениваются с использованием этого среднего значения и значения стандартного отклонения.
[264] Затем, для обучающих данных, мы оцениваем исходную начальную копию у каждого основания как , где f(.) является оцененным распределением из обучающего набора.
[265] , где f(.)является оцененным распределением из обучающего набора.
[266] Следовательно, мы оценили параметры, которые будут использоваться в стохастическом процессе. Затем, используя эти оценки, мы можем оценить среднее значение и дисперсию молекул, созданных в каждом цикле (обратите внимание, что мы делаем это отдельно для нормальных молекул, ошибочных молекул и мутантных молекул).
[267] Наконец, используя вероятностный способ (такой как способ максимального правдоподобия или аналогичные способы), мы можем определить наилучшее значение fe, которое наилучшим образом соответствует распределению ошибочных, мутантных и нормальных молекул. Более конкретно, мы оцениваем ожидаемое отношение ошибочных молекул к общим молекулам для различных значений fe в окончательных считываниях и определяем вероятность наших данных для каждого из этих значений, а затем выбираем значение с наибольшей вероятностью.
[268] Хвосты праймеров могут улучшить обнаружение фрагментированной ДНК из универсально помеченных библиотек. Если тег библиотеки и хвосты праймеров содержат гомологичную последовательность, гибридизация может быть улучшена (например, снижена температура плавления (Tm)) и могут быть удлинены праймеры, если только часть последовательности-мишени праймера находится в фрагменте ДНК образца, В некоторых вариантах воплощения можно использовать 13 или более целевых пар оснований. В некоторых вариантах воплощения можно использовать от 10 до 12 целевых пар оснований. В некоторых вариантах воплощения можно использовать от 8 до 9 целевых пар оснований. В некоторых вариантах воплощения можно использовать от 6 до 7 целевых пар оснований.
[269] В одном варианте воплощения библиотеки генерируются из указанных выше образцов путем лигирования адапторов к концам фрагментов ДНК в образцах или к концам фрагментов ДНК, полученных из ДНК, выделенной из образцов. Затем фрагменты могут быть амплифицированы с использованием ПЦР, например, согласно следующему примерному протоколу:
[270] 95°C, 2 мин; 15 x [95°C, 20 сек, 55°C, 20 сек, 68°C, 20 сек], 68°C 2 мин, выдерживание при 4°C.
[271] В данной области техники известно множество наборов и способов для создания библиотек нуклеиновых кислот, которые включают универсальные сайты связывания праймеров для последующей амплификации, например клональной амплификации, и для секвенирования подпоследовательностей. Для облегчения лигирования адапторов подготовка и амплификация библиотеки может включать в себя восстановление и аденилирование концов (то есть A-tailing). Для практических способов, представленных в настоящем документе могут быть полезны наборы, специально адаптированные для получения библиотек из небольших фрагментов нуклеиновой кислоты, особенно циркулирующей свободной ДНК. Например, наборы NEXTflex Cell Free kits, доступные от Bioo Scientific () или Natera Library Prep Kit (доступный от Natera, Inc. San Carlos, CA). Однако такие наборы обычно модифицируют, чтобы включать в себя адапторы, которые настроены для этапов амплификации и секвенирования способов, предоставленных в данном документе. Лигирование адаптора может быть выполнено с использованием имеющихся в продаже наборов, таких как набор для лигирования, представленный в AGILENT SURESELECT kit (Agilent, CA).
[272] Затем амплифицируют целевые области библиотеки нуклеиновых кислот, сгенерированной из ДНК, выделенной из образца, в частности образца циркулирующей свободной ДНК для способов по настоящему изобретению. Для этой амплификации, серия праймеров или пар праймеров, которые могут включать от 5, 10, 15, 20, 25, 50, 100, 125, 150, 250, 500, 1000, 2500, 5000, 10000, 20000, 25000 или 50000 в нижнем конце диапазона и 15, 20, 25, 50, 100, 125, 150, 250, 500, 1000, 2500, 5000, 10000, 20000, 25000, 50000, 60000, 75000 или 100000 праймеров в верхнем конце диапазона, каждый из которых связывается с одним из ряда сайтов связывания праймеров.
[273] Дизайны праймеров могут быть сгенерированы с Primer3 (Untergrasser A, Cutcutache I, Koressaar T, Ye J, Faircloth BC, Remm M, Rozen SG (2012) “Primer3 - new capabilities and interfaces.” Nucleic Acids Research 40(15):e115 и Koressaar T, Remm M (2007) “Enhancements and modifications of primer design program Primer3.” Bioinformatics 23(10):1289-91) исходный код доступен на primer3.sourceforge.net). Специфичность праймера может быть оценена с помощью BLAST и добавлена к существующим критериям разработки праймера:
[274] Специфичность праймеров можно определить с помощью программы BLASTn из пакета ncbi-blast-2.2.29+. Может использоваться опция задания “blastn-short” для картирования праймеров по отношению к геному человека hg19. Дизайн праймеров можно определить как «специфичные», если праймер имеет менее 100 совпадений с геномом, а верхнее совпадение является целевой областью связывания комплементарного праймера генома и находится по меньшей мере на два балла выше, чем другие совпадения (балл определяется в программе BLASTn). Это может быть сделано для того, чтобы иметь уникальное попадание в геном и не иметь много других попаданий по всему геному.
[275] Конечные избранные праймеры можно визуализировать в браузерах IGV (James T. Robinson, Helga Thorvaldsdóttir, Wendy Winckler, Mitchell Guttman, Eric S. Lander, Gad Getz, Jill P. Mesirov. Integrative Genomics Viewer. Nature Biotechnology 29, 24-26 (2011)) и UCSC (Kent WJ, Sugnet CW, Furey TS, Roskin KM, Pringle TH, Zahler AM, Haussler D. The human genome browser at UCSC. Genome Res. 2002 Jun;12(6):996-1006), используя для валидации опорные файлы и карты охвата.
[276] Способы по настоящему изобретению в некоторых вариантах воплощения включают в себя формирование реакционной смеси для амплификации. Реакционная смесь обычно образуется путем объединения полимеразы, нуклеотидтрифосфатов, фрагментов нуклеиновых кислот из библиотеки нуклеиновых кислот, сгенерированных из образца, набора прямых и обратных праймеров, специфичных для областей-мишеней, содержащих ОНВ. Реакционные смеси, представленные в настоящем документе, сами образуют в иллюстративных вариантах воплощения отдельный аспект изобретения.
[277] Реакционная смесь для амплификации, используемая для настоящего изобретения, включает компоненты, известные в данной области техники для амплификации нуклеиновых кислот, особенно для амплификации ПЦР. Например, реакционная смесь обычно включает нуклеотидтрифосфаты, полимеразу и магний. Полимеразы, которые полезны для настоящего изобретения, могут включать любую полимеразу, которая может использоваться в реакции амплификации, особенно те, которые полезны в реакциях ПЦР. В некоторых вариантах воплощения полимеразы Taq с горячим стартом являются особенно полезными. Реакционные смеси для амплификации, полезные для осуществления способов, представленных в настоящем документе, такие как AmpliTaq Gold master mix (Life Technologies, Carlsbad, CA), являются коммерчески доступными.
[278] Условия амплификации (например, температурное циклирование) для ПЦР хорошо известны в данной области техники. Способы, представленные в настоящем документе, могут включать любые условия циклирования ПЦР, которые приводят к амплификации нуклеиновых кислот-мишеней, таких как нуклеиновые кислоты-мишени, из библиотеки. Неограничивающие примерные условия циклирования приведены в данном документе в разделе Примеры.
[279] Существует множество рабочих процессов, которые возможны при проведении ПЦР; некоторые рабочие процессы, типичные для способов, раскрытых в данном документе, представлены в данном документе. Представленные в данном документе этапы не предназначены для исключения других возможных этапов и не подразумевают, что для правильной работы способа требуется какой-либо из этапов, представленных в данном документе. В литературе известно большое количество вариаций параметров или других модификаций, которые могут быть сделаны без ущерба для сущности изобретения.
[280] В некоторых вариантах воплощения способа, представленного в настоящем документе, по меньшей мере его части, и в иллюстративных примерах определяется полная последовательность ампликона, такого как ампликон-мишень для внешнего праймера. Способы определения последовательности ампликона известны в данной области техники. Для определения такой последовательности может использоваться любой из способов секвенирования, известных в данной области техники, например, секвенирование по Сенгеру. В иллюстративных вариантах воплощения для секвенирования ампликонов, полученных способами, представленными в данном документе, могут использоваться методики секвенирования следующего поколения с высокой пропускной способностью (также называемые в настоящем документе методиками массового параллельного секвенирования), такие как те, что используются в MYSEQ (ILLUMINA), HISEQ (ILLUMINA), ION TORRENT (LIFE TECHNOLOGIES), GENOME ANALYZER ILX (ILLUMINA), GS FLEX+ (ROCHE 454), но не ограничиваясь ими.
[281] Генетические секвенаторы с высокой пропускной способностью пригодны для использования штрих-кодов (то есть, маркировки образцов отличительными последовательностями нуклеиновых кислот) чтобы идентифицировать конкретные образцы от индивидуумов, что позволяет одновременно анализировать несколько образцов в одном прогоне секвенатора ДНК. Количество раз, когда последовательность данной области генома в приготовлении библиотеки (или другого исследуемого нуклеинового препарата) секвенируется (число считываний) будет пропорционально количеству копий этой последовательности в исследуемом геноме (или уровню экспрессии в случае приготовлений, содержащих кДНК). При таком количественном определении могут быть приняты во внимание отклонения в эффективности амплификации.
[282] Гены - мишени
[283] Гены-мишени по настоящему изобретению в примерных вариантах воплощения представляют собой гены, связанные с раком, и во многих иллюстративных вариантах воплощения являются генами, связанными с раком. Ген, связанный с раком (например, ген, связанный с раком, или ген, связанный с раком мочевого пузыря, или ген, связанный с колоректальным раком) относится к гену, связанному с измененным риском развития рака (например, рака молочной железы, рака мочевого пузыря или колоректального рака) или измененным прогнозом рака. Типичные гены, связанные с раком, которые способствуют развитию рака, включают онкогены; гены, которые усиливают пролиферацию, инвазию или метастазирование клеток; гены, которые ингибируют апоптоз; и гены, стимулирующие ангиогенез. Связанные с раком гены, которые ингибируют рак, включают, без ограничений, гены-супрессоры опухоли; гены, которые ингибируют пролиферацию, инвазию или метастазирование клеток; гены, способствующие апоптозу; и гены антиангиогенеза.
[284] Вариант воплощения способа обнаружения мутации начинается с выбора области гена, который становится мишенью. Область с известными мутациями используется для разработки праймеров для мПЦР-СНП для амплификации и выявления мутации.
[285] Способы, представленные в настоящем документе, могут использоваться для обнаружения практически любого типа мутации, особенно мутаций, о которых известно, что они связаны с раком, и наиболее конкретно, способы, представленные в настоящем документе, направлены на мутации, особенно ОНВ, связанные с раком, в частности раком молочной железы, раком мочевого пузыря или колоректальным раком. Примерные ОНВ могут быть в одном или более из следующих генов: EGFR, FGFR1, FGFR2, ALK, MET, ROS1, NTRK1, RET, HER2, DDR2, PDGFRA, KRAS, NF1, BRAF, PIK3CA, MEK1, NOTCH1, MLL2, EZH2, TET2, DNMT3A, SOX2, MYC, KEAP1, CDKN2A, NRG1, TP53, LKB1 и PTEN, которые были идентифицированы в различных образцах рака легких как мутировавшие, имеющие увеличенное количество копий или слитые с другими генами и их комбинациями (Non-small-cell lung cancers: a heterogeneous set of diseases. Chen et al. Nat. Rev. Cancer. 2014 Aug 14(8):535-551). В другом примере список генов - это вышеперечисленные гены, в которых были зарегистрированы ОНВ, такие, как указанные в ссылке Chen et al.
[286] Реакционные смеси для амплификациии (например, ПЦР):
[287] Способы по настоящему изобретению в некоторых вариантах воплощения включают в себя формирование реакционной смеси для амплификации. Реакционная смесь обычно образуется путем объединения полимеразы, нуклеотидтрифосфатов, фрагментов нуклеиновых кислот из библиотеки нуклеиновых кислот, сгенерированных из образца, серии внешних прямых праймеров, специфичных для мишени, и внешнего обратного универсального праймера для первой цепи. Другим иллюстративным вариантом воплощения является реакционная смесь, которая включает прямые специфичные для мишени внутренние праймеры вместо прямых специфичных для мишени внешних праймеров и ампликонов из первой реакции ПЦР с использованием внешних праймеров вместо фрагментов нуклеиновых кислот из библиотеки нуклеиновых кислот. Реакционные смеси, представленные в настоящем документе, сами образуют в иллюстративных вариантах воплощения отдельный аспект изобретения. В иллюстративных вариантах воплощения реакционные смеси представляют собой реакционные смеси для ПЦР. Реакционные смеси для ПЦР обычно включают магний.
[288] В некоторых вариантах воплощения реакционная смесь включает этилендиаминтетрауксусную кислоту (ЭДТА), магний, хлорид тетраметиламмония (ТМАС) или любую их комбинацию. В некоторых вариантах воплощения концентрация TMAC составляет от 20 до 70 мМ включительно. Хотя это и не предназначено для привязки к какой-либо конкретной теории, считается, что TMAC связывается с ДНК, стабилизирует дуплексы, повышает специфичность праймеров и/или выравнивает температуры плавления различных праймеров. В некоторых вариантах воплощения TMAC повышает единообразие количества амплифицированных продуктов для разных целей. В некоторых вариантах воплощения концентрация магния (например, магния из хлорида магния) составляет от 1 до 8 мМ.
[289] Большое количество праймеров, используемых для мультиплексной ПЦР с большим количеством мишеней, может хелатировать много магния (2 фосфата в праймерах хелатируют 1 магний). Например, если используется достаточное количество праймеров, так что концентрация фосфата в праймерах составляет приблизительно 9 мМ, тогда праймеры могут снизить эффективную концентрацию магния на приблизительно 4,5 мМ. В некоторых вариантах воплощения ЭДТА используется для уменьшения количества магния, доступного в качестве кофактора для полимеразы, так как высокие концентрации магния могут привести к ошибкам ПЦР, таким как амплификация нецелевых локусов. В некоторых вариантах воплощения концентрация ЭДТА снижает количество доступного магния до 1-5 мМ (например, 3-5 мМ).
[290] В некоторых вариантах воплощения рН составляет от 7,5 до 8,5, например от 7,5 до 8, от 8 до 8,3 или от 8,3 до 8,5 включительно. В некоторых вариантах воплощения используется Трис, например, при концентрации от 10 до 100 мМ, такой как от 10 до 25 мМ, от 25 до 50 мМ, от 50 до 75 мМ или от 25 до 75 мМ включительно. В некоторых вариантах воплощения любая из этих концентраций Трис используется при рН от 7,5 до 8,5. В некоторых вариантах воплощения используется комбинация KCl и (NH4)2SO4, например, от 50 до 150 мМ KCl и от 10 до 90 мМ (NH4)2SO4 включительно. В некоторых вариантах воплощения концентрация KCl составляет от 0 до 30 мМ, от 50 до 100 мМ или от 100 до 150 мМ включительно. В некоторых вариантах воплощения концентрация (NH4)2SO4 составляет от 10 до 50 мМ, от 50 до 90 мМ, от 10 до 20 мМ, от 20 до 40 мМ, от 40 до 60 мМ или от 60 до 80 мМ (NH4)2SO4 включительно. В некоторых вариантах воплощения концентрация аммония [NH4+] составляет от 0 до 160 мМ, например от 0 до 50, от 50 до 100 или от 100 до 160 мМ включительно. В некоторых вариантах воплощения сумма концентрация калия и аммония ([K+] + [NH4+]) составляет от 0 до 160 мМ, например от 0 до 25, от 25 до 50, от 50 до 150, от 50 до 75, от 75 до 100, от 100 до 125 или от 125 до 160 мМ включительно. Примерным буфером с [K+] + [NH4+] = 120 мМ является 20 мМ KCl и 50 мМ (NH4)2SO4. В некоторых вариантах воплощения буфер содержит от 25 до 75 мМ Трис, рН от 7,2 до 8, от 0 до 50 мМ KCl, от 10 до 80 мМ сульфата аммония и от 3 до 6 мМ магния включительно. В некоторых вариантах воплощения буфер включает от 25 до 75 мМ Трис, рН от 7 до 8,5, от 3 до 6 мМ MgCl2, от 10 до 50 мМ KCl и от 20 до 80 мМ (NH4)2SO4 включительно. В некоторых вариантах воплощения используется от 100 до 200 единиц/мл полимеразы. В некоторых вариантах воплощения используется 100 мМ KCl, 50 мМ (NH4)2SO4, 3 мМ MgCl2, 7,5 нМ каждого праймера в библиотеке, 50 мМ TMAC и 7 мкл ДНК-матрицы в 20 мкл конечного объема при рН 8,1.
[291] В некоторых вариантах воплощения используется краудинг-агент, такой как полиэтиленгликоль (ПЭГ, такой как ПЭГ 8000) или глицерин. В некоторых вариантах воплощения количество ПЭГ (такого, как ПЭГ 8000) составляет от 0,1 до 20%, например от 0,5 до 15%, от 1 до 10%, от 2 до 8% или от 4 до 8% включительно. В некоторых вариантах воплощения количество глицерина составляет от 0,1 до 20%, например от 0,5 до 15%, от 1 до 10%, от 2 до 8% или от 4 до 8% включительно. В некоторых вариантах воплощения краудинг-агент позволяет использовать низкую концентрацию полимеразы и/или более короткое время отжига. В некоторых вариантах воплощения краудинг-агент улучшает однородность глубины считывания (depth of read - DOR) и/или уменьшает отсев (необнаруженные аллели). Полимеразы В некоторых вариантах воплощения используется полимераза с корректирующей активностью, полимераза без или с незначительной корректирующей активностью или смесь полимеразы с корректирующей активностью и полимеразы без или с незначительной корректирующей активностью. В некоторых вариантах воплощения используется полимераза горячего старта, полимераза не-горячего старта или смесь полимеразы горячего старта и полимеразы не-горячего старта. В некоторых вариантах воплощения используется ДНК полимераза HotStarTaq (см., например, каталог QIAGEN № 203203). В некоторых вариантах воплощения используется ДНК полимераза AmpliTaq Gold®. В некоторых вариантах воплощения используется ДНК полимераза PrimeSTAR GXL, полимераза высокой точности, которая обеспечивает эффективную амплификацию ПЦР, когда в реакционной смеси присутствует избыток матрицы, и также она используется при амплификации длинных продуктов (Takara Clontech, Mountain View, CA). В некоторых вариантах воплощения используется ДНК полимераза KAPA Taq или ДНК полимераза KAPA TaqHotStart; они базируются на одно-субъединичной ДНК полимеразе дикого типа Taq термофильной бактерии Thermus aquaticus. ДНК полимеразы KAPA Taq и KAPA TaqHotStart имеют полимеразную активность 5'-3' и экзонуклеазную активность 5'-3', но не 3' -5' экзонуклеазную (корректирующую) активность (см., например, каталог KAPA BIOSYSTEMS № BK1000). В некоторых вариантах воплощения используется ДНК полимераза Pfu; это высоко термостабильная ДНК-полимераза из гипертермофильного архея Pyrococcus furiosus. Этот фермент катализирует матрично-зависимую полимеризацию нуклеотидов в дуплексную ДНК в направлении 5'→3'. ДНК полимеразы Pfu также проявляют 3'→5' экзонуклеазную (корректирующую) активность, что позволяет полимеразе исправлять ошибки включения нуклеотидов. Она не имеет 5'→3' экзонуклеазной активности (см., например, каталог Thermo Scientific № EP0501). В некоторых вариантах воплощения используется Klentaq1; это аналог ДНК полимеразы Taq по фрагменту Кленова, он не обладает экзонуклеазной или эндонуклеазной активностью (см., например, каталог DNA POLYMERASE TECHNOLOGY, Inc, St. Louis, Missouri, № 100). В некоторых вариантах воплощения полимераза представляет собой ДНК полимеразу PHUSION, такую как PHUSION High Fidelity DNA polymerase (M0530S, New England BioLabs, Inc.) или PHUSION Hot Start Flex DNA polymerase (M0535S, New England BioLabs, Inc.). В некоторых вариантах воплощения полимераза представляет собой ДНК полимеразу Q5®, такую как Q5® High-Fidelity DNA Polymerase (M0491S, New England BioLabs, Inc.) или Q5® Hot Start High-Fidelity DNA Polymerase (M0493S, New England BioLabs, Inc.). В некоторых вариантах воплощения полимераза представляет собой ДНК полимеразу T4 DNA (M0203S, New England BioLabs, Inc.).
[292] В некоторых вариантах воплощения используется от 5 до 600 единиц/мл (единиц на 1 мл реакционного объема) полимеразы, например, от 5 до 100, от 100 до 200, от 200 до 300, от 300 до 400, от 400 до 500 или от 500 до 600 единиц/мл включительно.
Способы ПЦР
[293] В некоторых вариантах воплощения ПЦР с горячим стартом используется для снижения или предотвращения полимеризации перед термоциклированием ПЦР. Типичные способы ПЦР с горячим стартом включают первоначальное ингибирование реакции ДНК-полимеразы или физическое разделение компонентов реакции до тех пор, пока реакционная смесь не достигнет более высоких температур. В некоторых вариантах воплощения используется медленное высвобождение магния. ДНК-полимераза требует активности ионов магния, поэтому магний химически отделяется от реакции путем связывания с химическим соединением и выделяется в раствор только при высокой температуре. В некоторых вариантах воплощения используется нековалентное связывание ингибитора. В этом способе пептид, антитело или аптамер нековалентно связаны с ферментом при низкой температуре и ингибируют его активность. После инкубации при повышенной температуре ингибитор высвобождается и начинается реакция. В некоторых исследованиях используется чувствительная к холоду Taq-полимераза, такая, как модифицированная ДНК-полимераза которая практически не проявляет активности при низкой температуре. В некоторых вариантах воплощения используется химическая модификация. В этом способе молекула ковалентно связана с боковой цепью аминокислоты в активном центре ДНК-полимеразы. Молекула высвобождается из фермента путем инкубации реакционной смеси при повышенной температуре. Как только молекула высвобождается, активируется фермент.
[294] В некоторых вариантах воплощения количество матричных нуклеиновых кислот (таких, как образец РНК или ДНК) составляет от 20 до 5000 нг, например от 20 до 200, от 200 до 400, от 400 до 600, от 600 до 1000; От 1000 до 1500; или от 2000 до 3000 нг включительно.
[295] В некоторых вариантах воплощения используется набор QIAGEN Multiplex PCR Kit (каталог QIAGEN, № 206143). Для мультиплексных ПЦР реакций 100 x 50 мкл набор включает 2x QIAGEN Multiplex PCR Master Mix (дающий конечную концентрацию 3 мМ MgCl2, 3 x 0,85 мл), 5x Q-Solution (1 x 2,0 мл), и воду, свободную от РНКаз (RNase-Free Water) (2 x 1,7 мл). QIAGEN Multiplex PCR Master Mix (MM) содержит комбинацию KCl и (NH4)2SO4, а также вспомогательное вещество для ПЦР, Фактор MP, что увеличивает локальную концентрацию праймеров на матрице. Фактор MP стабилизирует специфически связанные праймеры, обеспечивая эффективное удлинение праймеров ДНК полимеразой HotStarTaq DNA Polymerase. ДНК полимераза HotStarTaq является модифицированной формой ДНК полимеразы Taq и не обладает полимеразной активностью при комнатных температурах. В некоторых вариантах воплощения ДНК полимераза HotStarTaq активируется 15-минутной инкубацией при 95 °C, которая может быть включена в любую существующую программу термоциклирования.
[296] В некоторых вариантах воплощения используется конечная концентрация 1x QIAGEN MM (рекомендованная концентрация), 7,5 нМ каждого праймера в библиотеке, 50 мM TMAC и 7 мкл матрицы ДНК в 20 мкл конечного объема. В некоторых вариантах воплощения условия термоциклирования ПЦР включают 95 °С в течение 10 минут (горячий старт); 20 циклов при 96 °С в течение 30 секунд; 65 °С в течение 15 минут; и 72 °С в течение 30 секунд; затем 72 °С в течение 2 минут (окончательное удлинение); а затем выдерживать при 4 °C.
[297] В некоторых вариантах воплощения используется конечная концентрация 2x QIAGEN MM (двойная рекомендованная концентрация), 2 нМ каждого праймера в бибилиотеке, 70 мМ TMAC и 7 мкл матрицы ДНК в 20 мкл конечного объема. В некоторых вариантах воплощения также включено до 4 мМ ЭДТА. В некоторых вариантах воплощения условия термоциклирования ПЦР включают 95 °С в течение 10 минут (горячий старт); 25 циклов при 96 °С в течение 30 секунд; 65 °С в течение 20, 25, 30, 45, 60, 120 или 180 минут; и, необязательно, 72 °С в течение 30 секунд; затем 72 °С в течение 2 минут (окончательное удлинение); а затем выдерживать при 4 °C.
[298] Другой примерный набор условий включает в себя подход с полу-вложенной ПЦР. В первой реакции ПЦР используется 20 мкл реакционного объема с конечной концентрацией 2x QIAGEN MM, 1,875 нМ каждого праймера в библиотеке (внешний прямой и обратный праймеры) и матрица ДНК. Параметры термоциклирования включают 95 °С в течение 10 минут; 25 циклов: 96 °С в течение 30 секунд, 65 °С в течение 1 минуты, 58 °С в течение 6 минут, 60 °С в течение 8 минут, 65 °С в течение 4 минут и 72 °С в течение 30 секунд; и затем 72 °С в течение 2 минут, а затем выдерживание при 4 °С. Затем 2 мкл полученного продукта, разведенного 1: 200, используют в качестве исходного материала для второй реакции ПЦР. В этой реакции используется 10 мкл реакционного объема с конечной концентрацией 1x QIAGEN MM, 20 нМ каждого внутреннего прямого праймера и 1 мкМ тега обратного праймера. Параметры термоциклирования включают 95 °С в течение 10 минут; 15 циклов: 95 °С в течение 30 секунд, 65 °С в течение 1 минуты, 60 °С в течение 5 минут, 65 °С в течение 5 минут и 72 °С в течение 30 секунд; и затем 72 °С в течение 2 минут, а затем выдерживание при 4 °С. Температура отжига может быть необязательно выше, чем температура плавления некоторых или всех праймеров, как обсуждается в данном документе (см. Заявку на Патент США № 14/918544, поданную 20 октября 2015 года, которая включена сюда посредством ссылки во всей полноте).
[299] Температура плавления (Tm) представляет собой температуру, при которой половина (50%) дуплекса ДНК олигонуклеотида (такого как праймер) и его идеального комплемента диссоциирует и становится одноцепочечной ДНК. Температура отжига (TA) - это температура, при которой выполняется протокол ПЦР. В предыдущих способах она обычно на 5 °C ниже самой низкой Tm используемых праймеров, таким образом, рядом образуются почти все возможные дуплексы (такие, что по существу все молекулы праймера связывают матричную нуклеиновую кислоту). Хотя это очень эффективно, при более низких температурах происходят более неспецифические реакции. Одним из следствий слишком низкой TA является то, что праймеры могут отжигать последовательности, отличные от истинной мишени, поскольку могут допускаться внутренние несоответствия одного основания или частичный отжиг. В некоторых вариантах воплощения настоящего изобретения TA выше, чем Tm, где в данный момент только небольшая часть мишеней имеет отожженный праймер (например, всего приблизительно 1-5%). Если они удлиняются, они удаляются из равновесия отжигающих и диссоциирующих праймеров и мишени (так как удлинение быстро увеличивает Tm до температуры выше 70 °C), и у новых приблизительно 1-5% мишеней есть праймеры. Таким образом, предоставив реакции отжига длительное время, можно получить приблизительно 100% мишеней, скопированных за цикл.
[300] В различных вариантах воплощения температура отжига составляет 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13°C и 2, 3, 4, 5, 6, 7, 8, 9, 10 11, 12, 13 или 15°C на верхнем конце диапазона, превышающем температуру плавления (например, эмпирически измеренную или рассчитанную Tm) по меньшей мере на 25, 50, 60, 70, 75, 80, 90 95 или 100% неидентичных праймеров. В различных вариантах воплощения температура отжига составляет от 1 до 15 °C (например, от 1 до 10, от 1 до 5, от 1 до 3, от 3 до 5, от 5 до 10, от 5 до 8, от 8 до 10, от 10 до 12 или от 12 до 15 °C включительно) больше, чем температура плавления (например, эмпирически измеренная или рассчитанная Tm) по меньшей мере 25; 50; 75; 100; 300; 500; 750; 1000; 2000; 5000; 7500; 10000; 15000; 19000; 20000; 25000; 27000; 28000; 30000; 40000; 50000; 75000; 100000; или всх неидентичных праймеров. В различных вариантах воплощения температура отжига составляет от 1 до 15° C (например, от 1 до 10, от 1 до 5, от 1 до 3, от 3 до 5, от 3 до 8, от 5 до 10, от 5 до 8, от 8 до 10, от 10 до 12, или от 12 до 15 °C включительно) больше температуры плавления (например, эмпирически измеренная или рассчитанная Tm) по меньшей мере 25, 50, 60, 70, 75, 80, 90, 95% или всех неидентичных праймеров, а продолжительность стадии отжига (на цикл ПЦР) составляет от 5 до 180 минут, например от 15 до 120 минут, от 15 до 60 минут, от 15 до 45 минут или от 20 до 60 минут включительно.
[301] Примерные способы мультиплексной ПЦР
[302] В различных вариантах воплощения используются длительные времена отжига (как обсуждается в данном документе и приведено в качестве примера в Примере 10) и/ или низкие концентрации праймера. Фактически, в некоторых вариантах воплощения используются ограничивающие концентрации праймера и/или ограничивающие условия. В различных вариантах воплощения продолжительность этапа отжига составляет 15, 20, 25, 30, 35, 40, 45 или 60 минут на нижнем конце диапазона и 20, 25, 30, 35, 40, 45, 60, 120 или 180 минут на верхнем конце диапазона. В различных вариантах воплощения продолжительность стадии отжига (на цикл ПЦР) составляет от 30 до 180 минут. Например, стадия отжига может составлять от 30 до 60 минут, а концентрация каждого праймера может быть менее 20, 15, 10 или 5 нМ. В других вариантах воплощения концентрация праймера составляет 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20 или 25 нМ на нижнем конце диапазона и 2, 3, 4, 5 6, 7, 8, 9, 10, 15, 20, 25 и 50 на верхнем конце диапазона.
[303] При высоком уровне мультиплексирования раствор может стать вязким из-за большого количества праймеров в растворе. Если раствор слишком вязкий, можно уменьшить концентрацию праймеров до количества, которое все еще достаточно для того, чтобы праймеры связывали матричную ДНК. В различных вариантах воплощения используют от 1000 до 100000 различных праймеров, и концентрация каждого праймера составляет менее 20 нМ, например, менее 10 нМ или от 1 до 10 нМ включительно.
[304] Выявление варации числа копий (ВЧК)
[305] В дополнение к ОНВ и вставкам/делециям, способы мониторинга и выявления ранних рецидивов и метастазирования, представленные в данном документе, также могут получить пользу из обнаружения ВЧК.
[306] В одном аспекте настоящее изобретение в целом относится по меньшей мере частично, к улучшенным способам определения наличия или отсутствия вариаций числа копий, таких как делеции или дупликации сегментов хромосом или целых хромосом. Способы особенно полезны для обнаружения небольших делеций или дупликаций, которые может быть трудно обнаружить с высокой специфичностью и чувствительностью с использованием предыдущих способов из-за небольшого количества данных, доступных из соответствующего сегмента хромосомы. Эти способы включают улучшенные аналитические способы, улучшенные способы биоанализа и комбинации улучшенных аналитических способов и способов биоанализа. Способы по изобретению также можно использовать для обнаружения делеций или дупликаций, которые присутствуют только в небольшом проценте тестируемых клеток или молекул нуклеиновых кислот. Это позволяет обнаруживать делеции или дупликации до возникновения заболевания (например, на предраковой стадии) или на ранних стадиях заболевания, например, до того, как накопится большое количество пораженных клеток (таких как раковые клетки) с делецией или дупликацией. Более точное обнаружение делеций или дупликаций, связанных с заболеванием или расстройством, позволяет усовершенствовать способы диагностики, прогнозирования, предотвращения, задержки, стабилизации или лечения заболевания или расстройства. Известно, что некоторые делеции или дупликации связаны с раком или с серьезными умственными или физическими недостатками.
[307] В другом аспекте настоящее изобретение в целом относится по меньшей мере частично, к улучшенным способам обнаружения однонуклеотидных вариантов (ОНВ). Эти улучшенные способы включают улучшенные аналитические способы, улучшенные способы биоанализа и усовершенствованные способы, которые используют комбинацию улучшенных аналитических способов и способов биоанализа. Способы в некоторых иллюстративных вариантах воплощения используются для обнаружения, диагностики, мониторинга или стадирования рака, например, в образцах, где ОНВ присутствует в очень низких концентрациях, например, менее 10, 5, 4, 3, 2,5, 2, 1, 0,5, 0,25 или 0,1% относительно общего количества нормальных копий локуса ОНВ, таких как образцы циркулирующей свободной ДНК. То есть эти способы в определенных иллюстративных вариантах воплощения особенно хорошо подходят для образцов, где имеется относительно низкий процент мутации или варианта относительно нормальных полиморфных аллелей, присутствующих для этого генетического локуса. Наконец, в данном документе представлены способы, которые объединяют улучшенные способы обнаружения вариаций количества копий с усовершенствованными способами обнаружения однонуклеотидных вариаций.
[308] Успешное лечение такого заболевания, как рак, часто зависит от ранней диагностики, правильного определения стадии заболевания, выбора эффективной терапевтической схемы и тщательного мониторинга для предотвращения или выявления рецидива. Для диагностики рака наиболее надежным способом часто считают гистологическую оценку материала опухоли, полученного из биопсии ткани. Однако инвазивный характер взятия проб на основе биопсии сделал его непрактичным для массового скрининга и регулярного наблюдения. Следовательно, настоящие способы имеют то преимущество, что они могут выполняться неинвазивно, если это желательно, при относительно низких затратах и быстром времени выполнения. Целевое секвенирование, которое может быть использовано способами по изобретению, требует меньше операций считывания, чем дробное секвенирование, например, несколько миллионов операций считывания вместо 40 миллионов операций считывания, что снижает стоимость. Мультиплексная ПЦР и секвенирование следующего поколения, которые могут использоваться, увеличивают пропускную способность и снижают затраты.
[309] В некоторых примерных вариантах воплощения анализ паттернов AAI в цоДНК обеспечивает более детальное понимание клональной архитектуры опухолей, чтобы помочь предсказать их терапевтические ответы и оптимизировать стратегии лечения. Следовательно, в некоторых вариантах воплощения выбираются панели ммПЦР-СНП, которые предназначены для клинически значимых ВЧК и ОНВ. Такие панели в некоторых иллюстративных вариантах воплощения особенно полезны для пациентов с раковыми заболеваниями, где ВЧК представляют собой значительную долю мутационной нагрузки, как это часто бывает при раке молочной железы, яичников и легких.
[310] В некоторых вариантах воплощения используются способы для выявления делеции, дупликации или однонуклеотидного варианта у человека. Может быть проанализирован образец от индивидуума, который содержит клетки или нуклеиновые кислоты, предположительно имеющие делецию, дупликацию или однонуклеотидный вариант. В некоторых вариантах воплощения образец взят из ткани или органа, предположительно имеющего делецию, дупликацию или однонуклеотидный вариант, такого как клетки или образование, предположительно раковое. Способы по изобретению можно использовать для обнаружения делеции, дупликации или однонуклеотидного варианта, которые присутствуют только в одной клетке или небольшом количестве клеток в смеси, содержащей клетки с делецией, дупликацией или однонуклеотидным вариантом и в клетках без делеции, дупликации или однонуклеотидного варианта. В некоторых вариантах воплощения анализируется скДНК или скРНК из образца крови индивидуума. В некоторых вариантах воплощения скДНК или скРНК секретируется из клеток, таких, как раковые клетки. В некоторых вариантах воплощения скДНК или скРНК высвобождается клетками, подвергающимися некрозу или апоптозу, такими, как раковые клетки. Способы по изобретению можно использовать для обнаружения делеции, дупликации или однонуклеотидного варианта, которые присутствуют только в небольшом проценте скДНК или скРНК. В некоторых вариантах воплощения тестируется одна или более клеток эмбриона.
[311] В дополнение к определению наличия или отсутствия изменения количества копий при необходимости можно проанализировать один или более других факторов. Эти факторы могут использоваться для повышения точности диагностики (например, определения наличия или отсутствия рака или повышенного риска развития рака, классификации рака или стадирования рака) или его прогноза. Эти факторы также могут быть использованы для выбора конкретной терапии или схемы лечения, которая, вероятно, будет эффективной у субъекта. Примеры факторов включают наличие или отсутствие полиморфизмов или мутаций; измененные (повышенные или сниженные) уровни общей или определенной скДНК, скРНК, микроРНК (миРНК); измененную (повышенную или сниженную) опухолевую фракцию; измененные (повышенные или сниженные) уровни метилирования, измененную (повышенную или сниженную) целостность ДНК, измененный (повышенный или сниженный) или альтернативный сплайсинг мРНК.
[312] В следующих разделах описываются способы обнаружения делеций или дупликаций с использованием фазированных данных (таких как выведенные или измеренные фазированные данные) или нефазированных данных; образцы, которые можно тестировать; способы пробоподготовки, амплификации и количественного определения; способы фазирования генетических данных; полиморфизмы, мутации, изменения нуклеиновых кислот, изменения сплайсинга мРНК и изменения уровней нуклеиновых кислот, которые могут быть обнаружены; базы данных с результатами способов, других факторов риска и способов скрининга; рак, который можно диагностировать или лечить; лечение рака; модели рака для тестирования лечения; и способы формулировки и назначенияя лечения.
[313] Примерные способы определения плоидности с использованием фазированных данных
[314] Некоторые из способов по изобретению частично основаны на открытии того, что использование фазированных данных для обнаружения ВЧК уменьшает частоту ложных отрицательных и ложных положительных результатов по сравнению с использованием нефазированных данных. Это улучшение является наибольшим для образцов с ВЧК, присутствующими на низких уровнях. Таким образом, фазовые данные повышают точность обнаружения ВЧК по сравнению с использованием нефазированных данных (таких как способы, которые вычисляют отношения аллелей в одном или более локусов или совокупные отношения аллелей, чтобы получить агрегированное значение (такое, как среднее значение) по хромосоме или хромосомному сегменту без учета того, указывают ли соотношения аллелей в разных локусах на то, что одинаковые или разные гаплотипы присутствуют в ненормальном количестве). Использование фазированных данных позволяет более точно определить, вызваны ли различия между измеренными и ожидаемыми соотношениями аллелей шумом или наличием ВЧК. Например, если различия между измеренными и ожидаемыми соотношениями аллелей в большинстве или во всех локусах в области указывают на то, что один и тот же гаплотип представлен чрезмерно, то ВЧК с большей вероятностью присутствует. Использование связи между аллелями в гаплотипе позволяет определить, соответствуют ли измеренные генетические данные тому же гаплотипу, который представлен чрезмерно большим количеством (а не случайным шумом). Напротив, если различия между измеренными и ожидаемыми соотношениями аллелей обусловлены только шумом (таким как экспериментальная ошибка), то в некоторых вариантах воплощения приблизительно половину времени первый гаплотип представлен как присутствующий в чрезмерно большом количестве, и приблизительно вторую половину времени второй гаплотип представлен как присутствующий в чрезмерно большом количестве.
[315] В некоторых вариантах воплощения фазированные генетические данные используются для определения наличия чрезмерного количества копий первого гомологичного сегмента хромосомы по сравнению со вторым гомологичным сегментом хромосомы в геноме индивидуума (например, в геноме одной или более клеток или в скДНК или скРНК). Типичные чрезмерные представления включают дупликацию первого гомологичного сегмента хромосомы или делецию второго гомологичного сегмента хромосомы. В некоторых вариантах воплощения чрезмерное представление отсутствует, поскольку первый и гомологичный сегменты хромосомы присутствуют в равных пропорциях (например, одна копия каждого сегмента в диплоидном образце). В некоторых вариантах воплощения рассчитанные соотношения аллелей в образце нуклеиновой кислоты сравнивают с ожидаемыми соотношениями аллелей, чтобы определить, существует ли избыточная представленность, как описано далее ниже. В данном описании фраза «первый гомологичный сегмент хромосомы по сравнению со вторым гомологичным сегментом хромосомы» означает первый гомолог сегмента хромосомы и второй гомолог сегмента хромосомы.
[316] В некоторых вариантах воплощения способ включает получение фазированных генетических данных для первого гомологичного сегмента хромосомы, включающего идентичность аллеля, присутствующего в этом локусе на первом гомологичном сегменте хромосомы для каждого локуса в наборе полиморфных локусов на первом гомологичном сегменте хромосомы, получение фазированных генетических данных для второго гомологичного хромосомного сегмента, содержащего идентичность аллеля, присутствующего в этом локусе на втором гомологичном хромосомном сегменте для каждого локуса в наборе полиморфных локусов на втором гомологичном хромосомном сегменте, и получение измеренных генетических данных аллелей, содержащих для каждого из аллелей в каждом из локусов в наборе полиморфных локусов количество каждого аллеля, присутствующего в образце ДНК или РНК из одной или более клеток-мишеней и одной или более нецелевых клеток от индивидуума. В некоторых вариантах воплощения способ включает перечисление набора из одной или более гипотез, указывающих степень избыточной представленности первого гомологичного сегмента хромосомы; вычисление для каждой из гипотез ожидаемых генетических данных для множества локусов в образце из полученных фазированных генетических данных для одного или более возможных соотношений ДНК или РНК из одной или более клеток-мишеней к общей ДНК или РНК в образце; вычисление (например, вычисление на компьютере) для каждого возможного соотношения ДНК или РНК и для каждой гипотезы, соответствуют ли данные от полученных генетических данных образца для этого возможного соотношения ДНК или РНК и для этой гипотезы ожидаемым генетическим данным для образца; ранжирование одной или более гипотез согласно соответствию данных; и выбор гипоты, которая имеет самый высокий рейтинг, тем самым определяя степень чрезмерной представленности числа копий первого гомологичного сегмента хромосомы в геноме одной или более клеток от индивидуума.
[317] В некоторых вариантах воплощения способ включает получение фазированных генетических данных с использованием любого из способов, представленных в настоящем документе, или любого известного способа. В некоторых вариантах воплощения способ включает одновременно или последовательно в любом порядке (i) получение фазированных генетических данных для первого гомологичного сегмента хромосомы, включающих идентичность аллеля, присутствующего в этом локусе на первом гомологичном сегменте хромосомы, для каждого локуса в наборе полиморфных локусов на первом гомологичном сегменте хромосомы, (ii) получение фазированных генетических данных для второго гомологичного хромосомного сегмента, содержащего идентичность аллеля, присутствующего в этом локусе на втором гомологичном хромосомном сегменте для каждого локуса в наборе полиморфных локусов на втором гомологичном хромосомном сегменте, и (iii) получение измеренных генетических данных аллеля, включающих количество каждого аллеля в каждом из локусов в наборе полиморфных локусов в образце ДНК из одной или более клеток индивидуума.
[318] В некоторых вариантах воплощения способ включает вычисление соотношений аллелей для одного или более локусов в наборе полиморфных локусов, которые являются гетерозиготными по меньшей мере в одной клетке, из которой был получен образец. В некоторых вариантах воплощения рассчитанное соотношение аллелей для определенного локуса представляет собой измеренное количество одного из аллелей, деленное на общее измеренное количество всех аллелей для локуса. В некоторых вариантах воплощения рассчитанное соотношение аллелей для конкретного локуса представляет собой измеренное количество одного из аллелей (например, аллеля в первом сегменте гомологичной хромосомы), разделенное на измеренное количество одного или более других аллелей (например, аллеля во втором сегменте гомологичной хромосомы) для локуса. Рассчитанные соотношения аллелей могут быть рассчитаны с использованием любого из способов, представленных в настоящем документе, или любого стандартного способа (такого как любое математическое преобразование вычисленных соотношений аллелей, представленных в настоящем документе).
[319] В некоторых вариантах воплощения способ включает определение наличия чрезмерного количества копий первого гомологичного сегмента хромосомы путем сравнения одного или более рассчитанных соотношений аллелей для локуса с отношением аллелей, которое ожидается для этого локуса, если первый и второй гомологичные сегменты хромосомы присутствуют в равных пропорциях. В некоторых вариантах воплощения ожидаемое соотношение аллелей предполагает, что возможные аллели для локуса имеют равную вероятность присутствия. В некоторых вариантах воплощения, в которых вычисленное отношение аллелей для конкретного локуса представляет собой измеренное количество одного из аллелей, деленное на общее измеренное количество всех аллелей для локуса, соответствующее ожидаемое соотношение аллелей составляет 0,5 для двухаллельного локуса или 1/3 для трехаллельного локуса. В некоторых вариантах воплощения ожидаемое соотношение аллелей одинаково для всех локусов, например 0,5 для всех локусов. В некоторых вариантах воплощения ожидаемое соотношение аллелей предполагает, что возможные аллели для локуса могут иметь различную вероятность присутствия, такую как вероятность, основанная на частоте каждого из аллелей в конкретной популяции, к которой принадлежит субъект, такой как популяция, основанная на родословной субъекта. Такие частоты аллелей общедоступны (см., например, HapMap Project; Perlegen Human Haplotype Project; web на ncbi.nlm.nih.gov/projects/SNP/; Sherry ST, Ward MH, Kholodov M, et al. dbSDNP: the NCBI database of genetic variation. Nucleic Acids Res. 2001 Jan 1;29(1):308-11, каждый из которых включен посредством ссылки во всей полноте). В некоторых вариантах воплощения ожидаемое соотношение аллелей - это соотношение аллелей, которое ожидается для конкретного индивидуума, тестируемого для конкретной гипотезы, определяющей степень избыточной представленности первого гомологичного сегмента хромосомы. Например, ожидаемое соотношение аллелей для конкретного индивидуума может быть определено на основе фазированных или нефазированных генетических данных от индивидуума (например, из образца от индивидуума, который вряд ли будет иметь делецию или дупликацию, такого как нераковый образец) или данных от одного или более родственников индивидуума.
[320] В некоторых вариантах воплощения рассчитанное соотношение аллелей указывает на чрезмерную представленность числа копий первого сегмента гомологичной хромосомы, если либо (i) соотношение аллелей для измеренного количества аллеля, присутствующего в этом локусе на первой гомологичной хромосоме, деленное на общее измеренное количество всех аллелей для локуса больше, чем ожидаемое соотношение аллелей для этого локуса, или (ii) отношение аллелей для измеренного количества аллеля, присутствующего в этом локусе на второй гомологичной хромосоме, деленное на общее измеренное количество всех аллелей для локуса, меньше, чем ожидаемое соотношение аллелей для этого локуса. В некоторых вариантах воплощения рассчитанное соотношение аллелей считается показателем избыточной представленности, только если оно значительно выше или ниже ожидаемого соотношения для этого локуса. В некоторых вариантах воплощения рассчитанное соотношение аллелей указывает на отсутствие чрезмерной представленности числа копий первого гомологичного сегмента хромосомы, если либо (i) соотношение аллелей для измеренного количества аллеля, присутствующего в этом локусе на первой гомологичной хромосоме, деленное на общее измеренное количество всех аллелей для локуса, меньше или равно ожидаемому соотношению аллелей для этого локуса, или (ii) отношение аллелей для измеренного количества аллеля, присутствующего в этом локусе на второй гомологичной хромосоме, деленное на общее измеренное количество всех аллелей для локуса, больше или равно ожидаемому отношению аллелей для этого локуса. В некоторых вариантах воплощения рассчитанные коэффициенты, равные соответствующему ожидаемому коэффициенту, игнорируются (так как они указывают на отсутствие чрезмерной представленности).
[321] В различных вариантах воплощения используются один или более из следующих способов для сравнения одного или более рассчитанных соотношений аллелей с соответствующими ожидаемыми соотношениями аллелей. В некоторых вариантах воплощения определяют, является ли рассчитанное соотношение аллелей выше или ниже ожидаемого соотношения аллелей для конкретного локуса, независимо от величины различия. В некоторых вариантах воплощения определяют величину различия между рассчитанным отношением аллелей и ожидаемым отношением аллелей для конкретного локуса независимо от того, находится ли рассчитанное соотношение аллелей выше или ниже ожидаемого соотношения аллелей. В некоторых вариантах воплощения определяют, является ли вычисленное соотношение аллелей выше или ниже ожидаемого соотношения аллелей, и величину различия для конкретного локуса. В некоторых вариантах воплощения определяют, является ли среднее или средневзвешенное значение рассчитанных соотношений аллелей выше или ниже среднего или средневзвешенного значения ожидаемых соотношений аллелей независимо от величины различия. В некоторых вариантах воплощения определяют величину различия между средним или средневзвешенным значением рассчитанных соотношений аллелей и средним или средневзвешенным значением ожидаемых соотношений аллелей независимо от того, выше или ниже среднее или средневзвешенное значение рассчитанного соотношения аллелей среднего или средневзвешенного значения ожидаемого соотношения аллелей. В некоторых вариантах воплощения определяют, является ли среднее или средневзвешенное значение рассчитанных соотношений аллелей выше или ниже среднего или средневзвешенного значения ожидаемых соотношений аллелей, и величину различия. В некоторых вариантах воплощения определяют среднее или средневзвешенное значение величины различия между рассчитанными соотношениями аллелей и ожидаемыми соотношениями аллелей.
[322] В некоторых вариантах воплощения величина различия между рассчитанным соотношением аллелей и ожидаемым соотношением аллелей для одного или более локусов используется для определения того, является ли чрезмерное представление числа копий первого гомологичного сегмента хромосомы следствием дублирования первого гомологичного сегмента хромосомы или делеции второго гомологичного сегмента хромосомы в геноме одной или более клеток.
[323] В некоторых вариантах воплощения определяется чрезмерная представленность количества копий первого сегмента гомологичной хромосомы, если выполняется одно или более из следующих условий. В некоторых вариантах воплощения число рассчитанных соотношений аллелей, которые указывают на чрезмерную представленность числа копий первого гомологичного сегмента хромосомы, выше порогового значения. В некоторых вариантах воплощения количество рассчитанных соотношений аллелей, которые указывают на отсутствие чрезмерной представленности числа копий первого гомологичного сегмента хромосомы, ниже порогового значения. В некоторых вариантах воплощения величина различия между рассчитанными соотношениями аллелей, которые указывают на чрезмерную представленность числа копий первого гомологичного сегмента хромосомы и соответствующими ожидаемыми соотношениями аллелей, выше порогового значения. В некоторых вариантах воплощения для всех рассчитанных соотношений аллелей, которые указывают на чрезмерную представленность, сумма величины различий между рассчитанным отношением аллелей и соответствующим ожидаемым отношением аллелей выше порогового значения. В некоторых вариантах воплощения величина различия между рассчитанными соотношениями аллелей, которые указывают на отсутствие чрезмерной представленности числа копий первого гомологичного сегмента хромосомы и соответствующими ожидаемыми соотношениями аллелей, ниже порогового значения. В некоторых вариантах воплощения среднее или средневзвешенное значение рассчитанных соотношений аллелей для измеренного количества аллеля, присутствующего в первой гомологичной хромосоме, деленное на общее измеренное количество всех аллелей для локуса, больше, чем среднее или средневзвешенное значение ожидаемых соотношений аллелей по меньшей мере в рамках порогового значения. В некоторых вариантах воплощения среднее или средневзвешенное значение рассчитанных соотношений аллелей для измеренного количества аллеля, присутствующего на второй гомологичной хромосоме, деленное на общее измеренное количество всех аллелей для локуса, меньше, чем среднее или средневзвешенное значение ожидаемого отношения аллеля по меньшей мере в рамках порогового значения. В некоторых вариантах воплощения соответствие данных между рассчитанными соотношениями аллелей и соотношениями аллелей, которые прогнозируются для чрезмерной представленности числа копий первого гомологичного сегмента хромосомы, ниже порогового значения (указывает на хорошее совпадение данных). В некоторых вариантах воплощения соответствие данных между рассчитанными соотношениями аллелей и соотношениями аллелей, которые прогнозируются для отсутствия чрезмерной представленности числа копий первого гомологичного сегмента хромосомы, превышает пороговое значение (указывает на плохое соответствие данных).
[324] В некоторых вариантах воплощения чрезмерная представленность количества копий первого гомологичного сегмента хромосомы определяется как отсутствующая, если выполняется одно или более из следующих условий. В некоторых вариантах воплощения количество рассчитанных соотношений аллелей, которые указывают на чрезмерную представленность числа копий первого гомологичного сегмента хромосомы, ниже порогового значения. В некоторых вариантах воплощения число рассчитанных соотношений аллелей, которые указывают на отсутствие чрезмерной представленности числа копий первого гомологичного сегмента хромосомы, выше порогового значения. В некоторых вариантах воплощения величина различия между рассчитанными соотношениями аллелей, которые указывают на чрезмерную представленность числа копий первого гомологичного сегмента хромосомы и соответствующих ожидаемых соотношений аллелей, ниже порогового значения. В некоторых вариантах воплощения величина различия между рассчитанными соотношениями аллелей, которые указывают на отсутствие чрезмерной представленности числа копий первого гомологичного сегмента хромосомы и соответствующих ожидаемых соотношений аллелей, выше порогового значения. В некоторых вариантах воплощения среднее или средневзвешенное значение рассчитанных соотношений аллелей для измеренного количества аллеля, присутствующего в первой гомологичной хромосоме, деленное на общее измеренное количество всех аллелей для локуса минус среднее или средневзвешенное значение ожидаемых соотношений аллелей меньше порогового значения. В некоторых вариантах воплощения среднее или средневзвешенное значение ожидаемых соотношений аллелей минус среднее или средневзвешенное значение рассчитанных соотношений аллелей для измеренного количества аллеля, присутствующего на второй гомологичной хромосоме, деленное на общее измеренное количество всех аллелей для локуса, меньше порогового значения. В некоторых вариантах воплощения соответствие данных между рассчитанными соотношениями аллелей и соотношениями аллелей, которые прогнозируются для чрезмерной представленности числа копий первого гомологичного сегмента хромосомы, выше порогового значения. В некоторых вариантах воплощения соответствие данных между рассчитанными соотношениями аллелей и соотношениями аллелей, которые прогнозируются для отсутствия чрезмерного представления числа копий первого гомологичного сегмента хромосомы, ниже порогового значения. В некоторых вариантах воплощения пороговое значение определяется на основе эмпирических испытаний образцов, для которых известно наличие интересующей ВЧК, и/или образцов, для которых известно отсутствие ВЧК.
[325] В некоторых вариантах воплощения определение того, существует ли чрезмерная представленность числа копий первого гомологичного сегмента хромосомы, включает перечисление набора из одной или более гипотез, указывающих степень избыточной представленности первого гомологичного сегмента хромосомы. Примерной гипотезой является отсутствие чрезмерной представленности, поскольку первый и гомологичный сегменты хромосомы присутствуют в равных пропорциях (например, одна копия каждого сегмента в диплоидном образце). Другие примерные гипотезы включают первый гомологичный хромосомный сегмент, дублируемый один или более раз (например, 1, 2, 3, 4, 5 или более дополнительных копий первой гомологичной хромосомы по сравнению с количеством копий второго гомологичного хромосомного сегмента). Другая примерная гипотеза включает делецию второго гомологичного сегмента хромосомы. Еще одной примерной гипотезой является делеция как первого, так и второго гомологичных сегментов хромосомы. В некоторых вариантах воплощения предполагаемые соотношения аллелей для локусов, которые являются гетерозиготными по меньшей мере в одной клетке, оцениваются для каждой гипотезы с учетом степени избыточной представленности, определенной этой гипотезой. В некоторых вариантах воплощения вероятность того, что гипотеза верна, рассчитывается путем сравнения рассчитанных соотношений аллелей с прогнозируемыми соотношениями аллелей, и выбирается гипотеза с наибольшим правдоподобием.
[326] В некоторых вариантах воплощения ожидаемое распределение тестовой статистики рассчитывается с использованием предсказанных соотношений аллелей для каждой гипотезы. В некоторых вариантах воплощения вероятность того, что гипотеза верна, рассчитывается путем сравнения тестовой статистики, которая рассчитывается с использованием рассчитанных соотношений аллелей, с ожидаемым распределением тестовой статистики, рассчитанной с использованием прогнозируемых соотношений аллелей, и выбирается гипотеза с наибольшим правдоподобием.
[327] В некоторых вариантах воплощения прогнозируемые соотношения аллелей для локусов, которые являются гетерозиготными по меньшей мере в одной клетке, оцениваются с учетом фазированных генетических данных для первого гомологичного сегмента хромосомы, фазированных генетических данных для второго гомологичного сегмента хромосомы и степени избыточной представленности, определенной этой гипотезой. В некоторых вариантах воплощения вероятность того, что гипотеза верна, рассчитывается путем сравнения рассчитанных соотношений аллелей с предсказанными соотношениями аллелей; и выбирается гипотеза с наибольшим правдоподобием.
[328] Использование смешанных образцов
[329] Понятно, что для многих вариантов воплощения образец представляет собой смешанный образец с ДНК или РНК из одной или более клеток-мишеней и одной или более нецелевых клеток. В некоторых вариантах воплощения клетки-мишени - это клетки, которые имеют ВЧК, например, интересующую делецию или дупликацию, а нецелевые клетки - это клетки, которые не имеют интересующего изменения числа копий (например, смесь клеток с делецией или дупликацией клеток и исследуемые клетки без каких-либо делеций или дупликаций). В некоторых вариантах воплощения клетки-мишени представляют собой клетки, которые связаны с заболеванием или расстройством или повышенным риском заболевания или расстройства (например, раковые клетки), а клетки, не являющиеся мишенью, представляют собой клетки, которые не связаны с заболеванием или расстройством или повышенным риском для заболевания или расстройства (такие, как нераковые клетки) В некоторых вариантах воплощения все клетки-мишени имеют одинаковую ВЧК. В некоторых вариантах воплощения две или более клеток-мишеней имеют разные ВЧК. В некоторых вариантах воплощения одна или более клеток-мишеней имеют ВЧК, полиморфизм или мутацию, связанную с заболеванием или расстройством или повышенным риском заболевания или расстройства, которые не обнаруживают по меньшей мере в одной другой клетке-мишени. В некоторых таких вариантах воплощения предполагается, что фракция клеток, которые связаны с заболеванием или расстройством или повышенным риском заболевания или расстройства, от общего количества клеток в образце больше или равна фракции наиболее частой из этих ВЧК, полиморфизмов или мутаций в образце. Например, если 6% клеток имеют мутацию K-ras, а 8% клеток имеют мутацию BRAF, предполагается, что по меньшей мере 8% клеток являются раковыми.
[330] В некоторых вариантах воплощения рассчитывается отношение ДНК (или РНК) от одной или более клеток-мишеней к общей ДНК (или РНК) в образце. В некоторых вариантах воплощения перечислен ряд из одной или более гипотез, определяющих степень избыточной представленности первого гомологичного сегмента хромосомы. В некоторых вариантах воплощения прогнозируемые соотношения аллелей для локусов, которые являются гетерозиготными по меньшей мере в одной клетке, оцениваются с учетом рассчитанного соотношения ДНК или РНК и степени избыточной представленности, определенной этой гипотезой, оцениваются для каждой гипотезы. В некоторых вариантах воплощения вероятность того, что гипотеза верна, рассчитывается путем сравнения рассчитанных соотношений аллелей с прогнозируемыми соотношениями аллелей, и выбирается гипотеза с наибольшей правдоподобностью.
[331] В некоторых вариантах воплощения ожидаемое распределение тестовой статистики, рассчитанной с использованием предсказанных соотношений аллелей и рассчитанного соотношения ДНК или РНК, оценивается для каждой гипотезы. В некоторых вариантах воплощения вероятность того, что гипотеза верна, определяется путем сравнения тестовой статистики, рассчитанной с использованием рассчитанных соотношений аллелей и рассчитанного отношения ДНК или РНК, с ожидаемым распределением тестовой статистики, рассчитанной с использованием прогнозируемых соотношений аллелей и рассчитанного отношения ДНК или РНК, и выбирается гипотеза с наибольшей правдоподобностью.
[332] В некоторых вариантах воплощения способ включает перечисление набора из одной или более гипотез, определяющих степень избыточной представленности первого сегмента гомологичной хромосомы. В некоторых вариантах воплощения способ включает в себя оценку для каждой гипотезы либо (i) прогнозируемых соотношений аллелей для локусов, которые являются гетерозиготными по меньшей мере в одной клетке, с учетом степени избыточной представленности, определенной этой гипотезой или (ii) для одного или более возможных соотношений ДНК или РНК - ожидаемое распределение тестовой статистики, рассчитанной с использованием предсказанных соотношений аллелей и возможного отношения ДНК или РНК из одной или более клеток-мишеней к общей ДНК или РНК в образце. В некоторых вариантах воплощения совпадение данных рассчитывается путем сравнения или (i) рассчитанных соотношений аллелей с предсказанными соотношениями аллелей или (ii) тестовой статистики, рассчитанной с использованием рассчитанных соотношений аллелей и возможного соотношения ДНК или РНК к ожидаемому распределению тестовой статистики, рассчитанной с использованием предсказанных соотношений аллелей и возможного соотношения ДНК или РНК. В некоторых вариантах воплощения одна или более гипотез ранжируются в соответствии с совпадением данных и выбирается гипотеза, которая имеет самый высокий рейтинг. В некоторых вариантах воплощения используется методика или алгоритм, такой как алгоритм поиска, для одного или более из следующих этапов: вычисление совпадения данных, ранжирование гипотез или выбор гипотезы, которая имеет самый высокий рейтинг. В некоторых вариантах воплощения совпадение данных - это соответствие бета-биномиальному распределению или соответствие биномиальному распределению. В некоторых вариантах воплощения методику или алгоритм выбирают из группы, состоящей из оценки максимального правдоподобия, максимальной апостериорной оценки, байесовской оценки, динамической оценки (такой как динамическая байесовская оценка) и оценки максимизации ожидания. В некоторых вариантах воплощения способ включает применение методики или алгоритма к полученным генетическим данным и ожидаемым генетическим данным.
[333] В некоторых вариантах воплощения способ включает создание разбиения возможных соотношений, которые варьируются от нижнего предела до верхнего предела для отношения ДНК или РНК от одной или более клеток-мишеней к общей ДНК или РНК в образце. В некоторых вариантах воплощения перечислены одна или более гипотез, определяющих степень избыточной представленности первого гомологичного сегмента хромосомы. В некоторых вариантах воплощения способ включает оценку для каждого из возможных соотношений ДНК или РНК в разбиении и для каждой гипотезы либо (i) предсказанных соотношений аллелей для локусов, которые являются гетерозиготными по меньшей мере в одной клетке с учетом возможного соотношения ДНК или РНК, и степень избыточной представленности, определяемая этой гипотезой, или (ii) ожидаемого распределения тестовой статистики, рассчитанной с использованием предсказанных соотношений аллелей и возможного соотношения ДНК или РНК. В некоторых вариантах воплощения способ включает вычисление для каждого из возможных соотношений ДНК или РНК в разбиении и для каждой гипотезы, вероятности того, что гипотеза верна, путем сравнения либо (i) вычисленных соотношений аллелей с предсказанными соотношениями аллелей, либо (ii) тестовой статистики, рассчитанной с использованием рассчитанных соотношений аллелей и возможного соотношения ДНК или РНК к ожидаемому распределению тестовой статистики, рассчитанной с использованием предсказанных соотношений аллелей и возможного соотношения ДНК или РНК. В некоторых вариантах воплощения объединенная вероятность для каждой гипотезы определяется путем объединения вероятностей этой гипотезы для каждого из возможных соотношений в разбиении; и выбирается гипотеза с наибольшей совокупной вероятностью. В некоторых вариантах воплощения объединенная вероятность для каждой гипотезы определяется путем взвешивания вероятности гипотезы для конкретного возможного соотношения на основе вероятности того, что возможное соотношение является верным соотношением.
[334] В некоторых вариантах воплощения методика, которая выбирается из группы, состоящей из оценки максимального правдоподобия, максимальной апостериорной оценки, байесовской оценки, динамической оценки (такой как динамическая байесовская оценка) и оценки максимизации ожидания, используется для оценки соотношения ДНК или РНК из одного или более клеток-мишеней к общей ДНК или РНК в образце. В некоторых вариантах воплощения предполагается, что отношение ДНК или РНК из одной или более клеток-мишеней к общей ДНК или РНК в образце одинаково для двух или более (или всех) интересующих ВЧК. В некоторых вариантах воплощения отношение ДНК или РНК из одной или более клеток-мишеней к общей ДНК или РНК в образце рассчитывается для каждой интересующей ВЧК.
[335] Примерные способы использования недостаточно фазированных данных
[336] Следует понимать, что для многих вариантов воплощения используются несовершенно фазированные данные. Например, для одного или более локусов в первом и/или втором сегменте гомологичной хромосомы может быть не известно со 100% уверенностью, какой аллель присутствует. В некоторых вариантах воплощения при расчете вероятности каждой гипотезы используются исходные данные для возможных гаплотипов индивидуума (таких как гаплотипы, основанные на частотах гаплотипов, основанных на популяции). В некоторых вариантах воплощения исходные данные для возможных гаплотипов корректируется либо с помощью другого способа для фазированной генерации генетических данных, либо с помощью фазированных данных от других субъектов (например, предыдущих субъектов) для уточнения популяционных данных, используемых для фазирования индивидуума на основе биоинформатики.
[337] В некоторых вариантах воплощения фазированные генетические данные содержат вероятностные данные для двух или более возможных наборов фазированных генетических данных, причем каждый возможный набор фазированных данных содержит возможную идентичность аллеля, присутствующего в каждом локусе в наборе полиморфных локусов на первом гомологичном сегменте хромосомы, и возможную идентичность аллеля, присутствующего в каждом локусе в наборе полиморфных локусов на втором гомологичном сегменте хромосомы. В некоторых вариантах воплощения вероятность по меньшей мере для одной из гипотез определяется для каждого из возможных наборов фазированных генетических данных. В некоторых вариантах воплощения объединенная вероятность для гипотезы определяется путем объединения вероятностей гипотезы для каждого из возможных наборов фазированных генетических данных; и выбирается гипотеза с наибольшей совокупной вероятностью.
[338] Любой из способов, раскрытых в данном документе, или любой известный способ может быть использован для получения неполностью фазированных данных (такой как использование популяционных частот гаплотипов для определения наиболее вероятной фазы) для использования в заявленных способах. В некоторых вариантах воплощения фазированные данные получают путем вероятностного объединения гаплотипов более мелких сегментов. Например, возможные гаплотипы могут быть определены на основе возможных комбинаций одного гаплотипа из первой области с другим гаплотипом из другой области из той же хромосомы. Вероятность того, что конкретные гаплотипы из разных областей являются частью одного и того же более крупного блока гаплотипов в одной и той же хромосоме, может быть определена с использованием, например, популяционных частот гаплотипов и/или известных скоростей рекомбинации между различными областями.
[339] В некоторых вариантах воплощения для нулевой гипотезы дисомии используется тест отклонения единичной гипотезы. В некоторых вариантах воплощения вычисляется вероятность гипотезы дисомии, и гипотеза дисомии отклоняется, если вероятность ниже заданного порогового значения (например, менее 1 на 1000). Если нулевая гипотеза отклонена, это может быть связано с ошибками в неполностью фазированных данных или с наличием ВЧК. В некоторых вариантах воплощения получают более точные фазированные данные (такие как фазированные данные из любого из способов молекулярного фазирования, раскрытых в данном документе, для получения фактических фазированных данных, а не выводимых на основе биоинформатики фазированных данных). В некоторых вариантах воплощения вероятность гипотезы дисомии пересчитывается с использованием более точных фазированных данных для того, чтобы определить, следует ли отклонять гипотезу дисомии. Отказ от этой гипотезы указывает на наличие дупликации или делеции сегмента хромосомы. При необходимости, уровень ложноположительных результатов можно изменить, отрегулировав пороговое значение.
[340] Дальнейшие примерные варианты воплощения для определения плоидности с применением фазированных данных
[341] В иллюстративных вариантах воплощения в настоящем документе представлен способ определения плоидности хромосомного сегмента в образце индивидуума. Способ включает следующие этапы: получение данных о частоте аллеля, включающих количество каждого аллеля, присутствующего в образце в каждом локусе в наборе полиморфных локусов на хромосомном сегменте; получение фазированной аллельной информации для набора полиморфных локусов путем оценки фазы данных частоты аллелей; получение индивидуальных вероятностей частот аллелей для полиморфных локусов для различных состояний плоидности с использованием данных частоты аллелей; получение совместных вероятностей для набора полиморфных локусов с использованием индивидуальных вероятностей и фазированной аллельной информации; и выбор, основываясь на совместных вероятностях, модели наилучшего соответствия, указывающей на плоидность хромосом, тем самым определяя плоидность хромосомного сегмента.
[342] Как раскрывается в данном документе, данные о частоте аллелей (также называемые в данном документе измеренными данными о генетических аллелях) могут быть получены способами, известными в данной области техники. Например, данные могут быть получены с использованием кПЦР или микрочипов. В одном иллюстративном варианте воплощения данные генерируются с использованием данных секвенирования нуклеиновой кислоты, особенно данных секвенирования нуклеиновой кислоты с высокой пропускной способностью.
[343] В определенных иллюстративных примерах данные о частоте аллеля корректируются на ошибки до того, как они используются для генерации индивидуальных вероятностей. В конкретных иллюстративных вариантах воплощения ошибки, которые исправляются, включают смещение эффективности амплификации аллелей. В других вариантах воплощения ошибки, которые исправляются, включают загрязнение окружающей средой и загрязнение генотипом. В некоторых вариантах воплощения исправленные ошибк включают смещение амплификации аллелей, ошибки секвенирования, загрязнение окружающей средой и загрязнение генотипом.
[344] В некоторых вариантах воплощения индивидуальные вероятности генерируются с использованием набора моделей как различных состояний плоидности, так и фракций аллельного дисбаланса для набора полиморфных локусов. В этих вариантах воплощения и других вариантах воплощения объединенные вероятности генерируются с учетом связи между полиморфными локусами на сегменте хромосомы.
[345] Соответственно, в одном иллюстративном варианте воплощения, который объединяет некоторые из этих вариантов воплощения, в настоящем документе представлен способ обнаружения хромосомной плоидности в образце индивидуума, который включает в себя следующие этапы: получение данных последовательности нуклеиновой кислоты для аллелей в наборе полиморфных локусов на сегменте хромосомы у индивидуума; обнаружение частот аллелей в наборе локусов с использованием данных секвенирования нуклеиновой кислоты; исправление смещения эффективности амплификации аллелей в обнаруженных частотах аллелей для генерации скорректированных частот аллелей для набора полиморфных локусов; получение индивидуальных вероятностей частот аллелей для полиморфных локусов для различных состояний плоидности путем сравнения фазированной аллельной информации с набором моделей различных состояний плоидности и фракций аллельного дисбаланса набора полиморфных локусов; получение фазированной аллельной информации для набора полиморфных локусов путем оценки данных секвенирования нуклеиновой кислоты; получение объединенных вероятностей для набора полиморфных локусов путем объединения индивидуальных вероятностей с учетом связи между полиморфными локусами на сегменте хромосомы; и, основываясь на объединенных вероятностях, выбор модели наилучшего соответствия, указывающей на хромосомную анеуплоидию.
[346] Как раскрыто в данном документе, индивидуальные вероятности могут быть сгенерированы с использованием набора моделей или гипотезы как различных состояний плоидности, так и средних фракций аллельного дисбаланса для набора полиморфных локусов. Например, в особенно иллюстративном примере, индивидуальные вероятности генерируются путем моделирования состояний плоидности первого гомолога сегмента хромосомы и второго гомолога сегмента хромосомы. Моделируемые состояния плоидности включают следующее: (1) все клетки не имеют делеции или амплификации первого гомолога или второго гомолога сегмента хромосомы; (2) по меньшей мере, некоторые клетки имеют делецию первого гомолога или амплификацию второго гомолога сегмента хромосомы; и (3) по меньшей мере некоторые клетки имеют делецию второго гомолога или амплификацию первого гомолога сегмента хромосомы.
[347] Следует понимать, что вышеупомянутые модели могут также называться гипотезой, которая используется для ограничения модели. Таким образом, продемонстрировано 3 гипотезы, которые могут быть использованы.
[348] Моделируемые средние фракции аллельного дисбаланса могут включать любой диапазон среднего аллельного дисбаланса, который включает в себя фактический средний аллельный дисбаланс хромосомного сегмента. Например, в некоторых иллюстративных вариантах воплощения диапазон среднего аллельного дисбаланса, который моделируется, может быть между 0, 0,1, 0,2, 0,25, 0,3, 0,4, 0,5, 0,6, 0,75, 1, 2, 2,5, 3, 4 и 5% на нижнем конце и 1, 2, 2,5, 3, 4, 5, 10, 15, 20, 25, 30, 40, 50, 60, 70, 80, 90, 95 и 99% на верхнем конце. Интервалы для моделирования с диапазоном могут быть любым интервалом в зависимости от используемой вычислительной мощности и времени, отведенного для анализа. Например, можно смоделировать интервалы 0,01, 0,05, 0,02 или 0,1.
[349] В определенных иллюстративных вариантах воплощения образец имеет средний аллельный дисбаланс для хромосомного сегмента от 0,4% до 5%. В некоторых вариантах воплощения средний аллельный дисбаланс является низким. В этих вариантах воплощения средний аллельный дисбаланс обычно составляет менее 10%. В некоторых иллюстративных вариантах воплощения аллельный дисбаланс составляет от 0,25, 0,3, 0,4, 0,5, 0,6, 0,75, 1, 2, 2,5, 3, 4 и 5% на нижнем конце и до 1, 2, 2,5, 3, 4 и 5% на верхнем конце. В других примерных вариантах воплощения средний аллельный дисбаланс составляет от 0,4, 0,45, 0,5, 0,6, 0,7, 0,8, 0,9 или 1,0% на нижнем конце до 0,5, 0,6, 0,7, 0,8, 0,9, 1,0, 1,5, 2,0, 3,0 4,0 или 5,0% на верхнем конце. Например, средний аллельный дисбаланс образца в иллюстративном примере составляет от 0,45 до 2,5%. В другом примере средний аллельный дисбаланс обнаруживается с чувствительностью 0,45, 0,5, 0,6, 0,7, 0,8. 0,9 или 1,0%. То есть способ испытания способен обнаруживать хромосомную анеуплоидию до AAI (average allelic imbalance - средний аллельный дисбаланс) 0,45, 0,5, 0,6, 0,7, 0,8. 0,9 или 1,0%. В примерный образец с низким аллельным дисбалансом в способах по настоящему изобретению входят образцы плазмы от индивидуумов с раком, имеющих циркулирующую опухолевую ДНК, или образцы плазмы от беременных женщин, имеющих циркулирующую эмбриональную ДНК.
[350] Следует понимать, что для ОНВ доля аномальной ДНК обычно измеряется с использованием частоты мутантных аллелей (количество мутантных аллелей в локусе/общее количество аллелей в этом локусе). Поскольку разница между количеством двух гомологов в опухолях аналогична, мы измеряем долю аномальной ДНК для ВЧК по среднему аллельному дисбалансу (AAI), определяемому как |(H1 - H2)|/(H1 + H2), где Hi - среднее число копий гомолога i в образце, а Hi/(H1 + H2) - относительная распространенность или соотношение гомологов гомолога i. Максимальное соотношение гомологов - это соотношение гомологов более распространенного гомолога.
[351] Коэффициент отсева анализа - это процент ОНП без считывания, рассчитанный с использованием всех ОНП. Частота отсева одиночных аллелей (ADO - single allele drop-out) - это процент ОНП, в котором присутствует только один аллель, по оценкам с использованием только гетерозиготных ОНП. Достоверность генотипа можно определить путем подгонки биномиального распределения к числу считываний в каждом ОНП, которые были считываниями B-аллеля, и использования статуса плоидности фокальной области ОНП для оценки вероятности каждого генотипа.
[352] Для образцов опухолевой ткани хромосомная анеуплоидия (примером которой в этом параграфе являются ВЧК) может быть очерчена переходами между частотными распределениями аллелей. В образцах плазмы больных раком, индивидуумов, подозреваемых на наличие рака, индивидуумов, у которых ранее был диагностирован рак, или в качестве скрининга рака для индивидуумов из группы риска или популяции в целом, ВЧК могут быть идентифицированы с помощью алгоритма максимального правдоподобия, который ищет плазменные ВЧК в областях, о которых известно, что они проявляют анеуплоидию при раке, и/или где образец опухоли от того же индивидуума также имеет ВЧК. В иллюстративных вариантах воплощения алгоритм использует информацию о фазе гаплотипа индивидуума, чей образец анализируется на наличие циркулирующей опухолевой ДНК, чтобы соответствовать количеству аллелей измеренного и скорректированного тестового образца ожидаемому количеству аллелей, например, с использованием режима совместного распределения. Такая информация о фазе гаплотипа может быть получена из любого образца от индивидуума, который включает в основном или по меньшей мере 60, 70, 80, 90, 95, 96, 97, 98, 99% или всю нормальную клеточную ДНК, такую как, без ограничений, образец лейкотромбоцитарного слоя, образец слюны или образец кожи, из информации о генотипах родителей или фазирования гаплотипов de novo, что может быть достигнуто различными способами (см., например, Snyder, M., et al., Haplotype-resolved genome sequencing: experimental methods and applications. Nat Rev Genet 16, 344-358 (2015)), такими, как гаплотипирование путем разведения (Kaper, F., et al., Whole-genome haplotyping by dilution, amplification, and sequencing. Proc Natl Acad Sci U S A 110, 5552-5557 (2013)) или секвенирование с длинными считываниями (Kuleshov, V. et al. Whole-genome haplotyping using long reads and statistical methods. Nat Biotech 32, 261-266 (2014)). Этот алгоритм может моделировать ожидаемые частоты аллелей по всем коэффициентам аллельного дисбаланса с интервалами 0,025% для трех наборов гипотез: (1) все клетки нормальные (нет аллельного дисбаланса), (2) некоторые/все клетки имеют делецию гомолога 1 или амплификацию гомолога 2 или (3) некоторые/все клетки имеют делецию гомолога 2 или амплификацию гомолога 1. Правдоподобие каждой гипотезы может быть определено в каждом ОНП с использованием байесовского классификатора, основанного на бета-биномиальной модели ожидаемых и наблюдаемых частот аллелей для всех гетерозиготных ОНП, а затем может быть рассчитана объединенная вероятность по нескольким ОНП, в некоторых иллюстративных вариантах воплощения, с использованием связи локусов ОНП, приведенных в качестве примера. Фактически, в иллюстративных вариантах воплощения информация о фазе нормального клеточного гаплотипа, полученная, как описано выше, используется алгоритмом для подгонки подсчитанных и обычно скорректированных подсчетов аллелей в исследуемом образце к ожидаемым подсчетам аллелей с использованием модели совместного распределения. Затем можно выбрать гипотезу максимального правдоподобия.
[353] Рассмотрим хромосомную область со средним числом N копий в опухоли, и пусть c обозначает долю ДНК в плазме, полученную из смеси нормальных и опухолевых клеток в дисомической области. AAI рассчитывается как:
[354]
[355] В определенных иллюстративных примерах данные о частоте аллеля корректируются на ошибки до того, как они используются для генерации индивидуальных вероятностей. В данном документе раскрыты различные типы исправления ошибок и/или смещения. В конкретных иллюстративных вариантах воплощения ошибки, которые исправляются, являются смещением эффективности амплификации аллелей. В других вариантах воплощения ошибки, которые исправляются, включают ошибки последовательности, загрязнение окружающей средой и загрязнение генотипом. В некоторых вариантах воплощения исправленные ошибкивключают смещение амплификации аллелей, ошибки секвенирования, загрязнение окружающей средой и загрязнение генотипом.
[356] Следует понимать, что смещение эффективности амплификации аллелей может быть определено для аллеля как часть эксперимента или лабораторного определения, которое включает определение на тестовом образце, или оно может быть определено в другое время с использованием набора образцов, которые включают аллель, эффективность которого рассчитывается. Загрязнение окружающей средой и загрязнение генотипом, как правило, определяются на том же прогоне, что и анализ исследуемого образца.
[357] В некоторых вариантах воплощения для гомозиготных аллелей в образце определяют загрязнение окружающей средой и загрязнение генотипом. Следует понимать, что для любого данного образца от индивидуума некоторые локусы в образце будут гетерозиготными, а другие будут гомозиготными, даже если локус выбран для анализа, поскольку в популяции он имеет относительно высокую гетерозиготность. В некоторых вариантах воплощения целесообразно определять плоидность хромосомного сегмента с использованием гетерозиготных локусов для индивидуума, тогда как загрязнение окружающей средой и генотипом можно рассчитать с использованием гомозиготных локусов.
[358] В определенных иллюстративных примерах отбор выполняется путем анализа величины различия между фазированной аллельной информацией и оценочными аллельными частотами, сгенерированными для моделей.
[359] В иллюстративных примерах индивидуальные вероятности частот аллелей генерируются на основе бета-биномиальной модели ожидаемых и наблюдаемых частот аллелей в наборе полиморфных локусов. В иллюстративных примерах индивидуальные вероятности генерируются с использованием байесовского классификатора.
[360] В определенных иллюстративных вариантах воплощения данные последовательности нуклеиновой кислоты генерируют путем выполнения высокопроизводительного секвенирования ДНК множества копий серии ампликонов, сгенерированных с использованием реакции мультиплексной амплификации, где каждый ампликон из серии ампликонов охватывает по меньшей мере один полиморфный локус набора полиморфных локусов, и где каждый из полимерных локусов набора амплифицирован. В некоторых вариантах воплощения реакция мультиплексной амплификации проводится в условиях ограничивающего праймера для по меньшей мере 1/2 реакции. В некоторых вариантах воплощения ограничивающие концентрации праймеров используются в 1/10, 1/5, 1/4, 1/3, 1/2 или во всех реакциях мультиплексной реакции. В данном документе представлены факторы, которые следует учитывать для достижения условий ограничивающего праймера в реакции амплификации, такой как ПЦР.
[361] В некоторых вариантах воплощения способы, представленные в настоящем документе, обнаруживают плоидность для множества хромосомных сегментов в нескольких хромосомах. Соответственно, хромосомная плоидность в этих вариантах воплощения определяется для набора сегментов хромосомы в образце. Для этих вариантов воплощения необходимы реакции с более высокой мультиплексной амплификацией. Соответственно, для этих вариантов воплощения реакция мультиплексной амплификации может включать, например, от 2500 до 50000 мультиплексных реакций. В некоторых вариантах воплощения выполняются следующие диапазоны мультиплексных реакций: между 100, 200, 250, 500, 1000, 2500, 5000, 10000, 20000, 25000, 50000 на нижнем конце диапазона и между 200, 250, 500, 1000, 2500, 5000, 10000, 20000, 25000, 50000 и 100000 на верхнем конце диапазона.
[362] В иллюстративных вариантах воплощения набор полиморфных локусов представляет собой набор локусов, которые, как известно, проявляют высокую гетерозиготность. Однако ожидается, что для любого конкретного индивидуума некоторые из этих локусов будут гомозиготными. В некоторых иллюстративных вариантах воплощения способы по изобретению используют информацию о последовательности нуклеиновой кислоты как для гомозиготных, так и для гетерозиготных локусов для индивидуума. Гомозиготные локусы индивидуума используются, например, для исправления ошибок, тогда как гетерозиготные локусы используются для определения аллельного дисбаланса образца. В некоторых вариантах воплощения по меньшей мере 10% полиморфных локусов являются гетерозиготными локусами для индивидуума.
[363] Как раскрыто в данном документе, предпочтение отдается анализу целевых локусов ОНП, которые, как известно, в популяции являются гетерозиготными. Соответственно, в некоторых вариантах воплощения выбирают полиморфные локусы, в которых, как известно по меньшей мере 10, 20, 25, 50, 75, 80, 90, 95, 99 или 100% полиморфных локусов в популяции являются гетерозиготными.
[364] Как раскрыто в данном документе, в некоторых вариантах воплощения образец представляет собой образец плазмы от беременной женщины.
[365] В некоторых примерах способ дополнительно включает выполнение способа на контрольном образце с известным средним коэффициентом аллельного дисбаланса. Контроль может иметь средний коэффициент аллельного дисбаланса для конкретного аллельного состояния, указывающего на анеуплоидию хромосомного сегмента, от 0,4 до 10%, чтобы имитировать средний аллельный дисбаланс аллеля в образце, который присутствует в низких концентрациях, например, как ожидается от циркулирующей свободной ДНК из опухоли.
[366] В некоторых вариантах воплощения в качестве контроля используются контроли PlasmArt. Соответственно, в определенных аспектах образец получен способом, включающим фрагментацию образца нуклеиновой кислоты, которая, как известно, проявляет хромосомную анеуплоидию, на фрагменты, которые имитируют размер фрагментов ДНК, циркулирующих в плазме индивидуума. В определенных аспектах используется контроль, который не имеет анеуплоидии для сегмента хромосомы.
[367] В иллюстративных вариантах воплощения данные из одного или более контролей могут быть проанализированы в способе вместе с тестовым образцом. Например, контроли могут включать образец, отличный от индивидуума, который не подозревается на наличие хромосомной анеуплоидии, или образец, который, предположительно, содержит ВЧК или хромосомную анеуплоидию. Например, если исследуемый образец представляет собой образец плазмы, предположительно содержащий циркулирующую свободную опухолевую ДНК, способ также может быть выполнен для контрольного образца из опухоли субъекта вместе с образцом плазмы. Как раскрыто в настоящем документе, контрольный образец можно получить путем фрагментации образца ДНК, о котором известно, что он обладает хромосомной анеуплоидией. Такое фрагментирование может привести к образцу ДНК, который имитирует состав ДНК апоптотической клетки, особенно когда образец взят от индивидуума, пораженного раком. Данные от контрольного образца повысят достоверность выявления хромосомной анеуплоидии.
[368] В некоторых вариантах воплощения способов определения плоидности образец представляет собой образец плазмы от индивидуума, подозреваемого на наличие рака. В этих вариантах воплощения способ дополнительно содержит определение на основе выбора, присутствует ли вариация числа копий в клетках опухоли индивидуума. Для этих вариантов воплощения образец может представлять собой образец плазмы от индивидуума. Для этих вариантов воплощения способ может дополнительно включать в себя определение на основании выбора, того, присутствует ли рак у индивидуума.
[369] Эти варианты воплощения для определения плоидности хромосомного сегмента могут, кроме того, включать обнаружение однонуклеотидного варианта в месте однонуклеотидной вариации в наборе местоположений однонуклеотидной вариации, где обнаружение либо хромосомной анеуплоидии, либо однонуклеотидного варианта, либо обоих, указывает на наличие циркулирующих опухолевых нуклеиновых кислот в образце.
[370] Эти варианты воплощения могут дополнительно включать в себя получение информации о гаплотипе сегмента хромосомы для опухоли индивидуума и использование информации о гаплотипе для генерации набора моделей различных состояний плоидности и фракций аллельного дисбаланса набора полиморфных локусов.
[371] Как раскрыто в данном документе, некоторые варианты воплощения способов определения плоидности могут дополнительно включать в себя удаление выпадающих значений из исходных или скорректированных данных о частоте аллеля перед сравнением исходной или скорректированной частоты аллеля с набором моделей. Например, в некоторых вариантах воплощения частоты аллелей локусов, которые по меньшей мере на 2 или 3 стандартных отклонения выше или ниже среднего значения для других локусов на сегменте хромосомы, перед использованием для моделирования удаляют из данных.
[372] Как упомянуто в данном документе, следует понимать, что для многих из представленных в данном документе вариантов воплощения, в том числе для определения плоидности хромосомного сегмента, предпочтительно используются недостаточно или идеально фазированные данные. Также следует понимать, что в данном документе представлен ряд признаков, которые обеспечивают улучшения по сравнению с предшествующими способами обнаружения плоидности, и что можно использовать множество различных комбинаций этих признаков.
[373] В некоторых вариантах воплощения в данном документе представлены компьютерные системы и машиночитаемые носители для выполнения любых способов по настоящему изобретению. К ним относятся системы и машиночитаемые носители для выполнения способов определения плоидности. Соответственно, и в качестве неограничивающих примеров вариантов воплощения системы, чтобы продемонстрировать, что любой из способов, представленных в этом документе, может быть выполнен с использованием системы и машиночитаемого носителя с использованием раскрытия в данном документе, в другом аспекте в настоящем документе предоставляется система для обнаружения хромосомной плоидности в образце индивидуума, система, содержащая: процессор ввода, сконфигурированный для приема данных о частоте аллеля, включающих количество каждого аллеля, присутствующего в образце в каждом локусе в наборе полиморфных локусов на хромосомном сегменте; блок моделирования, сконфигурированный для: генерации фазированной аллельной информации для набора полиморфных локусов путем оценки фазы данных частоты аллелей; и получение индивидуальных вероятностей частот аллелей для полиморфных локусов для различных состояний плоидности, используя данные частоты аллелей; и получение объединенных вероятностей для набора полиморфных локусов с использованием индивидуальных вероятностей и фазированной аллельной информации; и менеджер гипотез, сконфигурированный для выбора на основе объединенных вероятностей модели наилучшего соответствия, указывающей на хромосомную плоидность, таким образом определяя плоидность хромосомного сегмента.
[374] В некоторых вариантах воплощения этой системы данные о частоте аллелей представляют собой данные, сгенерированные системой секвенирования нуклеиновых кислот. В некоторых вариантах воплощения система дополнительно содержит блок коррекции ошибок, выполненный с возможностью исправления ошибок в данных частоты аллеля, причем скорректированные данные частоты аллеля используются блоком моделирования для получения индивидуальных вероятностей. В некоторых вариантах воплощения блок коррекции ошибок корректирует смещение эффективности амплификации аллелей. В некоторых вариантах воплощения блок моделирования генерирует индивидуальные вероятности, используя набор моделей как различных состояний плоидности, так и фракций аллельного дисбаланса для набора полиморфных локусов. Блок моделирования в некоторых примерных вариантах воплощения генерирует объединенные вероятности, рассматривая связь между полиморфными локусами на сегменте хромосомы.
[375] В одном иллюстративном варианте воплощения в настоящем документе представлена система для обнаружения хромосомной плоидности в образце индивидуума, которая включает в себя следующее: процессор ввода, сконфигурированный для получения данных последовательности нуклеиновой кислоты для аллелей в наборе полиморфных локусов на сегменте хромосомы у индивидуума и определения частоты аллелей в наборе локусов, используя данные последовательности нуклеиновой кислоты; блок коррекции ошибок, сконфигурированный для исправления ошибок в обнаруженных частотах аллелей и получения скорректированных частот аллелей для набора полиморфных локусов; блок моделирования, сконфигурированный для: получения фазированной аллельной информации для набора полиморфных локусов путем оценки фазы данных о последовательности нуклеиновой кислоты; получение индивидуальных вероятностей частот аллелей для полиморфных локусов для различных состояний плоидности путем сравнения фазированной аллельной информации с набором моделей различных состояний плоидности и фракций аллельного дисбаланса набора полиморфных локусов; и получение объединенных вероятностей для набора полиморфных локусов путем объединения индивидуальных вероятностей с учетом относительного расстояния между полиморфными локусами на сегменте хромосомы; и менеджер гипотез, сконфигурированный для выбора на основе объединенных вероятностей модели наилучшего соответствия, указывающей на хромосомную анеуплоидию.
[376] В некоторых примерных вариантах воплощения системы, представленных в настоящем документе, набор полиморфных локусов включает от 1000 до 50000 полиморфных локусов. В некоторых примерных вариантах воплощения системы, представленных в настоящем документе, набор полиморфных локусов включает 100 известных локусов горячей точки гетерозиготности. В некоторых приведенных в качестве примера вариантах воплощения системы, представленных в настоящем документе, набор полиморфных локусов включает 100 локусов, которые находятся на расстоянии или в пределах 0,5 т.п.н. от горячей точки рекомбинации.
[377] В некоторых примерных вариантах воплощения системы, представленных в настоящем документе, модель наилучшего соответствия анализирует следующие состояния плоидности первого гомолога сегмента хромосомы и второго гомолога сегмента хромосомы: (1) все клетки не имеют делеции или амплификации первого гомолога или второго гомолога сегмента хромосомы; (2) некоторые или все клетки имеют делецию первого гомолога или амплификацию второго гомолога сегмента хромосомы; и (3) некоторые или все клетки имеют делецию второго гомолога или амплификацию первого гомолога сегмента хромосомы.
[378] В некоторых примерных вариантах воплощения системы, представленных в настоящем документе, ошибки, которые исправляются, включают смещение эффективности аллельной амплификации, загрязнение и/или ошибки секвенирования. В некоторых примерных вариантах воплощения системы, представленных в настоящем документе, загрязнение включает загрязнение окружающей средой и загрязнение генотипом. В некоторых примерных вариантах воплощения системы, представленных в настоящем документе, загрязнение окружающей средой и загрязнение генотипом определяются для гомозиготных аллелей.
[379] В некоторых примерных вариантах воплощения системы, представленных в настоящем документе, менеджер гипотез сконфигурирован для анализа величины различия между фазированной аллельной информацией и оцененными аллельными частотами, сгенерированными для моделей. В некоторых примерных вариантах воплощения системы, представленных в настоящем документе, блок моделирования генерирует индивидуальные вероятности частот аллелей на основе бета-биномиальной модели ожидаемых и наблюдаемых частот аллелей в наборе полиморфных локусов. В некоторых примерных вариантах воплощения системы, представленных в настоящем документе, блок моделирования генерирует индивидуальные вероятности с использованием байесовского классификатора.
[380] В некоторых примерных вариантах воплощения системы, представленных в настоящем документе, данные последовательности нуклеиновой кислоты генерируют путем выполнения высокопроизводительного секвенирования ДНК множества копий серии ампликонов, сгенерированных с использованием реакции мультиплексной амплификации, где каждый ампликон из серии ампликонов охватывает по меньшей мере один полиморфный локус из набора полиморфных локусов, и где каждый из полиморфных локусов набора амплифицирован. В некоторых примерных вариантах воплощения системы, представленных в настоящем документе, при этом реакция мультиплексной амплификации проводится в условиях ограничивающего по меньшей мере на 1/2 реакции, праймера. В некоторых примерных вариантах воплощения системы, представленных в настоящем документе, при этом образец имеет средний аллельный дисбаланс от 0,4 до 5%.
[381] В некоторых примерных вариантах воплощения системы, представленных в настоящем документе, образец представляет собой образец плазмы от индивидуума, подозреваемого на наличие рака, и менеджер гипотез на основе модели наилучшего соответствия дополнительно сконфигурирован для определения наличия изменения числа копий в клетках опухоли индивидуума.
[382] В некоторых примерных вариантах воплощения системы, представленных в настоящем документе, образец представляет собой образец плазмы от индивидуума, и менеджер гипотез на основе модели наилучшего соответствия дополнительно сконфигурирован для определения того, что рак присутствует у индивидуума. В этих вариантах воплощения менеджер гипотез может быть дополнительно сконфигурирован для обнаружения однонуклеотидного варианта в месте однонуклеотидной вариации в наборе местоположений однонуклеотидной вариации, где обнаружение либо хромосомной анеуплоидии, либо однонуклеотидного варианта, или обоих, указывает на наличие циркулирующих опухолевых нуклеиновых кислот в образце.
[383] В некоторых примерных вариантах воплощения системы, представленных в настоящем документе, процессор ввода дополнительно сконфигурирован для получения информации о гаплотипе сегмента хромосомы для опухоли индивидуума, и блок моделирования сконфигурирован для использования информации о гаплотипе для генерации набора моделей различных состояний плоидности и фракций аллельного дисбаланса набора полиморфных локусов.
[384] В некоторых примерных вариантах воплощения системы, представленных в настоящем документе, блок моделирования генерирует модели по фракциям аллельного дисбаланса в диапазоне от 0 до 25%.
[385] Следует понимать, что любой из способов, предоставленных в данном документе, может быть выполнен с помощью машиночитаемого кода, который хранится на постоянном машиночитаемом носителе. Соответственно, предоставлен в данном документе в одном варианте воплощения постоянный машиночитаемый носитель для обнаружения хромосомной плоидности в образце индивидуума, содержащий машиночитаемый код, который при выполнении устройством обработки побуждает устройство обработки: принимать данные о частоте аллеля, включающие количество каждого аллеля, присутствующего в образце, в каждом локусе в наборе полиморфных локусов на хромосомном сегменте; генерировать фазированную аллельную информацию для набора полиморфных локусов путем оценки фазы данных частоты аллелей; генерировать индивидуальные вероятности частот аллелей для полиморфных локусов для различных состояний плоидности, используя данные частоты аллелей; генерировать объединенные вероятности для набора полиморфных локусов с использованием индивидуальных вероятностей и фазированной аллельной информации; и выбирать на основе объединенных вероятностей модель наилучшего соответствия, указывающую на хромосомную плоидность, тем самым определяя плоидность хромосомного сегмента.
[386] В некоторых вариантах воплощения машиночитаемого носителя данные о частоте аллеля генерируются из данных последовательности нуклеиновой кислоты. Определенные варианты воплощения машиночитаемого носителя дополнительно содержат исправление ошибок в данных частоты аллеля и использование скорректированных данных частоты аллеля для этапа создания индивидуальных вероятностей. В некоторых вариантах воплощения машиночитаемого носителя ошибки, которые исправлены, являются смещением эффективности амплификации аллеля. В некоторых вариантах воплощения машиночитаемого носителя индивидуальные вероятности генерируются с использованием набора моделей как различных состояний плоидности, так и фракций аллельного дисбаланса для набора полиморфных локусов. В некоторых вариантах воплощения машиночитаемого носителя объединенные вероятности генерируются при учете связи между полиморфными локусами на сегменте хромосомы.
[387] В одном конкретном варианте воплощения в настоящем документе представлен постоянный машиночитаемый носитель для обнаружения хромосомной плоидности в образце индивидуума, содержащий машиночитаемый код, который при выполнении устройством обработки побуждает устройство обработки: принимать данные последовательности нуклеиновой кислоты для аллелей в наборе полиморфных локусов на сегменте хромосомы индивидуума; определять частоты аллелей в наборе локусов, используя данные последовательности нуклеиновой кислоты; проводить исправление смещения эффективности амплификации аллелей на обнаруженных частотах аллелей для генерации скорректированных частот аллелей для набора полиморфных локусов; генерировать фазированную аллельную информацию для набора полиморфных локусов путем оценки фазы данных последовательности нуклеиновой кислоты; генерировать индивидуальные вероятности частот аллелей для полиморфных локусов для различных состояний плоидности путем сравнения скорректированных частот аллелей с набором моделей различных состояний плоидности и фракций аллельного дисбаланса множества полиморфных локусов; генерировать объединенные вероятности для набора полиморфных локусов путем объединения индивидуальных вероятностей с учетом связи между полиморфными локусами на сегменте хромосомы; и выбирать, основываясь на объединенных вероятностях, модель наилучшего соответствия, указывающую на хромосомную анеуплоидию.
[388] В определенных иллюстративных вариантах воплощения для считываемых компьютером носителей выбор выполняется путем анализа величины различия между фазированной аллельной информацией и оцененными аллельными частотами, сгенерированными для моделей.
[389] В определенных иллюстративных вариантах воплощения для машиночитаемого носителя индивидуальные вероятности частот аллелей генерируются на основе бета-биномиальной модели ожидаемых и наблюдаемых частот аллелей в наборе полиморфных локусов.
[390] Следует понимать, что любой из вариантов воплощения способа, предоставленных в данном документе, может быть выполнен посредством выполнения кода, хранящегося на постоянном машиночитаемом носителе.
[391] Примерные варианты воплощения для выявления рака
[392] В определенных аспектах настоящее изобретение предоставляет способ выявления рака. Следует понимать, что образец может быть образцом опухоли или жидким образцом, таким как плазма, от индивидуума, подозреваемого на рак. Эти способы особенно эффективны при выявлении генетических мутаций, таких как единичные нуклеотидные изменения, такие как ОНВ, или изменений числа копий, таких как ВЧК, в образцах с низким уровнем этих генетических изменений в виде фракции от общей ДНК в образце. Таким образом, чувствительность для обнаружения ДНК или РНК от рака в образцах является исключительной. Способы могут сочетать любое или все улучшения, предусмотренные в данном документе, для обнаружения ВЧК и ОНВ для достижения этой исключительной чувствительности.
[393] Соответственно, в некоторых вариантах воплощения, представленных в настоящем документе, представлен способ для определения того, присутствуют ли циркулирующие в опухоли нуклеиновые кислоты в образце у индивидуума, и постоянный машиночитаемый носитель, содержащий машиночитаемый код, который при выполнении устройством обработки побуждает устройство обработки к осуществлению способа. Способ включает следующие этапы: анализ образца для определения плоидности в наборе полиморфных локусов на сегменте хромосомы у индивидуума; и определение уровня среднего аллельного дисбаланса, присутствующего в полиморфных локусах, на основании определения плоидности, где средний аллельный дисбаланс равен или превышает 0,4, 0,45, 0,5, 0,6, 0,7, 0,75, 0,8, 0,9 или 1%, указывает на наличие циркулирующих опухолевых нуклеиновых кислот, таких как цоДНК, в образце.
[394] В определенных иллюстративных примерах средний аллельный дисбаланс более 0,4, 0,45 или 0,5% свидетельствует о наличии цоДНК. В некоторых вариантах воплощения способ определения наличия циркулирующих опухолевых нуклеиновых кислот, дополнительно включает обнаружение однонуклеотидного варианта в месте однонуклеотидной вариации в наборе местоположений однонуклеотидной вариации, в котором обнаруживают либо аллельный дисбаланс, равный или превышающий 0,5%, либо обнаруживают однонуклеотидный вариант, либо оба, что свидетельствует о наличии циркулирующих опухолевых нуклеиновых кислот в образце. Следует понимать, что любой из способов, предусмотренных для выявления плоидности хромосом или ВЧК, может быть использован для определения уровня аллельного дисбаланса, обычно выражаемого как средний аллельный дисбаланс. Следует понимать, что любой из предложенных в данном документе способов для выявления ОНВ может быть использован для выявления одного нуклеотида для этого аспекта настоящего изобретения.
[395] В некоторых вариантах воплощения способ определения наличия циркулирующих опухолевых нуклеиновых кислот дополнительно включает выполнение способа на контрольном образце с известным средним коэффициентом аллельного дисбаланса. Контролем, например, может быть образец из опухоли индивидуума. В некоторых вариантах воплощения контроль имеет средний аллельный дисбаланс, ожидаемый для анализируемой пробы. Например, AAI от 0,5 до 5% или средний коэффициент аллельного дисбаланса 0,5%.
[396] В некоторых вариантах воплощения этап анализа в способе определения наличия циркулирующих опухолевых нуклеиновых кислот включает анализ ряда хромосомных сегментов, которые, как известно, проявляют анеуплоидию при раке. В некоторых вариантах воплощения этап анализа в способе определения наличия циркулирующих опухолевых нуклеиновых кислот включает анализ от 1000 до 50000 или от 100 до 1000 полиморфных локусов на предмет плоидности. В некоторых вариантах воплощения этап анализа в способе определения наличия циркулирующих опухолевых нуклеиновых кислот включает анализ от 100 до 1000 сайтов однонуклеотидного варианта. Например, в этих вариантах воплощения этап анализа может включать в себя проведение мультиплексной ПЦР для амплификации ампликонов по 1000-50000 полимерным локусам и 100-1000 сайтам однонуклеотидного варианта. Эта мультиплексная реакция может быть настроена как отдельная реакция или как совокупность различных подмножественных мультиплексных реакций. Предлагаемые в данном документе способы мультиплексной реакции, такие как массовая мультиплексная ПЦР, раскрытая в данном документе, обеспечивают примерный процесс для проведения реакции амплификации, чтобы помочь достичь улучшенного мультиплексирования и, следовательно, уровней чувствительности.
[397] В некоторых вариантах воплощения реакция мультиплексной ПЦР проводится в условиях ограничивающего праймера для по меньшей мере 10, 20, 25, 50, 75, 90, 95, 98, 99 или 100% реакций. Можно использовать улучшенные условия для проведения массовой мультиплексной реакции, представленные в настоящем документе.
[398] В определенных аспектах вышеуказанный способ определения того, присутствуют ли циркулирующие в опухоли нуклеиновые кислоты в образце у индивидуума и все его варианты воплощения, может быть осуществлен с помощью системы. Раскрытие предоставляет указания относительно конкретных функциональных и структурных особенностей для воплощения способов. В качестве неограничивающего примера система включает в себя следующее:
[399] Процессор ввода, сконфигурированный для анализа данных из образца для определения плоидности в наборе полиморфных локусов на сегменте хромосомы у индивидуума; и
[400] Блок моделирования, сконфигурированный для определения уровня аллельного дисбаланса, присутствующего в полиморфных локусах, на основании определения плоидности, где аллельный дисбаланс, равный или превышающий 0,5%, указывает на наличие циркуляции.
[401] Примерные варианты воплощения для выявления однонуклеотидных вариантов
[402] В определенных аспектах в настоящем документе предлагаются способы обнаружения однонуклеотидных вариантов в образце. Усовершенствованные способы, представленные в настоящем документе, могут достигать пределов обнаружения 0,015, 0,017, 0,02, 0,05, 0,1, 0,2, 0,3, 0,4 или 0,5 процента ОНВ в образце. Все варианты воплощения для обнаружения ОНВ могут быть выполнены с помощью системы. Раскрытие предоставляет указания относительно конкретных функциональных и структурных особенностей для осуществления способов. Кроме того, в данном документе представлены варианты воплощения, содержащие постоянный машиночитаемый носитель, содержащий машиночитаемый код, который при выполнении устройством обработки заставляет устройство обработки выполнять способы обнаружения ОНВ, представленные в данном документе.
[403] Соответственно, в настоящем документе в одном из вариантов воплощения представлен способ для определения того, присутствует ли однонуклеотидный вариант в наборе геномных позиций в образце от индивидуума, причем способ включает: для каждой геномной позиции получение оценки эффективности и частоты ошибок за цикл для ампликона, охватывающего эту геномную позицию, с использованием набора обучающих данных; получение информации о наблюдаемой идентичности нуклеотидов для каждой геномной позиции в образце; определение набора вероятностей процентного содержания однонуклеотидного варианта в результате одной или более реальных мутаций в каждой геномной позиции путем сравнения наблюдаемой информации об идентичности нуклеотидов в каждой геномной позиции с моделью различных вариантов процентного соотношения с использованием оцененной эффективности амплификации и частоты ошибок по циклам для каждой геномной позиции независимо; и определение наиболее вероятного реального процентного варианта и достоверности из набора вероятностей для каждой геномной позиции.
[404] В иллюстративных вариантах воплощения способа для определения наличия однонуклеотидного варианта оценка эффективности и частоты ошибок за цикл генерируются для набора ампликонов, которые охватывают геномную позицию. Например, могут быть включены 2, 3, 4, 5, 10, 15, 20, 25, 50, 100 или более ампликонов, которые охватывают геномную позицию.
[405] В иллюстративных вариантах воплощения способа определения наличия однонуклеотидного варианта наблюдаемая информация об идентичности нуклеотидов содержит наблюдаемое количество полных считываний для каждой геномной позиции и наблюдаемое количество считываний вариантных аллелей для каждой геномной позиции.
[406] В иллюстративных вариантах воплощения способа определения наличия однонуклеотидного варианта образец представляет собой образец плазмы, а однонуклеотидный вариант присутствует в циркулирующей опухолевой ДНК образца.
[407] В другом варианте воплощения, представленном в настоящем документе, представлен способ оценки процента однонуклеотидных вариантов, которые присутствуют в образце от индивидуума. Этот способ включает в себя следующие этапы: получение для набора геномных позиций оценки эффективности и частоты ошибок по циклам для одного или более ампликонов, охватывающих эти геномные позиции, с использованием набора обучающих данных; получение наблюдаемой информации об идентичности нуклеотидов для каждой геномной позиции в образце; получение расчетного среднего значения и дисперсии для общего числа молекул, молекул фоновой ошибки и реальных мутантных молекул для пространства поиска, включающего начальный процент реальных мутантных молекул с использованием эффективности амплификации и частоты ошибок ампликонов на цикл; и определение процентного содержания однонуклеотидных вариантов, присутствующих в образце в результате реальных мутаций, путем определения наиболее вероятного реального процентного содержания однонуклеотидного варианта путем подбора распределения с использованием оцененных средних значений и отклонений для наблюдаемой информации об идентичности нуклеотидов в образце.
[408] В иллюстративных примерах этого способа для оценки процента однонуклеотидных вариантов, которые присутствуют в образце, образец представляет собой образец плазмы, а однонуклеотидный вариант присутствует в циркулирующей опухолевой ДНК образца.
[409] Набор обучающих данных для этого варианта воплощения изобретения обычно включает образцы от одного здорового индивидуума или, предпочтительно, группы здоровых индивидуумов. В некоторых иллюстративных вариантах воплощения набор обучающих данных анализируется в тот же день или даже в том же цикле, что и один или более исследуемых образцов. Для получения набора обучающих данных, например, могут быть использованы образцы из группы из 2, 3, 4, 5, 10, 15, 20, 25, 30, 36, 48, 96, 100, 192, 200, 250, 500, 1000 или более здоровых индивидуумов. Там, где доступны данные для большего числа здоровых индивидуумов, например, 96 или более, возрастает достоверность для оценок эффективности амплификации, даже если циклы выполняются до выполнения способа на исследуемых образцах. Частота ошибок ПЦР может использовать информацию о последовательности нуклеиновой кислоты, сгенерированную не только для локализации основания с ОНВ, но и для всей амплифицированной области вокруг ОНВ, поскольку частота ошибок рассчитывается на ампликон. Например, используя образцы от 50 индивидуумов и секвенируя ампликон вокруг ОНВ из 20 пар оснований, для определения частоты ошибок можно использовать данные частоты ошибок из 1000 считываний оснований.
[410] Обычно эффективность амплификации оценивают путем оценки среднего и стандартного отклонения эффективности амплификации для амплифицированного сегмента, а затем подгоняют его к модели распределения, такой как биномиальное распределение или бета-биномиальное распределение. Частота ошибок определяется для реакции ПЦР с известным числом циклов, а затем оценивается частота ошибок за цикл.
[411] В определенных иллюстративных вариантах воплощения оценка начальных молекул набора тестовых данных дополнительно включает в себя обновление оценки эффективности для набора тестовых данных с использованием начального числа молекул, оцененного на этапе (б), если наблюдаемое количество считываний значительно отличается от предполагаемого количества считываний. Затем оценка может быть обновлена для новой эффективности и/или исходных молекул.
[412] Пространство поиска, используемое для оценки общего числа молекул, молекул фоновой ошибки и молекул реальной мутации, может включать в себя пространство поиска от 0,1, 0,2, 0,25, 0,5, 1, 2,5, 5, 10 , 15, 20 или 25% на нижнем конце и 1, 2, 2,5, 5, 10, 12,5, 15, 20, 25, 50, 75, 90 или 95% на верхнем конце копий оснований в положении ОНВ, являющимся основанием с ОНВ. Нижние диапазоны, 0,1, 0,2, 0,25, 0,5 или 1% на нижнем конце и 1, 2, 2,5, 5, 10, 12,5 или 15% на верхнем конце могут использоваться в иллюстративных примерах для образцов плазмы, где способ обнаруживает циркулирующую опухолевую ДНК. Более высокие диапазоны используются для опухолевых образцов.
[413] Распределение соответствует общему количеству молекул с ошибкой (фоновая ошибка и реальная мутация) в суммарных молекулах для того, чтобы вычислить правдоподобие или вероятность для каждой возможной реальной мутации в пространстве поиска. Это распределение может быть биномиальным или бета-биномиальным.
[414] Наиболее вероятная реальная мутация определяется путем определения наиболее вероятного процента реальных мутаций и расчета достоверности с использованием данных из подбора распределения. В качестве иллюстративного примера, который не предназначен для ограничения клинической интерпретации способов, представленных в настоящем документе, если средняя частота мутаций высока, то процент достоверности, необходимый для положительного определения ОНВ, ниже. Например, если средняя частота мутаций для ОНВ в образце, использующем наиболее вероятную гипотезу, составляет 5%, а процентная достоверность составляет 99%, то будет выполнено положительное распознавание ОНВ. С другой стороны, для этого иллюстративного примера, если средняя частота мутаций для ОНВ в образце, использующем наиболее вероятную гипотезу, составляет 1%, а процентная достоверность составляет 50%, то в определенных ситуациях положительное распознавание ОНВ не будет проведено. Следует понимать, что клиническая интерпретация данных будет зависеть от чувствительности, специфичности, распространенности и доступности альтернативного продукта.
[415] В одном иллюстративном варианте воплощения образец представляет собой образец циркулирующей ДНК, такой как образец циркулирующей опухолевой ДНК.
[416] В другом варианте воплощения в настоящем документе представлен способ обнаружения одного или более однонуклеотидных вариантов в тестируемом образце от индивидуума. Способ, согласно этому варианту воплощения, включает в себя следующие этапы:
[417] Определение медианной частоты вариантного аллеля для множества контрольных образцов от каждого из множества нормальных индивидуумов, для каждой позиции однонуклеотидного варианта в наборе позиций однонуклеотидной вариации на основе результатов, полученных в цикле секвенирования для того, чтобы идентифицировать выбранные позиции однонуклеотидного варианта, имеющие медианные частоты вариантных аллелей в нормальных образцах ниже порогового значения, и определить фоновую ошибку для каждого из положений однонуклеотидного варианта после удаления образцов с выбросами для каждой из позиций однонуклеотидного варианта; определение наблюдаемой глубины считанного взвешенного среднего значения и дисперсии для выбранных позиций однонуклеотидного варианта для тестового образца на основе данных, сгенерированных в ходе секвенирования для тестируемого образца; и выявление с помощью компьютера одной или более позиций однонуклеотидного варианта со статистически значимой глубиной считанного взвешенного среднего значения по сравнению с фоновой ошибкой для этой позиции, тем самым обнаруживая один или более однонуклеотидных вариантов.
[418] В некоторых вариантах воплощения этого способа выявления одного или более ОНВ образец представляет собой образец плазмы, контрольные образцы представляют собой образцы плазмы, а обнаруженный один или более однонуклеотидных вариантов присутствуют в циркулирующей опухолевой ДНК образца. В некоторых вариантах воплощения этого способа для обнаружения одного или более ОНВ множество контрольных образцов включает по меньшей мере 25 образцов. В определенных иллюстративных вариантах воплощения множество контрольных образцов составляет по меньшей мере 5, 10, 15, 20, 25, 50, 75, 100, 200 или 250 образцов на нижнем конце и 10, 15, 20, 25, 50, 75, 100, 200, 250, 500 и 1000 образцов на верхнем конце.
[419] В некоторых вариантах воплощения этого способа для обнаружения одного или более ОНВ выбросы удаляются из данных, сгенерированных в цикле высокопроизводительного секвенирования, для вычисления наблюдаемой глубины считанного взвешенного среднего и определения наблюдаемой дисперсии. В некоторых вариантах воплощения этого способа для обнаружения одного или более ОНВ глубина считывания для каждого положения однонуклеотидного варианта для тестируемого образца составляет по меньшей мере 100 считываний.
[420] В некоторых вариантах воплощения этого способа для обнаружения одного или более ОНВ цикл секвенирования включает реакцию мультиплексной амплификации, проводимую в условиях реакции ограниченного праймера. Для выполнения этих вариантов воплощения в иллюстративных примерах используются усовершенствованные способы выполнения реакций мультиплексной амплификации, представленные в настоящем документе.
[421] Не ограничиваясь теорией, способы по настоящему варианту воплощения используют модель фоновой ошибки с использованием нормальных образцов плазмы, которые секвенируются при том же цикле секвенирования, что и тестируемый образец, для учета артефактов, специфических для цикла. Помехонасыщенные позиции с нормальными медианными частотами вариантного аллеля выше порога, например более 0,1, 0,2, 0,25, 0,5, 0,75 и 1,0%, удаляются.
[422] Образцы с выбросами итерационно извлекаются из модели для учета шума и загрязнения. Для каждой замены основания каждого геномного локуса вычисляется глубина считывания взвешенного среднего значения глубины и стандартное отклонение ошибки. В определенных иллюстративных вариантах воплощения образцы, такие как образцы опухоли или бесклеточной плазмы, с положениями однонуклеотидного варианта с по меньшей мере пороговым числом считываний, например по меньшей мере 2, 3, 4, 5, 6, 7, 8, 9 10, 15, 20, 25, 50, 100, 250, 500 или 1000 считываний вариантов и a1 Z-показателем, превышающим 2,5, 5, 7,5 или 10 по сравнению с моделью фоновой ошибки в некоторых вариантах воплощения, считаются мутацией-кандидатом.
[423] В некоторых вариантах воплощения глубина считывания более 100, 250, 500, 1000, 2000, 2500, 5000, 10000, 20000, 250000, 50000 или 100000 в нижнем конце диапазона и 2000, 2500, 5000, 7500, 10000, 25000, 50000, 100000, 250000 или 500000 считываний в верхнем конце достигается в цикле секвенирования для каждой позиции однонуклеотидного варианта в наборе позиций однонуклеотидного варианта. Как правило, секвенирование - это высокопроизводительное секвенирование. Средние или медианные значения, сгенерированные для исследуемых образцов, в иллюстративных вариантах воплощения взвешиваются по глубине считывания. Следовательно, вероятность того, что определение вариантного аллеля является действительным в образце с 1 вариантным аллелем, обнаруженным в 1000 считываниях, взвешивается выше, чем в образце с 1 вариантным аллелем, обнаруженным в 10000 считываниях. Поскольку определения вариантного аллеля (то есть мутации) не выполняются со 100%-ной достоверностью, идентифицированный однонуклеотидный вариант можно считать вариантом-кандидатом или мутациями-кандидатами.
[424] Примерная тестовая статистика для анализа фазированных данных
[425] Ниже описывается примерная критериальная статистика для анализа фазированных данных из образца, известного или предположительно являющегося смешанным образцом, содержащим ДНК или РНК, которые получены из двух или более клеток, которые не являются генетически идентичными. Пусть f обозначает фракцию ДНК или РНК, представляющую интерес, например, фракцию ДНК или РНК с ВЧК, представляющую интерес, или фракцию ДНК или РНК из представляющих интерес клеток, таких как раковые клетки. В некоторых вариантах воплощения для тестирования рака f обозначает фракцию ДНК или РНК из раковых клеток в смеси раковых и нормальных клеток, или f обозначает долю раковых клеток в смеси раковых и нормальных клеток. Обратите внимание, что это относится к фракции ДНК из представляющих интерес клеток, при условии, что каждая из представляющих интерес клетка дает две копии ДНК. Это отличается от фракции ДНК от представляющих интерес клеток в сегменте, который подвергается делеции или дупликации.
[426] Возможные значения аллелей каждого ОНП обозначены A и B. AA, AB, BA и BB используются для обозначения всех возможных упорядоченных пар аллелей. В некоторых вариантах воплощения предоставляются ОНП с упорядоченными аллелями AB или BA. Пусть Ni обозначает число считываний последовательности i-го ОНП и обозначим Аi и Вi число считываний i-го ОНП, которые обозначают, соответственно, аллель A и B. Предполагается, что:
[427] .
[428] Соотношение аллелей Ri определяется как:
[429]
[430] Пусть Т обозначает количество целевых ОНП.
[431] Без потери универсального характера, некоторые варианты воплощения фокусируются на одном хромосомном сегменте. Для большей ясности в данном описании выражение «первый гомологичный сегмент хромосомы по сравнению со вторым гомологичным сегментом хромосомы» означает первый гомолог сегмента хромосомы и второй гомолог сегмента хромосомы. В некоторых таких вариантах воплощения все целевые ОНП содержатся в представляющем интерес сегменте хромосомы. В других вариантах воплощения множественные сегменты хромосомы анализируют на возможные вариации числа копий.
[432] Оценка апостериорного максимума (МАР)
и
[433] Этот способ использует знание фазирования через упорядоченные аллели, чтобы обнаружить делецию или дупликацию целевого сегмента. Для каждого ОНП i определите
и
и
и
[434]
[435] Затем определите
Все SNP
[436]
[437] Распределения Хi и S согласно различным гипотезам числа копий (таким как гипотезы о дисомии, делеции первого или второго гомолога или дупликации первого или второго гомолога) описаны ниже.
[438] Гипотеза дисомии
[439] Согласно этой гипотезы целевой сегмент не подвергается делеции или дупликации.
[440]
[441]
[442] где
[443]
[444] Если мы предполагаем постоянную глубину считывания N, это дает нам биномиальное распределение S с параметрами
[445] и T.
[446] Гипотезы делеции
[447] Согласно этой гипотезы первый гомолог подвергается делеции (то есть, AB ОНП становится B, а BA ОНП становится A), тогда Ri имеет биномиальное распределение с параметрами и T для AB ОНП, и и T для BA ОНП. Следовательно,
[448]
[449] Если предположить постоянную глубину считывания N, это дает биномиальное распределение S с параметрами
[450] и T.
[451] Согласно этой гипотезы второй гомолог подвергается делеции (то есть, AB ОНП становится A, и BA ОНП становится B), тогда Ri имеет биномиальное распределение с параметрами и T для AB ОНП, и и T для BA ОНП. Следовательно,
[452]
[453] Если предположить постоянную глубину считывания N, это дает биномиальное распределение S с параметрами
[454] и T.
[455] Гипотезы дупликации
[456] Согласно этой гипотезы первый гомолог подвергается дупликации (то есть, AB ОНП становится AAB, и BA ОНП становится BBA), тогда Ri имеет биномиальное распределение с параметрами и T для AB ОНП, и и T для BA ОНП. Следовательно,
[457]
[458] Если предположить постоянную глубину считывания N, это дает биномиальное распределение S с параметрами
[459] и T.
[460] Согласно этой гипотезы второй гомолог подвергается дупликации (то есть, AB ОНП становится ABB, и BA ОНП становится BAA), тогда Ri имеет биномиальное распределение с параметрами и T для AB ОНП, и и T для BA ОНП. Следовательно,
[462] Если предположить постоянную глубину считывания N, это дает биномиальное распределение S с параметрами
[463] и T.
[464] Классификация
[465] Как показано в разделах выше, Хi, является бинарной случайной величиной с
[466]
[467] Это позволяет рассчитать вероятность тестовой статистики S по каждой гипотезе. Может быть рассчитана вероятность каждой гипотезы с учетом измеренных данных. В некоторых вариантах воплощения заявлена гипотеза с наибольшей вероятностью. При необходимости распределение на S может быть упрощено либо путем аппроксимации каждого Ni, с постоянной глубиной охвата N, либо путем усечения глубины считываний до константы N. Это упрощение дает
[468]
[469] Значение для f может быть оценено путем выбора наиболее вероятного значения f с учетом измеренных данных, такого как значение f, которое генерирует наилучшее соответствие данных с использованием алгоритма (например, алгоритма поиска), такого как оценка максимального правдоподобия, максимальная апостериорная оценка или байесовская оценка. В некоторых вариантах воплощения анализируется несколько сегментов хромосомы, и значение f оценивается на основе данных для каждого сегмента. Если все клетки-мишени имеют эти дупликации или делеции, оцененные значения для f на основе данных для этих различных сегментов являются аналогичными. В некоторых вариантах воплощения f измеряется экспериментально, например, путем определения фракции ДНК или РНК из раковых клеток на основе различий в метилировании (гипометилирование или гиперметилирование) между раковой и нераковой ДНК или РНК.
[470] Непринятие единичной гипотезы
[471] Распределение S для гипотезы о дисомии не зависит от f. Таким образом, вероятность измеренных данных может быть рассчитана для гипотезы дисомии без расчета f. Для нулевой гипотезы дисомии может использоватьься тест непринятия единичной гипотезы. В некоторых вариантах воплощения вычисляется вероятность S гипотезы дисомии, и гипотеза дисомии отклоняется, если вероятность ниже заданного порогового значения (например, менее 1 на 1000). Это указывает на наличие дупликации или делеции хромосомного сегмента. При необходимости, уровень ложноположительных результатов можно изменить, отрегулировав пороговое значение.
[472] Примерные способы анализа фазированных данных
[473] Примерные способы описаны ниже для анализа данных из образца, о котором известно или предполагается, что он является смешанным образцом, содержащим ДНК или РНК, которые получены из двух или более клеток, которые не являются генетически идентичными. В некоторых вариантах воплощения используются фазированные данные. В некоторых вариантах воплощения для каждого рассчитанного соотношения аллелей способ включает определение того, является ли рассчитанное соотношение аллелей выше или ниже ожидаемого соотношения аллелей и величины различия для конкретного локуса. В некоторых вариантах воплощения определяется вероятное распределение для соотношения аллелей в локусе для конкретной гипотезы, и чем ближе рассчитанное соотношение аллелей к центру вероятного распределения, тем большая вероятность того, что гипотеза верна. В некоторых вариантах воплощения способ включает определение вероятности того, что гипотеза верна для каждого локуса. В некоторых вариантах воплощения способ включает определение вероятности того, что гипотеза верна для каждого локуса, и, объединение вероятностей этой гипотезы для каждого локуса, и выбирается гипотеза с наибольшей суммарной вероятностью. В некоторых вариантах воплощения способ включает определение вероятности того, что гипотеза верна для каждого локуса и для каждого возможного отношения ДНК или РНК из одной или более клеток-мишеней к общей ДНК или РНК в образце. В некоторых вариантах воплощения объединенная вероятность для каждой гипотезы определяется путем объединения вероятностей этой гипотезы для каждого локуса и каждого возможного отношения, и выбирается гипотеза с наибольшей объединенной вероятностью.
[474] В одном варианте воплощения рассматриваются следующие гипотезы: H11(все клетки нормальные), H10 (наличие клеток с единственным гомологом 1, следовательно, с делецией гомолога 2), H01 (наличие клеток с единственным гомологом 2, следовательно, с делецией гомолога 1), H21 (наличие клеток с дупликацией гомолога 1), H12 (наличие клеток с дупликацией гомолога 2). Для фракции f клеток-мишеней, таких, как раковые клетки или мозаичные клетки (или фракции ДНК или РНК из клеток-мишеней), ожидаемое соотношение аллелей для гетерозиготных (AB или BA) ОНП можно найти следующим образом:
[475] Уравнение (1):
[476]
[477] Исправление ошибок смещения, загрязнения и секвенирования:
[478] Наблюдение Ds в ОНП состоит из ряда оригинальных картированных считываний с присутствием каждой аллели, nA0 и nB0. Затем мы можем найти исправленные считывания nA и nB , используя ожидаемое смещение амплификации аллелей A и B.
[479] Пусть ca обозначает загрязнение окружающей средой (например, загрязнение ДНК в воздухе или окружающей среде) и r(ca) обозначает отношение аллелей для загрязнителя окружающей среды (которое изначально принимается равным 0,5). Более того, cg обозначает степень загрязнения генотипом (например, степень загрязнения из другого образца), и r(cg) является соотношением аллелей для загрязнителя. Пусть se(A,B) и se(B,A) обозначают ошибки секвенирования для распознавания одного аллеля другим аллелем (например, ошибочным обнаружением аллеля A, когда присутствует аллель B).
[480] Можно найти наблюдаемое соотношение аллелей q(r, ca, r(ca) , cg , r(cg), se(A,B), se(B,A)) для данного ожидаемого соотношения аллелей r путем корректировки на загрязнение окружающей средой, загрязнение генотипом и ошибку секвенирования.
[481] Поскольку генотипы загрязняющих веществ неизвестны, чтобы найти P(r(cg)), можно найти популяционные частоты. Более конкретно, пусть p будет популяционной частотой для одного из аллелей (который может упоминаться как референтный аллель). Затем, мы имеем P(r(cg) = 0) = (1-p)2, P(r(cg) = 0) = 2p(1-p), и P(r(cg) = 0) =p2. Условно ожидаемую величину свыше r(cg) можно использовать для определения E[q(r, ca, r(ca) , cg , r(cg), se(A,B), se(B,A))] . Обратите внимание, что загрязнение окружающей средой и генотипом определяется с помощью гомозиготных ОНП, поэтому на них не влияет отсутствие или наличие делеций или дупликаций. Кроме того, при необходимости, можно измерить загрязнение окружающей средой и генотипом, используя контрольную хромосому.
[482] Правдоподобие при каждой ОНП:
[483] Уравнение ниже дает вероятность наблюдения nA и nB при соотношении аллелей r:
[484] Уравнение (2):
[485]
[486] Пусть Ds обозначает данные для ОНП. Для каждой гипотезы h ϵ { H11, H01, H10, H21, H12}, можно представить r=r(AB,h) или r=r(BA,h) в уравнении (1) и найти условно ожидаемую величину свыше r(cg) для определения наблюдаемого соотношения аллелей E[q(r, ca, r(ca) , cg , r(cg)) ]. Затем, полагая r=E[q(r, ca, r(ca) , cg , r(cg), se(A,B), se(B,A)) ] в уравнении (2) можно определить P(Ds|h,f).
[487] Алгоритм поиска:
[488] В некоторых вариантах воплощения ОНП с соотношениями аллелей, которые кажутся выбросами, игнорируются (например, путем игнорирования или исключения ОНП с соотношениями аллелей, которые по меньшей мере на 2 или 3 стандартных отклонения выше или ниже среднего значения). Обратите внимание, что преимущество, выявленное для этого подхода, заключается в том, что при наличии более высокого процента мозаицизма изменчивость соотношений аллелей может быть высокой, следовательно, это гарантирует, что ОНП не будут обрезаны из-за мозаицизма.
[489] Пусть F = {f1, …., fN} означает пространство поиска для процента мозаицизма (такого, как опухолевая фракция). Можно определить P(Ds|h,f) в каждой ОНП s и f ϵ F и объединить вероятность для всех ОНП.
[490] Алгоритм перебирает каждый f для каждой гипотезы. Используя способ поиска, можно заключить, что мозаицизм существует, если существует диапазон F* от показателей f, где достоверность гипотезы делеции или дупликации выше, чем достоверность гипотез отсутствия удаления и отсутствия дупликации. В некоторых вариантах воплощения определяется оценка максимального правдоподобия для P(Ds|h,f) в F*. При необходимости можно определить условно ожидаемую величину f ϵ F*. При необходимости для каждой гипотезы может быть определена достоверность.
[491] В некоторых вариантах воплощения вместо биномиального распределения используется бета-биномиальное распределение. В некоторых вариантах воплощения для определения в образце специфических параметров бета-бинома используется референтная хромосома или хромосомный сегмент.
[492] Теоретические характеристики при использовании имитаций:
[493] При необходимости можно оценить теоретические характеристики алгоритма путем случайного присвоения количества рефернтных считываний ОНП с заданной глубиной считывания (DOR). Для нормального случая используйте p = 0,5 для биномиального параметра вероятности, а для делеций или дупликаций, соответственно, p пересматривается. Примерные входные параметры для каждой имитации следующие: (1) количество S ОНП (2) константа DOR D на ОНП, (3) p и (4) количество экспериментов.
[494] Первый имитационный эксперимент:
[495] Данный эксперимент был сосредоточен на S ϵ {500, 1000}, D ϵ {500, 1000} и p ϵ {0%, 1%, 2%, 3%, 4%, 5%}. Мы провели 1000 имитационных экспериментов в каждой настройке (отсюда 24000 экспериментов с фазой и 24000 без фазы). Мы имитировали количество считываний из биномиального распределения (при необходимости могут использоваться другие распределения). Определяли частоту ложноположительных (в случае p=0%) и ложноотрицательных (в случае p>0%) результатов как с информацией о фазе, так и без нее. Примите к сведению, что информация о фазе очень полезна, особенно для S=1000, D = 1000. Однако для S=500, D=500 данный алгоритм имеет наивысший уровень ложноположительных результатов, как с фазой, так и без фазы, независимо от исследуемых условий.
[496] Информация о фазах особенно полезна для низких процентов мозаицизма (≤ 3%). Без информации о фазе высокий уровень ложноотрицательных результатов наблюдался для p=1%, поскольку достоверность при делеции определяется путем присвоения равных шансов H10 и H01, а небольшого отклонения в пользу одной гипотезы недостаточно, чтобы компенсировать низкое правдоподобие другой гипотезы. Это относится и к дупликациям. Отметим также, что алгоритм кажется более чувствительным к глубине считывания по сравнению с количеством ОНП. Для результатов с информацией о фазе мы предполагаем, что точная информация о фазе доступна для большого числа последовательных гетерозиготных ОНП. При необходимости информацию о гаплотипах можно получить путем вероятностного комбинирования гаплотипов на меньших сегментах.
[497] Второй имитационный эксперимент:
[498] Данный эксперимент был сосредоточен на S ϵ {100, 200, 300, 400, 500}, D ϵ {1000, 2000, 3000, 4000, 5000} и p ϵ {0, 1,1, 5, 2, 2,5, 3%} и 10000 случайных экспериментов при каждой настройке. Частота ложноположительных результатов (в слечае p = 0%) и ложноотрицательных результатов (в случае p больше 0%) определялась как с информацией о фазе, так и без нее. Частота ложноотрицательных результатов была 10% для D ≥ 3000 и N ≥ 200 с применением информации о гаплотипe, тогда как та же эффективность достигается для D=5000 и N≥400. Разница между частотой ложноотрицательных результатов была особенно заметна для малых процентов мозаицизма. Например, когда p=1%, частота ложноотрицательных результатов менее 20% никогда не достигается без данных о гаплотипе, тогда как он близок к 0% для N ≥ 300 и D ≥ 3000. Для p=3% частота 0% ложноотрицательных результатов наблюдается с данными гаплотипа, в то время как достижения той же производительности без данных гаплотипа необходимы N≥300 и D≥3000.
[499] Примерные способы обнаружения делеций и дупликаций без фазированных данных
[500] В некоторых вариантах воплощения используются нефазированные генетические данные для определения того, имеется ли чрезмерное количество копий первого гомологичного сегмента хромосомы по сравнению со вторым гомологичным сегментом хромосомы в геноме индивидуума (например, в геноме одной или более клеток или в скДНК или скРНК). В некоторых вариантах воплощения используются фазированные генетические данные, но фазирование игнорируются. В некоторых вариантах воплощения образец ДНК или РНК представляет собой смешанный образец скДНК или скРНК от индивидуума, который включает скДНК или скРНК из двух или более генетически разных клеток. В некоторых вариантах воплощения способ использует величину различия между рассчитанным соотношением аллелей и ожидаемым соотношением аллелей для каждого из локусов.
[501] В некоторых вариантах воплощения способ включает получение генетических данных в наборе полиморфных локусов на хромосоме или сегменте хромосомы в образце ДНК или РНК из одной или более клеток от индивидуума путем измерения количества каждого аллеля в каждом локусе. В некоторых вариантах воплощения соотношения аллелей рассчитываются для локусов, которые являются гетерозиготными по меньшей мере в одной клетке, из которой был получен образец. В некоторых вариантах воплощения рассчитанное соотношение аллелей для конкретного локуса - это измеренное количество одного из аллелей, деленное на общее измеренное количество всех аллелей для локуса. В некоторых вариантах воплощения рассчитанное соотношение аллелей для конкретного локуса - это измеренное количество одного из аллелей (например, аллеля на первом гомологичном сегменте хромосомы), деленное на измеренное для локуса количество одного или более других аллелей (например, аллель на втором гомологичном сегменте хромосомы). Рассчитанные соотношения аллелей и ожидаемые соотношения аллелей могут быть рассчитаны с использованием любого из способов, представленных в данном документе, или любого стандартного способа (например, любого математического преобразования рассчитанных соотношений аллелей или ожидаемых соотношений аллелей, представленных в данном документе).
[502] В некоторых вариантах воплощения тестовая статистика рассчитывается на основе величины различия между рассчитанным соотношением аллелей и ожидаемым соотношением аллелей для каждого из локусов. В некоторых вариантах воплощения тестовая статистика Δ рассчитывается с использованием следующей формулы
[503] где δi представляет собой величину различия между рассчитанным соотношением аллелей и ожидаемым соотношением аллелей для i-того локуса;
[504] где μi представляет собой среднее значение δi; и
[505] где σi2 представляет собой среднее отклонение δi.
[506] Например, мы можем определить δi следующим образом, когда ожидаемое соотношение аллелей составляет 0,5:
[507] .
[508] Значения для μi и σi можно рассчитать, используя факт того, что Ri представляет собой биномиальную случайную величину. В некоторых вариантах воплощения для всех локусов предполагается одинаковое стандартное отклонение. В некоторых вариантах воплощения среднее или средневзвешенное значение стандартного отклонения или оценка стандартного отклонения используется для значения σi2. В некоторых вариантах воплощения предполагается, что тестовая статистика имеет нормальное распределение. Например, из центральной предельной теоремы следует, что распределение Δ приближается к стандартной нормали по мере того, как становится большим количество локусов (например, количество T ОНП).
[509] В некоторых вариантах воплощения перечислен набор из одной или более гипотез, определяющих количество копий хромосомы или сегмента хромосомы в геноме одной или более клеток. В некоторых вариантах воплощения выбирается гипотеза, которая, наиболее вероятно основана на тестовой статистике, тем самым определяя количество копий хромосомы или сегмента хромосомы в геноме одной или более клеток. В некоторых вариантах воплощения выбираются гипотеза, если вероятность того, что тестовая статистика принадлежит распределению тестовой статистики для этой гипотезы, превышает верхний порог; одна или более гипотез отклоняются, если вероятность того, что тестовая статистика принадлежит распределению тестовой статистики для этой гипотезы, ниже нижнего порога; или гипотеза не выбирается и не отклоняется, если вероятность того, что статистика теста принадлежит распределению статистики теста для этой гипотезы, находится между нижним и верхним порогами, или если вероятность не определена с достаточно высокой достоверностью. В некоторых вариантах воплощения верхний и/или нижний порог определяется из эмпирического распределения, такого как распределение из обучающих данных (таких как образцы с известным числом копий, такие как диплоидные образцы или образцы, которые, как известно, имеют конкретную делецию или дупликацию). Такое эмпирическое распределение можно использовать для выбора порога для проверки отклонения единичной гипотезы. Обратите внимание, что статистика теста Δ не зависит от S, и поэтому при необходимости оба показателя могут использоваться независимо.
[510] Примерные способы обнаружения делеций и дупликаций, используя распределение аллелей или паттерны
[511] В этот раздел включены способы определения того, существует ли чрезмерное количество копий первого гомологичного сегмента хромосомы по сравнению со вторым гомологичным сегментом хромосомы. В некоторых вариантах воплощения способ включает перечисление (i) множества гипотез, определяющих количество копий хромосомы или сегмента хромосомы, которые присутствуют в геноме одной или более клеток (таких как раковые клетки) индивидуума, или (ii) множества гипотез определения степени избыточного представления количества копий первого гомологичного сегмента хромосомы по сравнению со вторым гомологичным сегментом хромосомы в геноме одной или более клеток индивидуума. В некоторых вариантах воплощения способ включает получение генетических данных от индивидуума по множеству полиморфных локусов (таких как локусы ОНП) на хромосоме или сегменте хромосомы. В некоторых вариантах воплощения создается распределение вероятностей ожидаемых генотипов индивидуума для каждой из гипотез. В некоторых вариантах воплощения вычисляется соответствие данных между полученными генетическими данными индивидуума и распределением вероятностей ожидаемых генотипов индивидуума. В некоторых вариантах воплощения одна или более гипотез ранжируются в соответствии с соответствием данных, и выбирается гипотеза, получившая наивысший рейтинг. В некоторых вариантах воплощения методика или алгоритм, такой как алгоритм поиска, используется для одного или более из следующих этапов: вычисление соответствия данных, ранжирование гипотез или выбор гипотезы, получившей наивысший рейтинг. В некоторых вариантах воплощения соответствие данных - это соответствие бета-биномиальному распределению или соответствие биномиальному распределению. В некоторых вариантах воплощения методика или алгоритм выбирается из группы, состоящей из оценки максимального правдоподобия, максимальной апостериорной оценки, байесовской оценки, динамической оценки (например, динамической байесовской оценки) и оценки максимизации ожидания. В некоторых вариантах воплощения способ включает применение методики или алгоритма к полученным генетическим данным и ожидаемым генетическим данным.
[512] В некоторых вариантах воплощения способ включает перечисление (i) множества гипотез, определяющих количество копий хромосомы или сегмента хромосомы, которые присутствуют в геноме одной или более клеток (таких как раковые клетки) индивидуума, или (ii) множества гипотез определения степени избыточного представления количества копий первого гомологичного сегмента хромосомы по сравнению со вторым гомологичным сегментом хромосомы в геноме одной или более клеток индивидуума. В некоторых вариантах воплощения способ включает получение генетических данных от индивидуума по множеству полиморфных локусов (например, локусов ОНП) на хромосоме или сегменте хромосомы. В некоторых вариантах воплощения генетические данные включают количество аллелей для множества полиморфных локусов. В некоторых вариантах воплощения создается совместная модель распределения для ожидаемого количества аллелей во множестве полиморфных локусов на хромосоме или сегменте хромосомы для каждой гипотезы. В некоторых вариантах воплощения относительная вероятность для одной или более гипотез определяется с использованием модели совместного распределения и количества аллелей, измеренных в образце, и выбирается гипотеза с наибольшей вероятностью.
[513] В некоторых вариантах воплощения распределение или паттерн аллелей (например, паттерн рассчитанных соотношений аллелей) используется для определения наличия или отсутствия ВЧК, например, делеции или дупликации. При необходимости по этой схеме можно определить исходное происхождение ВЧК.
[514] Примерные способы подсчета/Количественные способы
[515] В некоторых вариантах воплощения один или более способов подсчета (также называемых количественными способами) используются для обнаружения одного или более ВЧК, таких как делеции или дупликации сегментов хромосомы или целых хромосом. В некоторых вариантах воплощения используются один или более способов подсчета для определения того, вызвано ли чрезмерное количество копий первого гомологичного сегмента хромосомы дупликацией первого гомологичного сегмента хромосомы или делецией второго гомологичного сегмента хромосомы. В некоторых вариантах воплощения используются один или более способов подсчета для определения количества дополнительных копий сегмента хромосомы или хромосомы, которые дуплицируются (например, имеется ли 1, 2, 3, 4 или более дополнительных копий). В некоторых вариантах воплощения используются один или более способов подсчета для дифференциации образца с множеством дупликаций и меньшей фракцией опухоли от образца с меньшим количеством дупликаций и большей фракцией опухоли. Например, один или более способов подсчета могут использоваться для дифференциации образца с четырьмя дополнительными копиями хромосомы и фракцией опухоли 10% от образца с двумя дополнительными копиями хромосомы и фракцией опухоли 20%. Примерные способы раскрыты, например, в Публикациях заявки на патент США №№. 2007/0184467; 2013/0172211; и 2012/0003637; Патентах США №№ 8467976; 7888017; 8008018; 8296076; и 8195415; Предварительной заявке на патент США, регистрационный № 62/008235, поданной 5 июня 2014 года и Предварительной заявке на патент США, регистрационный № 62/032785, поданной 4 августа 2014 года, каждый из этих документов настоящим включен в качестве ссылки во всей полноте.
[516] В некоторых вариантах воплощения способ подсчета включает подсчет количества считываний на основе последовательностей ДНК, которые картируются на одной или более заданных хромосом или сегментов хромосомы. Некоторые такие способы включают создание референтного значения (пороговое значение) для количества считываний последовательности ДНК, картируемых на конкретной хромосоме или сегменте хромосомы, причем количество считываний, превышающее это значение, указывает на конкретную генетическую аномалию.
[517] В некоторых вариантах воплощения общее измеренное количество всех аллелей для одного или более локусов (например, общее количество полиморфного или неполиморфного локуса) сравнивается с референтным количеством. В некоторых вариантах воплощения референтное количество представляет собой (i) пороговое значение или (ii) ожидаемое количество для конкретной гипотезы количества копий. В некоторых вариантах воплощения эталонное количество (при отсутствии ВЧК) представляет собой общее измеренное количество всех аллелей для одного или более локусов для одной или более хромосом или сегментов хромосом, о которых известно или ожидается, что они не имеют делеции или дупликации. В некоторых вариантах воплощения референтное (для наличия ВЧК) представляет собой общее измеренное количество всех аллелей для одного или более локусов для одной или более хромосом или сегментов хромосом, о которых известно или ожидается наличие делеции или дупликации. В некоторых вариантах воплощения референтное количество - это общее измеренное количество всех аллелей для одного или более локусов для одной или более эталонных хромосом или сегментов хромосомы. В некоторых вариантах воплощения референтное количество - это среднее значение или медиана значений, определенных для двух или более разных хромосом, хромосомных сегментов или разных образцов. В некоторых вариантах воплощения используется случайное (например, массовое параллельное дробное секвенирование) или целевое секвенирование для определения количества одного или более полиморфных или неполиморфных локусов.
[518] В некоторых вариантах воплощения с использованием эталонного количества способ включает (а) измерение количества генетического материала на хромосоме или представляющем интерес сегменте хромосомы; (б) сравнение количества, полученного на этапе (а), с референтным количеством; и (в) выявление наличия или отсутствия делеции или дупликации на основе сравнения.
[519] В некоторых вариантах воплощения с использованием референтной хромосомы или сегмента хромосомы, способ включает секвенирование ДНК или РНК из образца для получения множества тегов последовательности, выравнивающих по целевым локусам. В некоторых вариантах воплощения теги последовательности имеют достаточную длину, чтобы быть отнесенными к конкретному целевому локусу (например, длиной 15-100 нуклеотидов); целевые локусы принадлежат множеству различных хромосом или сегментов хромосомы, которые включают по меньшей мере одну первую хромосому или хромосомный сегмент, предположительно имеющий ненормальное распределение в образце, и по меньшей мере одну вторую хромосому или хромосомный сегмент, предположительно нормально распределенный в образце. В некоторых вариантах воплощения соответствующим целевым локусам присваивается множество тегов последовательности. В некоторых вариантах воплощения определяется количество тегов последовательности, выравниваемых с целевыми локусами первой хромосомы или хромосомного сегмента, и количество тегов последовательности, выравниваемых с целевыми локусами второй хромосомы или хромосомного сегмента. В некоторых вариантах воплощения эти числа сравниваются для определения наличия или отсутствия аномального распределения (например, делеции или дупликации) первой хромосомы или сегмента хромосомы.
[520] В некоторых вариантах воплощения при определении ВЧК используется значение f (например, фракция опухоли), например, для сравнения наблюдаемого различия между количеством двух хромосом или хромосомных сегментов с различием, которое можно было бы ожидать для определенного типа ВЧК с учетом значения f (см., например, Публикация заявки на патент США № 2012/0190020; Публикация заявки на патент США № 2012/0190021; Публикация заявки на патент США № 2012/0190557; Публикация заявки на патент США № 2012/0191358, каждая из которых настоящим включена в качестве ссылки во всей полноте). Например, разница в количестве сегмента хромосомы, который дуплицируется в опухоли, по сравнению с дисомным референтным сегментом хромосомы увеличивается по мере увеличения фракции опухоли. В некоторых вариантах воплощения способ включает сравнение относительной частоты представляющей интерес хромосомы или сегмента хромосомы с референтными хромосомами или сегментом хромосомы (например, хромосомой или сегментом хромосомы, ожидаемым или известным как дисомный) со значением f для определения вероятности ВЧК. Например, разницу в количестве между первыми хромосомами или сегментом хромосомы и референтной хромосомой или сегментом хромосомы можно сравнить с тем, что можно было бы ожидать, учитывая значение f для различных возможных ВЧК (например, одной или двух дополнительных копий сегмента хромосомы, представляющей интерес.
[521] Следующие примеры возможного использования иллюстрируют использование способа подсчета/количественного способа для различения дупликации первого гомологичного сегмента хромосомы и делеции второго гомологичного сегмента хромосомы. Если рассматривать нормальный дисомный геном хозяина в качестве исходного уровня, то анализ смеси нормальных и раковых клеток дает среднюю разницу между исходным уровнем и раковой ДНК в смеси. Например, представьте себе случай, когда 10% ДНК в образце происходили из клеток с делецией в области хромосомы, на которую направлен анализ. В некоторых вариантах воплощения количественный подход показывает, что количество считываний, соответствующих этой области, должно быть 95% от количества считываний, ожидаемого для нормального образца. Это связано с тем, что одна из двух целевых хромосомных областей в каждой из опухолевых клеток с делецией целевой области отсутствует, и, таким образом, общий объем картирования ДНК в этой области составляет 90% (для нормальных клеток) плюс ½ x 10 % (для опухолевых клеток) = 95%. Альтернативно, в некоторых вариантах воплощения аллельный подход показывает, что соотношение аллелей в гетерозиготных локусах в среднем составляло 19:20. Теперь представьте себе случай, когда 10% ДНК в образце произошло из клеток с пятикратной фокальной амплификацией участка хромосомы, на который направлен анализ. В некоторых вариантах воплощения количественный подход показывает, что количество считываний, соответствующих этой области, должно быть 125% от ожидаемого для нормального образца. Это связано с тем, что одна из двух целевых хромосомных областей в каждой из опухолевых клеток с пятикратной фокальной амплификацией копируется еще пять раз над целевой областью, и, таким образом, общий объем картирования ДНК в этой области составляет 90% (для нормальных клеток) плюс (2 + 5) x 10%/2 (для опухолевых клеток) = 125%. Альтернативно, в некоторых вариантах воплощения аллельный подход показывает, что соотношение аллелей в гетерозиготных локусах составляет в среднем 25:20. Обратите внимание, что при использовании только аллельного подхода фокальная пятикратная амплификация по хромосомной области в образце с 10% скДНК может выглядеть так же, как делеция по той же области в образце с 40% скДНК; в этих двух случаях гаплотип, который недостаточно представлен в случае делеции, оказывается гаплотипом без ВЧК в случае фокальной дупликации, а гаплотип без ВЧК в случае делеции оказывается чрезмерно представленным гаплотипом в случае с фокальной дупликацией. Сочетание вероятностей, полученных с помощью этого аллельного подхода, с вероятностями, полученными с помощью количественного подхода, различает эти две возможности.
[522] Примерные способы подсчета/Количественные способы, использующие референтные образцы
[523] Примерный количественный способ, использующий один или более референтных образцов, описан в Предварительной заявке на патент США, регистрационный № 62/008235, поданной 5 июня 2014 года, и Предварительной заявке на патент США, регистрационный № 62/032785, поданной 4 августа 2014 года, документы полностью включены сюда посредством ссылки. В некоторых вариантах воплощения один или более референтных образцов, которые, скорее всего, не имеют каких-либо ВЧК на одной или более хромосом или представляющих интерес хромосом (например, нормальный образец), идентифицируются путем отбора образцов с наибольшей фракцией опухолевой ДНК, отбора образцов с z-значением, ближайшем к нулю, отбора образцов, в которых данные соответствуют гипотезе, соответствующей отсутствию ВЧК с наибольшей достоверностью или вероятностью, отбора образцов, заведомо нормальных, отбора образцов от лиц с наименьшей вероятностью рака (например, имеющих молодой возраст, принадлежность к мужскому полу при скрининге на рак молочной железы, отсутствие семейного анамнеза и т. д.), отбора образцов с наибольшим вводимым количеством ДНК, отбора образцов с наивысшим соотношением сигнал/шум, отбора образцов на основе других критериев, которые, как считается, коррелируют с вероятностью рака, или отбора образцов с использованием некоторой комбинации критериев. После того, как выбран референтный набор, можно сделать предположение, что эти случаи дисомичны, а затем оценить смещение по ОНП, то есть специфическую для эксперимента амплификацию и другое смещение обработки для каждого локуса. Затем можно использовать эту специфичную для эксперимента оценку систематической ошибки, чтобы скорректировать систематическую ошибку в измерениях представляющей интерес хромосомы, такой как локусы хромосомы 21, и, при необходимости, для других хромосомных локусов для образцов, которые не являются частью подмножества, где дисомия предполагается для хромосомы 21. После того, как в этих образцах с неизвестной плоидностью были исправлены смещения, данные для этих образцов можно затем проанализировать второй раз, используя тот же или другой способ, чтобы определить, страдают ли индивидуумы трисомией 21. Например, количественный способ может быть использован для оставшихся образцов с неизвестной плоидностью, а z-оценка может быть рассчитана с использованием исправленных измеренных генетических данных на хромосоме 21. Альтернативно, как часть предварительной оценки состояния плоидности хромосомы 21, может быть вычислена фракция опухоли для образцов от индивидуума с подозрением на рак. Для случая с этой фракцией опухоли могут быть рассчитаны доля скорректированных считываний, ожидаемых в случае дисомии (гипотеза дисомии), и доля скорректированных считываний, ожидаемых в случае трисомии (гипотеза трисомии). В качестве альтернативы, если фракция опухоли не была измерена ранее, может быть создан набор гипотез дисомии и трисомии для различных фракций опухоли. Для каждого случая можно рассчитать ожидаемое распределение доли скорректированных считываний с учетом ожидаемого статистического разброса при выборе и измерении различных локусов ДНК. Наблюдаемую скорректированную долю считываний можно сравнить с распределением ожидаемой доли скорректированных считываний, и можно рассчитать отношение правдоподобия для гипотез дисомии и трисомии для каждого из образцов неизвестной плоидности. Состояние плоидности, связанное с гипотезой с наибольшим вычисленным правдоподобием, может быть выбрано как правильное состояние плоидности.
[524] В некоторых вариантах воплощения может быть выбрано подмножество образцов с достаточно низкой вероятностью рака в качестве контрольного набора образцов. Подмножество может быть фиксированным числом или может быть переменным числом, основанным на выборе только тех образцов, которые не достигают порогового значения. Количественные данные из подмножества образцов могут быть объединены, усреднены или объединены с использованием средневзвешенного значения, где взвешивание основано на вероятности того, что выборка является нормой. Количественные данные могут использоваться для определения смещения по локусу для амплификации секвенирования образцов в текущей партии контрольных образцов. Смещение по локусу может также включать данные из других партий образцов. Смещение по локусу может указывать на относительную избыточную или недостаточную амплификацию, которая наблюдается для этого локуса по сравнению с другими локусами, исходя из предположения, что подмножество образцов не содержит каких-либо ВЧК и что любая наблюдаемая избыточная или недостаточная амплификация происходит из-за амплификации и/или секвенирования или другого смещения. Смещение по локусу может учитывать содержание GC в ампликоне. Локусы могут быть сгруппированы в группы локусов с целью вычисления смещения для каждого локуса. После того, как смещение для каждого локуса было вычислено для каждого локуса во множестве локусов, данные секвенирования для одного или более образцов, которые не входят в подмножество образцов, и, необязательно, одного или более образцов, которые находятся в подмножество образцов, для того, чтобы удалить эффект смещения в этом локусе, могут быть скорректированы путем корректировки количественных измерений для каждого локуса. Например, если в подгруппе пациентов наблюдалось, что ОНП 1 имеет глубину считывания, вдвое превышающую среднюю, корректировка может включать замену количества считываний, соответствующих ОНП 1, на число, которое вдвое меньше среднего. Если рассматриваемый локус является ОНП, корректировка может включать сокращение вдвое количества считываний, соответствующих каждому из аллелей в этом локусе. После того, как данные секвенирования для каждого локуса в одном или более образцов были скорректированы, они могут быть проанализированы с использованием способа с целью обнаружения наличия ВЧК в одной или более хромосомных областей.
[525] В одном примере образец A представляет собой смесь амплифицированной ДНК, происходящей из смеси нормальных и раковых клеток, которая анализируется с использованием количественного способа. Следующее иллюстрирует примерные возможные данные. Было обнаружено, что область q-плеча на хромосоме 22 имеет только 90% ДНК, отображаемой на эту область, как и ожидалось; было обнаружено, что фокальная область, соответствующая гену HER2, имеет на 150% больше ДНК, отображаемой в этой области, как и ожидалось; и p-плечо хромосомы 5, как обнаружено, имеет 105% картирования ДНК, сколько и ожидалось. Врач может сделать вывод, что в образце имеется делеция области на плече q хромосомы 22 и дупликация гена HER2. Врач может сделать вывод, что, поскольку делеции 22q распространены при раке молочной железы и что, поскольку клетки с делецией области 22q на обеих хромосомах обычно не выживают, приблизительно 20% ДНК в образце получены из клеток с делецией 22q на одной из двух хромосом. Врач может также сделать вывод, что если ДНК из смешанного образца, происходящего из опухолевых клеток, произошла из набора генетически опухолевых клеток, чья область HER2 и области 22q были гомогенными, то клетки содержали пятикратную дупликацию области HER2.
[526] В одном примере образец А также анализируется аллельным способом. Следующее иллюстрирует примерные возможные данные. Два гаплотипа в одной и той же области на плече q хромосомы 22 присутствуют в соотношении 4: 5; два гаплотипа в фокальной области, соответствующей гену HER2, присутствуют в соотношении 1: 2; и два гаплотипа на p-плече хромосомы 5 представлены в соотношении 20:21. Все остальные исследуемые участки генома не имеют статистически значимого превышения какого-либо гаплотипа. Клиницист может сделать вывод, что образец содержит ДНК опухоли с ВЧК в области 22q, области HER2 и плече 5p. Основываясь на знании того, что делеции 22q очень распространены при раке молочной железы, и/или основываясь на количественном анализе, показывающем недостаточное отображение количества ДНК, отображаемых в области 22q генома, клиницист может сделать вывод о существовании опухоли с делецией 22q. Основываясь на знании того, что амплификации HER2 очень распространены при раке молочной железы, и/или основываясь количественном анализе, показывающем завышенное представление количества ДНК, отображаемых в области HER2 генома, клиницист может сделать вывод о существовании опухоли с амплификацией HER2.
[527] Примерные референтные хромосомы или хромосомные сегменты
[528] В некоторых вариантах воплощения любой из представленных в данном документе способов также выполняется на одной или более референтных хромосом или сегментах хромосом, и результаты сравниваются с результатами для одной или более представляющих интерес хромосом или сегментов хромосом.
[529] В некоторых вариантах воплощения референтная хромосома или сегмент хромосомы используются в качестве контроля того, что можно было бы ожидать в случае отсутствия ВЧК. В некоторых вариантах воплощения референтный образец представляет собой ту же хромосому или сегмент хромосомы из одного или более разных образцов, о которых известно или ожидается, что они не имеют делеции или дупликации в этой хромосоме или сегменте хромосомы. В некоторых вариантах воплощения референтный образец - это хромосома или сегмент хромосомы, отличный от тестируемого образца, который предположительно является дисомным. В некоторых вариантах воплощения референтный образец представляет собой сегмент, отличный от одной из представляющих интерес хромосом в том же образце, который тестируется. Например, референтный образец может представлять собой один или более сегментов за пределами области потенциальной делеции или дупликации. Наличие эталонного образца для одной и той же тестируемой хромосомы позволяет избежать вариабельности между разными хромосомами, например различий в метаболизме, апоптозе, гистонах, инактивации и/или амплификации между хромосомами. Также может использоваться анализ сегментов без ВЧК на той же хромосоме, что и тестируемая хромосома, для определения различий в метаболизме, апоптозе, гистонах, инактивации и/или амплификации между гомологами, что позволяет определить уровень вариабельности между гомологами в отсутствие ВЧК для сравнения с результатами для потенциальной ВЧК. В некоторых вариантах воплощения величина различия между рассчитанным и ожидаемым соотношением аллелей для потенциальной ВЧК больше, чем соответствующая величина для референтного образца, тем самым подтверждая наличие ВЧК.
[530] В некоторых вариантах воплощения референтная хромосома или сегмент хромосомы используются в качестве контроля того, что можно было бы ожидать от наличия ВЧК, например, конкретной интересующей делеции или дупликации. В некоторых вариантах воплощения референтный образец - это одна и та же хромосома или сегмент хромосомы из одного или более разных образцов, о которых известно или ожидается, что они имеют делецию или дупликацию в этой хромосоме или сегменте хромосомы. В некоторых вариантах воплощения референтным образцом является хромосома или сегмент хромосомы, отличные от тестируемого образца, о котором известно или ожидается, что он имеет ВЧК. В некоторых вариантах воплощения величина различия между рассчитанным и ожидаемым соотношением аллелей для потенциальной ВЧК аналогична (например, незначительно отличается) соответствующей величине референтного образца для ВЧК, тем самым подтверждая наличие ВЧК. В некоторых вариантах воплощения величина различия между рассчитанным и ожидаемым соотношением аллелей для потенциальной ВЧК меньше (например, значительно меньше), чем соответствующая величина референтного образца для ВЧК, тем самым подтверждая отсутствие ВЧК. В некоторых вариантах воплощения для определения фракции опухоли используется один или более локусов, для которых генотип раковой клетки (или ДНК или РНК из раковой клетки, такой как скДНК или скРНК) отличается от генотипа нераковой клетки (или ДНК или РНК из нераковой клетки, такой как скДНК или скРНК). Фракция опухоли может быть использована для определения того, является ли чрезмерное количество копий первого гомологичного сегмента хромосомы следствием дупликации первого гомологичного сегмента хромосомы или делеции второго гомологичного сегмента хромосомы. Фракцию опухоли также можно использовать для определения количества дополнительных копий сегмента хромосомы или хромосомы, которые дуплицируются (например, есть ли 1, 2, 3, 4 или более дополнительных копий), например, чтобы дифференцировать образец с четырьмя дополнительными копиями хромосомы и фракцией опухоли 10% из образца с двумя дополнительными копиями хромосомы и фракцией опухоли 20%. Фракцию опухоли также можно использовать для определения того, насколько хорошо наблюдаемые данные соответствуют ожидаемым данным для возможных ВЧК. В некоторых вариантах воплощения степень преобладания ВЧК используется для выбора конкретной терапии или терапевтического режима для индивидуума. Например, некоторые терапевтические агенты эффективны только по меньшей мере для четырех, шести или более копий сегмента хромосомы.
[531] В некоторых вариантах воплощения один или более локусов, используемых для определения фракции опухоли, находятся на референтной хромосоме или сегменте хромосомы, таком как хромосома или сегмент хромосомы, о которых известно или ожидается, что они являются дисомной хромосомой или сегментом хромосомы, которые редко подвергаются дупликации или делеции в раковых клетках в целом или при конкретном типе рака, который, как известно, есть у индивидуума или индувидуум имеет повышенный риск его наличия, или хромосома или хромосомный сегмент, который вряд ли будет анеуплоидным (такой как сегмент, который, как ожидается, приведет к гибели клетки в случае делеции или дупликации). В некоторых вариантах воплощения любой из способов изобретения используется для подтверждения того, что референтная хромосома или сегмент хромосомы является дисомным как в раковых, так и в нераковых клетках. В некоторых вариантах воплощения используются одна или более хромосом или сегментов хромосом, для которых существует высокая степень достоверности распознавания дисомии.
[532] Примерные локусы, которые можно использовать для определения фракции опухоли, включают полиморфизмы или мутации (такие как ОНП) в раковой клетке (или ДНК или РНК, такие как скДНК или скРНК из раковой клетки), которые отсутствуют в нераковой клетке (или ДНК или РНК из нераковой клетки) у индивидуума. В некоторых вариантах воплощения фракция опухоли определяется путем идентификации тех полиморфных локусов, в которых раковая клетка (или ДНК, или РНК из раковой клетки) имеет аллель, который отсутствует в нераковых клетках (или ДНК или РНК из нераковой клетки) в образце (например, образец плазмы или биопсия опухоли) от индивидуума; и использование количества аллеля, уникального для раковой клетки, в одном или более идентифицированных полиморфных локусов для определения фракции опухоли в образце. В некоторых вариантах воплощения нераковая клетка гомозиготна по первому аллелю в полиморфном локусе, а раковая клетка (i) гетерозиготна по первому аллелю и второму аллелю или (ii) гомозиготна по второму аллелю в полиморфном локусе. В некоторых вариантах воплощения нераковая клетка гетерозиготна по первому аллелю и второму аллелю в полиморфном локусе, а раковая клетка (i) имеет одну или две копии третьего аллеля в полиморфном локусе. В некоторых вариантах воплощения предполагается или известно, что раковые клетки имеют только одну копию аллеля, которой нет в нераковых клетках. Например, если генотип нераковых клеток является AA, а раковых клеток - AB, и 5% сигнала в этом локусе в образце исходит от аллеля B, а 95% - от аллеля A, то доля опухоли в образце составляет 10%. В некоторых вариантах воплощения предполагается или известно, что раковые клетки имеют две копии аллеля, отсутствующего в нераковых клетках. Например, если генотип нераковых клеток является AA, а раковых клеток является BB, а 5% сигнала в этом локусе в образце происходят от аллеля B, а 95% происходят от аллеля A, фракция опухоли в образце составляет 5%. В некоторых вариантах воплощения анализируются множественные локусы, для которых раковые клетки имеют аллель не в нераковых клетках, для того, чтобы определить, какие из локусов в раковых клетках являются гетерозиготными, а какие гомозиготными. Например, для локусов, в которых нераковые клетки представляют собой AA, если сигнал от аллеля B составляет приблизительно 5% в некоторых локусах и приблизительно 10% в некоторых локусах, то предполагается, что раковые клетки гетерозиготны в локусах с приблизительно 5% B аллеля и гомозиготны по локусам с приблизительно 10% B аллеля (что указывает на фракцию опухоли приблизительно 10%).
[533] Примерные локусы, которые можно использовать для определения фракции опухоли, включают локусы, для которых раковая клетка и нераковая клетка имеют один общий аллель (например, локусы, в которых раковой клеткой является AB, а нераковой клеткой является BB, или раковой клеткой является BB, а нераковой клеткой является AB). Количество сигнала A, количество сигнала B или отношение сигнала A к сигналу B в смешанном образце (содержащем ДНК или РНК из раковой клетки и нераковой клетки) сравнивается с соответствующим значением для (i) образца содержащего ДНК или РНК только раковых клеток или (ii) образца, содержащего ДНК или РНК только нераковых клеток. Для определения доли опухоли в смешанном образце используется разница в значениях.
[534] В некоторых вариантах воплощения локусы, которые можно использовать для определения фракции опухоли, выбираются на основе генотипа (i) образца, содержащего ДНК или РНК только из раковых клеток, и/или (ii) образца, содержащего ДНК или РНК только из нераковых клеток. В некоторых вариантах воплощения локусы выбираются на основе анализа смешанного образца, такие, как локусы, для которых абсолютное или относительное количество каждого аллеля отличается от того, что можно было бы ожидать, если и раковые, и нераковые клетки имеют одинаковый генотип в конкретном локусе. Например, если раковые и нераковые клетки имеют один и тот же генотип, ожидается, что локусы будут производить 0% сигнала B, если все клетки являются AA, 50% сигнала B, если все клетки являются AB, или 100% сигнала B, если все клетки являются BB. Другие значения для сигнала B указывают на то, что генотип раковых и нераковых клеток в этом локусе различный, и, таким образом, этот локус может использоваться для определения фракции опухоли.
[535] В некоторых вариантах воплощения фракция опухоли, рассчитанная на основе аллелей в одном или более локусов, сравнивается с фракцией опухоли, рассчитанной с использованием одного или более способов подсчета, представленных в настоящем документе.
[536] Примерные способы обнаружения фенотипа или анализ множественных мутаций
[537] В некоторых вариантах воплощения способ включает анализ образца на наличие набора мутаций, связанных с заболеванием или расстройством (таким как рак) или повышенным риском заболевания или расстройства. Существуют сильные корреляции между событиями внутри классов (например, классы рака M или C), которые можно использовать для улучшения отношения сигнал/шум способа и классификации опухолей на отдельные клинические подгруппы. Например, очень сильным сигналом могут быть пограничные результаты для нескольких мутаций (таких как несколько ВЧК) на одной или более хромосом или сегментов хромосом, рассматриваемых вместе. В некоторых вариантах воплощения определение наличия или отсутствия множественных полиморфизмов или представляющих интерес мутаций (таких как 2, 3, 4, 5, 8, 10, 12, 15 или более) увеличивает чувствительность и/или специфичность определения наличия или отсутствия заболевания или расстройства, такого как рак, или повышенный риск заболевания или расстройства, такого как рак. В некоторых вариантах воплощения корреляция между событиями в нескольких хромосомах используется для более эффективного анализа сигнала по сравнению с рассмотрением каждого из них по отдельности. Для лучшей классификации опухолей можно оптимизировать дизайн самого способа. Это, по сравнению с рецидивом, может быть невероятно полезно для раннего выявления и скрининга, когда чувствительность к одной конкретной мутации/ВЧК может иметь первостепенное значение. В некоторых вариантах воплощения события не всегда коррелируют, однако существует вероятность того, что они коррелируют. В некоторых вариантах воплощения используется формулировка матричной оценки с ковариационной матрицей шума, имеющей недиагональные параметры.
[538] В некоторых вариантах воплощения изобретение относится к способу обнаружения фенотипа (такого как фенотип рака) у индивидуума, при этом фенотип определяется наличием по меньшей мере одной мутации из набора мутаций. В некоторых вариантах воплощения способ включает получение измерений ДНК или РНК для образца ДНК или РНК из одной или более клеток индивидуума, при этом одна или более клеток предположительно имеют фенотип; и анализ измерений ДНК или РНК, чтобы определить для каждой мутации в наборе мутаций вероятность того, что хотя бы одна из клеток имеет эту мутацию. В некоторых вариантах воплощения способ включает определение того, что индивидуум имеет фенотип, если либо (i) по меньшей мере, для одной из мутаций, вероятность того, что по меньшей мере одна из клеток содержит эту мутацию, превышает пороговое значение, либо (ii) по меньшей мере, для одной из мутаций вероятность того, что по меньшей мере одна из клеток имеет эти мутации, меньше порогового значения, и для множества мутаций совокупная вероятность того, что по меньшей мере одна из клеток имеет по меньшей мере одну из мутаций, больше пороговой. В некоторых вариантах воплощения одна или более клеток имеют подмножество или все мутации в наборе мутаций. В некоторых вариантах воплощения подмножество мутаций связано с раком или повышенным риском рака. В некоторых вариантах воплощения набор мутаций включает подмножество или все мутации в классе M раковых мутаций (Ciriello, Nat Genet. 45(10):1127-1133, 2013, doi: 10.1038/ng.2762, документ полностью включен сюда посредством ссылки). В некоторых вариантах воплощения набор мутаций включает подмножество или все мутации в классе C раковых мутаций (Ciriello, выше). В некоторых вариантах воплощения образец включает внеклеточную ДНК или РНК. В некоторых вариантах воплощения измерения ДНК или РНК включают измерения (например, количество каждого аллеля в каждом локусе) в наборе полиморфных локусов на одной или более хромосом или представляющих интерес сегментов хромосом.
[539] Примерная комбинация способов
[540] Для повышения точности результатов используются два или более способа (например, любой из способов по настоящему изобретению или любой известный способ) для обнаружения наличия или отсутствия ВЧК. В некоторых вариантах воплощения выполняются один или более способов анализа фактора (например, любого из представленных в данном документе способов или любого известного способа), указывающего на наличие или отсутствие заболевания или расстройства, либо на повышенный риск заболевания или расстройства.
[541] В некоторых вариантах воплощения для вычисления ковариации и/или корреляции между двумя или более способами используются стандартные математические способы. Стандартные математические способы также могут быть использованы для определения совокупной вероятности конкретной гипотезы на основе двух или более тестов. Примеры способов включают метаанализ, комбинированный вероятностный тест Фишера для независимых тестов, способ Брауна для комбинирования зависимых p-значений с известной ковариацией и способ Коста для комбинирования зависимых p-значений с неизвестной ковариацией. В случаях, когда вероятности определяются первым способом, который ортогонален или не связан с тем, как определяется вероятность для второго способа, комбинирование вероятностей является простым и может быть выполнено путем умножения и нормализации, или путем использования формулы, такой как:
[542] Rcomb= R1R2/[R1R2 + (1-R1)(1-R2)]
[543] Rcomb является объединенной вероятностью, а R1 и R2 являются индивидуальными вероятностями. Например, если вероятность трисомии по способу 1 составляет 90%, а вероятность трисомии по способу 2 составляет 95%, то объединение результатов двух способов позволяет клиницисту сделать вывод, что плод является трисомным с вероятностью (0,90)(0,95)/[(0,90)(0,95) + (1 - 0,90)(1 - 0,95)] = 99,42%. В случаях, когда первый и второй способы не ортогональны, то есть когда существует корреляция между двумя способами, вероятности все же могут быть объединены.
[544] Примерные способы анализа множества факторов или переменных раскрыты в Патенте США № 8024128, выданном 20 сентября 2011 года; Публикации заявки на патент США № 2007/0027636, поданной 31 июля 2006 года; и Публикации заявки на патент США № 2007/0178501, поданной 6 декабря 2006 года, каждый из этих документов полностью включен сюда посредством ссылки.
[545] В различных вариантах воплощения совокупная вероятность конкретной гипотезы или диагноза превышает 80, 85, 90, 92, 94, 96, 98, 99 или 99,9% или превышает какое-либо другое пороговое значение.
[546] Предел обнаружения
[547] Как показали эксперименты, представленные в разделе «Примеры», способы, представленные в настоящем документе, способны обнаруживать средний аллельный дисбаланс в образце с пределом обнаружения или чувствительности 0,45% AAI, что является пределом обнаружения анеуплоидии иллюстративного способа настоящего изобретения. Аналогичным образом, в некоторых вариантах воплощения способы, представленные в настоящем документе, способны обнаруживать средний аллельный дисбаланс в образце, составляющий 0,45, 0,5, 0,6, 0,7, 0,8. 0,9 или 1,0%. То есть, способ тестирования способен обнаруживать хромосомную анеуплоидию в образце до 0,45, 0,5, 0,6, 0,7, 0,8. 0,9 или 1,0% AAI. Как продемонстрировано экспериментами, представленными в разделе «Примеры», способы, представленные в данном документе, способны обнаруживать присутствие ОНВ в образце по меньшей мере для некоторых ОНВ с пределом обнаружения или чувствительностью 0,2%, что является пределом обнаружения для по меньшей мере нескольких ОНВ в одном иллюстративном варианте воплощения. Аналогичным образом, в некоторых вариантах воплощения способ позволяет обнаруживать ОНВ или AAI ОНВ с частотой 0,2, 0,3, 0,4, 0,5, 0,6, 0,7, 0,8. 0,9 или 1,0%. То есть, данный способ тестирования способен обнаруживать ОНВ в образце с пределом обнаружения 0,2, 0,3, 0,4, 0,5, 0,6, 0,7, 0,8. 0,9 или 1,0% от общего количества аллелей в хромосомном локусе ОНВ.
[548] В некоторых вариантах воплощения предел обнаружения мутации (такой как ОНВ или ВЧК) способа по настоящему изобретению меньше или равен 10, 5, 2, 1, 0,5, 0,1, 0,05, 0,01 или 0,005%. В некоторых вариантах воплощения предел обнаружения мутации (такой как ОНВ или ВЧК) способа по изобретению составляет от 15 до 0,005%, например, от 10 до 0,005%, от 10 до 0,01%, от 10 до 0,1%, от 5 до 0,005% , от 5 до 0,01%, от 5 до 0,1%, от 1 до 0,005%, от 1 до 0,01%, от 1 до 0,1%, от 0,5 до 0,005%, от 0,5 до 0,01%, от 0,5 до 0,1% или от 0,1 до 0,01 включительно.
[549] В некоторых вариантах воплощения предел обнаружения такой, что обнаруживается (или может быть обнаружена) мутация (например, ОНВ или ВЧК), которая присутствует в количестве менее чем или равном 10, 5, 2, 1, 0,5, 0,1, 0,05, 0,01 или 0,005% молекулы ДНК или РНК с этим локусом в образце (например, образец скДНК или скРНК). Например, мутация может быть обнаружена, даже если меньше или равно 10, 5, 2, 1, 0,5, 0,1, 0,05, 0,01 или 0,005% молекул ДНК или РНК, имеющих этот локус, имеют эту мутацию в локусе (вместо, например, версии локуса дикого типа или немутантной версии локуса или другой мутации в этом локусе). В некоторых вариантах воплощения предел обнаружения таков, что обнаруживается (или способна быть обнаруженной) мутация (такая, как ОНВ или ВЧК), присутствующая в количестве меньшем или равном 10, 5, 2, 1, 0,5, 0,1, 0,05, 0,01 или 0,005% молекулы ДНК или РНК в образце (таком, как образец скДНК или скРНК). В некоторых вариантах воплощения, где ВЧК представляет собой делецию, делеция может быть обнаружена, даже если она присутствует только в количестве, меньшем или равном 10, 5, 2, 1, 0,5, 0,1, 0,05, 0,01 или 0,005% молекул ДНК или РНК, имеющих в образце представляющую интерес область, которая может содержать или не содержать делецию. В некоторых вариантах воплощения, где ВЧК представляет собой делецию, делеция может быть обнаружена, даже если она присутствует только в количестве, меньшем или равном 10, 5, 2, 1, 0,5, 0,1, 0,05, 0,01 или 0,005% молекул ДНК или РНК в образце. В некоторых вариантах воплощения, в которых ВЧК представляет собой дупликацию, дупликацию можно обнаружить, даже если присутствующая дополнительная дуплицированная ДНК или РНК меньше или равна 10, 5, 2, 1, 0,5, 0,1, 0,05, 0,01, или 0,005% молекул ДНК или РНК, имеющих представляющую интерес область, которая может или не может дуплицироваться в образце. В некоторых вариантах воплощения, где ВЧК представляет собой дупликацию, дупликацию можно обнаружить, даже если присутствующая дополнительная дуплицированная ДНК или РНК меньше или равна 10, 5, 2, 1, 0,5, 0,1, 0,05, 0,01, или 0,005% молекул ДНК или РНК в образце.
[550] Примерные образцы
[551] В некоторых вариантах воплощения любого из аспектов изобретения образец включает клеточный и/или внеклеточный генетический материал из клеток, подозреваемых в наличии делеции или дупликации, таких как клетки, предположительно являющиеся раковыми. В некоторых вариантах воплощения образец включает любую ткань или биологическую жидкость, предположительно содержащую клетки, ДНК или РНК, имеющие делецию или дупликацию, например опухоли или другие образцы, которые включают раковые клетки, ДНК или РНК. Генетические измерения, используемые как часть этих способов, могут быть выполнены на любом образце, содержащем ДНК или РНК, например, без ограничений, ткани, крови, сыворотки, плазмы, мочи, волос, слез, слюны, кожи, ногтей, фекалий, желчи, лимфы, цервикальной слизи, спермы, опухоли или других клетках или материалах, содержащих нуклеиновые кислоты. Образцы могут включать любой тип клеток или можно использовать ДНК или РНК из любого типа клеток (например, клетки любого органа или ткани, предположительно раковые, или нейроны). В некоторых вариантах воплощения образец включает ядерную и/или митохондриальную ДНК. В некоторых вариантах воплощения образец взят от любого из целевых индивидуумов, представленных в данном документе. В некоторых вариантах воплощения целевым индивидуумом является пациент с раком.
[552] Примерные образцы включают образцы, содержащие скДНК или скРНК. В некоторых вариантах воплощения скДНК доступна для анализа без потребности этапа лизиса клеток. Свободно-клеточная ДНК может быть получена из различных тканей, таких как ткани, которые находятся в жидкой форме, например, кровь, плазма, лимфа, асцитная жидкость или спинномозговая жидкость. В некоторых случаях скДНК состоит из ДНК, полученной из клеток плода. В некоторых случаях скДНК выделяют из плазмы, выделенной из цельной крови, центрифугированной для удаления клеточного материала. СкДНК может быть смесью ДНК, полученной из клеток-мишеней (таких как раковые клетки) и нецелевых клеток (таких как нераковые клетки).
[553] В некоторых вариантах воплощения образец содержит или предположительно содержит смесь ДНК (или РНК), например смесь ДНК (или РНК), происходящей из раковых клеток, и ДНК (или РНК), происходящей из нераковых (то есть нормальных) клеток. В некоторых вариантах воплощения по меньшей мере 0,5, 1, 3, 5, 7, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 92, 94, 95, 96, 98, 99 или 100% клеток в образце являются раковыми клетками. В некоторых вариантах воплощения по меньшей мере 0,5, 1, 3, 5, 7, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 92, 94, 95, 96, 98, 99 или 100% ДНК (например, скДНК) или РНК (например, скРНК) в образце происходит из раковых клеток. В различных вариантах воплощения процент клеток в образце, являющихся раковыми, составляет от 0,5 до 99%, например, от 1 до 95%, от 5 до 95%, от 10 до 90%, от 5 до 70%, от 10 до 70%, от 20 до 90%, или от 20 до 70% включительно. В некоторых вариантах воплощения образец обогащен раковыми клетками или ДНК или РНК раковых клеток. В некоторых вариантах воплощения, в которых образец обогащен раковыми клетками по меньшей мере 0,5, 1, 2, 3, 4, 5, 6, 7, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 92, 94, 95, 96, 98, 99 или 100% клеток в обогащенном образце являются раковыми клетками. В некоторых вариантах воплощения, в которых образец обогащен ДНК или РНК из раковых клеток по меньшей мере 0,5, 1, 2, 3, 4, 5, 6, 7, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 92, 94, 95, 96, 98, 99 или 100% ДНК или РНК в обогащенном образце взяты из раковых клеток. В некоторых вариантах воплощения для обогащения раковыми клетками используется сортировка клеток (такая как сортировка флюоресцентно-активированных клеток (Fluorescent Activated Cell Sorting -FACS)) (Barteneva et. al., Biochim Biophys Acta., 1836(1):105-22, Aug 2013. doi: 10.1016/j.bbcan.2013.02.004. Epub 2013 Feb 24, and Ibrahim et al., Adv Biochem Eng Biotechnol. 106:19-39, 2007, каждый из этих документов полностью включен сюда посредством ссылки).
[554] В некоторых вариантах воплощения образец обогащен фетальными клетками. В некоторых вариантах воплощения, в которых образец обогащен фетальными клетками, по меньшей мере, 0,5, 1, 2, 3, 4, 5, 6, 7% или более клеток в обогащенном образце являются клетками плода. В некоторых вариантах воплощения процент клеток в образце, которые являются фетальными клетками, составляет от 0,5 до 100%, например, от 1 до 99%, от 5 до 95%, от 10 до 95%, от 10 до 95%, от 20 до 90% или от 30 до 70 % включительно. В некоторых вариантах воплощения образец обогащен фетальной ДНК. В некоторых вариантах воплощения, в которых образец обогащен фетальной ДНК по меньшей мере 0,5, 1, 2, 3, 4, 5, 6, 7% или более ДНК в обогащенном образце является фетальной ДНК. В некоторых вариантах воплощения процент ДНК в образце, которая является фетальной ДНК, составляет от 0,5 до 100%, например, от 1 до 99%, от 5 до 95%, от 10 до 95%, от 10 до 95%, от 20 до 90% или от 30 до 70 % включительно.
[555] В некоторых вариантах воплощения образец включает одну клетку или включает ДНК и/или РНК из одной клетки. В некоторых вариантах воплощения множественные отдельные клетки (например по меньшей мере 5, 10, 20, 30, 40 или 50 клеток от одного и того же субъекта или от разных субъектов) анализируются параллельно. В некоторых вариантах воплощения клетки из множественных образцов от одного индивидуума объединяются, что сокращает объем работы по сравнению с анализом образцов по отдельности. Объединение множественных образцов также может позволить одновременно проверять несколько тканей на рак (что может использоваться для обеспечения или более тщательного скрининга на рак или для определения того, мог ли рак метастазировать в другие ткани).
[556] В некоторых вариантах воплощения образец содержит одну клетку или небольшое количество клеток, например 2, 3, 5, 6, 7, 8, 9 или 10 клеток. В некоторых вариантах воплощения образец содержит от 1 до 100, от 100 до 500 или от 500 до 1000 клеток включительно. В некоторых вариантах воплощения образец содержит от 1 до 10 пикограмм, от 10 до 100 пикограмм, от 100 пикограмм до 1 нанограмма, от 1 до 10 нанограммов, от 10 до 100 нанограммов или от 100 нанограммов до 1 микрограмма РНК и/или ДНК включительно.
[557] В некоторых вариантах воплощения образец заключен в парафин. В некоторых вариантах воплощения образец хранится с консервантом, таким как формальдегид, и необязательно заключен в парафин, что может вызвать перекрестное сшивание ДНК, так что для ПЦР доступно ее меньшее количество. В некоторых вариантах воплощения образец представляет собой фиксированный в формальдегиде и заключенный в парафин (formaldehyde fixed-paraffin embedded - FFPE) образец. В некоторых вариантах воплощения образец представляет собой свежий образец (например, образец, полученный за 1 или 2 дня анализа). В некоторых вариантах воплощения образец замораживают перед анализом. В некоторых вариантах воплощения образец представляет собой исторический образец.
[558] Эти образцы можно использовать в любом из способов изобретения.
[559] Примерные способы подготовки образца
[560] В некоторых вариантах воплощения способ включает выделение или очистку ДНК и/или РНК. Для достижения этой цели известен ряд стандартных процедур. В некоторых вариантах воплощения образец можно центрифугировать для разделения различных слоев. В некоторых вариантах воплощения ДНК или РНК можно выделить с помощью фильтрации. В некоторых вариантах воплощения подготовка ДНК или РНК может включать амплификацию, разделение, очистку с помощью хроматографии, жидкостное разделение, выделение, предпочтительное обогащение, предпочтительную амплификацию, целевую амплификацию или любой из ряда других способов, известных в данной области техники или представленных в данном документе. В некоторых вариантах воплощения для выделения ДНК используется РНКаза для разложения РНК. В некоторых вариантах воплощения для выделения РНК, для разложения ДНК используется ДНКаза (такая как ДНКаза I от Invitrogen, Carlsbad, CA, США). В некоторых вариантах воплощения для выделения РНК используется мини-набор RNeasy (Qiagen) в соответствии с протоколом производителя. В некоторых вариантах воплощения малые молекулы РНК выделяют с использованием набора mirVana PARIS (Ambion, Austin, TX, Техас, США) в соответствии с протоколом производителя (Gu et al., J. Neurochem. 122:641-649, 2012, документ полностью включен сюда посредством ссылки). Концентрацию и чистоту РНК можно необязательно определить с использованием Nanovue (GE Healthcare, Piscataway, NJ, США), и целостность РНК можно необязательно определить с использованием 2100 Bioanalyzer (Agilent Technologies, Santa Clara, CA, США) (Gu et al., J. Neurochem. 122:641-649, 2012, документ полностью включен сюда посредством ссылки). В некоторых вариантах воплощения для стабилизации РНК во время хранения используется TRIZOL или RNAlater (Ambion).
[561] В некоторых вариантах воплощения для создания библиотеки добавлены универсальные меченные адапторы. Перед лигированием образец ДНК может быть тупым концом, а затем к 3'-концу добавляется одно аденозиновое основание. Перед лигированием ДНК можно расщепить рестриктазой или каким-либо другим способом расщепления. Во время лигирования 3'-аденозин фрагментов образца и комплементарный 3'-тирозиновый «липкий» конец адаптора могут усиливать эффективность лигирования. В некоторых вариантах воплощения лигирование адаптора проводится с использованием набора для лигирования, находящегося в наборе AGILENT SURESELECT. В некоторых вариантах воплощения библиотека амплифицирована с использованием универсальных праймеров. В одном из вариантов воплощения амплифицированная библиотека фракционируется путем разделения по размеру или с использованием таких продуктов, как микрогранулы AGENCOURT AMPURE, или другими аналогичными способами. В некоторых вариантах воплощения для амплификации целевых локусов используется ПЦР-амплификация. В некоторых вариантах воплощения амплифицированная ДНК секвенируется (например, секвенирование с использованием секвенатора ILLUMINA IIGAX или HiSeq). В некоторых вариантах воплощения амплифицированная ДНК секвенируется с каждого конца амплифицированной ДНК для уменьшения ошибок секвенирования. Если при секвенировании с одного конца амплифицированной ДНК имеется ошибка последовательности в определенном основании, то ошибка последовательности в комплементарном основании при секвенировании с другой стороны амплифицированной ДНК будет происходить с меньшей вероятностью (по сравнению с многократным секвенированием с одного и того же конца амплифицированной ДНК).
[562] В некоторых вариантах воплощения для амплификации образца нуклеиновой кислоты применяется полногеномная амплификация (whole genome amplification - WGA). Существует ряд способов для WGA: опосредованная лигированием ПЦР (ligation-mediated PCR - LM-PCR), ПЦР с вырожденными нуклеотидными праймерами (degenerate oligonucleotide primer PCR - DOP-PCR) и амплификация с множественным замещением (multiple displacement amplification - MDA). При LM-PCR короткие последовательности ДНК, называемые адапторами, лигируются с тупыми концами ДНК. Эти адапторы содержат универсальные последовательности амплификации, которые используются для амплификации ДНК с помощью ПЦР. В DOP-PCR в первом цикле отжига и ПЦР используются случайные праймеры, которые также содержат универсальные последовательности амплификации. Затем используется второй цикл ПЦР для дальнейшей амплификации последовательностей с помощью последовательностей универсальных праймеров. MDA использует полимеразу phi-29, которая является высокопроизводительным и неспецифическим ферментом, который реплицирует ДНК и используется для анализа отдельных клеток. В некоторых вариантах воплощения WGA не проводится.
[563] В некоторых вариантах воплощения для амплификации или обогащения целевых локусов используется селективная амплификация. В некоторых вариантах воплощения способ амплификации и/или селективного обогащения может включать ПЦР, такую как ПЦР, опосредованную лигированием, захват фрагмента гибридизацией, инвертируемые молекулярные зонды или другие циркуляризующие зонды. В некоторых вариантах воплощения используется количественная ПЦР в реальном времени (real-time quantitative PCR - RT-qPCR), цифровая ПЦР или эмульсионная ПЦР, реакция достройки по одному основанию в аллеле с последующей масс-спектрометрией (Hung et al., J Clin Pathol 62:308-313, 2009, документ полностью включен сюда посредством ссылки). В некоторых вариантах воплощения для предпочтительного обогащения ДНК используется захват путем гибридизации с гибридными зондами захвата. В некоторых вариантах воплощения способы амплификации или селективного обогащения могут включать использование зондов, в которых при правильной гибридизации с целевой последовательностью 3'-конец или 5'-конец нуклеотидного зонда отделяется от полиморфного сайта полиморфного аллеля небольшим количеством нуклеотидов. Это разделение снижает предпочтительную амплификацию одного аллеля, называемую смещением аллеля. Это является усовершенствованием по сравнению со способами, которые включают использование зондов, в которых 3'- конец или 5'-конец правильно гибридизированного зонда находятся непосредственно рядом или очень близко к полиморфному сайту аллеля. В одном варианте воплощения зонды, в которых гибридизирующаяся область может содержать или обязательно содержит полиморфный сайт, исключаются. Полиморфные сайты в месте гибридизации могут вызывать неравную гибридизацию или вообще подавлять гибридизацию некоторых аллелей, что приводит к предпочтительной амплификации определенных аллелей. Эти варианты воплощения являются усовершенствованиями по сравнению с другими способами, которые включают целевую амплификацию и/или селективное обогащение, в том смысле, что они лучше сохраняют исходные частоты аллелей образца в каждом полиморфном локусе, независимо от того, является ли образец чистым геномным образцом от одного индивидуума или от смеси индивидуумов.
[564] В некоторых вариантах воплощения для получения очень коротких ампликонов используется ПЦР (именуемая мини-ПЦР) (Заявка на патент США № 13/683604, поданная 21 ноября 2012 года, Публикация заявки на патент США № 2013/0123120, Заявка на патент США № 13/300235, поданная 18 ноября 2011 года, Публикация заявки на патент США № 2012/0270212, поданная 18 ноября 2011 года и Предварительная заявка на патент США, регистрационный № 61/994791, поданная 16 мая 2014 года, каждый из этих документов полнростью включен сюда посредством ссылки). скДНК (такая, как раковая ДНК, освобождаемая вследствие некроза или апоптоза) высоко фрагментирована. Для фетальной скДНК размеры фрагментов распределяются приблизительно по Гауссу со средним значением 160 п.н., стандартным отклонением 15 п.н., минимальным размером приблизительно 100 п.н. и максимальным размером приблизительно 220 п.н. Полиморфный сайт одного конкретного целевого локуса может занимать любую позицию среди различных фрагментов, происходящих из этого локуса, от начала до конца. Поскольку фрагменты скДНК короткие, вероятность присутствия обоих сайтов праймеров и вероятность того, что фрагмент длиной L содержит сайты как прямого, так и обратного праймеров, представляет собой отношение длины ампликона к длине фрагмента. В идеальных условиях анализы, в которых ампликон составляет 45, 50, 55, 60, 65 или 70 п.н., будут успешно амплифицироваться с, соответственно, 72, 69, 66, 63, 59 или 56% доступных молекул фрагментов матрицы. В некоторых вариантах воплощения, которые наиболее предпочтительно относятся к скДНК из образцов индивидуумов с подозрением на рак, скДНК амплифицируют с использованием праймеров, которые дают максимальную длину ампликона 85, 80, 75 или 70 п.н., а в некоторых предпочтительных вариантах воплощения 75 п.н., и которые имеют температуру плавленияа от 50 до 65 °C, а в некоторых предпочтительных вариантах воплощения от 54 до 60,5 °C. Длина ампликона - это расстояние между 5'-концами прямого и обратного праймированных сайтов. Длина ампликона, которая короче чем та, что обычно используется способами, известными в данной области техники, может привести к более эффективным измерениям желаемых полиморфных локусов, при этом требуется только считывания коротких последовательностей. В одном из вариантов воплощения значительная часть ампликонов имеет размер менее 100 п.н., менее 90 п.н., менее 80 п.н., менее 70 п.н., менее 65 п.н., менее 60 п.н., менее 55 п.н., менее 50 п.н. или менее 45 п.н.
[565] В некоторых вариантах воплощения апмлификация проводится с использованием прямой мультиплексной ПЦР, последовательной ПЦР, вложенной ПЦР, двойной вложенной ПЦР, полуторасторонней вложенной ПЦР, полностью вложенной ПЦР, односторонней полностью вложенной ПЦР, односторонней вложенной ПЦР, геми-вложенной ПЦР, геми-вложенной ПЦР, трижды геми-вложенной ПЦР, полу-вложенной ПЦР, односторонней полу-вложенной ПЦР, способом обратной полу-вложенной ПЦР или односторонней ПЦР, которые описаны в Заявке на патент США № 13/683604, поданной 21 ноября 2012 года, Публикации заявки на патент США No. 2013/0123120, Заявке на патент США № 13/300235, поданной 18 ноября 2011 года, Публикации заявки на патент США № 2012/0270212 и в Предварительной заявке на патент США, регистрационный № 61/994791, поданной 16 мая 2014 года, документы полностью включены сюда посредством ссылки. При необходимости для мини-ПЦР можно использовать любой из этих способов.
[566] При необходимости стадия удлинения в ПЦР амплификации может быть ограничена с точки зрения времени, чтобы уменьшить амплификацию от фрагментов длиной более 200 нуклеотидов, 300 нуклеотидов, 400 нуклеотидов, 500 нуклеотидов или 1000 нуклеотидов. Это может привести к обогащению фрагментированной или более короткой ДНК (например, фетальной ДНК или ДНК из раковых клеток, подвергшихся апоптозу или некрозу) и улучшению результатов теста.
[567] В некоторых вариантах воплощения используется мультиплексная ПЦР. В некоторых вариантах воплощения способ амплификации целевых локусов в образце нуклеиновой кислоты включает (i) приведение образца нуклеиновой кислоты в контакт с библиотекой праймеров, которые одновременно гибридизируются по меньшей мере с 100; 200; 500; 750; 1000; 2000; 5000; 7500; 10,000; 20,000; 25000; 30,000; 40000; 50000; 75000; или 100000 различных целевых локусов для получения реакционной смеси; и (ii) воздействие на реакционную смесь условий реакции удлинения праймера (таких как условия ПЦР) для получения амплифицированных продуктов, которые включают целевые ампликоны. В некоторых вариантах воплощения амплифицируются по меньшей мере 50, 60, 70, 80, 90, 95, 96, 97, 98, 99 или 99,5% целевых локусов. В различных вариантах воплощения менее 60, 50, 40, 30, 20, 10, 5, 4, 3, 2, 1, 0,5, 0,25, 0,1 или 0,05% продуктов амплификации представляют собой димеры праймеров. В некоторых вариантах воплощения праймеры находятся в растворе (например, растворены в жидкой фазе, а не в твердой фазе). В некоторых вариантах воплощения праймеры находятся в растворе и не иммобилизованы на твердой подложке. В некоторых вариантах воплощения праймеры не являются частью микроматрицы. В некоторых вариантах воплощения праймеры не включают инвертируемые молекулярные зонды (MIP).
[568] В некоторых вариантах воплощения два или более (например, 3 или 4) целевых ампликона (таких, как ампликоны из раскрытого в данном документе способа мини-ПЦР) лигируют вместе, а затем лигированные продукты секвенируют. Объединение нескольких ампликонов в один продукт лигирования увеличивает эффективность последующего этапа секвенирования. В некоторых вариантах воплощения целевые ампликоны имеют длину менее 150, 100, 90, 75 или 50 пар оснований до лигирования. Селективное обогащение и/или амплификация может включать маркировку каждой отдельной молекулы различными метками, молекулярными штрих-кодами, метками для амплификации и/или метками для секвенирования. В некоторых вариантах воплощения амплифицированные продукты анализируются секвенированием (например, высокопроизводительным секвенированием) или гибридизацией с матрицей, такой как ОНП матрица, матрица ILLUMINA INFINIUM или генный чип AFFYMETRIX. В некоторых вариантах воплощения используется нанопоровое секвенирование, такое как технология нанопорового секвенирования, разработанная Genia (см., например, всемирную сеть по адресу geniachip.com/technology, документ полностью включен сюда посредством ссылки). В некоторых вариантах воплощения используется дуплексное секвенирование (Schmitt et al., “Detection of ultra-rare mutations by next-generation sequencing,” Proc Natl Acad Sci U S A. 109(36): 14508-14513, 2012, документ полностью включен сюда посредством ссылки). Такой подход значительно снижает количество ошибок за счет независимой маркировки и секвенирования каждой из двух цепей дуплекса ДНК. Поскольку две цепи комплементарны, истинные мутации обнаруживают в одном и том же положении в обеих цепях. Напротив, ошибки ПЦР или секвенирования приводят к мутациям только в одной цепи и, таким образом, могут быть исключены как техническая ошибка. В некоторых вариантах воплощения способ включает метку обеих цепей дуплексной ДНК случайной, но комплементарной двухцепочечной нуклеотидной последовательностью, называемой дуплексной меткой. Последовательности двухцепочечной метки включаются в стандартные адапторы для секвенирования, сначала вводя одноцепочечную рандомизированную нуклеотидную последовательность в одну цепь адаптора, а затем удлиняя противоположную цепь ДНК-полимеразой с получением комплементарной двухцепочечной метки. После лигирования меченых адапторов к разрезанной ДНК индивидуально меченые нити амплифицируются с помощью ПЦР из асимметричных праймерных сайтов на хвостах адаптора и подвергаются секвенированию спаренных концов. В некоторых вариантах воплощения образец (например, образец ДНК или РНК) делится на несколько фракций, например на разные лунки (например, лунки от WaferGenSmartChip). Разделение образца на разные фракции (например по меньшей мере на 5, 10, 20, 50, 75, 100, 150, 200 или 300 фракций) может повысить чувствительность анализа, поскольку в некоторых из лунок процент молекул с мутацией выше, чем в общем образце. В некоторых вариантах воплощения каждая фракция содержит менее 500, 400, 200, 100, 50, 20, 10, 5, 2 или 1 молекулу ДНК или РНК. В некоторых вариантах воплощения молекулы в каждой фракции секвенируются отдельно. В некоторых вариантах воплощения ко всем молекулам в одной и той же фракции добавляется один и тот же штрих-код (например, случайная последовательность или последовательность, не относящаяся к человеку) (например, путем амплификации с праймером, содержащим штрих-код, или путем лигирования штрих-кода), и к молекулам добавляются разные штрих-коды в разных фракциях. Молекулы со штрих-кодом можно объединять и секвенировать вместе. В некоторых вариантах воплощения молекулы амплифицируются перед объединением и секвенированием, например, с использованием вложенной ПЦР. В некоторых вариантах воплощения используются один прямой и два обратных праймера или два прямых и один обратный праймеры.
[569] В некоторых вариантах воплощения обнаруживается (или может быть обнаружена) мутация (например, ОНВ или ВЧК), которая присутствует менее чем в 10, 5, 2, 1, 0,5, 0,1, 0,05, 0,01 или 0,005% молекул ДНК или РНК в образце (например, в образце скДНК или скРНК). В некоторых вариантах воплощения обнаруживается (или может быть обнаружена) мутация (например, ОНВ или ВЧК), которая присутствует менее чем в 1000, 500, 100, 50, 20, 10, 5, 4, 3 или 2 исходных молекулах ДНК или РНК (до амплификации) в образце (таком, как образец скДНК или скРНК из, например, образца крови). В некоторых вариантах воплощения обнаруживается (или может быть обнаружена) мутация (например, ОНВ или ВЧК), которая присутствует только в 1 исходной молекуле ДНК или РНК (до амплификации) в образце (например, в образце скДНК или скРНК из, например, образца крови).
[570] Например, если предел обнаружения мутации (такой как однонуклеотидный вариант (ОНВ)) составляет 0,1%, мутацию, присутствующую в 0,01%, можно обнаружить, разделив фракцию на несколько фракций, таких как 100 лунок. В большинстве лунок копии мутации отсутствуют. Для нескольких лунок с мутацией мутация находится в гораздо более высоком проценте считываний. В одном примере имеется 20000 начальных копий ДНК из целевого локуса, и две из этих копий включают представляющий интерес ОНВ. Если образец разделен на 100 лунок, 98 лунок содержат ОНВ, а 2 лунки - 0,5%. ДНК в каждой лунке можно закодировать, амплифицировать, объединить с ДНК из других лунок и секвенировать. Лунки без ОНВ можно использовать для измерения частоты ошибок фоновой амплификации/секвенирования для того, чтобы определить, превышает ли сигнал из лунок с выпадающими значениями фоновый уровень шума.
[571] В некоторых вариантах воплощения амплифицированные продукты обнаруживают с использованием матрицы, такой как матрица, в частности микроматрица с зондами для одной или более представляющих интерес хромосом (например, хромосомы 13, 18, 21, X, Y или любой их комбинации). Понятно, например, что можно использовать коммерчески доступные микрочипы для обнаружения ОНП, такие как, например, анализ генотипирования Illumina (San Diego, CA) GoldenGate, DASL, Infinium или CytoОНП-12, или продукт для обнаружения ОНП от Affymetrix, например, микрочип OncoScan.
[572] В некоторых вариантах воплощения, включающих секвенирование, глубина считывания представляет собой количество считываний секвенирования, которые соответствуют заданному локусу. Глубина считываний может быть нормализована по общему количеству считываний. В некоторых вариантах воплощения для глубины считывания образца глубина считывания - это средняя глубина считывания по целевым локусам. В некоторых вариантах воплощения для глубины считывания локуса глубина считывания представляет собой количество считываний, измеренное путем картирования секвенатором этого локуса. В целом, чем больше глубина считывания локуса, тем ближе соотношение аллелей в локусе к соотношению аллелей в исходном образце ДНК. Глубину считывания можно выразить множеством различных способов, включая, помимо прочего, процент или пропорцию. Так, например, в высокопараллельном секвенаторе ДНК, таком как Illumina HISEQ, который, например, производит последовательность из 1 миллиона клонов, секвенирование одного локуса 3000 раз приводит к глубине считывания 3000 считываний в этом локусе. Пропорция считываний в этом локусе равна 3000, деленным на 1 миллион общего количества считываний, или 0,3% общего количества считываний.
[573] В некоторых вариантах воплощения получают аллельные данные, при этом аллельные данные включают количественные измерения, показывающие количество копий определенного аллеля полиморфного локуса. В некоторых вариантах воплощения аллельные данные включают количественные измерения, показывающие количество копий каждого из аллелей, наблюдаемых в полиморфном локусе. Как правило, количественные измерения получают для всех возможных аллелей представляющего интерес полиморфного локуса. Например, любой из способов, представленных в предыдущих параграфах для определения аллеля для локуса ОНП или ОНВ, такой как, например, микроматрицы, кПЦР, секвенирование ДНК, такое как высокопроизводительное секвенирование ДНК, можно использовать для генерации количественных измерений количества копий определенного аллеля полиморфного локуса. Это количественное измерение называется в данном документе данными частоты аллелей или данными измеренных генетических аллелей. Способы, использующие аллельные данные, иногда называют количественными аллельными способами; это отличается от количественных способов, которые используют исключительно количественные данные из неполиморфных локусов или из полиморфных локусов, но без учета аллельной идентичности. Когда аллельные данные измеряются с использованием высокопроизводительного секвенирования, аллельные данные обычно включают количество считываний каждого аллеля, картируемого на представляющем интерес локусе.
[574] В некоторых вариантах воплощения получают неаллельные данные, причем неаллельные данные включают количественные измерения, показывающие количество копий конкретного локуса. Локус может быть полиморфным или неполиморфным. В некоторых вариантах воплощения, когда локус не является полиморфным, неаллельные данные не содержат информации об относительном или абсолютном количестве отдельных аллелей, которые могут присутствовать в этом локусе. Способы, использующие только неаллельные данные (то есть количественные данные по неполиморфным аллелям или количественные данные по полиморфным локусам, но без учета аллельной идентичности каждого фрагмента), называются количественными способами. Как правило, количественные измерения получают для всех возможных аллелей интересующего полиморфного локуса, при этом одно значение связано с измеренной величиной для всех аллелей в этом локусе в целом. Неаллельные данные для полиморфного локуса могут быть получены путем суммирования количественного показателя аллеля для каждого аллеля в этом локусе. Когда аллельные данные измеряются с использованием высокопроизводительного секвенирования, неаллельные данные обычно включают количество считываний картирования на интересующий локус. Измерения секвенирования могут указывать относительное и/или абсолютное количество каждого из аллелей, присутствующих в локусе, а неаллельные данные включают сумму считываний, картируемых на локус, независимо от аллельной идентичности. В некоторых вариантах воплощения для получения как аллельных, так и неаллельных данных может использоваться один и тот же набор измерений секвенирования. В некоторых вариантах воплощения аллельные данные используются как часть способа для определения количества копий на интересующей хромосоме, а полученные неаллельные данные могут использоваться как часть другого способа для определения количества копий на интересующей хромосоме. В некоторых вариантах воплощения два способа статистически ортогональны и объединяются, чтобы дать более точное определение числа копий на представляющей интерес хромосоме.
[575] В некоторых вариантах воплощения получение генетических данных включает (i) получение информации о последовательности ДНК с помощью лабораторных способов, например, с использованием автоматизированного высокопроизводительного секвенатора ДНК, или (ii) получение информации, которая была ранее получена лабораторными способами, при этом информация передается в электронном виде, например, с помощью компьютера через Интернет или электронной передачи с устройства секвенирования.
[576] Дополнительные примерные способы подготовки образцов, амплификации и количественного определения описаны в заявке на патент США № 13/683604, поданной 21 ноября 2012 года (Публикация заявки на патент США № 2013/0123120 и Предварительная заявка на патент США, регистрационный № 61/994791, поданные 16 мая 2014 года, которые полностью включены сюда посредством ссылки). Эти способы могут быть использованы для анализа любых образцов, раскрытых в данном документе.
[577] Примерные способы количественного определения свободно-клеточной ДНК
[578] При необходимости это количество или концентрацию скДНК или скРНК можно измерить стандартными способами. В некоторых вариантах воплощения определяется количество или концентрация свободно-клеточной митохондриальной ДНК (скмДНК). В некоторых вариантах воплощения определяется количество или концентрация свободно-клеточной ДНК, происходящей от ядерной ДНК (скяДНК). В некоторых вариантах воплощения количество или концентрация скмДНК и скяДНК определяются одновременно.
[579] В некоторых вариантах воплощения для измерения скяДНК и/или скмДНК используется кПЦР (Kohler et al. “Levels of plasma circulating cell free nuclear and mitochondrial DNA as potential biomarkers for breast tumors.” Mol Cancer 8:105, 2009, 8:doi:10.1186/1476-4598-8-105, документ полностью включен сюда посредством ссылки). Например, с помощью мультиплексной кПЦР могут быть измерены один или более локусов из скяДНК (таких как глицеральдегид-3-фосфат-дегидрогеназа, GAPDH) и один или более локусов из скмДНК (АТФаза 8, MTATP 8). В некоторых вариантах воплощения для измерения скяДНК и/или скмДНК используется ПЦР с флуоресцентной меткой (Schwarzenbach et al., “Evaluation of cell-free tumour DNA and RNA in patients with breast cancer and benign breast disease.” Mol Biosys 7:2848-2854, 2011, документ полностью включен сюда посредством ссылки). При необходимости, распределение нормальности данных можно определить с помощью стандартных способов, таких как критерий Шапиро-Уилка. При необходимости уровни скяДНК и мДНК можно сравнивать с помощью стандартных способов, таких как U-тест Манна-Уитни. В некоторых вариантах воплощения уровни скяДНК и/или мДНК сравнивают с другими установленными прогностическими факторами с использованием стандартных способов, таких как U-тест Манна-Уитни или тест Краскела-Уоллиса.
[580] Примерные способы амплификации, количественного определения и анализа РНК
[581] Для амплификации и необязательно количественной оценки РНК может быть использован любой из следующих типичных способов, таких как скРНК, клеточная РНК, цитоплазматическая РНК, кодирующая цитоплазматическая РНК, некодирующая цитоплазматическая РНК, мРНК, миРНК, митохондриальная РНК, рРНК, или тРНК. В некоторых вариантах воплощения миРНК представляет собой любую из молекул миРНК, перечисленных в базе данных miRBase, доступной во всемирной паутине по адресу mirbase.org, документ полностью включен сюда посредством ссылки. Примерные молекулы миРНК включают miR-509; miR-21 и miR-146a.
[582] В некоторых вариантах воплощения для амплификации РНК используется зависимая от мультиплексного лигирования амплификация зонда с обратной транскриптазой (reverse-transcriptase multiplex ligation-dependent probe amplification - RT-MLPA). В некоторых вариантах воплощения каждый набор гибридизирующих зондов состоит из двух коротких синтетических олигонуклеотидов, охватывающих ОНП, и одного длинного олигонуклеотида (Li et al., Arch Gynecol Obstet. “Development of noninvasive prenatal diagnosis of trisomy 21 by RT-MLPA with a new set of SNP markers,” July 5, 2013, DOI 10.1007/s00404-013-2926-5;. Schouten et al. “Relative quantification of 40 nucleic acid sequences by multiplex ligation-dependent probe amplification.” Nucleic Acids Res 30:e57, 2002; Deng et al. (2011) “Non-invasive prenatal diagnosis of trisomy 21 by reverse transcriptase multiplex ligation-dependent probe amplification,” Clin, Chem. Lab Med. 49:641-646, 2011, каждый из этих документов полностью включен сюда посредством ссылки).
[583] В некоторых вариантах воплощения РНК амплифицируют с помощью ПЦР с обратной транскриптазой. В некоторых вариантах воплощения РНК амплифицируется с помощью ПЦР с обратной транскриптазой в реальном времени, такой как одностадийная ПЦР с обратной транскриптазой в реальном времени с SYBR GREEN I, как описано ранее. (Li et al., Arch Gynecol Obstet. “Development of noninvasive prenatal diagnosis of trisomy 21 by RT-MLPA with a new set of SNP markers,” July 5, 2013, DOI 10.1007/s00404-013-2926-5; Lo et al., “Plasma placental RNA allelic ratio permits noninvasive prenatal chromosomal aneuploidy detection,” Nat Med 13:218-223, 2007; Tsui et al., Systematic micro-array based identification of placental mRNA in maternal plasma: towards non-invasive prenatal gene expression profiling. J Med Genet 41:461-467, 2004; Gu et al., J. Neurochem. 122:641-649, 2012, каждый из этих документов полностью включен сюда посредством ссылки).
[584] В некоторых вариантах воплощения для обнаружения РНК используется микрочип. Например, микрочип миРНК человека от Agilent Technologies может использоваться в соответствии с протоколом производителя. Вкратце, выделенная РНК дефосфорилируется и лигируется с pCp-Cy3. Меченая РНК очищается и гибридизируется с матрицами миРНК, содержащими зонды для зрелых миРНК человека, на основе высвобождения miRBase 14.0 по Сэнгеру. Матрицы промываются и сканируются с помощью сканера микрочипов (G2565BA, Agilent Technologies). Интенсивность каждого сигнала гибридизации оценивается с помощью программного обеспечения для экстракции Agilent v9.5.3. Мечение, гибридизацию и сканирование можно проводить в соответствии с протоколами микроматрицы Agilent для системы микрочипов (Gu et al., J. Neurochem. 122:641-649, 2012, документ полностью включен сюда посредством ссылки).
[585] В некоторых вариантах воплощения для обнаружения РНК используется тест TaqMan. Примерным тестом является панель TaqMan Array Human MicroRNA v1.0 (Early Access) (Applied Biosystems), которая содержит тесты 157 TaqMan MicroRNA Assays, включая соответствующие праймеры обратной транскрипции, праймеры ПЦР и зонд TaqMan (Chim et al., “Detection and characterization of placental microRNAs in maternal plasma,” Clin Chem. 54(3):482-90, 2008, документ полностью включен сюда посредством ссылки).
[586] При необходимости, может быть определен паттерн сплайсинга мРНК для одной или более мРНК с использованием стандартных способов (Fackenthal1 and Godley, Disease Models & Mechanisms 1: 37-42, 2008, doi:10.1242/dmm.000331, документ полностью включен сюда посредством ссылки). Например, для обнаружения вариантов сплайсинга мРНК могут быть использованы микрочипы высокой плотности и/или высокопроизводительное секвенирование ДНК.
[587] В некоторых вариантах воплощения для измерения транскриптома используется дробное секвенирование всего транскриптома или матрица.
[588] Примерные способы амплификации
[589] Также были разработаны усовершенствованные способы амплификации ПЦР, которые минимизируют или предотвращают интерференцию из-за амплификации находящихся поблизости или примыкающих целевых локусов в том же реакционном объеме (например, часть реакции мультиплексной ПЦР образца, которая одновременно амплифицирует все целевые локусы). Эти способы можно использовать для одновременной амплификации находящихся поблизости или примыкающих целевых локусов, что быстрее и дешевле, чем необходимость разделять находящиеся поблизости целевые локусы на разные реакционные объемы, чтобы их можно было амплифицировать отдельно для избегания интерференции.
[590] В некоторых вариантах воплощения амплификацию целевых локусов проводят с использованием полимеразы (например, ДНК-полимеразы, РНК-полимеразы или обратной транскриптазы) с низкой 5´→3´ экзонуклеазной активностью и/или низкой активностью смещения цепи. В некоторых вариантах воплощения низкий уровень экзонуклеазы 5´→3´ снижает или предотвращает деградацию ближайшего праймера (например, неудлиненного праймера или праймера, к которому был добавлен один или более нуклеотидов во время удлинения праймера). В некоторых вариантах воплощения низкий уровень активности смещения цепи снижает или предотвращает смещение ближайшего праймера (например, неудлиненный праймер или праймер, к которому был добавлен один или более нуклеотидов во время удлинения праймера). В некоторых вариантах воплощения амплифицируются целевые локусы, которые находятся рядом друг с другом (например, между целевыми локусами нет оснований) или поблизости (например, локусы находятся в пределах 50, 40, 30, 20, 15, 10, 9, 8, 7, 6, 5, 4, 3, 2 или 1 основания). В некоторых вариантах воплощения 3´-конец одного локуса находится в пределах 50, 40, 30, 20, 15, 10, 9, 8, 7, 6, 5, 4, 3, 2 или 1 основания от 5´-конца следующего локуса, располагающегося далее.
[591] В некоторых вариантах воплощения амплифицируются по меньшей мере 100, 200, 500, 750, 1000; 2000; 5000; 7500; 10000; 20000; 25000; 30000; 40000; 50000; 75000; или 100000 различных целевых локусов, например, путем одновременной амплификации в одном реакционном объеме. В некоторых вариантах воплощения, по меньшей мере, 50, 60, 70, 80, 90, 95, 96, 97, 98, 99 или 99,5% амплифицированных продуктов являются целевыми ампликонами. В различных вариантах воплощения количество амплифицированных продуктов, которые являются целевыми ампликонами, составляет от 50 до 99,5%, например, от 60 до 99%, от 70 до 98%, от 80 до 98%, от 90 до 99,5% или от 95 до 99,5% включительно. В некоторых вариантах воплощения по меньшей мере 50, 60, 70, 80, 90, 95, 96, 97, 98, 99 или 99,5% целевых локусов амплифицируются (например, амплифицируются по меньшей мере 5, 10, 20, 30, 50 или 100-кратно по сравнению с количеством до амплификации), например, путем одновременной амплификации в одном реакционном объеме. В различных вариантах воплощения количество целевых локусов, которые амплифицируются (например, амплифицируются по меньшей мере 5, 10, 20, 30, 50 или 100-кратно по сравнению с количеством до амплификации) составляет от 50 до 99,5%, например, от 60 до 99%, от 70 до 98%, от 80 до 99%, от 90 до 99,5%, от 95 до 99,9% или от 98 до 99,99% включительно. В некоторых вариантах воплощения продуцируется меньшее количество нецелевых ампликонов, например меньшее количество ампликонов, образованных из прямого праймера из первой пары праймеров и обратного праймера из второй пары праймеров. Такие нежелательные нецелевые ампликоны могут быть получены с использованием предшествующих способов амплификации, если, например, обратный праймер из первой пары праймеров и/или прямой праймер из второй пары праймеров разрушены и/или замещены.
[592] В некоторых вариантах воплощения эти способы позволяют использовать более длительное время удлинения, поскольку полимераза, связанная с удлиняемым праймером, с меньшей вероятностью разрушит и/или вытеснит соседний праймер (такой как следующий нижестоящий праймер) при низкой концентрации экзонуклеазы 5´→3´ и/или низкой полимеразной активности замещения цепи. В различных вариантах воплощения условия реакции (такие как время удлинения и температура) используются таким образом, чтобы скорость удлинения полимеразой позволяла количеству нуклеотидов, добавляемых к удлиняемому праймеру, быть равным или превышающим 80, 90, 95, 100, 110, 120, 130, 140, 150, 175 или 200% от числа нуклеотидов между 3'-концом сайта связывания праймера и 5'-концом следующего нижестоящего сайта связывания праймера на той же цепи.
[593] В некоторых вариантах воплощения ДНК-полимераза используется для получения ампликонов ДНК с использованием ДНК в качестве матрицы. В некоторых вариантах воплощения используется РНК-полимераза для получения ампликонов РНК с использованием ДНК в качестве матрицы. В некоторых вариантах воплощения используется обратная транскриптаза для получения ампликонов кДНК с использованием РНК в качестве матрицы.
[594] В некоторых вариантах воплощения низкий уровень 5´→3´ экзонуклеазы полимеразы составляет менее 80, 70, 60, 50, 40, 30, 20, 10, 5, 1 или 0,1% активности такого же количества полимеразы Thermus aquaticus в таких же условиях (полимераза «Taq», которая представляет собой обычно используемую ДНК-полимеразу из термофильных бактерий, PDB 1BGX, EC 2.7.7.7, Murali et al., “Crystal structure of Taq DNA polymerase in complex with an inhibitory Fab: the Fab is directed against an intermediate in the helix-coil dynamics of the enzyme,” Proc. Natl. Acad. Sci. USA 95:12562-12567, 1998, документ полностью включен сюда посредством ссылки). В некоторых вариантах воплощения, низкий уровень полимеразной активности замещения цепи составляет менее, чем 80, 70, 60, 50, 40, 30, 20, 10, 5, 1 или 0,1% такого же количества полимеразы Tag в таких же условиях.
[595] В некоторых вариантах воплощения полимераза является ДНК-полимеразой полимеразой PUSHION, такой, как ДНК-полимераза PHUSION High Fidelity (M0530S, New England BioLabs, Inc.) или PHUSION Hot Start Flex (M0535S, New England BioLabs, Inc.; Frey and Suppman BioChemica. 2:34-35, 1995; Chester and Marshak Analytical Biochemistry. 209:284-290, 1993, каждый из этих документов полностью включен сюда посредством ссылки). ДНК-полимераза PHUSION является ферментом, подобным Pyrococcus, слитым с доменом, повышающим процессивность. ДНК-полимераза PHUSION обладает 5´→3´ полимеразной активностью и 3´→5´ экзонуклеазной активностью, и генерирует продукты с тупыми концами. ДНК-полимераза PHUSION лишена 5´→3´ экзонуклеазной активности и активности замещения цепей.
[596] В некоторых вариантах воплощения полимеразой является высокоточная ДНК-полимераза Q5®, такая, как Q5® High-Fidelity (M0491S, New England BioLabs, Inc.) или Q5® Hot Start High-Fidelity (M0493S, New England BioLabs, Inc.). ДНК-полимераза Q5® High-Fidelity является высокоточной, термостабильной ДНК-полимеразой с 3´→5´ экзонуклеазной активностью, слитой с усиливающим процессивность доменом Sso7d. ДНК-полимераза Q5® High-Fidelity лишена 5´→3´ экзонуклеазной активности и активности замещения цепей.
[597] В некоторых вариантах воплощения полимераза является T4 ДНК-полимеразой (M0203S, New England BioLabs, Inc.; Tabor and Struh. (1989). “DNA-Dependent DNA Polymerases,” In Ausebel et al. (Ed.), Current Protocols in Molecular Biology. 3.5.10-3.5.12. New York: John Wiley & Sons, Inc., 1989; Sambrook et al. Molecular Cloning: A Laboratory Manual. (2nd ed.), 5.44-5.47. Cold Spring Harbor: Cold Spring Harbor Laboratory Press, 1989, каждый из этих документов полностью включен сюда посредством ссылки). T4 ДНК-полимераза катализирует синтез ДНК в направлении 5´→3´ и требует наличия матрицы и праймера. Этот фермент обладает 3´→5´ экзонуклеазной активностью, которая намного более активна, чем та, которую имеет ДНК-полимераза I. T4 ДНК-полимераза лишена 5´→3´ экзонуклеазной активности и активности замещения цепей.
[598] В некоторых вариантах воплощения полимераза является ДНК-полимеразой IV Sulfolobus (M0327S, New England BioLabs, Inc.; (Boudsocq,.et al. (2001). Nucleic Acids Res., 29:4607-4616, 2001; McDonald, et al. (2006). Nucleic Acids Res., 34:1102-1111, 2006, каждый из этих документов полностью включен сюда посредством ссылки). ДНК-полимераза IV Sulfolobus является термостабильной ДНК-полимеразой Y-семейства для обхода повреждений, которая эффективно синтезирует ДНК через множество повреждений ДНК-матрицы (McDonald, J.P. et al. (2006). Nucleic Acids Res.,. 34, 1102-1111, документ полностью включен сюда посредством ссылки). ДНК-полимераза IV Sulfolobus лишена 5´→3´ экзонуклеазной активности и активности замещения цепей.
[599] В некоторых вариантах воплощения, если праймер связывает область с ОНП, праймер может связывать и амплифицировать разные аллели с разной эффективностью или может связывать и амплифицировать только один аллель. Для субъектов, которые являются гетерозиготными, один из аллелей не может быть амплифицирован праймером. В некоторых вариантах воплощения праймер разрабатывается для каждого аллеля. Например, если есть два аллеля (например, двух-аллельный ОНП), то можно использовать два праймера для связывания одного и того же местоположения целевого локуса (например, прямой праймер для связывания аллеля «A» и прямой праймер для связывания аллеля «B»). Для определения местоположения известных ОНП, таких как горячие точки ОНП с высокой степенью гетерозиготности, могут использоваться стандартные способы, такие как база данных dbОНП.
[600] В некоторых вариантах воплощения ампликоны одинаковы по размеру. В некоторых вариантах воплощения диапазон длины целевых ампликонов составляет менее 100, 75, 50, 25, 15, 10 или 5 нуклеотидов. В некоторых вариантах воплощения (таких, как амплификация целевых локусов во фрагментированной ДНК или РНК), длина целевых ампликонов составляет от 50 до 100 нуклеотидов, например, от 60 до 80 нуклеотидов, или от 60 до 75 нуклеотидов включительно. В некоторых вариантах воплощения (таких, как амплификация множества целевых локусов в экзоне или гене), длина целевых ампликонов составляет от 100 до 500 нуклеотидов, например, от 150 до 450 нуклеотидов, от 200 до 400 нуклеотидов, от 200 до 300 нуклеотидов или от 300 до 400 нуклеотидов включительно.
[601] В некоторых вариантах воплощения множество целевых локусов одновременно амплифицируются с использованием пары праймеров, которая включает прямой и обратный праймеры для каждого целевого локуса, амплифицируемого в данном реакционном объеме. В некоторых вариантах воплощения один цикл ПЦР выполняется с одним праймером для каждого целевого локуса, а затем второй цикл ПЦР выполняется с парой праймеров для каждого целевого локуса. Например, первый цикл ПЦР может быть выполнен с одним праймером для каждого целевого локуса, так что все праймеры связываются с одной и той же цепью (например, с использованием прямого праймера для каждого целевого локуса). Это позволяет ПЦР амплифицировать линейным образом и снижает или устраняет смещение амплификации между ампликонами из-за различий в последовательности или длине. В некоторых вариантах воплощения ампликоны затем амплифицируются с использованием прямого и обратного праймера для каждого целевого локуса.
[602] Примерные способы конструирования праймеров
[603] При необходимости мультиплексная ПЦР может выполняться с использованием праймеров с пониженной вероятностью образования димеров праймеров. В частности, высоко мультиплексная ПЦР часто может приводить к образованию очень высокой пропорции продукта ДНК, которая является результатом непродуктивных побочных реакций, таких как образование димера праймера. В одном из вариантов воплощения конкретные праймеры, которые с наибольшей вероятностью вызывают непродуктивные побочные реакции, могут быть удалены из библиотеки праймеров для того, чтобы получить библиотеку праймеров, которая приведет к увеличению пропорции амплифицированной ДНК, которая картируется в геном. Этап удаления проблемных праймеров, то есть тех праймеров, которые с большой вероятностью укрепляют димеры, неожиданно позволил получить чрезвычайно высокие уровни мультиплексирования ПЦР для последующего анализа путем секвенирования.
[604] Существует несколько способов выбора праймеров для библиотеки, в которых количество димера праймера, не отображающего картирование, или других вредных продуктов праймера сведено к минимуму. Эмпирические данные показывают, что небольшое количество «плохих» праймеров отвечает за большое количество побочных реакций димеров праймеров, не связанных с картированием. Удаление этих «плохих» праймеров может увеличить процент считываний последовательностей, которые картируются на целевые локусы. Один из способов идентифицировать «плохие» праймеры представляет собой оценку данных секвенирования ДНК, которая была амплифицирована с помощью целевой амплификации; те димеры праймеров, которые наблюдаются с наибольшей частотой, могут быть удалены, чтобы получить библиотеку праймеров, которая со значительно меньшей вероятностью приведет к образованию побочного продукта ДНК, который не картируется в геном .Кроме того, существуют общедоступные программы, которые могут подсчитать энергию свзывания различных праймерных комбинаций и удалить из них имеющие наивысший уровень энергии связывания, что позволит получить библиотеку праймеров, которая со значительно меньшей вероятностью приведет к образованию побочного продукта ДНК, который не картируется в геном.
[605] В некоторых вариантах воплощения для выбора праймеров создается начальная библиотека праймеров-кандидатов путем конструирования одного или более праймеров или пар праймеров для целевых локусов-кандидатов. Набор потенциальных целевых локусов (например, ОНП) может быть выбран на основе общедоступной информации о желаемых параметрах целевых локусов, таких как частота ОНП в целевой популяции или уровень гетерозиготности ОНП. В одном варианте воплощения праймеры для ПЦР могут быть созданы с использованием программы Primer3 (всемирная сеть по адресу primer3.sourceforge.net; libprimer3 выпуск 2.2.3, документ полностью включен сюда посредством ссылки). При необходимости, праймеры могут быть разработаны для отжига в конкретном диапазоне температур отжига, иметь конкретный диапазон содержания GC, иметь конкретный диапазон размеров, производить целевые ампликоны в конкретном диапазоне размеров и/или иметь другие характеристики параметров. Использование нескольких праймеров или пар праймеров для каждого целевого локуса-кандидата увеличивает вероятность того, что праймер или пара праймеров останутся в библиотеке для большинства или всех целевых локусов. В одном варианте воплощения критерии отбора могут требовать, чтобы в библиотеке оставалась по меньшей мере одна пара праймеров на каждый локус-мишень. Таким образом, большая часть или все целевые локусы будут амплифицированы при использовании последней библиотеки праймеров. Это желательно для таких применений, как скрининг на наличие делеций или дупликаций в большом количестве сайтов в геноме или скрининг на большое количество последовательностей (таких как полиморфизмы или другие мутации), связанных с заболеванием или повышенным риском заболевания. Если пара праймеров из библиотеки будет продуцировать целевой ампликон, который перекрывается с целевым ампликоном, продуцируемым другой парой праймеров, одна из пар праймеров может быть удалена из библиотеки для предотвращения интерференции.
[606] В некоторых вариантах воплощения «оценка нежелательности» (наивысшая оценка представляет наименьшую желательность) рассчитывается (например, расчет на компьютере) для большинства или всех возможных комбинаций двух праймеров из библиотеки праймеров-кандидатов. В различных вариантах воплощения оценка нежелательности рассчитана по меньшей мере для 80, 90, 95, 98, 99 или 99,5% возможных комбинаций праймеров-кандидатов в библиотеке. Каждая оценка нежелательности основана по меньшей мере частично на вероятности образования димера между двумя праймерами-кандидатами. При необходимости, оценка нежелательности может также основываться на одном или более других параметров, выбранных из группы, состоящей из степени гетерозиготности целевого локуса, распространенности заболевания, ассоциированного с последовательностью (например, полиморфизма) в целевом локусе, пенетрантности заболевания, связанной с последовательностью (например, полиморфизм) в целевом локусе, специфичности праймера-кандидата для целевого локуса, размера праймера-кандидата, температуры плавления целевого ампликона, содержания GC целевого ампликона, эффективности амплификации целевого ампликона, размера целевого ампликона и расстояния от центра горячей точки рекомбинации. В некоторых вариантах воплощения специфичность праймера-кандидата для целевого локуса включает вероятность того, что праймер-кандидат будет неспецифически функционировать путем связывания и амплификации локуса, отличного от целевого локуса, для амплификации которого он был разработан. В некоторых вариантах воплощения один или более или все праймеры-кандидаты, неспецифически функционирующие, удаляются из библиотеки. В некоторых вариантах воплощения для увеличения количества возможных выбираемых праймеров, праймеры-кандидаты, способные неспецифически функционировать, не удаляются из библиотеки. Если рассматривается несколько факторов, оценка нежелательности может быть вычислена на основе средневзвешенного значения различных параметров. Параметрам могут быть присвоены разные веса в зависимости от их важности для конкретного применения, для которого будут использоваться праймеры. В некоторых вариантах воплощения праймер с наивысшей оценкой нежелательности удаляется из библиотеки. Если удаленный праймер является членом пары праймеров, которая гибридизируется с одним целевым локусом, то другой член пары праймеров может быть удален из библиотеки. При желании процесс удаления праймера можно повторить. В некоторых вариантах воплощения способ отбора выполняется до тех пор, пока все показатели нежелательности для комбинаций праймеров-кандидатов, оставшихся в библиотеке, не станут равными или ниже минимального порога. В некоторых вариантах воплощения способ отбора выполняется до тех пор, пока количество праймеров-кандидатов, оставшихся в библиотеке, не уменьшится до желаемого количества.
[607] В различных вариантах воплощения после подсчета баллов нежелательности праймер-кандидат, который является частью наибольшего числа комбинаций двух праймеров-кандидатов с оценкой нежелательности выше первого минимального порога, удаляется из библиотеки. На этом этапе взаимодействия, равные или ниже первого минимального порога, игнорируются, поскольку эти взаимодействия менее значимы. Если удаленный праймер является членом пары праймеров, которая гибридизируется с одним целевым локусом, то другой член пары праймеров может быть удален из библиотеки. При желании процесс удаления праймера можно повторить. В некоторых вариантах воплощения способ отбора выполняется до тех пор, пока все оценки нежелательности для комбинаций праймеров-кандидатов, оставшихся в библиотеке, не станут равными или ниже первого минимального порога. Если количество праймеров-кандидатов, остающихся в библиотеке, превышает желаемое, количество праймеров можно уменьшить, уменьшив первый минимальный порог до более низкого второго минимального порога и повторив процесс удаления праймеров. Если количество праймеров-кандидатов, остающихся в библиотеке, меньше желаемого, способ можно продолжить, увеличив первый минимальный порог до более высокого второго минимального порога и повторив процесс удаления праймеров с использованием исходной библиотеки праймеров-кандидатов, тем самым позволив большему количеству праймеров-кандидатов остаться в библиотеке. В некоторых вариантах воплощения данный способ отбора выполняется до тех пор, пока все баллы нежелательности для комбинаций праймеров-кандидатов, оставшихся в библиотеке, не станут равными или ниже второго минимального порога, или пока количество возможных праймеров, оставшихся в библиотеке, не уменьшится до желаемого числа.
[608] При необходимости, пары праймеров, которые продуцируют целевой ампликон, который перекрывается с целевым ампликоном, продуцируемым другой парой праймеров, можно разделить на отдельные реакции амплификации. Множественные реакции амплификации ПЦР могут быть желательны для применений, в которых желательно анализировать все целевые локусы - кандидаты (вместо исключения целевых локусов - кандидатов из анализа из-за перекрытия целевых ампликонов).
[609] Эти способы отбора минимизируют количество праймеров-кандидатов, которые необходимо удалить из библиотеки для достижения желаемого снижения димеров праймеров. Удалив меньшее количество праймеров-кандидатов из библиотеки, можно амплифицировать большее количество (или все) целевых локусов с использованием полученной библиотеки праймеров.
[610] Мультиплексирование большого количества праймеров налагает значительные ограничения на тесты, которые могут быть включены. Непреднамеренно взаимодействующие тесты приводят к ложным продуктам амплификации. Ограничения размера в миниПЦР могут привести к дополнительным ограничениям. В одном из вариантов воплощения можно начать с очень большого количества потенциальных мишеней ОНВ (от, приблизительно, 500 до более 1 миллиона) и попытаться создать праймеры для амплификации каждого ОНП. Там, где можно сконструировать праймеры, можно попытаться идентифицировать пары праймеров, которые могут образовывать ложные продукты, путем оценки вероятности образования ложного дуплекса праймера между всеми возможными парами праймеров с использованием опубликованных термодинамических параметров образования дуплекса ДНК. Взаимодействия праймеров можно ранжировать с помощью функции оценки, связанной с взаимодействием, и праймеры с наихудшими оценками взаимодействия удаляются до тех пор, пока не будет достигнуто необходимое количество праймеров. В случаях, когда наиболее полезные ОНП вероятно могут быть гетерозиготными, можно также ранжировать список тестов и выбрать наиболее совместимые с гетерозиготностью тесты. Эксперименты подтвердили, что праймеры с высокими показателями взаимодействия с наибольшей вероятностью образуют димеры праймеров. При высоком мультиплексировании невозможно устранить все ложные взаимодействия, но важно удалить праймеры или пары праймеров с наивысшими показателями взаимодействия in silico, поскольку они могут доминировать во всей реакции, что значительно ограничивает амплификацию от достижения намеченных целей. Мы выполняли эту процедуру для создания мультиплексных наборов праймеров до 10000 праймеров, а в некоторых случаях, более 10000 праймеров. Усовершенствование, связанное с этой процедурой, является значительным, позволяя проводить амплификацию более чем 80%, более чем 90%, более чем 95%, более чем 98% и даже более чем 99% целевых продуктов, как определено путем секвенирования всех продуктов ПЦР, по сравнению с 10% при реакции, в которой не были удалены худшие праймеры. В сочетании с частичным полувложенным подходом, как описано ранее, более 90% и даже более 95% ампликонов могут картироваться на целевых последовательностях.
[611] Обращаем внимание на то, что существуют другие способы определения того, какие ПЦР-зонды могут образовывать димеры. В одном из вариантов воплощения анализ пула ДНК, который был амплифицирован с использованием неоптимизированного набора праймеров, может быть достаточен, чтобы определить проблемные праймеры. Например, анализ может быть проведен с использованием секвенирования, и те димеры, которые присутствуют в наибольшем количестве, определяются как те, которые с наибольшей вероятностью образуют димеры, и могут быть удалены. В одном из вариантов воплощения способ конструирования праймеров можно использовать в сочетании со способом мини-ПЦР, представленным в данном документе.
[612] Использование меток на праймерах может снизить амплификацию и секвенирование димерных продуктов праймеров. В некоторых вариантах воплощения праймер содержит внутреннюю область, которая образует петлевую структуру с меткой. В конкретных вариантах воплощения праймеры включают 5'-область, которая специфична для целевого локуса, внутреннюю область, которая не является специфичной для целевого локуса и образует петлевую структуру, и 3'-область, которая специфична для целевого локуса. В некоторых вариантах воплощения область петли может находиться между двумя областями связывания, причем две области связывания предназначены для связывания со смежными или соседними областями матричной ДНК. В различных вариантах воплощения длина 3'-области составляет по меньшей мере 7 нуклеотидов. В некоторых вариантах воплощения длина 3'-области составляет от 7 до 20 нуклеотидов, например, от 7 до 15 нуклеотидов, или от 7 до 10 нуклеотидов включительно. В различных вариантах воплощения праймеры включают 5'-область, которая не является специфичной для целевого локуса (например, метку или универсальный сайт связывания праймера), за которой следует область, которая является специфичной для целевого локуса, внутреннюю область, которая не является специфичной для целевого локуса и образует петлевую структуру, и 3'-область, специфичную для целевого локуса. Меченные праймеры можно использовать для сокращения необходимых целевых специфичных последовательностей до менее 20, менее 15, менее 12 и даже менее 10 пар оснований. Это может явиться случайностью со стандартной конструкцией праймера, когда целевая последовательность фрагментирована в пределах сайта связывания праймера, или она может быть сконструирована в конструкции праймера. Преимущества этого способа включают следующее: он увеличивает количество тестов, которые могут быть разработаны для определенной максимальной длины ампликона, и он сокращает «неинформативное» секвенирование последовательности праймера. Его также можно использовать в сочетании с внутренним тегированием.
[613] В варианте воплощения относительное количество непродуктивных продуктов в мультиплексной целевой ПЦР-амплификации может быть уменьшено путем повышения температуры отжига. В случаях, когда амплифицируются библиотеки с той же меткой, что и специфичные для мишени праймеры, температуру отжига можно повысить по сравнению с геномной ДНК, поскольку метки будут способствовать связыванию праймера. В некоторых вариантах воплощения используются пониженные концентрации праймера, необязательно вместе с более длительным временем отжига. В некоторых вариантах воплощения время отжига может быть более 3 минут, более 5 минут, более 8 минут, более 10 минут, более 15 минут, более 20 минут, более 30 минут, более 60 минут, более 120 минут, более 240 минут, более 480 минут и даже более 960 минут. В определенных иллюстративных вариантах воплощения используется более длительное время отжига при пониженной концентрации праймеров. В различных вариантах воплощения используются более длительные, чем обычно, времена удлинения, например, более 3, 5, 8, 10 или 15 минут. В некоторых вариантах воплощения концентрации праймера составляют всего 50 нМ, 20 нМ, 10 нМ, 5 нМ, 1 нМ и менее 1 нМ. Это неожиданно приводит к надежной работе для высоко мультиплексированных реакций, например 1000-плексированных реакций, 2000-плексированных реакций, 5000-плексированных реакций, 10000-плексированных реакций, 20000-плексированных реакций, 50000-плексированных реакций и даже 100000-плексированных реакций. В варианте воплощения при амплификации используются один, два, три, четыре или пять циклов с длительным временем отжига, за которыми следуют циклы ПЦР с более обычным временем отжига с мечеными праймерами.
[614] Чтобы выбрать целевые местоположения, можно начать с пула дизайнов пар праймеров-кандидатов и создать термодинамическую модель потенциально неблагоприятных взаимодействий между парами праймеров, а затем использовать модель для исключения дизайнов, несовместимых с другими дизайнами в пуле.
[615] В варианте воплощения изобретение относится к способу уменьшения количества локусов-мишеней (таких как локусы, которые могут содержать полиморфизм или мутации, связанные с заболеванием или расстройством, или повышенным риском заболевания или расстройства, такого как рак) и/или усиления тяжести обнаруженного заболевания (например, увеличение количества обнаруженных полиморфизмов или мутаций). В некоторых вариантах воплощения способ включает ранжирование (например, ранжирование от наивысшего к низшему) локусов по частоте или повторению полиморфизма или мутации (например, вариации, вставки или делеции одного нуклеотида или любых других вариаций, представленных в данном документе) в каждом локусе среди субъектов с заболеванием или расстройством, таким как рак. В некоторых вариантах воплощения праймеры для ПЦР предназначены для некоторых или всех локусов. Во время выбора праймеров ПЦР для библиотеки праймеров праймеры для локусов, которые имеют более высокую частоту или повторение (локусы более высокого ранга), предпочтительнее, чем праймеры с более низкой частотой или повторением (локусы более низкого ранга). В некоторых вариантах воплощения этот параметр включен как один из параметров при вычислении представленных в данном документе баллов нежелательности. При необходимости, праймеры (например, праймеры для локусов высокого ранга), несовместимые с другими дизайнами в библиотеке, могут быть включены в другую библиотеку/пул ПЦР. В некоторых вариантах воплощения в отдельных реакциях ПЦР используются несколько библиотек/пулов (например, 2, 3, 4, 5 или более), чтобы обеспечить амплификацию всех (или большинства) локусов, представленных всеми библиотеками/пулами. В некоторых вариантах воплощения этот способ продолжается до тех пор, пока в одну или ,более библиотек/пулов не будет включено достаточное количество праймеров, так что праймеры в совокупности позволят охватить желаемую нагрузку заболеванием для заболевания или расстройства (например, таким образом, как путем обнаружения по меньшей мере 80, 85, 90, 95 или 99% нагрузки заболеванием).
[616] Примерные библиотеки праймеров
[617] В одном аспекте изобретение включает библиотеки праймеров, таких как праймеры, выбранные из библиотеки праймеров-кандидатов с использованием любого из способов по изобретению. В некоторых вариантах воплощения библиотека включает праймеры, которые одновременно гибридизируются (или способны одновременно гибридизоваться) с или которые одновременно амплифицируют (или способны одновременно амплифицировать) по меньшей мере 100; 200; 500; 750; 1000; 2000; 5000; 7500; 10000; 20000; 25000; 30000; 40000; 50000; 75000; или 100000 различных целевых локусов в одном реакционном объеме. В различных вариантах воплощения библиотека включает праймеры, которые одновременно амплифицируют (или способны одновременно амплифицировать) от 100 до 500; от 500 до 1000; от 1000 до 2000; от 2000 до 5000; от 5000 до 7500; от 7 500 до 10000; от 10000 до 20000; от 20000 до 25000; от 25000 до 30000; от 30000 до 40000; от 40000 до 50000; от 50000 до 75000; или от 75000 до 100000 различных целевых локусов в одном реакционном объеме включительно. В различных вариантах воплощения библиотека включает праймеры, которые одновременно амплифицируют (или способны одновременно амплифицировать) от 1000 до 100000 различных целевых локусов в одном реакционном объеме, например от 1000 до 50000; от 1000 до 30000; от 1000 до 20000; от 1000 до 10000; от 2000 до 30000; от 2000 до 20000; от 2000 до 10000; от 5000 до 30000; от 5000 до 20000; или от 5000 до 10000 различных целевых локусов включительно. В некоторых вариантах воплощения библиотека включает праймеры, которые одновременно амплифицируют (или способны одновременно амплифицировать) целевые локусы в одном реакционном объеме, так что менее 60, 40, 30, 20, 10, 5, 4, 3, 2, 1, 0,5, 0,25, 0,1 или 0,5% амплифицированных продуктов представляют собой димеры праймеров. В различных вариантах воплощения количество амплифицированных продуктов, которые являются димерами праймеров, составляет от 0,5 до 60%, например от 0,1 до 40%, от 0,1 до 20%, от 0,25 до 20%, от 0,25 до 10%, от 0,5 до 20%, от 0,5 до 10%, от 1 до 20% или от 1 до 10% включительно. В некоторых вариантах воплощения праймеры одновременно амплифицируют (или способны одновременно амплифицировать) целевые локусы в одном реакционном объеме, так что по меньшей мере 50, 60, 70, 80, 90, 95, 96, 97, 98, 99 или 99,5% амплифицированных продуктов являются целевыми ампликонами. В различных вариантах воплощения количество амплифицированных продуктов, которые являются целевыми ампликонами, составляет от 50 до 99,5%, например, от 60 до 99%, от 70 до 98%, от 80 до 98%, от 90 до 99,5% или от 95 до 99,5% включительно. В некоторых вариантах воплощения праймеры одновременно амплифицируют (или способны одновременно амплифицировать) целевые локусы в одном реакционном объеме, так что по меньшей мере 50, 60, 70, 80, 90, 95, 96, 97, 98, 99 или 99,5% целевых локусов амплифицируются (например, амплифицируются по меньшей мере в 5, 10, 20, 30, 50 или 100 раз по сравнению с количеством до амплификации). В различных вариантах воплощения количество целевых локусов, которые амплифицируются (например, амплифицируются по меньшей мере в 5, 10, 20, 30, 50 или 100 раз по сравнению с количеством до амплификации) составляет от 50 до 99,5%, например, от 60 до 99%, от 70 до 98%, от 80 до 99%, от 90 до 99,5%, от 95 до 99,9% или от 98 до 99,99% включительно. В некоторых вариантах воплощения библиотека праймеров включает по меньшей мере 100; 200; 500; 750; 1000; 2000; 5000; 7500; 10000; 20,000; 25000; 30000; 40000; 50000; 75000; или 100000 пар праймеров, где каждая пара праймеров включает прямой тестовый праймер и обратный тестовый праймер, где каждая пара тестовых праймеров гибридизируется с целевым локусом. В некоторых вариантах воплощения библиотека праймеров включает по меньшей мере 100; 200; 500; 750; 1000; 2000; 5000; 7500; 10000; 20000; 25000; 30000; 40000; 50000; 75000; или 100000 индивидуальных праймеров, каждый из которых гибридизируется с различным целевым локусом, при этом отдельные праймеры не являются частью пар праймеров.
[618] В различных вариантах воплощения концентрация каждого праймера меньше 100, 75, 50, 25, 20, 10, 5, 2 или 1 нМ, или меньше 500, 100, 10 или 1 мкМ. В различных вариантах воплощения концентрация каждого праймера составляет от 1 мкМ до 100 нМ, например, от 1 мкМ до 1 нМ, от 1 до 75 нМ, от 2 до 50 нМ или от 5 до 50 нМ включительно. В различных вариантах воплощения содержание GC в праймерах составляет от 30 до 80%, например от 40 до 70% или от 50 до 60% включительно. В некоторых вариантах воплощения диапазон содержания GC в праймерах составляет менее 30, 20, 10 или 5%. В некоторых вариантах воплощения диапазон содержания GC в праймерах составляет от 5 до 30%, например от 5 до 20% или от 5 до 10% включительно. В некоторых вариантах воплощения температура плавления (Tm) тестовых праймеров составляет от 40 до 80 °C, например от 50 до 70 °C, от 55 до 65 °C или от 57 до 60,5 °C включительно. В некоторых вариантах воплощения Tm рассчитывается с помощью программы Primer3 (libprimer3, выпуск 2.2.3) с использованием встроенных параметров SantaLucia (веб-адрес: primer3.sourceforge.net). В некоторых вариантах воплощения диапазон температур плавления праймеров менее 15, 10, 5, 3 или 1 °C. В некоторых вариантах воплощения диапазон температур плавления праймеров составляет от 1 до 15 °C, например от 1 до 10 °C, от 1 до 5 °C или от 1 до 3 °C включительно. В некоторых вариантах воплощения длина праймеров составляет от 15 до 100 нуклеотидов, например от 15 до 75 нуклеотидов, от 15 до 40 нуклеотидов, от 17 до 35 нуклеотидов, от 18 до 30 нуклеотидов или от 20 до 65 нуклеотидов включительно. В некоторых вариантах воплощения диапазон длины праймеров составляет менее 50, 40, 30, 20, 10 или 5 нуклеотидов. В некоторых вариантах воплощения диапазон длины праймеров составляет от 5 до 50 нуклеотидов, например от 5 до 40 нуклеотидов, от 5 до 20 нуклеотидов или от 5 до 10 нуклеотидов включительно. В некоторых вариантах воплощения длина целевых ампликонов составляет от 50 до 100 нуклеотидов, например, от 60 до 80 нуклеотидов или от 60 до 75 нуклеотидов включительно. В некоторых вариантах воплощения диапазон длины целевых ампликонов менее 50, 25, 15, 10 или 5 нуклеотидов. В некоторых вариантах воплощения диапазон длины целевых ампликонов составляет от 5 до 50 нуклеотидов, например от 5 до 25 нуклеотидов, от 5 до 15 нуклеотидов или от 5 до 10 нуклеотидов включительно. В некоторых вариантах воплощения библиотека не содержит микрочипа. В некоторых вариантах воплощения библиотека включает микрочип.
[619] В некоторых вариантах воплощения некоторые (например по меньшей мере 80, 90 или 95%) или все адапторы или праймеры включают одну или более связей между соседними нуклеотидами, кроме встречающейся в природе фосфодиэфирной связи. Примеры таких связей включают фосфорамидные, фосфоротиоатные и фосфородитиоатные связи. В некоторых вариантах воплощения некоторые (например по меньшей мере 80, 90 или 95%) или все адапторы или праймеры включают тиофосфат (например, монотиофосфат) между последним 3' нуклеотидом и предпоследним 3' нуклеотидом. В некоторых вариантах воплощения некоторые (например по меньшей мере 80, 90 или 95%) или все адапторы или праймеры включают тиофосфат (например, монотиофосфат) между последними 2, 3, 4 или 5 нуклеотидами на 3'-конце. В некоторых вариантах воплощения некоторые (например по меньшей мере 80, 90 или 95%) или все адапторы или праймеры включают тиофосфат (например, монотиофосфат) между по меньшей мере 1, 2, 3, 4 или 5 нуклеотидами из последних 10 нуклеотидов на 3'-конце. В некоторых вариантах воплощения такие праймеры с меньшей вероятностью будут расщепляться или разрушаться. В некоторых вариантах воплощения праймеры не содержат сайт расщепления ферментом (например, сайт расщепления протеазой).
[620] Дополнительные примерные способы и библиотеки мультиплексной ПЦР описаны в Заявке на патент США № 13/683604, поданной 21 ноября 2012 года (Публикация заявки на патент США № 2013/0123120) и Предварительной заявке на патент США, регистрационный № 61/994791, поданной 16 мая 2014 года, каждый из этих документов полностью включен сюда посредством ссылки). Эти способы и библиотеки можно использовать для анализа любых образцов, раскрытых в данном документе, и для использования в любом из способов по настоящему изобретению.
[621] Примерные библиотеки праймеров для обнаружения рекомбинации
[622] В некоторых вариантах воплощения праймеры в библиотеке праймеров предназначены для определения того, произошла ли рекомбинация в одной или более известных горячих точек рекомбинации (таких как кроссоверы между гомологичными хромосомами человека). Знание того, какие кроссоверы произошли между хромосомами, позволяет определить более точные поэтапные генетические данные для человека. Горячие точки рекомбинации - это локальные области хромосом, в которых, как правило, концентрируются события рекомбинации. Часто они окружены «холодными пятнами», областями с частотой рекомбинации ниже средней. Горячие точки рекомбинации имеют тенденцию обладать сходной морфологией, и они имеют длину приблизительно от 1 до 2 т.п.н. Распределение горячих точек положительно коррелирует с содержанием GC и распределением повторяющихся элементов. В активности некоторых горячих точек играет роль частично вырожденный 13-мерный мотив CCNCCNTNNCCNC. Было показано, что белок «цинковый палец», именуемый PRDM9, связывается с этим мотивом и инициирует рекомбинацию в его местоположении. Сообщается, что среднее расстояние между центрами горячих точек рекомбинации составляет ~80 т.п.н. В некоторых вариантах воплощения расстояние между центрами горячих точек рекомбинации составляет от приблизительн 3 т.п.н. до приблизительно 100 т.п.н. Общедоступные базы данных включают в себя большое количество известных горячих точек рекомбинации человека, например базы данных HUMHOT и International HapMap Project (см., например, Nishant et al., “HUMHOT: a database of human meiotic recombination hot spots,” Nucleic Acids Research, 34: D25-D28, 2006, Database issue; Mackiewiczet al., “Distribution of Recombination Hotspots in the Human Genome - A Comparison of Computer Simulations with Real Data” PLoS ONE 8(6): e65272, doi:10.1371/journal.pone.0065272; и веб-адрес hapmap.ncbi.nlm.nih.gov/downloads/index.html.en, каждый из этих документов полностью включен сюда посредством ссылки).
[623] В некоторых вариантах воплощения праймеры в библиотеке праймеров сгруппированы в горячих точках рекомбинации или рядом с ними (например, в известных горячих точках рекомбинации человека). В некоторых вариантах воплощения соответствующие ампликоны используются для определения последовательности в пределах или рядом с горячей точкой рекомбинации для того, чтобы определить, произошла ли рекомбинация в этой конкретной горячей точке (например, является ли последовательность ампликона последовательностью, ожидаемой в случае, если произошла рекомбинация, или последовательностью, ожидаемой в случае, если рекомбинации не произошло). В некоторых вариантах воплощения праймеры предназначены для амплификации части или всей горячей точки рекомбинации (и, необязательно, последовательности, фланкирующей горячую точку рекомбинации). В некоторых вариантах воплощения для секвенирования части или всей горячей точки рекомбинации используется секвенирование с длинным считыванием (такое как секвенирование с использованием технологии Moleculo, разработанной Illumina для секвенирования до приблизительно 10 т.п.н.) или секвенирование спаренных концов по парным концам. Знание того, произошло ли событие рекомбинации, можно использовать для определения того, какие блоки гаплотипов фланкируют горячую точку. При необходимости присутствие определенных блоков гаплотипов может быть подтверждено с помощью праймеров, специфичных для регионов внутри блоков гаплотипов. В некоторых вариантах воплощения предполагается, что между известными горячими точками рекомбинации нет кроссоверов. В некоторых вариантах воплощения праймеры в библиотеке праймеров сгруппированы на концах хромосом или рядом с ними. Например, такие праймеры можно использовать для определения наличия или отсутствия определенного плеча или участка на конце хромосомы. В некоторых вариантах воплощения праймеры в библиотеке праймеров сгруппированы в горячих точках рекомбинации или рядом с ними, а также на концах хромосом или рядом с ними.
[624] В некоторых вариантах воплощения библиотека праймеров включает один или более праймеров (например по меньшей мере 5; 10; 50; 100; 200; 500; 750; 1000; 2000; 5000; 7 500; 10000; 20000; 25000; 30000; 40000; или 50000 различных праймеров или различных пар праймеров), которые специфичны для горячей точки рекомбинации (например, известной горячей точки рекомбинации человека) и/или специфичны для области рядом с горячей точкой рекомбинации (например, в пределах 10, 8, 5, 3, 2, 1 или 0,5 т.п.н. от 5'- или 3'-конца горячей точки рекомбинации). В некоторых вариантах воплощения по меньшей мере 1, 5, 10, 20, 40, 60, 80, 100 или 150 различных праймеров (или пар праймеров) специфичны для одной и той же горячей точки рекомбинации или специфичны для одной и той же горячей точки рекомбинации или области рядом с горячей точкой рекомбинации. В некоторых вариантах воплощения по меньшей мере 1, 5, 10, 20, 40, 60, 80, 100 или 150 различных праймеров (или пар праймеров) специфичны для области между горячими точками рекомбинации (например, области, которая маловероятно была подвергнута рекомбинации); эти праймеры можно использовать для подтверждения наличия блоков гаплотипов (таких как те, которые можно было бы ожидать в зависимости от того, произошла ли рекомбинация). В некоторых вариантах воплощения, по меньшей мере, 10, 20, 30, 40, 50, 60, 70, 80 или 90% праймеров в библиотеке праймеров специфичны для горячей точки рекомбинации и/или специфичны для области рядом с горячей точкой рекомбинации (например, в пределах 10, 8, 5, 3, 2, 1 или 0,5 т.п.н. от 5'- или 3'-конца горячей точки рекомбинации). В некоторых вариантах воплощения библиотеку праймеров используют для определения того, произошла ли рекомбинация при количестве различных горячих точек рекомбинации большем или равном 5; 10; 50; 100; 200; 500; 750; 1000; 2000; 5000; 7500; 10000; 20000; 25000; 30000; 40000; или 50000 (таких как известные горячие точки рекомбинации человека). В некоторых вариантах воплощения области, являющиеся мишенями праймеров, нацеленных на горячую точку рекомбинации или близлежащую область, приблизительно равномерно распределены вдоль этой части генома. В некоторых вариантах воплощения по меньшей мере 1, 5, 10, 20, 40, 60, 80, 100 или 150 различных праймеров (или пар праймеров) специфичны для области на конце хромосомы или приблизительно нее (например, области в пределах 20, 10, 5, 1, 0,5, 0,1, 0,01 или 0,001 Мб от конца хромосомы). В некоторых вариантах воплощения по меньшей мере 10, 20, 30, 40, 50, 60, 70, 80 или 90% праймеров в библиотеке праймеров специфичны для области на конце хромосомы или приблизительно нее (например, области в пределах 20, 10, 5, 1, 0,5, 0,1, 0,01 или 0,001 Мб от конца хромосомы). В некоторых вариантах воплощения по меньшей мере 1, 5, 10, 20, 40, 60, 80, 100 или 150 различных праймеров (или пар праймеров) специфичны для области в пределах потенциальной микроделеции в хромосоме. В некоторых вариантах воплощения по меньшей мере 10, 20, 30, 40, 50, 60, 70, 80 или 90% праймеров в библиотеке праймеров специфичны для области в пределах потенциальной микроделеции в хромосоме. В некоторых вариантах воплощения по меньшей мере 10, 20, 30, 40, 50, 60, 70, 80 или 90% праймеров в библиотеке праймеров специфичны для горячей точки рекомбинации, области рядом с горячей точкой рекомбинации, области на конце или приблизительно конца хромосомы или области в пределах потенциальной микроделеции в хромосоме.
[625] Примерные способы мультиплексной ПЦР
[626] В одном аспекте изобретение относится к способам амплификации целевых локусов в образце нуклеиновой кислоты, которые включают (i) контактирование образца нуклеиновой кислоты с библиотекой праймеров, которые одновременно гибридизируются по меньшей мере с 1000; 2000; 5000; 7500; 10000; 15000; 19000; 20000; 25000; 27000; 28000; 30000; 40000; 50000; 75000; или 100000 различных целевых локусов для получения реакционной смеси; и (ii) воздействие на реакционную смесь условий реакции удлинения праймера (таких как условия ПЦР) для получения амплифицированных продуктов, которые включают целевые ампликоны. В некоторых вариантах воплощения способ также включает определение наличия или отсутствия по меньшей мере одного целевого ампликона (например по меньшей мере 50, 60, 70, 80, 90, 95, 96, 97, 98, 99 или 99,5% целевых ампликонов). В некоторых вариантах воплощения способ также включает определение последовательности по меньшей мере одного целевого ампликона (например по меньшей мере 50, 60, 70, 80, 90, 95, 96, 97, 98, 99 или 99,5% целевых ампликонов). В некоторых вариантах воплощения амплифицируются по меньшей мере 50, 60, 70, 80, 90, 95, 96, 97, 98, 99 или 99,5% целевых локусов. В некоторых вариантах воплощения по меньшей мере 25; 50; 75; 100; 300; 500; 750; 1000; 2000; 5000; 7500; 10,000; 15000; 19000; 20000; 25000; 27000; 28000; 30000; 40000; 50000; 75000; или 100000 различных целевых локусов амплифицируются по меньшей мере в 5, 10, 20, 40, 50, 60, 80, 100, 120, 150, 200, 300 или 400 раз. В некоторых вариантах воплощения по меньшей мере 50, 60, 70, 80, 90, 95, 96, 97, 98, 99, 99,5 или 100% целевых локусов амплифицируются по меньшей мере в 5, 10, 20, 40, 50, 60, 80, 100, 120, 150, 200, 300 или 400 раз. В различных вариантах воплощения менее 60, 50, 40, 30, 20, 10, 5, 4, 3, 2, 1, 0,5, 0,25, 0,1 или 0,05% амплифицированных продуктов представляют собой димеры праймеров. В некоторых вариантах воплощения способ включает мультиплексную ПЦР и секвенирование (например, высокопроизводительное секвенирование).
[627] В различных вариантах воплощения используется длительное время отжига и/или низкие концентрации праймеров. В различных вариантах воплощения длительность этапа отжига превышает 3, 5, 8, 10, 15, 20, 30, 45, 60, 75, 90, 120, 150 или 180 минут. В различных вариантах воплощения продолжительность этапа отжига (на цикл ПЦР) составляет от 5 до 180 минут, например от 5 до 60, от 10 до 60, от 5 до 30 или от 10 до 30 минут включительно. В различных вариантах воплощения продолжительность стадии отжига больше 5 минут (например, больше 10 или 15 минут), а концентрация каждого праймера меньше 20 нМ. В различных вариантах воплощения продолжительность этапа отжига превышает 5 минут (например, больше 10 или 15 минут), а концентрация каждого праймера составляет от 1 до 20 нМ или от 1 до 10 нМ включительно. В различных вариантах воплощения продолжительность стадии отжига больше 20 минут (например, больше 30, 45, 60 или 90 минут), а концентрация каждого праймера меньше 1 нМ.
[628] При высоком уровне мультиплексирования раствор может стать вязким из-за большого количества праймеров в растворе. Если раствор слишком вязкий, можно снизить концентрацию праймера до количества, достаточного для связывания праймером ДНК-матрицы. В различных вариантах воплощения используется менее 60000 различных праймеров, а концентрация каждого праймера меньше 20 нМ, например, меньше 10 нМ или от 1 до 10 нМ включительно. В различных вариантах воплощения используется более 60000 различных праймеров (например, от 60000 до 120000 различных праймеров), и концентрация каждого праймера составляет менее 10 нМ, например, менее 5 нМ или от 1 до 10 нМ включительно.
[629] Было обнаружено, что температура отжига необязательно может быть выше, чем температуры плавления некоторых или всех праймеров (в отличие от других способов, в которых используется температура отжига ниже температур плавления праймеров). Температура плавления (Tm) является температурой, при которой половина (50%) дуплекса ДНК олигонуклеотида (например, праймера) и его совершенного комплемента диссоциируют и превращаются в одноцепочечную ДНК. Температура отжига (TA) является температурой, при которой выполняется протокол ПЦР. Для предшествующих способов она обычно на 5 °C ниже самой низкой Tm используемых праймеров, таким образом, образуются почти все возможные дуплексы (такие, что по существу все молекулы праймера связываются с матричной нуклеиновой кислотой). Хотя это очень эффективно, при более низких температурах обязательно будут происходить более неспецифические реакции. Одним из последствий слишком низкой TA является то, что праймеры могут отжигаться с последовательностями, отличными от истинной мишени, поскольку могут допускаться внутренние несоответствия по одному основанию или частичный отжиг. В некоторых вариантах воплощения настоящего изобретения TA выше, чем (Tm), где в данный момент только небольшая часть мишеней имеет отожженный праймер (например, только приблизительно 1-5%). Если они увеличиваются, то они удаляются из равновесия отжига и диссоциации праймеров и мишени (поскольку удлинение быстро увеличивает Tm до более 70 °C), и новые приблизительно 1-5% мишеней имеют праймеры. Таким образом, давая реакции большое время для отжига, можно получить приблизительно 100% копий мишеней за цикл. Таким образом, наиболее стабильные пары молекул (с идеальным спариванием ДНК между праймером и ДНК-матрицей) предпочтительно удлиняются для получения правильных целевых ампликонов. Например, тот же эксперимент был проведен с 57 °C в качестве температуры отжига и с 63 °C в качестве температуры отжига с праймерами, которые имели температуру плавления ниже 63 °C. Когда температура отжига составляла 57 °C, процент картированных считываний для амплифицированных продуктов ПЦР составлял всего 50% (причем приблизительно 50% амплифицированных продуктов были димерами праймеров). Когда температура отжига составляла 63 °C, процент амплифицированных продуктов, которые были димерами праймера, упал до приблизительно 2%.
[630] В различных вариантах воплощения температура отжига по меньшей мере на 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 или 15 °C выше, чем температура плавления (например, эмпирически измеренная или рассчитанная Tm) по меньшей мере 25; 50; 75; 100; 300; 500; 750; 1000; 2000; 5000; 7500; 10000; 15000; 19000; 20000; 25000; 27000; 28000; 30000; 40000; 50000; 75000; 100000; или всех неидентичных праймеров. В некоторых вариантах воплощения температура отжига по меньшей мере на 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 или 15 °C выше, чем температура плавления (например, эмпирически измеренная или рассчитанная Tm) по меньшей мере 25; 50; 75; 100; 300; 500; 750; 1000; 2000; 5000; 7500; 10000; 15000; 19000; 20000; 25000; 27000; 28000; 30000; 40000; 50000; 75000; 100000; или всех неидентичных праймеров, а продолжительность стадии отжига (на цикл ПЦР) составляет более, чем 1, 3, 5, 8, 10, 15, 20, 30, 45, 60, 75, 90, 120, 150 или 180 минут.
[631] В различных вариантах воплощения температура отжига на от 1 до 15 °C (например, от 1 до 10, от 1 до 5, от 1 до 3, от 3 до 5, от 5 до 10, от 5 до 8, от 8 до 10, от 10 до 12 или от 12 до 15 °C включительно) выше температуры плавления (такой как эмпирически измеренная или рассчитанная Tm) по меньшей мере 25; 50; 75; 100; 300; 500; 750; 1000; 2000; 5000; 7500; 10000; 15000; 19000; 20000; 25000; 27000; 28000; 30000; 40000; 50000; 75000; 100000; или всех неидентичных праймеров. В различных вариантах воплощения температура отжига от 1 до 15 °C (например, от 1 до 10, от 1 до 5, от 1 до 3, от 3 до 5, от 5 до 10, от 5 до 8, от 8 до 10, от 10 до 12 или от 12 до 15 °C включительно) выше температуры плавления (такой как эмпирически измеренная или рассчитанная Tm) по меньшей мере 25; 50; 75; 100; 300; 500; 750; 1000; 2000; 5000; 7500; 10000; 15000; 19000; 20000; 25000; 27000; 28000; 30000; 40000; 50000; 75000; 100000; или всех неидентичных праймеров, а продолжительность этапа отжига (на цикл ПЦР) составляет от 5 до 180 минут, например от 5 до 60, от 10 до 60, от 5 до 30 или от 10 до 30 минут включительно.
[632] В некоторых вариантах воплощения температура отжига по меньшей мере на 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 или 15 °C выше, чем самая высокая температура плавления (например, эмпирически измеренная или рассчитанная Tm) праймеров. В некоторых вариантах воплощения температура отжига по меньшей мере на 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 или 15 °C выше, чем самая высокая температура плавления (например, эмпирически измеренная или рассчитанная Tm) праймеров, а длина стадии отжига (за цикл ПЦР) больше 1, 3, 5, 8, 10, 15, 20, 30, 45, 60, 75, 90, 120, 150 или 180 минут.
[633] В некоторых вариантах воплощения температура отжига на от 1 до 15 °C (например, от 1 до 10, от 1 до 5, от 1 до 3, от 3 до 5, от 5 до 10, от 5 до 8, от 8 до 10, от 10 до 12 или от 12 до 15 °C включительно) выше, чем самая высокая температура плавления (например, эмпирически измеренная или рассчитанная Tm) праймеров. В некоторых вариантах воплощения температура отжига на от 1 до 15 °C (например, от 1 до 10, от 1 до 5, от 1 до 3, от 3 до 5, от 5 до 10, от 5 до 8, от 8 до 10, от 10 до 12 или от 12 до 15 °C включительно) выше, чем наивысшая температура плавления (например, эмпирически измеренная или рассчитанная Tm) праймеров, а продолжительность стадии отжига (на цикл ПЦР) составляет от 5 до 180 минут, например от 5 до 60, oт 10 до 60, от 5 до 30 или от 10 до 30 минут включительно.
[634] В некоторых вариантах воплощения температура отжига по меньшей мере на 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 или 15 °C выше, чем средняя температура плавления (например, эмпирически измеренная или рассчитанная Tm) по меньшей мере 25; 50; 75; 100; 300; 500; 750; 1000; 2000; 5000; 7500; 10000; 15000; 19000; 20000; 25000; 27000; 28000; 30000; 40000; 50000; 75000; 100000; или всех неидентичных праймеров. В некоторых вариантах воплощения температура отжига по меньшей мере на 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 или 15 °C выше, чем средняя температура плавления (например, эмпирически измеренная или рассчитанная Tm) по меньшей мере 25; 50; 75; 100; 300; 500; 750; 1000; 2000; 5000; 7500; 10000; 15000; 19000; 20000; 25000; 27000; 28000; 30000; 40000; 50000; 75000; 100000; или всех неидентичных праймеров, а длина стадии отжига (на цикл ПЦР) больше 1, 3, 5, 8, 10, 15, 20, 30, 45, 60, 75, 90, 120, 150 или 180 минут.
[635] В некоторых вариантах воплощения температура отжига на от 1 до 15 °C (например, от 1 до 10, от 1 до 5, от 1 до 3, от 3 до 5, от 5 до 10, от 5 до 8, от 8 до 10, от 10 до 12 или от 12 до 15 °C включительно) выше средней температуры плавления (такой как эмпирически измеренная или рассчитанная Tm) по меньшей мере 25; 50; 75; 100; 300; 500; 750; 1000; 2000; 5000; 7500; 10000; 15000; 19000; 20000; 25000; 27000; 28000; 30000; 40000; 50000; 75000; 100000; или всех неидентичных праймеров. В некоторых вариантах воплощения температура отжига составляет от 1 до 15 °C (например, от 1 до 10, от 1 до 5, от 1 до 3, от 3 до 5, от 5 до 10, от 5 до 8, от 8 до 10, от 10 до 12 или от 12 до 15 °C включительно) выше средней температуры плавления (такой как эмпирически измеренная или рассчитанная Tm) по меньшей мере 25; 50; 75; 100; 300; 500; 750; 1000; 2000; 5000; 7500; 10000; 15000; 19000; 20000; 25000; 27000; 28000; 30000; 40000; 50000; 75000; 100000; или всех неидентичных праймеров, а продолжительность этапа отжига (на цикл ПЦР) составляет от 5 до 180 минут, например от 5 до 60, от 10 до 60, от 5 до 30 или от 10 до 30 минут включительно.
[636] В некоторых вариантах воплощения температура отжига составляет от 50 до 70 °C, например от 55 до 60, от 60 до 65 или от 65 до 70 °C включительно. В некоторых вариантах воплощения температура отжига составляет от 50 до 70 °C, например от 55 до 60, от 60 до 65 или от 65 до 70 °C включительно, и либо (i) длина стадии отжига (на цикл PCR) больше, чем 3, 5, 8, 10, 15, 20, 30, 45, 60, 75, 90, 120, 150 или 180 минут или (ii) продолжительность этапа отжига (на цикл ПЦР) составляет от 5 до 180 минут, например от 5 до 60, от 10 до 60, от 5 до 30 или от 10 до 30 минут включительно.
[637] В некоторых вариантах воплощения одно или более из следующих условий используются для эмпирического измерения Tm или принимаются для расчета Tm: температура: 60,0 °C, концентрация праймера 100 нМ и/или концентрация соли 100 мМ. В некоторых вариантах воплощения используются другие условия, такие как условия, которые будут использоваться для мультиплексной ПЦР с библиотекой. В некоторых вариантах воплощения используется 100 мМ KCl, 50 мМ (NH4)2SO4, 3 мМ MgCl2, 7,5 нМ каждого праймера и 50 мМ TMAC при pH 8,1. В некоторых вариантах воплощения Tm рассчитывается с применением программы Primer3 (libprimer3 выпуск 2.2.3) с использованием встроенных параметров SantaLucia (веб-адрес primer3.sourceforge.net, документ полностью включен сюда посредством ссылки). В некоторых вариантах воплощения расчетная температура плавления праймера является температурой, при которой ожидается отжиг половины молекул праймера. Как обсуждалось выше, даже при температуре выше расчетной температуры плавления часть праймеров будет отожжена, и, следовательно, возможно удлинение ПЦР. В некоторых вариантах воплощения эмпирически измеренная Tm (фактическая Tm) определяется с помощью термостатированной ячейки в УФ-спектрофотометре. В некоторых вариантах воплощения график зависимости температуры от поглощения дает S-образную кривую с двумя плато. Показатель поглощения на полпути между плато соответствует Tm.
[638] В некоторых вариантах воплощения поглощение при 260 нм измеряется как функция температуры на УФ/видимом спектрофотометре ultrospec 2100 pr. (Amershambiosciences) (см., например, Takiya et al., “An empirical approach for thermal stability (Tm) prediction of PNA/DNA duplexes,”Nucleic Acids Symp Ser (Oxf); (48):131-2, 2004, документ полностью включен сюда посредством ссылки). В некоторых вариантах воплощения поглощение при 260 нм измеряется путем снижения температуры с шагом 2 °C в минуту с 95 до 20 °C. В некоторых вариантах воплощения праймер и его идеальный комплемент (например, 2 мкМ каждого спаренного олигомера) смешивают, а затем проводят отжиг путем нагревания образца до 95 °C, выдерживания его там в течение 5 минут с последующим охлаждением до комнатной температуры в течение 30 минут, и выдерживание образцов при 95 °C по меньшей мере 60 минут. В некоторых вариантах воплощения температура плавления определяется путем анализа данных с помощью программы SWIFT Tm. В некоторых вариантах воплощения любого из способов по изобретению, способ включает эмпирическое измерение или расчет (например, расчет с помощью компьютера) температуры плавления по меньшей мере для 50, 80, 90, 92, 94, 96, 98, 99 или 100% праймеров в библиотеке до или после использования праймеров для ПЦР-амплификации целевых локусов.
[639] В некоторых вариантах воплощения библиотека включает микрочип. В некоторых вариантах воплощения библиотека не содержит микрочип.
[640] В некоторых вариантах воплощения большинство или все праймеры удлиняются с образованием продуктов амплификации. Использование всех праймеров в реакции ПЦР увеличивает однородность амплификации различных целевых локусов, поскольку в целевые ампликоны для каждого целевого локуса превращается одинаковое или аналогичное количество молекул праймеров. В некоторых вариантах воплощения по меньшей мере 80, 90, 92, 94, 96, 98, 99 или 100% молекул праймера удлиняются с образованием амплифицированных продуктов. В некоторых вариантах воплощения для по меньшей мере 80, 90, 92, 94, 96, 98, 99 или 100% целевых локусов по меньшей мере 80, 90, 92, 94, 96, 98, 99 или 100% молекул праймеров для этих целевых локусов удлиняются с образованием амплифицированных продуктов. В некоторых вариантах воплощения выполняется несколько циклов до тех пор, пока этот процент праймеров не будет израсходован. В некоторых вариантах воплощения выполняют несколько циклов до тех пор, пока не будут израсходованы все или практически все праймеры. При необходимости можно использовать более высокий процент праймеров, уменьшив исходную концентрацию праймеров и/или увеличив количество выполняемых циклов ПЦР.
[641] В некоторых вариантах воплощения способы ПЦР могут выполняться с микролитровыми реакционными объемами, для которых может быть труднее достичь специфической амплификации ПЦР (из-за более низкой локальной концентрации матричных нуклеиновых кислот) по сравнению с нанолитровыми или пиколитровыми реакционными объемами, используемыми в микрофлюидных применениях. В некоторых вариантах воплощения объем реакции составляет от 1 до 60 мкл, например от 5 до 50 мкл, от 10 до 50 мкл, от 10 до 20 мкл, от 20 до 30 мкл, от 30 до 40 мкл или от 40 до 50 мкл включительно.
[642] В одном варианте воплощения в способе, раскрытом в данном документе, используется высокоэффективная целевая ПЦР с высокой степенью мультиплексирования для амплификации ДНК с последующим высокопроизводительным секвенированием для определения частот аллелей в каждом целевом локусе. Возможность мультиплексировать более 50 или 100 праймеров для ПЦР в одном реакционном объеме таким образом, чтобы большая часть считываний полученной последовательности картировалась в целевые локусы, является новой и неочевидной. Одна методика, которая позволяет проводить высокоэффективную целевую ПЦР с высокой степенью мультиплексирования, включает разработку праймеров, которые вряд ли будут гибридизоваться друг с другом. Зонды ПЦР, обычно называемые праймерами, выбираются путем создания термодинамической модели потенциально неблагоприятных взаимодействий между по меньшей мере 300; по меньшей мере, 500; по меньшей мере, 750; по меньшей мере, 1000; по меньшей мере, 2000; по меньшей мере, 5000; по меньшей мере, 7500; по меньшей мере, 10000; по меньшей мере, 20000; по меньшей мере, 25000; по меньшей мере, 30000; по меньшей мере, 40000; по меньшей мере, 50000; по меньшей мере, 75000; или по меньшей мере 100000 потенциальных пар праймеров, или непреднамеренных взаимодействий между праймерами и образцом ДНК, а затем использование модели для исключения конструкций, несовместимых с другими конструкциями в пуле. Другая методика, которая позволяет выполнять высокоэффективную целевую ПЦР с высокой степенью мультиплексирования, заключается в использовании подхода частичного или полного вложения к целевой ПЦР. Использование одного или комбинации этих подходов позволяет мультиплексировать по меньшей мере 300 по меньшей мере 800 по меньшей мере 1200 по меньшей мере 4000 или по меньшей мере 10000 праймеров в единый пул с полученной амплифицированной ДНК, содержащей большинство молекул ДНК, которые при секвенировании, будут картироваться в целевые локусы. Использование одного или комбинации этих подходов позволяет мультиплексировать большое количество праймеров в одном пуле с полученной амплифицированной ДНК, содержащей более 50%, более 60%, более 67%, более 80%, более 90%, более 95%, более 96%, более 97%, более 98%, более 99% или более 99,5% молекул ДНК, которые картируются в целевые локусы.
[643] В некоторых вариантах воплощения обнаружение целевого генетического материала может быть выполнено мультиплексным способом. Число генетических последовательностей-мишеней, которые могут выполняться параллельно, может варьироваться от одной до десяти, от десяти до ста, от ста до одной тысячи, от одной тысячи до десяти тысяч, от десяти тысяч до ста тысяч, от ста тысяч до миллиона, или от одного миллиона до десяти миллионов. Предыдущие попытки мультиплексировать более 100 праймеров на пул привели к значительным проблемам с нежелательными побочными реакциями, такими как образование димера праймера.
[644] Целевая ПЦР
[645] В некоторых вариантах воплощения ПЦР можно использовать для нацеливания на определенные участки генома. В образцах плазмы исходная ДНК сильно фрагментирована (обычно менее 500 п.н., при средней длине менее 200 п.н.). В ПЦР как прямой, так и обратный праймер отжигаются с одним и тем же фрагментом, чтобы сделать амплификацию возможной. Следовательно, если фрагменты короткие, анализы ПЦР также должны амплифицировать относительно короткие области. Подобно MIPS, если полиморфные позиции находятся слишком близко к сайту связывания полимеразы, это может привести к ошибкам в амплификации от разных аллелей. В настоящее время праймеры для ПЦР, нацеленные на полиморфные области, такие как те, которые содержат ОНП, обычно разрабатываются таким образом, что 3'-конец праймера будет гибридизоваться с основанием, непосредственно примыкающим к полиморфному основанию или основаниям. В одном варианте воплощения настоящего изобретения 3'-концы как прямого, так и обратного праймеров для ПЦР предназначены для гибридизации с основаниями, которые находятся на одно или несколько положений дальше от вариантов положений (полиморфных сайтов) целевого аллеля. Количеством оснований между полиморфным сайтом (ОНП или другого) и основанием, для которого предназначена гибридизация 3'-конца праймера, может быть одно основание, это может быть два основания, это может быть три основания, это может быть четыре основания, это может быть пять оснований, это может быть шесть оснований, это может быть от семи до десяти оснований, это может быть от одиннадцати до пятнадцати оснований, или это может быть от шестнадцати до двадцати оснований. Прямой и обратный праймеры могут быть разработаны для гибридизации различного количества оснований вдали от полиморфного сайта.
[646] ПЦР-анализы могут проводиться в большом количестве, однако взаимодействие между разными ПЦР-анализами затрудняет их мультиплексирование за пределами приблизительно сотни анализов. Для повышения уровня мультиплексирования можно использовать различные сложные молекулярные подходы, но все же можно ограничиться менее чем 100, возможно, 200 или, возможно, 500 анализами на реакцию. Образцы с большим количеством ДНК можно разделить на несколько субреакций, а затем рекомбинировать перед секвенированием. Для образцов, в которых ограничен либо общий образец, либо некоторая субпопуляция молекул ДНК, разделение образца внесет статистический шум. В одном варианте воплощения небольшое или ограниченное количество ДНК может относиться к количеству ниже 10 пг, от 10 до 100 пг, от 100 пг до 1 нг, от 1 до 10 нг или от 10 до 100 нг. Обратите внимание, что хотя этот способ особенно полезен для небольших количеств ДНК, где другие способы, предполагающие разделение на несколько пулов, могут вызвать значительные проблемы, связанные с внесенным стохастическим шумом, этот способ по-прежнему обеспечивает преимущество минимизации систематической ошибки, когда он выполняется на образцах с любым количеством ДНК. В этих ситуациях можно использовать универсальный этап предварительной амплификации для увеличения общего количества образца. В идеале, этот этап предварительной амплификации не должен заметно изменять аллельные распределения.
[647] В одном из вариантов воплощения, способ, согласно настоящему описанию, может генерировать продукты ПЦР, которые специфичны для большого количества целевых локусов, в частности для от 1000 до 5000 локусов, от 5000 до 10000 локусов или более 10000 локусов, для генотипирования посредством секвенирования или какого-либо другого способа генотипирования из ограниченного количества образцов, таких как отдельные клетки или ДНК из жидкостей организма. В настоящее время выполнение мультиплексных реакций ПЦР для более, чем 5-10 мишеней представляет собой серьезную проблему и часто затрудняется из-за побочных продуктов праймера, таких как димеры праймеров, и других артефактов. При обнаружении целевых последовательностей с использованием микроматриц с зондами гибридизации, димеры праймеров и другие артефакты можно игнорировать, поскольку они не обнаруживаются. Однако при использовании секвенирования в качестве способа обнаружения подавляющее большинство считываний секвенирования будет секвенировать такие артефакты, а не желаемые целевые последовательности в образце. Способы, представленные на предшествующем уровне техники, используемые для мультиплексирования более 50 или 100 реакций в одном реакционном объеме с последующим секвенированием, как правило, приводят к более чем 20%, а часто и более чем 50%, во многих случаях более 80%, а в некоторых случаях более 90% считываниям нецелевой последовательности.
[648] В общем, для выполнения целевого секвенирования нескольких (n) мишеней образца (больше 50, больше 100, больше 500 или больше 1000) можно разделить образец на ряд параллельных реакций, которые амплифицируют одну индивидуальную мишень. Это было выполнено в многолуночных планшетах для ПЦР или может быть выполнено на коммерческих платформах, таких как FLUIDIGM ACCESS ARRAY (48 реакций на образец в микрожидкостных чипах) или DROPLET PCR от RAIN DANCE TECHNOLOGY (от 100 до нескольких тысяч мишеней). К сожалению, эти способы разделения и объединения проблематичны для образцов с ограниченным количеством ДНК, поскольку часто не хватает копий генома, чтобы гарантировать наличие одной копии каждой области генома в каждой лунке. Это особенно серьезная проблема тогда, когда мишенью являются полиморфные локусы, и требуются относительные пропорции аллелей в полиморфных локусах, поскольку стохастический шум, вносимый разделением и объединением, приведет к очень неточным измерениям пропорций аллелей, которые присутствует в исходном образце ДНК. В данном документе описан способ эффективной и действенной амплификации многих реакций ПЦР, который применим в случаях, когда доступно только ограниченное количество ДНК. В одном варианте воплощения, способ может применяться для анализа отдельных клеток, биологических жидкостей, смесей ДНК, таких как свободно плавающая ДНК, обнаруживаемая в плазме, биопсиях, образцах окружающей среды и/или образцах судебно-медицинской экспертизы.
[649] В одном варианте воплощения целевое секвенирование может включать в себя один, множество или все следующие этапы: а) Сгенерировать и амплифицировать библиотеку с последовательностями адапторов на обоих концах фрагментов ДНК. б) Разделить на несколько реакций после амплификации библиотеки. в) Сгенерировать и необязательно амплифицировать библиотеку с последовательностями адапторов на обоих концах фрагментов ДНК. г) Выполнить от 1000- до 10000-плексную амплификацию выбранных мишеней с использованием одного специфичного для мишени «прямого» праймера для каждой мишени и одного праймера, специфичного для метки. д) Выполнить вторую амплификацию этого продукта с использованием «обратных» праймеров, специфичных для мишени, и одного (или более) праймеров, специфичных для универсальной метки, которая была введена как часть специфичных для мишени прямых праймеров в первом цикле. е) Выполнить предварительную 1000-плексную амплификацию выбранной мишени в течение ограниченного числа циклов. ж) Разделить продукт на несколько аликвот и амплифицировать субпулы мишеней в индивидуальных реакциях (например, от 50 до 500-плексная амплификация, хотя это может быть использовано вплоть до одноплексной амплификации. з) Объединить продукты параллельных реакций субпулов. и) Во время этих амплификаций праймеры могут нести теги, совместимые с секвенированием (частичной или полной длины), так что эти продукты могут быть секвенированы.
[650] Высоко-мультиплексная ПЦР
[651] В данном документе раскрыты способы, которые позволяют проводить целенаправленную амплификацию от более чем сотни до десятков тысяч целевых последовательностей (например, локусов ОНП) из образца нуклеиновой кислоты, такого как геномная ДНК, полученная из плазмы. Амплифицированный образец может быть относительно свободным от продуктов димеров праймеров и иметь низкий аллельный сдвиг в целевых локусах. Если во время или после амплификации к продуктам добавляются адапторы, совместимые с секвенированием, анализ этих продуктов может быть выполнен путем секвенирования.
[652] Выполнение высоко-мультиплексной ПЦР-амплификации с использованием способов, известных в данной области техники, приводит к получению продуктов димеров праймеров, которые превышают желаемые продукты амплификации и не подходят для секвенирования. Их можно уменьшить эмпирически, исключив праймеры, образующие эти продукты, или проведя выбор праймеров in silico. Однако чем больше количество анализов, тем сложнее становится эта проблема.
[653] Одним из решений является разделение 5000-плексной реакции на несколько амплификаций с более низким плексированием, например сто 50-плексных или пятьдесят 100-плексных реакций, или использовать микрофлюидику, или даже разделить образец на отдельные реакции ПЦР. Однако, если образец ДНК ограничен, например, при неинвазивной пренатальной диагностике из плазмы беременных, следует избегать разделения образца на несколько реакций, поскольку это приведет к возникновению узких мест.
[654] В данном документе описаны способы, позволяющие сначала амплифицировать ДНК плазмы образца в целом, а затем разделить образец на несколько мультиплексированных реакций целевого обогащения с более умеренным количеством целевых последовательностей на реакцию. В одном варианте воплощения способ настоящего изобретения может использоваться для предпочтительного обогащения смеси ДНК по множеству локусов, причем способ включает один или болееиз следующих этапов: создание и амплификация библиотеки из смеси ДНК, где молекулы в библиотеке имеют последовательности адапторов, лигированные на обоих концах фрагментов ДНК, разделение амплифицированной библиотеки на несколько реакций, выполнение первого цикла мультиплексной амплификации выбранных мишеней с использованием одного специфичного для мишени «прямого» праймера на мишень и одного или нескольких специфичных для адаптора универсальных «обратных» праймеров. В одном варианте воплощения способ настоящего изобретения дополнительно включает выполнение второй амплификации с использованием «обратных» праймеров, специфичных для мишени, и одного или нескольких праймеров, специфичных для универсальной метки, которая была введена как часть специфичных для мишени прямых праймеров в первом цикле. В одном варианте воплощения способ может включать полностью вложенный, геми-вложенный, полу-вложенный, односторонний полностью вложенный, односторонний геми-вложенный или односторонний полу-вложенный подход ПЦР. В варианте воплощения, способ настоящего изобретения используется для предпочтительного обогащения смеси ДНК по множеству локусов, причем способ включает выполнение мультиплексной предварительной амплификации выбранных мишеней в течение ограниченного количества циклов, разделение продукта на несколько аликвот и амплификацию субпулов мишеней в индивидуальных реакциях и объединение продуктов реакций параллельных субпулов. Обратите внимание, что этот подход может быть использован для выполнения целевой амплификации таким образом, который приведет к низкому уровню смещения аллелей для 50-500 локусов, для от 500 до 5000 локусов, от 5000 до 50000 локусов или даже для 50000-500000 локусов. В варианте воплощения праймеры несут теги, совместимые с частичным или полным секвенированием.
[655] Рабочий процесс может включать (1) извлечение ДНК, такой как ДНК плазмы, (2) подготовку библиотеки фрагментов с универсальными адапторами на обоих концах фрагментов, (3) амплификацию библиотеки с использованием универсальных праймеров, специфичных для адапторов, (4) разделение амплифицированного образца «библиотеки» на несколько аликвот, (5) выполнение на аликвотах мультиплексных амплификаций (например, приблизительно 100-плексных, 1000 или 10000-плексных с одним специфическим для мишени праймером на мишень и специфичным для тега праймером), (6) объединение аликвот одного образца, (7) штрих-кодирование образца, (8) смешивание образцов и регулировка концентрации, (9) секвенирование образца. Рабочий процесс может включать несколько подэтапов, которые содержат одну из перечисленных стадий (например, стадия (2) подготовки библиотеки может включать в себя три ферментативных стадии (тупой конец, наращивание dA-хвостов и лигирование адаптора) и три стадии очистки). Этапы рабочего процесса могут быть объединены, разделены или выполнены в разном порядке (например, штрих-кодирование и объединение образцов).
[656] Важно отметить, что амплификация библиотеки может быть выполнена таким образом, что она будет смещена для более эффективной амплификации коротких фрагментов. Таким образом можно предпочтительно амплифицировать более короткие последовательности, например фрагменты мононуклеосомной ДНК в виде внеклеточной ДНК плода (плацентарного происхождения), обнаруженные в кровотоке беременных женщин. Обратите внимание, что анализы ПЦР могут иметь метки, например метки секвенирования (обычно это усеченная форма из 15-25 оснований). После мультиплексирования ПЦР-мультиплексы образца объединяются, а затем метки завершаются (включая штрих-кодирование) с помощью специфичной для метки ПЦР (также может быть выполнено лигирование). Кроме того, теги полного секвенирования могут быть добавлены в той же реакции, что и мультиплексирование. В первых циклах мишени могут быть амплифицированы с помощью специфичных для мишени праймеров, впоследствии специфичные для метки праймеры вступают в действие для завершения последовательности SQ-адаптора. Праймеры для ПЦР могут не содержать меток. Теги секвенирования могут быть добавлены к продуктам амплификации путем лигирования.
[657] В варианте воплощения для различных применений, таких как обнаружение анеуплоидии плода, может использоваться высоко-мультиплексная ПЦР с последующей оценкой амплифицированного материала путем клонального секвенирования. В то время как традиционные мультиплексные ПЦР оценивают до пятидесяти локусов одновременно, представленный в данном документе подход может использоваться для одновременной оценки более 50 локусов одновременно, более 100 локусов одновременно, более 500 локусов одновременно, более 1000 локусов одновременно, более 5000 локусов одновременно, более 10000 локусов одновременно, более 50000 локусов одновременно и более 100000 локусов одновременно. Эксперименты показали, что до, в том числе, и более 10000 различных локусов могут быть оценены одновременно, в одной реакции, с достаточно хорошей эффективностью и специфичностью для того, чтобы выполнять неинвазивные пренатальные диагнозы анеуплоидии и/или копировать различные распознавания с высокой точностью. Анализы могут быть объединены в одну реакцию со всем образцом, таким, как образец скДНК, выделенный из плазмы, его фракция или производное, подвергшееся дальнейшей обработке, из образца скДНК. Образец (например, скДНК или производное) также можно разделить на несколько параллельных мультиплексных реакций. Оптимальное разделение образца и мультиплексирование определяется путем компромисса различных технических характеристик. Из-за ограниченного количества материала разделение пробы на несколько фракций может привести к шуму выборки, увеличению времени обработки и увеличению вероятности ошибки. И наоборот, более высокое мультиплексирование может привести к большему количеству побочной амплификации и большему неравенству в амплификации, оба из них могут снизить производительность теста.
[658] Двумя критическими взаимосвязанными соображениями при применении представленных в данном документе способов являются ограниченное количество исходного образца (например, плазмы) и количество исходных молекул в этом материале, из которого получают частоту аллелей или другие измерения. Если количество исходных молекул падает ниже определенного уровня, случайный шум выборки становится значительным и может повлиять на точность теста. Как правило, данные достаточного качества для постановки неинвазивного диагноза пренатальной анеуплоидии могут быть получены, если измерения проводятся на образце, содержащем эквивалент 500-1000 исходных молекул на целевой локус. Есть несколько способов увеличить количество отдельных измерений, например, увеличить объем образца. Каждая манипуляция, применяемая к образцу, также потенциально приводит к потерям материала. Важно охарактеризовать потери, понесенные вследствие различных манипуляций, и избежать их или, при необходимости, улучшить результативность определенных манипуляций, чтобы избежать потерь, которые могут ухудшить производительность теста.
[659] В варианте воплощения можно уменьшить потенциальные потери на последующих этапах путем амплификации всего исходного образца или его части (например, образца скДНК). Доступны различные способы для амплификации всего генетического материала в образце, увеличивая объем, доступный для последующих процедур. В варианте воплощения с опосредованной лигированием ПЦР (LM-PCR) фрагменты ДНК амплифицируются с помощью ПЦР после лигирования одного отдельного адаптора, двух разных адапторов или многих отдельных адапторов. В варианте воплощения с амплификацией с множественным замещением (MDA) используется полимераза phi-29 для изотермической амплификации всей ДНК. в DOP-PCR и ее вариациях для амплификации ДНК исходного материала используется случайное праймирование. Каждый способ имеет определенные характеристики, такие как однородность амплификации во всех представленных областях генома, эффективность захвата и амплификации исходной ДНК и производительность амплификации в зависимости от длины фрагмента.
[660] В варианте воплощения LM-PCR может использоваться с одним гетеродуплексным адаптором, имеющим 3'-тирозин. Гетеродуплексный адаптор позволяет использовать одну молекулу адаптора, которая может быть преобразована в две отдельные последовательности на 5'- и 3'-концах исходного фрагмента ДНК во время первого цикла ПЦР. В варианте воплощения можно фракционировать амплифицированную библиотеку разделением по размерам или продуктами, такими способами как AMPURE, TASS или другими подобными способами. Перед лигированием образец ДНК может быть тупым концом, а затем к 3'-концу добавляется одно аденозиновое основание. Перед лигированием ДНК можно расщепить рестриктазой или каким-либо другим способом расщепления. Во время лигирования 3'-аденозин фрагментов образца и дополнительный 3'-тирозиновый выступ адаптора могут повысить эффективность лигирования. Стадия удлинения амплификации ПЦР может быть ограничена с точки зрения времени, чтобы уменьшить амплификацию от фрагментов длиннее приблизительно 200 п.н., приблизительно 300 п.н., приблизительно 400 п.н., приблизительно 500 п.н. или приблизительно 1000 п.н. Был проведен ряд реакций с использованием условий, указанных в коммерчески доступных наборах; в результате было успешно лигировано менее 10% образцов молекул ДНК. Для этого серия оптимизаций условий реакции улучшила лигирование приблизительно до 70%.
[661] Мини-ПЦР
[662] Следующий способ мини-ПЦР желателен для образцов, содержащих короткие нуклеиновые кислоты, расщепленные нуклеиновые кислоты или фрагментированные нуклеиновые кислоты, такие как скДНК. Традиционный дизайн анализа в ПЦР приводит к значительным потерям отдельных фетальных молекул, но потери могут быть значительно уменьшены путем разработки очень коротких анализов ПЦР, называемых анализами мини-ПЦР. Фетальная скДНК в материнской сыворотке сильно фрагментирована, а размеры фрагментов распределены приблизительно по Гауссу со средним значением 160 п.н., стандартным отклонением 15 п.н., минимальным размером приблизительно 100 п.н. и максимальным размером приблизительно 220 п.н. Распределение начальных и конечных положений фрагментов относительно целевых полиморфизмов, хотя и не будучи обязательно случайным, широко варьируется среди индивидуальных мишеней и среди всех мишеней в совокупности, и полиморфный сайт одного конкретного целевого локуса среди различных фрагментов, происходящих из этого локуса, может занимать любую позицию от начала и до его конца. Обратите внимание, что термин мини-ПЦР может также относиться к нормальной ПЦР без дополнительных рестрикций или ограничений.
[663] Во время ПЦР амплификация будет происходить только с фрагментов матричной ДНК, содержащих сайты как прямого, так и обратного праймера. Поскольку фрагменты фетальной скДНК короткие, вероятность присутствия обоих сайтов праймеров и вероятность того, что фетальный фрагмент длиной L, содержит сайты как прямого, так и обратного праймеров, является отношением длины ампликона к длине фрагмента. В идеальных условиях тесты, в которых ампликон составляет 45, 50, 55, 60, 65 или 70 п.н., будут успешно амплифицироваться с, соответственно, 72, 69, 66, 63, 59 или 56% доступных молекул фрагментов матрицы. Длина ампликона - это расстояние между 5'-концами прямого и обратного прайминговых сайтов. Длина ампликона, которая короче, чем та, которая обычно используется способами, известными в данной области техники, может привести к более эффективным измерениям желаемых полиморфных локусов, при этом только требуются считывания коротких последовательностей. В варианте воплощения значительная доля ампликонов должна быть менее 100 п.н., менее 90 п.н., менее 80 п.н., менее 70 п.н., менее 65 п.н., менее 60 п.н., менее 55 п.н., менее 50 п.н. или менее 45 п.н.
[664] Примите во внимание, что в способах, известных в данной области техники, обычно избегают коротких анализов, таких как представленные в данном документе, потому что они не являются необходимыми, и они накладывают значительные ограничения на конструкцию праймера, ограничивая длину праймера, характеристики отжига и расстояние между прямым и обратным праймером.
[665] Также примите во внимание, что существует возможность смещенной амплификации, если 3'-конец любого праймера находится приблизительно в пределах 1-6 оснований от полиморфного сайта. Это различие в одном основании в месте первоначального связывания полимеразы может привести к преимущественной амплификации одного аллеля, что может изменить наблюдаемые частоты аллелей и ухудшить эффективность. Все эти ограничения очень затрудняют идентификацию праймеров, которые будут успешно амплифицировать конкретный локус, и, кроме того, создание больших наборов праймеров, совместимых в одной и той же мультиплексной реакции. В варианте воплощения 3'-конец внутреннего прямого и обратного праймеров предназначены для гибридизации с областью ДНК выше полиморфного сайта, и они отделены от полиморфного сайта небольшим количеством оснований. В идеале, количество оснований может составлять от 6 до 10 оснований, но с равным успехом может составлять от 4 до 15 оснований, от трех до 20 оснований, от двух до 30 оснований или от 1 до 60 оснований, и по существу достигается тот же конец.
[666] Мультиплексная ПЦР может включать один цикл ПЦР, в котором амплифицируются все мишени, или может включать один цикл ПЦР, за которым следует один или более циклов вложенной ПЦР или некоторого варианта вложенной ПЦР. Вложенная ПЦР состоит из последующего цикла или циклов амплификации ПЦР с использованием одного или более новых праймеров, которые внутренне связываются по меньшей мере одной парой оснований, с праймерами, использованными в предыдущем цикле. Вложенная ПЦР снижает количество ложных целей амплификации за счет амплификации в последующих реакциях только тех продуктов амплификации из предыдущей, которые имеют правильную внутреннюю последовательность. Уменьшение количества побочных мишеней амплификации увеличивает количество полезных измерений, которые могут быть получены, особенно при секвенировании. Вложенная ПЦР обычно влечет за собой создание праймеров, полностью внутренних по отношению к предыдущим сайтам связывания праймеров, что обязательно увеличивает минимальный размер сегмента ДНК, необходимый для амплификации. Для таких образцов, как плазматическая скДНК, в которых ДНК сильно фрагментирована, больший размер анализа уменьшает количество отдельных молекул скДНК, по которым может быть получено измерение. В варианте воплощения, чтобы компенсировать этот эффект, можно использовать частично вложенный подход, при котором один или оба праймера второго цикла перекрывают первые сайты связывания, удлиняя внутри некоторое количество оснований для достижения дополнительной специфичности при минимальном увеличении общего размера анализа.
[667] В варианте воплощения для амплификации потенциально гетерозиготных ОНП или других полиморфных или неполиморфных локусов на одной или более хромосом разработан мультиплексный пул ПЦР-анализов, и эти анализы используются в одной реакции для амплификации ДНК. Количество анализов ПЦР может составлять от 50 до 200 анализов ПЦР, от 200 до 1000 анализов ПЦР, от 1000 до 5000 анализов ПЦР или от 5000 до 20000 анализов ПЦР (соответственно, от 50- до 200-плексный, от 200- до 1000- плексный, от 1000- до 5000-плексный, от 5000- до 20000-плексный, более 20000-плексный анализ). В варианте воплощения мультиплексный пул из приблизительно 10000 ПЦР-анализов (10000-плексный) предназначен для амплификации потенциально гетерозиготных ОНП-локусов на хромосомах X, Y, 13, 18, 21 и 1 или 2, и эти анализы используются в одной реакции для амплификации скДНК полученных из образца плазмы материала, образцов ворсинок хориона, образцов амниоцентеза, отдельных клеток или небольшого количества клеток, других жидкостей или тканей организма, рака или другого генетического материала. Частоты ОНП каждого локуса можно определить клональным или другим способом секвенирования ампликонов. Статистический анализ частотных распределений аллелей или соотношений всех анализов может использоваться для определения того, содержит ли образец трисомию по одной или более хромосом, включенных в тест. В другом варианте воплощения исходные образцы скДНК разделяют на два образца и проводят параллельные 5000-плексные анализы. В другом варианте воплощения исходные образцы скДНК разделяют на n образцов и проводят параллельные (~10000/n)-плексные анализы, где n составляет от 2 до 12, или от 12 до 24, или от 24 до 48, или от 48 до 96. Данные собираются и анализируются аналогично уже изложенному. Обратите внимание, что этот способ одинаково хорошо применим для обнаружения транслокаций, делеций, дупликаций и других хромосомных аномалий.
[668] В варианте воплощения хвосты, не имеющие гомологии с целевым геномом, также могут быть добавлены к 3'- или 5'-концу любого из праймеров. Эти хвосты облегчают последующие манипуляции, процедуры или измерения. В варианте воплощения хвостовая последовательность может быть одинаковой для прямых и обратных праймеров, специфичных для мишени. В варианте воплощения для прямых и обратных праймеров, специфичных для мишени, могут использоваться разные хвосты. В варианте воплощения для разных локусов или наборов локусов может использоваться множество разных хвостов. Некоторые хвосты могут быть общими для всех локусов или для подмножества локусов. Например, использование прямых и обратных хвостов, соответствующих прямым и обратным последовательностям, необходимым для любой из существующих платформ секвенирования, может обеспечить прямое секвенирование после амплификации. В варианте воплощения хвосты можно использовать в качестве общих сайтов праймирования среди всех амплифицированных мишеней, которые можно использовать для добавления других полезных последовательностей. В некоторых вариантах воплощения внутренние праймеры могут содержать область, которая предназначена для гибридизации либо выше, либо ниже целевого локуса (например, полиморфного локуса). В некоторых вариантах воплощения праймеры могут содержать молекулярный штрих-код. В некоторых вариантах воплощения праймер может содержать универсальную последовательность прайминга, разработанную для обеспечения возможности ПЦР-амплификации.
[669] В варианте воплощения создается пул анализа 10000-плексной ПЦР, так что прямой и обратный праймеры имеют хвосты, соответствующие требуемым прямым и обратным последовательностям, необходимым для высокопроизводительного инструмента секвенирования (часто называемого инструментом массового параллельного секвенирования), такого как HISEQ, GAIIX или MYSEQ, доступный от ILLUMINA. Кроме того, в хвосты секвенирования включена дополнительная 5'-последовательность, которая может использоваться в качестве сайта праймирования в последующей ПЦР для добавления последовательностей нуклеотидных штрих-кодов к ампликонам, что обеспечивает возможность мультиплексного секвенирования нескольких образцов на одной дорожке инструмента для секвенирования с высокой пропускной способностью.
[670] В варианте воплощения создается пул анализа 10000-плексной ПЦР, так что обратные праймеры имеют хвосты, соответствующие требуемым обратным последовательностям, необходимым для высокопроизводительного прибора для секвенирования. После амплификации с помощью первого 10000-плексного анализа последующая амплификация ПЦР может быть проведена с использованием другого 10000-плексного пула, имеющего частично вложенные прямые праймеры (например, вложенные 6 оснований) для всех мишеней, и обратный праймер, соответствующий хвосту обратного секвенирования, включенный в первом цикле. Этот последующий цикл частично вложенной амплификации только с одним специфичным для мишени праймером и универсальным праймером ограничивает требуемый размер анализа, уменьшая шум выборки, но значительно сокращает количество побочных ампликонов. К прилагаемым адапторам лигирования и/или как часть ПЦР-зондов могут быть добавлены метки секвенирования, так что метка является частью конечного ампликона.
[671] Фракция опухоли влияет на эффективность теста. Есть несколько способов обогатить опухолевую фракцию ДНК, обнаруженную в плазме пациента. Фракцию опухоли можно увеличить с помощью ранее представленного способа LM-PCR, который уже обсуждался, а также путем целенаправленного удаления длинных фрагментов. В варианте воплощения перед мультиплексной ПЦР-амплификацией целевых локусов может быть проведена дополнительная мультиплексная реакция ПЦР для выборочного удаления длинных и, в основном, материнских фрагментов, соответствующих локусам-мишеням в последующей мультиплексной ПЦР. Дополнительные праймеры предназначены для отжига участка, находящегося на большем расстоянии от полиморфизма, чем ожидается среди бесклеточных фрагментов фетальной ДНК. Эти праймеры можно использовать в одноцикловой мультиплексной реакции ПЦР перед мультиплексной ПЦР целевых полиморфных локусов. Эти дистальные праймеры помечены молекулой или фрагментом, которые могут обеспечить селективное распознавание помеченных фрагментов ДНК. В варианте воплощения эти молекулы ДНК могут быть ковалентно модифицированы молекулой биотина, которая позволяет удалить вновь образованную двухцепочечную ДНК, содержащую эти праймеры, после одного цикла ПЦР. Двухцепочечная ДНК, образующаяся во время этого первого цикла, вероятно, имеет материнское происхождение. Удаление гибридного материала может быть выполнено с помощью магнитных стрептавидиновых микрогранул. Есть и другие способы тегирования, которые могут также работать хорошо. В варианте воплощения могут использоваться способы выбора размера для обогащения образца более короткими цепями ДНК; например, менее приблизительно 800 п.н., менее приблизительно 500 п.н. или менее приблизительно 300 п.н. После этого амплификация коротких фрагментов может продолжаться как обычно.
[672] Способ мини-ПЦР, представленный в данном изобретении, обеспечивает высоко мультиплексную амплификацию и анализ от сотен до тысяч или даже миллионов локусов в одной реакции из одного образца. В то же время обнаружение амплифицированной ДНК может быть мультиплексным; от десятков до сотен образцов можно мультиплексировать в одной полосе секвенирования с помощью ПЦР со штрих-кодированием. Это мультиплексное обнаружение было успешно протестировано до 49-плексного, и теперь возможно гораздо более высокое мультиплексирование. Фактически, это позволяет генотипировать сотни образцов на тысячи ОНП за один прогон секвенирования. Для этих образцов способ позволяет определять генотип и степень гетерозиготности и одновременно определять количество копий, оба из которых могут использоваться с целью обнаружения анеуплоидии. Его можно использовать как часть способа дозирования мутаций. Этот способ может использоваться для любого количества ДНК или РНК, и целевыми областями могут быть ОНП, другие полиморфные области, неполиморфные области и их комбинации.
[673] В некоторых вариантах воплощения можно использовать опосредованную лигированием универсальную-ПЦР-амплификацию фрагментированной ДНК. Универсальная ПЦР-амплификация, опосредованная лигированием, может использоваться для амплификации плазматической ДНК, которая затем может быть разделена на несколько параллельных реакций. Его также можно использовать для предпочтительной амплификации коротких фрагментов, тем самым обогащая опухолевую фракцию. В некоторых вариантах воплощения добавление меток к фрагментам путем лигирования может позволить обнаружение более коротких фрагментов, использование более коротких частей праймеров, специфичных для целевой последовательности, и/или отжиг при более высоких температурах, что снижает неспецифические реакции.
[674] Описанные в данном документе способы могут использоваться для ряда целей, когда есть целевой набор ДНК, который смешан с некоторым количеством загрязняющей ДНК. В некоторых вариантах воплощения целевая ДНК и загрязняющая ДНК могут быть от людей, которые являются генетически родственными. Например, генетические аномалии у плода (мишени) могут быть обнаружены из материнской плазмы, которая содержит ДНК плода (мишень), а также материнскую (загрязняющую) ДНК; аномалии включают целые хромосомные аномалии (например, анеуплоидию), частичные хромосомные аномалии (например, делеции, дупликации, инверсии, транслокации), полинуклеотидные полиморфизмы (например, простой тандемный повтор STR), однонуклеотидные полиморфизмы и/или другие генетические аномалии или различия. В некоторых вариантах воплощения целевая и загрязняющая ДНК могут быть от одного и того же индивидуума, но целевая и загрязняющая ДНК различаются по одной или более мутаций, например, в случае рака. (см., например, H. Mamon et al. Preferential Amplification of Apoptotic DNA from Plasma: Potential for Enhancing Detection of Minor DNA Alterations in Circulating DNA. Clinical Chemistry 54:9 (2008). В некоторых вариантах воплощения ДНК может быть обнаружена в супернатанте клеточной культуры (апоптоз). В некоторых вариантах воплощения можно вызвать апоптоз в биологических образцах (например, крови) для последующего приготовления библиотеки, амплификации и/или секвенирования. Ряд рабочих процессов и протоколов для достижения этой цели представлен в другом месте в этом описании.
[675] В некоторых вариантах воплощения целевая ДНК может происходить из отдельных клеток, из образцов ДНК, состоящих менее чем из одной копии целевого генома, из небольших количеств ДНК, из ДНК смешанного происхождения (например, плазма больного раком и опухоли: смесь здоровой и раковой ДНК, трансплантация и т. д.), из других жидкостей организма, из клеточных культур, из супернатантов культур, из судебно-медицинских образцов ДНК, из древних образцов ДНК (например, насекомых, заключенных в янтаре), из других образцов ДНК и их комбинаций.
[676] В некоторых вариантах воплощения можно использовать ампликоны небольшого размера. Короткие размеры ампликонов особенно подходят для фрагментированной ДНК (см., например, A. Sikora, et sl. Detection of increased amounts of cell-free fetal DNA with short PCR amplicons. Clin Chem. 2010 Jan;56(1):136-8.)
[677] Использование ампликонов небольшого размера может дать некоторые значительные преимущества. Небольшие размеры ампликонов могут привести к оптимизации эффективности амплификации. Короткие размеры ампликонов обычно дают более короткие продукты, поэтому вероятность неспецифического праймирования меньше. Более короткие продукты могут быть сгруппированы более плотно на проточной ячейке секвенирования, так как кластеры будут меньше. Обратите внимание, что представленные в данном документе способы могут одинаково хорошо работать для более длинных ампликонов ПЦР. При необходимости длину ампликона можно увеличить, например, при секвенировании больших участков последовательности. На отдельных клетках и на геномной ДНК с положительными результатами были проведены эксперименты с направленной 146-плексной амплификацией с анализами длиной от 100 до 200 пар оснований в качестве первого шага в протоколе вложенной ПЦР.
[678] В некоторых вариантах воплощения представленные в данном документе способы могут быть использованы для амплификации и/или обнаружения ОНП, числа копий, метилирования нуклеотидов, уровней мРНК, других типов уровней экспрессии РНК, других генетических и/или эпигенетических особенностей. Представленные в данном документе способы мини-ПЦР могут использоваться вместе с секвенированием следующего поколения; его можно использовать с другими следующими способами, такими как микрочипы, подсчет с помощью цифровой ПЦР, ПЦР в реальном времени, масс-спектрометрический анализ и т. д.
[679] В некоторых вариантах воплощения способы мини-ПЦР амплификации, представленные в данном документе, могут использоваться как часть способа точной количественной оценки популяций, присутствующих в меньшинстве. Его можно использовать для абсолютного количественного определения с использованием калибраторов пиков. Его можно использовать для количественной оценки мутаций/минорных аллелей посредством очень глубокого секвенирования, и можно проводить высоко-мультиплексным способом. Его можно использовать для стандартной проверки отцовства и личности родственников или предков у людей, животных, растений или других существ. Может использоваться для судебно-медицинской экспертизы. Его можно использовать для быстрого генотипирования и анализа числа копий (CN) на любом виде материала, например, амниотическая жидкость и проба ворсинчатого хориона, сперма, продукт зачатия (POC). Его можно использовать для анализа отдельных клеток, например для генотипирования образцов биопсии эмбрионов. Его можно использовать для быстрого анализа эмбрионов (менее чем за один, один или два дня после биопсии) путем целевого секвенирования с использованием мини-ПЦР.
[680] В некоторых вариантах воплощения способы мини-ПЦР амплификации могут использоваться для анализа опухолей: биопсия опухоли часто представляет собой смесь здоровых и опухолевых клеток. Целевая ПЦР позволяет проводить глубокое секвенирование ОНП и локусов практически без фоновых последовательностей. Ее можно использовать для анализа количества копий и потери гетерозиготности опухолевой ДНК. Указанная опухолевая ДНК может присутствовать во многих различных жидкостях организма или тканях пациентов с опухолями. Ее можно использовать для обнаружения рецидива опухоли и/или скрининга опухоли. Может использоваться для контроля качества семян. Может использоваться для разведения животных или рыбной ловли. Обратите внимание, что любой из этих способов может с равным успехом использоваться для нацеливания на неполиморфные локусы с целью распознавания плоидности.
[681] Некоторая литература, описывающая некоторые из фундаментальных способов, которые лежат в основе представленных в данном документе способов, включает: (1) Wang HY, Luo M, Tereshchenko IV, Frikker DM, Cui X, Li JY, Hu G, Chu Y, Azaro MA, Lin Y, Shen L, Yang Q, Kambouris ME, Gao R, Shih W, Li H. Genome Res. 2005 Feb;15(2):276-83. Department of Molecular Genetics, Microbiology and Immunology/The Cancer Institute of New Jersey, Robert Wood Johnson Medical School, New Brunswick, New Jersey 08903, USA. (2) High-throughput genotyping of single nucleotide polymorphisms with high sensitivity. Li H, Wang HY, Cui X, Luo M, Hu G, Greenawalt DM, Tereshchenko IV, Li JY, Chu Y, Gao R. Methods Mol Biol. 2007;396 - PubMed PMID: 18025699. (3) Способ, включающий мультиплексирование в среднем 9 анализов для секвенирования, описан в: Nested Patch PCR enables highly multiplexed mutation discovery in candidate genes. Varley KE, Mitra RD. Genome Res. 2008 Nov;18(11):1844-50. Epub 2008 Oct 10. Примите во внимание, что раскрытые в данном документе способы позволяют мультиплексировать на несколько порядков больше, чем в приведенных выше ссылках.
[682] Примерные наборы
[683] В одном аспекте изобретение представляет собой набор, такой как набор для амплификации целевых локусов в образце нуклеиновой кислоты для обнаружения делеций и/или дупликаций хромосомных сегментов или целых хромосом с использованием любого из представленных в данном документе способов. В некоторых вариантах воплощения набор может включать любую из библиотек праймеров по изобретению. В варианте воплощения набор включает множество внутренних прямых праймеров и, необязательно, множество внутренних обратных праймеров, и необязательно внешних прямых праймеров и внешних обратных праймеров, где каждый из праймеров предназначен для гибридизации с областью ДНК, расположенной непосредственно выше и/или или ниже одного из целевых сайтов (например, полиморфных сайтов) на целевой хромосоме(ах) или сегменте(ах) хромосомы, и, необязательно, дополнительных хромосомах или сегментах хромосомы. В некоторых вариантах воплощения набор включает инструкции по использованию библиотеки праймеров для амплификации целевых локусов, например, для обнаружения одной или более делеций и/или дупликаций одного или более сегментов хромосомы или целых хромосом с использованием любого из представленных в данном документе способов.
[684] В некоторых вариантах воплощения наборы по изобретению обеспечивают пары праймеров для обнаружения хромосомной анеуплоидии и определения ВЧК, такие как пары праймеров для массовых мультиплексных реакций для обнаружения хромосомных анеуплоидий, таких как ВЧК (CoNVERGe) (Copy Number Variant Events Revealed Genotypically) и/или ОНВ. В этих вариантах воплощения наборы могут включать в себя по меньшей мере 100, 200, 250, 300, 500, 1000, 2000, 2500, 3000, 5000, 10000, 20000, 25000, 28000, 50000 или 75000 и не более 200, 250, 300, 500, 1000, 2000, 2500, 3000, 5000, 10000, 20000, 25000, 28000, 50000, 75000 или 100000 пар праймеров, которые поставляются вместе. Пары праймеров могут содержаться в одной емкости, такой как одна пробирка или коробка, или несколько пробирок или коробок. В некоторых вариантах воплощения пары праймеров предварительно квалифицируются коммерческим поставщиком и продаются вместе, а в других вариантах воплощения заказчик выбирает индивидуализированные генные мишени и/или праймеры, а коммерческий поставщик изготавливает и отправляет пул праймеров заказчику или в пробирке, или в множестве пробирок. В некоторых примерных вариантах воплощения наборы включают праймеры для обнаружения как ВЧК, так и ОНВ, особенно ВЧК и ОНВ, которые, как известно, коррелируют по меньшей мере с одним типом рака.
[685] Наборы для обнаружения циркулирующей ДНК в соответствии с некоторыми вариантами воплощения настоящего изобретения включают стандарты и/или контроли для обнаружения циркулирующей ДНК. Например, в некоторых вариантах воплощения стандарты и/или контроли продаются и, необязательно, отправляются и упаковываются вместе с праймерами, используемыми для проведения реакций амплификации, предусмотренных в настоящем документе, такими как праймеры для выполнения CoNVERGe. В некоторых вариантах воплощения контроли включают полинуклеотиды, такие как ДНК, включая изолированную геномную ДНК, которая проявляет одну или более хромосомных анеуплоидий, таких как ВЧК, и/или включает один или более ОНВ. В некоторых вариантах воплощения стандарты и/или контроли называются стандартами PlasmArt и включают полинуклеотиды, последовательность которых идентична участкам генома, которые, как известно, проявляют ВЧК, особенно при определенных наследственных заболеваниях и при определенных болезненных состояниях, таких как рак, а также распределение по размеру, которое отражает распределение фрагментов скДНК, встречающихся в естественных условиях в плазме. Примерные способы создания стандартов PlasmArt представлены в приведенных в данном документе примерах. Как правило, геномную ДНК из источника, о котором известно, что он включает хромосомную анеуплоидию, выделяют, фрагментируют, очищают и выбирают по размеру.
[686] Соответственно, стандарты и/или контроли искусственных полинуклеотидов скДНК могут быть изготовлены путем добавления образцов выделенных полинуклеотидов, приготовленных, как описано выше, в образцы ДНК, которые, как известно, не проявляют хромосомной анеуплоидии и/или ОНВ, в концентрациях, аналогичных наблюдаемым для скДНК in vivo, например, от 0,01% до 20%, от 0,1 до 15% или от 0,4 до 10% ДНК в такой жидкости. Эти стандарты/контроли могут использоваться в качестве контролей для конструирования, характеристики, разработки и/или валидации анализа, а также в качестве стандартов контроля качества во время тестирования, например, при тестировании на рак, выполняемом в лаборатории CLIA, и/или в качестве стандартов, включенных только в исследовательское использование или наборы диагностических тестов.
[687] Примерные способы нормализации/коррекции
[688] В некоторых вариантах воплощения измерения для разных локусов, хромосомных сегментов или хромосом корректируются с учетом смещения, например смещения из-за различий в содержании GC или смещения из-за других различий в эффективности амплификации или с учетом ошибок секвенирования. В некоторых вариантах воплощения измерения для разных аллелей одного и того же локуса скорректированы с учетом различий в метаболизме, апоптозе, гистонах, инактивации и/или амплификации между аллелями. В некоторых вариантах воплощения измерения для разных аллелей одного и того же локуса в РНК скорректированы с учетом различий в скорости транскрипции или стабильности между разными аллелями РНК.
[689] Примерные способы фазирования генетических данных
[690] В некоторых вариантах воплощения генетические данные фазируются с использованием представленных в данном документе способов или любого известного способа фазирования генетических данных (см., например, Публикация РСТ № WO2009/105531, поданная 9 февраля 2009 года, и Публикация РСТ № WO2010/017214, поданная 4 августа 2009 года; Публикация заявки на патент США № 2013/0123120, 21 ноября 2012 года; Публикация заявки на патент США № 2011/0033862, поданная 7 октября 2010 года; Публикация заявки на патент США № 2011/0033862, поданная 19 августа 2010 года; Публикация заявки на патент США № 2011/0178719, поданная 3 февраля 2011 года; Патент США № 8515679, поданный 17 марта 2008 года; Публикация заявки на патент США № 2007/0184467, поданная 22 ноября 2006 года; Публикация заявки на патент США № 2008/0243398, поданная 17 марта 2008 года, и Предварительная заявка на патент США, регистрационный № 61/994791, поданная 16 мая 2014 года, каждый из этих документов полностью включен сюда посредством ссылки). В некоторых вариантах воплощения фаза определяется для одной или более областей, которые, как известно, или предположительно содержат представляющую интерес ВЧК. В некоторых вариантах воплощения фаза также определяется для одной или более областей, фланкирующих область(и) ВЧК, и/или для одной или более референтных областей. В одном варианте воплощения генетические данные индивидуума фазируются путем выведения путем измерения гаплоидной ткани индивидуума, например, путем измерения одного или более сперматозоидов или яйцеклеток. В одном варианте воплощения генетические данные индивидуума фазируются путем выведения с использованием измеренных генотипических данных одного или более родственников первой степени родства, таких как родители индивидуума (например, сперма от отца индивидуума) или братья и сестры.
[691] В одном варианте воплощения генетические данные индивидуума фазируются, когда ДНК или РНК разводятся в одной или более лунок, например, с помощью цифровой ПЦР. В некоторых вариантах воплощения ДНК или РНК разводят до точки, при которой ожидается не более приблизительно одной копии каждого гаплотипа в каждой лунке, а затем измеряют ДНК или РНК в одной или более лунок. В некоторых вариантах воплощения клетки задерживаются в фазе митоза, когда хромосомы представляют собой плотные связки, и для помещения отдельных хромосом в отдельные лунки используется микрофлюидика. Поскольку ДНК или РНК разбавлены, маловероятно, что в одной фракции (или пробирке) находится более одного гаплотипа. Таким образом, фактически в пробирке может находиться одна молекула ДНК, что позволяет определить гаплотип на одной молекуле ДНК или РНК. В некоторых вариантах воплощения способ включает разделение образца ДНК или РНК на множество фракций, так что по меньшей мере одна из фракций включает одну хромосому или один сегмент хромосомы из пары хромосом, и генотипирование (например, определение наличия двух или более полиморфных локусов) образца ДНК или РНК по меньшей мере в одной из фракций, тем самым определяя гаплотип. В некоторых вариантах воплощения генотипирование включает секвенирование (такое как дробное секвенирование или секвенирование отдельной молекулы), матрицу ОНП для обнаружения полиморфных локусов или мультиплексную ПЦР. В некоторых вариантах воплощения генотипирование включает использование матрицы ОНП для обнаружения полиморфных локусов, например по меньшей мере 100; 200; 500; 750; 1000; 2000; 5000; 7500; 10000; 20000; 25000; 30000; 40000; 50000; 75000; или 100000 различных полиморфных локусов. В некоторых вариантах воплощения генотипирование включает использование мультиплексной ПЦР. В некоторых вариантах воплощения способ включает контактирование образца во фракции с библиотекой праймеров, которые одновременно гибридизируются по меньшей мере со 100; 200; 500; 750; 1000; 2000; 5000; 7500; 10000; 20000; 25000; 30000; 40000; 50000; 75000; или 100000 различных полиморфных локусов (таких как ОНП) для получения реакционной смеси; и воздействие на реакционную смесь условий реакции удлинения праймера для получения продуктов амплификации, которые измеряются с помощью высокопроизводительного секвенатора для получения данных секвенирования. В некоторых вариантах воплощения РНК (например, мРНК) секвенирована. Поскольку мРНК содержит только экзоны, секвенирование мРНК позволяет определять аллели полиморфных локусов (таких как ОНП) на большом расстоянии в геноме, например, в несколько мегабаз. В некоторых вариантах воплощения гаплотип индивидуума определяется сортировкой хромосом. Типичный способ сортировки хромосом включает задержку клеток на фазе митоза, когда хромосомы представляют собой плотные пучки, и использование микрофлюидики для помещения отдельных хромосом в отдельные лунки. Другой способ включает сбор отдельных хромосом с помощью FACS-опосредованной сортировки отдельных хромосом. Для идентификации аллелей на одной хромосоме с целью определения гаплотипа индивидуума могут использоваться стандартные способы (такие как секвенирование или матрица).
[692] В некоторых вариантах воплощения гаплотип индивидуума определяется путем секвенирования с длинным считыванием, например, с использованием технологии Moleculo, разработанной Illumina. В некоторых вариантах воплощения этап подготовки библиотеки включает разрезание ДНК на фрагменты, например, фрагменты размером ~10 т.п.н., разбавление фрагментов и размещение их в лунках (так, чтобы в одной лунке находилось приблизительно 3000 фрагментов), амплификацию фрагментов в каждой лунке с помощью ПЦР длинных фрагментов, разрезание на короткие фрагменты и штрих-кодирование фрагментов, а также объединение фрагментов со штрих-кодом из каждой лунки для их совместного секвенирования. После секвенирования вычислительные этапы включают разделение считываний из каждой лунки на основе прикрепленных штрих-кодов и группировку их во фрагменты, сборку фрагментов в перекрывающихся гетерозиготных ОНВ в блоки гаплотипов и статистическое фазирование блоков на основе поэтапной референтной панели, и получение длинных контигов гаплотипов.
[693] В некоторых вариантах воплощения гаплотип индивидуума определяется с использованием данных от родственника индивидуума. В некоторых вариантах воплощения используется матрица ОНП для определения наличия по меньшей мере 100; 200; 500; 750; 1000; 2000; 5000; 7500; 10000; 20000; 25000; 30000; 40000; 50000; 75000; или 100000 различных полиморфных локусов в образце ДНК или РНК от индивидуума и его родственника. В некоторых вариантах воплощения способ включает контактирование образца ДНК от индивидуума и/или родственника индивидуума с библиотекой праймеров, которые одновременно гибридизируются по меньшей мере с 100; 200; 500; 750; 1000; 2000; 5000; 7500; 10000; 20000; 25000; 30000; 40000; 50000; 75000; или 100000 различных полиморфных локусов (таких как ОНП) для получения реакционной смеси; и воздействие на реакционную смесь условий реакции удлинения праймера для получения продуктов амплификации, которые измеряются с помощью высокопроизводительного секвенатора для получения данных секвенирования.
[694] В одном варианте воплощения генетические данные индивидуума фазируются с помощью компьютерной программы, которая использует популяционные частоты гаплотипов для определения наиболее вероятной фазы, например, фазирование на основе HapMap. Например, наборы гаплоидных данных могут быть выведены непосредственно из диплоидных данных с помощью статистических способов, которые используют известные блоки гаплотипов в общей популяции (например, созданные для общедоступного проекта HapMap и для проекта гаплотипа человека Perlegen). Блок гаплотипа - это, по сути, серия коррелированных аллелей, которые неоднократно встречаются в различных популяциях. Поскольку эти блоки гаплотипов часто бывают древними и распространенными, их можно использовать для прогнозирования гаплотипов на основе диплоидных генотипов. Общедоступные алгоритмы, которые решают эту задачу, включают несовершенный филогенетический подход, байесовские подходы, основанные на сопряженных исходных данных, и исходные данные из популяционной генетики. Некоторые из этих алгоритмов используют скрытую марковскую модель.
[695] В одном из вариантов воплощения, индивидуальные генетические данные фазируются с использованием алгоритма, который оценивает гаплотипы на основе данных генотипа, например алгоритма, использующего локализованную кластеризацию гаплотипов (см., например, Browning and Browning, “Rapid and Accurate Haplotype Phasing and Missing-Data Inference for Whole-Genome Association Studies By Use of Localized Haplotype Clustering” Am J Hum Genet. Nov 2007; 81(5): 1084-1097, документ полностью включен сюда посредством ссылки). Примерной программой является Beagle версия: 3.3.2 или версия 4 (доступна по веб-адресу hfaculty.washington.edu/browning/beagle/beagle.html, документ полностью включен сюда посредством ссылки).
[696] В одном из вариантов воплощения, генетические данные индивидуума фазируются с использованием алгоритма, который оценивает гаплотипы на основе данных генотипа, таких как алгоритм, который использует распад неравновесия по сцеплению с расстоянием, порядок и интервалы генотипированных маркеров, условную подстановку отсутствующих данных, оценку скорости рекомбинации или их комбинацию (см., например, Stephens and Scheet, “Accounting for Decay of Linkage Disequilibrium in Haplotype Inference and Missing-Data Imputation” Am. J. Hum. Genet. 76:449-462, 2005, документ полностью включен сюда посредством ссылки). Примерной программой является PHASE v.2.1 или v2.1.1. (доступные по веб адресу stephenslab.uchicago.edu/software.html, документ полностью включен сюда посредством ссылки).
[697] В одном из вариантов воплощения, генетические данные индивидуума фазируются с использованием алгоритма, который оценивает гаплотипы по данным популяционного генотипа, такого как алгоритм, который позволяет членству в кластерах непрерывно изменяться вдоль хромосомы в соответствии со скрытой марковской моделью. Этот подход является гибким, допускающим как «блочные» модели неравновесия по сцеплению, так и постепенное снижение неравновесия по сцеплению с расстоянием (см., например, Scheet and Stephens, “A fast and flexible statistical model for large-scale population genotype data: applications to inferring missing genotypes and haplotypic phase.” Am J Hum Genet, 78:629-644, 2006, документ полностью включен сюда посредством ссылки). Примерной программой является fastPHASE (доступная по веб- адресу stephenslab.uchicago.edu/software.html, документ полностью включен сюда посредством ссылки).
[698] В одном из вариантов воплощения, генетические данные индивидуума фазируются с использованием способа условной подстановки генотипа, такого как способ, который использует один или более из следующих референтных наборов данных: набор данных HapMap, наборы данных контролей, генотипированных на нескольких чипах ОНП, и плотно типизированные образцы из проекта 1,000 Genomes Project. Примерным подходом является гибкая структура моделирования, которая повышает точность и объединяет информацию из нескольких референтных панелей (см., например, Howie, Donnelly, and Marchini (2009) “A flexible and accurate genotype imputation method for the next generation of genome-wide association studies.” PLoS Genetics 5(6): e1000529, 2009, документ полностью включен сюда посредством ссылки). Примерными программами являются IMPUTE или IMPUTE версия 2 (также известная как IMPUTE2) (доступные по веб-адресу mathgen.stats.ox.ac.uk/impute/impute_v2.html, которые полностью включены сюда посредством ссылки).
[699] В одном из вариантов воплощения, генетические данные индивидуума фазируются с использованием алгоритма, который выводит гаплотипы, такого как алгоритм, который выводит гаплотипы в соответствии с генетической моделью слияния с рекомбинацией, такой как разработанный Стивенсом в PHASE v2.1. Основные алгоритмические улучшения основаны на использовании двоичных деревьев для представления наборов гаплотипов-кандидатов для каждого индивидуума. Эти представления бинарного дерева: (1) ускоряют вычисления апостериорных вероятностей гаплотипов, избегая избыточных операций, сделанных в PHASE v2.1, и (2) преодолевают экспоненциальный аспект проблемы вывода гаплотипов за счет интеллектуального исследования большинства вероятных путей (т.е.,гаплотипов) в бинарных деревьях (см., например, Delaneau, Coulonges and Zagury, “Shape-IT: new rapid and accurate algorithm for haplotype inference,” BMC Bioinformatics 9:540, 2008 doi:10.1186/1471-2105-9-540, документ полностью включен сюда посредством ссылки). Примерной программой является SHAPEIT (доступная по веб-адресу mathgen.stats.ox.ac.uk/genetics_software/shapeit/shapeit.html, документ полностью включен сюда посредством ссылки).
[700] В одном из вариантов воплощения, генетические данные индивидуума фазируются с использованием алгоритма, который оценивает гаплотипы по данным популяционного генотипа, такого как алгоритм, который использует частоты фрагментов гаплотипов для получения эмпирически обоснованных вероятностей для более длинных гаплотипов. В некоторых вариантах воплощения алгоритм реконструирует гаплотипы так, чтобы они имели максимальную локальную когерентность (см., например, Eronen, Geerts, and Toivonen, “HaploRec: Efficient and accurate large-scale reconstruction of haplotypes,”BMC Bioinformatics 7:542, 2006, документ полностью включен сюда посредством ссылки). Примерной программой является HaploRec, например HaploRec версия 2.3. (доступная по веб-адресу cs.helsinki.fi/group/genetics/haplotyping.html, документ полностью включен сюда посредством ссылки).
[701] В одном из вариантов воплощения, генетические данные индивидуума фазируются с использованием алгоритма, который оценивает гаплотипы на основе данных генотипа популяции, такого как алгоритм, который использует стратегию разделения-лигирования, и алгоритм, основанный на максимизации ожидания (см., например, Qin, Niu, and Liu, “Partition-Ligation-Expectation-Maximization Algorithm for Haplotype Inference with Single-Nucleotide Polymorphisms,” Am J Hum Genet. 71(5): 1242-1247, 2002, документ полностью включен сюда посредством ссылки). Примерной программой является PL-EM (доступная по веб-адресу people.fas.harvard.edu/~junliu/plem/click.html, документ полностью включен сюда посредством ссылки).
[702] В одном из вариантов воплощения, генетические данные индивидуума фазируются с использованием алгоритма, который оценивает гаплотипы по данным популяционного генотипа, такого как алгоритм для одновременного фазирования генотипов на гаплотипы и разделение блоков. В некоторых вариантах воплощения, используется алгоритм максимизации ожидания (см., например, Kimmel and Shamir, “GERBIL: Genotype Resolution and Block Identification Using Likelihood,” Proceedings of the National Academy of Sciences of the United States of America (PNAS) 102: 158-162, 2005, документ полностью включен сюда посредством ссылки). Примерной программой является GERBIL, доступная как часть программы GEVALT версия 2 (доступная по веб адресу acgt.cs.tau.ac.il/gevalt/, документ полностью включен сюда посредством ссылки).
[703] В одном из вариантов воплощения, генетические данные индивидуума фазируются с использованием алгоритма, который оценивает гаплотипы на основе данных генотипа популяции, такого как алгоритм, который использует алгоритм EM для вычисления оценок ML частот гаплотипов с учетом измерений генотипа, которые не указывают фазу. Алгоритм также допускает отсутствие некоторых измерений генотипа (например, из-за неудачной ПЦР). Он также позволяет проводить множественные условные подстановки индивидуальных гаплотипов (см., например, Clayton, D. (2002), "SNPHAP: A Program for Estimating Frequencies of Large Haplotypes of SNPs", документ полностью включен сюда посредством ссылки). Примерной программой является SNPHAP (доступная по веб-адресу gene.cimr.cam.ac.uk/clayton/software/snphap.txt, документ полностью включен сюда посредством ссылки).
[704] В одном из вариантов воплощения, генетические данные индивидуума фазируются с использованием алгоритма, который оценивает гаплотипы на основе данных генотипа популяции, такого как алгоритм вывода гаплотипа на основе статистики генотипа, собранной для пар ОНП. Это программное обеспечение можно использовать для сравнительно точного фазирования большого количества длинных последовательностей генома, например полученных из матриц ДНК. Примерная программа принимает матрицу генотипов в качестве входных данных и выводит соответствующую матрицу гаплотипов. (см., например, Brinza and Zelikovsky, “2SNP: scalable phasing based on 2-SNP haplotypes,” Bioinformatics.22(3):371-3, 2006, документ полностью включен сюда посредством ссылки). Примерной программой является 2SNP (доступная по веб адресу alla.cs.gsu.edu/~software/2SNP, документ полностью включен сюда посредством ссылки).
[705] В различных вариантах воплощения, генетические данные индивидуума фазируются с использованием данных о вероятности кроссинговера хромосом в разных местах хромосомы или сегмента хромосомы (например, с использованием данных рекомбинации, которые могут быть найдены в базе данных HapMap, для создания оценки риска рекомбинации для любого интервала) для моделирования зависимости между полиморфными аллелями на хромосоме или сегменте хромосомы. В некоторых вариантах воплощения, количество аллелей в полиморфных локусах рассчитывается на компьютере на основе данных секвенирования или данных матрицы ОНП. В некоторых вариантах воплощения, создается (например, создание на компьютере) множество гипотез, каждая из которых относится к различному возможному состоянию хромосомы или сегмента хромосомы (например, чрезмерное представление количества копий первого гомологичного сегмента хромосомы по сравнению со вторым гомологичным сегментом хромосомы в геноме одной или более клеток из индивидуум, дупликация первого гомологичного сегмента хромосомы, делеция второго гомологичного сегмента хромосомы или равное представление первого и второго гомологичных сегментов хромосомы); для каждой гипотезы строится (например, на компьютере) модель (например, совместная модель распределения) ожидаемого количества аллелей в полиморфных локусах хромосомы; определяется (например, определение на компьютере) относительная вероятность каждой из гипотез с использованием модели совместного распределения и подсчета аллелей; и выбирается гипотеза с наибольшей вероятностью. В некоторых вариантах воплощения построение объединенной модели распределения для количества аллелей и этап определения относительной вероятности каждой гипотезы выполняется с использованием способа, который не требует использования референтной хромосомы.
[706] В некоторых вариантах воплощения образец (например, биопсия, такая как биопсия опухоли, образец крови, образец плазмы, образец сыворотки или другой образец, который может содержать в основном или только клетки, ДНК или РНК с представляющим интерес ВЧК) от индивидуума анализируется для определения фазы для одной или более областей, о которых известно или предполагается, что они содержат интересующую ВЧК (например, делецию или дупликацию). В некоторых вариантах воплощения образец имеет высокую фракцию опухоли (например, 30, 40, 50, 60, 70, 80, 90, 95, 98, 99 или 100%).
[707] В некоторых вариантах воплощения образец имеет гаплотипический дисбаланс или любую анеуплоидию. В некоторых вариантах воплощения образец включает любую смесь двух типов ДНК, где два типа имеют разные соотношения двух гаплотипов и имеют по меньшей мере один гаплотип. Например, в случае опухоли, нормальная ткань составляет 1:1, а опухолевая ткань - 1:0 или 1:2, 1:3, 1:4 и т. д. В некоторых вариантах воплощения анализируются по меньшей мере 10; 100; 500; 1000; 2000; 3000; 5000; 8000; или 10000 полиморфных локусов для определения фазы аллелей в некоторых или во всех локусах. В некоторых вариантах воплощения образец взят из клетки или ткани, которые были обработаны для получения анеуплоидии, такой как анеуплоидия, индуцированная длительным культивированием клеток.
[708] В некоторых вариантах воплощения большой процент или вся ДНК или РНК в образце имеют представляющую интерес ВЧК. В некоторых вариантах воплощения соотношение ДНК или РНК из одной или более клеток-мишеней, содержащих интересующую ВЧК, к общей ДНК или РНК в образце составляет по меньшей мере 80, 85, 90, 95 или 100%. Для образцов с делецией присутствует только один гаплотип для клеток (или ДНК, или РНК) с делецией. Этот первый гаплотип можно определить стандартными способами для определения идентичности аллелей, присутствующих в области делеции. В образцах, которые содержат только клетки (или ДНК или РНК) с делецией, будет сигнал только от первого гаплотипа, присутствующего в этих клетках. В образцах, которые также содержат небольшое количество клеток (или ДНК или РНК) без делеции (например, небольшое количество доброкачественных клеток), слабый сигнал от второго гаплотипа в этих клетках (или ДНК или РНК) можно игнорировать. Второй гаплотип, который присутствует в других клетках, ДНК или РНК индивидуума, у которых отсутствует делеция, может быть определен путем вывода. Например, если генотип клеток индивидуума без делеции равен (AB, AB), а фазированные данные для индивидуума указывают, что первый гаплотип - (A, A); тогда другой гаплотип может быть выведен как (B, B).
[709] Для образцов, в которых присутствуют как клетки (или ДНК, или РНК) с делецией, так и клетки (или ДНК или РНК) без делеции, фаза все же может быть определена. Например, могут быть созданы графики, на которых ось абсцисс представляет линейное положение отдельных локусов вдоль хромосомы, а ось ординат представляет количество считываемых аллелей А как долю от общего числа (А + В) считываний аллелей. В некоторых вариантах воплощения для делеции паттерн включает две центральные полосы, которые представляют ОНП, по которым индивид является гетерозиготным (верхняя полоса представляет AB из клеток без делеции и A из клеток с делецией, а нижняя полоса представляет AB из клеток без делеции и B из клетки с делецией). В некоторых вариантах воплощения разделение этих двух полос увеличивается по мере увеличения доли клеток, ДНК или РНК с делецией. Таким образом, идентичность аллелей A может использоваться для определения первого гаплотипа, а идентичность аллелей B может использоваться для определения второго гаплотипа.
[710] Для образцов с дупликацией дополнительная копия гаплотипа присутствует для клеток (или ДНК, или РНК) с дупликацией. Этот гаплотип дуплицированной области может быть определен с использованием стандартных способов определения идентичности аллелей, присутствующих в увеличенном количестве в области дупликации, или гаплотип области, которая не дуплицируется, может быть определен с использованием стандартных способов для определения идентичности аллелей, присутствующих в уменьшенном количестве. Как только определен один гаплотип, другой гаплотип может быть определен путем вывода.
[711] Для образцов, в которых присутствуют как клетки (или ДНК, или РНК) с дупликацией, так и клетки (или ДНК или РНК) без дупликации, фазу все же можно определить с помощью способа, аналогичного представленному выше для делеций. Например, могут быть созданы графики, на которых ось абсцисс представляет линейное положение отдельных локусов вдоль хромосомы, а ось ординат представляет количество считываемых аллелей А как долю от общего числа (А + В) считываний аллелей. В некоторых вариантах воплощения для делеции паттерн включает две центральные полосы, которые представляют ОНП, по которым индивидуум является гетерозиготным (верхняя полоса представляет AB из клеток без дупликации и AAB из клеток с дупликацией, а нижняя полоса представляет AB из клеток без дупликации и ABB из клеток с дупликацией). В некоторых вариантах воплощения разделение этих двух полос увеличивается по мере увеличения доли клеток, ДНК или РНК с дупликацией. Таким образом, идентичность аллелей A может использоваться для определения первого гаплотипа, а идентичность аллелей B может использоваться для определения второго гаплотипа. В некоторых вариантах воплощения фаза одного или более участков ВЧК (например, фаза по меньшей мере 50, 60, 70, 80, 90, 95 или 100% полиморфных локусов в измеряемой области) определяется для образца (например, биопсия опухоли или образец плазмы) от индивидуума, о котором известно, что он болен раком, и используется для анализа последующих образцов от того же индивидуума для того, чтобы отслеживать прогрессирование рака (например, мониторинг ремиссии или повторного возникновения рака). В некоторых вариантах воплощения образец с высокой фракцией опухоли (например, биопсия опухоли или образец плазмы от индивидуума с высокой опухолевой нагрузкой) используется для получения фазированных данных, которые используются для анализа последующих образцов с более низкой фракцией опухоли (например, образец плазмы от индивидуума, проходящего лечение от рака или находящегося в стадии ремиссии).
[712] В некоторых вариантах воплощения для фазирования генетических данных индивидуума используются два или более из представленных в данном документе способов. В некоторых вариантах воплощения для получения фактических фазированных данных используется как способ биоинформатики (например, использование частот гаплотипов на основе популяции для определения наиболее вероятной фазы), так и способ молекулярной биологии (например, любой из способов молекулярного фазирования, раскрытых в настоящем документе, а не предполагаемых фазированных данных на основе биоинформатики). В некоторых вариантах воплощения фазированные данные от других субъектов (например, предыдущих субъектов) используются для уточнения данных о популяции. Например, фазированные данные от других субъектов могут быть добавлены к данным о популяции для расчета исходных данных для возможных гаплотипов для другого субъекта. В некоторых вариантах воплощения фазированные данные от других субъектов (например, предыдущих субъектов) используются для расчета исходных данных для возможных гаплотипов для другого субъекта.
[713] В некоторых вариантах воплощения могут использоваться вероятностные данные. Например, из-за вероятностного характера представления молекул ДНК в образце, а также из-за различных ошибок амплификации и измерении относительное количество молекул ДНК, измеренное из двух разных локусов или из разных аллелей в данном локусе, не всегда отражает относительное количество молекул в смеси или у индивидуума. Если пытаться определять генотип нормального диплоидного индивидуума в данном локусе на аутосомной хромосоме путем секвенирования ДНК из плазмы индивидуума, можно было бы ожидать, что будет наблюдаться либо только один аллель (гомозиготный), либо приблизительно равное количество двух аллелей (гетерозиготный). Если бы на этом аллеле наблюдались десять молекул аллеля A и наблюдались две молекулы аллеля B, было бы неясно, был ли индивидуум гомозиготным по локусу, а две молекулы аллеля B были обусловлены шумом или загрязнением, или если индивидуум был гетерозиготным, и меньшее количество молекул аллеля B было вызвано случайным статистическим изменением количества молекул ДНК в плазме, смещением амплификации, загрязнением или любым количеством других причин. В этом случае можно рассчитать вероятность того, что индивидуум был гомозиготным, и соответствующую вероятность того, что индивидуум был гетерозиготным, и эти вероятностные генотипы можно было использовать в дальнейших вычислениях.
[714] Примите во внимание, что для данного соотношения аллелей вероятность того, что это соотношение точно представляет соотношение молекул ДНК у индивидуума, тем больше, чем больше количество наблюдаемых молекул. Например, если бы нужно было измерить 100 молекул A и 100 молекул B, вероятность того, что фактическое соотношение составляет 50%, значительно выше, чем если бы нужно было измерить 10 молекул A и 10 молекул B. В одном варианте воплощения используется байесовская теория в сочетании с подробной моделью данных для определения вероятности того, что конкретная гипотеза верна с учетом наблюдения. Например, если бы кто-то рассматривал две гипотезы - одну, которая соответствует трисомному индивидууму, и другую, которая соответствует дисомному индивидууму, то вероятность того, что дисомная гипотеза будет правильной, будет значительно выше для случая, где наблюдалось 100 молекул каждого из двух аллелей, по сравнению со случаем, когда наблюдались 10 молекул каждого из двух аллелей. По мере того, как данные становятся более зашумленными из-за систематической ошибки, загрязнения или какого-либо другого источника шума, или по мере того, как количество наблюдений в данном локусе уменьшается, вероятность того, что гипотеза максимального правдоподобия будет верной, с учетом наблюдаемых данных падает. На практике можно агрегировать вероятности по множеству локусов, чтобы повысить уверенность в том, что гипотеза максимального правдоподобия может быть определена как правильная. В некоторых вариантах воплощения вероятности просто суммируются без учета рекомбинации. В некоторых вариантах воплощения в расчетах учтены кроссоверы.
[715] В одном из вариантов воплощения вероятностно фазированные данные используются при определении вариации количества копий. В некоторых вариантах воплощения вероятностно фазированные данные являются данными о частоте блоков гаплотипов на основе популяционного источника данных, такого как база данных HapMap. В некоторых вариантах воплощения вероятностно фазированные данные являются данными о гаплотипах, полученных молекулярным способом, например, фазирование путем разбавления, когда отдельные сегменты хромосом разбавляются до одной молекулы на реакцию, но из-за стохастического шума идентичность гаплотипов может быть полностью неизвестной. В некоторых вариантах воплощения вероятностно фазированные данные является данными о гаплотипе, полученными молекулярным способом, где идентичность гаплотипов может быть известна с высокой степенью уверенности.
[716] Представьте себе гипотетический случай, когда врач хотел определить, есть ли в организме индивидуума некоторые клетки с делецией в определенном сегменте хромосомы, путем измерения ДНК плазмы этого индивидуума. Врач мог бы использовать информацию о том, что если бы все клетки, из которых произошла ДНК плазмы, были диплоидными и имели один и тот же генотип, то для гетерозиготных локусов относительное количество молекул ДНК, наблюдаемых для каждого из двух аллелей, попало бы в одно распределение, сосредоточенное на 50% аллелей A и 50% аллелей B. Однако, если фракция клеток, из которых произошла ДНК плазмы, имела делецию в определенном сегменте хромосомы, то для гетерозиготных локусов можно было бы ожидать, что относительное количество молекул ДНК, наблюдаемых для каждого из двух аллелей, будет делиться на два распределения, одно с центром выше 50% аллеля A для локусов, в которых произошла делеция сегмента хромосомы, содержащего аллель B, и одно с центром ниже 50% для локусов, где произошла делеция сегмента хромосомы, содержащего аллель A. Чем большая доля клеток, из которых произошла ДНК плазмы, содержала делецию, тем дальше от 50% будут эти два распределения.
[717] В этом гипотетическом случае представьте себе клинициста, который хочет определить, была ли у индивидуума делеция хромосомной области в определенной части клеток в организме индивидуума. Клиницист может взять кровь у индивидуума в вакутейнер или пробирку другого типа, центрифугировать кровь и выделить слой плазмы. Клиницист может выделить ДНК из плазмы, обогатить ДНК в целевых локусах, возможно, с помощью целевой или другой амплификации, способов захвата локусов, увеличения размера или других способов обогащения. Клиницист может анализировать, например, путем измерения количества аллелей в наборе ОНП, другими словами, генерируя данные частоты аллелей, обогащенную и/или амплифицированную ДНК, используя такой анализ, как кПЦР, секвенирование, микроматрица или другие способы измерения количества ДНК в образце. Мы рассмотрим анализ данных для случая, когда клиницист амплифицировал внеклеточную плазменную ДНК с помощью способа целевой амплификации, а затем секвенировал амплифицированную ДНК так, чтобы получить следующие примерные возможные данные для шести ОНП, обнаруженных на сегменте хромосомы, который указывает на рак там, где индивидуум оказался гетерозиготным по этим ОНП:
[718] ОНП 1: 460 считываний аллеля А; 540 считываний аллеля В (46% A)
[719] ОНП 2: 530 считываний аллеля А; 470 считываний аллеля В (53% A)
[720] ОНП 3: 40 считываний аллеля А; 60 считываний аллеля В (40% A)
[721] ОНП 4: 46 считываний аллеля А; 54 считываний аллеля В (46% A)
[722] ОНП 5: 520 считываний аллеля А; 480 считываний аллеля В (52% A)
[723] ОНП 6: 200 считываний аллеля А; 200 считываний аллеля В (50% A)
[724] Из этого набора данных, может быть трудно провести различие между случаем, когда индивидуум является нормальным, когда все клетки являются дисомными, или когда у индивидуума может быть рак, с некоторой частью клеток, ДНК которых внесла вклад в свободно-клеточную ДНК, обнаруженную в плазме, с делецией или дупликацией на хромосоме. Например, две гипотезы с максимальной вероятностью могут заключаться в том, что индивидуум имеет делецию в этом сегменте хромосомы с долей опухоли 6%, и где удаленный сегмент хромосомы имеет генотип по шести ОНП (A, B, A, A, B, B) или (A, B, A, A, B, A). В этом представлении генотипа индивидуума над набором ОНП первая буква в скобках соответствует генотипу гаплотипа для ОНП 1, вторая - ОНП 2 и т. д.
[725] Если бы использовали способ для определения гаплотипа индивидуума в этом сегменте хромосомы и было бы обнаружено, что гаплотип для одной из двух хромосом составил (A, B, A, A, B, B), это бы согласовывалось с гипотезой максимального правдоподобия, и рассчитанная вероятность того, что у индивидуума имеется делеция в этом сегменте и, следовательно, могут быть раковые или предраковые клетки, будет значительно увеличена. С другой стороны, если бы у индивидуума был обнаружен гаплотип (A, A, A, A, A, A), то вероятность того, что у индивидуума есть делеция в этом сегменте хромосомы, значительно снизилась бы, и, возможно, вероятность гипотезы об отсутствии делеции будет выше (фактические значения вероятности будут зависеть от других параметров, таких как, среди прочего, измеренный шум в системе).
[726] Существует много способов определить гаплотип индивидуума, многие из которых описаны в другом месте данного документа. В данном документе приводится неполный список, который не является исчерпывающим. Одним из способов является биологический способ, при котором отдельные молекулы ДНК разбавляются до тех пор, пока приблизительно одна молекула из каждой хромосомной области не окажется в любом заданном реакционном объеме, а затем для измерения генотипа используются такие способы, как секвенирование. Другой способ основан на информатике, где популяционные данные о различных гаплотипах в сочетании с их частотой могут использоваться вероятностным образом. Другой способ заключается в том, чтобы измерить диплоидные данные индивидуума вместе с одним или множеством связанных индивидуумов, которые, как ожидается, будут иметь общие с индивидуумом блоки гаплотипов, и затем сделать вывод о блоках гаплотипов. Другим способом может быть забор образца ткани с высокой концентрацией сегмента с делецией или дупликацией и определение гаплотипа на основе аллельного дисбаланса, например, измерения генотипа образца опухолевой ткани с делецией могут быть использованы для определения фазированных данных для этой области делеции, и эти данные затем могут быть использованы для определения повторного роста рака после резекции.
[727] На практике обычно на данном сегменте хромосомы измеряется более 20 ОНП, более 50 ОНП, более 100 ОНП, более 500 ОНП, более 1000 ОНП или более 5000 ОНП.
[728] Примерные мутации
[729] Примеры мутаций, связанных с заболеванием или расстройством, таким как рак, или повышенным риском (например, уровнем риска выше нормального) для заболевания или расстройства, такого как рак, включают однонуклеотидные варианты (ОНВ), множественные нуклеотидные мутации, делеции (например, как делеция области от 2 до 30 миллионов пар оснований), дупликации или тандемные повторы. В некоторых вариантах воплощения мутация находится в ДНК, такой как скДНК, внеклеточная митохондриальная ДНК (скмДНК), внеклеточная ДНК, происходящая из ядерной ДНК (скяДНК), клеточная ДНК или митохондриальная ДНК. В некоторых вариантах воплощения мутация находится в РНК, такой как скРНК, клеточная РНК, цитоплазматическая РНК, кодирующая цитоплазматическая РНК, некодирующая цитоплазматическая РНК, мРНК, миРНК, митохондриальная РНК, рРНК или тРНК. В некоторых вариантах воплощения мутация с большей частотой встречается у субъектов с заболеванием или расстройством (таким как рак), чем у субъектов без заболевания или расстройства (такого как рак). В некоторых вариантах воплощения мутация указывает на рак, например мутация, вызывающая рак. В некоторых вариантах воплощения мутация является драйверной мутацией, которая играет причинную роль в заболевании или расстройстве. В некоторых вариантах воплощения мутация не является причинной мутацией. Например, при некоторых формах рака накапливаются множественные мутации, но некоторые из них не являются причинными мутациями. Мутации (такие как те, которые присутствуют с большей частотой у субъектов с заболеванием или расстройством, чем у субъектов без заболевания или расстройства), которые не являются причинными, все же могут быть полезны для диагностики заболевания или расстройства. В некоторых вариантах воплощения мутация представляет собой потерю гетерозиготности (loss-of-heterozygosity - LOH) по одному или более микросателлитов.
[730] В некоторых вариантах воплощения субъект проходит скрининг на один из нескольких полиморфизмов или мутаций, которые, как известно, имеются у субъекта (например, для проверки их наличия, изменения количества клеток, ДНК или РНК с этими полиморфизмами или мутациями, или при ремиссии рака или повторном развитии). В некоторых вариантах воплощения субъект проходит скрининг на наличие одного или более полиморфизмов или мутаций, по которым субъект, как известно, подвержен риску (например, субъект, у которого есть родственник с полиморфизмом или мутацией). В некоторых вариантах воплощения субъект проходит скрининг по панели полиморфизмов или мутаций, связанных с заболеванием или расстройством, таким как рак (например по меньшей мере 5, 10, 50, 100, 200, 300, 500, 750, 1000, 1500, 2000 или 5000 полиморфизмов или мутаций).
[731] Многие варианты кодирования, связанные с раком, описаны в Abaan et al., "The Exomes of the NCI-60 Panel: A Genomic Resource for Cancer Biology and Systems Pharmacology", Cancer Research, July 15, 2013, и по веб-адресу dtp.nci.nih.gov/branches/btb/characterizationNCI60.html, каждый из этих документов полностью включен сюда посредством ссылки). Панель раковых клеток человека NCI-60 состоит из 60 различных клеточных линий, представляющих рак легких, толстой кишки, мозга, яичников, молочной железы, простаты и почек, а также лейкоз и меланому. Генетические вариации, которые были идентифицированы в этих клеточных линиях, состояли из двух типов: варианты типа I, которые встречаются в нормальной популяции, и варианты типа II, специфичные для рака.
[732] Примерные полиморфизмы или мутации (такие как делеции или дупликации) находятся в одном или более из следующих генов: TP53, PTEN, PIK3CA, APC, EGFR, NRAS, NF2, FBXW7, ERBBs, ATAD5, KRAS, BRAF, VEGF, EGFR, HER2, ALK, p53, BRCA, BRCA1, BRCA2, SETD2, LRP1B, PBRM, SPTA1, DNMT3A, ARID1A, GRIN2A, TRRAP, STAG2, EPHA3/5/7, POLE, SYNE1, C20orf80, CSMD1, CTNNB1, ERBB2, FBXW7, KIT, MUC4, ATM, CDH1, DDX11, DDX12, DSPP, EPPK1, FAM186A, GNAS, HRNR, KRTAP4-11, MAP2K4, MLL3, NRAS, RB1, SMAD4, TTN, ABCC9, ACVR1B, ADAM29, ADAMTS19, AGAP10, AKT1, AMBN, AMPD2, ANKRD30A, ANKRD40, APOBR, AR, BIRC6, BMP2, BRAT1, BTNL8, C12orf4, C1QTNF7, C20orf186, CAPRIN2, CBWD1, CCDC30, CCDC93, CD5L, CDC27, CDC42BPA, CDH9, CDKN2A, CHD8, CHEK2, CHRNA9, CIZ1, CLSPN, CNTN6, COL14A1, CREBBP, CROCC, CTSF, CYP1A2, DCLK1, DHDDS, DHX32, DKK2, DLEC1, DNAH14, DNAH5, DNAH9, DNASE1L3, DUSP16, DYNC2H1, ECT2, EFHB, RRN3P2, TRIM49B, TUBB8P5, EPHA7, ERBB3, ERCC6, FAM21A, FAM21C, FCGBP, FGFR2, FLG2, FLT1, FOLR2, FRYL, FSCB, GAB1, GABRA4, GABRP, GH2, GOLGA6L1, GPHB5, GPR32, GPX5, GTF3C3, HECW1, HIST1H3B, HLA-A, HRAS, HS3ST1, HS6ST1, HSPD1, IDH1, JAK2, KDM5B, KIAA0528, KRT15, KRT38, KRTAP21-1, KRTAP4-5, KRTAP4-7, KRTAP5-4, KRTAP5-5, LAMA4, LATS1, LMF1, LPAR4, LPPR4, LRRFIP1, LUM, LYST, MAP2K1, MARCH1, MARCO, MB21D2, MEGF10, MMP16, MORC1, MRE11A, MTMR3, MUC12, MUC17, MUC2, MUC20, NBPF10, NBPF20, NEK1, NFE2L2, NLRP4, NOTCH2, NRK, NUP93, OBSCN, OR11H1, OR2B11, OR2M4, OR4Q3, OR5D13, OR8I2, OXSM, PIK3R1, PPP2R5C, PRAME, PRF1, PRG4, PRPF19, PTH2, PTPRC, PTPRJ, RAC1, RAD50, RBM12, RGPD3, RGS22, ROR1, RP11-671M22.1, RP13-996F3.4, RP1L1, RSBN1L, RYR3, SAMD3, SCN3A, SEC31A, SF1, SF3B1, SLC25A2, SLC44A1, SLC4A11, SMAD2, SPTA1, ST6GAL2, STK11, SZT2, TAF1L, TAX1BP1, TBP, TGFBI, TIF1, TMEM14B, TMEM74, TPTE, TRAPPC8, TRPS1, TXNDC6, USP32, UTP20, VASN, VPS72, WASH3P, WWTR1, XPO1, ZFHX4, ZMIZ1, ZNF167, ZNF436, ZNF492, ZNF598, ZRSR2, ABL1, AKT2, AKT3, ARAF, ARFRP1, ARID2, ASXL1, ATR, ATRX, AURKA, AURТЫС. П.Н., AXL, BAP1, BARD1, BCL2, BCL2L2, BCL6, BCOR, BCORL1, BLM, BRIP1, BTK, CARD11, CBFB, CBL, CCND1, CCND2, CCND3, CCNE1, CD79A, CD79B, CDC73, CDK12, CDK4, CDK6, CDK8, CDKN1B, CDKN2B, CDKN2C, CEBPA, CHEK1, CIC, CRKL, CRLF2, CSF1R, CTCF, CTNNA1, DAXX, DDR2, DOT1L, EMSY (C11orf30), EP300, EPHA3, EPHA5, EPHB1, ERBB4, ERG, ESR1, EZH2, FAM123B (WTX), FAM46C, FANCA, FANCC, FANCD2, FANCE, FANCF, FANCG, FANCL, FGF10, FGF14, FGF19, FGF23, FGF3, FGF4, FGF6, FGFR1, FGFR2, FGFR3, FGFR4, FLT3, FLT4, FOXL2, GATA1, GATA2, GATA3, GID4 (C17orf39), GNA11, GNA13, GNAQ, GNAS, GPR124, GSK3B, HGF, IDH1, IDH2, IGF1R, IKBKE, IKZF1, IL7R, INHBA, IRF4, IRS2, JAK1, JAK3, JUN, KAT6A (MYST3), KDM5A, KDM5C, KDM6A, KDR, KEAP1, KLHL6, MAP2K2, MAP2K4, MAP3K1, MCL1, MDM2, MDM4, MED12, MEF2B, MEN1, MET, MITF, MLH1, MLL, MLL2, MPL, MSH2, MSH6, MTOR, MUTYH, MYC, MYCL1, MYCN, MYD88, NF1, NFKBIA, NKX2-1, NOTCH1, NPM1, NRAS, NTRK1, NTRK2, NTRK3, PAK3, PALB2, PAX5, PBRM1, PDGFRA, PDGFRB, PDK1, PIK3CG, PIK3R2, PPP2R1A, PRDM1, PRKAR1A, PRKDC, PTCH1, PTPN11, RAD51, RAF1, RARA, RET, RICTOR, RNF43, RPTOR, RUNX1, SMARCA4, SMARCB1, SMO, SOCS1, SOX10, SOX2, SPEN, SPOP, SRC, STAT4, SUFU, TET2, TGFBR2, TNFAIP3, TNFRSF14, TOP1, TP53, TSC1, TSC2, TSHR, VHL, WISP3, WT1, ZNF217, ZNF703 и их комбинациях (Suet al., J Mol Diagn 2011, 13:74-84; DOI:10.1016/j.jmoldx.2010.11.010; и Abaan et al., "The Exomes of the NCI-60 Panel: A Genomic Resource for Cancer Biology and Systems Pharmacology", Cancer Research, July 15, 2013, каждый из этих документов полностью включен сюда посредством ссылки). В некоторых вариантах воплощения дупликация является дупликацией хромосомы 1p («Chr1p»), связанной с раком молочной железы. В некоторых вариантах воплощения один или более полиморфизмов или мутаций находятся в BRAF, например, мутация V600E. В некоторых вариантах воплощения один или более полиморфизмов или мутаций находятся в K-ras. В некоторых вариантах воплощения существует комбинация одного или более полиморфизмов или мутаций в K-ras и APC. В некоторых вариантах воплощения существует комбинация одного или более полиморфизмов или мутаций в K-ras и p53. В некоторых вариантах воплощения существует комбинация одного или более полиморфизмов или мутаций в APC и p53. В некоторых вариантах воплощения существует комбинация одного или более полиморфизмов или мутаций в K-ras, APC и p53. В некоторых вариантах воплощения существует комбинация одного или более полиморфизмов или мутаций в K-ras и EGFR. Примерные полиморфизмы или мутации находятся в одном или более из следующих микроРНК: miR-15a, miR-16-1, miR-23a, miR-23b, miR-24-1, miR-24-2, miR-27a, miR-27b, miR-29b-2, miR-29c, miR-146, miR-155, miR-221, miR-222, и miR-223 (Calin et al. “A miRNA signature associated with prognosis and progression in chronic lymphocytic leukemia.” N Engl J Med 353:1793- 801, 2005, документ полностью включен сюда посредством ссылки).
[733] В некоторых вариантах воплощения делецией является делеция по меньшей мере 0,01 т.п.н., 0.1 т.п.н., 1 т.п.н., 10 т.п.н., 100 т.п.н., 1 Мб, 2 Мб, 3 Мб, 5 Мб, 10 Мб, 15 Мб, 20 Мб, 30 Мб или 40 Мб. В некоторых вариантах воплощения делецией является делеция от 1 т.п.н. до 40 Мб, такая как от 1 т.п.н. до 100 т.п.н., от 100 т.п.н. до 1 Мб, от 1 до 5 Мб, от 5 до 10 Мб, от 10 до 15 Мб, от 15 до 20 Мб, от 20 до 25 Мб, от 25 до 30 Мб или от 30 до 40 Мб включительно.
[734] В некоторых вариантах воплощения дупликация является дупликацией по меньшей мере 0,01 т.п.н., 0,1 т.п.н., 1 т.п.н., 10 т.п.н., 100 т.п.н., 1 Мб, 2 Мб, 3 Мб, 5 Мб, 10 Мб, 15 Мб, 20 Мб, 30 Мб или 40 Мб. В некоторых вариантах воплощения дупликацией является дупликация от 1 т.п.н. до 40 Мб, такая как от 1 т.п.н. до 100 т.п.н., от 100 т.п.н. до 1 Мб, от 1 до 5 Мб, от 5 до 10 Мб, от 10 до 15 Мб, от 15 до 20 Мб, от 20 до 25 Мб, от 25 до 30 Мб или от 30 до 40 Мб включительно.
[735] В некоторых вариантах воплощения тандемный повтор представляет собой повтор из от 2 до 60 нуклеотидов, например, от 2 до 6, от 7 до 10, от 10 до 20, от 20 до 30, от 30 до 40, от 40 до 50 или от 50 до 60 нуклеотидов включительно. В некоторых вариантах воплощения тандемный повтор представляет собой повтор из 2 нуклеотидов (динуклеотидный повтор). В некоторых вариантах воплощения тандемный повтор представляет собой повтор из 3 нуклеотидов (тринуклеотидный повтор).
[736] В некоторых вариантах воплощения полиморфизм или мутация являются прогностическими. Типичные прогностические мутации включают мутации K-ras, такие как мутации K-ras, которые являются индикаторами рецидива послеоперационного заболевания при колоректальном раке (Ryan et al.” A prospective study of circulating mutant KRAS2 in the serum of patients with colorectal neoplasia: strong prognostic indicator in postoperative follow up,” Gut 52:101-108, 2003; and Lecomte T et al. Detection of free-circulating tumor-associated DNA in plasma of colorectal cancer patients and its association with prognosis,” Int J Cancer 100:542-548, 2002, каждый из этих документов полностью включен сюда посредством ссылки).
[737] В некоторых вариантах воплощения полиморфизм или мутация связаны с измененным ответом на конкретное лечение (например, повышенная или пониженная эффективность или побочные эффекты). Примеры включают мутации K-ras, связанные со снижением ответа на лечение на основе EGFR при немелкоклеточном раке легкого (Wang et al. “Potential clinical significance of a plasma-based KRAS mutation analysis in patients with advanced non-small cell lung cancer,” Clin Canc Res16:1324-1330, 2010, документ полностью включен сюда посредством ссылки).
[738] K-ras является онкогеном, который активируется при многих раковых заболеваниях. Типичные мутации K-ras представляют собой мутации в кодонах 12, 13 и 61. Мутации скДНК K-ras были идентифицированы при раке поджелудочной железы, легких, колоректальном раке, раке мочевого пузыря и желудка (Fleischhacker & Schmidt “Circulating nucleic acids (CNAs) and caner - a survey,” Biochim Biophys Acta 1775:181-232, 2007, документ полностью включен сюда посредством ссылки).
[739] p53 представляет собой опухолевый супрессор, который мутирует при многих формах рака и способствует прогрессированию опухоли (Levine & Oren “The first 30 years of p53: growing ever more complex. Nature Rev Cancer,” 9:749-758, 2009, документ полностью включен сюда посредством ссылки). Могут мутировать множество различных кодонов, например Ser249. Мутации p53 скДНК были выявлены при раке молочной железы, легких, яичников, мочевого пузыря, желудка, поджелудочной железы, колоректального рака, кишечника и гепатоцеллюлярного рака (Fleischhacker & Schmidt “Circulating nucleic acids (CNAs) and caner - a survey,” Biochim Biophys Acta 1775:181-232, 2007, документ полностью включен сюда посредством ссылки).
[740] BRAF - онкоген, расположенный ниже Ras. Мутации BRAF были идентифицированы при глиальных новообразованиях, меланоме, раке щитовидной железы и легких (Dias-Santagata et al. BRAF V600E mutations are common in pleomorphic xanthoastrocytoma: diagnostic and therapeutic implications. PLOS ONE 2011;6:e17948, 2011; Shinozaki et al. Utility of circulating B-RAF DNA mutation in serum for monitoring melanoma patients receiving biochemotherapy. Clin Canc Res 13:2068-2074, 2007 и Board et al. Detection of BRAF mutations in the tumor and serum of patients enrolled in the AZD6244 (ARRY-142886) advanced melanoma phase II study. Brit J Canc2009;101:1724-1730, каждый из этих документов полностью включен сюда посредством ссылки). Мутация BRAF V600E встречается, например, при меланомных опухолях и чаще встречается на поздних стадиях. Мутация V600E была обнаружена в скДНК.
[741] EGFR способствует пролиферации клеток и неправильно регулируется при многих формах рака (Downward J. Targeting RAS signalling pathways in cancer therapy. Nature Rev Cancer 3:11-22, 2003 и Levine & Oren “The first 30 years of p53: growing ever more complex. Nature Rev Cancer,” 9:749-758, 2009, документ полностью включен сюда посредством ссылки). Примерные мутации EGFR включают мутации в экзонах 18-21, которые были идентифицированы у пациентов с раком легких. У больных раком легких идентифицированы мутации EGFR в скДНК (Jia et al. “Prediction of epidermal growth factor receptor mutations in the plasma/pleural effusion to efficacy of gefitinib treatment in advanced non-small cell lung cancer,” J Canc Res Clin Oncol 2010;136:1341-1347, 2010, документ полностью включен сюда посредством ссылки).
[742] Примеры полиморфизмов или мутаций, связанных с раком молочной железы, включают LOH на микросателлитах (Kohler et al. ”Levels of plasma circulating cell free nuclear and mitochondrial DNA as potential biomarkers for breast tumors,” Mol Cancer 8:doi:10.1186/1476-4598-8-105, 2009, документ полностью включен сюда посредством ссылки), мутации p53 (такие, как мутации в экзонах 5-8) (Garcia et al.” Extracellular tumor DNA in plasma and overall survival in breast cancer patients,” Genes, Chromosomes & Cancer 45:692-701, 2006, документ полностью включен сюда посредством ссылки), HER2 (Sorensen et al. “Circulating HER2 DNA after trastuzumab treatment predicts survival and response in breast cancer,” Anticancer Res30:2463-2468, 2010, документ полностью включен сюда посредством ссылки), PIK3CA, MED1 и полиморфизмы или мутации GAS6 (Murtaza et al. “Non-invasive analysis of acquired resistance to cancer therapy by sequencing of plasma DNA,” Nature 2013;doi:10.1038/nature12065, 2013, документ полностью включен сюда посредством ссылки).
[743] Повышенные уровни скДНК и LOH связаны с уменьшением общей выживаемости и безрецидивной выживаемости. Мутации p53 (экзоны 5-8) связаны с уменьшением общей выживаемости. Снижение уровней HER2 циркулирующей скДНК связано с лучшим ответом на лечение, направленным на HER2, у субъектов с HER2-положительной опухолью молочной железы. Активирующая мутация в PIK3CA, усечение MED1 и мутация сплайсинга в GAS6 приводят к резистентности к лечению.
[744] Примерные полиморфизмы или мутации, связанные с колоректальным раком, включают мутации p53, APC, K-ras и тимидилатсинтазы, а также метилирование гена p16. (Wang et al. “Molecular detection of APC, K-ras, and p53 mutations in the serum of colorectal cancer patients as circulating biomarkers,” World J Surg 28:721-726, 2004; Ryan et al. “A prospective study of circulating mutant KRAS2 in the serum of patients with colorectal neoplasia: strong prognostic indicator in postoperative follow up,” Gut 52:101-108, 2003; Lecomte et al. “Detection of free-circulating tumor-associated DNA in plasma of colorectal cancer patients and its association with prognosis,” Int J Cancer 100:542-548, 2002; Schwarzenbach et al. “Molecular analysis of the polymorphisms of thymidylate synthase on cell-free circulating DNA in blood of patients with advanced colorectal carcinoma,” Int J Cancer 127:881-888, 2009, каждый из этих документов полностью включен сюда посредством ссылки). Послеоперационное обнаружение мутаций K-ras в сыворотке крови является надежным предиктором рецидива заболевания. Обнаружение мутаций K-ras и метилирования гена p16 связано с уменьшением выживаемости и увеличением рецидивов заболевания. Обнаружение мутаций K-ras, APC и/или p53 связано с рецидивом и/или метастазами. Полиморфизмы (включая LOH, ОНП, тандемные повторы с переменным числом и делецию) в гене тимидилатсинтазы (мишень химиотерапии на основе фторпиримидина) при использовании скДНК могут быть связаны с ответом на лечение.
[745] Примерные полиморфизмы или мутации, связанные с раком легкого (таким, как немелкоклеточный рак легкого включают K-ras (такие как мутации в кодоне 12) и мутации EGFR. Примеры прогностических мутаций включают мутации EGFR (делеция экзона 19 или мутация экзона 21), связанные с увеличением общей выживаемости и выживаемости без прогрессирования, а K-рас мутации (в кодонах 12 и 13) связаны с уменьшением выживаемости без прогрессирования (Jian et al. “Prediction of epidermal growth factor receptor mutations in the plasma/pleural effusion to efficacy of gefitinib treatment in advanced non-small cell lung cancer,” J Canc Res Clin Oncol 136:1341-1347, 2010; Wang et al. “Potential clinical significance of a plasma-based KRAS mutation analysis in patients with advanced non-small cell lung cancer,” Clin Canc Res 16:1324-1330, 2010, каждый из этих документов полностью включен сюда посредством ссылки). Примерные полиморфизмы или мутации, указывающие на ответ на лечение, включают мутации EGFR (делеция экзона 19 или мутация экзона 21), которые улучшают ответ на лечение, и мутации K-ras (кодоны 12 и 13), которые снижают ответ на лечение. Выявлена мутация, придающая устойчивость EFGR. (Murtaza et al. “Non-invasive analysis of acquired resistance to cancer therapy by sequencing of plasma DNA,” Nature doi:10.1038/nature12065, 2013, документ полностью включен сюда посредством ссылки).
[746] Примерные полиморфизмы или мутации, связанные с меланомой (такой, как увельная меланома) включают таковые в GNAQ, GNA11, BRAF и p53. Примерные мутации GNAQ и GNA11 включают мутации R183 и Q209. Мутации Q209 в GNAQ или GNA11 связаны с метастазами в кости. Мутации BRAF V600E могут быть обнаружены у пациентов с метастатической/распространенной меланомой. BRAF V600E является индикатором инвазивной меланомы. Наличие мутации BRAF V600E после химиотерапии связано с отсутствием ответа на лечение.
[747] Примерные полиморфизмы или мутации, связанные с панкреатическими карциномами, включают таковые в K-ras и p53 (такие, как p53 Ser249). p53 Ser249 также связана с инфекцией гепатитом В и гепатоцеллюлярной карциномой, а также с раком яичников и неходжкинской лимфомой.
[748] Даже полиморфизмы или мутации, которые присутствуют в образце с низкой частотой, могут быть обнаружены с помощью способов по настоящему изобретению. Например, полиморфизм или мутацию, которая присутствует с частотой 1 на миллион, можно наблюдать 10 раз, выполнив 10 миллионов считываний секвенирования. При необходимости количество считываний секвенирования может быть изменено в зависимости от желаемого уровня чувствительности. В некоторых вариантах воплощения образец анализируется повторно или другой образец от субъекта анализируется с использованием большего количества считываний секвенирования для повышения чувствительности. Например, если не обнаружено или обнаружено лишь небольшое количество (например, 1, 2, 3, 4 или 5) полиморфизмов или мутаций, связанных с раком или повышенным риском рака, образец повторно анализируется или тестируется другой образец.
[749] В некоторых вариантах воплощения для рака или метастатического рака необходимы множественные полиморфизмы или мутации. В таких случаях скрининг на множественные полиморфизмы или мутации улучшает возможность точной диагностики рака или метастатического рака. В некоторых вариантах воплощения, когда субъект имеет подмножество множественных полиморфизмов или мутаций, необходимых для рака или метастатического рака, субъект может быть повторно подвергнут скринингу позже, чтобы увидеть, приобретает ли субъект дополнительные мутации.
[750] В некоторых вариантах воплощения, в которых для рака или метастатического рака требуется несколько полиморфизмов или мутаций, можно сравнить частоту каждого полиморфизма или мутации, чтобы увидеть, встречаются ли они с одинаковой частотой. Например, если для рака требуются две мутации (обозначенные «A» и «B»), некоторые клетки не будут иметь ни одной из них, некоторые клетки - A, некоторые - B, а некоторые - A и B. Если A и B наблюдаются с одинаковой частотой, у субъекта более вероятно будет несколько клеток с A и B. Если A и B наблюдаются с разной частотой, у субъекта с большей вероятностью будут разные популяции клеток.
[751] В некоторых вариантах воплощения, в которых для рака или метастатического рака требуются множественные полиморфизмы или мутации, количество или идентичность таких полиморфизмов или мутаций, которые присутствуют у субъекта, можно использовать для прогнозирования вероятности или скорости появления у субъекта заболевания или расстройства. В некоторых вариантах воплощения, в которых полиморфизмы или мутации имеют тенденцию происходить в определенном порядке, субъект может периодически тестироваться, чтобы видеть, приобрел ли субъект другие полиморфизмы или мутации.
[752] В некоторых вариантах воплощения определение наличия или отсутствия множественных полиморфизмов или мутаций (таких как 2, 3, 4, 5, 8, 10, 12, 15 или более) увеличивает чувствительность и/или специфичность определения наличия или отсутствия заболевания или расстройства, такого как рак, или повышенный риск заболевания или расстройства, такого как рак.
[753] В некоторых вариантах воплощения полиморфизм(ы) или мутация(и) обнаруживают прямым способом. В некоторых вариантах воплощения полиморфизм(ы) или мутация(и) обнаруживают непрямым способом путем обнаружения одной или более последовательностей (например, полиморфного локуса, такого, как ОНП), связанных с полиморфизмом или мутацией.
[754] Примерные изменения нуклеиновых кислот
[755] В некоторых вариантах воплощения имеется изменение целостности РНК или ДНК (например, изменение размера фрагментированных скРНК, или скДНК, или изменение нуклеосомного состава), которое связано с заболеванием или расстройством, таким как рак, или повышенным риском заболевания или расстройства, такого как рак. В некоторых вариантах воплощения имеется изменение в структуре метилирования РНК или ДНК, связанное с заболеванием или расстройством, таким как рак, или повышенным риском заболевания или расстройства, такого как рак (например, гиперметилирование генов-супрессоров опухолей). Например, предполагается, что метилирование CpG-островков в промоторной области генов-супрессоров опухолей запускает локальный сайленсинг генов. Аберрантное метилирование гена-супрессора опухоли p16 происходит у субъектов с раком печени, легких и молочной железы. Другие часто метилированные гены-супрессоры опухолей, включая APC, белок 1A семейства ассоциативных доменов Ras (RASSF1A), глутатион-S-трансферазу P1 (GSTP1) и DAPK, были обнаружены при различных типах рака, например, при карциноме носоглотки, колоректальном раке, раке легкого, раке пищевода, раке простаты, раке мочевого пузыря, меланомe и остром лейкозе. Метилирование определенных генов-супрессоров опухолей, таких как p16, было описано как раннее событие в формировании рака и, таким образом, полезно для раннего скрининга рака.
[756] В некоторых вариантах воплощения для определения паттерна метилирования используется бисульфитная конверсия или стратегия, не основанная на бисульфите, с использованием переваривания чувствительным к метилированию рестрикционным ферментом (Hung et al., J Clin Pathol 62:308-313, 2009, документ полностью включен сюда посредством ссылки). При бисульфитной конверсии метилированные цитозины остаются цитозинами, в то время как неметилированные цитозины превращаются в урацилы. Чувствительные к метилированию рестрикционные ферменты (например, BstUI) расщепляют неметилированные последовательности ДНК в определенных сайтах узнавания (например, 5´-CG против CG-3´ для BstUI), в то время как метилированные последовательности остаются нетронутыми. В некоторых вариантах воплощения обнаруживают интактные метилированные последовательности. В некоторых вариантах воплощения используются праймеры типа «петля на стебле» для селективной амплификации неметилированных фрагментов, расщепленных рестрикционным ферментом, без совместной амплификации метилированной ДНК, не расщепленной ферментом.
[757] Примерные измерения в сплайсинге мРНК
[758] В некоторых вариантах воплощения изменение в сплайсинге мРНК связано с заболеванием или расстройством, таким как рак, или повышенным риском заболевания или расстройства, такого как рак. В некоторых вариантах воплощения изменение в сплайсинге мРНК происходит в одной или более из следующих нуклеиновых кислот, связанных с раком или с повышенным риском рака: DNMT3B, BRCA1, KLF6, Ron или Gemin5. В некоторых вариантах воплощения обнаруженный вариант сплайсинга мРНК связан с заболеванием или расстройством, таким как рак. В некоторых вариантах воплощения здоровыми клетками (такими как незлокачественные клетки) продуцируются множественные варианты сплайсинга мРНК, но изменение относительных количеств вариантов сплайсинга мРНК связано с заболеванием или расстройством, таким как рак. В некоторых вариантах воплощения изменение в сплайсинге мРНК происходит из-за изменения последовательности мРНК (например, мутации в сайте сплайсинга), изменения уровней факторов сплайсинга, изменения количества доступного фактора сплайсинга (например, уменьшения количества доступного фактора сплайсинга из-за связывания фактора сплайсинга с повтором), изменения регуляции сплайсинга или микроокружения опухоли.
[759] Реакция сплайсинга осуществляется комплексом из нескольких белков и РНК, который называется сплайсосомой (Fackenthal1 and Godley, Disease Models & Mechanisms 1: 37-42, 2008, doi:10.1242/dmm.000331, документ полностью включен сюда посредством ссылки). Сплайсосома распознает границы интрон-экзон и удаляет промежуточные интроны посредством двух реакций переэтерификации, которые приводят к лигированию двух соседних экзонов. Точность этой реакции должна быть безупречной, потому что, если лигирование происходит неправильно, нормальный потенциал кодирования белка может быть нарушен. Например, в случаях, когда пропуск экзона сохраняет рамку считывания триплетных кодонов, определяющую идентичность и порядок аминокислот во время трансляции, альтернативно сплайсированная мРНК может указывать на белок, в котором отсутствуют важные аминокислотные остатки. Чаще всего пропуск экзона нарушает трансляционную рамку считывания, что приводит к преждевременным стоп-кодонам. Эти мРНК обычно деградируют по меньшей мере на 90% в результате процесса, известного как нонсенс-опосредованная деградация мРНК, что снижает вероятность того, что такие дефектные сообщения будут накапливаться с образованием усеченных белковых продуктов. Если неправильно сплайсированные мРНК избегают этого пути, то образуются усеченные, мутированные или нестабильные белки.
[760] Альтернативный сплайсинг представляет собой способ экспрессии нескольких или многих различных транскриптов одной и той же геномной ДНК и является результатом включения подмножества доступных экзонов для конкретного белка. При исключении одного или более экзонов определенные белковые домены могут быть потеряны из кодируемого белка, что может привести к потере или усилению функции белка. Описано несколько типов альтернативного сплайсинга: пропуск экзона; альтернативные 5' или 3' сайты сплайсинга; взаимоисключающие экзоны; и, что гораздо реже, удержание интрона. Другие сравнивали количество альтернативного сплайсинга в раковых клетках по сравнению с нормальными клетками с использованием биоинформационного подхода и определили, что у раковых заболеваний уровень альтернативного сплайсинга ниже, чем у нормальных клеток. Кроме того, распределение типов альтернативных событий сплайсинга отличалось в раковых и нормальных клетках. Раковые клетки демонстрировали меньший пропуск экзонов, но больший выбор альтернативных 5'- и 3'-сайтов сплайсинга и удержание интронов, чем нормальные клетки. Когда был исследован феномен экзонизации (использование последовательностей в качестве экзонов, которые преимущественно используются другими тканями в качестве интронов), гены, связанные с экзонизацией в раковых клетках, были преимущественно связаны с процессингом мРНК, что указывает на прямую связь между раковыми клетками и генерацией аберрантных форм сплайсинга мРНК.
[761] Примерные изменения в уровнях ДНК или РНК
[762] В некоторых вариантах воплощения наблюдается изменение общего количества или концентрации одного или более типов ДНК (такой, как скДНК, скмДНК, скяДНК, клеточная ДНК или митохондриальная ДНК) или РНК (скРНК, клеточная РНК, цитоплазматическая РНК, кодирующая цитоплазматическая РНК, некодирующая цитоплазматическая РНК, мРНК, миРНК, митохондриальная РНК, рРНК или тРНК). В некоторых вариантах воплощения существует изменение количества или концентрации одной или более конкретных молекул ДНК (такой, как скДНК, скмДНК, скяДНК, клеточная ДНК или митохондриальная ДНК) или РНК (скРНК, клеточная РНК, цитоплазматическая РНК, кодирующая цитоплазматическая РНК, некодирующая цитоплазматическая РНК, мРНК, миРНК, митохондриальная РНК, рРНК или тРНК). В некоторых вариантах воплощения один аллель экспрессируется сильнее, чем другой аллель интересующего локуса. Типичные миРНК представляют собой короткие молекулы РНК из 20-22 нуклеотидов, которые регулируют экспрессию гена. В некоторых вариантах воплощения существует изменение транскриптома, такое как изменение идентичности или количества одной или более молекул РНК.
[763] В некоторых вариантах воплощения увеличение общего количества или концентрации скДНК или скРНК связано с заболеванием или расстройством, таким как рак, или повышенным риском заболевания или расстройства, такого как рак. В некоторых вариантах воплощения общая концентрация типа ДНК (такой, как скДНК, скмДНК, скяДНК, клеточная ДНК или митохондриальная ДНК) или РНК (скРНК, клеточная РНК, цитоплазматическая РНК, кодирующая цитоплазматическая РНК, некодирующая цитоплазматическая РНК, мРНК, миРНК, митохондриальная РНК, рРНК или тРНК) увеличивается по меньшей мере в 2, 3, 4, 5, 6, 7, 8, 9, 10 раз или более по сравнению с общей концентрацией этого типа ДНК или РНК у здоровых (например, нераковых) субъектов. В некоторых вариантах воплощения общая концентрация скДНК от 75 до 100 нг/мл, от 100 до 150 нг/мл, от 150 до 200 нг/мл, от 200 до 300 нг/мл, от 300 до 400 нг/мг, от 400 до 600 нг/мл, от 600 до 800 нг/мл, от 800 до 1000 нг/мл включительно, или общая концентрация скДНК более 100 нг/мл, например, более 200, 300, 400, 500, 600, 700, 800, 900 или 1000 нг/мл указывает на рак, повышенный риск рака, повышенный риск того, что опухоль будет злокачественной, а не доброкачественной, снижение вероятности перехода рака в стадию ремиссии или худший прогноз для рака. В некоторых вариантах воплощения количество типа ДНК (такой, как скДНК, скмДНК, скяДНК, клеточная ДНК или митохондриальная ДНК) или РНК (скРНК, клеточная РНК, цитоплазматическая РНК, кодирующая цитоплазматическая РНК, некодирующая цитоплазматическая РНК, мРНК, миРНК, митохондриальная РНК, рРНК или тРНК), имеющей один или более полиморфизмов/мутаций (таких как делеции или дупликации), связанных с заболеванием или расстройством, таким как рак, или повышенным риском заболевания или расстройства, такого как рак, составляет по меньшей мере 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 14, 16, 18, 20 или 25% от общего количества этого типа ДНК или РНК. В некоторых вариантах воплощения по меньшей мере 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 14, 16, 18, 20 или 25% от общего количества этого типа ДНК (такой, как скДНК, скмДНК, скяДНК, клеточная ДНК или митохондриальная ДНК) или РНК (скРНК, клеточная РНК, цитоплазматическая РНК, кодирующая цитоплазматическая РНК, некодирующая цитоплазматическая РНК, мРНК, миРНК, митохондриальная РНК, рРНК или тРНК) имеет определенный полиморфизм или мутацию (например, делецию или дупликацию), связанную с заболеванием или расстройством, таким как рак, или повышенным риском заболевания или расстройства, такого как рак.
[764] В некоторых вариантах воплощения скДНК инкапсулирована. В некоторых вариантах воплощения скДНК не инкапсулирована.
[765] В некоторых вариантах воплощения определяется доля опухолевой ДНК от общей ДНК (например, доля опухолевой скДНК от общего количества скДНК или доля опухолевой скДНК с определенной мутацией от общего количества скДНК). В некоторых вариантах воплощения фракция опухолевой ДНК может быть определена для множества мутаций, где мутации могут быть однонуклеотидными вариантами, вариантами числа копий, дифференциальным метилированием или их комбинациями. В некоторых вариантах воплощения средняя фракция опухоли, рассчитанная для одной мутации или набора мутаций с наивысшей рассчитанной фракцией опухоли, принимается за фактическую фракцию опухоли в образце. В некоторых вариантах воплощения средняя фракция опухоли, рассчитанная для всех мутаций, принимается за фактическую фракцию опухоли в образце. В некоторых вариантах воплощения эта фракция опухоли используется для определения стадии рака (поскольку более высокие фракции опухоли могут быть связаны с более поздними стадиями рака). В некоторых вариантах воплощения фракция опухоли используется для определения размера рака, поскольку более крупные опухоли могут коррелировать с фракцией ДНК опухоли в плазме. В некоторых вариантах воплощения фракция опухоли используется для определения размера доли опухоли, пораженной одной или множеством мутаций, поскольку может существовать корреляция между измеренной фракцией опухоли в образце плазмы и размером ткани с данной мутацией(ями). Например, размер ткани с данной мутацией(ями) может быть скоррелирован с фракцией опухоли ДНК, которая может быть рассчитана с нацеливанием на эту конкретную мутацию(ии).
[766] Примерные базы данных
[767] В изобретении также представлены базы данных, содержащие один или более результатов способа по изобретению. Например, база данных может включать записи с любой из следующей информации для одного или более субъектов: любые выявленные полиморфизмы/мутации (например, ВЧК), любая известная ассоциация полиморфизмов/мутаций с заболеванием или расстройством или повышенный риск заболевания или нарушения, влияние полиморфизмов/мутаций на экспрессию или уровень активности кодируемой мРНК или белка, фракция ДНК, РНК или клеток, связанных с заболеванием или расстройством (например, ДНК, РНК или клетки, имеющие полиморфизм/мутацию, связанные с заболеванием или расстройством) из общей ДНК, РНК или клеток в образце, источник образца, используемый для идентификации полиморфизмов/мутаций (например, образец крови или образец из конкретной ткани), количество пораженных клеток, результаты последующего повторения теста (например, повторение теста для отслеживания прогрессирования или ремиссии заболевания или расстройства), результаты других тестов на заболевание или расстройство, тип заболевания или расстройства, с которым у субъекта был поставлен диагноз, назначенное лечение(я), ответ на такое лечение(я), побочные эффекты такого лечения(й), симптомы (такие как симптомы, связанные с заболеванием или расстройством), продолжительность и количество ремиссий, продолжительность выживания (например, продолжительность времени от первоначального теста до смерти или продолжительность времени от постановки диагноза до смерти), причина смерти, и их комбинации.
[768] В некоторых вариантах воплощения база данных включает записи с любой из следующей информации для одного или более субъектов: любые выявленные полиморфизмы/мутации, любая известная ассоциация полиморфизмов/мутаций с раком или повышенным риском рака, влияние полиморфизмов/мутаций на уровень экспрессии или активности кодируемой мРНК или белка, фракция раковой ДНК, РНК или клеток из общей ДНК, РНК или клеток в образце, источник образца, используемого для идентификации полиморфизмов/мутаций (например, образец крови или образец из конкретной ткани), количество раковых клеток, размер опухоли (опухолей), результаты последующего повторения теста (например, повторение теста для мониторинга прогрессирования или ремиссии рака), результаты других тестов на рак, тип рака, который был диагностирован у субъекта, назначенное(ые) лечение(я), ответ на такое(ие) лечение(я), побочные эффекты такого(их) лечения(ий), симптомы (например, симптомы, связанные с раком), продолжительность и количество ремиссий, продолжительность выживания (например, продолжительность времени от первоначального теста до смерти или продолжительность времени от диагноза рака до смерти), причина смерти, и их комбинации. В некоторых вариантах воплощения ответ на лечение включает любое из следующего: уменьшение или стабилизация размера опухоли (например, доброкачественной или раковой опухоли), замедление или предотвращение увеличения размера опухоли, уменьшение или стабилизация количества опухолевых клеток, увеличение времени безрецидивной выживаемости между исчезновением опухоли и ее повторным появлением, предотвращение первоначального или последующего возникновения опухоли, уменьшение или стабилизация неблагоприятного симптома, связанного с опухолью, или их комбинации. В некоторых вариантах воплощения включены результаты одного или более других тестов на заболевание или расстройство, такое как рак, например, результаты скрининговых тестов, медицинской визуализации или микроскопического исследования образца ткани.
[769] В одном таком аспекте изобретение предлагает электронную базу данных, включающую по меньшей мере 5, 10, 102, 103, 104, 105, 106, 107, 108 или более записей. В некоторых вариантах воплощения база данных содержит записи для по меньшей мере 5, 10, 102, 103, 104, 105, 106, 107, 108 или более различных субъектов.
[770] В другом аспекте изобретение относится к компьютеру, включающему базу данных изобретения и пользовательский интерфейс. В некоторых вариантах воплощения пользовательский интерфейс может отображать часть или всю информацию, содержащуюся в одной или более записей. В некоторых вариантах воплощения пользовательский интерфейс способен отображать (i) один или более типов рака, которые были идентифицированы как такие, которые содержат полиморфизм или мутацию, запись о которых хранится в компьютере, (ii) один или более полиморфизмов или мутаций, которые были идентифицированы в конкретном типе рака, запись о котором хранится в компьютере, (iii) информацию о прогнозе для конкретного типа рака или конкретного полиморфизма или мутации, запись о котором хранится в компьютере, (iv) одно или более соединений или других способов лечения, полезных для рака с полиморфизмом или мутацией, запись о которых хранится в компьютере, (v) одно или более соединений, которые модулируют экспрессию или активность мРНК или белка, запись о которых хранится в компьютере и (vi) одну или более молекул или белков мРНК, экспрессия или активность которых модулируется соединением, запись о которых хранится в компьютере. Внутренние компоненты компьютера обычно включают процессор, соединенный с памятью. Внешние компоненты обычно включают в себя запоминающее устройство, например жесткий диск; пользовательские устройства ввода, например клавиатуру и мышь; дисплей, например, монитор; и, необязательно, сетевой канал, способный соединять компьютерную систему с другими компьютерами, чтобы обеспечить совместное использование данных и задачи обработки. Во время работы в память данной системы могут загружаться программы.
[771] В другом аспекте изобретение представляет собой реализованный на компьютере процесс, который включает в себя один или более этапов любого из способов изобретения.
[772] Примерные факторы риска
[773] В некоторых вариантах воплощения субъект также оценивается на предмет одного или более факторов риска заболевания или расстройства, такого как рак. Примеры факторов риска включают семейный анамнез заболевания или расстройства, образ жизни (например, курение и воздействие канцерогенов) и уровень одного или более гормонов или белков сыворотки (например, альфа-фетопротеина (AFP) при раке печени, карциноэмбрионального антигена (CEA) при колоректальном раке или простатоспецифического антигена (ПСА) при раке простаты). В некоторых вариантах воплощения измеряется и используется размер и/или количество опухолей для определения прогноза субъекта или выбора лечения для субъекта.
[774] Примерные способы скрининга
[775] При необходимости наличие или отсутствие заболевания или расстройства, такого как рак, можно подтвердить, или заболевание или нарушение, такое как рак, можно классифицировать с использованием любого стандартного способа. Например, заболевание или расстройство, такое как рак, можно обнаружить несколькими способами, включая наличие определенных признаков и симптомов, биопсию опухоли, скрининговые тесты или медицинскую визуализацию (например, маммографию или ультразвук). Как только возможный рак обнаружен, его можно диагностировать с помощью микроскопического исследования образца ткани. В некоторых вариантах воплощения субъект, которому поставлен диагноз, подвергается повторному тестированию с использованием способа по изобретению или известного тестирования на заболевание или расстройство в нескольких временных точках для отслеживания прогрессирования заболевания или расстройства, или же ремиссии или повторного возникновения заболевания или расстройства.
[776] Примерные виды рака
[777] Примерные виды рака, которые можно диагностировать, прогнозировать, стабилизировать, лечить, предотвращать, для которых ответ на лечение можно прогнозировать или контролировать с помощью любого из способов по изобретению, включают солидные опухоли, карциномы, саркомы, лимфомы, лейкемии, герминогеннные опухоли или бластомы. В различных вариантах воплощения рак представляет собой острый лимфобластный лейкоз, острый миелоидный лейкоз, адренокортикальную карциному, рак, связанный со СПИДом, лимфому, связанную со СПИДом, рак анального канала, рак аппендикса, астроцитому (например, мозжечковая или церебральная астроцитома у детей), базальноклеточную карциному, рак желчных протоков (например, рак внепеченочного желчного протока), рак мочевого пузыря, опухоль кости (например, остеосаркома или злокачественная фиброзная гистиоцитома), глиому ствола головного мозга, рак головного мозга (например, астроцитома мозжечка, астроцитома головного мозга/злокачественная глиома, эпендимома, медуллобластома, супратенторильные примитивные нейроэктодермальные опухоли, или глиома зрительного пути/гипоталамуса), глиобластому, рак молочной желехы, аденому или карциноид бронхов, лимфому Беркитта, карциноидную опухоль (например, карциноидная опухоль у детей или карциноидная опухоль желудочно-кишечного тракта), карциному, лимфому центральной нервной системы, астроцитому мозжечка или злокачественная глиому (например, астроцитома мозжечка у детей или злокачественная глиома), рак шейки матки, педиатрический рак, хронический лимфоцитарный лейкоз, хроническую миелогенную лейкемию, хронические миелопролиферативные расстройства, рак толстой кишки, кожную Т-клеточную лимфому, десмопластическую мелкокруглоклеточную опухоль, рак эндометрия, эпендимому, рак пищевода, саркому Юинга, опухоль в семействе опухолей Юинга, экстракраниальную герминогенную опухоль (например, экстракраниальная герминогенная опухоль в детском возрасте), внегонадную герминогенную опухоль, рак глаза (например, внутриглазная меланома или ретинобластомный рак глаза), рак желчного пузыря, рак желудка, карциноидную опухоль желудочно-кишечного тракта, стромальную опухоль желудочно-кишечного тракта, герминогенную опухоль (например, экстракраниальная, внегонадная или овариальная герминогенная опухоль), гестационную трофобластическую опухоль, глиому (например, глиома ствола мозга, детская церебральная астроцитома или детская глиома зрительного пути/гипоталамическая глиома), карциноид желудка, волосатоклеточный лейкоз, рак головы и шеи, рак сердца, гепатоцеллюлярный (печеночный) рак, лимфому Ходжкина, гипофарингеальный рак, глиому гипоталамического и зрительного путей (например, детская глиома зрительного пути), карциному островковых клеток (например, эндокринная карцинома или карцинома островковых клеток поджелудочной железы), саркому Капоши, рак почки, рак гортани, лейкоз (например, острый лимфобластный, острый миелоидный, хронический лимфоцитарный, хронический миелогенный или волосатоклеточный лейкоз), рак губы или полости рта, липосаркому, рак печени (например, немелкоклеточный или мелкоклеточный рак), рак легкого, лимфому (например, связанная со СПИДом, Беркитта, кожная Т-клеточная лимфома, лимфома Ходжкина, неходжкинская лимфома или лимфома центральной нервной системы), макроглобулинемию (например, макроглобулинемия Вальденстрема, злокачественная фиброзная гистиоцитома кости или остеосаркома, медуллобластома (например, медуллобластома у детей), меланому, карциному из клеток Меркеля, мезотелиому (например, мезотелиома взрослых или детей), метастатический плоскоклеточный рак шеи неизвестнгго происхождения, рак ротовой полости, синдром множественной эндокринной неоплазии (например, синдром множественной эндокринной неоплазии в детском возрасте), множественную миелому или новообразование плазматических клеток, грибовидный микоз, миелодиспластический синдром, миелодиспластическое или миелопролиферативное заболевание, миелогенный лейкоз (такой как хронический миелогенный лейкоз), миелоидный лейкоз (например, острый миелоидный лейкоз у взрослых или острый миелоидный лейкоз у детей), миелопролиферативное расстройство (такое, как например, хроническое миелопролиферативное расстройство), рак носовой полости или придаточных пазух носа, рак носоглотки, нейробластому, рак полости рта, рак ротоглотки, остеосаркому или злокачественную фиброзную гистиоцитому кости, рак яичников, эпителиальный рак яичников, герминогенную опухоль яичников, опухоль яичников низкой злокачественности, рак поджелудочной железы (такой, как рак островковых клеток поджелудочной железы), рак придаточных пазух носа или полости носа, рак паращитовидной железы, рак полового члена, рак глотки, феохромоцитому, астроцитому пинеальной железы, герминому пинеальной железы, пинеобластому или супратенториальную примитивную нейроэктодермальную опухоль (например, детская пинеобластома или супратенториальная примитивная нейроэктодермальная опухоль), аденому гипофиза, неоплазию плазматических клеток, плевролегочную бластому, первичную лимфому центральной нервной системы, рак, рак прямой кишки, почечно-клеточную карциному или рак почечной лоханки (такой, как рак лоханки или переходно-клеточный рак мочеточника), ретинобластому, рабдомиосаркому (например, рабдомиосаркома в детском возрасте), рак слюнных желез, саркому (например, саркома из семейства опухолей Юинга, Капоши, мягких тканей или саркома матки), синдром Сезари, рак кожи (например, немеланомный рак, меланома или рак кожи из клеток Мергкеля), рак тонкой кишки, плоскоклеточную карциному, супратенториальную примитивную нейроэктодермальную опухоль (например, детская супратенториальная примитивная нейроэктодермальная опухоль), Т-клеточную лимфому (например, кожная Т-клеточная лимфома), рак яичек, рак горла, тимому (например, детская тимома), тимому или карциному тимуса, рак щитовидной железы (например, детский рак щитовидной железы), трофобластическую опухоль (например, гестационная трофобластическая опухоль), карциному с неизвестной первичной локализацией (например, карцинома с неизвестной первичной локализацией у взрослых или детей), рак уретры (например, рак эндометрия матки), саркому матки, рак влагалища, глиому зрительного пути или глиому гипоталамуса (например, глиома зрительного пути/гипоталамуса у детей), рак вульвы, макроглобулинемию Вальденстрема или опухоль Вильмса (например, опухоль Вильмса у детей). В различных вариантах воплощения рак метастазировал или не метастазировал.
[778] Рак может быть или не быть связанным с гормонами или зависимым от гормонов раком (например, эстрогенный или андрогенный рак). Доброкачественные опухоли или злокачественные опухоли можно диагностировать, прогнозировать, стабилизировать, лечить или предотвращать с использованием способов и/или композиций по настоящему изобретению.
[779] В некоторых вариантах воплощения у субъекта имеется раковый синдром. Раковый синдром является генетическим заболевание, при котором генетические мутации в одном или более из генов предрасполагают пораженных индивидуумов к развитию рака, а также могут вызывать раннее начало этих видов рака. Раковые синдромы часто показывают не только высокий риск развития рака в течение всей жизни, но и развитие множественных независимых первичных опухолей. Многие из этих синдромов вызваны мутациями в генах-супрессорах опухолей, генах, которые участвуют в защите клетки от превращения в злокачественную. Другие гены, которые могут быть затронуты, - это гены репарации ДНК, онкогены и гены, участвующие в образовании кровеносных сосудов (ангиогенез). Распространенными примерами наследственных онкологических синдромов являются наследственный синдром рака молочной железы и яичников и наследственный неполипозный рак толстой кишки (синдром Линча).
[780] В некоторых вариантах воплощения субъекту с одним или более полиморфизмами или мутациями в K-ras, p53, BRA, EGFR или HER2 вводят лечение, нацеленное на, соответственно, K-ras, p53, BRA, EGFR или HER2.
[781] Способы по настоящему изобретению обычно можно применять для лечения злокачественных или доброкачественных опухолей любого типа клеток, тканей или органов.
[782] Примерные виды лечения
[783] При необходимости субъекту может быть назначено любое лечение для стабилизации, лечения или предотвращения заболевания или расстройства, такого как рак, или повышенного риска заболевания или расстройства, такого как рак (например, субъекту, у которого выявлен рак или повышенный риск рака, используя любой из способов изобретения). В различных вариантах воплощения лечение представляет собой известное лечение или комбинацию способов лечения заболевания или расстройства, такого как рак, включая, помимо прочего, цитотоксические агенты, таргетную терапию, иммунотерапию, гормональную терапию, лучевую терапию, хирургическое удаление раковых клеток или клеток, которые могут стать злокачественными, трансплантацию стволовых клеток, трансплантацию костного мозга, фотодинамическую терапию, паллиативное лечение или их комбинацию. В некоторых вариантах воплощения лечение (такое как профилактическое лекарство) используется для предотвращения, отсрочки или уменьшения тяжести заболевания или расстройства, такого как рак, у субъекта с повышенным риском заболевания или расстройства, такого как рак. В некоторых вариантах воплощения лечение представляет собой хирургическое вмешательство, химиотерапию первой линии, адъювантную терапию или неоадъювантную терапию.
[784] В некоторых вариантах воплощения таргетная терапия - это лечение, нацеленное на специфические гены, белки рака или тканевую среду, которая способствует росту и выживанию рака. Этот тип лечения блокирует рост и распространение раковых клеток, ограничивая повреждение нормальных клеток, что обычно приводит к меньшему количеству побочных эффектов по сравнению с другими лекарствами от рака.
[785] Одним из наиболее успешных подходов является нацеливание на ангиогенез, рост новых кровеносных сосудов вокруг опухоли. Таргетная терапия, такая как бевацизумаб (Авастин), леналидомид (Ревлимид), сорафениб (Нексавар), сунитиниб (Сутент) и талидомид (Таломид), препятствуют ангиогенезу. Другим примером является использование лечения, нацеленного на HER2, такого как трастузумаб или лапатиниб, для рака, сверхэкспрессирующего HER2 (например, некоторых видов рака молочной железы). В некоторых вариантах воплощения используется моноклональное антитело для блокирования конкретной мишени снаружи раковых клеток. Примеры включают алемтузумаб (Campath-1H), бевацизумаб, цетуксимаб (Erbitux), панитумумаб (Vectibix), пертузумаб (Omnitarg), ритуксимаб (Rituxan) и трастузумаб. В некоторых вариантах воплощения моноклональное антитело тозитумомаб (Bexxar) используется для доставки излучения к опухоли. В некоторых вариантах воплощения пероральная малая молекула подавляет раковый процесс внутри раковой клетки. Примеры включают дазатиниб (Sprycel), эрлотиниб (Tarceva), гефитиниб (Iressa), иматиниб (Gleevec), лапатиниб (Tykerb), нилотиниб (Tasigna), сорафениб, сунитиниб и темсиролимус (Torisel). В некоторых вариантах воплощения ингибитор протеасом (например, лекарство от множественной миеломы, бортезомиб (Велкейд)) мешает работе специализированных белков, называемых ферментами, которые расщепляют другие белки в клетке.
[786] В некоторых вариантах воплощения разработана иммунотерапия для стимулирования естественной защиты организма для борьбы с раком. Примерные типы иммунотерапии используют материалы, вырабатываемые в организме либо в лаборатории, для поддержки, нацеливания или восстановления функции иммунной системы.
[787] В некоторых вариантах воплощения гормональная терапия лечит рак, снижая количество гормонов в организме. Некоторые виды рака, в том числе некоторые виды рака молочной железы и простаты, растут и распространяются только в присутствии природных химических веществ в организме, называемых гормонами. В различных вариантах воплощения гормональная терапия используется для лечения рака простаты, молочной железы, щитовидной железы и репродуктивной системы.
[788] В некоторых вариантах воплощения лечение включает трансплантацию стволовых клеток, при которой пораженный костный мозг заменяется высокоспециализированными клетками, называемыми гемопоэтическими стволовыми клетками. Гемопоэтические стволовые клетки обнаруживают как в кровотоке, так и в костном мозге.
[789] В некоторых вариантах воплощения лечение включает фотодинамическую терапию, при которой используются специальные препараты, называемые фотосенсибилизирующими агентами, а также свет для уничтожения раковых клеток. Лекарства действуют после того, как они были активированы определенным светом.
[790] В некоторых вариантах воплощения лечение включает хирургическое удаление раковых клеток или клеток, которые могут стать злокачественными (такое, как лампэктомия или мастэктомия). Например, женщина с мутацией гена предрасположенности к раку молочной железы (мутация гена BRCA1 или BRCA2) может снизить риск рака молочной железы и яичников при помощи снижающей риск сальпингоофорэктомии (удаление маточных труб и яичников) и/или снижающей риск двусторонней мастэктомии (удаление обеих молочных желез). Лазеры, которые представляют собой очень мощные и точные лучи света, при очень осторожной хирургической работе, включая лечение некоторых видов рака, могут использоваться вместо лезвий (скальпелей).
[791] В дополнение к лечению для замедления, остановки или устранения рака (также называемого лечением, направленным на заболевание), важной частью лечения рака является облегчение симптомов и побочных эффектов у субъекта, таких, как боль и тошнота. Оно включает в себя поддержку субъекта с физическими, эмоциональными и социальными потребностями, подход, который называется паллиативным или поддерживающим уходом. Люди часто одновременно получают терапию, направленную на заболевание, и лечение для облегчения симптомов.
[792] Примеры лечения включают актиномицин D, адцетрис, адриамицин, альдеслейкин, алемтузумаб, алимту, амсидин, амсакрин, анастрозол, аредиа, аримидекс, аромазин, аспарагиназу, авастин, бевацизумаб, бикалутамид, блеомицин, бондронат, бонефос, бортезомиб, бусилвекс, бусульфан, кампто, капецитабин, карбоплатин, кармустин, касодекс, цетуксимаб, химакс, хлорамбуцил, циметидин, цисплатин, кладрибин, клодронат, клофарабин, крисантаспазу, циклофосфамид, ципротерона ацетат, ципростат, цитарабин, цитоксан, дакарбозин, дактиномицин, дазатиниб, даунорубицин, дексаметазон, диэтилстильбестрол, доцетаксел, доксорубицин, дрогенил, эмцит, эпирубицин, эпозин, эрбитукс, эрлотиниб, эстрацит, эстрамустин, этопофос, этопозид, эволтру, экземестан, фарестон, фемару, филграстим, флудару, флударабин, фторурацил, флутамид, гефинитиб, гемцитабин, гемзар, глеевек, гливек, гонапептил депо, гозерелин, халавен, герцептин, гикамптин, гидроксикарбамид, ибандроновую кислоту, ибритумомаб, идарубицин, ифосфомид, интерферон, мезилат иматиниба, ирессу, иринотекан, джевтану, ланвис, лапатиниб, летрозол, лейкеран, лейпрорелин, лейстат, ломустин, мабкампат, мабтеру, мегас, мегестрол, метотрексат, митозантрон, митомицин, мутулан, милеран, навельбин, нейласту, нейпоген, нексавар, нипент, нолвадекс D, новантрон, онковин, паклитаксел, памидронат, PCV, пеметрексед, пентостатин, перджету, прокарбазин, провендж, преднизолон, прострап, ралтитрексед, ритуксимаб, спрайцел, сорафениб, солтамокс, стрептозоцин, стильбэстрол, стимувакс, сунитиниб, сутент, таблоид, тагамет, тамофен, тамоксифен, тарцеву, таксол, таксотер, тегафур с урацилом, темодал, темозоломид, талидомид, тиоплекс, тиотепу, тиогуанин, томудекс, топотекан, торемифен, трастузумаб, третиноин, треосульфан, триэтилентиофорсфорамид, трипторелин, тиверб, уфторал, велкад, вепезид, везаноид, винкристин, винорелбин, ксалкори, кселоду, ервой, зактиму, заносар, заведос, зевелин, золадекс, золедронат, золедроновую кислоту зометы и зитигу.
[793] В некоторых вариантах воплощения рак представляет собой рак молочной железы, и лечение или соединение, вводимое индивидууму, представляет собой одно или более из следующего: Абемациклиб, Абраксан (состав наночастиц, стабилизированных Паклитакселом Альбумином), Адо-Трастузумаб Эмтанзин, Афинитор (Эверолимус), Анастрозол, Аредиа (Памидронат Динатрий), Аримидекс (Анастрозол), Аромазин (Экземестан), Капецитабин, Циклофосфамид, Доцетаксел, Гидрохлорид Доксорубицина, Эллетс (Гидрохлорид Эпирубицина), гидрохлорид Эпирубицина, Мезилат Эрибулина, Эверолимус, Экземестан, 5-ФУ (фторурацил для инъекций), Фарестон (Торемифен), Фаслодекс (Фулвестрант), Фемара (Летрозол), Фторурацил для инъекций, Фулвестрант, Гемцитабина Гидрохлорид, Гемзар (Гемцитабина Гидрохлорид), Гозерелина Ацетат, Халавен (Мезилат Эрибулина), Герцептин (Трастузумаб), Ибранс (Палбоциклиб), Иксабепилон, Иксемпра (Иксабепилон), Кадсила (Адо-Трастузумаб Эмтанзин), Кискали (Рибоциклиб), Лапатиниб Дитозилат, Летрозол, Линпарза (Олапариб), Мегестрол ацетат, Метотрексат, Нератиниб Малеат, Нерлинкс (Нератиниб Малеат), Олапариб, Паклитаксел, Состав наночастиц, стабилизированных Паклитакселом Альбумином, Палбоциклиб, Памидронат динатрий, Перьета (Пертузумаб), Пертузумаб, Рибоциклиб, Цитрат Тамоксифена, Таксол (Паклитаксел), Таксотер (Доцетаксел), Тиотепа, Торемифен, Трастузумаб, Трексалл (Метотрексилат), Тикерб (Лапатиниба Дитозилат), Верзенио (Абемациклиб), Винбластина сульфат, Кселода (Капецитабин), Золадекс (Гозерелина ацетат), Эвиста (Ралоксифена гидрохлорид), Ралоксифена гидрохлорид, Тамоксифена цитрат. В некоторых вариантах воплощения рак представляет собой рак молочной железы, и лечение или соединение, вводимое индивиду, представляет собой комбинацию, выбранную из следующего: Доксорубицина гидрохлорид (Адриамицин) и Циклофосфамид; Доксорубицина гидрохлорид (Адриамицин), Циклофосфамид и Паклитаксел (Таксол); Доксорубицина гидрохлорид (Адриамицин), Циклофосфамид и Фторурацил; Метотрексат, Циклофосфамид и Фторурацил; Эпирубицина гидрохлорид, Циклофосфамид и Фторурацил; и Доксорубицина гидрохлорид (Адриамицин), Циклофосфамид и Доцетаксел (Таксотер).
[794] Для субъектов, которые экспрессируют как мутантную форму (например, форму, связанную с раком), так и форму дикого типа (например, форму, не связанную с раком) мРНК или белка, терапия предпочтительно ингибирует экспрессию или активность мутантной формы по меньшей мере в 2, 5, 10 или 20 раз сильнее, чем она подавляет экспрессию или активность формы дикого типа. Одновременное или последовательное использование нескольких терапевтических агентов может значительно снизить заболеваемость раком и уменьшить количество пролеченных раковых образований, которые становятся устойчивыми к терапии. Кроме того, терапевтические агенты, которые используются как часть комбинированной терапии, могут потребовать более низкой дозы для лечения рака, чем соответствующая доза, необходимая при индивидуальном применении терапевтических агентов. Низкая доза каждого соединения в комбинированной терапии снижает серьезность потенциальных неблагоприятных побочных эффектов этих соединений.
[795] В некоторых вариантах воплощения субъект, идентифицированный как имеющий повышенный риск рака, (способами согласно изобретению или любым стандартным способом), должен избегать конкретных факторов риска или внести изменения в образ жизни, чтобы снизить любой дополнительный риск рака.
[796] В некоторых вариантах воплощения полиморфизмы, мутации, факторы риска или любые их комбинации используются для выбора схемы лечения для субъекта. В некоторых вариантах воплощения для субъекта с повышенным риском рака или с худшим прогнозом выбрана большая доза или большее количество курсов лечения.
[797] Другие соединения для включения в отдельные или комбинированные терапии
[798] При необходимости дополнительные соединения для стабилизации, лечения или предотвращения заболевания или расстройства, такого как рак, или повышенного риска заболевания или расстройства, такого как рак, могут быть идентифицированы из больших библиотек как натуральных продуктов, так и синтетических (или полусинтетических) экстрактов или химических библиотек, в соответствии со способами, известными в данной области техники. Специалисты в области открытия и разработки лекарств поймут, что точный источник тестируемых экстрактов или соединений не является критическим для способов по настоящему изобретению. Соответственно, практически любое количество химических экстрактов или соединений может быть подвергнуто скринингу на предмет их влияния на клетки их конкретного типа рака или от конкретного субъекта, или может быть проведен скрининг на предмет их влияния на активность или экспрессию молекул, связанных с раком (таких, как молекулы, связанные с раком, о которых известно, что они имеют измененную активность или экспрессию при определенном типе рака). Когда обнаруживается, что неочищенный экстракт модулирует активность или экспрессию молекулы, связанной с раком, может быть выполнено дальнейшее фракционирование положительного основного экстракта для выделения химического компонента, ответственного за наблюдаемый эффект, с использованием способов, известных в данной области техники.
[799] Примерные тесты и модели на животных для тестирования терапий
[800] При необходимости один или более представленных в данном документе способов лечения могут быть протестированы на предмет их воздействия на заболевание или расстройство, такое как рак, с использованием клеточной линии (такой как клеточная линия с одной или более мутаций, идентифицированных у субъекта, у которого был диагностирован рак или повышенный риск рака при использовании способов по изобретению) или на модели заболевания или расстройства на животных, такой как мышиная модель SCID (Jain et al., Tumor Models In Cancer Research, ed. Teicher, Humana Press Inc., Totowa, N.J., pp. 647-671, 2001, документ полностью включен сюда посредством ссылки). Кроме того, существует множество стандартных анализов и моделей на животных, которые можно использовать для определения эффективности конкретных способов лечения для стабилизации, лечения или предотвращения заболевания или расстройства, такого как рак, или повышенного риска заболевания или расстройства, такого как рак. Терапии также могут быть протестированы в стандартных клинических испытаниях на людях.
[801] Для выбора предпочтительной терапии для конкретного субъекта соединения могут быть протестированы на их влияние на экспрессию или активность в отношении одного или более генов, мутировавших у субъекта. Например, способность соединения модулировать экспрессию определенных молекул или белков мРНК может быть обнаружена с помощью стандартного нозерн-блоттинга, вестерн-блоттинга или анализа с помощью микрочипов. В некоторых вариантах воплощения отбирается одно или более соединений, которые (i) ингибируют экспрессию или активность молекул мРНК или белков, способствующих развитию рака, которые экспрессируются на более высоком, чем обычно, уровне, или имеют более высокий, чем нормальный уровень активности у субъекта (например, в образце от субъекта) или (ii) способствуют экспрессии или активности молекул мРНК или белков, которые ингибируют рак, которые экспрессируются на более низком уровне, чем нормальный, или имеют более низкий, чем нормальный уровень активности, у субъекта. Отдельная или комбинированная терапия, которая (i) модулирует наибольшее количество молекул мРНК или белков, которые имеют мутации, связанные с раком у субъекта, и (ii) модулирует наименьшее количество молекул или белков мРНК, которые не имеют мутаций, связанных с раком у субъекта. В некоторых вариантах воплощения избранная отдельная или комбинированная терапия обладает высокой лекарственной эффективностью и дает мало побочных эффектов, если вообще таковые имеются.
[802] В качестве альтернативы субъект-специфическому анализу, представленному выше, ДНК-чипы могут использоваться для сравнения экспрессии молекул мРНК в конкретном типе рака на ранней или поздней стадии (например, в клетках рака молочной железы) с экспрессией в нормальной ткани (Marracket al., Current Opinion in Immunology 12, 206-209, 2000; Harkin, Oncologist. 5:501-507, 2000; Pelizzariet al., Nucleic Acids Res. 28(22):4577-4581, 2000, каждый из этих документов полностью включен сюда посредством ссылки). На основе этого анализа можно выбрать отдельную или комбинированную терапию для субъектов с этим типом рака, чтобы модулировать экспрессию мРНК или белков, которые изменили экспрессию при этом типе рака.
[803] Помимо использования для выбора терапии для конкретного субъекта или группы субъектов, профили экспрессии можно использовать для отслеживания изменений в экспрессии мРНК и/или белка, которые происходят во время лечения. Например, профилирование экспрессии можно использовать, чтобы определить, вернулась ли экспрессия генов, связанных с раком, к нормальному уровню. В противном случае доза одного или более соединений в терапии может быть изменена для увеличения или уменьшения эффекта терапии на уровни экспрессии соответствующего гена(ов), связанного(ых) с раком. Кроме того, этот анализ можно использовать для определения того, влияет ли терапия на экспрессию других генов (например, генов, связанных с неблагоприятными побочными эффектами). При необходимости доза или состав терапии могут быть изменены для предотвращения или уменьшения нежелательных побочных эффектов.
[804] Примерные составы и способы введения
[805] Для стабилизации, лечения или предотвращения заболевания или расстройства, такого как рак, или повышенного риска заболевания или расстройства, такого как рак, композиция может быть составлена и введена с использованием любого способа, известного специалистам в данной области техники (см., например, Патенты США №№ 8389578 и 8389557, каждый из этих документов полностью включен сюда посредством ссылки). Общие способы составления и введения находятся в "Remington: The Science and Practice of Pharmacy,” 21st Edition, Ed. David Troy, 2006, Lippincott Williams & Wilkins, Philadelphia, Pa., документ полностью включен сюда посредством ссылки). Примерами таких составов являются жидкости, суспензии, таблетки, капсулы, пилюли, порошки, гранулы, гели, мази, суппозитории, инъекции, ингаляционные средства и аэрозоли. В качестве примера, пероральный состав с модифицированным или пролонгированным высвобождением может быть получен с использованием дополнительных способов, известных в этой области техники. Например, подходящей формой с пролонгированным высвобождением активного ингредиента может быть матричная таблетка или капсульная композиция. Подходящие материалы, образующие матрицу, включают, например, воски (например, карнаубский, пчелиный воск, парафиновый воск, церезин, шеллаковый воск, жирные кислоты и жирные спирты), масла, отвержденные масла или жиры (например, отвержденное рапсовое масло, касторовое масло, говяжий жир, пальмовое масло и соевое масло) и полимеры (например, гидроксипропилцеллюлоза, поливинилпирролидон, гидроксипропилметилцеллюлоза и полиэтиленгликоль). Другими подходящими материалами для матричного таблетирования являются микрокристаллическая целлюлоза, порошкообразная целлюлоза, гидроксипропилцеллюлоза, этилцеллюлоза с другими носителями и наполнителями. Таблетки также могут содержать гранулы, порошки с покрытием или пеллеты. Таблетки также могут быть многослойными. Необязательно, готовая таблетка может быть покрыта или быть без покрытия.
[806] Типичные пути введения таких композиций включают, без ограничения, пероральный, сублингвальный, буккальный, местный, трансдермальный, ингаляционный, парентеральный (например, подкожные, внутривенные, внутримышечные, внутристернальные инъекции или методики инфузии), ректальный, вагинальный и интраназальный. В предпочтительных вариантах воплощения терапию проводят с использованием устройства пролонгированного высвобождения.
Композиции по изобретению составлены таким образом, чтобы активный ингредиент (ингредиенты), содержащий(е)ся в них, был(и) биодоступным(и) после введения композиции. Композиции могут иметь форму одной или более дозированных единиц. Композиции могут содержать 1, 2, 3, 4 или более активных ингредиентов и необязательно могут содержать 1, 2, 3, 4 или более неактивных ингредиентов.
[807] Альтернативные варианты воплощения
[808] Любой из представленных в данном документе способов может включать вывод данных в физическом формате, например, на экране компьютера или на бумажной распечатке. Любой из способов изобретения может быть объединен с выводом данных, требующих принятия мер, в формате, который может использоваться врачом. Некоторые из вариантов воплощения, представленных в документе, для определения генетических данных, относящихся к целевому индивидууму, могут быть объединены с уведомлением медицинского работника о потенциальной хромосомной аномалии (например, делеции или дупликации) или ее отсутствии. Некоторые из представленных в данном документе вариантов воплощения могут быть объединены с выводом данных, требующих принятия мер, и выполнением клинического решения, которое приводит к клиническому лечению, или к выполнению клинического решения не предпринимать никаких действий.
[809] В некоторых вариантах воплощения в данном документе раскрывается способ создания отчета, раскрывающего результат любого способа по изобретению (например, наличие или отсутствие делеции или дупликации). В результате применения способа по изобретению может быть сгенерирован отчет, и он может быть отправлен врачу в электронном виде, отображен на устройстве вывода (например, в цифровом отчете) или может быть доставлен врачу в виде письменного отчета (например, отчет в виде распечатанной бумажной копии). Кроме того, представленные способы могут быть объединены с фактическим исполнением клинического решения, которое приводит к клиническому лечению, или к выполнению клинического решения не предпринимать никаких действий.
[810] В некоторых вариантах воплощения настоящее изобретение предоставляет реагенты, наборы и способы, а также компьютерные системы и компьютерные среды с закодированными инструкциями для выполнения таких способов для обнаружения как ВЧК, так и ОНВ в одном образце с использованием представленных в данном документе способов мультиплексной ПЦР. В некоторых предпочтительных вариантах воплощения образец представляет собой образец одной клетки или образец плазмы, предположительно содержащий циркулирующую опухолевую ДНК. Эти варианты воплощения используют преимущество открытия того, что путем исследования образцов ДНК из отдельных клеток или плазмы на наличие ВЧК и ОНВ с использованием высокочувствительных способов мультиплексной ПЦР, раскрытых в данном документе, может быть достигнуто улучшенное обнаружение рака по сравнению с исследованием только для ВЧК или ОНВ, особенно для видов рака, демонстрирующих ВЧК, таких как рак молочной железы, яичников и легких. Способы в некоторых иллюстративных вариантах воплощения для анализа ВЧК исследуют от 50 до 100000 или от 50 до 10000, или от 50 до 1000 ОНП, и для ОНВ исследуют от 50 до 1000 ОНВ или от 50 до 500 ОНВ, или от 50 до 250 ОНВ. Предоставленные в данном документе способы для обнаружения ВЧК и/или ОНВ в плазме субъектов с подозрением на рак, включая, например, рак, который, как известно, проявляет ВЧК и ОНВ, такой как рак молочной железы, легких и яичников, обеспечивают преимущество обнаружения ВЧК и/или ОНВ из опухолей, которые часто состоят из гетерогенных популяций раковых клеток с точки зрения генетического состава. Таким образом, традиционные способы, которые ориентированы на анализ только определенных областей опухоли, часто могут упускать из виду ВЧК или ОНВ, которые присутствуют в клетках в других областях опухоли. Образцы плазмы действуют как жидкие биопсии, которые можно исследовать для обнаружения любых ВЧК и/или ОНВ, которые присутствуют только в субпопуляциях опухолевых клеток.
[811] Нижеследующие примеры представлены для того, чтобы предоставить рядовым специалистам в данной области техники полное раскрытие и описание того, как использовать варианты воплощения, представленные в данном документе, и не предназначены для ограничения объема изобретения, и также они не предназначены для обозначения того, что приведенные ниже примеры являются всеми или единственными выполненными экспериментами. Были предприняты усилия для обеспечения точности используемых чисел (например, количества, температуры и т. д.), но следует учитывать некоторые экспериментальные ошибки и отклонения. Если не указано иное, части являются частями по объему, а температура дана в градусах Цельсия. Следует понимать, что изменения в представленных способах могут быть сделаны без изменения фундаментальных аспектов, которые эти примеры признаны иллюстрировать.
ПРИМЕРЫ
[812] ПРИМЕР 1. Персонализированный анализ циркулирующей опухолевой ДНК для мониторинга колоректального рака
[813] Было показано, что раннее выявление рецидивов заболевания улучшает выживаемость пациентов с колоректальным раком (КРР). Обнаружение циркулирующей опухолевой ДНК (цоДНК) после операции определяет подгруппу пациентов с КРР с очень высоким риском рецидива. Предыдущие исследования проводили анализ цоДНК для мониторинга опухолевой нагрузки на ранней стадии КРР с использованием секвенирования небольших генов или цифровой капельной ПЦР.
[814] Целью этого примера было использовать персонализированную платформу ССП для мультиплексной ПЦР, нацеленную на 16 опухолеспецифических мутаций на пациента, для оценки минимального остаточного заболевания после операции и мониторинга реакции на лечение КРР.
[815] В исследование были включены 130 пациентов с I-IV стадией КРР, получавших лечебное хирургическое вмешательство и (необязательно) адъювантную химиотерапию (см. Таблицу 1). Образцы плазмы собирали в динамике на исходном уровне до операции и во время запланированных контрольных визитов после операции (ФИГ. 20A). Полноэкзомное секвенирование выявило соматические мутации; в соответствии со стандартным рабочим процессом Signatera, тесты мультиплексной ПЦР для конкретных пациентов, нацеленные на 16 соматических однонуклеотидных вариантов и вариантов со вставкой/делецией, были проанализированы путем массового параллельного секвенирования в образцах плазмы, собранных до и после операции, а также во время адъювантной терапии (ФИГ. 20B).
[816] Таблица 1. Характеристики и демографические данные пациентов (N=130)
Н/О*
10 (7,7)
II
6 (14,3)
Н/О*
9 (6,9)
[817] ФИГ.22 представляет собой схематический обзор результатов профилирования цоДНК более 800 образцов плазмы от 128 из 130 пациентов. ФИГ.23A-B показывает риск рецидива, стратифицированный по послеоперационному статусу цоДНК. Статус цоДНК был установлен на основании первой послеоперационной пробы крови, взятой на 6 неделе и до начала АХТ. ФИГ.23 (A) показывает анализ Каплана-Мейера безрецидивной выживаемости, стратифицированный по статусу цоДНК. Пациенты без события были оценены в конце периода наблюдения. ФИГ.23 (В) показывает частоту рецидивов в соответствии со статусом цоДНК (без оценки пациентов). Адъювантная химиотерапия была проведена 58 пациентам, что, вероятно, повлияло на частоту рецидивов у пациентов с положительной реакцией на цоДНК.
[818] ФИГ.24(A) показывает риск рецидива после постадъювантной химиотерапии, стратифицированный по постадъювантному статусу цоДНК. Пациенты считались цоДНК- положительными, если в любой момент времени после адъювантной терапии этот статус был положительным, и отрицательными, если во все постадъювантные моменты времени статус был отрицательным. ФИГ.24(B) показывает профилирование по цоДНК у репрезентативного пациента во время адъювантного и постадъювантного лечения.
[819] ФИГ.25 демонстрирует частоту рецидивов у 10 пациентов с послеоперационным цоДНК-положительным статусом до лечения при помощи адъювантной химиотерапии, а также то, как цоДНК была устранена посредством АХТ у двух из трех безрецидивных цоДНК-положительных пациентов.
[820] ФИГ.26A-B показывает сравнение времени до рецидива (TTR) с использованием цоДНК и компьютерной томографии: (A) сравнение TTR с использованием цоДНК и КT-визуализации для 12 пациентов с рецидивом, у которых рецидив был обнаружен обоими способами; (б) серийное профилирование цоДНК репрезентативного пациента с рецидивом со сроком исследования цоДНК 10,2 месяца.
[821] ФИГ.27A-D демонстрирует серийное профилирование цоДНК четырех репрезентативных пациентов.
[822] В заключение можно сказать, что подход Signatera RUO к массовому параллельному секвенированию персонализированных мультиплексных ПЦР-тестов, направленных на опухолеспецифические мутации, является высокочувствительной и специфической платформой для обнаружения и количественной оценки цоДНК. Послеоперационный анализ цоДНК позволяет разделить пациентов с КРР на подгруппы с очень высоким или очень низким риском рецидива, как до, так и после АХТ. Как до, так и после адъювантной химиотерапии. Анализ цоДНК в динамике обеспечивает эффективный послеоперационный мониторинг лечения и раннее выявление рецидивов. Анализ цоДНК очень полезен при принятии решений о лечении как в адъювантном, так и в постадъювантном режиме.
[823] ПРИМЕР 2. Секвенирование скДНК плазмы пациентов с местнораспространенным раком мочевого пузыря для наблюдения и мониторинга терапевтической эффективности
[824] Исследования на различных типах рака показали, что уровни циркулирующей опухолевой ДНК (цоДНК) можно эффективно использовать для мониторинга реакции на неоадъювантную терапию и/или выявления рецидива заболевания раньше клинического и радиологического обнаружения. При раке мочевого пузыря мутации в плазме ранее использовались для отслеживания ответа во время лечения и выявления ранних признаков метастатического заболевания. Недавно было описано обнаружение цоДНК в динамике у пациентов с НМРЛ, и был разработан персонализированный тест обнаружения циркулирующей опухолевой ДНК (цоДНК) (Signatera™ RUO).
[825] Целью исследования явилось использование специфичных для пациента мутаций, выявленных в первичной опухоли, для обнаружения метастатического рецидива, оценки прогноза и мониторинга ответа на лечение по цоДНК из образцов плазмы, собранных в динамике.
[826] Клинический протокол. Пациенты с диагнозом местно-распространенный мышечно-инвазивный рак мочевого пузыря (МИРМП), которым назначена химиотерапия, были проспективно набраны в период с 2013 по 2017 год. Все пациенты получали неоадъювантную химиотерапию или химиотерапию первой линии перед цистэктомией (ЦЭ) и наблюдались в течение 2 лет (ФИГ.28). Образцы плазмы отбирались в динамике до и после системной терапии и при плановых контрольных визитах после ЦЭ.
[827] Молекулярный протокол. Соматические мутации, специфичные для пациента, были идентифицированы путем полноэкзомного секвенирования (ПЭС) опухоли и сопоставлялись с нормальными образцами. Персонализированные анализы мультиплексной ПЦР использовали для обнаружения специфичной для пациента ДНК опухоли в плазме с использованием скДНК из образцов плазмы, собранных в динамике. Для каждого пациента было выполнено секвенирование 16 опухолеспецифичных мишеней, и данные были проанализированы клинически слепым способом на наличие цоДНК. Образцы считались цоДНК положительными, если и только если в них были распознаны по меньшей мере две положительные мишени, специфичные для пациента, и которые соответствовали требуемому порогу доверительной оценки. Клинические результаты (рентгенографические изображения и ответ на лечение) не были слепыми и сравнивались непосредственно с результатами анализа плазмы Signatera.
[828] Всего в исследование было включено 50 пациентов (Таблица 2).
[829] Таблица 2. Характеристики и демографические данные пациентов (N=50)
T4a/b
7 (14)
[830] Оперативный контроль качества секвенирования проводился в 5 циклах HiSeq PE 2x50; среднее значение на целевую глубину считывания и фоновую частоту ошибок показано на ФИГ.29.
[831] Раннее обнаружение рецидива. Клинический рецидив после ЦЭ был диагностирован у десяти пациентов, а цоДНК была обнаружена в плазме у девяти из этих пациентов с медианным значением 128 дней до клинического рецидива. (Таблица 3). У одного пациента последний контрольный образец через 4 месяца после ЦЭ еще не анализировался.
[832] Таблица 3. Сравнение молекулярного и клинического рецидива (n=9).
№
[833] ФИГ.30A-F изображает 6 пациентов, у которых был выявлен ранний рецидив. цоДНК была обнаружена при ЧВА всего на уровне 0,02% во время молекулярного рецидива, время упреждения которого составляло до 265 дней до клинического рецидива (ФИГ. 30D, 30E и 30F). У большинства пациентов ответ на химиотерапию соответствовал снижению ЧВА цоДНК (Таблица 4).
[834] Таблица 4. Прогнозирование ответа на лечение после химиотерапии
aПолучил химиотерапию первой линии перед ЦЭ. bИмел TUR-P перед TUR-B, опухоль T1 из уретры, простатическая часть. cОтвет на лечение определялся переходом от неоперабельного к операбельному состоянию после химиотерапии (несмотря на изменение стадии рака). ЧВА, частота вариантного аллеля; ЦЭ, цистэктомия; Н/О, не обнаружено.
[835] На ФИГ.32A-B изображены два пациента, у которых наблюдалась реакция на лечение с использованием цоДНК; цоДНК, обнаруженная первоначально при постановке диагноза, снизилась при неоадъювантном лечении и оставалась невыявляемой после ЦЭ.
[836] В заключение, эти данные демонстрируют, что анализ цоДНК (например, с помощью Signatera) может помочь получить информацию о реакции на лечение и выявить рецидивы заболевания на 265 дней раньше, чем при рентгенографии. Анализ выживаемости выявил достоверно более низкую безрецидивную выживаемость у пациентов с цоДНК на момент постановки диагноза или после цистэктомии. В конечном счете, анализ цоДНК может быть включен в рутинное наблюдение для раннего выявления рецидива и, следовательно, потенциально более раннего начала альтернативного лечения, такого как иммунотерапия. Положительное воздействие на общую выживаемость, достигнутое за счет выявления рецидива цоДНК, следует оценивать в рандомизированных клинических исследованиях.
[837] Пример 3. Высокочувствительный анализ неинвазивного выявления рецидивов рака и мониторинга терапии на основе специфической для пациента мультиплексной ПЦР, основанной на секвенировании следующего поколения (ССП)
[838] Идентификация опухолевых мутаций в циркулирующей внеклеточной ДНК имеет большой потенциал для неинвазивного выявления рецидива рака до его клинического проявления, обнаружения минимального остаточного заболевания после радикального лечения и обнаружения терапевтически значимых мутаций. Анализировать и сообщать результаты аналитической валидации для выявления опухолеспецифических вариантов с помощью текущей версии анализа.
[839] Signatera RUO. Процесс Signatera™ (RUO) начинается с выявления и назначения приоритетности соматических мутаций на основе полноэкзомного секвенирования опухоли и соответствующих нормальных образцов. Специфичные для пациента анализы мультиплексной ПЦР, нацеленные на 16 соматических однонуклеотидных вариантов и вариантов вставка/делеция, затем анализируются путем массового параллельного секвенирования образцов плазмы, собранных на протяжении всего течения болезни пациента, чтобы помочь обнаружить и контролировать циркулирующую опухолевую ДНК.
[840] Аналитическая валидация. Аналитическая проверка текущей версии анализа Signatera (RUO) была проведена на двух линиях клеток рака молочной железы (HCC2218, HCC1395), одной клеточной линии рака легких (NCI-H1395) и их соответствующих нормальных аналогах (соответственно, HCC2218-BL, HCC1395-BL и NCI-H1395-BL). Различные количества ДНК линии опухолевых клеток (0; 0,005; 0,01; 0,03; 0,05; 0,1; 0,3; 0,5; 1%) титровали до соответствующей подходящей ДНК нормальной линии клеток. Пулы праймеров для мультиплексного ПЦР-анализа (каждый из которых состоит из 16 анализов пар праймеров, специфичных для соматических мутаций с высокой степенью достоверности) были разработаны с использованием данных всего экзома из соответствующей ДНК линии опухолевых клеток и соответствующей ДНК нормальной клеточной линии. Начальный общий ввод в подготовку библиотеки для каждой реакции составлял 20 тыс. геномных эквивалентов; мишени ОНВ и вставки/делеции из соответствующих образцов опухолевой ДНК были амплифицированы с использованием пулов праймеров для мультиплексной ПЦР, упомянутых выше. Продукты мПЦР получали штрих-коды, затем были объединены с другими продуктами мПЦР, и впоследствии секвенированы на Illumina HiSeq 2500 Rapid Run с 50 циклами парных считываний с использованием набора Illumina Paired End v2 со средней глубиной считывания ~100000/анализ.
[841] ФИГ.34 изображает последовательность проверок контроля качества процесса по 4 запускам HiSeq PE 2x50, включая фоновый переход и частоту ошибок преобразования, а также среднее значение на целевую глубину считывания (depth-of-reads - DOR) приблизительно 100тыс. (где любые мишени, получившие менее 5000 считываний, считались неудачными и не учитывались для распознавания).
[842] С Signatera (RUO) была достигнута аналитическая чувствительность ~60% для обнаружения при 0,03% добавленной опухолевой ДНК (Таблица 5).
[843] Таблица 5. Результаты аналитической чувствительности для текущей версии Signatera (RUO)
[844] Для данного набора ОНВ количество ожидаемых процентов ввода по сравнению с обнаруженными процентными значениями частоты вариантного аллеля (ЧВА) для различных концентраций добавленной мутантной ДНК показано по 6 мишеням, демонстрируя высокую чувствительность выше 0,03% концентрации опухолевой ДНК (ФИГ.36). Ложноотрицательные результаты, показанные при вводе не более 0,01% ОНВ (начиная с менее 2 мутантных копий), включают мутантные молекулы, потерянные в результате забора образцов (ФИГ.36).
[845] Расчетная чувствительность на уровне образца для Signatera (RUO) при распознавании по меньшей мере двух ОНВ из набора из 16 ОНВ с высокой степенью достоверности, указана в Таблице 6.
[846] Таблица 6. Расчетная чувствительность на уровне образца
[847] В заключение. Анализ Signatera RUO представляет собой новый способ неинвазивного обнаружения рецидива персонализированных сигнатур рака в плазме путем сверхглубокого мультиплексного секвенирования индивидуализированных ПЦР-анализов (выбранных для опухоли пациента) с высокой чувствительностью, высокой специфичностью и низкой частотой ошибок. Основываясь на результатах аналитической валидации, анализ Signatera RUO на уровне ОНВ имеет специфичность 99,9% и чувствительность более 65% при фракции опухоли свыше 0,03%, и чувствительность 100% при фракции опухоли свыше 0,1%. На уровне образца анализ Signatera RUO имеет чувствительность более 95% при фракции опухоли 0,01%, чувствительность почти 100% при фракции опухоли 0,03% и 100% чувствительность при фракции опухоли 0,05% и выше. Эти данные демонстрируют высокую степень обнаружения на уровне мутантных одиночных молекул; они также предполагают, что можно использовать более низкие объемы плазмы для достижения такого же обнаружения одиночных молекул с высокой специфичностью. Эффективность анализа Signatera предполагает возможность его применения для определения эффективности химиотерапевтического лечения.
[848] Пример 4. Оценка в динамике мультиплексных индивидуальных биомаркеров цоДНК при раке мочевого пузыря для диагностики, наблюдения и выявления рецидива
[849] Обоснование. Использование циркулирующей опухолевой ДНК (цоДНК) в качестве биомаркера для определения стадии заболевания при диагностике (DX), реакции на лечение и мониторинг рецидивов является новой областью для многих типов рака. При раке мочевого пузыря применение цоДНК показало многообещающие результаты. Раскрывается высокочувствительный и специфический подход к мониторингу цоДНК на основе ССП.
[850] Способы. Была проспективно включена когорта из 50 пациентов с местно-распространенным мышечно-инвазивным раком мочевого пузыря, получавших неоадъювантную химиотерапию. Для каждого пациента была разработана панель из 16 опухолеспецифических мутаций (SignateraTM RUO) на основе полноэкзомного секвенирования ДНК опухоли и зародышевой линии. В общей сложности мы проанализировали цоДНК из собранных в динамике образцов плазмы из 386 временных точек, полученных при диагностике, во время лечения, при цистэктомии (Сх) и во время мониторинга до рецидива заболевания или до 2 лет наблюдения. Результаты анализа цоДНК сравнивали с рентгенологическими данными и клиническими исходами. цоДНК из образцов мочи, собранных в динамике, также может быть проанализирована на предмет ответа на лечение и рецидива заболевания.
[851] Результаты. При DX статус цоДНК в плазме был сильным прогностическим фактором безрецидивной выживаемости. В частности, 62% (8/13) пациентов с цоДНК+ при DX имели рецидив после неоадъювантного лечения и Сх; и наоборот, ни один (0/22) из пациентов с цоДНК- не имел рецидива (логарифмический ранг; p меньше 0,0001). Кроме того, также наблюдалась сильная корреляция между наличием цоДНК после Cx и рецидивом заболевания. В частности, рецидив после Cx был обнаружен у 100% (10/10) пациентов с цоДНК+ за приблизительно 120 дней (0-245 дней) до рентгенографии, в то время как у 0% (0/38) пациентов с цоДНК- был отмечен рецидив (логарифмический ранг); р меньше 0,0001).
[852] Выводы. Был продемонстрирован значительный прогностический потенциал цоДНК при раке мочевого пузыря во время DX, что предполагает наличие роли цоДНК в стадировании рака мочевого пузыря. Кроме того, было показано, что цоДНК выявляется у всех пациентов с рецидивом заболевания после Сх. Включение анализа цоДНК в рутинное наблюдение для раннего выявления рецидива позволяет раньше начинать применение альтернативных способов лечения.
[853] Пример 5. Серийный анализ циркулирующей опухолевой ДНК для выявления остаточной болезни, оценки эффективности адъювантной терапии и раннего выявления рецидивов колоректального рака
[854] Обоснование. Было показано, что раннее обнаружение рецидива заболевания улучшает выживаемость пациентов с колоректальным раком (КРР). Предыдущие исследования анализировали циркулирующую опухолевую ДНК (цоДНК) для мониторинга опухолевой нагрузки при КРР с использованием небольших панелей генов и цифровой капельной ПЦР. В данном случае была использована персонализированная мультиплексная ПЦР и платформа ССП (Signatera™RUO) для обнаружения цоДНК в серийно собранных образцах плазмы, чтобы оценить, определяет ли обнаружение цоДНК подгруппу пациентов с высоким риском рецидива как до, так и после адъювантной химиотерапии (АХТ).
[855] Способы. Была проанализирована когорта из 130 пациентов с I-IV стадией КРР, получавших лечение по стандарту медицинской помощи. Для каждого пациента были разработаны опухолеспецифические панели из 16 мутаций с использованием сигнатур соматических мутаций, полученных из ПЭС. Были проанализированы образцы плазмы (n=829), отобранные до и после операции, а также во время АХТ. Рассчитана безрецидивная выживаемость пациентов, стратифицированных по статусу цоДНК после операции (n=91) и после АХТ (n=58).
[856] Результаты. Статус цоДНК после операции, но до АХТ, оценивали у 91 пациента. Рецидив наблюдался у 75% (6/8) пациентов с цоДНК+ и только у 13% (11/83) пациентов с цоДНК-. Эффективное лечение при помощи АХТ наблюдалось у 30% (3/10) послеоперационных больных цоДНК+. Они постоянно имели статус цоДНК- в серийных образцах крови, взятых после АХТ, и, соответственно, не имели рецидивов в конце периода наблюдения. Статус цоДНК после АХТ оценен у 58 пациентов. Рентгенологически подтвержденный рецидив отмечен у 77% (10/13) пациентов с цоДНК+ и у 4% (2/45) пациентов с цоДНК-. В среднем цоДНК выявляет рецидив на 9,13 месяца раньше, чем при стандартной компьютерной томографии.
[857] Выводы. Серийный послеоперационный анализ цоДНК позволяет разделить пациентов на подгруппы с высоким или низким риском рецидива, оценить эффективность лечения АХТ и обеспечить раннее выявление рецидива. Важно отметить, что это также указывает на то, что АХТ может устранить остаточную болезнь у 30% послеоперационных пациентов с цоДНК+ и, следовательно, может быть вариантом лечения для пациентов с цоДНК+. Таким образом, анализ цоДНК имеет большой потенциал для определения решений о лечении, как в адъювантных, так и в постадъювантных условиях.
[858] Пример 6. Раннее обнаружение остаточного рака молочной железы (РМЖ) с помощью надежного, масштабируемого и персонализированного анализа циркулирующей опухолевой ДНК (цоДНК) предшествует выраженному метастатическому рецидиву
[859] Обоснование. У многих пациентов с РМЖ наблюдается рецидив после первичного лечения, но отсутствуют надежные тесты для выявления отдаленных метастазов до того, как они станут явными. В нашем варианте продемонстрировано более раннее выявление рецидивирующих пациентов с помощью персонализированного анализа цоДНК. Способ применим ко всем пациентам и не ограничивается мутациями горячих точек, которые обычно обнаруживают с помощью генных панелей.
[860] Способы. Было набрано 49 пациентов с неметастатическим РМЖ после хирургического вмешательства и адъювантной терапии. Образцы плазмы (n=208) собирали серийно раз в полгода. Используя аналитически подтвержденный рабочий процесс SignateraTM, мутационные сигнатуры определяли на основе данных всего экзома первичной опухоли и путем сверхглубокого секвенирования (в среднем, более 100000X).были разработаны персонализированные анализы с высокой чувствительностью, нацеленные на 16 вариантов. Для того, чтобы определить, можно ли обнаружить мутационную сигнатуру в плазме, использовали анализ каждого пациента. Все пациенты, кроме 5, получали химиотерапию, а остальные 5 получали лучевую терапию.
[861] Результаты. У 16 из 18 (89%) пациентов с клиническим рецидивом цоДНК была обнаружена перед метастатическим рецидивом, диагностированным путем клинического обследования и биохимическими измерениями (CA15-3), и цоДНК оставалась положительной при последующем наблюдении. Из 2 пациентов с невыявленной цоДНК у одного был местный рецидив, а у другого две первичные опухоли. Ни один из 33 безрецидивных пациентов не был положительным по цоДНК в любой временной точке (n=142). Метастатический рецидив был предсказан Signatera с высокой точностью и временем упреждения до 2 лет (медиана = 9,5 месяцев). Резюме этих результатов представлено на ФИГ. 37. Подробные результаты показаны на ФИГ. 38-59.
[862] Выводы. Использование масштабируемого валидированного рабочего процесса на основе цоДНК, ориентированного на конкретного пациента, позволяет раньше идентифицировать пациентов, у которых возникнет рецидив. Точный и более ранний прогноз с помощью анализа цоДНК может обеспечить средство мониторинга пациентов с раком молочной железы, нуждающихся в вспомогательной адъювантной терапии второй линии, чтобы предотвратить выраженное, угрожающее жизни метастатическое прогрессирование.
[863] Представленные в данном документе результаты демонстрируют, что способы на основе обнаружения персонализированного маркера рака/циркулирующей опухолевой ДНК в образце крови пациента очень чувствительны в прогнозировании рецидива рака молочной железы. Например, 16 из 18 случаев рецидива были верно предсказаны, и ложноположительных результатов отмечено не было. Способы также очень последовательны. После того, как обнаружен положительный результат, последующий образец крови от того же пациента остается неизменно положительным.
[864] Способы позволяют обнаруживать персонализированный маркер рака/циркулирующую опухолевую ДНК и прогнозировать рецидив, например, за 27-610 дней до обнаружения рецидива с помощью стандартных способов (например, визуализации). Медианное время выявления рецидива составляет 9 месяцев до того, как рецидив обнаруживается стандартными способами.
[865] Пример 7. Персонализированный серийный анализ циркулирующей опухолевой ДНК (цоДНК) у пациентов с высоким риском рака молочной железы на ранней стадии для мониторинга и прогнозирования ответа на неоадъювантную терапию (НАТ) и исхода в исследовании I-SPY2 TRIAL
[866] Обоснование. Анализ цоДНК предлагает неинвазивный подход к мониторингу ответа и устойчивости к лечению. Серийное тестирование цоДНК во время НАТ может предоставить ранние индикаторы возникающей резистентности и прогрессирования заболевания. В этом исследовании цоДНК была проанализирована у пациентов с ранним раком молочной железы с высоким риском, получивших НАТ и радикальную операцию в исследовании I-SPY2 TRIAL (NCT01042379). Данные, собранные в этом примере, будут использоваться для: (1) определения взаимосвязи между уровнями цоДНК во время раннего лечения и полным патологическим ответом/остаточной раковой нагрузкой/отдаленной выживаемостью без рецидивов; (2) сравнения эффективности цоДНК и МРТ в прогнозировании ответа опухоли на терапию; и (3) изучения взаимосвязи уровней цоДНК до и после НАТ с 3-летней выживаемостью без событий (event-free survival - EFS).
[867] Способы. Анализ цоДНК был проведен у 84 пациентов с раком молочной железы II и III стадии с высоким риском, рандомизированных по неоадъювантному исследуемому агенту (n = 57), ингибитору AKT MK-2206 (M) в комбинации с паклитакселом (T), а затем к доксорубицину и циклофосфамиду (AC). (M + T-> AC) или стандарт лечения (T-> AC) (n = 27). Пациенты с HER2 + получали трастузумаб (H) в дополнение к T или M + T.
[868] Серийную плазму собирали до НАТ, в начале лечения (3 недели), между схемами (12 недель) и после НАТ перед операцией. Мутационные профили, полученные из биопсии опухоли перед лечением и полноэкзомные последовательностей ДНК зародышевой линии, были использованы для разработки персонализированных анализов, нацеленных на 16 вариантов, специфичных для опухоли пациента, для обнаружения цоДНК в плазме. В подгруппе пациентов, у которых не наблюдалось полного патологического ответа (n = 18-22), мутации в остаточном раке сравнивали с мутациями, обнаруженными в опухоли до лечения.
[869] Анализ: Из 84 пациентов в этом анализе 15-25% имели HR-HER2-, 40-60% H+ HER2- и 35-35% - HER2+. Из них 20-25% и 30-42% достигли полного патологического ответа, соответственно, в контрольной и лечебной группах. В настоящее время данные собираются для: (1) определения взаимосвязи между уровнями цоДНК во время раннего лечения и полным патологическим ответом/остаточной раковой нагрузкой/отдаленной выживаемостью без рецидивов; (2) сравнения эффективности цоДНК и МРТ в прогнозировании ответа опухоли на терапию; (3) изучения взаимосвязи уровней цоДНК до и после НАТ с 3-летней бессобытийной выживаемостью (EFS).
[870] Выводы. Это исследование предоставляет платформу для оценки клинической значимости цоДНК для серийного мониторинга ответа на НАТ. Точный и ранний прогноз ответа с помощью высокочувствительного анализа цоДНК может способствовать своевременному и разумному изменению лечения для того, чтобы повысить шансы пациентов на достижение полного патологического ответа. Наконец, персонализированное тестирование цоДНК может дополнять визуализацию и патологическую оценку ответа опухоли для оптимизации полного патологического ответа в качестве суррогатной конечной точки для улучшения EFS.
[871] Пример 8. Раннее выявление остаточного рака молочной железы с помощью масштабируемого и персонализированного анализа циркулирующей опухолевой ДНК (цоДНК) предшествует выраженному метастатическому рецидиву.
[872] ВВЕДЕНИЕ
[873] Рак молочной железы является одним из наиболее часто диагностируемых онкологических заболеваний во всем мире и второй по значимости причиной смерти женщин от рака. В настоящее время стандартом лечения женщин с неметастатическим раком молочной железы является хирургическое вмешательство, за которым часто следует адъювантная терапия для устранения микроскопических остаточных заболеваний, которые могут привести к рецидиву или дальнейшему прогрессированию заболевания. К сожалению, у до 30% женщин, у которых нет признаков заболевания после радикального лечения, в конечном итоге обнаруживается рецидив, и они умирают от метастатического рака молочной железы в результате микрометастазов. Современные инструменты для мониторинга заболеваний, включая способы визуализации и/или биохимические способы (включая уровни ракового антигена 15-3 (CA15-3) в сыворотке), обладают ограниченной чувствительностью и точностью при обнаружении микрометастазов. Позднее обнаружение метастазов связано с плохими результатами у многих пациентов, что подчеркивает необходимость разработки более ранних и более чувствительных показателей минимальной остаточной болезни (МОБ).
[874] Циркулирующая опухолевая ДНК (цоДНК), высвобождаемая апоптотическими и некротическими раковыми клетками, как было обнаружено, отражает мутационные сигнатуры опухоли и становится потенциальным неинвазивным биомаркером для мониторинга прогрессирования опухоли при различных типах рака. При раке молочной железы использование цоДНК для выявления минимальной остаточной болезни после хирургического вмешательства и/или адъювантной терапии, а также для мониторинга метастатического заболевания дало многообещающие результаты. В частности, было показано, что уровни цоДНК в плазме коррелируют с изменениями в массе опухоли, тем самым обеспечивая более раннюю оценку ответа на лечение и позволяя различать пациентов с клиническим рецидивом после операции и без него. Хотя многочисленные исследования документально подтвердили потенциальное использование анализа цоДНК при раке молочной железы, на сегодняшний день нет масштабируемых тестов, способных надежно обнаруживать минимальную остаточную болезнь у всех пациентов.
[875] Персонализированный опухолеспецифический подход к исследованию однонуклеотидных вариантов и вариантов ВСТАВКА/ДЕЛЕЦИЯ в скДНК плазмы предсказал рецидив у пациентов с немелкоклеточным раком легкого до клинического обнаружения, что позволяет предположить, что это также может быть подходящим способом для мониторинга минимальной остаточной болезни у пациентов с раком молочной железы. в данном документе, используя расширенную и масштабируемую версию этого подхода, мы стремились определить использование серийного анализа цоДНК для мониторинга рецидива рака молочной железы после хирургического вмешательства и адъювантной терапии по сравнению с традиционными методами мониторинга. Основная цель заключалась в определении «упреждающего интервала» между обнаружением цоДНК в плазме крови и клиническим обнаружением выраженного метастатического заболевания у пациентов с первичным раком молочной железы.
[876] СПОСОБЫ
[877] Пациенты и образцы
[878] EBLIS представляет собой многоцентровое ожидаемое когортное исследование (номер NIHR REC - 13/LO/1152; IRAS: 126462), финансируемое Cancer Research UK и Национальным институтом медицинских исследований (NIHR). Все пациенты дали письменное информированное согласие до начала исследования. Протокол исследования был одобрен Комитетом по этике исследований Риверсайда (Riverside Research Ethics Committee - REC): 13/LO/115; IRAS: 126462. Весь исследовательский и технический персонал не знал о результатах лечения пациентов.
[879] Всего мы набрали 197 пациентов из 3 центров Великобритании. Девять пациентов не соответствовали критериям включения в исследование; таким образом, когорта из 188 пациентов наблюдалась с 6-месячным забором крови на цоДНК вместе с сопутствующим клиническим обследованием и биохимическими измерениями, включая CA153 (ФИГ.60). Подходящие пациенты должны были быть 18 лет и старше, не иметь клинических признаков метастатического заболевания и, следовательно, считаться здоровыми после операции и адъювантной химиотерапии. Все они прошли адъювантную химиотерапию в течение 5 лет после включения в исследование. У всех был рак молочной железы высокого риска (риск смерти более 50% через 10 лет без лечения, что соответствует частоте рецидивов 65% через 10 лет без лечения).
[880] середине исследования (2 года), после промежуточного анализа и с учетом того, что наблюдалось 50% предсказанных событий, мы решили провести полноэкзомный анализ первичной опухоли у первых 50 пациентов.
[881] Образцы крови собирали в пробирки с K2-EDTA. Образцы обрабатывали в течение 2 часов после забора путем двойного центрифугирования крови, сначала в течение 10 минут при 1000 g, затем плазмы в течение 10 минут при 2000 g. Плазму хранили в виде аликвот по 1 мл при минус 80 °C.
[882] Платформа Signatera™ RUO. Весь исследовательский и технический персонал не знали результатов лечения пациентов, и анализы проводились слепым способом. Строго контролируемый полуавтоматический лабораторный процесс выполнялся обученным персоналом с подписанными СОП и засвидетельствованием. Все реагенты и оборудование были проверены и аттестованы перед поступлением в процесс обработки Signatera™ RUO. Информация о процессе и реагентах/оборудовании фиксировалась в электронном виде и загружалась в базу данных со встроенными проверками целостности. Контроль качества проводился на каждом этапе рабочего процесса (ФИГ.67A-D). Образцы и ампликоны, не прошедшие контроль качества, были исключены из анализа. Для каждого пациента был генотипирован набор из 45 ОНП в ПЭС и секвенировании плазмы для обеспечения соответствия образцов. Данные ПЭС были использованы для разработки индивидуальной панели соматических мутаций для всех 49 пациентов. Всего на определение цоДНК было проанализировано 215 проб плазмы. Для каждого целевого варианта рассчитывалась оценка достоверности на основе глубины считывания мутантных и эталонных аллелей. Образец плазмы с двумя и более высоко достоверными вариантами считался цоДНК-положительным. Подробная информация об этапах рабочего процесса Signatera представлена ниже.
[883] Статистические анализы
[884] Все данные были представлены описательно как средние, медианы или пропорции. Безрецидивную выживаемость со дня включения в исследование определяли с использованием способа Каплана-Мейера. Для моделирования времени до рецидива заболевания использовался регрессионный анализ пропорциональных рисков Кокса. Все статистические анализы были выполнены с использованием Stata, выпуск 12.0 (Stata Corp., College Station, Texas, США), и графики выживаемости были сгенерированы с использованием R версия 3.5.1 (пакет “survminer” версия 0.4.2.99).
[885] Была использована консервативная стратегия обработки недостающих непрерывных данных. Если отдельные точки данных отсутствовали, последнее наблюдение переносилось на будущее или, если предыдущие и последующие данные были доступны, то среднее из этих двух значений служило оценкой отсутствующих данных.
[886] Полноэкзомное секвенирование
[887] Диагностические FFPE блоки проверяли путем визуальной инспекции и для выделения ДНК использовали блок с наибольшей остаточной опухолью. Единичный гематоксилин-эозиновый срез опухоли исследовал консультант-гистопатолог (D M) и по меньшей мере 2 области опухоли подвергали макроскопическому препарированию с использованием 1 мм микрочиповой иглы для пункционной биопсии. ДНК экстрагировали из ядер FFPE опухоли с использованием набора Gene Read (Qiagen) в соответствии с инструкциями производителя, и концентрацию ДНК измеряли, как описано ранее.
[888] Illumina HiSeq был использован для выполнения полноэкзомного секвенирования на 200-500 нг объединенной опухолевой ДНК из 1-3 областей, сформированных из каждого FFPE блока первичной опухоли (секвенирование выполнялось Novogen как плата за услугу, при средней глубине целевого считывания с дедупликацией 150x для всех 49 опухолевых ДНК и 50x для 49 соответствующих образцов зародышевой линии. Все данные секвенирования депонированы в Европейском архиве генома-фенома.
[889] Индивидуальный дизайн панели. Соматические варианты, специфичные для каждого пациента, были идентифицированы путем анализа первичной опухоли и соответствовали нормальному ПЭС для всех 49 пациентов. Клональность вариантов была выведена на основании расчетной доли раковых клеток, несущих вариант. Предполагаемая клональность и типы вариантов были использованы для приоритетных соматических ОНВ и коротких вставок/делеций, идентифицированных для каждой опухоли. Для создания праймеров для ПЦР для данного набора вариантов использовался стандартный процесс обработки анализов Signatera. Для каждого пациента было выбрано 16 высокорейтинговых совместимых анализов для индивидуальной панели конкретного пациента. Специализированные для пациента 16-плексные ПЦР-анализы заказывали у Integrated DNA Technologies.
[890] Экстракция и количественное определение скДНК. Для этого исследования было доступно до 8 мл плазмы на случай (диапазон 1-8 мл; медиана 5 мл). Для экстракции скДНК был использован весь объем плазмы. скДНК экстрагировали с применением набора QIAamp Circulating Nucleic Acid kit (Qiagen) и элюировали в 50 мкл буфера для суспензии ДНК (Sigma). Проводили количественное определение каждого образца скДНК с помощью набора Quant-iT High Sensitivity dsDNA Assay Kit (Invitrogen). У 49 пациентов скДНК была выделена из 215 серийных образцов плазмы.
[891] Приготовление библиотеки скДНК. В качестве исходных данных для подготовки пользовательской библиотеки использовалось до 66 нг (20000 геномных эквивалентов) скДНК из каждого образца плазмы. Бесклеточная ДНК была подвергнута репарации на концах, наращиванию A-хвостов и лигированию с помощью специальных адапторов. Очищенный продукт лигирования амплифицировали в течение 20 циклов, очищали с использованием микрогранул Ampure XP beads (Agencourt/Beckman Coulter).
[892] Рабочий процесс ССП в мультиплексной ПЦР. Аликвоту каждой библиотеки использовали в качестве ввода для специфичной для пациента реакции 16-плексной ПЦР. Образцы были амплифицированы с использованием опухолеспецифического анализа Signatera и закодированы при помощи штрих-кода, а затем объединены. Секвенирование проводили на Illumina HiSeq 2500 Rapid Run с 50 циклами считывания спаренных концов с использованием набора Illumina Paired Ends v2 со средней глубиной считывания более 100000X на ампликон.
[893] Процесс обработки биоинформатики. Все считывания парных концов были объединены с использованием программного обеспечения Pear. Основания, которые не совпадали при прямом и обратном считывании или имели низкий показатель качества, были отфильтрованы с тем, чтобы минимизировать ошибки секвенирования. Объединенные считывания были сопоставлены с эталонным геномом hg19 с помощью Novoalign версия 2.3.4. Ампликоны с менее 5000 считываниями высокого качества считались не прошедшими контроль качества. Контроль качества выполнялся с помощью собственной программы, проверяющей широкий список статистических данных для каждой выборки, который включал общее количество считываний, картированных считываний, целевых считываний, количество неудачных мишеней и среднюю частоту ошибок (ФИГ.67A-D)
[894] Распознавание плазматических вариантов. Для построения модели фоновой ошибки для конкретного варианта был предварительно обработан большой набор образцов отрицательного контроля (~1000). Оценка достоверности была рассчитана для каждого целевого варианта с использованием мутантных и референтных аллелей на основе модели ошибок, документ полностью включен в настоящий документ посредством ссылки. Образец плазмы, содержащий по меньшей мере 2 варианта с показателем достоверности выше заранее определенного порога (0,97), называется цоДНК положительным.
[895] Аналитическая валидация. Аналитическая проверка проводилась с использованием титрования мононуклеосомной ДНК из трех линий раковых клеток и их соответствующих нормальных аналогов (ATCC). Были использованы две линии клеток рака молочной железы (HCC2218 и HCC1395), одна линия клеток рака легких (NCI-H1395) и соответствующие им подходящие линии нормальных клеток, происходящих из B-лимфобластов (HCC2218-BL, HCC1395-BL и NCI-BL1395). ДНК была секвенирована через экзом для каждой пары клеточных линий, были отобраны целевые варианты, и были сконструированы два пула праймеров для мультиплексной ПЦР с использованием стандартного процесса обработки Signatera. Титрование опухоли на нормальные мононуклеосомные ДНК проводилось при средних ЧВА (на основе ввода ДНК) 1.0; 0,5; 0,3; 0,1; 0,05; 0,03; 0,01; 0,005, 0% (числа реплик были взяты из от двух до девяти - увеличиваясь с коэффициентом разбавления). Из-за возможности гетерогенности и анеуплоидии в линиях опухолевых клеток ЧВА отдельных мишеней могут отличаться от средних вводимых ЧВА. Для точного расчета номинального ЧВА каждой мишени на каждом этапе титрования был проведен отдельный эксперимент со смесями 10% ЧВА. Наблюдаемые ЧВА из этого эксперимента затем использовались для расчета поправочных коэффициентов ввода (наблюдаемое ЧВА/10%). Поправочные коэффициенты применялись к соответствующим целевым показателям в серии разведений. Дополнительные отрицательные образцы были проанализированы с использованием скДНК, выделенной из 16 образцов плазмы индивидуума (примерно 8 мл каждая). Для серии титрования в качестве ввода для подготовки библиотеки Signatera использовали 66 нг скДНК (что соответствует 20000 эквивалентов гаплоидного генома); для образцов плазматической скДНК в качестве ввода использовалась вся выделенная ДНК (в диапазоне от 13 до 55 нг). Затем эти библиотеки были пропущены через рабочий процесс плазмы Signatera (два пула праймеров для каждого образца титрования и пять пулов праймеров для каждого образца скДНК), секвенированы и проанализированы с помощью процесса обработки анализа Signatera. ФИГ.68А демонстрирует нашу расчетную чувствительность для обнаружения мишеней в плазме при различных уровнях концентрации. Для отрицательных образцов была достигнута целевая специфичность больше 99,6%. Делая предположение о том, что пользовательская панель имеет от 10 до 16 клональных вариантов, на уровне образца может быть получена чувствительность, как указано на ФИГ.68B. Специфичность на уровне образца оценивается в более 99,8%.
[896] РЕЗУЛЬТАТЫ
[897] десь мы представляем анализ первых 50 пациентов, включенных в исследование EBLIS (ФИГ.60). Один образец опухоли не подходил для секвенирования экзома, поэтому мы продолжили исследование с 49 пациентами. На дату сбора сведений для отчета (30 июня 2018 г.) у 18 пациентов случился рецидив, и 31 пациент оставался без признаков заболевания. Все из 49 пациентов, кроме 7 человек получали адъювантную химиотерапию или НАТ по схеме антрациклин/таксан. (см. ФИГ.69 и Таблицу A). Сорок один пациент получал адъювантную эндокринную терапию на протяжении всего времени забора крови. (Таблица B1-B3). Хотя до включения в исследование повторное сканирование не требовалось, все, кроме 3 пациентов, прошли визуализационные исследования при постановке диагноза или во время включения в исследование, и все были в пределах нормы (Таблица B1-B3).
[898] Пациенты без рецидива были последовательными пациентами, набранными в течение того же периода времени по сравнению с теми, у кого возник рецидив, у них было достаточно опухолевой ДНК, выделенной из FFPE блока первичной опухоли, для профилирования экзома, и они наблюдались в течение по меньшей мере 2 лет при серийном заборе крови. Мы проанализировали серийные образцы плазмы слепым способом с использованием оптимизированного рабочего процесса Signatera.
[899] Из 18 пациентов, у которых случился рецидив, 10 случаев рецидива были обнаружены с помощью компьютерной томографии, 3 - с помощью сканирования костей и по одному - с помощью маммографии, МРТ, повышения уровня ферментов печени и ультразвука. Один пациент умер по неизвестной причине.
[900] Выявление циркулирующей опухолевой ДНК и упреждающий интервал
[901] Мы собрали FFPE образцы опухоли у всех пациентов: 39 не получали системную терапию до биопсии; 10 человек получали неоадъювантную химиотерапию (НАХТ) перед резекцией рака молочной железы (подробная информация о всей системной терапии, включая время взятия образцов крови, содержится на ФИГ.60 и в Таблицах B1-B3).
[902] Для оценки наличия циркулирующей опухолевой ДНК для каждого пациента мы разработали индивидуальные тесты, нацеленные на 16 соматических ОНВ и вариантов ВСТАВКА/ДЕЛЕЦИЯ из профилей соматических мутаций опухоли каждого пациента (ФИГ.64A-C). Затем мы применили 49 соответствующих персонализированных анализов к каждому из 208 образцов плазмы (диапазон: 1-8 временных точек) от 49 пациентов.
[903] Циркулирующая ДНК опухоли была обнаружена у 89% (16 из 18) пациентов, у которых возник рецидив; обнаружение составило 82%, 100% и 100% при, соответственно, HR+/HER2-, HER2+ и трижды негативном раке молочной железы (triple negative breast cancer - TNBC) (ФИГ.61A и B). Из двух пациентов с рецидивом, которые не были обнаружены цоДНК, у одного (1018) было три первичных рака, а у другого (1019) был небольшой местный рецидив в грудине (впоследствии удаленный) (ФИГ.61A, Таблица A). Примечательно, что у одного пациента (1072) изначально был нормальный профиль крови, но при последнем посещении он был положительным на цоДНК; у пациента не было признаков заболевания на момент анализа крови, но впоследствии у пациента появились отдаленные метастазы незадолго до даты сбора сведений (ФИГ.61A и ФИГ.65A). Мы выявляли рецидив заболевания за 2 года до клинического рецидива с медианным значением 266 дней (8,9 месяцев; ФИГ.61B). При разделении по подтипам медианное время упреждения составляло, соответственно, 301, 164 и 258 дней для HR+/HER2-, HER2+ и трижды негативного рака молочной железы (TNBC) (ФИГ.61B и C). Поразительно, что у двух пациентов ER+ PR+ HER2- (1031 и 1051, ФИГ.61A) было до четырех временных точек, которые были положительными на цоДНК до клинического рецидива, что означает наличие упреждающего интервала почти в 2 года.
[904] Мы не обнаружили цоДНК ни в одном из 156 образцов плазмы 31 пациента, у которых не было рецидива заболевания (ФИГ.61A). Присутствие цоДНК было связано со значительно худшим прогнозом как при обнаружении цоДНК в первом послеоперационном образце плазмы (ОР = 11,8 (95%, ДИ 4,3-32,5)), так и в последующих образцах плазмы после операции (ОР = 35,8 (95% ДИ 8,0-161,3)) (ФИГ.62A-B). У всех пациентов с положительным результатом на цоДНК в течение 50 месяцев после операции возник рецидив.
[905] Для всех пациентов результаты рентгенологического и сканирующего обследования были отрицательными на предмет отдаленных метастазов до даты выраженного рецидива, которому обычно предшествовали симптомы пациента. Многие пациенты прошли последующее сканирование в дополнение к сканированию, проведенному при обращении, и оно также было отрицательным (Таблица B1-B3). У семи пациентов (1004, 1055, 1072, 1091, 3018, 3019, 3048) сканирование было выполнено в течение 4 месяцев после того, как тест на цоДНК впервые стал положительным, и все результаты были отрицательными.
[906] Мы также проводили мониторинг CA15-3 у 43 из 49 пациентов на протяжении всего исследования. Тридцать девять из этих пациентов показали нормальные результаты в течение периода наблюдения. Двенадцать из 18 пациентов, у которых случился рецидив, имели нормальные уровни CA15-3 в течение периода наблюдения. У двух пациентов (1051 и 1088) наблюдалось прогрессирующее повышение уровня CA15-3, но цоДНК был более чувствительным, чем CA15-3, с цоДНК, обнаруженной до повышения уровня CA15-3 раньше на, соответственно, 224 и 212 дней (ФИГ.63A and ФИГ.65B). У пациентов 1111 и 1018 была взята одна проба крови до клинического рецидива, и у них были повышенные показатели CA15-3. У пациента 1111 был положительный тест на цоДНК, у пациента 1018 - отрицательный на цоДНК. Примечательно, что у шести других пациентов (3 с рецидивом и 3 без рецидива) периодически брались образцы крови со слегка повышенным CA15-3, но это значение колебалось и не отражало прогрессирование заболевания (Таблица B1-B3).
[907] Характеристика циркулирующей опухолевой ДНК
[908] Анализ Signatera предназначен для нацеливания на 16 специфичных для пациента соматических ОНВ и вариантов ВСТАВКА/ДЕЛЕЦИЯ, обеспечивающих наибольшую вероятность обнаружения. Все 16 больных с рецидивами, выявленных цоДНК, показаны на ФИГ.63 и ФИГ.65. В 10 образцах плазмы от восьми пациентов с рецидивом были выявлены частоты вариантных аллелей (ЧВА) в пределах 0,01-0,02%. Наименьшая частота вариантного аллеля 0,01% соответствует обнаружению одной мутантной молекулы в образце плазмы (ФИГ.66). Этот уровень чувствительности можно увидеть у четырех пациентов - 1004, 01055, 1072 и 1096 (ФИГ.63, ФИГ.65, Таблица C). Специфичность теста выше 99,5% достигается за счет требования, чтобы два или более вариантов измерялись выше выбранного доверительного порога алгоритма распознавания для того, чтобы иметь уверенность в том, что цоДНК присутствует в плазме. Специфичность подчеркивается тем фактом, что ни один из образцов плазмы пациентов без рецидива не был признан положительным.
[909] Что касается изменений профилей цоДНК с течением времени, то из 16 рецидивов, выявленных с помощью цоДНК, у семи пациентов был положительный тест на цоДНК во все проанализированные моменты времени, и они показали увеличение как количества обнаруженных вариантов, так и процента ЧВА с течением времени; шесть пациентов, которые изначально были цоДНК-отрицательными, позже стали положительными, а у трех пациентов с рецидивом для анализа была доступна только одна временная точка плазмы, все они были положительными на цоДНК (ФИГ.63 and ФИГ.65).
[910] Пять из этих пациентов выделены на ФИГ.63, где представлены по меньшей мере по одному из каждого подтипа - HR+/HER2- (1031 и 1051), HER2+ (1096) и TNBC (1055 и 1074). Пациенты 1031, 1051, 1055 изначально были цоДНК-отрицательными, но цоДНК стал обнаруживаться в более поздние временные точки. (ФИГ.63A-C). У двух из этих пациентов, оба HR+ (1031 и 1051), было наибольшее время упреждения между молекулярным рецидивом, обнаруженным по цоДНК, и клиническим рецидивом, соответственно, 721 и 611 днями (ФИГ.63A-B). У пациентов 1031, 1055, 1074 и 1096 частоты вариантов аллелей обнаруживались в диапазоне от 0,01 до 0,02%, и у них наблюдалось прогрессивное повышение ЧВА, коррелирующее с прогрессированием заболевания (ФИГ.63B-E). После выявления цоДНК все пациенты оставались положительными в течение периода наблюдения (ФИГ.63 и ФИГ.65).
[911] В целом, за прогрессированием заболевания можно следить как по частоте вариантного аллеля, так и по количеству обнаруженных вариантов, как показано на ФИГ.63F. Поскольку количество временных точек у разных пациентов варьировалось, выделяются различия между первой и последней временными точками в серии образцов плазмы от одного и того же пациента. Медианная частота вариантного аллеля увеличилась с 0,092% в первой временной точке (диапазон: от 0,01 до 9,2%) до 3,9% (диапазон: от 0,05 до 64,4%), тогда как медианное количество вариантов, обнаруженных в первой временной точке, составило 5 (диапазон: 2-12) по сравнению с 12 вариантами (диапазон: 5-15) в последней временной точке. Малое количество вариантов, обнаруживаемых в ранних временных точках, и тот факт, что они присутствуют в очень малом количестве копий, указывают на важность тестирования множественных мутаций, присутствующих в опухоли пациента, для проведения высокочувствительного теста на присутствие цоДНК в плазма пациента.
[912] Обсуждение
[913] В этом отчете описан надежный и воспроизводимый способ мониторинга минимальной остаточной болезни у пациентов с раком молочной железы по основным подтипам. Подход использует геномные данные опухоли для разработки анализов для конкретных пациентов. Затем выполняется секвенирование плазматической скДНК с очень большой глубиной, в среднем до более 100000 считываний на мишень для того, чтобы достичь чувствительности вплоть до одной мутантной молекулы. Эта новая преобразующая технология надежна и масштабируема для внедрения в современное здравоохранение, и она уже разработана для использования в исследованиях. Это особенно своевременно, учитывая, например, недавнее объявление о том, что все виды рака в Великобритании будут получать геномное профилирование с осени 2018 года. Платформа Signatera способна предоставить индивидуализированный способ обнаружения микрометастазов, что четко подтверждается результатами исследования. В этом исследовании все, кроме одной, пациентки с раком молочной железы, у которых случился рецидив с отдаленными метастазами, имели положительный анализ крови до выраженного рецидива, а в некоторых случаях демонстрировали почти 2-летний упреждающий интервал.
[914] Предыдущее исследование с прототипом этой технологии показало многообещающие результаты у пациентов с немелкоклеточным раком легкого (Abbosh et al., 2017, полностью включено в настоящий документ посредством ссылки), и с тех пор рабочий процесс был усовершенствован для достижения более высоких показателей чувствительности обнаружения цоДНК и для того, чтобы быть более экономичным. В этом случае мы демонстрируем превосходную воспроизводимость и точность этой системы. Сосредоточение внимания на ОНВ, уникальных для пациента, а не на известных генах-драйверах, представляет собой наиболее точный и чувствительный на сегодняшний день способ обнаружения МОБ у пациентов с раком молочной железы.
[915] Клиническое применение измерений цоДНК в лечении рака на ранних стадиях остается очень спорным вопросом, и недавний совместный обзор ASCO и ACP пришел к выводу, что нет доказательств его клинической применимости, и существует мало доказательств его клинической валидности для мониторинга лечения или раннего обнаружения остаточной болезни на ранних стадиях рака. Этот вывод отчасти может быть связан с тем фактом, что все предыдущие исследования проводились без сравнения с обычными маркерами, как это было сделано в данном документе.
[916] Из этого исследования следует несколько важных моментов. Во-первых, теперь можно с высокой степенью точности предсказать рецидив у пациентов без признаков заболевания при визуализации. Во-вторых, большинство пациентов в настоящее время наблюдаются в центрах США и Великобритании с помощью комбинации ежегодной маммографии и, в некоторых случаях, CA15-3 и функциональных печеночных тестов. Все они, за исключением двух случаев прогрессивно повышенного CA15-3 при отсутствии обнаруживаемых метастазов, в нашей когорте были нормальными до выраженного метастатического рецидива, демонстрируя ограничения текущих подходов, используемых клиницистами. Семь из пациентов, у которых случился рецидив, также прошли сканирование приблизительно во время первого обнаружения цоДНК, и все результаты были отрицательными. Следует отметить наблюдение, что у некоторых пациентов временно повышен уровень CA15-3, и они остаются здоровыми, в то время как тест Signatera всегда был положительным после обнаружения, и ложноположительные результаты отсутствовали. В-третьих, несмотря на то, что НАХТ уменьшила первичный рак (на котором было проведено секвенирование экзома), сигнатура мутации остаточного рака отражает остаточное метастатическое заболевание у этих пациентов, что предполагает, что персонализированный тест, разработанный на основе профиля мутации первичной опухоли не только возможен, но и эффективен.
[917] Однако существует требование, чтобы цоДНК попадал в плазму, и, таким образом, тест может быть ограничен теми, у кого вначале имеется достаточно агрессивное заболевание, и, следовательно, может быть неприменим к пациентам с меньшим и менее агрессивным раком молочной железы, у которых часто имеется хороший прогноз. Поскольку предел обнаружения в нашем анализе ограничен одной молекулой, отсутствие обнаружения, вероятно, связано с биологией опухоли, при которой менее агрессивные опухоли могут выделять меньше молекул цоДНК. Примером этого является один пациент (1018), у которого возник рецидив местного резектабельного заболевания при отрицательном результате на цоДНК. Кроме того, у пациентов с множественными первичными опухолями все опухоли должны быть профилированы для наблюдения за прогрессированием заболевания. Это наблюдается у пациента 1019, у которого было три первичные опухоли; к сожалению, только одна из них была подвергнута секвенированию экзома из-за ограниченного наличия доступных тканей. В этом случае рецидив заболевания не был обнаружен по цоДНК, и наша гипотеза состоит в том, что метастазы произошли не от той опухоли, которая подверглась секвенированию. Наконец, тест не подходит для обнаружения второго первичного рака молочной железы, если только это не рецидив исходной опухоли; примером этого является пациент 1044, у которого при рутинной маммографии был обнаружен второй первичный рак противоположной стороны, но плазма оставалась отрицательной по цоДНК на протяжении всего периода (Таблица A).
[918] Описываемая в данном документе аналитическая платформа не предназначена для идентификации определяемых мишеней из плазмы. Большинство ОНВ, выбранных для использования для обнаружения опухолевой ДНК, были уникальными для каждого пациента, и они были выбраны как отражение опухолевой нагрузки, а не как репрезентативные мутации-драйверы, которые часто способствуют прогрессированию рака. Однако это также является преимуществом анализа Signatera - выбор мутаций-пассажиров и клональных мутаций является обязательным для мониторинга нагрузки заболевания, поскольку мутации-драйверы часто дают селективное преимущество, ведущее к изменению гетерогенности опухоли. Хотя 16-плексные анализы не обеспечивают значимых мишеней, ПЭС опухоли может обеспечивать такие мишени, и библиотеки плазмы также могут быть протестированы с другими анализами, которые идентифицируют определяемые мутации.
[919] Наши результаты дополняют другие результаты, в которых значимые мутации, например, в PIK3CA, прослеживаются в период неоадъювантной и адъювантной терапии. В то время, как при выборе мутации-драйвера можно отслеживать прогрессирование некоторых опухолей (ссылки), исследования показали, что они не приносят пользу при выявлении раннего метастатического рецидива у всех пациентов, поскольку не все пациенты имеют одни и те же целевые мутации-драйверы в опухоли (ссылки). В одном из предыдущих исследований только 78% (43 из 55) случаев имели одну или более соматических мутаций, которые идентифицировались и впоследствии отслеживались с помощью цифровой капельной ПЦР. Мы также проанализировали готовую панель рака молочной железы (Oncomine™ Breast cfDNA Assay), нацеленную на более 150 горячих точек в 10 генах рака молочной железы, и эта панель выявила цоДНК только у 73% пациентов с раком молочной железы. Поскольку панели генов не могут отражать неоднородность всех случаев рака молочной железы, они не включают всех пациентов и не применимы ко всем пациентам с раком молочной железы, как показано в двух вышеупомянутых примерах. Следовательно, для выявления минимальной остаточной болезни у всех пациентов с метастатическим раком молочной железы необходимо использовать профилирование экзома опухоли и индивидуальный подход Signatera; в случае положительного результата необходимо провести вторичный анализ на наличие значимых мутаций.
[920] Имеется несколько важных следствий нашего исследования. До сих пор было показано, что системное лечение с помощью таргетной или цитотоксической терапии является излечивающим только при введении в адъювантном режиме; лечение выраженного метастатического заболевания редко, если вообще когда-либо, приводит к излечению (ссылка). Представленный в данном документе подход предлагает альтернативу: попытку спасти пациентов с цоДНК с помощью терапии второй линии. Другое применение может заключаться в помощи в оценке новых лекарственных препаратов, особенно тех, механизм которых заключается в усилении иммунного ответа. До сих пор использовался косвенный показатель успеха - время до прогрессирования опухоли; способ Signatera обнаружения цоДНК теперь позволит использовать в качестве мерила еще один критерий успеха - уменьшение или удаление цоДНК.
[921] В заключение, платформа Signatera способна обнаруживать МОБ у пациентов с раком молочной железы с высокой степенью чувствительности. Он превосходит традиционные способы наблюдения и демонстрирует многообещающие возможности для наблюдения за пациентами с точки зрения точной медицины. Впервые предлагается анализ крови, который убеждает пациентов в том, что их болезнь находится под контролем.
[922] Резюме
[923] У многих пациенты с РМЖ после первичного лечения развивается рецидив, но отсутствуют надежные тесты для выявления отдаленных метастазов до того, как они станут выраженными. В этом случае мы демонстрируем более раннюю идентификацию рецидива рака молочной железы с помощью масштабируемого персонализированного анализа циркулирующей опухолевой ДНК (цоДНК). Способ применим ко всем пациентам и не ограничивается мутациями горячих точек, которые обычно обнаруживают с помощью генных панелей.
[924] Было набрано 49 пациентов с неметастатическим РМЖ после хирургического вмешательства и адъювантной терапии. Образцы плазмы (n = 208) собирали серийно раз в полгода. Используя аналитически проверенный рабочий процесс Signatera™, мы определили мутационные сигнатуры на основе данных всего экзома первичной опухоли и разработали персонализированные тесты с высокой чувствительностью, с помощью сверхглубокого секвенирования (в среднем более 100000X), нацеленные на 16 вариантов. Для определения присутствия цоДНК в плазме использовался специфический для пациента анализ.
[925] У 16 из 18 (89%) пациентов с клиническим рецидивом цоДНК была обнаружена перед метастатическим рецидивом, диагностированным клиническим обследованием, рентгенологическим исследованием и измерением CA15-3, и пациенты оставались цоДНК-положительными при последующем наблюдении. Из 2 пациентов, у которых цоДНК обнаружена не была, у одного был только небольшой местный рецидив (в настоящее время удален), а у другого три первичные опухоли. Ни один из 31 безрецидивного пациента не был цоДНК-положительным в любой момент времени (n = 156). Метастатический рецидив был предсказан Signatera с периодом упреждения до 2 лет (медиана = 8,9 месяцев, ОР: 35,84 (95% ДИ 7,9626 - 161,32)).
[926] Использование масштабируемого валидированного рабочего процесса, ориентированного на конкретного пациента, на основе цоДНК выявляет минимальную остаточную болезнь до метастатического рецидива рака молочной железы, опережая клиническое выявление основных подтипов рака молочной железы. Точный и более ранний прогноз с помощью анализа цоДНК может обеспечить средство наблюдения за пациентами с раком молочной железы, нуждающимися во вспомогательной адъювантной терапии второго ряда в попытке предотвратить выраженный опасный для жизни метастатический рецидив.
[927] Таблица A1. Клинические характеристики всех 49 пациентов. Пациенты, отмеченные звездочкой*, скончались.
TNM
[928] Таблица B1. Временные точки забора плазмы у пациентов.
[929] Таблица B2. Уровни CA15-3 пациентов.
[930] Таблица B3. Эндокринная терапия пациентов.
[931] Таблица C. Резюме уровня образцов и ЧВА.
обнаружен-ных
мишеней
[932] Пример 9. Раннее обнаружение метастатического рецидива и мониторинг терапевтической эффективности с помощью сверхглубокого секвенирования серийной плазматической свободно-клеточной ДНК у пациентов с уротелиальной карциномой мочевого пузыря.
[933] ВВЕДЕНИЕ
[934] Рак мочевого пузыря является наиболее распространенным злокачественным новообразованием мочевыводящих путей, и приблизительно у 20-25% пациентов с недавно диагностированной уротелиальной карциномой развивается мышечно-инвазивный рак мочевого пузыря (МИРМП), и 10-30% пациентов с диагнозом «не-МИРМП» (НМИРМП) будут прогрессировать до МИРМП. В настоящее время стандартным способом лечения МИРМП является радикальная цистэктомия. К сожалению, у 20% пациентов с отрцательным поражением лимфоузлов и у 80% пациентов с положительным поражением лимфоузлов на момент операции наблюдается метастатический рецидив, а общая выживаемость (ОВ) в среднем составляет 50% в течение 5 лет.
[935] Неоадъювантная химиотерапия (НАХТ) улучшает выживаемость пациентов с МИРМП, а лечение гемцитабином и цисплатином (ГК) является наиболее часто применяемой неоадъювантной химиотерапией (НАХТ) МИРМП. В настоящее время лечение гемцитабином и цисплатином приводит к значительному снижению стадии (pT меньше 2 N0 при цистэктомии) приблизительно у 40-50% пациентов.
[936] Раннее обнаружение метастатического рецидива у пациентов с раком мочевого пузыря может предложить новые терапевтические подходы для увеличения выживаемости. Выявление метастатического рецидива после цистэктомии на ранней стадии, когда рецидив не обнаруживается с помощью рентгенографии, может значительно улучшить идентификацию пациентов, которые может получить пользу от раннего/адъювантного лечения и улучшить исход выживаемости для этой группы пациентов. Кроме того, раннее определение рецидива и метастазирования может помочь предотвратить ненужное и потенциально вредное продолжительное лечение пациентов, которые не отвечают на лечение.
[937] В настоящее время для обнаружения рецидива, метастазов и отслеживания реакции на лечение используется стандартная компьютерная томография (КТ) с заданными интервалами. В то время как способы визуализации предлагают оценку опухолевой нагрузки, возможности мониторинга ограничены неоптимальным пределом обнаружения и присущей вариабельностью измерений, поэтому раннее обнаружение метастатического рецидива и/или прогрессирования и оценка эффективности лечения остаются серьезной клинической проблемой.
[938] Полный потенциал использования циркулирующей опухолевой ДНК (цоДНК) в качестве биомаркера для определения стадии заболевания при диагностике, определении опухолевой нагрузки, раннего обнаружения метастатического рецидива и терапевтического ответа на лечение остается нереализованным. Недавние многообещающие исследования показали, что свободно-клеточная ДНК (скДНК) может использоваться для мониторинга эволюции рака легких на ранней стадии и субклонального развития при метастатическом заболевании (Abbosh, et al., Nature 545, 446-451 (2017) (“Abbosh et al. 2017”), полностью включено в настоящий документ). При раке мочевого пузыря было показано, что цоДНК обнаруживается в плазме и моче, и что высокие уровни цоДНК связаны с более поздним клиническим прогрессированием заболевания и метастазированием (Birkenkamp-Demtröderet al., Eur. Urol. 70, 75-82 (2016); Christensenet al., Eur. Urol. 71, 961-969 (2017); Birkenkamp-Demtröder, K. et al. Eur. Urol. 73, 535-540 (2018); Patel, et al., Sci. Rep. 7, 5554 (2017)). Однако эти предыдущие исследования рака мочевого пузыря были основаны на небольших отобранных когортах и использовали анализы цифровой капельной ПЦР, которые имеют относительно ограниченную чувствительность по сравнению со способом на основе секвенирования следующего поколения (ССП), представленным в данном документе.
[939] десь мы сообщаем о результатах проспективного исследования, включающего полноэкзомное секвенирование (ПЭС) первичных опухолей и соответствующих ДНК зародышевой линии у 68 пациентов, получавших неоадъювантную химиотерапию (n = 56) или химиотерапию первой линии (n=12) перед цистэктомией. Чувствительные, персонализированные анализы на основе ССП в мультиплексной ПЦР, специфичные для опухолевой мутационной сигнатуры каждого индивидуального пациента, были разработаны и использованы для мониторинга соматических мутаций в образцах плазмы, которые были получены в динамике, до, во время и после химиотерапии. Основная цель этого исследования заключалась в разработке способа обнаружения цоДНК, позволяющего использовать цоДНК в качестве мощного биомаркера для прогноза, раннего выявления метастатического заболевания и в качестве предиктора ответа на химиотерапию.
[940] СПОСОБЫ
[941] Пациенты и клинические образцы
[942] Пациенты с диагнозом МИРМП, получавшие неоадъювантную химиотерапию перед цистэктомией, а также пациенты, получавшие химиотерапию из-за метастатического заболевания с предшествующей цистэктомией или без нее, были зарегистрированы в период с 2013 по 2017 год в единой специализированной университетской больнице (Университетская больница Орхуса, Дания). Радикальную цистэктомию проводили как открытую цистэктомию или с роботизированной помощью в зависимости от критериев пациента и доступности робота. У всех пациентов была выполнена расширенная лимфодиссекция до уровня бифуркации аорты.
[943] Пациенты лечились в соответствии с национальными рекомендациями Дании. Неоадъювантная химиотерапия проводилась в виде 4 серий гемцитабина и цисплатина (ГК) с трехнедельными интервалами. Пациенты с метастазами или опухолями cT4b на момент постановки диагноза получали до 6 серий ГК. Снижение патологической стадии после химиотерапии, проведенной до ЦЭ, определялось как менее T1N0 после лечения. Пациенты с цистэктомией наблюдались с помощью рентгенографических изображений с помощью дотерапевтической ПЭТ/КТ и КТ грудной клетки и брюшной полости в запланированном контроле через 4, 12 и 24 месяца после цистэктомии для пациентов с диагнозом pT2N0 и дополнительных контролей через 8 и 18 месяцев для пациентов с диагнозом более pT2 и/или N+. Пациенты, получавшие лечение по поводу распространенного заболевания, наблюдались с интервалом в 3-4 месяца с помощью КТ. Подробные данные последующего наблюдения были доступны для всех пациентов, а клиническими конечными точками были последнее зарегистрированное посещение или время смерти, полученные из национального персонального реестра. Пациенты были отобраны для полноэкзомного секвенирования на основании следующих критериев: 1) неоадъювантная химиотерапия/химиотерапия первой линии для локализованных МИРМП 2) количество посещений с образцами плазмы, взятыми до и во время химиотерапии, до и после ЦЭ 3) наличие биопсии опухоли. Все пациенты предоставили письменное информированное согласие, и исследование было одобрено Национальным комитетом по этике медицинских исследований (№1302183).
[944] Сбор образцов и экстракция ДНК
[945] Мы проанализировали материал из крови, биопсии опухоли и в динамике собранных образцов плазмы. Биопсии ткани были взяты из TUR-B во время постановки диагноза. ДНК экстрагировали, как описано ранее, либо из срезов TISSUE-TEK® O.C.T. Ткань, залитая смесью (Sakura) или залитая парафином, фиксированная формалином (FFPE) из биоптата, взятого в наиболее репрезентативной локализации с высоким процентом клеток карциномы. 40 мл крови с ЭДТА собирали при каждом посещении или перед каждой серией химиотерапии и немедленно обрабатывали. Образцы центрифугировали при 3000 g в течение 10 минут при комнатной температуре, а плазму и лейкоцитарную пленку хранили отдельно при минус 80 °C. ДНК зародышевой линии экстрагировали из лейкоцитов лейкоцитарной пленки, и концентрацию измеряли флуорометрическим количественным анализом QUBIT®. Плазму хранили при минус 80 °C. В этом исследовании использовалось до 9 мл плазмы на случай (диапазон 4-9 мл; в среднем X мл). Весь объем плазмы использовали для экстракции скДНК с использованием набора QIAAMP® Circulating Nucleic Acid kit (Qiagen) и элюировали в 50 мкл буфера для суспензии ДНК (Sigma). Каждый образец скДНК был количественно определен с помощью набора QUANT-IT® High Sensitivity dsDNA Assay Kit (Invitrogen).
[946] Секвенирование экзома и анализ в области биоинформатики
[947] Библиотеки опухолевой ДНК и подходящей ДНК зародышевой линии получали с использованием 100-500 нг ДНК и захватывали с помощью панели SEQCAPEZ® MedExomeV1_hg19 или MedExomePlusV1_hg19 (Roche). Показаны метрики секвенирования экзома, процент клеток карциномы и тип ткани.
[948] Все варианты, прошедшие примененные фильтры, были подвергнуты анализу на активность мутационных сигнатур. Варианты изначально были загружены в объект VRanges, а затем контекст последовательности был извлечен с помощью пакета SomaticSignatures R (Obenchainet al., Bioinformatics 30, 2076-2078 (2014); Gehring et al., Bioinformatics 31, 3673-3675 (2015)). Экстракция сигнатур мутаций de novo не применялaсь из-за размера когорты. Вместо этого мутационные профили, идентифицированные в наших образцах, проецировались на известные сигнатуры COSMIC с помощью пакета MutationalPatterns R (см. cancer.sanger.ac.uk/cosmic/signatures и Blokzijl et al., Genome Med. 10, 33 (2018)). Для анализов были приоритезированы мутационные сигнатуры 1, 2, 5 и 13, идентифицированные в Robertson et al., Cell 171, 540-556.e25 (2017) для рака мочевого пузыря.
[949] Мутации, связанные с ответом на повреждение ДНК
[950] Избранные гены ответа на повреждение ДНК были описаны в Teo et al., Clin. Cancer Res. 3610-3618 (2017). Мутации, идентифицированные в этих генах, были проанализированы на предмет повреждающего действия или доброкачественности. Все мутации с потерей функции считались повреждающими. Миссенс-мутации были подвергнуты дальнейшему анализу с использованием PolyPhen2 и MutationAssessor, как описано в Reva et al., Nucleic Acids Res. 39, e118 (2011) и Adzhubei et al., Nature Methods 7, 248-249 (2010). Варианты, идентифицированные как вероятно повреждающие/возможно повреждающие или средние/высокие, соответственно, в PolyPhen2 и MutationAssessor, считались повреждающими.
[951] Подготовка бибилиотеки свободно-клеточной ДНК
[952] Получение свободно-клеточной ДНК (скДНК) было ранее описано в качестве исходных данных для подготовки библиотеки использовали до 66 нг (20000 геномных эквивалентов) внеклеточной ДНК (скДНК) из каждого образца плазмы. скДНК была подвергнута репарации на концах, наращиванию A-хвостов и лигированию с помощью специальных адапторов. Очищенный продукт лигирования амплифицировали в течение 20 циклов и очищали с использованием микрогранул AMPURE® XP (Agencourt/Beckman Coulter).
[953] Рабочий процесс секвенирования следующего поколения (ССП) плазмы в мультиплексной ПЦР
[954] Аликвоту каждой библиотеки использовали в качестве ввода для связанной с пациентом реакции 16-плексной ПЦР. Образцы были амплифицированы с использованием опухолеспецифического анализа SIGНАТERA® и закодированы штрих-кодом с последующим объединением. Секвенирование выполнялось на Illumina HISEQ® 2500 Rapid Run с 50 циклами считывания парных концов с использованием набора Illumina PAIRED END® v2 со средней глубиной считывания более 100000X на ампликон, как описано в Abbosh et al., Phylogenetic ctDNA analysis depicts early-stage lung cancer evolution, Nature 545, 446-451 (2017).
[955] Распознавание плазматических вариантов
[956] Для построения модели фоновой ошибки был предварительно обработан большой набор отрицательных контрольных образцов (~1000). Для каждого целевого варианта с использованием глубины чтения мутантных и референтных аллелей показатель достоверности был рассчитан на основе модели ошибок, как описано в Abbosh et al. 2017. Образец положительной плазмы цоДНК был определен как имеющий по меньшей мере 2 варианта с показателем достоверности выше предопределенного порога алгоритма (0,97), как описано Abbosh et al. 2017.
[957] Полноэкзомное секвенирование плазмы
[958] Аликвоту каждой библиотеки плазмы кодировали штрих-кодом и захватывали с помощью набора для обогащения мишени SEQCAP® EZ MedExome Target Enrichment Kit. Секвенирование проводили на Illumina HISEQ® 2500 с 200 циклами считываний одиночных концов с применением набора Illumina TRUESEQ®v1 kit. Данные были демультиплексированы, адаптор обрезан, и картирование было выполнено с помощью инструмента выравнивания Burrows-Wheeler Alignment (BWA-mem) и использования hg19 в качестве эталонной последовательности. Для манипулирования с данными секвенирования дубликаты были маркированы с помощью инструмента Picard. Файлы Bam, созданные из этого картирования, были обработаны в соответствии с передовой практикой GATK (ссылка). Варианты распознавались с помощью MuTect2, а для определения геномных позиций использовались варианты, прошедшие встроенные фильтры, с изменениями для каждого пациента. Распознанные варианты в обоих экзомах для каждого пациента впоследствии были использованы для анализа всех включенных положений вручную с использованием BAM-readcount (ссылка). Были включены только основания и считывания с качеством выше 20, а позиции с менее 10 считываниями в обоих экзомах не были включены в сравнение.
[959] Секвенирование РНК, обработка данных и анализ
[960] Секвенирование РНК проводили при помощи QUANTSEQ® 3' mRNA-Seq Library Prep (Lexogen) с вводом РНК в пределах 50-250 нг. Библиотеки готовили согласно рекомендациям производителя. Секвенирование выполняли однократным считыванием 70 п.н. на платформе Illumina NEXTSEQ® 500. Считанные последовательности выравнивали с транскриптомом GRCh38 (кДНК + нкРНК) с использованием Salmon (Patro et al., Nature Methods, 14, 417-419 ( 2017)) без коррекции длины гена, и данные экспрессии гена TPM были нормализованы с использованием edgeR (Robinson and Oshlack, Genome Biology, 11,R25 (2010)). Образцы были классифицированы согласно консенсусным подтипам МИРМП (рукопись на стадии подготовки).
[961] Статистические анализы
[962] Анализ выживаемости проводился в статистике R с использованием пакетов Survminer и Survival. Оценка статистической значимости проводилась с использованием критерия суммы рангов Вилкоксона для непрерывных переменных и точного критерия Фишера для категориальных переменных.
[963] РЕЗУЛЬТАТЫ
[964] Характеристики пациентов и анализ первичной опухоли
[965] Мы включили пациентов с локализованными МИРМП, получавших химиотерапию перед цистэктомией в период с 2014 по 2017 год в больнице Орхусского университета, Дания (ФИГ. 70). Всего 68 пациентов соответствовали всем критериям включения (см. ФИГ. 70, ФИГ. 71A-G и Таблицу IA ниже).
Таблица IA: Характеристики и демографические данные пациентов.
T4a/b
10 (14,7)
[966] Полноэкзомное секвенирование (ПЭС) опухоли и ДНК соответствующей зародышевой линии было выполнено при среднем целевом охвате 104X (31X-251X) для образцов опухоли и 66X (35X-120X) для образцов зародышевой линии, определяя в среднем 488 (11- 3536) мутаций на пациента. Кроме того, было выполнено РНК-секвенирование 46 опухолей для определения подтипов рака мочевого пузыря, иммунных сигнатур и клеточного состава. Резюме молекулярных характеристик и клинических данных для всех пациентов приведено на ФИГ. 71A-G. Схема клинического протокола и график отбора проб для этого исследования показаны на ФИГ. 72.
[967] Мониторинг цоДНК при помощи секвенирования следующего поколения (ССП) основанного на сверхглубокой мультиплексной ПЦР.
[968] Для обнаружения цоДНК использовали индивидуальный подход ССП мультиплексной ПЦР. Соматические ОНВ и короткие ВСТАВКИ/ДЕЛЕЦИИ были расставлены по приоритету на основании данных полноэкзомного секвенирования (ПЭС) на основе наблюдаемой частоты вариантного аллеля (ЧВА) в контексте ткани и последовательности. Были разработаны и синтезированы уникальные специфические для пациента анализы для шестнадцати высокорейтинговых соматических мутаций, как указано на ФИГ. 73. ССП в мультиплексной ПЦР проводили на скДНК плазмы. Образец считался цоДНК положительным только в том случае, если было обнаружено по меньшей мере два целевых варианта на основе ранее разработанного алгоритма распознавания, представленного в Abbosh et.al 2017. Аналитическая чувствительность на уровне образца (когда обнаруживают 2 или более вариантов из 16) определялась как более 95% при частотах вариантных аллелей 0,01%.
[969] Используя этот подход, статус цоДНК был проанализирован в 618 образцах плазмы 68 пациентов, включенных в исследование (ФИГ. 70). Контроль качества осуществлялся на протяжении всего рабочего процесса. Образцы и ампликоны, не прошедшие контроль качества, были исключены из дальнейшего анализа. Для каждого пациента набор из 45 ОНП был генотипирован при полноэкзомном секвенировании (ПЭС) и при секвенировании плазмы для обеспечения соответствия образцов. Медианное покрытие мишени составляло 120000X.
[970] Обнаружение цоДНК для прогноза и выявления рецидива
[971] На протяжении всего течения заболевания наличие или отсутствие цоДНК сильно коррелировало с исходом заболевания (ФИГ. 74, ФИГ. 75A-C). Значительный интерес представлял статус цоДНК в следующих трех временных точках. Первым интересующим моментом времени является статус цоДНК до введения НАХТ, и было обнаружено, что эта временная точка в высокой степени прогнозирует исход. При раке мочевого пузыря первым вмешательством является ТУРОМП (трансуретральная резекция опухоли мочевого пузыря), и поэтому было обнаружено, что эта первая временная точка служит приблизительным показателем для измерения минимальной остаточной болезни. Поразительно, что 94% (34/36) пациентов с отрицательным результатом на цоДНК в этот первый момент времени не имели рецидив на протяжении всего исследования. Напротив, 44% (11/25) пациентов, которые были цоДНК-положительными в этот момент до НАХТ, имели рецидив после цистэктомии. Таким образом, обнаружение цоДНК в этот ранний момент времени является очень сильным прогностическим фактором для долгосрочного клинического исхода после НАХТ и цистэктомии (ЦЭ).
[972] Вторая временная точка была после НАХТ и до цистэктомии, статус цоДНК в этот временной момент также был прогностическим для исхода пациента. Среди цоДНК-отрицательных пациентов было только 7% (4/55; 4 были положительными после цистэктомии (ЦЭ) и имели рецидив) пациентов с рецидивом по сравнению с 70% (7/10) положительных по цоДНК пациентов, у которых был рецидив. Статус цоДНК до цистэктомии (ЦЭ) был связан с патологией при ЦЭ, потому что у 100% цоДНК-положительных пациентов в этот момент времени была остаточная опухоль T2+ и/или метастазы в лимфатические узлы, идентифицированные при цистэктомии (ФИГ. 75B).
[973] Третья временная точка была после цистэктомии. Стратификация пациентов по статусу цоДНК после ЦЭ показала значительно худший результат для цоДНК положительных пациентов (ФИГ. 75C). Большинство, 96% пациентов с отрицательным результатом на цоДНК (50/52) не имели рецидив, однако у 2/52 пациентов возник рецидив через более, чем 1,5 года после ЦЭ (анализ на цоДНК ближе к рецидиву не проводился). Напротив, 92% (12/13) пациентов с положительной реакцией на цоДНК имели рецидив. Примечательно, что один пациент умер до клинической оценки (ФИГ. 75D). Было обнаружено, что статус цоДНК после ЦЭ является высокопрогностическим фактором рецидива заболевания и более сильным прогностическим фактором, чем любой другой прогностический фактор, такой как стадия N перед цистэктомией и ответ на химиотерапию (ФИГ. 75E).
[974] Серийные измерения цоДНК для наблюдения за заболеванием
[975] Здесь раскрывается, что серийное измерение цоДНК может использоваться как для мониторинга терапевтического ответа, так и для обнаружения рецидива. В нашем исследовании чтобы оценить ценность цоДНК в условиях наблюдения плазма была собрана после цистэктомии, в серийные временные точки, когда пациенты были без признаков заболевания. При включении анализа серийных измерений цоДНК во время течения заболевания мы наблюдали чувствительность 92% при 100% специфичности (ФИГ. 76). В среднем, обнаружение цоДНК наблюдалось за 96 дней (0-245 дней) до обнаружения с помощью рентгенографии. Например, у пациента 4265 наблюдалось падение цоДНК во время НАХТ, а затем цоДНК было обнаружено через 138 дней после ЦЭ; тогда как клинический рецидив был выявлен через 186 дней (324 дня после ЦЭ). Подобным образом, пациент 4189 показал положительный результат на цоДНК до ЦЭ и впоследствии был отрицательным, а затем, через 273 дня после ЦЭ, снова была обнаружена цоДНК; однако клинический рецидив был выявлен на 369 день или 96 дней спустя (см. ФИГ. 76). Для 12 пациентов с метастатическим рецидивом мы обнаружили, что анализ цоДНК имеет медианное время упреждения 103 дня (диапазон; p=0,019) по сравнению с обычными способами визуализации (ФИГ.77). Время упреждения может быть смещено при анализе более частого отбора проб плазмы по сравнению с визуализацией. Ограничение нашего анализа пациентами с одновременным исследованием плазмы и рентгенографией позволило выявить восемь пациентов, пять из которых показали упреждение времени обнаружения рецидива для анализов цоДНК. У остальных трех пациентов было выявлено одновременное рецидивирование (ФИГ.77), и среднее время упреждения для всех восьми пациентов составило 106 дней.
[976] Серийный отбор измерений цоДНК для мониторинга ответа на терапию
[977] Рак мочевого пузыря лечится с помощью НАХТ, однако клинически полезные прогностические биомаркеры ответа на лечение были ранее и в настоящее время недоступными, и снижение патологической стадии при ЦЭ используется в качестве показателя эффективности лечения (ссылка). В нашей серии рецидив заболевания был достоверно связан с ожидаемым ответом на химиотерапию (ФИГ. 78A), однако только у 44% (х/у) пациентов без ответа наблюдался рецидив заболевания, что указывает на то, что снижение патологической стадии явилось неоптимальным маркером для оценки эффективности лечения. В данном случае мы обнаружили, что измерения цоДНК в динамике во время НАХТ показали очень разные распределения между пациентами, отвечающими на лечение, и пациентами, не отвечающими на лечение (p = xx; ФИГ. 78F-G). В общей сложности 83% (34/41) цоДНК-отрицательных пациентов показали ответ на химиотерапию, и 53% (9/17) пациентов, у которых был выявлен клиренс цоДНК в результате исходно положительных тестов, отвечали на терапию, что указывает на то, что уровни цоДНК могут служить лучшими индикаторами эффективности лечения во время и после лечения. У пациентов с положительной цоДНК после НАХТ не было ответа на химиотерапию. В целом, уровни цоДНК отражали характеристики течения болезни, наблюдаемые в когорте (ФИГ. 78G).
[978] Анализ молекулярных характеристик опухолей, ранее не получавших лечение, показал значительно более высокий вклад мутационной сигнатуры 5 (p = 0,01) у пациентов, отвечающих на химиотерапию (ФИГ. 78B). Высокий вклад сигнатуры 5 был в значительной степени связан со статусом мутации ERCC2 (ФИГ. 80), что указывает на корреляцию с механизмами ответа на повреждение ДНК (DDR), как сообщалось ранее. Мутации ERCC2 у пациентов, отвечающих на лечение, однако, не были значимо более распространенными (ФИГ. 78C). В целом, статус мутации DDR не был прогностическим биомаркером ответа на химиотерапию (ФИГ. 78D). Путем стратификации опухолей по молекулярным подтипам (ФИГ. 78E) мы обнаружили значительную корреляцию с выживаемостью (ФИГ. 78F), но эти подтипы не позволяли прогнозировать ответ на НАХТ (ФИГ. 78G). Опухоли, классифицированные как «инфильтрированные», показали более высокую скорость ответа на химиотерапию по сравнению с другими подтипами (ФИГ. 78G). Это контрастирует с более ранними сообщениями, в которых подчеркивается, что опухоли, подобные базальным, в наибольшей степени связаны с ответом на лечение НАХТ.
[979] Полноэкзомное секвенирование цоДНК плазмы от пациентов с метастатической болезнью
[980] Мы провели полноэкзомное секвенирование (ПЭС) скДНК из образцов плазмы с цоДНК-мишенями, измеренными с частотой аллелей 10% или выше в анализах ССП мультиплексной ПЦР. Четыре образца от трех пациентов были секвенированы до среднего целевого охвата 307X (272X-340X), и было идентифицировано 508-1294 мутаций. Мы сравнили все мутации, идентифицированные в данных ПЭС плазмы, с соответствующими данными ПЭС первичной опухоли, чтобы оценить мутационные изменения, приобретенные во время метастатической эволюции (ФИГ. 79A-D). Мы обнаружили большое сходство между мутационными ландшафтами первичных опухолей и метастатических поражений, что указывает на ограниченную клональную эволюцию в течение болезни у выбранных пациентов. В среднем, мы идентифицировали 62 мутации в цоДНК, присутствующие на момент метастазирования, которые не были обнаружены в первичных опухолях. Интересно, что мы идентифицировали две мутации CYP2C19 в плазме пациента 4119, обе затрагивающие кодон 214. Полученная аминокислота находится в канале, участвующем в направлении соединений к активному центру белка. Эти мутации могли произойти во время химиотерапии, и они могут объяснить отсутствие снижения патологической стадии, наблюдаемого у этого пациента.
[981] Обсуждение
[982] В данном отчете описан надежный и воспроизводимый способ для раннего выявления и улучшения лечения метастатического заболевания, основанный на обнаружении и мониторинге цоДНК до, во время и после лечения. У пациентов, подвергшихся радикальной операции, обнаружение цоДНК служит прямым доказательством скрытых раковых клеток и, следовательно, остаточного заболевания.
[983] Что интересно, в данном случае было обнаружено, что выявление цоДНК часто предшествовало обнаружению метастазов с помощью способов визуализации. В частности, мы обнаружили, что все пациенты, у которых в конечном итоге был выявлен метастатический рак мочевого пузыря, были цоДНК-положительными после цистэктомии, со средним временем упреждения 103 дня по сравнению с визуализационными способами. Таким образом, способ анализа, представленной в данном документе цоДНК, предлагает уникальную возможность для начала лечения метастатического рецидива в более ранний момент времени. Важно отметить, что начало лечения небольших объемов метастатического заболевания может повысить уровни ответа и положительно повлиять на выживаемость.
[984] В этом исследовании также описан надежный и воспроизводимый способ выявления пациентов с низким риском метастатического рецидива. При этом было обнаружено, что все пациенты, у которых не было заболевания, после цистэктомии были цоДНК-отрицательными (100% специфичность). 100% специфичность теста после цистэктомии может быть использована для выявления пациентов с низким риском метастатического рецидива и, следовательно, уменьшения потребности в постоянном наблюдении с дорогостоящей рентгенографической визуализацией и связанной с этим тревогой пациента. Соответственно, настоящее описание обеспечивает лучшую связь между статусом цоДНК и исходом по сравнению с обычными способами, тем самым приближая анализ цоДНК к клиническому значению.
[985] Настоящее изобретение также явилось открытием того, что динамика цоДНК может помочь в идентификации пациентов, реагирующих на НАХТ, уже во время лечения. Пациенты с МИРМП получали НАХТ для уменьшения первичной опухолевой нагрузки и потенциального устранения микрометастазов до цистэктомии, и у большинства пациентов наблюдалось снижение патологической стадии после НАХТ. Отсутствие снижения патологической стадии, т.е. остаточная первичная опухоль или инфильтрация лимфатических узлов во время цистэктомии, или предшествующая инфильтрация лимфатических узлов, являются факторами риска, связанными с рецидивом заболевания после цистэктомии. В нашем исследовании цоДНК была обнаружена у 37% (25/68) пациентов до или во время НАХТ, а у 53% пациентов со снижением цоДНК ниже нашего порога обнаружения наблюдалось снижение патологической стадии. Важно отметить, что ни у одного из пациентов с постоянно определяемой цоДНК не наблюдалось снижения патологической стадии. Однако мы наблюдали подгруппу пациентов со снижением патологической стадии, у которых наблюдались рецидивы заболевания, и наоборот. Эти результаты показывают, что, хотя клинические и гистопатологические параметры служат прогностическими факторами риска, стратификация риска пациентов на основе патологии далека от идеала.
[986] В данном изобретении также предлагается, что статус цоДНК до и во время химиотерапии может быть реализован как новый мощный клинический фактор риска и потенциально может помочь в отборе пациентов с ранним метастатическим распространением, которым могут быть полезны длительные режимы НАХТ и усиленного наблюдения. При этом было продемонстрировано, что ни у одного из пациентов с отрицательным результатом цоДНК до или во время химиотерапии не было рецидива заболевания после цистэктомии, в то время как у 44% (11/25) пациентов, которые были положительными по цоДНК до или во время химиотерапии, был рецидив заболевания. Таким образом, присутствие цоДНК даже на ранней стадии может указывать на метастатическое распространение и способствовать более высокой стратификации риска пациентов по сравнению с имеющимися в настоящее время факторами риска для этой группы пациентов, которые, насколько нам известно, ранее не демонстрировались на аналогичном уровне закономерности. Подгруппа пациентов с первоначально обнаруживаемой цоДНК, но без признаков возможного рецидива заболевания, может представлять собой случаи, когда химиотерапия или цистэктомия эффективно искоренили болезнь. Следовательно, пациенты без признаков раннего метастатического распространения (цоДНК отрицательные) и снижения патологической стадии после НАХТ могут иметь право на лечение с сохранением мочевого пузыря.
[987] Примечательно, что для многих пациентов частоты цоДНК были довольно низкими (несколько мутировавших копий), и для надежного обнаружения этих редких вариантов требуются подходы сверхглубокого секвенирования на основе ССП. Отбор клональных мутаций на основе ПЭС первичной опухоли позволяет провести сверхглубокое секвенирование специфичных для пациента мутаций в цоДНК плазмы. Более ранняя работа показала генетическую гетерогенность между первичными опухолями и метастазами, указывая на то, что могут потребоваться генные панели часто мутирующих генов. При применении ПЭС скДНК из плазмы мы по-прежнему наблюдали гетерогенность между первичными опухолями и метастазами, но, что важно, все клональные мутации, выбранные из первичных опухолей, были обнаружены в метастазах.
[988] В заключение, представленное в данном документе изобретение, показало, что определение уровней цоДНК у пациентов с раком мочевого пузыря является высокопрогнозируемым маркером метастатического рецидива и ответа на лечение. В частности, изобретатели настоящего изобретения предоставили в данном документе точные и надежные способы мониторинга реакции пациента на лечение рака, чтобы убедить пациента в том, что заболевание находится под контролем, и обнаружение рецидива значительно ранее обычных способов может улучшить результаты выживаемости.
[989] Пример 10. Анализ в динамике свободно-клеточной ДНК плазмы путем ультраглубокого секвенирования у пациентов с колоректальным раком I-III стадии.
[990] Целью этого примера было показать, что послеоперационный анализ в динамике циркулирующей опухолевой ДНК (цоДНК) позволяет идентифицировать и контролировать остаточную опухолевую нагрузку у пациентов без клинических проявлений заболевания. В частности, этот пример показал, что анализ цоДНК позволяет персонализировать и стратифицировать риск послеоперационного лечения пациентов с колоректальным раком I-III стадии.
[991] ВВЕДЕНИЕ
[992] олоректальный рак (КРР) является третьим по распространенности раком в мире и второй ведущей причиной смертей, связанных с раком, с 1,3 миллионами впервые диагностированных случаев ежегодно. Несмотря на улучшение хирургических вмешательств, проведение скрининга и прогресс в схемах лечения, пятилетний уровень смертности пациентов с КРР остается высоким и составляет приблизительно 40%, что представляет собой серьезное бремя для здравоохранения во всем мире.
[993] Текущий стандарт лечения пациентов с КРР включает хирургическое удаление опухоли с последующей адъювантной химиотерапией (АХТ) у отдельных пациентов. Большинство пациентов II стадии не получают АХТ, однако приблизительно 10-15% имеют остаточное заболевание после операции. Если бы их можно было идентифицировать, лечение АХТ потенциально могло бы снизить риск рецидива. Напротив, большинство пациентов III стадии получают АХТ. Несмотря на это, более 50% уже становятся излеченными хирургическим путем. Кроме того, приблизительно 30% пациентов с III стадией лечения АХТ испытывают рецидивы, что делает их кандидатами на дополнительную терапию. Таким образом, крайне необходимы улучшенные инструменты для определения популяции пациентов, которым АХТ принесет пользу.
[994] Ранняя диагностика рецидивов заболевания является еще одной значимой клинически неудовлетворенной потребность при КРР. После завершения радикального лечения рекомендуется наблюдение за рецидивом, чтобы выявить рецидив на достаточно ранней стадии для потенциально излечивающего хирургического вмешательства. Несмотря на наблюдение, многие рецидивы выявляются поздно, и только 10-20% метахронных метастазов лечатся с намерением исцеления. Следовательно, существует потребность в лучших биомаркерах, которые могут раньше выявлять пациентов с высоким риском рецидива, что позволяет использовать соответствующие стратегии последующего наблюдения и лечения для улучшения выживаемости пациентов.
[995] СПОСОБЫ
[996] Пациенты
[997] Пациенты с КРР стадии I - III были набраны в хирургических отделениях больницы Орхусского университета, больницы Рандерс и больницы Хернинга в период с 2014 по 2018 год. Опухолевая ткань была собрана во время операции. Образцы крови собирали до операции (за 14 дней до операции) и после операции на 30-й день (при этом можно было взять образец за 14 дней до или после), а затем каждые три месяца до смерти, выхода пациента из исследования или в месяц 36, в зависимости от того, что наступит раньше. Семьдесят пять пациентов предоставили серийные образцы крови (от 3 до 14 образцов на пациента), тогда как оставшиеся 50 пациентов предоставили только два образца крови (дооперационный и послеоперационный в день 30). Характеристики и демографические данные пациентов приведены ниже в Таблице 12.1.
[998] Для всех пациентов была собрана информация о послеоперационном клиническом вмешательстве и другая клинико-патологическая информация, как показано в Таблице 12.2 ниже. Всем пациентам в исследовании была выполнена резекция первичной опухоли.
пациента
первичной опухоли
первичной
опухоли, мм
по
UICC
терапия
5-10 см
10-15 см
10-15 см
10-15 см
10-15 см
восходящая кишка (2)
40 (2)
T3N1M0V1 (2)
10-15 см
и поперечная кишка (2)
13 (2)
TxN1M0Vx (2)
левый изгиб (2)
Н/Д (2)
T3N1M0V0 (2)
восходящая кишка (2)
35 (2)
T3N1MxV0 (2)
пациента
после операции,
месяц
Рецидива
фолиевая кислота
фолиевая кислота
фолиевая кислота
фолиевая кислота
РЧА печени
радикальная резекция
радикальная резекция
резекция
опухоли
[999] Все пациенты получали лечение и наблюдение в соответствии с Национальными рекомендациями Дании. Исследование было одобрено Комитетом по этике биомедицинских исследований в Центральном регионе Дании (1-16-02-453-14) и проводилось в соответствии с Хельсинкской декларацией. Все участники предоставили письменное информированное согласие.
[1000] Анализ карциноэмбрионального антигена (CEA).
[1001] Анализ CEA выполнялся на платформе Cobas e601 (Roche) в соответствии с рекомендациями производителя с использованием 500 мкл сыворотки. Пороговые уровни были установлены на уровне 4,0 мкг/л и 6,0 мкг/л для, соответственно, некурящих и курильщиков в соответствии с рекомендациями анализирующей больницы. Человек, который не курил 8 недель до сбора образцов, считался бывшим курильщиком.
[1002] Сбор ткани и полноэкзомное секвенирование.
[1003] Опухолевая ткань была собрана у всех пациентов в виде свежезамороженной (n = 102) или фиксированной формалином и залитой парафином ткани (FFPE) (n = 27). Четыре пациента поступили с синхронным колоректальным раком (КРР); у этих пациентов были взяты ткани обеих опухолей. Метастатическая ткань была взята у трех пациентов с рецидивом. Конституционная ДНК, соответствующая всем пациентам, была извлечена из лейкоцитов периферической крови.
[1004] Первичные свежезамороженные или фиксированные в формалине и залитые в парафин образцы ткани (FFPE) имели медианную патологическую клеточность опухоли 50% (диапазон 20-90%). (Приложение, Таблица 2). ДНК экстрагировали с использованием набора для очистки ДНК Puregene® DNA purification kit (Gentra Systems) или с использованием набора QiAamp® DNA FFPE tissue kit (Qiagen).
[1005] Полноэкзомное секвенирование (ПЭС) выполняли на соответствующих ДНК опухолей и ДНК лейкоцитов лейкоцитарной пленки. Сводная информация об образце и ПЭС приведена в таблице 12.5 ниже. Содержание рака оценивали с помощью гематоксилин-эозиновой оценки срезов ткани, вырезанных до и после тех, которые использовались для экстракции. Синхронные КРР отмечены в таблице буквами S1 и S2.
[1006] Подготовку библиотеки, секвенирование и анализ данных проводили как описано в Lamy et al. Paired Exome Analysis Reveals Clonal Evolution and Potential Therapeutic Targets in Urothelial Carcinoma. Cancer Res. 76(19):5894-5906 (2016).
[1007] Сбор крови и выделение плазмы
[1008] Образцы крови собирали в 10 мл пробирки с K2-ЭДТА (BD 367525) в больнице Орхусского университета. Все образцы обрабатывали в течение 2 часов после сбора путем двойного центрифугирования крови при комнатной температуре, сначала в течение 10 минут при 3000 g, а затем центрифугированием плазмы в течение 10 минут при 3000 g. Плазму разделяли на аликвоты в криопробирки объемом 5 мл и хранили при минус 80 °C.
[1009] Экстракция свободно-клеточной ДНК, количественное определение и подготовка библиотеки.
[1010] В этом исследовании использовали до 10 мл плазмы на случай (диапазон 2-10 мл; медиана 8,5 мл), а внеклеточная ДНК (скДНК) была извлечена с использованием набора QIAamp® Circulating Nucleic Acid kit (Qiagen) и элюирована в 50 мкл буфера DNA Suspension Buffer (Sigma). Поводили количественное определение каждого образца скДНК с помощью набора Quant-iT® High Sensitivity dsDNA Assay Kit (Invitrogen). У 125 пациентов скДНК был выделена из 795 серийных образцов плазмы.
[1011] В качестве исходных данных для подготовки библиотеки использовали до 66 нг (20000 геномных эквивалентов) скДНК из каждого образца плазмы. скДНК была подвергнута репарации на концах, наращиванию A-хвостов и лигированию с помощью специальных адапторов, как описано в Abbosh et al. Phylogenetic ctDNA analysis depicts early-stage lung cancer evolution. Nature 545(7655):446-451(2017). Очищенный продукт лигирования амплифицировали в течение 20 циклов и очищали с использованием микрогранул Ampure® X (Agencourt/Beckman Coulter).
[1012] Схема анализа мультиплексной ПЦР
[1013] Соматические варианты для конкретного пациента были идентифицированы путем анализа первичной опухоли и ПЭС соответствующих нормальных образцов для всех пациентов. Клональность вариантов была выведена на основании расчетной доли раковых клеток, несущих вариант. Обратите внимание, что вывод о клональности для образцов с низкой фракцией опухолевых клеток ограничен из-за довольно плоского распределения частоты вариантного аллеля. Наблюдаемые ЧВА в ткани и в контексте последовательностей вариантов были использованы для определения приоритета соматических ОНВ и коротких ВСТАВОК/ДЕЛЕЦИЙ, идентифицированных для каждой опухоли. Для создания пар праймеров для ПЦР для данного набора вариантов использовался стандартный процесс разработки ампликонов Signatera. Для каждого пациента было выбрано 16 высокорейтинговых совместимых ампликонов для индивидуальной панели пациента. Праймеры для ПЦР заказывались в Integrated DNA Technologies.
[1014] Рабочий процесс секвенирования следующего поколения плазмы в мультиплексной ПЦР
[1015] Аликвоту каждой библиотеки использовали в качестве ввода для связанной с пациентом реакции 16-плексной ПЦР. Образцы были амплифицированы с использованием специфического для пациента анализа и закодированы штрих-кодом с последующим объединением. Секвенирование выполняли на Illumina HiSeq® 2500 Rapid Run с 50 циклами считывания парных концов с использованием набора Illumina PAIRED END® v2 со средней глубиной считывания более 105000X на ампликон.
[1016] Процесс обработки биоинформатики
[1017] Все считывания парных концов были объединены с использованием программного обеспечения Pear как описано в Zhang, Bioinformatics, 30(5): 614-620 (2014). Основания, которые не совпадали при прямом и обратном считывании или имели низкий показатель качества, были отфильтрованы с тем, чтобы минимизировать ошибки секвенирования. Объединенные считывания были сопоставлены с эталонным геномом hg19 с помощью Novoalign версия 2.3.4 (http://www.novocraft.com/). Ампликоны с менее 5000 считываний высокого качества считались не прошедшими контроль качества (КК). КК выполнялся с помощью собственной программы, проверяющей широкий список статистических данных для каждой выборки, который включал общее количество считываний, картированных считываний, целевых считываний, количество неудачных мишеней и среднюю частоту ошибок.
[1018] Распознавание плазматических вариантов
[1019] Для построения модели фоновой ошибки был предварительно обработан большой набор образцов отрицательного контроля (~1000). Для каждого целевого варианта с использованием глубины считывания мутантных и референтных аллелей показатель достоверности рассчитывался на основе модели ошибок, как описано в Abbosh et al. Phylogenetic ctDNA analysis depicts early-stage lung cancer evolution. Nature 545(7655):446-451 (2017). Образец плазмы с по меньшей мере 2 вариантами с оценкой достоверности выше заранее определенного порога алгоритма был определен как цоДНК положительный, как описано в Abbosh et al, 2017, выше.
[1020] Статистический анализ
[1021] Первичным критерием результата было время до рецидива (TTR), оцененное по стандартным радиологическим критериям. TTR измеряли от даты операции до зарегистрированного первого радиологического рецидива (местного или отдаленного) или смерти в результате колоректального рака и проверяли при последнем наблюдении или смерти, не связанной с колоректальным раком. Анализ выживаемости проводили с использованием способа Каплана - Мейера. Для оценки влияния цоДНК и CEA на TTR был использован регрессионный анализ пропорциональных рисков Кокса. Многофакторный анализ проводился с клиническими параметрами, которые были статистически значимыми при одномерном анализе. Все P-значения были основаны на двустороннем тестировании, и различия считались значимыми при P≤0,05. Статистический анализ был проведен с использованием программного обеспечения STATA IC/12.1 и R Statistical software, версия 2.4 для Windows.
[1022] РЕЗУЛЬТАТЫ
[1023] С 2014 по 2016 год в исследование было включено 130 пациентов с КРР I - III стадии по UICC. Пять пациентов были впоследствии исключены, поскольку они были либо потеряны для последующего наблюдения (n = 3), либо переведены в стадию IV. Для идентификации соматических мутаций использовали полноэкзомное секвенирование (ПЭС) опухоли и соответствующей ДНК зародышевой линии, как показано на ФИГ. 90A-B. Для каждого пациента были разработаны опухолеспецифические панели для анализа в мультиплексной ПЦР, нацеленные на 16 мутаций. ССП на основе сверхглубокой мультиплексной ПЦР использовали для анализа и количественной оценки циркулирующей опухолевой ДНК в 795 образцах плазмы 125 пациентов с медианным периодом наблюдения 12,5 месяцев (диапазон от 1,4 до 38,5 месяцев). Рабочий процесс этого исследования показан на ФИГ. 83A-E. Контроль качества проводился на каждом этапе рабочего процесса. Глубина считывания для тестов, прошедших контроль качества покрытия, составила более 105000X, как показано на ФИГ. 91. Подробная информация о результатах и динамике цоДНК для всех 125 пациентов указана в Таблице 12.6 и представлена на ФИГ. 92. За период наблюдения за пациентами у 24 (19,2%) пациентов были рентгенологические рецидивы.
[1024] Дооперационное выявление цоДНК
[1025] В исходных дооперационных образцах плазмы (n=122) мы обнаружили цоДНК в 89% образцов с чувствительностью 40%, 92% и 90% на стадиях, соответственно, I, II и III как показано на ФИГ. 87A. Анализ карциноэмбрионального антигена (CEA), проведенный на тех же образцах, выявил 43,3% случаев рака, как показано на ФИГ. 88.
[1026] Послеоперационный статус цоДНК в день 30 прогнозирует рецидив
[1027] Чтобы оценить способность выявлять остаточную болезнь и прогнозировать рецидив в будущем, мы провели анализ цоДНК в образцах плазмы, собранных после операции. Плазма, собранная на 30-й день, до начала адъювантной химиотерапии, была доступна для 94 пациентов. Интересно, что подавляющее большинство (89,4%) пациентов были цоДНК отрицательными, и только 10,6% пациентов были положительными по цоДНК после операции, как показано на ФИГ. 89. Эти цоДНК-положительные пациенты имели значительно более высокую частоту рецидивов (70%, 7/10) по сравнению с теми, которые были цоДНК-отрицательными после операции (11.9%, 10/84), как показано на ФИГ. 87B. Присутствие цоДНК было связано со значительным сокращением времени до рецидива (TTR) по сравнению с цоДНК-отрицательными пациентами (ОР, 7,2; 95% ДИ, 2,7-19; P менее 0,0000), как показано на ФИГ. 87C. По сравнению с известными прогностическими факторами, такими как стадия и лимфоваскулярная инвазия, в модели многомерной логистической регрессии статус цоДНК был единственным значимым прогностическим фактором, как показано в Таблице 12.7 ниже.
[1028] Подгруппа пациентов получала АХТ (n=52), что могло изменить прогностическую ценность цоДНК в отношении исхода. Однако даже для этой подгруппы положительность по цоДНК была связана с высоким риском рецидива (ОР, 7,1; 95% ДИ 2,2-22; P=0,0008) как показано на ФИГ. 90A-B. Частота рецидивов у цоДНК-отрицательных пациентов составляла 11,9% независимо от того, лечились они АХТ (5/42) или нет (5/42). Таким образом, статус цоДНК на 30-й день после операции является сильным предиктором будущего рецидива даже для пациентов, получавших АХТ.
[1029] Адъювантная химиотерапия устраняет цоДНК в субфракции дня 30 у положительных по цоДНК пациентов.
[1030] Хотя рандомизированные исследования показали, что адъювантная химиотерапия (АХТ) может снизить общую частоту рецидивов III стадии КРР 21-24, в настоящее время неизвестно, может ли АХТ специфически предотвращать рецидивы среди цоДНК-положительной подгруппы высокого риска. Десять пациентов, у которых был положительный результат на цоДНК на 30-е сутки, впоследствии получали АХТ, как показано на ФИГ. 87D. Среди этих пациентов, впоследствии получавших АХТ, у 70% (n = 7) возник рецидив, в то время как у 30% (n=3) к концу периода наблюдения все еще отсутствовали признаки заболевания. Эта эффективность лечения аналогична оценке, когда АХТ назначается всем ракам толстой кишки стадии III, как описано в Upadhyay et al., Chemotherapy use in stage III colon cancer: a National Cancer Database analysis. Ther Adv Med Oncol. 7(5):244-251 (2015); André et al., Improved overall survival with oxaliplatin, fluorouracil, and leucovorin as adjuvant treatment in stage II or III colon cancer in the MOSAIC trial. J Clin Oncol. 27(19):3109-3116 (2009); Gill et al., Pooled analysis of fluorouracil-based adjuvant therapy for stage II and III colon cancer: who benefits and by how much? J Clin Oncol. 22(10):1797-1806 (2004); Haller et al., Capecitabine plus oxaliplatin compared with fluorouracil and folinic acid as adjuvant therapy for stage III colon cancer. J Clin Oncol. 29(11):1465-1471 (2011). Таким образом, представленные в данном документе результаты, показанные на ФИГ. 87D, показали, что АХТ может устранить остаточную болезнь в подгруппе цоДНК-положительных пациентов с высоким риском.
[1031] Для двух из трех пациентов, которые не имели рецидивов, собранные образцы плазмы были доступны в динамике. В соответствии с АХТ, устраняющей остаточное заболевание, эти пациенты продемонстрировали полный клиренс цоДНК во время терапии и оставались отрицательными на протяжении всего исследования. Напротив, шесть пациентов с рецидивом и доступной в динамике плазмой либо оставались цоДНК-положительными во время АХТ, либо снова становились цоДНК-положительными вскоре после завершения АХТ.
[1032] Мониторинг цоДНК в динамике измеряет эффективность лечения при помощи АХТ.
[1033] Собранные в динамике образцы крови были доступными для 8/10 пациентов, которые были цоДНК-положительными перед началом АХТ. Эти собранные в динамике образцы крови были проанализированы для наблюдения за изменениями уровней цоДНК во время лечения. Статус цоДНК стал отрицательным у 50% пациентов (n=4), как показано на ФИГ. 87D, тогда как у остальных четырех пациентов статус цоДНК оставался положительным на протяжении всего лечения. Поразительно, что все четыре пациента (100%), у которых не было клиренса цоДНК, имели рецидив заболевания, что указывает на то, что остаточная цоДНК предсказала, что АХТ не смогла устранить остаточное заболевание. Из четырех пациентов, которые избавились от цоДНК во время лечения, двое оставались отрицательными на цоДНК во всех образцах после АХТ и все время не имели рецидив, в то время как у двух других пациентов вскоре после лечения восстановился положительный результат на цоДНК, и в конечном итоге развился рецидив, как показано на ФИГ. 87D.
[1034] Выявление цоДНК после АХТ определяет подгруппу пациентов с очень высоким риском рецидива.
[1035] Поскольку у 100% пациентов, которые не избавились от цоДНК во время адъювантной химиотерапии (АХТ), впоследствии произошел рецидив заболевания, мы предположили, что анализ цоДНК первой пробы крови, взятой после АХТ, может быть использован для идентификации подгруппы пациентов с продолжающимся остаточным заболеванием, которым принесет пользу дальнейшее лечение. Мы обнаружили, что из 58 пациентов с образцами крови после АХТ все цоДНК-положительные пациенты (7/7) имели рецидив. Для сравнения, частота рецидивов составила 13,7% (7/51) для пациентов с отрицательным результатом на цоДНК (точный критерий Фишера, P менее 0,0001), как показано на ФИГ. 87E. Статус цоДНК после АХТ был более сильным предиктором начала рецидива по сравнению с другими прогностическими факторами, такими как стадия, лимфоваскулярная инвазия, микроскопический статус радикальной резекции и CEA, как показано в Таблице 12.8 ниже, а статус цоДНК был очень значимым предиктором времени до рецидива (TTR) (ОР, 18,0; 95% ДИ, 5,4-57; P менее 0,0000), как показано на ФИГ. 87F.
[1036] Анализ цоДНК в динамике, включая все образцы крови после АХТ, был еще более сильным предиктором времени до рецидива (ОР, 29,0; 95% ДИ, 6,4-130; p <0,0000), и выявил 13 цоДНК-положительных пациентов, из которых 92,3% (12/13) имели рецидив, как показано на ФИГ. 91. Хотя анализ карциноэмбрионального антигена (СЕА) в динамике также был значительным предиктором времени до рецидива, как показано на ФИГ. 92, после мнофакторной корректировки статус цоДНК в динамике был единственным значимым предиктором времени до рецидива (ОР, 26,9; 95% ДИ, 5,11-142; P = 0,0001), как показано в таблице 12.9 ниже.
[1037] Анализ цоДНК в динамике предсказал исход пациентов и сделал возможным ранее выявление рецидива.
[1038] Серийный анализ цоДНК во время наблюдения после радикального лечения 75 пациентов с помощью образцов плазмы в динамике выявил метастатический рецидив с чувствительностью 87,5% (14/16) и специфичностью 98,3% (58/59). Поразительно, что 93,3% (14/15) цоДНК-положительных пациентов имели рецидивы по сравнению с частотой рецидивов, составляющей только 3,3% (2/60) для цоДНК-отрицательных пациентов (точный тест Фишера, P менее 0,0001). Пациенты, положительные по цоДНК, имели значительно сокращенное время до рецидива (TTR) (ОР, 44,0; 95% ДИ, 9,8-190; P <0,0000), как показано на ФИГ. 93A-B. Течение болезни и результаты цоДНК в динамике для всех 75 больных показаны на ФИГ. 94. Серийный анализ цоДНК пропустил два рецидива (пациенты 20 и 24, ФИГ. 94). Тем не менее, полноэкзомное секвенирование двух пропущенных метастазов подтвердило присутствие мутаций, используемых для скрининга плазмы, как показано в Таблице 12.10 ниже.
не выявлена
[1039] Для двух пациентов с рецидивом (ИН 20 и 24, Таблица 12.10) анализ в динамике после операции не выявил цоДНК, как показано на ФИГ. 90A-B. У этих двух пациентов было проанализировано такое же количество плазмы, что и у других пациентов. Возможная замена образцов могла быть отклонена из-за 45 общих ОНП во всех опухолях и образцах плазмы, что подтвердило то, что никакие образцы не были заменены. Затем мы выполнили полноэкзомное секвенирование (ПЭС) метастатических рецидивов для двух пациентов и подтвердили, что мутации, выбранные для профилирования плазмы, присутствовали в метастазах. Таблица 12.9. ПЭС была также выполнена на метастазах от пациента 77. Для этого пациента анализ цоДНК в динамике не обнаруживал цоДНК до тех пор, пока рецидив не был выявлен с помощью радиологической визуализации, как показано на ФИГ. 90A-B. И снова ПЭС подтвердило, что мутации, выбранные для профилирования плазмы, присутствовали в метастазах. Таким образом, отрицательные послеоперационные результаты были вызваны уровнем цоДНК ниже уровня обнаружения, а не тем, что выбранные маркеры были неинформативными.
[1040] Анализ в динамике CEA-анализ этой же популяции выявил рецидив с чувствительностью 68,8% (11/16) и специфичностью 64,4% (38/59), как показано на ФИГ. 95. В многофакторном анализе цоДНК был единственным значимым предиктором времени до рецидива (TTR) (ОР, 41; 95% ДИ, 8,5-199; P <0,0000), как показано в Таблице 12.11 ниже.
[1041] Для пациентов с метастатическим рецидивом и обнаруживаемой цоДНК было выявлено, что анализ цоДНК имел среднее время упреждения 8,7 месяцев (знаковый ранговый критерий Вилкоксона; P=0,0009) по сравнению со стандартными КТ-изображениями, как показано на ФИГ. 93C; тогда как время упреждения с помощью анализа карциноэмбрионального антигена (CEA) не могло быть установлено, как показано на ФИГ. 96. С момента обнаружения цоДНК и до радиологического обнаружения рецидива образцы плазмы оставались положительными на цоДНК, и наблюдалось 50-кратное увеличение среднего значения ЧВА цоДНК, что указывает на резкое увеличение опухолевой нагрузки, в то время, когда пациенты ожидали радиологического обнаружения рецидива, как показано на ФИГ. 93D.
[1042] Анализ цоДНК выявил клинически значимые мутации
[1043] Показав, что анализ цоДНК в динамике позволяет проводить раннее обнаружение микрометастазов, мы затем исследовали, можно ли использовать анализ цоДНК в динамике для получения информации о потенциально значимых мутациях, присутствующих в метастазах.
[1044] Из доступных образцов в динамике было идентифицировано 11 пациентов с метастатическим рецидивом, и клинически значимые мутации были идентифицированы путем выполнения полноэкзомного секвенирования (ПЭС) первичной опухоли, как показано в Таблице 12.12 ниже.
[1045] В качестве доказательства концепции была разработана дополнительная панель мультиплексной ПЦР, нацеленная на значимые мутации, и она была применена к полученным в динамике образцам. Значимая мутация была обнаружена у 82% (9/11) пациентов, как показано на ФИГ. 97А. Мы наблюдали хорошую корреляцию между средними ЧВА цоДНК и ЧВА значимых мутаций, как показано на ФИГ. 97B. Изменения в динамике частот значимых вариантов аллелей (ЧВА) в целом показали хорошую корреляцию с лечением и очень небольшую интермутационную вариабельность, как показано на ФИГ. 97C.
[1046] ОБСУЖДЕНИЕ
[1047] Этот пример продемонстрировал, что анализ цоДНК в динамике у пациентов с I-III стадией КРР может эффективно обнаруживать и отслеживать изменения в опухолевом образовании на протяжении всего клинического течения заболевания. В частности, было продемонстрировано, что цоДНК служил надежным биомаркером для i) дооперационного обнаружения КРР, ii) послеоперационной и пост-АХТ стратификации риска, iii) мониторинга эффективности АХТ, iv) выявления клинически значимых мутаций и v) раннего выявления рецидивов. Эти наблюдения имеют важные и потенциально изменяющие парадигму последствия для будущего послеоперационного ведения пациентов с КРР, и они заложили основу для будущих интервенционных испытаний для изучения клинических преимуществ лечения под контролем цоДНК.
[1048] В предоперационном контексте была продемонстрирована применимость предоперационных измерений цоДНК для выявления заболевания.
[1049] Что касается стратификации пациентов, то использованный в данном документе анализ цоДНК разделил пациентов на группы с высоким и низким риском рецидивов, что могло иметь потенциальное влияние на отбор пациентов для лечения при помощи адъювантной химиотерапии (АХТ) и для решения о дополнительном лечении после АХТ. Ранее принятие решения о лечении АХТ основывалось на стадиях и клинических факторах риска. Однако данное изобретение показало, что статус цоДНК является более сильным прогностическим фактором, чем стадия, CEA и другие признаки высокого риска. Следовательно, в будущем, возможно, появится возможность назначать лечение АХТ на основе анализа цоДНК для цоДНК-положительных, но клинически низкого риска (I и II стадии) пациентов, которые не получали бы сегодня АХТ в качестве стандарта лечения. Изобретатели настоящего изобретения в настоящее время проводят испытания для оценки клинической пользы отбора пациентов на основе цоДНК в этих условиях (например, клинические исследования IMPROVE-IT ClinicalTrials. gov: NCT03748680 и реестр клинических исследований Австралии и Новой Зеландии DYNAMIC Australian New Zealand Clinical Trials registry: АСТRN12615000381583).
[1050] Настоящее изобретение также продемонстрировало, что цоДНК-отрицательные пациенты имеют низкий риск рецидива, независимо от того, вводили ли им АХТ (11,9%) или нет (11,9%). Следовательно, в будущем, возможно, появится возможность удерживать от АХТ цоДНК-отрицательных, но клинически высокого риска (стадия III) пациентов с минимальным влиянием на риск их рецидива. Этой группе пациентов можно было бы предложить активное наблюдение на основе цоДНК вместо АХТ, что избавило бы многих пациентов, вылеченных одним только хирургическим путем, от токсичности химиотерапии. Кроме того, в условиях пост-АХТ, где отсутствуют текущие прогностические маркеры, мы демонстрируем, что анализ цоДНК выявляет пациентов, у которых все еще сохраняется остаточная болезнь. Этой популяции может принести пользу усиленное терапевтическое лечение.
[1051] Настоящее изобретение также продемонстрировало, что мониторинг цоДНК в динамике до, во время и после АХТ может обеспечить измерение эффективности АХТ на уровне пациента. 30% пациентов, у которых произошел клиренс цоДНК и они оставались отрицательными по цоДНК во всех последующих образцах, на протяжении всего исследования оставались без признаков заболевания. Таким образом, этот пример предоставил первую линию доказательств того, что АХТ может снизить риск рецидива у цоДНК-положительных пациентов. Настоящее изобретение также продемонстрировало, что все пациенты, у которых не произошел клиренс цоДНК, имели рецидив в течение года после завершения АХТ, и все пациенты, у которых наблюдался временный клиренс, также имели рецидив. Будущие клинические испытания, которые включают клиренс цоДНК в дизайн исследования, могут позволить измерять эффективность терапии на уровне пациента в реальном времени.
[1052] В послеоперационном периоде мониторинг цоДНК показывает значительное улучшение в выявлении рецидивов по сравнению со стандартными рентгенологическими изображениями, демонстрируя значительное время упреждения в 8,7 месяцев (P <0,001). Важно отметить, что в ожидании радиологического обнаружения уровень цоДНК увеличился в среднем в 50 раз, что указывает на резкое увеличение опухолевой нагрузки в течение 8,7 месяцев времени упреждения. Текущие руководства рекомендуют наблюдение после радикальной операции КРР, но большинство рецидивов выявляются слишком поздно, чтобы быть подходящими для радикального вмешательства. Раннее обнаружение остаточной болезни с помощью анализа цоДНК может дать возможность более раннего радиологического обнаружения. Помимо выявления остаточной болезни, анализ цоДНК также позволил выявить клинически значимые мутации. Следовательно, цоДНК имеет потенциал как для раннего выявления, так и для принятия решений о лечении.
[1053] В заключение, изобретение, представленное в этом примере, обеспечивает потенциально изменяющее парадигму клиническое применение цоДНК при колоректальном раке. Как упоминалось выше, разрабатываются или уже проводятся дополнительные клинические испытания для изучения клинических преимуществ лечения под контролем цоДНК. Представленные в данном документе результаты позволяют использовать циркулирующие биомаркеры для персонализированной стратификации риска и мониторинга терапии, чтобы гарантировать, что правильное лечение будет назначено правильному пациенту в нужное время и в течение нужной продолжительности.
[1054] Пример 11. Полноэкзомное профилирование скДНК плазмы захватывает мутационные сигнатуры доклинического рецидива для мониторинга эволюции заболевания.
[1055] Целью этого примера было оценить использование полноэкзомного секвенирования свободно-клеточной ДНК (ПЭС-скДНК) плазмы для исследования мутационных сигнатур и клональной эволюции у пациентов с запущенными формами рака или пациентов с высокой нагрузкой циркулирующей опухолевой ДНК (цоДНК). В частности, в данном случае мы продемонстрировали использование профилирования ПЭС-скДНК для выявления доклинических метастазов у пациентов с первичным раком молочной железы.
[1056] СПОСОБЫ
[1057] Сорок девять пациентов с первичным раком молочной железы были набраны после хирургического вмешательства и адъювантной терапии. Серийные образцы плазмы собирали каждые шесть месяцев для анализа цоДНК путем сверхглубокого секвенирования с рабочим процессом Signatera от Natera с использованием тестов для конкретных пациентов, нацеленных на 16 вариантов. Полноэкзомное секвенирование было выполнено на скДНК плазмы от всех 17 пациентов с рецидивом до, во время или после клинического рецидива, чтобы определить соответствие между вариантами, идентифицированными в плазме и биопсии опухоли, и понять эволюцию опухоли во время прогрессирования заболевания.
[1058] РЕЗУЛЬТАТЫ
[1059] Предварительный анализ ПЭС-скДНК профилей от 3 пациентов с рецидивом показал высокую степень соответствия между специфическими для пациента вариантами, идентифицированными при биопсии опухоли и в плазме. При ПЭС плазмы также были идентифицированы 34 из 35 вариантов, обнаруженных Signatera, и они продемонстрировали высококонкордантные частоты вариантных аллелей (ЧВА). Один вариант, который не был обнаружен ПЭС-скДНК, ранее был обнаружен Signatera при 0,2% ЧВА.
[1060] ВЫВОДЫ
[1061] Эти примеры показали, что ПЭС плазмы может обнаруживать молекулярную остаточную болезнь у пациентов с первичным раком молочной железы. Анализ плазмы при ПЭС потенциально свидетельствует об эволюции рака, что может быть важно для принятия решения о лечении.
[1062] Пример 12. Использование циркулирующей опухолевой ДНК (цоДНК) в качестве молекулярного биомаркера для оценки ответа на лечение при лимфоме.
[1063] Здесь, в пилотном биофармацевтическом исследовании, мы оценивали потенциал персонализированного, специфичного для опухоли, мультиплексного подхода на основе ССП-ПЦР (Signatera ™) для обнаружения цоДНК в ходе режима лечения пациентов, чтобы сопоставить наличие цоДНК с общим клиническим ответом в когорте с неходжкинской лимфомой (НХЛ).
[1064] СПОСОБЫ
[1065] Для анализа цоДНК были доступны образцы крови, взятые у 8 пациентов с неходжкинской лимфомой (НХЛ) (6 диффузных больших В-клеточных лимфом и 2 фолликулярные лимфомы). Соматические варианты, специфичные для пациента, были идентифицированы путем анализа данных полноэкзомного секвенирования (ПЭС) из биопсии первичной опухоли и соответствующих нормальных образцов. Затем образцы плазмы были проанализированы слепым способом с помощью соответствующих индивидуальных 16-плексных анализов с использованием рабочего процесса Signatera. Образцы считались цоДНК-положительными, если по меньшей мере два целевых показателей для конкретного пациента соответствовали квалификационному порогу доверительной оценки.
[1066] РЕЗУЛЬТАТЫ
[1067] Для неходжкинской лимфомы (НХЛ) из 2,5 мл (медиана) плазмы было извлечено 14,9 нг (медиана) (диапазон 2,25-685 нг) скДНК. цоДНК была обнаружена в 5 временных точках плазмы у 4 пациентов. Из 5 образцов плазмы цоДНК+ 4 образца плазмы коррелировали либо с клинически прогрессирующим заболеванием, либо с частичным ответом на терапию при заборе крови. У 4 пациентов без обнаружения цоДНК в любой момент времени при заборе крови был выявлен полный клинический ответ.
[1068] ВЫВОДЫ
[1069] Масштабируемый анализ мониторинга цоДНК для конкретного пациента может применяться для определения исходного уровня, мониторинга терапии и выявления рецидивов. Высокочувствительный анализ обнаружения цоДНК компании Signatera обеспечивает неинвазивные средства контроля над текущими стандартами лечения.
название | год | авторы | номер документа |
---|---|---|---|
ОБНАРУЖЕНИЕ МУТАЦИЙ И ПЛОИДНОСТИ В ХРОМОСОМНЫХ СЕГМЕНТАХ | 2015 |
|
RU2717641C2 |
СПОСОБЫ ВЫЯВЛЕНИЯ РАКА ЛЕГКОГО | 2017 |
|
RU2760913C2 |
СПОСОБЫ И КОМПОЗИЦИИ ДЛЯ ВЫСОКОМУЛЬТИПЛЕКСНОЙ ПЦР | 2012 |
|
RU2650790C2 |
СПОСОБЫ НЕИНВАЗИВНОГО ПРЕНАТАЛЬНОГО УСТАНОВЛЕНИЯ ПЛОИДНОСТИ | 2011 |
|
RU2671980C2 |
СПОСОБЫ НЕИНВАЗИВНОГО ПРЕНАТАЛЬНОГО УСТАНОВЛЕНИЯ ОТЦОВСТВА | 2011 |
|
RU2620959C2 |
ПРОГНОЗИРОВАНИЕ ПРОГРЕССИРОВАНИЯ ВОЗРАСТНОЙ МАКУЛОДИСТРОФИИ ДО ПОЗДНЕЙ СТАДИИ С ПОМОЩЬЮ ПОЛИГЕННОГО ПОКАЗАТЕЛЯ | 2011 |
|
RU2593954C2 |
Способ выявления мутации p.L265P в гене MYD88 | 2020 |
|
RU2756909C1 |
МУТАЦИИ ГЕНА МТS В ЗАРОДЫШЕВОЙ ЛИНИИ И СПОСОБ ВЫЯВЛЕНИЯ ПРЕДРАСПОЛОЖЕННОСТИ К ЗЛОКАЧЕСТВЕННЫМ ОПУХОЛЯМ В ГЕНЕ МТS | 1995 |
|
RU2161309C2 |
Способ преимплантационного генетического тестирования наследственных множественных остеохондром типа 1 | 2022 |
|
RU2795824C1 |
Способ определения нуклеотидных последовательностей экзонов генов BRCA1 и BRCA2 | 2015 |
|
RU2612894C1 |
Изобретение относится к биотехнологии. Описан способ мониторинга и обнаружения минимального остаточного заболевания рака молочной железы, а также способ мониторинга и обнаружения раннего рецидива или метастазирования колоректального рака. Заявленные способы предусматривают использование высокопроизводительного секвенирования с глубиной считывания не менее 100000 на ампликон и обнаружение двух или более специфичных для пациента однонуклеотидных вариантов выше порога достоверности 0,97. Изобретение расширяет арсенал средств диагностики рака молочной железы. 2 н. и 44 з.п. ф-лы, 100 ил., 18 табл., 12 пр.
1. Способ мониторинга и обнаружения минимального остаточного заболевания рака молочной железы, включающий:
выбор набора из по меньшей мере 16 локусов однонуклеотидных вариантов, специфичных для пациента, на основе соматических мутаций, обнаруженных в образце опухоли пациента, у которого был диагностирован рак молочной железы;
отбор в динамике одного или более образцов крови или мочи у пациента после того, как пациент подвергся химиотерапии, лучевой терапии, иммунотерапии, трансплантации стволовых клеток, трансплантации костного мозга, фотодинамической терапии, паллиативному лечению, хирургическому вмешательству и/или химиотерапии первой линии;
получение набора ампликонов путем проведения реакции мультиплексной амплификации на нуклеиновых кислотах, выделенных из каждого образца крови или мочи или их фракции, где каждый ампликон из набора ампликонов охватывает по меньшей мере один локус однонуклеотидного варианта из набора специфичных для пациента локусов однонуклеотидных вариантов, связанных с раком молочной железы; и
выполнение высокопроизводительного секвенирования для определения последовательности по меньшей мере сегмента каждого ампликона из набора ампликонов, который содержит специфичный для пациента локус однонуклеотидного варианта,
при этом высокопроизводительное секвенирование выполняется с глубиной считывания не менее 100000 на ампликон и обнаружением двух или более специфичных для пациента однонуклеотидных вариантов выше порога достоверности 0,97,
при этом обнаружение двух или более специфичных для пациента однонуклеотидных вариантов выше порога достоверности 0,97 в образце крови указывает на циркулирующую опухолевую ДНК (цДНК) и наличие минимального остаточного заболевания, при этом способ имеет специфичность не менее 99,5% при выявлении минимального остаточного заболевания рака молочной железы.
2. Способ по п. 1, отличающийся тем, что способ выявляет специфичные для пациента однонуклеотидные варианты по меньшей мере у 95% пациентов, имеющих ранний рецидив или метастазирование HER2+ рака молочной железы.
3. Способ по п. 1, отличающийся тем, что способ выявляет специфичные для пациента однонуклеотидные варианты по меньшей мере у 95% пациентов с ранним рецидивом или метастазированием трижды негативного рака молочной железы.
4. Способ по п. 1, отличающийся тем, что способ выявляет специфичные для пациента однонуклеотидные варианты по меньшей мере у 80% пациентов с ранним рецидивом или метастазированием рака молочной железы HR+/HER2-.
5. Способ по п. 1, отличающийся тем, что способ выявляет однонуклеотидные варианты, специфичные для пациента, у пациентов с ранним рецидивом или метастазированием рака молочной железы по меньшей мере за 200 дней до клинического рецидива или метастазирования рака молочной железы, обнаруживаемого с помощью визуализации, и/или по меньшей мере за 100 дней до повышения уровня CA15-3.
6. Способ по п. 1, отличающийся тем, что способ выявляет специфичные для пациента однонуклеотидные варианты у пациентов с ранним рецидивом или метастазированием рака молочной железы HER2+ по меньшей мере за 150 дней до клинического рецидива или метастазирования рака молочной железы HER2+, обнаруживаемого с помощью визуализации, и/или по меньшей мере за 100 дней до повышения уровня CA15-3.
7. Способ по п. 1, отличающийся тем, что способ выявляет специфичные для пациента однонуклеотидные варианты у пациентов с ранним рецидивом или метастазированием трижды негативного рака молочной железы по меньшей мере за 200 дней до клинического рецидива или метастазирования трижды негативного рака молочной железы, обнаруживаемого с помощью визуализации, и/или по меньшей мере за 100 дней до повышения уровня CA15-3.
8. Способ по п. 1, отличающийся тем, что способ выявляет специфичные для пациента однонуклеотидные варианты у пациентов с ранним рецидивом или метастазированием рака молочной железы HR+/HER2- по меньшей мере за 250 дней до клинического рецидива или метастазирования рака молочной железы HR+/HER2-, определяемого с помощью визуализации, и/или по меньшей мере за 100 дней до повышения уровня СА15-3.
9. Способ по п. 1, отличающийся тем, что способ выявляет отсутствие специфичных для пациента однонуклеотидных вариантов по меньшей мере у 99% пациентов без раннего рецидива или метастазирования рака молочной железы.
10. Способ по п. 1, отличающийся тем, что способ выявляет отсутствие специфичных для пациента однонуклеотидных вариантов по меньшей мере у 99% пациентов без раннего рецидива или метастазирования рака молочной железы HER2+.
11. Способ по п. 1, отличающийся тем, что способ выявляет отсутствие специфичных для пациента однонуклеотидных вариантов по меньшей мере у 99% пациентов без раннего рецидива или метастазирования трижды негативного рака молочной железы.
12. Способ по п. 1, отличающийся тем, что способ выявляет отсутствие специфичных для пациента однонуклеотидных вариантов по меньшей мере у 99% пациентов без раннего рецидива или метастазирования рака молочной железы HR+/HER2-.
13. Способ по п. 1, отличающийся тем, что способ имеет специфичность по меньшей мере 99,5% при обнаружении раннего рецидива или метастазирования HER2+ рака молочной железы, когда два или более специфичных для пациента однонуклеотидных варианта обнаруживают выше порога достоверности 0,97.
14. Способ по п. 1, отличающийся тем, что способ имеет специфичность по меньшей мере 99,5% при обнаружении раннего рецидива или метастазирования трижды негативного рака молочной железы, когда два или более специфичных для пациента однонуклеотидных варианта обнаруживают выше порога достоверности 0,97.
15. Способ по п. 1, отличающийся тем, что имеет специфичность по меньшей мере 99,5% в обнаружении раннего рецидива или метастазирования рака молочной железы HR+/HER2-, когда два или более специфичных для пациента однонуклеотидных варианта обнаруживают выше порога достоверности 0,97.
16. Способ мониторинга и обнаружения раннего рецидива или метастазирования колоректального рака, включающий:
отбор в динамике одного или более образцов крови от пациента, который подвергается лечению колоректального рака;
получение набора ампликонов путем выполнения реакции мультиплексной амплификации нуклеиновых кислот, выделенных из образца крови или их фракции от пациента, получавшего лечение от колоректального рака, где каждый ампликон из набора ампликонов охватывает по меньшей мере один локус однонуклеотидного варианта набора специфичных для пациента локусов однонуклеотидных вариантов, связанных с колоректальным раком; и
выполнение высокопроизводительного секвенирования для определения последовательности по меньшей мере сегмента каждого ампликона из набора ампликонов, который содержит специфичный для пациента локус однонуклеотидного варианта, при этом высокопроизводительное секвенирование выполняется с глубиной считывания не менее 100000 на ампликон и обнаружением двух или более специфичных для пациента однонуклеотидных вариантов выше порога достоверности 0,97, при этом обнаружение двух или более однонуклеотидных вариантов, специфичных для пациента выше порога достоверности 0,97, указывает на циркулирующую опухолевую ДНК (цДНК) и ранний рецидив или метастазирование колоректального рака, где наличие двух или более специфичных для пациента однонуклеотидных вариантов позволяет выявить ранний рецидив или метастазирование колоректального рака у пациента с раком с упреждением не менее 8,7 месяцев по сравнению с клиническим рецидивом или метастазированием рака, обнаруживаемым с помощью изображений рентгенографии, и/или повышением уровня СЕА.
17. Способ по п. 16, отличающийся тем, что нуклеиновые кислоты выделяют из опухоли пациента и соматические мутации идентифицируют в опухоли для набора специфичных для пациента локусов однонуклеотидных вариантов перед определением последовательности по меньшей мере сегмента каждого ампликона из набора ампликонов для образца крови или их фракции.
18. Способ по п. 16, отличающийся тем, что обнаруживают по меньшей мере 5 ОНВ и где присутствие по меньшей мере 5 ОНВ указывает на циркулирующую опухолевую ДНК (цДНК) и ранний рецидив или метастазирование колоректального рака.
19. Способ по п. 16, отличающийся тем, что индивидуум подвергался хирургическому лечению до выделения образца крови.
20. Способ по п. 16, отличающийся тем, что индивидуум подвергался лечению химиотерапией до выделения образца крови.
21. Способ по п. 16, отличающийся тем, что индивидуум подвергался лечению радиотерапией до выделения образца крови.
22. Способ по п. 16, отличающийся тем, что индивидуум подвергался лечению адъювантной терапией до выделения образца крови.
23. Способ по п. 16, отличающийся тем, что способ дополнительно включает введение индивидууму соединения, когда известно, что соединение является специфически эффективным при лечении колоректального рака, имеющего один или более из определенных однонуклеотидных вариантов.
24. Способ по п. 16, отличающийся тем, что способ дополнительно включает определение частоты вариантного аллеля для каждого из однонуклеотидных вариантов на основе определения последовательности.
25. Способ по п. 1, отличающийся тем, что план лечения рака молочной железы определяют на основании определений частоты вариантного аллеля.
26. Способ по п. 16, отличающийся тем, что способ дополнительно включает введение индивидууму соединения, когда известно, что соединение особенно эффективно при лечении колоректального рака, имеющего один из однонуклеотидных вариантов с частотой вариабельных аллелей, превышающей по меньшей мере половину других определенных однонуклеотидных вариантов.
27. Способ по п. 16, отличающийся тем, что последовательность определяют путем высокопроизводительного секвенирования ДНК множества локусов однонуклеотидных вариаций.
28. Способ по п. 16, отличающийся тем, что способ дополнительно включает обнаружение клонального однонуклеотидного варианта при колоректальном раке, путем определения частоты вариантного аллеля для каждого из локусов ОНВ на основе секвенирования множества копий серии ампликонов, где более высокая относительная частота аллеля по сравнению с другими однонуклеотидными вариантами множества локусов однонуклеотидных вариантов указывает на клональный однонуклеотидный вариант при колоректальном раке.
29. Способ по п. 28, отличающийся тем, что способ дополнительно включает введение индивидууму соединения, нацеленного на один или более клональных однонуклеотидных вариантов, но не на другие однонуклеотидные варианты.
30. Способ по п. 28, отличающийся тем, что частота вариантного аллеля более 1,0% указывает на клональный однонуклеотидный вариант.
31. Способ по п. 16, отличающийся тем, что способ дополнительно включает формирование реакционной смеси амплификации путем объединения полимеразы, нуклеотидтрифосфатов, фрагментов нуклеиновых кислот из библиотеки нуклеиновых кислот, созданной из образца, и набора праймеров, каждый из которых связывает в пределах 150 пар оснований локусов однонуклеотидного варианта, или набора пар праймеров, каждый из которых охватывает область из 160 пар оснований или менее, содержащих локусы однонуклеотидного варианта, и
подвергание реакционной смеси амплификации условиям амплификации для создания набора ампликонов.
32. Способ по любому из пп. 16-31, отличающийся тем, что определение того, присутствует ли однонуклеотидный вариант в образце, включает определение значения достоверности для каждого определения аллеля в каждом из набора локусов однонуклеотидных вариаций на основе, по меньшей мере частично, глубины считывания для локусов.
33. Способ по любому из пп. 16-31, отличающийся тем, что набор локусов однонуклеотидных вариаций содержит все локусы однонуклеотидных вариаций, идентифицированные в наборах данных TCGA и COSMIC, для колоректального рака.
34. Способ по любому из пп. 16-31, отличающийся тем, что набор сайтов однонуклеотидных вариаций содержит все сайты однонуклеотидных вариаций, идентифицированные в наборах данных TCGA и COSMIC, для колоректального рака.
35. Способ по любому из пп. 16-31, отличающийся тем, что набор локусов однонуклеотидных вариантов содержит от 25 до 1000 локусов однонуклеотидных вариаций, которые, как известно, связаны с колоректальным раком.
36. Способ по любому из пп. 16-31, отличающийся тем, что эффективность и частоту ошибок на цикл определяют для каждой реакции амплификации мультиплексной реакции амплификации локусов однонуклеотидных вариаций, а эффективность и частоту ошибок используют для определения наличия однонуклеотидного варианта в наборе локусов однонуклеотидных вариантов в образце.
37. Способ по любому из пп. 16-31, отличающийся тем, что реакция амплификации представляет собой реакцию ПЦР, а температура отжига на 1-15 °C выше, чем температура плавления по меньшей мере 50% праймеров из набора праймеров.
38. Способ по любому из пп. 16-31, отличающийся тем, что реакция амплификации представляет собой реакцию ПЦР, а продолжительность стадии отжига в реакции ПЦР составляет от 15 до 120 минут.
39. Способ по любому из пп. 16-31, отличающийся тем, что реакция амплификации представляет собой реакцию ПЦР, а продолжительность стадии отжига в реакции ПЦР составляет от 15 до 120 минут.
40. Способ по любому из пп. 16-31, отличающийся тем, что концентрация праймера в реакции амплификации составляет от 1 до 10 нМ.
41. Способ по любому из пп. 16-31, отличающийся тем, что праймеры в наборе праймеров предназначены для минимизации образования димера праймера.
42. Способ по любому из пп. 16-31, отличающийся тем, что реакция амплификации представляет собой реакцию ПЦР, температура отжига на 1-15 °C выше, чем температура плавления по меньшей мере 50% праймеров набора праймеров, продолжительность стадии отжига в реакции ПЦР составляет от 15 до 120 минут, концентрация праймера в реакции амплификации составляет от 1 до 10 нМ, а праймеры в наборе праймеров предназначены для минимизации образования димера праймера.
43. Способ по любому из пп. 16-31, отличающийся тем, что реакцию мультиплексной амплификации проводят в условиях ограничивающего праймера.
44. Способ по любому из пп. 1-15, дополнительно включающий полноэкзомное секвенирование образца опухоли пациента для обнаружения соматических мутаций, связанных с раком молочной железы, и отбор набора из по меньшей мере 16 специфичных для пациента локусов однонуклеотидных вариантов, соответствующих соматическим мутациям, обнаруженным в образце опухоли.
45. Способ по любому из пп. 16-43, включающий отбор набора из по меньшей мере 16 специфичных для пациента локусов однонуклеотидных вариантов на основе соматических мутаций, обнаруженных в образце опухоли пациента, у которого диагностирован колоректальный рак.
46. Способ по п. 45, дополнительно включающий полноэкзомное секвенирование образца опухоли пациента для обнаружения соматических мутаций, связанных с колоректальным раком, и обор набора из по меньшей мере 16 специфичных для пациента локусов однонуклеотидных вариантов, соответствующих соматическим мутациям, обнаруженным в образце опухоли.
Ng, S., Chua, C., Ng, M | |||
et al | |||
Individualised multiplexed circulating tumour DNA assays for monitoring of tumour presence in patients after colorectal cancer surgery | |||
Способ восстановления хромовой кислоты, в частности для получения хромовых квасцов | 1921 |
|
SU7A1 |
Francesca Riva et al, Patient-Specific Circulating Tumor DNA Detection during Neoadjuvant Chemotherapy in Triple-Negative Breast Cancer, Clinical |
Авторы
Даты
2024-01-12—Публикация
2019-04-12—Подача