Ссылка на родственные заявки
По настоящей заявке испрашивается приоритет по дате подачи предварительной заявки на выдачу патента США №61/426208, которая была подана 22 декабря 2010 г., и настоящая заявка является частично продолжающейся заявкой на выдачу патента США на изобретение с серийным №13/300235, которая была подана 18 ноября 2011 г., по которой испрашивается приоритет предварительной заявки на выдачу патента США №61/571248, которая была подана 23 июня 2011 г.; предварительной заявки на выдачу патента США №61/542508, которая была подана 3 октября 2011 г.; и является частично продолжающейся заявкой на выдачу патента США на изобретение с серийным №13/110685, которая была подана 18 мая 2011 г., по которой испрашивается приоритет по дате подачи предварительной заявки на выдачу патента США №61/395850, которая была подана 18 мая 2010 г.; предварительной заявки на выдачу патента США №61/398159, которая была подана 21 июня 2010 г.; предварительной заявки на выдачу патента США №61/462972, которая была подана 9 февраля 2011 г.; предварительной заявки на выдачу патента США №61/448547, которая была подана 2 марта 2011 г.; а также предварительной заявки на выдачу патента США №61/516996, которая была подана 12 апреля 2011 г., и все эти заявки во всей их полноте тем самым включены в настоящий документ посредством ссылки на все их идеи.
Область техники, к которой относится настоящее изобретение
Настоящее раскрытие по сути относится к способам неинвазивного пренатального установления отцовства.
Предшествующий уровень техники настоящего изобретения
Неопределенное отцовство является существенной проблемой, и по оценкам у 4%-10% детей их предполагаемый будущий биологический отец не является фактическим биологическим отцом. В случаях, когда женщина беременна, но релевантные лица не уверены, кто является биологическим отцом, используют несколько вариантов определения истинного биологического отца плода. Один способ заключается в ожидании рождения, проведении генетического фингерпринтинга ребенка и сравнении генетического фингерпринта генома ребенка с таковым предполагаемых отцов. Однако мать часто желает знать, кто биологический отец ее ребенка, при беременности. Другой способ заключается в проведении пробы ворсинчатого хориона в первом триместре или амниоцентеза во втором триместре беременности, а также в использовании генетического материала, полученного для проведения генетического фингерпринтинга пренатально. Однако эти способы являются инвазивными и несут существенный риск самопроизвольного аборта.
Недавно было обнаружено, что плодная бесклеточная ДНК (cfDNA) и интактные плодные клетки могут попадать в кровоток матери. Следовательно, анализ этого плодного генетического материала может обеспечить раннюю неинвазивную пренатальную генетическую диагностику (NIPGD или NPD). Одной из основных задач при выполнении NIPGD на плодных клетках является задача идентификации и извлечения плодных клеток или нуклеиновых кислот из крови матери. Концентрация плодных клеток в крови матери зависит от стадии беременности и состояния плода, но по оценкам варьирует от одной до сорока плодных клеток на каждый миллилитр крови матери или менее одной плодной клетки на 100000 материнских ядросодержащих клеток. Современными методиками можно выделить небольшие количества плодных клеток из крови матери, хотя трудно приумножить плодные клетки для очистки в любом количестве. Наиболее эффективная методика в этом отношении предусматривает применение моноклональных антител, но другие методики, используемые для выделения плодных клеток, предусматривают центрифугирование в градиенте плотности, селективный лизис взрослых эритроцитов и FACS. Одна из основных проблем выполнения NIPGD на плодной cfDNA заключается в том, что, как правило, она смешана с материнской cfDNA, и, таким образом, анализ cfDNA затруднен необходимостью учета материнского генотипического сигнала. Анализ плодной ДНК был продемонстрирован с помощью ПЦР-амплификации с использованием праймеров, которые предназначены для гибридизации с последовательностями, которые являются специфичными к унаследованным от отца генам. Эти источники плодного генетического материала открывают двери методикам неинвазивной пренатальной диагностики.
Как только плодная ДНК выделена, либо в чистом виде, либо в смеси, ее можно амплифицировать. Существует ряд способов, доступных для полногеномной амплификации (WGA): опосредованная лигированием ПЦР (LM-PCR), ПЦР с вырожденными олигонуклеотидными праймерами (DOP-PCR) и амплификация с множественным вытеснением цепи (MDA). Существует ряд способов, доступных для целевой амплификации, в том числе ПЦР и зонды циркуляризации, такие как молекулярные инверсионные зонды (MIP) и зонды, замыкающиеся в кольцо при лигировании. Существуют и другие способы, которые могут быть использованы для предпочтительного приумножения плодной ДНК, такие как разделение по размерам и зонды гибридного захвата.
Существует многочисленные трудности в использовании амплификации ДНК в этих контекстах. Амплификация ДНК отдельной клетки, ДНК из небольшого числа клеток или от больших количеств ДНК с помощью ПЦР может полностью потерпеть неудачу. Это часто происходит из-за загрязнения ДНК, потери клетки, ее ДНК или доступности ДНК в ходе реакции амплификации. Другие погрешности, которые могут возникнуть при измерении плодной ДНК путем амплификации и микроматричного анализа, включают транскрипционные ошибки, введенные ДНК-полимеразой, когда конкретный нуклеотид неправильно скопирован в ходе ПЦР, и ошибки считывания микроматрицы из-за нарушенной гибридизации на матрице. Другой проблемой является выпадение одного аллеля (ADO), которое определяется как невозможность амплификации одного из двух аллелей в гетерозиготных клетках.
Существует множество методик, которые обеспечивают данные генотипирования. Некоторые примеры предусматривают следующее. TAQMAN - уникальная технология генотипирования, разработанная и распространяемая LIFE TECHNOLOGY. В TAQMAN применяется полимеразная цепная реакция (ПЦР) для амплификации представляющих интерес последовательностей. Системы 500К ARRAYS от AFFYMETRIX и INFINIUM от ILLUMINA являются матрицами генотипирования, которые выявляют присутствие специфичных последовательностей ДНК при большом числе локализаций одновременно. HISEQ и MISEQ от ILLUMINA, а также платформы ION TORRENT и SOLID от LIFE TECHNOLOGY позволяют непосредственно секвенировать большое число отдельных последовательностей ДНК.
Краткое раскрытие настоящего изобретения
В настоящем документе раскрываются способы определения отцовства вынашиваемого плода неинвазивным путем. Согласно проиллюстрированным в настоящем документе аспектам в одном варианте осуществления способ установления того, является ли предполагаемый отец биологическим отцом плода, который вынашивается беременной матерью, предусматривает получение генетического материала от предполагаемого отца, получение образца крови от беременной матери, осуществление генотипических определений во множестве полиморфных локусов в генетическом материале от предполагаемого отца, получение генотипических определений во множестве полиморфных локусов из генетического материала от беременной матери, осуществление генотипических определений в смешанном образце ДНК, происходящей из образца крови от беременной матери, если смешанный образец ДНК содержит плодную ДНК и материнскую ДНК, определение на компьютере вероятности того, что предполагаемый отец является биологическим отцом плода, вынашиваемого беременной матерью, с использованием генотипических определений, выполненных из ДНК от предполагаемого отца, генотипических определений, полученных от беременной матери, и генотипических определений, выполненных в смешанном образце ДНК, и установление того, что предполагаемый отец является биологическим отцом плода, с использованием установленной вероятности того, что предполагаемый отец является биологическим отцом плода.
В варианте осуществления полиморфные локусы содержат однонуклеотидные полиморфизмы. В варианте осуществления смешанный образец ДНК содержит ДНК, которая происходит от свободно плавающей ДНК в плазменной фракции образца крови от беременной матери. В варианте осуществления смешанный образец ДНК содержит материнскую цельную кровь или фракцию крови матери, содержащей ядросодержащие клетки. В варианте осуществления фракцию крови матери, содержащую ядросодержащие клетки, обогащали клетками плодного происхождения.
В одном варианте осуществления определение того, что предполагаемый отец является биологическим отцом, предусматривает вычисление тестовой статистики для предполагаемого отца и плода, в котором тестовая статистика показывает степень генетического сходства между предполагаемым отцом и плодом, и в котором тестовая статистика основывается на генотипических измерениях, выполненных в ДНК от предполагаемого отца, генотипических измерениях, выполненных на смешанных образцах ДНК, и генотипических измерениях, выполненных в ДНК от беременной матери, вычисление распределения тестовой статистики для множества индивидуумов, которые не являются генетически родственными плоду, если каждая рассчитанная тестовая статистика показывает степень генетического сходства между неродственным индивидуумом из множества индивидуумов, которые не являются родственными плоду, и плодом, причем тестовая статистика основывается на генотипических измерениях, выполненных в ДНК от неродственного индивидуума, генотипических измерениях, выполненных в смешанном образце ДНК, и генотипических измерениях, полученных в ДНК от беременной матери, вычисление вероятности того, что тестовая статистика, рассчитанная для предполагаемого отца и плода находится в пределах распределения тестовой статистики, рассчитанной для множества неродственных индивидуумов и плода, и определение вероятности того, что предполагаемый отец является биологическим отцом плода, с использованием вероятности того, что тестовая статистика, рассчитанная для предполагаемого отца, находится в пределах распределения тестовой статистики, рассчитанной для множества неродственных индивидуумов и плода. В варианте осуществления установление того, является ли предполагаемый отец биологическим отцом плода, также предусматривает установление того, что предполагаемый отец является биологическим отцом плода, путем отклонения гипотезы, что предполагаемый отец не является родственным плоду, если вероятность того, что предполагаемый отец является биологическим отцом плода, является выше верхнего порога, или установление того, что предполагаемый отец не является биологическим отцом плода путем неотклонения гипотезы, что предполагаемый отец не является родственным плоду, если вероятность того, что предполагаемый отец является биологическим отцом плода, ниже нижнего порога, или неустановление того, является ли предполагаемый отец биологическим отцом плода,если правдоподобие находится между нижним порогом и верхним порогом, или если правдоподобие не было установлено с достаточно высокой достоверностью.
В варианте осуществления определение вероятности того, что предполагаемый отец является биологическим отцом плода, предусматривает получение популяционных частот аллелей для каждого локуса во множестве полиморфных локусов, обеспечение разделения возможных фракций плодной ДНК в смешанном образце ДНК, что варьирует от нижнего предела плодной фракции до верхнего предела плодной фракции, вычисление вероятности того, что предполагаемый отец является биологическим отцом плода, с учетом генотипических определений по ДНК от матери, генотипических определений, выполненных в ДНК от предполагаемого отца, генотипических определений, выполненных в смешанном образце ДНК, для каждого из возможных плодных фракций в разделении, определение вероятности того, что предполагаемый отец является биологическим отцом плода, путем объединения рассчитанных вероятностей того, что предполагаемый отец является биологическим отцом плода, для каждого из возможных плодных фракций в разделении, вычисление вероятности того, что предполагаемый отец не является биологическим отцом плода, с учетом генотипических определений, выполненных в ДНК от матери, генотипических определений, выполненных в смешанном образце ДНК, полученных популяционных частот аллелей; для каждой из возможных плодных фракций в разделении, и определение вероятности того, что предполагаемый отец не является биологическим отцом плода, путем объединения рассчитанных вероятностей того, что предполагаемый отец не является биологическим отцом плода, для каждой из возможных плодных фракций в разделении.
В варианте осуществления вычисления вероятности того, что предполагаемый отец является биологическим отцом плода, и вычисление вероятности того, что предполагаемый отец не является биологическим отцом плода, также может предусматривать вычисление для каждого из множества полиморфных локусов правдоподобия наблюдаемых данных последовательности в конкретном локусе с использованием модели зависимости от платформы, одной или нескольких фракций в возможном разделении плодных фракций, множества аллельных отношений для матери, множества аллельных отношений для предполагаемого отца и множества отношений аллелей для плода, вычисление правдоподобия того, что предполагаемыйотец является биологическим отцом, путем объединения правдоподобия наблюдаемых данных последовательностей в каждом полиморфном локусе по всем плодным фракциям в разделении, по аллельным отношениям матери в наборе полиморфных локусов, по аллельным отношениям предполагаемого отца в наборе полиморфных локусов и по плодным аллельным отношениям в наборе полиморфных локусов, вычисление правдоподобия того, что предполагаемый отец не является биологическим отцом, путем объединения правдоподобия наблюдаемых данных последовательности в каждом полиморфном локусе по всем плодным фракциям в разделении, по аллельным отношениям матери в наборе полиморфных локусов, по популяционным частотам для набора полиморфных локусов и по плодным аллельным отношениям в наборе полиморфных локусов, вычисление правдоподобия того, что предполагаемый отец является биологическим отцом, на основе вероятности того, что предполагаемый отец является биологическим отцом, и вычисление правдоподобия того, что предполагаемый отец не является биологическим отцом, на основе вероятности того, что предполагаемый отец не является биологическим отцом.
В одном варианте осуществления вычисление вероятности того, что предполагаемый отец является биологическим отцом, на основе правдоподобия того, что предполагаемый отец является биологическим отцом, выполняется с использованием оценки максимального правдоподобия или метода максимальной апостериорной гипотезы. В варианте осуществления установление того, является ли предполагаемый отец биологическим отцом плода, также может предусматривать установление того, что предполагаемый отец является биологическим отцом, если рассчитанная вероятность того, что предполагаемый отец является биологическим отцом плода, существенно больше рассчитанной вероятности того, что предполагаемый отец не является биологическим отцом, или установление того, что предполагаемый отец не является биологическим отцом плода, если рассчитанная вероятность того, что предполагаемый отец является биологическим отцом, существенно больше рассчитанной вероятности того, что предполагаемый отец не является биологическим отцом. В варианте осуществления полиморфные локусы соответствуют хромосомам с высоким правдоподобием того, что они являются дисомными.
В варианте осуществления разделение возможных фракций плодной ДНК содержит только одну плодную фракцию, и при этом плодная фракция определена с помощью методики из перечня, состоящего из количественной ПЦР, цифровой ПЦР, целевой ПЦР, зондов циркуляризации, других способов амплификации ДНК, захвата гибридизационными зондами, других способов предпочтительного приумножения, микроматриц SNP, микроматриц ДНК, секвенирования, других методик для измерения полиморфных аллелей, других методик для измерения неполиморфных аллелей, измерение полиморфных аллелей, которые присутствуют в геноме отца, но не присутствуют в геноме матери, измерение неполиморфных аллелей, которые присутствуют в геноме отца, но не присутствуют в геноме матери, измерение аллелей, которые являются специфичными по отношению к Y-хромосоме, сравнение измеренного количества унаследованных от отца аллелей с измеренным количеством унаследованных от матери аллелей, максимально правдоподобных оценок, методов максимальной апостериорной гипотезы и их комбинаций. В варианте осуществления способа по п. 1 разделение возможных плодных фракций содержит только одну плодную фракцию, и плодная фракция определена с помощью способ по п. 26.
В варианте осуществления генетический материал предполагаемого отца получается из ткани, выбранной из группы, состоящей из крови, соматической ткани, спермы, волоса, буккального образца, кожи, других экспертных образцов и их комбинаций. В варианте осуществления достоверность вычисляется для установленного определения того, что предполагаемый отец является биологическим отцом плода. В варианте осуществления фракцию плодной ДНК в смешанном образце ДНК приумножают с использованием способа, выбранного из группы, состоящей из отбора по размеру, универсальной опосредованной лигированием ПЦР, ПЦР с коротким временем удлинения, других способов приумножения и их комбинаций.
В варианте осуществления получение генотипических определений из генетического материала беременной матери может предусматривать осуществление генотипических определений в образце генетического материала от беременной матери, который состоит в основном из материнского генетического материала. В варианте осуществления получение генотипических определений из генетического материала от беременной матери может предусматривать заключение о том, что генотипические измерения из генотипических определений, выполненных в смешанном образце ДНК, вероятно относятся к генетическому материалу от беременной матери, и использование таких генотипических определений, которые согласно заключению относятся к генетическому материалу от матери, в виде полученных генотипических определений. В варианте осуществления способ также может предусматривать осуществление клинического решения на основе определения установленного отцовства. В варианте осуществления клиническим решением является прекращение беременности.
В варианте осуществления получение генотипических определений может быть выполнено путем измерения генетического материал с использованием методики или технологии, выбранной из группы, состоящей из зондов, замыкающихся в кольцо при лигировании, молекулярных инверсионных зондов, других зондов циркуляризации, микроматриц генотипирования, анализов генотипирования SNP, микроматриц на основе чипа, микроматриц на основе гранул, других микроматриц SNP, других способов генотипирования, секвенирования ДНК по методу Сэнгера, пиросеквенирования, высокопроизводительного секвенирования, целевого секвенирования с использованием зондов циркуляризации, целевого секвенирования с использованием захвата гибридизационными зондами, секвенирования с обратимой терминацией с использованием красителей, секвенирования с помощью лигирования, секвенирования с помощью гибридизации, других способов секвенирования ДНК, других высокопроизводительных платформ генотипирования, флуоресцентной in situ гибридизации (FISH), сравнительной геномной гибридизации (CGH), матричной CGH, а также их групп или комбинаций.
В варианте осуществления получение генотипических определений может быть выполнено на генетическом материале, который амплифицируют и/или предпочтительно приумножают до измерения с использованием методики или технологии, которая выбрана из группы, состоящей из полимеразной цепной реакции (ПЦР), опосредованной лигандом ПЦР, ПЦР с вырожденными олигонуклеотидными праймерами, целевой амплификации, ПЦР, мини-ПЦР, универсальной ПЦР-амплификации, амплификации с множественным вытеснением цепи (MDA), специфичной по отношению к аллелям ПЦР, методик специфичной по отношению к аллелям амплификации, способов линейной амплификации, лигирования субстратной ДНК с последующим другим способом амплификации, мостиковой амплификации, зондов, замыкающихся в кольцо при лигировании, зондов циркуляризации, захвата гибридизационными зондами и их комбинаций.
В варианте осуществления способ также может предусматривать создание отчета, содержащего установленное отцовство плода. В варианте осуществления настоящее изобретение может предусматривать отчет, раскрывающий установленное отцовство плода, полученное с использованием описанного в настоящем документе способа.
В настоящем документе раскрываются способы определения фракции ДНК, полученной от целевого индивидуума, присутствующей в смеси ДНК, которая содержит ДНК от целевого индивидуума, и также ДНК по меньшей мере от одного другого индивидуума. Согласно проиллюстрированным в настоящем документе аспектам в варианте осуществления способ определения фракции ДНК от целевого индивидуума, присутствующей в смешанном образце ДНК, который содержит ДНК от целевого индивидуума и ДНК от второго индивидуума, может предусматривать осуществление генотипических определений во множестве полиморфных локусов из смешанного образца ДНК, получение генотипических данных во множестве полиморфных локусов от второго индивидуума и определение на компьютере фракции ДНК от целевого индивидуума, присутствующей в смешанном образце, с использованием генотипических определений в смешанном образце ДНК, генотипических данных от второго индивидуума и методик вероятностной оценки.
В варианте осуществления получение генотипических данных от второго индивидуума предусматривает осуществление генетических измерений в ДНК, которая в основном состоит из ДНК от второго индивидуума. В варианте осуществления получение генотипических данных от второго индивидуума может предусматривать заключение о том, что генотипические измерения из генотипических определений, выполненных в смешанном образце ДНК, вероятно, относятся к генетическому материалу от второго индивидуума, и с использованием этих генотипических определений, которые, как было заключено, относятся к генетическому материалу от второго индивидуума как полученные генотипические измерения.
В варианте осуществления заключение о генотипических данных родственного индивидуума также может предусматривать использование частот аллельных популяций в локусах. В варианте осуществления определенная фракция ДНК от целевого индивидуума выражается как вероятность фракций ДНК. В варианте осуществления генотипические измерения, выполненные для смешанного образца, предусматривают генотипические измерения, выполненные путем секвенирования ДНК в смешанном образце. В варианте осуществления ДНК в смешанном образце предпочтительно приумножается во множестве полиморфных локусов для осуществления генотипических определений из смешанного образца ДНК. В варианте осуществления полиморфные локусы содержат однонуклеотидные полиморфизмы.
В варианте осуществления определение фракции также может предусматривать определение вероятности множества фракций ДНК от целевого индивидуума, присутствующих в смешанном образце ДНК, определение фракции путем выбора фракции из множества фракций с наибольшей вероятностью. В варианте осуществления определение фракции также может предусматривать определение вероятности множества фракций ДНК от целевого индивидуума, присутствующих в смешанном образце ДНК, с использованием методики оценки максимального правдоподобия для определения наиболее вероятной фракции и определение фракции путем выбора фракции, которая была определена как наиболее вероятная.
В варианте осуществления целевым индивидуумом является плод, вынашиваемый беременной матерью, а вторым индивидуумом является беременная мать. В варианте осуществления способ также может предусматривать использование модели платформы, которая соотносит генотипические данные, измеренные в полиморфных локусах, и использование таблицы, которая соотносит материнские генотипы с генотипами детей. В варианте осуществления при определении также применяются генотипические измерения во множестве полиморфных локусов, выполненные на ДНК от отца плода. В варианте осуществления в способе не применяются генотипические данные от отца плода. В варианте осуществления в способе не используются локусы в хромосоме Y. В варианте осуществления настоящее изобретение может предусматривать отчет, раскрывающий установленное отцовство плода, определенное с использованием раскрытого в настоящем документе способа определения фракции плодной ДНК, присутствующей в материнской плазме. В варианте осуществления настоящее изобретение может предусматривать отчет, раскрывающий состояние плоидности плода, установленное с использованиемраскрытого в настоящем документе способа определения фракции плодной ДНК, присутствующей в материнской плазме.
Краткое описание графических материалов
Раскрытые в настоящем документе варианты осуществления далее будут поясняться со ссылкой на приложенные графические материалы, в которых одинаковые структуры обозначаются одинаковыми позициями на нескольких видах. Представленные графические материалы необязательно выполнены в масштабе, вместо этого акцент сделан на иллюстрацию принципов раскрытых в настоящем документе вариантов осуществления.
На фиг.1 показано распределение интенсивностей аллелей из двух родительских контекстов, измеренных в материнской плазме.
На фиг.2 показано распределение статистики теста определения отцовства для 200 неродственных мужчин и биологического отца.
На фиг.3 показаны два распределения отношений интенсивности для 200 неродственных мужчин и биологического отца. Каждый график соответствует различным каналам ввода.
На фиг.4 показаны кривые распределения накопленных частот (cdf) для корреляционного отношения между генотипическими измерениями плода и генотипическими измерениями отца для трех случаев.
На фиг.5 показаны гистограммы корреляционного отношения между генотипическими измерениями плода и генотипическими измерениями отца для трех случаев.
На фиг.6 показана гистограмма статистики теста определения отцовства для 35 образцов по сравнению с идеализированным гауссовым распределением тестовых статистик для 800 неродственных мужчин.
На фиг.7 показан пример отчета, раскрывающего исключение отцовства.
На фиг.8 показан пример отчета, раскрывающего принятие отцовства.
На фиг.9 показан пример отчета, раскрывающего неопределенный результат.
В то время как в вышеупомянутых графических материалах изложены раскрытые в настоящем документе варианты осуществления, также рассматриваются другие варианты осуществления, отмеченные в обсуждении. В настоящем раскрытии представлены иллюстративные варианты осуществления для представления, а не для ограничения. Специалистами в данной области могут быть разработаны многие другие модификации и варианты осуществления, которые попадают в объем и идею принципов раскрытых в настоящем документе вариантов осуществления.
Подробное раскрытие настоящего изобретения
Согласно проиллюстрированным в настоящем документе аспектам представлен способ определения того, является или не является предполагаемый отец биологическим отцом плода, который вынашивается беременной матерью. В варианте осуществления способ предусматривает получение генетического материала от предполагаемого отца и получение образца крови от беременной матери. В варианте осуществления способ может предусматривать осуществление генотипических определений предполагаемого отца и беременной матери и осуществление генотипических определений в свободно плавающей ДНК (ffDNA, т.е. cfDNA), обнаруженной в плазме беременной матери. В варианте осуществления способ предусматривает получение генотипических данных для набора SNP матери и предполагаемого отца плода; осуществление генотипических определений для набора SNP в смешанном образце, который содержит ДНК от целевого индивидуума, а также ДНК от матери целевого индивидуума. В варианте осуществления способ может предусматривать использование генотипических определений для определения на компьютере вероятности того, что предполагаемый отец является биологическим отцом плода, вынашиваемого беременной матерью. В варианте осуществления способ может предусматривать использование генотипических данных беременной матери и предполагаемого отца для определения ожидаемого аллельного распределения для генотипических определений смеси плодной ДНК/матери, если предполагаемый отец был биологическим отцом плода. В варианте осуществления способ может предусматривать использование генотипических данных беременной матери и генотипических данных множества индивидуумов, среди которых, как известно, нет отца, для определения ожидаемого аллельного распределения для генотипических определений смеси плодной/материнской ДНК, если предполагаемый отец не является биологическим отцом плода. В варианте осуществления способ может предусматривать вычисление вероятностей того, что предполагаемый отец является биологическим отцом плода, с учетом ожидаемых аллельных распределений и фактических измерений ДНК материнской плазмы. В варианте осуществления ряд этапов, описанных в способе, приводит к преобразованию генетического материала беременной матери и предполагаемого отца с получением и определением корректной идентичности биологического отца вынашиваемого плода пренатально и неинвазивным способом. В варианте осуществления правдоподобие того, что предполагаемый отец является биологическим отцом, предусматривает объявление или установление предполагаемого отца как биологического отца, если вероятность того, что отец исключается из аллельного распределения, созданного с использованием множества неродственных индивидуумов, является выше порога. В варианте осуществления определение правдоподобия того, что предполагаемый отец является биологическим отцом, предусматривает объявление того, что предполагаемый отец не является биологическим отцом, если правдоподобие того, что предполагаемый отец исключается из аллельного распределения, созданного с использованием множества неродственных индивидуумов, ниже порога. В варианте осуществления определение отцовства выполняется с помощью изначальной гипотезы, что предполагаемый отец на самом деле является отцом ребенка; если предполагаемый отец определен не верно, генотипы детей не будут соответствовать этим прогнозам, и изначальная гипотезы считается неправильной; однако если генотипы детей соответствуют прогнозам, то гипотеза считается правильной. Таким образом, в тесте на отцовство предусматривается, насколько хорошо наблюдаемая ffDNA соответствует генотипам детей, предсказанным с помощью генотипов предполагаемых отцов. В варианте осуществления может быть создан электронный или физический отчет с указанием отцовства.
В варианте осуществления определение отцовства осуществляется с использованием генетических измерений свободно плавающей ДНК (ffDNA), выявленной в крови матери, и генотипической информации от матери и предполагаемого отца. Для измерений ffDNA может быть использован общий способ с использованием ряда платформ, таких как микроматрицы SNP, нецелевое высокопроизводительное секвенирование или целевое секвенирование. Обсуждаемые в настоящем документе способы учитывают тот факт, что свободно плавающая плодная ДНК обнаруживается в материнской плазме при низких, еще неизвестных, концентрациях и с трудом. Тест на отцовство может предусматривать оценку измерений ffDNA и вероятности, что они получены от предполагаемого отца, на основе его генотипов. Независимо от платформы измерения тест может быть основан на генотипах, измеренных в полиморфных локализациях. В некоторых вариантах осуществления возможные аллели в каждом полиморфном локусе могут быть обобщены до А и В, и необязательно до С, D и/или Е и т.д.
В варианте осуществления этот способ предусматривает использование данных измерений аллелей от множества локусов. В варианте осуществления локусы являются полиморфными. В варианте осуществления некоторые или большинство локусов являются полиморфными. В варианте осуществления полиморфные локусы представляют собой однонуклеотидные полиморфизмы (SNP). В варианте осуществления некоторые или большинство из полиморфных локусов являются гетерозиготными. В варианте осуществления нет необходимости определения перед тестированием того, какие локусы являются гетерозиготными.
В варианте осуществления в раскрытом в настоящем документе способе используются методики селективного приумножения, которые сохраняют относительные частоты аллелей, которые присутствуют в оригинальном образце ДНК в каждом полиморфном локусе из набора полиморфных локусов. В некоторых вариантах осуществления амплификация и/или методика селективного приумножения может предусматривать методики ПНР, такие как мини-ПЦР или опосредованная лигированием ПЦР, захват фрагмента с помощью гибридизации или зонды циркуляризации, такие как молекулярные инверсионные зонды. В некоторых вариантах осуществления способы амплификации или селективного приумножения могут предусматривать использование праймеров ПЦР или других зондов, если, при корректной гибридизации с целевой последовательностью, 3'-конец или 5-конец нуклеотидного зонда отделяется от полиморфного сайта аллеля небольшим числом нуклеотидов. В варианте осуществления исключаются зонды, в которых область гибридизации сконструирована для гибридизации с полиморфным сайтом. Такие варианты осуществления являются улучшенными по сравнению с другими способами, которые предусматривают целевую амплификацию и/или селективное приумножение, в том отношении, что они лучше сохраняют оригинальные частоты аллелей образца в каждом полиморфном локусе, является ли образец чистым геномным образцом от одного индивидуума или от группы индивидуумов.
В варианте осуществления в раскрытом в настоящем документе способе используется высокоэффективная высокомультиплексная целевая ПЦР для амплификации ДНК с последующим высокопроизводительным секвенированием с определением частот аллелей в каждом целевом локусе. Одна методика, обеспечивающая выполнение высокомультиплексной целевой ПЦР высокоэффективным способом, предусматривает конструирование праймеров, которые вряд ли гибридизируются друг с другом. Зонды ПЦР могут быть выбраны путем создания термодинамической модели потенциально неблагоприятных взаимодействий или непредусмотренных взаимодействий между по меньшей мере 500, по меньшей мере 1000, по меньшей мере 5000, по меньшей мере 10000, по меньшей мере 20000, по меньшей мере 50000 или по меньшей мере 100000 потенциальными парами праймеров, или между праймерами и образцом ДНК, а затем использования модели с устранением конструкций, которые несовместимы с другими конструкциями в пуле или с образцом ДНК. Другая методика, обеспечивающая выполнение высокомультиплексной целевой ПЦР высокоэффективным способом, заключается в использовании частичного или полного вложенного подхода к целевой ПЦР. Использование одного или комбинации таких подходов обеспечивает мультиплексирование по меньшей мере 300, по меньшей мере 800, по меньшей мере 1200, по меньшей мере 4000 или по меньшей мере 10000 праймеров в одном пуле с полученной в результате амплифицированной ДНК, содержащей большую часть молекул ДНК, которые при секвенировании будут картироваться с целевыми локусми. Использование одного или комбинации таких подходов обеспечивает мультиплексирование большого числа праймеров в одном пуле с полученной в результате амплифицированной ДНК, содержащей более 50%, более 80%, более 90%, более 95%, более 98% или более 99% молекул ДНК, которые картируются с целевыми локусами.
В варианте осуществления раскрытый в настоящем документе способ предусматривает определение того, указывает ли распределение наблюдаемых аллельных измерений на принятие или исключение отцовства с использованием методики оценки максимального правдоподобия (MLE). Применение методики оценки максимального правдоподобия значительно отличается в лучшую сторону от способов, в которых применяется методика отклонения простой гипотезы, тем, что полученное в результате определение будет сделано со значительно более высокой точностью. Одна из причин в том, что методики отклонения простой гипотезы не содержит информацию об альтернативной гипотезе. Другая причина состоит в том, что методика максимального правдоподобия обеспечивает определение оптимальных порогов отсечения для каждого отдельного образца. Другая причина состоит в том, что использование методики максимального правдоподобия позволяет рассчитать достоверность для каждого определения отцовства. Возможность осуществлять расчет достоверности для каждого определения позволяет специалисту-практику узнать, какие признаки являются точными, а какие, скорее всего, будут неправильными. В некоторых вариантах осуществления разнообразные способы могут быть скомбинированы с методикой оценки максимального правдоподобия для повышения точности признаков плоидности. В варианте осуществления раскрытый в настоящем документе способ предусматривает оценивание плодной фракции ДНК в смешанном образце и использование этой оценки для вычисления и признака отцовства (определения), и достоверности признака отцовства.
В варианте осуществления способ предусматривает вычисление тестовой статистики, которая показывает степень сходства между первым индивидуумом и вторым индивидуумом, с учетом генотипических определений во множестве полиморфных локусов для первого индивидуума и генотипических определений во множестве полиморфных локусов для смеси ДНК, если смесь ДНК содержит ДНК от второго индивидуума и родственного индивидуума. В варианте осуществления первый индивидуум является предполагаемым отцом, второй индивидуум является вынашиваемым плодом, а родственным индивидуумом является мать плода. Тестовая статистика может быть рассчитана для плода, матери и множества индивидуумов, как известно, неродственных плоду, посредством чего создается распределение метрики для неродственных индивидуумов. Тестовая статистика также может быть рассчитана для плода, матери и предполагаемого отца. Тест отклонения простой гипотезы может быть использован для определения, если тестовая статистика, рассчитанная с использованием генотипических данных предполагаемого отца, является частью распределения тестовых статистик, рассчитанных с использованием генотипических данных неродственных индивидуумов. Если тестовая статистика, рассчитанная с использованием генотипических данных предполагаемого отца, как выявлено, находится в пределах распределения тестовых статистик, рассчитанных с использованием генотипических данных неродственных индивидуумов, то отцовство может быть исключено, то есть может быть определено, что предполагаемый отец не является родственным плоду. Если тестовая статистика, рассчитанная с использованием генотипических данных предполагаемого отца, как выявлено, не находится в пределах распределения тестовых статистик, рассчитанных с использованием генотипических данных неродственных индивидуумов, то отцовство может быть принято, то есть может быть определено, что предполагаемый отец является родственным плоду.
В варианте осуществления определение отцовства предусматривает определение вероятности измеренных генотипических данных с учетом двух возможных гипотез: гипотезы о том, что предполагаемый отец является биологическим отцом плода, и гипотезы о том, что предполагаемый отец не является биологическим отцом плода. Затем вероятность может быть рассчитана для каждой из гипотез с учетом данных, и отцовство может быть установлено на основе правдоподобия каждой из двух гипотез. Для определения могут использоваться генетические измерения, выполненные на материнской плазме, генетические измерения, выполненные на ДНК от предполагаемого отца, и необязательно материнские генотипические данные. В варианте осуществления материнские генотипические данные могут быть выведены из генотипических определений, выполненных в материнской плазме. В варианте осуществления вероятность может быть определена с использованием разделения диапазона возможных плодных фракций; диапазон плодных фракций может представлять собой 0,01%-99,9%, и сетка может характеризоваться шагом в диапазоне 10%-1%, 1%-0,1% и менее 0,1%. В варианте осуществления разделение возможных плодных фракций может составлять от 2% до 30%, а шаги составляют приблизительно 1%. В варианте осуществления сетка может быть непрерывной, и правдоподобия могут быть интегрированы в диапазонах, а не объединены. В варианте осуществления вероятность может быть определена с использованием только одной фракции плода, при этом плодная фракция может быть определена с использованием любого приемлемого способа. Для каждой возможной фракции плода в сетке можно рассчитать вероятность данных с учетом двух гипотез. Для гипотезы о том, что предполагаемый отец является биологическим отцом, в вычислении вероятности могут быть использованы генотипы предполагаемых отцов, тогда как для гипотезы о том, что предполагаемый отец не является биологическим отцом, в вычислении вероятности дополнительно могут быть использованы основанные на популяции данные частоты аллелей. В варианте осуществления можно применять родительские контексты и модель платформы в вычислении правдоподобия данных с учетом гипотезы. В варианте осуществления правдоподобия могут быть объединены во всех плодных фракциях в разделении, во всех материнских генотипах, а также во всех отцовских генотипах. В варианте осуществления родительские генотипы могут быть вероятностными (например, при данном SNP, родитель может иметь генотип GT с вероятностью 99%, GG с вероятностью 0,5% и ТТ с вероятностью 0,5%); в другом варианте осуществления родительские генотипы могут принимать одно значение (например, при данном SNP, родитель имеет генотип GT). В некоторых вариантах осуществления термины «вероятность» и «правдоподобие» могут быть для простоты взаимозаменяемыми; в других вариантах осуществления эти два термина могут не быть взаимозаменяемыми, и могут читаться так, как их прочитал бы специалист в области статистики.
В некоторых известных в уровне техники способах плодная фракция определяется с использованием измерений, выполненных в локусах, которые выявляются исключительно в родительском генотипе, например, в локусах, которые выявляются исключительно в Y-хромосоме или в гене Rhesus-D. К сожалению, для этих способов нужно, либо чтобы плод был мужского пола (в случае, когда локусы выявляются исключительно в Y-хромосоме), либо чтобы ген или набор генов мог быть идентифицирован до измерений ДНК, если эти гены присутствуют в родительском генотипе и не присутствуют в материнском генотипе. Дополнительная сложность заключается в том, что в контексте установления отцовства не известно, является или нет предполагаемый отец биологическим отцом, и, поэтому, за исключением специфичных для Y-хромосомы локусов не представляется возможным определить, какие локусы могут присутствовать у отца, а не у матери. Таким образом, в контексте установления отцовства в настоящее время невозможно определить плодную фракцию, если плод женского пола, но если плод мужского пола, плодная фракция может быть определена только с использованием специфичных для Y-хромосомы локусов. В варианте осуществления в настоящем документе раскрывается способ определения фракции плодной ДНК, которая присутствует в смеси ДНК, содержащей материнскую и плодную ДНК. В варианте осуществления с помощью способа можно определить плодную фракцию плодной ДНК, которая присутствует в смеси ДНК, содержащей материнскую и плодную ДНК, с использованием генотипических определений в аутосомных хромосомах. В варианте осуществления с помощью способа можно определить плодную фракцию плодной ДНК, которая присутствует в смеси ДНК, содержащей материнскую и плодную ДНК, независимо от пола плода. В варианте осуществления с помощью способа можно определить плодную фракцию плодной ДНК, которая присутствует в смеси ДНК, содержащей материнскую и плодную ДНК, независимо от того, имеются ли гены матери и предполагаемого отца. Для способа в соответствии с настоящим изобретением не нужно, чтобы плод был мужского пола, или чтобы были идентифицированы локус или локусы, которые присутствуют у отца, а не у матери. Для способа в соответствии с настоящим изобретением не нужно, чтобы был известен родительский генотип. Для способа в соответствии с настоящим изобретением не нужно, чтобы был известен материнский генотип, поскольку он может быть выведен из измерений, выполненных в ДНК материнской плазмы, которая содержит смесь и плодной, и материнской ДНК.
В варианте осуществления распределение полиморфных локусов может быть смоделировано с использованием биномиального распределения. В варианте осуществления распределение полиморфных локусов может быть смоделировано с использованием бета-биномиального распределения. При использовании бета-биномиального распределения в качестве модели для аллельного распределения можно более точно моделировать вероятные аллельные измерения, чем при использовании других распределений; это может обеспечить более точные определения отцовства.
В варианте осуществления раскрытый в настоящем документе способ учитывает тенденцию данных к искажению и к содержанию ошибок при присоединении вероятности к каждому измерению. Применение методик максимального правдоподобия для выбора корректной гипотезы из набора гипотез, которые были
оценены, делает более вероятным то, что некорректные измерения будут дисконтированы, а корректные измерения будут использованы в расчетах, которые приведут к определению отцовства. Для большей точности в этом способе систематически уменьшается влияние некорректно измеренных данных по определению отцовства. Это является улучшением по сравнению со способами, при которых все данные считаются в равной степени корректными, или со способами, при которых резко отличающиеся данные произвольно исключаются из расчетов, ведущих к определению отцовства. В варианте осуществления отдельные SNP взвешиваются с помощью ожидаемого расхождения измерений на основе качества SNP и наблюдаемой глубины считывания; это может привести в результате к повышению точности полученной в результате статистики, что приведет к значительному повышению точности признака отцовства, особенно в спорных случаях.
Описанные в настоящем документе способы особенно полезны при использовании на образцах, в которых доступно небольшое количество ДНК, или в которых процент плодной ДНК низкий. Это объясняется соответственно более высокой степенью исключения аллелей, что может происходить при доступности только небольшого количества ДНК, и/или соответственно более высокой степенью исключения плодных аллелей, если процент плодной ДНК низкий в смешанном образце плодной и материнской ДНК. Высокая степень исключения аллелей, означающая, что большое процентное отношение аллелей не было измерено для целевого индивидуума, что приводит в результате к неточным расчетам в плодной фракции и к неточным определениям отцовства. Описанные в настоящем документе способы обеспечивают осуществление точного определения плоидности, если процент молекул ДНК плодного происхождения в смеси составляет менее 40%, менее 30%, менее 20%, менее 10%, менее 8%, менее 6%, менее 4% и даже менее 3%.
В варианте осуществления можно определить отцовство индивидуума на основе измерений, если ДНК индивидуума смешивается с ДНК родственного индивидуума. В варианте осуществления смесь ДНК является свободно плавающей ДНК, обнаруженной в материнской плазме, которая может содержать ДНК от матери с известным генотипом, и которая может быть смешана с плодной ДНК неизвестного генотипа. Затем отцовство плода может быть определено путем просмотра фактических измерений и определения правдоподобия отцовства с учетом наблюдаемых данных. В некоторых вариантах осуществления раскрытый в настоящем документе способ может быть использован в ситуациях при весьма небольшом количестве ДНК, например в экспертных ситуациях, когда доступны одна или несколько клеток (как правило, менее десяти клеток, менее двадцати клеток, менее 40 клеток, менее 100 клеток или эквивалентное количество ДНК). В некоторых вариантах осуществления раскрытый в настоящем документе способ может быть использован в ситуациях с высоко фрагментированной ДНК, например, с ffDNA, обнаруженной в плазме. В таких вариантах осуществления раскрытый в настоящем документе способ служит для получения признаков отцовства из небольшого количества ДНК, которая не загрязнена другой ДНК, но если объявление отцовства сильно затруднено из-за небольшого количества ДНК. Генетические измерения, используемые как часть этих способов, могут быть выполнены на любом образце, содержащем ДНК или РНК, например, без ограничения кровь, плазма, жидкости организма, моча, волос, слезы, слюна, ткань, кожа, ногти, бластомеры, эмбрионы, амниотическая жидкость, образцы хориальных ворсин, кал, желчь, лимфа, выделяемая шейкой матки слизь, сперма или другие клетки или материалы, содержащие нуклеиновые кислоты. В варианте осуществления раскрытый в настоящем документе способ может быть проведен со способами выявления нуклеиновой кислоты, такими как секвенирование, микроматрицы, количественная ПЦР, цифровая ПЦР, или другими способами, используемыми для измерения нуклеиновых кислот. В некоторых вариантах осуществления раскрытый в настоящем документе способ предусматривает вычисление на компьютере аллельных отношений во множестве полиморфных локусов по измерениям ДНК, выполненным в обработанных образцах. В некоторых вариантах осуществления раскрытый в настоящем документе способ предусматривает вычисление на компьютере аллельных отношений или аллельных распределений во множестве полиморфных локусов по измерениям ДНК, выполненным в обработанных образцах, наряду с любой комбинацией других описанных в настоящем раскрытии улучшений.
Дальнейшее обсуждение этих положений может быть найдено в других разделах настоящего документа.
Неинвазивное пренаталъное установление отцовства (NPPT)
Способ неинвазивного пренатального установления отцовства предусматривает ряд этапов. Некоторые из этапов могут включать (1) получение генетического материала от плода; (2) приумножение генетического материала плода, который может находиться в смешанном образце ex vivo; (3) амплификацию генетического материала ех vivo; (4) предпочтительно приумножение специфичных локусов в генетическом материале ех vivo; (5) измерение генетического материала ех vivo и (6) анализ генотипических данных на компьютере и ех vivo. Способы осуществления этих шести и других соответствующих этапов описаны в настоящем документе. По меньшей мере некоторые из этапов способа непосредственно не применяются на организме. В варианте осуществления настоящее раскрытие относится к способам лечения и диагностики, применяемым к ткани и другим биологическим материалам, выделенным и отделенным от организма. По меньшей мере некоторые из этапов способа осуществляются на компьютере.
Некоторые варианты осуществления настоящего раскрытия позволяют практикующему врачу определить генетический статус вынашиваемого матерью плода, в частности, его биологическую связь с другим индивидуумом, неинвазивным способом так, что здоровье ребенка не подвергается риску при заборе генетического материала плода, и нет необходимости подвергать мать инвазивной процедуре.
Современные технологические достижения позволяют измерять большие количества генетической информации из генетического образца с использованием таких способов, как высокопроизводительное секвенирование и матрицы для генотипирования. Раскрытые в настоящем документе способы позволяют практикующему врачу в большей степени использовать большие количества доступных данных, а также выполнять более точную диагностику генетической идентичности плода. В варианте осуществления основанный на информатике способ может обеспечить более точное определение отцовства, чем известные на данный момент в уровне техники способы. Подробности ряда вариантов осуществления приведены ниже. Различные варианты осуществления могут предусматривать различные комбинации вышеупомянутых этапов. Различные комбинации различных вариантов осуществления различных этапов могут быть использованы взаимозаменяемо.
В варианте осуществления у беременной матери берут образец крови, и свободно плавающую ДНК в плазме крови матери, которая содержит смесь и ДНК материнского происхождения, и ДНК плодного происхождения, выделяют и используют для определения статуса плоидности плода. В варианте осуществления раскрытый в настоящем документе способ предусматривает предпочтительное приумножение таких последовательностей ДНК в смеси ДНК, которая соответствует полиморфным аллелям, таким образом, что аллельные отношения и/или аллельные распределения остаются приемлемо постоянными при приумножении. В варианте осуществления способ предусматривает амплификацию выделенной ДНК с использованием полногеномной амплификации (WGA). В варианте осуществления раскрытый в настоящем документе способ предусматривает целевую основанную на ПЦР амплификацию такую, что высокое процентное отношение полученных в результате молекул соответствует целевым локусам. В варианте осуществления раскрытый в настоящем документе способ предусматривает секвенирование смеси ДНК, которая содержит и ДНК материнского происхождения, и ДНК плодного происхождения. В варианте осуществления способ предусматривает измерение амплифицированной ДНК с использованием микроматрицы, сконструированной для выявления последовательностей нуклеиновой кислоты, таких как матрица SNP. В варианте осуществления раскрытый в настоящем документе способ предусматривает использование измеренных аллельных распределений для определения отцовства плода, который вынашивается матерью. В варианте осуществления раскрытый в настоящем документе способ предусматривает сообщение определенного статуса отцовства практикующему врачу. В варианте осуществления раскрытый в настоящем документе способ предусматривает осуществление клинического действия, например, выполнение сопутствующего инвазивного теста, такого как проба ворсинчатого хориона или амниоцентез, для подготовки к рождению ребенка или к добровольному прерыванию беременности.
Настоящая заявка ссылается на заявку на выдачу патента США на изобретение с серийным №11/603406, поданную 28 ноября 2006 г. (публикацию патентного документа США №20070184467); заявку на выдачу патента США на изобретение с серийным №12/076348, поданную 17 марта 2008 г. (публикацию патентного документа США №20080243398); РСТ заявку с серийным № PCT/US 09/52730, поданную 4 августа 2009 г. (РСТ публикацию № WO/2010/017214); РСТ заявку с серийным № РСТ/US810/050824, поданную 30 сентября 2010 г. (РСТ публикацию № WO/2011/041485), заявку на выдачу патента США на изобретение с серийным №13/110685, поданную 18 мая 2011 г., и заявку на выдачу патента США на изобретение с серийным №13/300235, поданную 18 ноября 2011 г. Некоторая терминология, используемая в настоящей поданной заявке, может иметь свои предпосылки в этих ссылках. Некоторые из описанных в настоящем документе концепций могут быть более понятны в свете концепций указанных ссылок.
Скрининг крови матери, содержащей свободно плавающую плодную ДНК
Описанные в настоящем документе способы могут быть использованы для обеспечения определения того, является ли ребенок, плод или другой целевой индивидуум генетически родственный другому индивидууму. В определенном варианте осуществления это может выполняться в случаях, когда генетический материал целевого индивидуума обнаруживается в присутствии количества генетического материала от другого индивидуума. В одном варианте осуществления способ может быть использован для обеспечения определения того, является ли плод генетически родственным предполагаемому отцу, с использованием свободно плавающей плодной ДНК, выявленной в крови матери, вместе с генетическим образцом от отца и необязательно матери. В варианте осуществления плод может происходить из яйцеклетки от донора яйцеклетки так, что плод не является генетически родственным матери, которая вынашивает плод. В варианте осуществления способ может применяться в случаях, если количество целевой ДНК находится в любой пропорции с нецелевой ДНК; например, целевая ДНК может составлять от 0,000001 до 99,999999% имеющейся ДНК. В варианте осуществления нецелевая загрязняющая ДНК может быть от множества индивидуумов; удобно, если генетические данные от некоторого или всех соответствующих нецелевых индивидуумов известны, или если доступны генетические образцы от указанных родственных индивидуумов. В варианте осуществления раскрытый в настоящем документе способ может быть использован для определения генотипических данных плода из крови матери, которая содержит плодную ДНК. Это также может быть использовано в случае, если в матке беременной женщины находится несколько плодов, или если другая загрязняющая ДНК может присутствовать в образце, например, от других уже рожденных братьев или сестер.
Эта методика может обеспечить использование явления плодных кровяных клеток, получивших доступ в кровообращение матери через ворсины плаценты. Как правило, только очень небольшое количество плодных клеток попадает в кровообращение матери таким путем (недостаточное для обеспечения положительного теста Клейхауэра-Бетке на плодное-материнское кровотечение). Плодные клетки могут быть отсортированы и проанализированы с помощью ряда методик поиска конкретных последовательностей ДНК, но без рисков, которые несут инвазивные процедуры. Эта методика также может обеспечить использование явления свободно плавающей плодной ДНК, получившей доступ в кровообращение матери путем высвобождения ДНК после апоптоза плацентарной ткани, если рассматриваемая плацентарная ткань содержит ДНК того же генотипа, что и плод. Было показано, что свободно плавающая обнаруженная в материнской плазме ДНК содержит плодную ДНК в пропорциях более 30-40% плодной ДНК.
В варианте осуществления кровь может быть получена от беременной женщины. Исследование показало, что кровь матери может содержать небольшое количество свободно плавающей ДНК плодного происхождения, вдобавок к свободно плавающей ДНК материнского происхождения. Кроме того, также могут наблюдаться ядросодержащие плодные кровяные клетки, содержащие ДНК плодного происхождения, вдобавок к многочисленным клеткам крови материнского происхождения, которые, как правило, не содержат ядерную ДНК. Имеется много известных из уровня техники способов выделения плодной ДНК или создания фракций, приумноженных плодной ДНК. Например, было показано, что с помощью хроматографии создаются определенные фракции, которые приумножены плодной ДНК.
Как только образец крови, плазмы или другой жидкости матери, содержащий количество плодной ДНК, либо клеточной, либо свободно плавающей, или приумноженный в его пропорции к материнской ДНК, или в его оригинальном отношении, получен, относительно неинвазивным путем, можно определить генотип ДНК, найденной в указанном образце. В некоторых вариантах осуществления кровь может быть получена с использованием иглы для забора крови из вены, например, из подкожной медиальной вены руки. Описанный в настоящем документе способ может быть использован для определения генотипических данных плода. Например, он может быть использован для определения состояния плоидности в одной или нескольких хромосомах, он может быть использован для определения идентичности одного или нескольких SNP, включая вставки, делеции и транслокализации. Он может быть использован для определения одного или нескольких гаплотипов, в том числе родительского происхождения из одного или нескольких генотипических признаков. Он также может быть использован для определения степени сходства между плодом и другим индивидуумом.
Следует отметить, что этот способ будет работать с любыми нуклеиновыми кислотами, которые могут быть использованы для любых способов генотипирования и/или секвенирования, таких как платформа INFINIUM ARRAY от ILLUMINA, GENECHIP от AFFYMETRIX, GENOME ANALYZER от ILLUMINA или SOLID SYSTEM от LIFE TECHNOLGIES, вместе с измеренными ими генотипическими данными. Он предусматривает экстрагирование свободно плавающей ДНК из плазмы или ее амплификации (например, полногеномную амплификацию, ПЦР); геномной ДНК из других типов клеток (например, лимфоцитов человека из цельной крови) или ее амплификации. Для получения ДНК также подходит любой способ экстракции или очистки, который дает геномную ДНК, приемлемую для одной из этих платформ. Этот способ будет работать также хорошо с образцами РНК. В варианте осуществления хранение образцов могут осуществляться с минимальным разрушением (например, замораживание ниже точки замерзания при приблизительно -20°C или при более низкой температуре).
PARENTAL SUPPORT
Некоторые варианты осуществления могут быть использованы в комбинации с методом PARENTAL SUPPORT™ (PS), варианты осуществления которого описаны в заявке на выдачу патента США №11/603406 (публикации патентного документа США №20070184467), заявке на выдачу патента США №12/076348 (публикации патентного документа США №20080243398), заявке на выдачу патента США №13/110685, РСТ заявке № PCT/US 09/52730 (РСТ публикации № WO/2010/017214), РСТ заявке; № PCT/US 10/050824 (РСТ публикации № WO/2011/041485), РСТ заявке № PCT/US 2011/037018 (РСТ публикации № WO/2011/146632) и РСТ заявке № PCT/US 2011/61506, которые включены в настоящий документ во всей своей полноте посредством ссылки. PARENTAL SUPPORT™ является основанным на информатике подходом, который может быть использован для анализа генетических данных. В некоторых вариантах осуществления раскрытые в настоящем документе способы могут рассматриваться как часть метода PARENTAL SUPPORT™. В некоторых вариантах осуществления метод PARENTAL SUPPORT™ представляет собой совокупность методов, которые могут быть использованы для определения генетических данных целевого индивидуума с высокой точностью по одной клетке или небольшому количеству клеток от этого индивидуума или по смеси ДНК, содержащей ДНК от целевого индивидуума и ДНК от одного или множества других индивидуумов, особенно для определения связанных с заболеванием аллелей, других представляющих интерес аллелей, состояния плоидности одной или нескольких хромосом у целевого индивидуума, и/или степени родства другого индивидуума с целевым индивидуумом. PARENTAL SUPPORT™ может относиться к любому из этих способов. PARENTAL SUPPORT™ является примером основанного на информатике способа.
Метод PARENTAL SUPPORT™ позволяет использовать известные родительские генетические данные, т.е. генетические данные гаплотипа и/или диплоидности матери и/или отца, наряду с информацией о механизме мейоза и неполным измерением целевой ДНК, и, возможно, одного или нескольких родственных индивидуумов, вместе с популяционными частотами кроссинговера, для восстановления in silico генотипа на множестве аллелей и/или статуса отцовства эмбриона, или любой целевой клетки(клеток) и целевой ДНК с локализацией ключевых локусов с высокой степенью достоверности. Метод PARENTAL SUPPORT™ позволяет использовать известные родительские генетические данные, т.е. генетические данные гаплотипа и/или диплоидности матери и/или отца, наряду с информацией о механизме мейоза и неполным измерением целевой ДНК для создания гипотезы о том, какие генетическое данные могут ожидаться в различных ситуациях, для расчета правдоподобия каждой из ситуаций с учетом наблюдаемых генетических данных с определением тем самым, какая ситуация наиболее вероятна. В некоторых вариантах осуществления ситуация предусматривает вопрос о том, унаследовал ли целевой индивидуум представляющий интерес связанный с заболеванием гаплотип, унаследовал ли целевой индивидуум представляющий интерес связанный с фенотипом гаплотип, имеет ли целевой индивидуум одну или нескольких анеуплоидных хромосом, и/или является ли целевой индивидуум родственным представляющему интерес индивидууму, и что может быть степень родства. Метод PARENTAL SUPPORT™ позволяет очистить искаженные генетические данные. PARENTAL SUPPORT™ может быть особенно релевантным, если доступна только небольшая фракция генетического материала от целевого индивидуума (например, NPD или NPPT), и если прямые измерения генотипов существенно искажены из-за сигнала загрязняющей ДНК от другого индивидуума. С помощью метода PARENTAL SUPPORT™ можно восстановить высокоточные упорядоченные последовательности диплоидных аллелей в эмбрионе вместе с числом копий сегментов хромосом, даже в том случае, если обычные измерения неупорядоченного диплоида могут быть охарактеризованы высокими степенями исключений аллелей, ложных считываний, переменных ошибок амплификации и других погрешностей. Для метода могут использоваться и базовая генетическая модель, и базовая модель погрешности измерения. Генетическая модель может определять и вероятности аллелей на каждом SNP, и вероятности кроссинговера между SNP. Вероятности аллелей могут быть моделированы на каждом SNP на основе данных, полученных от родителей и модели вероятностей кроссинговера между SNP на основе данных полученных из базы данных НарМар, разработанной Международным проектом НарМар. С учетом надлежащей базовой генетической модели и модели погрешности измерения может быть использована оценка апостериорного максимума (MAP) с модификациями для вычислительной эффективности, чтобы корректно оценить упорядоченные значения аллелей на каждом SNP в эмбрионе.
Определения
«Однонуклеотидный полиморфизм (SNP)» относится к отдельному нуклеотиду, который может отличаться в геномах двух членов одного и того же вида. Использование термина не должно подразумевать какое-либо ограничение частоты, с которой встречается каждый вариант.
«Последовательность» относится к последовательности ДНК или генетической последовательности. Она может относиться к первичной физической структуре молекулы или цепи ДНК у индивидуума. Она может относиться к последовательности нуклеотидов, обнаруженных в этой молекуле ДНК, или к цепи, комплементарной к молекуле ДНК. Она может относиться к информации, содержащейся в молекуле ДНК, как она представлена in silico.
«Локус» относится к конкретной представляющей интерес области на ДНК индивидуума, которая может относиться к SNP, сайту возможной вставки или делеции или сайту некоторой другой соответствующей генетической вариации. Связанные с заболеванием SNP также могут относиться к связанным с заболеванием локусам.
«Полиморфный аллель», также «полиморфный локус», относится к аллелю или локусу, по которому генотип варьирует у индивидуумов данного вида. Некоторые примеры полиморфных аллелей включают в себя однонуклеотидные полиморфизмы, короткие тандемные повторы, делеции, дупликации и инверсии.
«Полиморфный сайт» относится к специфичным нуклеотидам, обнаруженным в полиморфной области, которая варьирует у индивидуумов.
«Аллель» относится к генам, которые занимают конкретный локус.
«Генетические данные», также «генотипические данные», относится к данным, описывающим аспекты генома одного или нескольких индивидуумов. Они могут относиться к одному или нескольким локусам, частичным или полным последовательностям, частичным или полным хромосомам или полному геному. Они могут относиться к идентичности одного или нескольких нуклеотидов; они могут относиться к набору последовательных нуклеотидов или нуклеотидов из различных локализаций в геноме или к их комбинации. Генотипические данные рассматриваются, как правило, in silico, однако, также можно рассматривать физические нуклеотиды в последовательности как химически кодированные генетические данные. Генотипические данные могут быть указаны «в» индивидууме(ах), «для» индивидуума(ам), «на» индивидууме(ах), «от» индивидуума(ов) или «по» индивидууму(ам). Генотипические данные могут относиться к выходным измерениям из платформы генотипирования, по которой выполняются эти измерения в генетическом материале.
«Генетический материал», также «генетический образец», относится к физическому материалу, такому как ткань или кровь, включающему ДНК или РНК, от одного или нескольких индивидуумов.
«Достоверность» относится к статистическому правдоподобию того, что названный SNP, аллель, набор аллелей, признак плоидности или признак отцовства является корректным.
«Анеуплоидия» относится к состоянию, при котором в клетке присутствует неправильное число хромосом. В случае соматической клетки человека она может относиться к случаю, когда клетка не содержит 22 пары аутосомных хромосом и одну пару половых хромосом. В случае гаметы человека, она может относиться к явлению, когда клетка не содержит одну из каждой из 23 хромосом. В случае одного типа хромосом она может относиться к случаю, когда присутствует более или менее двух гомологичных, но неидентичных, копий хромосом, или когда присутствуют две копии хромосом, которые происходят от одного и того же родителя.
«Хромосома» может относиться к одной копии хромосомы, т.е. к одной молекуле ДНК, которых 46 в нормальной соматической клетке; примером является хромосома 18 материнского происхождения. Хромосома также может относиться к типу хромосом, которых 23 в нормальной соматической клетке человека; примером является хромосома 18.
«Моносомия» относится к состоянию, при котором клетка содержит только одну из типа хромосомы.
«Дисомия» относится к состоянию, при котором клетка содержит две из типа хромосомы.
«Однородительская дисомия» относится к состоянию, при котором клетка содержит две из типа хромосомы, и при котором обе хромосомы происходят от одного родителя.
«Трисомия» относится к состоянию, при котором клетка содержит три из типа хромосомы.
«Статус генетического материала» или просто «генетический статус» может относиться к идентичности набора SNP в ДНК, к фазированным гаплотипам генетического материала или к последовательности ДНК, в том числе к вставкам, делециям, повторам и мутациям. Он также может относиться к состоянию плоидности одной или нескольких хромосом, хромосомных сегментов или наборов хромосомных сегментов.
«Установление отцовства» или «определение отцовства» относится к процессу установления или определения того, является или не является предполагаемый отец биологическим отцом вынашиваемого плода, или определение или установление правдоподобия того, что предполагаемый отец является биологическим отцом плода.
«Определенное отцовство» относится к определению того, что предполагаемый отец является или не является биологическим отцом плода. Определенное отцовство является результатом установления, объявления или определения отцовства.
«Отцовство» относится к идентификации биологического отца индивидуума.
«Принятие отцовства» относится к установлению того, что предполагаемый отец является биологическим отцом плода.
«Исключение отцовства» относится к установлению того, что предполагаемый отец не является биологическим отцом плода.
«Предполагаемый отец» относится к мужчине, чье родительское родство плоду находится под вопросом.
«Биологический отец» индивидуума относится к мужчине, чей генетический материал был унаследован индивидуумом.
«Аллельное отношение» относится к отношению между количеством каждого аллеля в полиморфном локусе, которое имеется в образце или у индивидуума. Если образец измеряется с помощью секвенирования, аллельное отношение может означать отношение считываний последовательности, которые картируются с каждым аллелем в локусе. Если образец измеряется с помощью способа измерения интенсивности, аллельное отношение может означать отношение количеств каждого аллеля, присутствующего в локусе, подсчитанных способом измерения.
«Аллельное распределение» или «распределение подсчета аллелей» относится к относительному количеству каждого аллеля, присутствующего в каждом локусе из набора локусов. Аллельное распределение может относиться к индивидууму, к образцу или к набору измерений, выполненных в образце. В контексте секвенирования аллельное распределение относится к числу или вероятному числу считываний, которые картируются с конкретным аллелем для каждого аллеля в наборе полиморфных локусов. Измерения аллелей могут быть обработаны в вероятностном смысле, т.е. правдоподобие того, что данный аллель присутствует в данном считывании последовательности, представляет собой фракцию от 0 до 1, или они могут быть обработаны бинарным способом, т.е. любое данное считывание принимается за нулевую или единичную копии конкретного аллеля.
«Систематическая ошибка подсчета аллелей» относится к степени, с которой измеренное отношение аллелей в гетерозиготном локусе отличается от отношения, которое наблюдалось в оригинальном образце ДНК. Степень систематической ошибки подсчета аллелей в конкретном локусе равняется наблюдаемому измеренному аллельному отношению в этом локусе, деленному на отношение аллелей в оригинальном образце ДНК в этом локусе. Систематическая ошибка подсчета аллелей может быть определена как превышающая единицу, так, что если расчет степени систематической ошибки подсчета аллелей возвращает значение х, которое менее 1, то степень систематической ошибки подсчета аллелей может быть пересчитана как 1/х. Систематическая ошибка подсчета аллелей возможна из-за стандартной ошибки амплификации, стандартной ошибки очистки или какого-либо другого явления, которое неодинаково влияет на различные аллели.
«Праймер», также «зонд ПЦР», относится к отдельной молекуле ДНК (олигомеру ДНК) или коллекции молекул ДНК (олигомеров ДНК), в которой молекулы ДНК идентичны или почти идентичны, и при этом праймер содержит область, которая конструируется для гибридизации с целевым полиморфным локусом, и может содержать праймирующую последовательность, сконструированную для обеспечения ПЦР-амплификации. Праймер также может содержать молекулярный штрих-код. Праймер может содержать случайную область, которая отличается у каждой отдельной молекулы.
«Зонд гибридного захвата» относится к любой последовательности нуклеиновой кислоты, возможно модифицированной, которая получена различными способами, такими как ПЦР или прямой синтез, и предназначена быть комплементарной одной цепи конкретной целевой последовательности ДНК в образце. Экзогенные зонды гибридного захвата могут быть добавлены в подготовленный образец и гибридизированы посредством процесса денатурации и повторного отжига с образованием двойных спиралей экзогенных-эндогенных фрагментов. Затем эти двойные спирали можно физически отделить от образца различными средствами.
«Считывание последовательности» относится к представлению данных последовательности нуклеотидных оснований, которые были измерены с использованием способа клонального секвенирования. С помощью клонального секвенирования можно получать данные последовательности, представляющие отдельную молекулу ДНК или клоны, или кластеры одной оригинальной молекулы ДНК. Считывание последовательности также может быть связано с оценкой качества в каждом положении основания последовательности, показывающей вероятность того, что нуклеотид был назван правильно.
«Картирование считывания последовательности» представляет собой процесс определения локализации считывания последовательности из источника в геномной последовательности конкретного организма. Локализация источника считываний последовательности основывается на подобии последовательности нуклеотидов считывания и геномной последовательности.
«Гомозиготный» относится к содержащему подобные аллели в соответствующих хромосомных локусах.
«Гетерозиготный» относится к содержащему несходные аллели в соответствующих хромосомных локусах.
«Степень гетерозиготности» относится к степени индивидуумов в популяции, имеющих гетерозиготные аллели в данном локусе. Степень гетерозиготности также может относиться к ожидаемому или измеренному отношению аллелей в данном локусе у индивидуума или в образце ДНК.
«Гаплотип» относится к комбинации аллелей в нескольких локусах, которые, как правило, наследованы вместе в одной и той же хромосоме. Гаплотип может относиться либо к всего лишь двум локусам, либо ко всей хромосоме в зависимости от количества событий рекомбинации, произошедших между данным набором локусов. Гаплотип также может относиться к набору однонуклеотидных полиморфизмов (SNP) на одной хроматиде, которые статистически связаны.
«Гаплотипические данные», также «фазированные данные» или «упорядоченные генетические данные», относится к данным из одной хромосомы в диплоидном или полиплоидном геноме, т.е. либо к сегрегированной материнской, либо к отцовской копии хромосомы в диплоидном геноме.
«Фазирование» относится к действию по определению гаплотипических генетических данных из имеющихся неупорядоченных диплоидных (или полиплоидных) генетических данных индивидуума. Оно может относиться к действию по определению, какой из двух генов в аллеле, для набора аллелей, обнаруженного в одной хромосоме, ассоциируется с каждой из двух гомологичных хромосом у индивидуума.
«Фазированные данные» относятся к генетическим данным с установлением одного или нескольких гаплотипов.
«Плодный» относится к «относящемуся к плоду» или к «области плаценты, которая генетически подобна плоду». У беременной женщины некоторая часть плаценты генетически подобна плоду, и свободно плавающая плодная ДНК, обнаруженная в крови матери, может происходить из части плаценты, генотип которой совпадает с таковым плода.
«ДНК плодного происхождения» относится к ДНК, которая была первоначально частью клетки, генотип которой был главным образом эквивалентен таковому плода. Следует отметить, что генетическая информация половины хромосом у плода наследуется от матери плода; в некоторых вариантах осуществления ДНК от этих унаследованных от матери хромосом, которые походят от плодной клетки, считается имеющей «плодное происхождение», а не «материнское происхождение».
«ДНК материнского происхождения» относится к ДНК, которая была первоначально частью клетки, генотип которой был главным образом эквивалентен таковому матери.
«Ребенок» может относиться к эмбриону, бластомеру или плоду. Следует отметить, что в раскрытых в настоящем документе вариантах осуществления описанные концепции в равной степени применяются к индивидуумам, которые представляют собой рожденного ребенка, плод, эмбрион или набор их клеток. Применение термина «ребенок» может просто означать, что названный ребенком индивидуум является генетическим потомком родителей.
«Родитель» относится к генетическим матери или отцу индивидуума. У индивидуума, как правило, имеется два родителя, мать и отец, хотя это может быть необязательно в случае, таком как генетический или хромосомный химеризм.
«Мать» может относиться к биологической матери индивидуума и/или может относиться к женщине, которая вынашивает индивидуума при его/ее созревании.
«Родительский контекст» относится к генетическому статусу данного SNP в каждой из двух соответствующих хромосом для одного или обоих из двух родителей цели.
«Материнская плазма» относится к порции плазмы крови от женщины, которая является беременной.
«Клиническое решение» относится к какому-либо решению по принятию или непринятию действия, результат которого влияет на здоровье или выживаемость индивидуума. В контексте пренатального установления отцовства клиническое решение может относиться к решению о прерывании или о продолжении беременности. Клиническое решение также может относиться к решению о проведении дополнительного тестирования или к принятию действий по подготовке к рождению ребенка.
«Диагностический бокс» относится к одному или к комбинации устройств, разработанных для выполнения одного или множество аспектов раскрытых в настоящем документе способов. В варианте осуществления диагностический бокс может быть размещен в пункте наблюдения за пациентом. В варианте осуществления с помощью диагностического бокса может выполняться целевая амплификация с последующим секвенированием. В варианте осуществления диагностический бокс может функционировать самостоятельно или может управляться специалистом.
«Основанный на информатике способ» или «основанный на информатике подход» относится к способу, который в значительной мере опирается на статистику для осмысления большого количества данных. В контексте пренатальной диагностики он относится к способу, разработанному для определения состояния плоидности по одной или нескольких хромосомах или аллельного состояния в одном или нескольких аллелях с помощью статистического заключения о наиболее возможном состоянии, а не с помощью непосредственного физического измерения состояния, при большом количестве генетических данных, например, из молекулярной матрицы или секвенирования. В варианте осуществления настоящего раскрытия основанная на информатике методика может быть методикой, раскрытой в настоящем изобретении. В варианте осуществления настоящего раскрытия это может быть PARENTAL SUPPORT™.
«Предпочтительное приумножение» ДНК, которая соответствует одному или множеству локусов, или предпочтительное приумножение ДНК в одном или множестве локусов относится к любому способу, который дает процентное отношение молекул ДНК в постприумноженной смеси ДНК, которая соответствует локусам, более высокое, чем процентное отношение молекул ДНК в доприумноженной смеси ДНК, которая соответствует локусам. Способ может предусматривать селективную амплификацию молекул ДНК, которые соответствуют локусам. Способ может предусматривать удаление молекул ДНК, которые не соответствуют локусам.
«Амплификация» относится к способу, который увеличивает число копий молекулы ДНК.
«Селективная амплификация» может относиться к способу, который увеличивает число молекулярных копий конкретной молекулы ДНК или молекул ДНК, которые соответствуют конкретной области ДНК. Она также может относиться к способу, который увеличивает число копий конкретной целевой молекулы ДНК или целевой области ДНК в большей степени, чем увеличивает нецелевые молекулы или области ДНК. Селективная амплификация может быть способом предпочтительного приумножения.
«Универсальная праймирующая последовательность» относится к последовательности ДНК, которая может быть добавлена к популяции целевых молекул ДНК, например, путем лигирования, ПЦР или опосредованной лигированием ПЦР. При добавлении к популяции целевых молекул праймеры, специфичные к универсальным праймирующим последовательностям, могут быть использованы для амплификации целевой популяции с использованием одной пары амплификационных праймеров. Универсальные праймирующие последовательности, как правило, не являются родственными целевым последовательностям.
«Универсальные адаптеры», или «адаптеры лигирования», или «метки библиотеки» представляют собой молекулы ДНК, содержащие универсальную праймирующую последовательность, которая может быть ковалентно связана с 5'-концом и 3'-концом популяции целевых двухцепочечных молекул ДНК. Добавление адаптеров обеспечивает универсальные праймирующие последовательности на 5'-конце и 3'-конце целевой популяции, по которой может осуществляться ПЦР-амплификация, амплификация всех молекул из целевой популяции, с использованием одной пары амплификационных праймеров.
«Нацеливание» относится к способу, используемому для селективной амплификации или иного предпочтительного приумножения тех молекул ДНК, которые соответствуют набору локусов, в смеси ДНК.
«Гипотеза» относится к вероятности того, что предполагаемый отец является биологическим отцом плода, или того, что предполагаемый отец не является биологическим отцом плода.
«Определение», «установление» и «вычисление» могут быть использованы взаимозаменяемо.
Родительские контексты
Родительский контекст относится к генетическому статусу данного аллеля в каждой из двух соответствующих хромосом для одного из двух или обоих родителей цели. Следует отметить, что в варианте осуществления родительский контекст не означает аллельное состояние цели, скорее он относится к аллельному состоянию родителей. Родительский контекст для данного SNP может состоять из четырех пар оснований, двух отцовских и двух материнских; они могут быть одинаковыми или отличаться друг от друга. Он, как правило, записывается как «m1m2|f1f2», при этом m1 и m2 представляют генетический статус данного SNP в двух материнских хромосомах, а f1 и f2 представляют генетический статус данного SNP в двух отцовских хромосомах. В некоторых вариантах осуществления родительский контекст может быть записан как «f1f2|m1m2». Следует отметить, что индексы «1» и «2» относятся к генотипу в данном аллеле первой и второй хромосом; также следует отметить, что выбор, какая хромосома отмечается «1», а какая отмечается «2», может быть произвольным.
Следует отметить, что в настоящем раскрытии А и В часто используются для группового представления идентичностей пар оснований; А или В могут одинаково хорошо представлять С (цитозин), G (гуанин), А (аденин) или Т (тимин). Например, если на данном основанном на SNP аллеле генотип матери представлял собой Т в этом SNP в одной хромосоме и G в этом SNP в гомологичной хромосоме, и генотип отца в этом аллеле представляет собой G в этом SNP в обеих гомологичных хромосомах, можно сказать, что аллель целевого индивидуума характеризуется родительским контекстом АВ|ВВ; также можно сказать, что аллель характеризуется родительским контекстом АВ|АА. Следует отметить, что теоретически любой из четырех возможных нуклеотидов может встречаться в данном аллеле, и таким образом возможно, например, чтобы мать имела генотип AT, а отец имел генотип GC в данном аллеле. Однако эмпирические данные показывают, что в большинстве случаев только две из четырех возможных пар оснований наблюдаются в данном аллеле. Возможно, например, при использовании отдельных тандемных повторов наличие более двух родительских, более четырех и даже более десяти контекстов. В настоящем раскрытии обсуждение предполагает, что только две возможных пары оснований будут наблюдаться в данном аллеле, хотя раскрытые в настоящем документе варианты осуществления могут быть модифицированы с учетом тех случаев, когда эта гипотеза не принимается.
«Родительский контекст» может относиться к набору или подгруппе целевых SNP, которые характеризуются одинаковым родительским контекстом. Например, если было измерено 1000 аллелей в данной хромосоме целевого индивидуума, то контекст АА|ВВ может относиться набору всех аллелей в группе из 1000 аллелей, при этом генотип матери целевого индивидуума был гомозиготным, и генотип целевого индивидуума был гомозиготным, но материнский генотип и отцовский генотип являются несходными в этом локусе. Если родительские данные не являются фазированными, и, таким образом, АВ=ВА, то существует восемь возможных родительских контекстов: АА|АА, АА|АВ, АА|ВВ, АВ|АА, АВ|АВ, АВ|ВВ, ВВ|АА, ВВ|АВ и ВВ|ВВ. Если родительские данные являются фазированными, и, таким образом, АВ≠ВА, то существует шестнадцать различных возможных родительских контекстов: АА|АА, АА|АВ, АА|ВА, АА|ВВ, АВ|АА, АВ|АВ, АВ|ВА, АВ|ВВ, ВА|АА, ВА|АВ, ВА|ВА, ВА|ВВ, ВВ|АА, ВВ|АВ, ВВ|ВА и ВВ|ВВ. Каждый аллель SNP в хромосоме, за исключением некоторых SNP в половых хромосомах, характеризуется одним из этих родительских контекстов. Набор SNP, в котором родительский контекст для одного родителя является гетерозиготным, может называться гетерозиготным контекстом.
Различные выполнения раскрытых в настоящем документе вариантов осуществления
В настоящем документе раскрывается способ определения отцовства целевого индивидуума. Целевым индивидуумом может быть бластомер, эмбрион или плод. В некоторых вариантах осуществления настоящего раскрытия способ определения отцовства индивидуума может предусматривать какой-либо из описанных в настоящем документе этапов и их комбинации.
В некоторых вариантах осуществления источником генетического материала для использования в определении отцовства плода могут быть плодные клетки, такие как ядросодержащие плодные красные кровяные клетки, выделенные из крови матери. Способ может предусматривать получение образца крови от беременной матери. В некоторых вариантах осуществления настоящего раскрытия генетическим материалом для использования в определении отцовства плода может быть свободно плавающая ДНК из материнской плазмы, при этом свободно плавающая ДНК может состоять из смеси плодной и материнской ДНК.
В некоторых вариантах осуществления источником генетического материала плода могут быть плодные клетки, такие как ядросодержащие плодные красные кровяные клетки, выделенные из крови матери. Способ может предусматривать получение образца крови от беременной матери. Способ может предусматривать выделение плодных красных кровяных клеток с использованием визуальных методик, основанных на идее, что определенная комбинация цветов уникально связана с ядросодержащей красной кровяной клеткой, и подобная комбинация цветов не связана с любой другой присутствующей в крови матери клеткой. Комбинация цветов, связанных с ядросодержащими красными кровяными клетками, может содержать красный цвет гемоглобина вокруг ядра, причем цвет можно сделать более четким с помощью окрашивания, и цвет ядерного материала, который можно окрасить, например, голубым. Путем выделения клеток из крови матери и распределения их по предметному стеклу, а затем идентификации тех точек, в которых виден и красный (от гемоглобина), и голубой (от ядерного материала) можно идентифицировать локализацию ядросодержащих красных кровяных клеток. Затем можно экстрагировать такие ядросодержащие красные кровяные клетки с использованием микроманипулятора, использовать методики генотипирования и/или секвенирования для измерения аспектов генотипа генетического материала в этих клетках.
В варианте осуществления можно окрасить ядросодержащую красную кровяную клетку красителем, который флуоресцирует только в присутствии плодного гемоглобина, а не материнского гемоглобина, и таким образом устранить неясность, происходит ли ядросодержащая красная кровяная клетка от матери или от плода. Некоторые варианты осуществления настоящего раскрытия могут предусматривать окрашивание или иную маркировку ядерного материала. Некоторые варианты осуществления настоящего раскрытия могут предусматривать специфичную маркировку плодного ядерного материал с использованием специфичных к плодным клеткам антител.
Существует множество других путей выделения плодных клеток из крови матери или плодной ДНК из крови матери или приумножения образцов плодного генетического материал в присутствии материнского генетического материала. Некоторые из этих способов приведены в настоящем документе, но это не должно расценивается как исчерпывающий перечень. Для удобства в настоящем документе приведены некоторые приемлемые методики: использование флуоресцентно или иным образом меченых антител, эксклюзионная хроматография, магнитные или меченые иным образом аффинные метки, эпигенетические различия, такие как различное метилирование между материнскими и плодными клетками в определенных аллелях, центрифугирование в градиенте плотности с последующим истощением CD45/14 и CD71-положительным отбором из СD45/14-отрицательных клеток, одинарные или двойные градиенты Перколла с различными осмоляльностями или специфичный по отношению к галактозе пектиновый метод.
В некоторых вариантах осуществления генетический образец может быть получен, выделен и/или очищен. В некоторых вариантах осуществления образец может быть центрифугирован для разделения разных слоев. В некоторых вариантах осуществления получение ДНК может предусматривать амплификацию, отделение, очистку хроматографией, очистку электрофорезом, фильтрацию, разделение жидкостей, выделение, осаждение, предпочтительное приумножение, предпочтительную амплификацию, целевую амплификацию или любую из ряда других методик, либо известных в уровне техники, либо описанных в настоящем документе.
В некоторых вариантах осуществления способ настоящего раскрытия может предусматривать амплификацию ДНК. Амплификация ДНК, процесс, который трансформирует небольшое количество генетического материала в большее количество генетического материала, который содержит подобный набор генетических данных, может быть выполнена с помощью широкого ряда способов, в том числе без ограничения с помощью полимеразной цепной реакции (ПЦР). Одним способом амплификации ДНК является полногеномная амплификация (WGA). Существует ряд доступных для WGA способов: опосредованная дотированием ПЦР (LM-PCR), ПЦР с вырожденными олигонуклеотидными праймерами (DOP-PCR) и амплификация с множественным вытеснением цепи (MDA). При LM-PCR короткие последовательности ДНК, названные адаптерами, лигируются по тупым концам ДНК. Эти адаптеры содержат универсальные амплификационные последовательности, которые используются для амплификации ДНК с помощью ПЦР. При DOP-PCR случайные праймеры, которые также содержат универсальные амплификационные последовательности, используются в первом раунде отжига и ПЦР. Затем второй раунд ПЦР используется для амплификации последовательностей с универсальными праймерными последовательностями. При MDA используется полимераза phi-29, которая является высоко процессивным и неспецифичным ферментом, который реплицирует ДНК и используется для анализа единичных клеток. Полногеномная амплификация единичных клеток успешно использовалась в ряде примений в течение многих лет. Существуют другие способы амплификации ДНК из образца ДНК. Амплификация ДНК преобразует изначальный образец ДНК в образец ДНК, которая подобна в ряде последовательностей, но содержится в гораздо больших количествах. В некоторых случаях амплификация может быть не нужна.
В некоторых вариантах осуществления ДНК может быть амплифицирована с использованием универсальной амплификации, такой как WGA или MDA. В некоторых вариантах осуществления ДНК может быть амплифицирована с помощью целевой амплификации, например, с использованием целевой ПЦР, или зондов циркуляризации. В некоторых вариантах осуществления ДНК может быть предпочтительно приумножена с использованием способа целевой амплификации или способа, который дает полное или частичное отделение желательной ДНК от нежелательной, такого как захват путем гибридизационных подходов. В некоторых вариантах осуществления ДНК может быть амплифицирована с использованием комбинации способа универсальной амплификации и способа предпочтительного приумножения. Более полное описание некоторых из этих способов можно найти в других разделах настоящего документа.
Генетические данные целевого индивидуума и/или родственного индивидуума могут быть преобразованы из молекулярного состояния в электронное состояние путем измерения приемлемого генетического материала с использованием инструментов и/или методик из группы, включающей в себя без ограничения микроматрицы генотипирования и высокопроизводительное секвенирование. Некоторые способы высокопроизводительного секвенирования предусматривают секвенирование ДНК по методу Сэнгера, пиросеквенирование, платформу SOLEXA от ILLUMINA, GENOME ANALYZER от ILLUMINA или платформу секвенирования 454 от APPLIED BIOSYSTEM, платформу TRUE SINGLE MOLECULE SEQUENCING от HELICOS, метод секвенирования с использованием электронного микроскопа от HALCYON MOLECULAR или любой другой способ секвенирования. Все эти способы физически преобразуют генетические данные, хранящиеся в образце ДНК, в набор генетических данных, которые, как правило, хранятся до обработки в запоминающем устройстве.
Соответствующие генетические данные индивидуума могут быть измерены путем анализа веществ из группы, включающей без ограничения массу диплоидной ткани индивидуума, одну или несколько диплоидных клеток от индивидуума, одну или несколько гаплоидных клеток от индивидуума, один или несколько бластомеров от целевого индивидуума, внеклеточный генетический материал, обнаруженный у индивидуума, внеклеточный генетический материал индивидуума, обнаруженный в крови матери, клетки индивидуума, обнаруженные в крови матери, один или несколько эмбрионов, образованных из гаметы родственного индивидуума, один или несколько бластомеров, взятых от таких эмбрионов, внеклеточный генетический материал, обнаруженный у родственного индивидуума, генетический материал, как известно, происходящий от родственного индивидуума, и их комбинации.
В некоторых вариантах осуществления может быть вычислено правдоподобие того, что предполагаемый отец является биологическим отцом плода. В некоторых вариантах осуществления определение отцовства может быть использовано для принятия клинического решения. Эта информация, которая, как правило, хранится как физическое размещение материала в запоминающем устройстве, затем может быть преобразована в отчет. Затем согласно отчету могут быть приняты соответствующие меры. Например, клиническим решением может быть решение о прекращении беременности; в качестве альтернативы, клиническим решением может быть решение о продолжении беременности.
В варианте осуществления настоящего раскрытия любой из описанных в настоящем документе способов может быть модифицирован для обеспечения нескольких целей одного и того же целевого индивидуума, например, несколько заборов крови от одной и той же беременной матери. Это может улучшить точность модели, поскольку несколько генетических измерений могут обеспечить больше данных, с которыми может быть установлен целевой генотип. В варианте осуществления один набор целевых генетических данных служил в качестве сообщаемых первичных данных, а другой служил в качестве данных для двойной проверки первичных целевых генетических данных. В варианте осуществления несколько наборов генетических данных, каждый из которых измерен в генетическом материале, взятом от целевого индивидуума, рассматриваются параллельно, и, таким образом, оба набора целевых генетических данных служат для обеспечения определения отцовства плода.
В варианте осуществления способ может быть использован для установления отцовства. Например, данную основанную на SNP генотипическую информацию от матери и от мужчины, который может быть или может не быть генетическим отцом, и измеренную генотипическую информацию из смешанного образца можно определить, если генотипическая информация мужчины действительно представляет, что он фактический генетический отец вынашиваемого плода. Простой способ осуществления этого заключается в простом рассматривании контекстов, в которых мать представляет АА, а возможный отец представляет АВ или ВВ. В этих случаях можно ожидать увидеть половину вклада отца (АА|АВ) или весь (АА|ВВ) в момент времени, соответственно. С учетом ожидаемого ADO просто определять, находятся или не находятся наблюдаемые плодные SNP в соответствии с таковыми возможного отца. Другие способы для осуществления определения отцовства описаны в других разделах настоящего документа.
В варианте осуществления настоящего раскрытия беременная мать хотела бы определить, является ли данный мужчина биологическим отцом ее плода. Она идет к своему врачу и сдает образец своей крови, а также она и ее муж сдают образцы своих ДНК из буккальных мазков. Сотрудник лаборатории генотипирует родительскую ДНК с использованием протокола MDA для амплификации родительской ДНК и матриц INFINIUM от ILLUMINA для измерения генетических данных родителей на большом числе SNP. Затем сотрудник лаборатории осаждает кровь центрифугированием, отбирает плазму и выделяет образец свободно плавающей ДНК с использованием эксклюзионной хроматографии. В качестве альтернативы, сотрудник лаборатории использует одно или несколько флуоресцентных антител, таких как антитело, которое является специфичным по отношению к гемоглобину плода, для выделения ядросодержащей плодной красной кровяной клетки. Затем сотрудник лаборатории берет выделенный или приумноженный плодный генетический материал и амплифицирует его с использованием библиотеки из соответствующим образом сконструированных 70-мерных олигонуклеотидов так, что два конца каждого олигонуклеотида соответствуют фланкирующим последовательностям по обеим сторонам целевого аллеля. После добавления полимеразы, лигазы и приемлемых реагентов олигонуклеотиды подвергаются заполняющей гэпы циркуляризации, захватывающей желаемый аллель. Добавляется экзонуклеаза, инактивируется нагреванием, и продукты используются непосредственно в качестве шаблона для ПЦР-амплификации. Продукты ПЦР секвенируются на GENOME ANALYZER от ILLUMINA. Считывания последовательности используются в качестве входных данных для метода PARENTAL SUPPORT™, с помощью которого затем предсказывается состояние плоидности плода. Метод определяет, что предполагаемый отец не является биологическим отцом плода, и вычисляет достоверность определения как 99,98%. Генерируется отчет, раскрывающий и определенное отцовство, и достоверность определения.
В другом варианте осуществления беременная женщина хочет узнать, является ли данный мужчина биологическим отцом ее плода. Акушер берет кровь матери и отца. Кровь отсылается в лабораторию, где лаборант центрифугирует материнский образец с выделением плазмы и лейкоцитарной пленки. ДНК в лейкоцитарной пленке и в родительском образце крови трансформируется путем амплификации, а генетические данные, закодированные в амплифицированном генетическом материале далее трансформируются из хранящихся в молекуле генетических данных в хранящиеся в электронном виде генетические данные путем прогона генетического материала на высокопроизводительном секвенаторе для измерения родительских генотипов. Образец плазмы предпочтительно обогащается в наборе локусов с использованием метода 5000-плексной гемивложенной целевой ПЦР. Смесь фрагментов ДНК готовится в виде библиотеки ДНК, приемлемой для секвенирования. Затем ДНК секвенируется с использованием способа высокопроизводительного секвенирования, например, GENOME ANALYZER GAIIx от ILLUMINA. Секвенирование преобразовывает информацию, которая закодирована молекулярно в ДНК, в информацию, которая закодирована в электронном виде в аппаратных средствах компьютера. Для определения отцовства плода может быть использована основанная на информатике методика, которая предусматривает раскрытые в настоящем документе варианты осуществления, такие как PARENTAL SUPPORT™. Она может предусматривать вычисление на компьютере подсчетов аллелей во множестве полиморфных локусов по измерениям ДНК, выполненным в приумноженном образце; и определение правдоподобия того, что данный мужчина является биологическим отцом ее плода. Вероятность того, что предполагаемый отец является биологическим отцом плода, устанавливается как 99,9999%, а достоверность определения отцовства рассчитывается как 99,99%. Отчет распечатывается или отсылается в электронном виде акушеру беременной женщины, который передает определение женщине. Женщина, ее муж и врач садятся и обсуждают отчет.
В варианте осуществления необработанный генетический материал матери и отца преобразуется путем амплификации в количество ДНК, которая подобна по последовательности, но представлена в большем количестве. Затем путем способа генотипирования генотипические данные, которые закодированы нуклеиновыми кислотами, преобразуются в генетические измерения, которые могут храниться в физическом и/или электронном виде в запоминающем устройстве, таком как описанные выше. Соответствующие алгоритмы, которые составляют алгоритм PARENTAL SUPPORT™, соответствующие части которого подробно обсуждаются в настоящем документе, переносятся в компьютерную программу с использованием языка программирования. Затем путем выполнения компьютерной программы в аппаратных средствах компьютера вместо физически закодированных битов и байтов, расположенных в паттерне, который представляет необработанные данные измерения, они преобразуются в паттерн, который представляет высоко достоверное определение отцовства плода. Подробности этого преобразования будут зависеть от самих данных, а также от компьютерного языка и системы аппаратных средств, используемых для выполнения описанного в настоящем документе способа. Затем данные, которые физически сконфигурированы для представления высококачественного определения отцовства плода, преобразуются в отчет, который может быть отослан практикующему медику. Такое преобразование может быть выполнено с использованием принтера или компьютерного дисплея. Отчет может быть печатной копией на бумаге или другой приемлемой среде или, кроме того, может быть электронным. В случае электронного отчета он может быть преобразован, может храниться физически в запоминающем устройстве с размещением в компьютере, доступном практикующему медику; он также может быть показан на экране так, что его можно считывать. В случае экранного устройства отображения данные могут быть преобразованы в считываемый формат путем физического преобразования пикселей на устройстве отображения. Преобразование может быть выполнено путем физической активизации электронов на фосфоресцентном экране, путем изменения электрического заряда, что физически изменяет прозрачность определенного набора пикселей на экране, который может располагаться перед подложкой, которая испускает или поглощает протоны. Такое преобразование может быть выполнено путем изменения наномасштабной ориентации молекул в жидком кристалле, например, от неметической до холестерической или смектической фазы, в определенном наборе пикселей. Такое преобразование может быть выполнено с помощью вызывающих электрический ток фотонов, испускаемых из определенного набора пикселей из множества светоизлучающих диодов, расположенных в значимом паттерне. Такое преобразование может быть выполнено любым другим способом, используемым для отображения информации, таким как компьютерный экран или любое другое устройство вывода, или путем передачи информации. Затем практикующий медик может действовать согласно отчету так, что данные в отчете превращаются в действие. Действие может предусматривать продолжение или прекращение беременности, в этом случае вынашиваемый плод превращается в неживой плод. В качестве альтернативы, можно преобразовать набор генотипических определений в отчет, который поможет врачу лечить свою беременную пациентку.
В некоторых вариантах осуществления описанные в настоящем документе способы могут быть использованы в очень раннем внутриутробном возрасте, например, всего лишь четыре недели, всего лишь пять недель, всего лишь шесть недель, всего лишь семь недель, всего лишь восемь недель, всего лишь девять недель, всего лишь десять недель, всего лишь одиннадцать недель и всего лишь двенадцать недель.
Любой из вариантов осуществления, раскрытых в настоящем документе, можно реализовать в цифровой электронной схеме, интегральной схеме, специально сконструированных ASIC (специализированных интегральных микросхемах), компьютерном аппаратном средстве, аппаратно реализованном программном обеспечении, программном обеспечении или в их сочетаниях. Аппарат в соответствии с раскрытыми в настоящем описании вариантами осуществления можно реализовать в продукте - компьютерной программе, материально осуществляемой в машиночитаемом устройстве для хранения данных для выполнения программируемым процессором; и этапы способа в соответствии с раскрытыми в настоящем описании вариантами осуществления могут быть осуществлены программируемым процессором, выполняющим программу, исходя из инструкций по выполнению функций в соответствии с раскрытыми в настоящем описании вариантами осуществления путем работы с вводимыми данными и генерируя выводимые данные. Раскрытые в настоящем описании варианты осуществления могут быть реализованы преимущественно в одной или нескольких компьютерных программах, которые являются выполнимыми и/или интерпретируемыми на программируемой системе, включающей по меньшей мере один программируемый процессор, который может быть специализированным или многоцелевым, соединенный для получения данных и инструкций от и для передачи данных и инструкций к системе хранения данных, по меньшей мере одно устройство ввода данных и по меньшей мере одно устройство вывода данных. Каждая компьютерная программа может быть реализована на высокоуровневом процедурном или объектно-ориентированном языке программирования или на языке ассемблера или машинном языке, если это необходимо; и в любом случае язык может быть транслируемым и интерпретируемым языком. Компьютерную программу можно использовать в любом виде, в том числе в виде независимой программы или в виде
модуля, компонента, стандартной подпрограммы или другой секции, подходящих для применения в вычислительной среде. Компьютерную программу можно использовать для выполнения или интерпретации на одном компьютере или на многих компьютерах в одном центре или распределять по многим центрами взаимосвязанными с помощью коммуникационной сети.
Считываемая компьютером среда хранения данных, как используется в настоящем документе, относится к физическому или материальному хранению (в противоположность сигналам) и включает без ограничения не сохраняющие информацию при отключении питания и сохраняющие информацию при отключении питания, съемные и несъемные носители, реализуемые в любом способе и технологии для материального хранения информации, такой как считываемые компьютером инструкции, структуры данных, модули программы или другие данные. Считываемая компьютером среда хранения данных включает RAM (запоминающее устройство с произвольным доступом), ROM (постоянное запоминающее устройство), EPROM (перепрограммируемое постоянное запоминающее устройство), EEPROM (электрически стираемое программируемое постоянное запоминающее устройство), флэш-память или постоянные запоминающие устройства, созданные по другой технологии, CD-ROM (постоянное запоминающее устройство на основе компакт-диска), DVD (цифровой многофункциональный диск) или другое оптическое устройство хранения данных, компакт-кассеты, магнитную ленту, запоминающее устройство на магнитном диске или другие магнитные запоминающие устройства, но не ограничивается ими, или любые другие материальные или физические среды которые можно применять для материального хранения необходимой информации, или данных, или инструкций и к которым может иметь доступ компьютер или процессор.
Целевое приумножение и секвенирование
Применение методики приумножения образца ДНК в наборе целевых локусов с последующим секвенированием как части способа неинвазивного пренатального объявления аллелей или установления плоидности может обеспечивать ряд неожиданных преимуществ. В некоторых вариантах осуществления настоящего раскрытия способ предусматривает измерение генетических данных для применения с основанным на информатике способом, таким как PARENTAL SUPPORT™ (PS). Конечным итогом некоторых вариантов осуществления является получение генетических данных эмбриона или плода. Имеется много способов, которые могут быть использованы для измерения генетических данных индивидуума и/или родственных индивидуумов как часть осуществляемых способов. В настоящем документе в варианте осуществления раскрывается способ приумножения концентрации набора целевых аллелей, при этом способ предусматривает один или несколько из следующих этапов: целевая амплификация генетического материала, добавление специфичных по отношению к локусам олигонуклеотидных зондов, лигирование определенных цепочек ДНК, выделение наборов желаемой ДНК, удаление нежелаемых компонентов реакции, выявление определенных последовательностей ДНК путем гибридизации и выявление последовательности из одной или множества цепочек ДНК способами секвенирования ДНК. В некоторых случаях цепочки ДНК могут относиться к целевому генетическому материалу, в некоторых случаях они могут относиться к праймерам, в некоторых случаях они могут относиться к синтезированным последовательностям или к их комбинациям. Эти этапы могут быть выполнены в различном порядке. С учетом высоковариабельной природы молекулярной биологии, как правило, не является очевидным, какие способы и какие комбинации этапов будут работать плохо, хорошо или наилучшим образом в различных ситуациях.
Например, этап универсальной амплификации ДНК до целевой амплификации может обеспечить несколько преимуществ, таких как устранение риска затруднения и снижение систематической ошибки подсчета аллелей. ДНК может быть смешана с олигонуклеотидным зондом, который может гибридизироваться с двумя соседними областями целевой последовательности, по одному с каждой стороны. После гибридизации концы зонда могут быть соединены путем добавления полимеразы, средства для лигирования, и каких-либо необходимых реагентов для обеспечения циркуляризации зонда. После циркуляризации может быть добавлена экзонуклеаза для расщепления нециркуляризованного генетического материала с последующим выявлением циркуляризованного зонда. ДНК может быть смешана с праймерами ПЦР, которые могут гибридизоваться с двумя соседними областями целевой последовательности, по одному с каждой стороны. После гибридизации концы зонда могут быть соединены путем добавления полимеразы, средства для лигирования, и каких-либо необходимых реагентов для выполнения ПЦР-амплификации. Амплифицированная или неамплифицированная ДНК может быть целью для зондов гибридного захвата, которые нацелены на набор локусов; после гибридизации зонд может быть локализован и отделен от смеси для обеспечения смеси ДНК, которая приумножается целевыми последовательностями.
В некоторых вариантах осуществления выявление целевого генетического материала может быть выполнено мультиплексным способом. Число генетических целевых последовательностей, которые можно прогнать параллельно, могут варьировать от одной до десяти, от десяти до сотни, от сотни до тысячи, от тысячи до десяти тысяч, от десяти тысяч до сотни тысяч, от сотни тысяч до миллиона или от миллиона до десяти миллионов. Следует отметить, что в уровне техники раскрываются успешные мультиплексные ПЦР, предусматривающие пулы до приблизительно 50 или 100 праймеров, но не более. Предшествующие попытки мультиплексирования более 100 праймеров на пул приводили к значительным проблемам с нежелательными побочными реакциями, такими как образование димеров праймеров.
В некоторых вариантах осуществления этот способ может быть использован для генотипирования единичной клетки, небольшого количества клеток, от двух до пяти клеток, от шести до десяти клеток, от десяти до двадцати клеток, от двадцати до пятидесяти клеток, от пятидесяти до ста клеток, от ста до тысячи клеток или небольшого количества внеклеточной ДНК, например, от одного до десяти пикограмм, от десяти до ста пикограмм, от ста пикограмм до одного нанограмма, от одного до десяти нанограмм, от десяти до ста нанограмм или от ста нанограмм до одного микрограмма.
Применение способа для нацеливания на определенные локусы с последующим секвенированием как части способа установления аллелей или установления плоидности может обеспечить ряд неожиданных преимуществ. Некоторые способы, с помощью которых можно нацелиться на ДНК или предпочтительно приумножить, предусматривают использование зондов циркуляризации, связанных инвертированных зондов (LIP, MIP), способов захвата путем гибридизации, таких как SURESELECT, и стратегии целевой ПЦР или опосредованной лигированием ПЦР-амплификации.
В некоторых вариантах осуществления способ настоящего раскрытия предусматривает измерение генетических данных для применения с основанным на информатике способом, таким как PARENTAL SUPPORT™ (PS). PARENTAL SUPPORT™ является основанным на информатике подходом для манипулирования генетическими данными, аспекты которого описываются в настоящем документе. Конечным итогом некоторых из вариантов осуществления является получение генетических данных эмбриона или плода с последующим клиническим решением на основе полученных данных. Алгоритмы метода PS учитывают измеренные генетические данные целевого индивидуума, часто эмбриона или плода, и измеренные генетические данные родственных индивидуумов и обеспечивают повышенную точность определения генетического статуса целевого индивидуума. В варианте осуществления измеренные генетические данные используются в контексте осуществления определений отцовства при пренатальной генетической диагностике. Существует много способов, которые могут быть использованы для измерения генетических данных индивидуума и/или родственных индивидуумов в вышеупомянутых контекстах. Различные способы предусматривают ряд этапов, которые часто предусматривают амплификацию генетического материала, добавление олигонуклеотидных зондов, лигирование определенных цепочек ДНК, выделение наборов желаемой ДНК, удаление нежелаемых компонентов реакции, выявление определенных последовательностей ДНК путем гибридизации, выявление последовательности из одной или множества цепочек ДНК способами секвенирования ДНК. В некоторых случаях цепочки ДНК могут относиться к целевому генетическому материалу, в некоторых случаях они могут относиться к праймерам, в некоторых случаях они могут относиться к синтезированным последовательностям или их комбинациям. Эти этапы могут быть выполнены в различном порядке. С учетом высоковариабельной природы молекулярной биологии, как правило, не является очевидным, какие способы и какие комбинации этапов будут работать плохо, хорошо или наилучшим образом в различных ситуациях.
Некоторые варианты осуществления настоящего раскрытия предусматривают использование «связанных инвертированных зондов» (LIP), которые ранее были описаны в литературе. LIP - это генерический термин, относящийся к технологиям, которые предусматривают создание кольцевых молекул ДНК, при которых зонды сконструированы с тем, чтобы гибридизироваться с целевой областью ДНК на одной из сторон целевого аллеля так, что добавление приемлемых полимераз и/или лигаз, буферов и других реагентов, а также приемлемые условия дополнят комплементарную инвертированную область ДНК между концами целевого аллеля с созданием кольцевой петли ДНК, в которой будет содержаться информация, обнаруженная в целевом аллеле. LIP также могут быть названы предварительно циркуляризованными зондами, зондами предварительной циркуляризации или зондами циркуляризации. Зондом LIP может быть линейная молекула ДНК длиной от 50 до 500 нуклеотидов, а в варианте осуществления длиной от 70 до 100 нуклеотидов; в некоторых вариантах осуществления она может быть длиннее или короче, чем описанные в настоящем документе. Другие варианты осуществления настоящего раскрытия включают различные воплощения технологии LIP, такие как зонды «висячие замки» и молекулярные инверсионные зонды (MIP).
Один способ нацеливания на специфичных локализаций для секвенирования заключается в синтезе зондов, в которых 3- и 5'-концы зондов отжигаются на целевой ДНК в локализациях, примыкающих к одной из сторон целевой области, инвертированным образом так, что добавление ДНК-полимеразы и ДНК-лигазы приводит к удлинению от 3'-конца присоединением оснований к одноцепочечному зонду, которые комплементарны целевой молекуле (заполнение гэпов), с последующим лигированием нового 3'-конца с 5'-концом оригинального зонда, что приводит к формированию кольцевой молекулы ДНК, которая может быть впоследствии отделена от сопутствующей ДНК. Концы зонда сконструированы для фланкирования представляющей интерес целевой области. Один аспект этого подхода обычно называется MIPS и используется в сочетании с матричными технологиями для определения природы заполняемой последовательности.
Опосредованная лигированием ПЦР представляет собой способ ПЦР, используемый для предпочтительного приумножения образца ДНК посредством амплификации одного или множества локусов в смеси ДНК, при этом способ предусматривает получение набора пар праймеров, в котором каждый праймер в паре содержит целевую специфичную последовательность и нецелевую последовательность, при этом целевая специфичная последовательность сконструирована для отжига с целевой областью, одна в 3'-5'-направлении и одна в 5'-3'-направлении от полиморфного сайта, и которая может быть отделена от полиморфного сайта 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11-20, 21-30, 31-40, 41-50, 51-100, или более 100 основаниями; полимеризацию ДНК от 3'-конца в 3'-5'-направлении праймера для заполнения одно цепочечной области между ним и 5'-концом в 5'-3'-направлении праймера нуклеотидами, комплементарными целевой молекуле; лигирование последнего полимеризо ванного основания в 3'-5'-направлении праймера с примыкающим с основанием на 5'-конце в 5'-3'-направлении праймера; и амплификацию только полимеризованных и лигированных молекул с использованием нецелевых последовательностей, содержащихся на 5'-конце в 3'-5'-направлении праймера и 3'-конце в 5'-3'-направлении праймера. Пары праймеров для распознавания разных целей могут быть смешаны в одной и той же реакции. Нецелевые последовательности служат в качестве универсальных последовательностей так, что все пары праймеров, которые были успешно полимеризованы и лигированы, могли быть амплифицированы с помощью одной пары амплификационных праймеров.
В варианте осуществления образец ДНК может быть предпочтительно приумножен с использованием подхода захвата путем гибридизации. Некоторые примеры коммерческих методик захвата гибридизацией включают в себя SURE SELECT от AGILENT и truseq от ILLUMINA. При захвате гибридизацией набору олигонуклеотидов, комплементарных или в основном комплементарных желаемым целевым последовательностям, дают возможность гибридизироваться со смесью ДНК, а затем физически отделяют от смеси. После того, как желаемые последовательности гибридизировались с олигонуклеотидами нацеливания, эффект физического удаления олигонуклеотидов нацеливания также заключается в удалении целевых последовательностей. После удаления гибридизированных олигонуклеотидов их можно нагреть до температуры, превышающей их точку плавления, и они могут быть амплифицированы. Некоторые способы физического удаления олигонуклеотидов нацеливания заключаются в ковалентном связывании олигонуклеотидов нацеливания с твердой подложкой, например, с магнитной гранулой или чипом. Другой способ физического удаления олигонуклеотидов нацеливания заключается в ковалентном связывании их с молекулярным фрагментом с высокой аффинностью к другому молекулярному компоненту. Примером такой молекулярной пары является биотин и стрептавидин, такие как используемые в SURE SELECT. Таким образом, целевые последовательности могут быть ковалентно прикреплены к молекуле биотина, и после гибридизации можно использовать твердую подложку со стрептавидином, прикрепленном так, чтобы тянуть вниз биотинилированные олигонуклеотиды, с которыми гибридизированы целевые последовательности.
В некоторых вариантах осуществления ПЦР может быть использована для нацеливания на специфичные локализации в геноме. В образцах плазмы оригинальная ДНК высоко фрагментирована (как правило, менее 500 пар оснований, со средней длиной менее 200 пар оснований). При ПЦР для осуществления амплификации как прямые, так и обратные праймеры должны отжигаться с одним и тем же фрагментом. Следовательно, если фрагменты короткие, в ходе анализов ПЦР также должны амплифицироваться относительно короткие области. Анализ ПЦР может проводиться в больших количествах, однако, взаимодействия между различными анализами ПЦР затрудняет их мультиплексирование при их количестве, превышающем приблизительно сто анализов. Для повышения уровня мультиплексирования могут быть использованы различные комплексные молекулярные подходы, но их применение может быть ограничено числом меньшим 100, вероятно 200, или возможно 500 анализов на реакцию. Образцы с большими количествами ДНК можно разделить на несколько субреакций, а затем повторно объединить перед секвенированием. Для образцов, в которых либо весь образец, либо субпопуляция молекул ДНК ограничивается, расщепление образца будет вносить статистический шум. В варианте осуществления небольшое или ограниченное количество ДНК может относиться к количеству ниже 10 пг, от 10 до 100 пг, от 100 пг до 1 нг, от 1 до 10 нг или от 10 до 100 нг. Следует отметить, что хотя данный способ особенно применим при небольших количествах ДНК, при которых другие способы, предусматривающие расщепление образца на множество пулов, могут вызвать значительные проблемы, связанные с возникновением стохастического шума, он все же обеспечивает преимущество минимизации стандартной ошибки при применении на образцах с любым количеством ДНК. В таких ситуациях можно использовать этап универсальной преамплификации для увеличения количества всего образца. В идеале такой этап преамплификации не должен значимо изменять распределения аллелей.
В целом, для выполнения целевого секвенирования множества (n) целей в образце (более 50, более 100, более 500 или более 1000) можно разделить образец на ряд параллельных реакций, в которых будет амплифицироваться одна индивидуальная цель. Это можно выполнять в многолуночных планшетах для ПЦР или на коммерчески доступных платформах, таких как FLUIDIGM ACCESS ARRAY (48 реакций на образец в микрожидкостных чипах) или методом капельной ПЦР по технологии RAIN DANCE TECHNOLOGY (от сотен до нескольких тысяч целей). К сожалению, такие методы расщепления и объединения являются проблематичными для образцов с ограниченным количеством ДНК, поскольку часто отсутствует достаточное количество копий генома для обеспечения того, чтобы в каждую лунку попала одна копия каждой области генома. Это представляет особенно серьезную проблему, если целями являются полиморфные локусы, и нужны относительные пропорции аллелей в полиморфных локусах, поскольку стохастический шум, возникающий в результате расщепления и объединения, будет являться причиной очень низкой точности измерений пропорций аллелей, присутствующих в оригинальном образце ДНК. В настоящем документе описывается способ для эффективной и производительной амплификации во множестве реакций ПЦР, который применим для случаев, если доступно только ограниченное количество ДНК. В варианте осуществления метод может применяться для анализа единичных клеток, жидкостей организма, смесей ДНК, таких как свободно плавающая ДНК, обнаруживаемая в материнской плазме, биоптатов, образцов, взятых из окружающей среды и/или экспертных образцов.
В варианте осуществления целевое секвенирование может предусматривать один, несколько или все из следующих этапов, а) Создание и амплификация библиотеки с адаптерными последовательностями на обоих концах фрагментов ДНК. b) Разделение на несколько реакций после амплификации библиотеки, с) Выполнение приблизительно 100-плексной, приблизительно 1000-плексной или приблизительно 10000-плексной амплификации выбранных целей с использованием одного специфичного по отношению к цели «прямого» праймера на цель и одного праймера специфичного по отношению к маркеру, d) Выполнение второй амплификации этого продукта с использованием «обратных» праймеров специфичных по отношению к цели и одного (или нескольких) праймеров, специфичных по отношению к универсальному маркеру, который был введен как часть прямых специфичных по отношению к цели праймеров, в первом раунде, е) Разделение продукта на множество аликвот и амплификация субпулов целей в индивидуальных реакциях (например, от 50 до 500-плексной, хотя могут быть использованы все, вплоть до одноплексной). f) Объединение продуктов реакций в параллельных субпулах. Во время этих амплификации праймеры могут нести совместимые с секвенированием маркеры (частичные или полной длины) так, что продукты могут быть секвенированы.
В варианте осуществления можно снизить потенциальные потери на последовательных этапах посредством амплификации всей cfTP-IK образца или фракции оригинальной сВДНК. Доступны различные способы для амплификации всего генетического материала в образце с увеличением количества материала, доступного для процедур в 5'-3'-направлении. В варианте осуществления при опосредованной лигированием ПЦР (LM-PCR) фрагменты ДНК амплифицируются путем ПЦР после лигирования или одного отдельного адаптера, или двух отдельных адаптеров, или множества отдельных адаптеров. В варианте осуществления при амплификации с множественным замещением цепей (MDA) полимераза phi-29 используется для амплификации всей ДНК в изотермических условиях. В DOP-PCR и вариациях для амплификации ДНК из оригинального материала используется случайный прайминг. Каждый способ имеет определенные характеристики, такие как однородность амплификации по всем представленным областям генома, эффективность захвата и амплификации оригинальной ДНК, а также производительность амплификации как функция длины фрагмента.
Схема традиционного анализа ПЦР приводит к значительным потерям отдельных плодных молекул, однако, потери могут быть существенно уменьшены разработкой очень коротких анализов ПЦР, называемых анализами мини-ПЦР. Плодная с1ДНК в материнской сыворотке высоко фрагментирована, и размеры фрагментов распределяются приблизительно по закону распределения вероятностей Гаусса со средней длиной 160 пар оснований, стандартным отклонением 15 пар оснований, минимальным размером приблизительно 100 пар оснований и максимальным размером приблизительно 220 пар оснований. Распределение стартовых и концевых положений фрагмента относительно целевых полиморфизмов, не являясь обязательно случайным, значительно варьирует между отдельными целями и между всеми целями вместе, и полиморфный сайт одного конкретного целевого локуса может занимать любое положение от старта до конца в различных фрагментах, происходящих от этого локуса. Следует отметить, что термин мини-ПЦР может в равной степени относиться к обычной ПЦР без дополнительных оговорок или ограничений.
Во время ПЦР будет происходить амплификация только тех матричных фрагментов ДНК, которые содержат сайты как прямых, так и обратных праймеров. Поскольку фрагменты плодной сfДНК короткие, правдоподобие того, что сайты обоих праймеров присутствуют, означает правдоподобие существования плодного фрагмента длиной L, содержащего сайты как прямых, так и обратных праймеров, и равняется отношению длины ампликона к длине фрагмента. При идеальных условиях в анализе, в котором ампликон составляет 45, 50, 55, 60, 65 или 70 пар оснований, будет успешно амплифицироваться 72%, 69%, 66%, 63%, 59% или 56%, соответственно, доступных фрагментов-матриц молекул. Длина ампликона - это расстояние между 5'-концами прямых и обратных праймирующих сайтов. Ампликон с меньшей длиной по сравнению с теми, которые, как правило, известны в уровне техники, может дать более эффективные измерения желаемых полиморфных локусов, требуя считывания только коротких последовательностей. В варианте осуществления существенная фракция ампликонов должна составлять менее 100 пар оснований, менее 90 пар оснований, менее 80 пар оснований, менее 70 пар оснований, менее 65 пар оснований, менее 60 пар оснований, менее 55 пар оснований, менее 50 пар оснований или менее 45 пар оснований.
Следует отметить, что в способах, известных в уровне техники, коротких анализов, таких как описанные в настоящем документе, обычно избегают, потому что они не являются необходимыми и накладывают значительные ограничения на конструирование праймеров, ограничивая длину праймера, характеристики отжига и расстояние между прямым и обратным праймерами.
Мультиплексная ПЦР может предусматривать один раунд ПЦР, в котором амплифицируются все цели, или может предусматривать один раунд ПЦР с последующим одним или несколькими раундами вложенной ПЦР или некоторым вариантом вложенной ПЦР. Вложенная ПЦР состоит из последовательного раунда или раундов ПЦР-амплификации с использованием одного или нескольких новых праймеров, которые внутренне связываются с помощью по меньшей мере одной пары оснований с праймерами, использованными в предыдущем раунде. Вложенная ПЦР снижает число побочной амплификации целей посредством амплификации в последовательных реакциях только тех продуктов предыдущего раунда, которые имеют корректную внутреннюю последовательность. Снижение побочной амплификации целей повышает количество полезных измерений, которые могут быть получены, особенно при секвенировании. Вложенная ПЦР, как правило, означает конструирование праймеров, полностью внутренних по отношению к связывающим сайтам предыдущих праймеров, с увеличением в обязательном порядке минимального размера сегмента ДНК, необходимого для амплификации. Для образцов, таких как сfДНК из материнской плазмы, в которых ДНК высоко фрагментирована, больший размер анализируемых фрагментов снижает число отдельных молекул сfДНК, из которых можно получить измерение. В варианте осуществления с целью компенсации этого эффекта можно использовать частичный вложенный подход, при котором один или оба праймера второго раунда перекрывают сайты связывания праймеров первого раунда, несколько увеличивая внутреннее количество оснований для достижения дополнительной специфичности и при этом минимально увеличивая общий размер анализируемых фрагментов.
В варианте осуществления мультиплексного пула ПЦР анализируемых фрагментов сконструирован для амплификации потенциально гетерозиготных SNP или других полиморфных или неполиморфных локусов в одной или нескольких хромосомах, и эти анализируемые фрагменты используются в одной реакции для амплификации ДНК. Количество анализируемых фрагментов в ПЦР может составлять от 50 до 200 анализируемых фрагментов ПЦР, от 200 до 1000 анализируемых фрагментов ПЦР, от 1000 до 5000 анализируемых фрагментов ПЦР или от 5000 до 20000 анализируемых фрагментов ПЦР (50-200-плексная, 200-1000-плексная, 1000-5000-плексная, 5000-20000-плексная, более чем 20000-плексная, соответственно)
В варианте осуществления создается пул анализируемых фрагментов от 100-плексной до 500-плексной, от 500-плексной до 1000-плексной, от 1000-плексной до 2000-плексной, от 2000-плексной до 5000-плексной, от 5000-плексной до 10000-плексной, от 10000-плексной до 20000-плексной, от 20000-плексной до 50000-плексной или от 50000-плексной до 100000-плексной ПЦР, таким образом, что прямые и обратные праймеры имеют хвосты, соответствующие прямым и обратным последовательностям, необходимым для инструмента высокопроизводительного секвенирования, такого как HISEQ, GAIIX или MYSEQ, доступных от ILLUMINA. Кроме того, включенный в хвосты секвенирования 5'-конец представляет собой дополнительную последовательность, которая может быть использована в качестве праймирующего сайта в последующей ПЦР для добавления последовательностей нуклеотидов штрихкода к ампликонам, что обеспечивает возможность мультиплексного секвенирования множества образцов на одной дорожке инструмента высокопроизводительного секвенирования. В варианте осуществления создается пул анализируемых фрагментов для 10000-плексной ПЦР таким образом, что обратные праймеры имеют хвосты, соответствующие обратным последовательностям, необходимым для инструмента высокопроизводительного секвенирования. После амплификации в первом 10000-плексном анализе может быть выполнена последующая ПЦР-амплификация с использованием другого 10000-плексного пула, содержащего частично вложенные прямые праймеры (например, из 6 вложенных оснований) для всех целей и обратный праймер, соответствующий обратному хвосту секвенирования, включенный в первом раунде. Этот последующий раунд частично вложенной амплификации только с одним специфичным по отношению к цели праймером и универсальным праймером ограничивает необходимый размер анализируемого фрагмента, снижает шумовой сигнал, а также значительно уменьшает число побочных ампликонов. Хвосты секвенирования могут добавляться к присоединенным адаптерам дотирования и/или как часть зондов ПЦР так, что хвост является частью конечного ампликона.
Плодная фракция оказывает влияние на производительность теста; труднее корректно определить отцовство по образцам с более низкой плодной фракцией. Существует ряд способов приумножения ДНК, обнаруженной в материнской плазме, плодной фракцией. Плодная фракция может быть увеличена уже обсуждаемым ранее способом LM-PCR, а также целевым удалением длинных материнских фрагментов. В варианте осуществления перед мультиплексной ПЦР-амплификацией целевых локусов может быть проведена дополнительная мультиплексная ПЦР с целью селективного удаления длинных и в основном материнских фрагментов, соответствующих целевым локусам в последующей мультиплексной ПЦР. Конструируются дополнительные праймеры для отжига сайта, расположенного на большем расстоянии от полиморфизма, чем ожидается во фрагментах внеклеточной плодной ДНК. Такие праймеры могут быть использованы в одном цикле мультиплексной ПЦР до мультиплексной ПЦР целевых полиморфных локусов. Эти дистальные праймеры метятся молекулой или частью молекулы, которая может обеспечить селективное распознавание меченых кусочков ДНК. В варианте осуществления эти молекулы ДНК могут быть ковалентно модифицированы молекулой биотина, которая обеспечивает удаление свеже сформированной двуцепочечной ДНК, содержащей эти праймеры после одного цикла ГИДР. Двухцепочечная ДНК, сформированная во время первого раунда, скорее всего по происхождению является материнской. Удаление гибридного материала можно выполнить с использованием магнитных стрептавидиновых гранул. Существуют другие способы мечения, которые могут работать в равной степени хорошо. В варианте осуществления для приумножения образца более короткими цепями ДНК, например, менее приблизительно 800 пар оснований, менее приблизительно 500 пар оснований или менее приблизительно 300 пар оснований, могут быть использованы способы отбора по размеру. После этого амплификацию коротких фрагментов можно проводить как обычно.
В некоторых вариантах осуществления целевая ДНК может происходить из единичных клеток, из образцов ДНК, состоящих из менее одной копии целевого генома, из небольших количеств ДНК, из ДНК смешанного происхождения (например, из плазмы беременных: плацентарная и материнская ДНК; из плазмы и опухолей больных злокачественным заболеванием: смесь ДНК здоровых и раковых клеток, трансплантация и т.д.), из других жидкостей организма, из культур клеток, из супернатантов культур, из экспертных образцов ДНК, из древних образцов ДНК (например, насекомых в янтаре), из других образцов ДНК и их комбинаций.
В некоторых вариантах осуществления описанные в настоящем документе способы могут быть использованы для амплификации и/или определения SNP, простых тандемных повторов (STR), числа копий, метилирования нуклеотидов, уровней мРНК, уровней экспрессии РНК других типов, других генетических и/или эпигенетических признаков. Описанные в настоящем документе способы мини-ПЦР могут быть использованы вместе с секвенированием следующего поколения; они могут быть использованы с другими способами 5'-3'-направления, такими как микроматрицы, подсчет способом цифровой ПНР, ПЦР в реальном времени, масс-спектрометрия и т.д.
В некоторых вариантах осуществления описанные в настоящем документе способы мини-ПЦР амплификации могут быть использованы как часть способа точного количественного определения минорных популяций. Он может быть использован для определения абсолютного количества с использованием пиковых калибраторов. Он может быть использован для количественного анализа мутантного/минорного аллеля посредством очень глубокого секвенирования и может выполняться по высоко мультиплексному типу. Он может быть использован для стандартного установления отцовства, родства и происхождения у человека, животных, растений или других существ. Он может быть использован для экспертного тестирования. Он может быть использован для быстрого генотипирования и анализа числа копий (CN) на материале любого типа, например, амниотической жидкости и CVS, сперме, продуктах оплодотворения (РОС). Он может быть использован для анализа единичных клеток, такого как генотипирование образцов, взятых на биопсию из эмбрионов. Он может быть использован для быстрого анализа эмбрионов (в течение менее одного, одного или двух дней после биопсии) с помощью целевого секвенирования с использованием мини-ПЦР.
Высоко мультиплексная ПЦР может часто приводить к продуцированию очень высоких пропорций продуктов ДНК, получающихся в результате непродуктивных побочных реакций, таких как формирование димеров праймеров. В варианте осуществления праймеры, которые с наибольшей вероятностью вызывают непродуктивные побочные реакции, могут быть удалены из библиотеки праймеров, результатом чего будет библиотека праймеров с большей пропорцией амплифицированной ДНК, картирующеся с геномом. Этап удаление проблемных праймеров, т.е. тех праймеров, которые с повышенной вероятностью формируют димеры, неожиданно обеспечил возможность ПЦР с исключительно высокими уровнями мультиплексирования для последующего анализа секвенированием. В системах, таких как секвенирование, в которых производительность существенно ухудшается при наличии димеров праймеров и/или других вредных продуктов, было достигнуто мультиплексирование, превышающее в более 10, более 50 и более 100 раз мультиплексирование, описанное другими. Следует отметить, что это противопоставимо способам выявления, основанным на зондах, например, микроматрицам, TaqMan, ПЦР и т.д., при которых избыток димеров праймеров не оказывает значимого влияния на исход. Также следует отметить, что, как правило, в уровне техники предполагается, что мультиплексирование ПЦР для секвенирования ограничивается приблизительно 100 анализируемыми фрагментами в одной и той же лунке.
Существует ряд способов выбора праймеров для библиотеки, при которых количество некартирующихся димеров праймеров или других вредных продуктов праймеров сводится к минимуму. Эмпирические данные указывают на то, что за большое количество побочных реакций с участием некартирующихся димеров праймеров ответственно небольшое количество «плохих» праймеров. Удаление этих «плохих» праймеров может повысить процент считываний последовательностей, которые картируются с целевыми локусами. Одним из способов идентификации «плохих» праймеров является просмотр данных секвенирования ДНК, амплифицированной в ходе целевой амплификации; димеры праймеров, наблюдающиеся с наибольшей частотой, могут быть удалены с получением библиотеки праймеров, которая со значительно меньшей вероятностью вызовет образование побочных продуктов ДНК, которые не картируются с геномом. Существуют также общедоступные программы, которые могут рассчитать энергию связывания различных комбинаций праймеров, и удаление праймеров с самой высокой энергией связывания также даст библиотеку праймеров, которая со значительно меньшей вероятностью вызовет образование побочных продуктов ДНК, которые не картируются с геномом.
Следует отметить, что существуют другие способы выявления, какие зонды ПЦР вероятно будут формировать димеры. В варианте осуществления анализа пула ДНК, которая была амплифицирована с использованием неоптимизированного набора праймеров, может быть достаточно для выявления проблематичных праймеров. Например, анализ может быть выполнен с использованием секвенирования, и те праймеры, чьи димеры присутствуют в наибольших количествах, считаются теми праймерами, которые с большой вероятностью будут формировать димеры и которые подлежат удалению.
Отбор целевых локализаций можно начать с конструирования пула пар кандидатных праймеров и создания термодинамической модели потенциально неблагоприятных взаимодействий между парами праймеров, а затем использовать модель для элиминации конструкций, которые несовместимы с другими конструкциями в пуле.
Существует много технологических процессов проведения ПЦР; описаны некоторые технологические процессы, типичные для раскрытых в настоящем документе способов. Указанные в настоящем документе этапы не означают исключения других возможных этапов и не подразумевают, что какой-либо из этапов, описанных в настоящем документе необходим для того, чтобы способ работал соответствующим образом. В литературе известен широкий ряд вариаций параметров или другие модификации, и они могут быть выполнены без затрагивания сущности настоящего изобретения. Один особенно обобщенный технологический процесс приведен ниже с последующим рядом возможных вариантов. Варианты, как правило, относятся к возможным вторичным реакциям ПЦР, например, к различным типам вложения, которые могут быть выполнены (этап 3). Важно отметить, что варианты могут быть выполнены в другое время или в другом порядке, чем то, как это описано в настоящем документе.
1. ДНК в образце может содержать адаптеры лигирования, часто упоминаемые как маркеры библиотеки или маркеры-адаптеры лигирования (LT), добавляемые в тех случаях, если адаптеры лигирования содержат универсальную праймирующую последовательность с последующей универсальной амплификацией. В варианте осуществления это может быть выполнено с использованием стандартного протокола, разработанного для создания библиотек секвенирования после фрагментации. В варианте осуществления образец ДНК может быть снабжен тупыми концами, и затем А может быть добавлен к 3'-концу. Y-адаптер с выступающим Т может быть добавлен и лигирован. В некоторых вариантах осуществления могут быть использованы другие липкие концы, отличные от выступающих А или Т. В некоторых вариантах осуществления другие адаптеры могут быть добавлены, например, петлевые адаптеры лигирования. В некоторых вариантах осуществления адаптеры могут содержать маркер, сконструированный для ПЦР-амплификации.
2. Специфичная амплификация целей (STA). Преамплификация сотен, тысяч, десятков тысяч и даже сотен тысяч целей может быть мультиплексирована в одной реакции. STA, как правило, проводится в ходе 10-30 циклов, хотя она может проводиться в ходе 5-40 циклов, в ходе 2-50 циклов и даже в ходе 1-100 циклов. Праймеры могут быть снабжены хвостами, например, для упрощения технологического процесса или для избегания секвенирования больших пропорций димеров. Следует отметить, что, как правило, димеры обоих праймеров, несущих одинаковый маркер не будут эффективно амплифицироваться или секвенироваться. В некоторых вариантах осуществления может быть проведено от 1 до 10 циклов ПЦР; в некоторых вариантах осуществления может быть проведено от 10 до 20 циклов ГЩР; в некоторых вариантах осуществления может быть проведено от 20 до 30 циклов ПЦР; в некоторых вариантах осуществления может быть проведено от 30 до 40 циклов ПЦР; в некоторых вариантах осуществления может быть проведено более 40 циклов ПЦР. Амплификацией может быть линейной амплификацией. Число циклов ПЦР может быть оптимизировано для получения оптимального профиля глубины считывания (DOR). Различные профили DOR могут быть целесообразны для различных целей. В некоторых вариантах осуществления целесообразно более равномерное распределение считываний между всеми анализируемыми фрагментами; если DOR слишком мала для некоторых анализируемых фрагментов, стохастический шум может быть слишком высок для того, чтобы данные были полезными, в то время как, если глубина считывания слишком высокая, пограничная полезность каждого дополнительного считывания относительно мала.
Хвосты праймеров могут улучшить выявление фрагментированной ДНК из универсально маркированных библиотек. Если маркер библиотеки и хвосты праймеров содержат гомологичную последовательность, гибридизация может быть улучшена (например, снижена температура плавления (TM)), а праймеры можно удлинить, если только часть целевой последовательности праймера находится во фрагменте ДНК образца. В некоторых вариантах осуществления могут быть использованы 13 или больше пар оснований, специфичных по отношению к цели. В некоторых вариантах осуществления могут быть использованы от 10 до 12 пар оснований, специфичных по отношению к цели. В некоторых вариантах осуществления могут быть использованы от 8 до 9 пар оснований, специфичных по отношению к цели. В некоторых вариантах осуществления могут быть использованы от 6 до 7 пар оснований, специфичных по отношению к цели. В некоторых вариантах осуществления STA может быть выполнена на преамплифицированной ДНК, например. MDA, RCA, другие виды полногеномных амплификации или опосредованная адаптерами универсальная ПЦР. В некоторых вариантах осуществления STA может быть выполнена на образцах и популяциях, приумноженных определенными последовательностями или истощенных по определенным последовательностям, например, путем отбора по размеру, целевого захвата, направленного разрушения.
3. В некоторых вариантах осуществления возможно выполнение вторичных мультиплексных ПЦР или реакций удлинения праймеров для повышения специфичности и снижения количества нежелательных продуктов. Например, полное вложение, полувложение, гемивложение и/или разделение на меньшие пулы анализируемых фрагментов для параллельных реакций являются методиками, которые могут быть использованы для повышения специфичности. Эксперименты показали, что расщепление образца на три 400-плексные реакции приводит к образованию продукта ДНК с большей специфичностью, чем одна 1200-плексная реакция с такими же праймерами. Аналогично, эксперименты показали, что расщепление образца на четыре 2400-плексные реакции приводит к образованию продукта ДНК с большей специфичностью, чем одна 9600-плексная реакция с такими же праймерами. В варианте осуществления возможно использование специфичных по отношению к целям и специфичных по отношению к маркерам праймеров одинаковой и противоположной направленностей.
4. В некоторых вариантах осуществления можно амплифицировать образец ДНК (разведенный, очищенный или иным путем обработанный), полученный реакцией STA с использованием специфичных по отношению к маркеру праймеров и «универсальной амплификацией», т.е. амплифицировать многие или все преамплифицированные и маркированные цели. Праймеры могут содержать дополнительные функциональные последовательности, например, штрихкоды или полную адаптерную последовательность, необходимую для секвенирования на платформе высокопроизводительного секвенирования.
Эти способы могут быть использованы для анализа любого образца ДНК и особенно полезны, если образец ДНК особенно мал, или если это образец ДНК, в котором ДНК происходит от более одного индивидуума, например, в случае материнской плазмы. Эти способы могут быть использованы на образцах ДНК, таких как ДНК единичных клеток или небольшого количества клеток, геномная ДНК, ДНК плазмы, амплифицированные библиотеки плазмы, амплифицированные библиотеки апоптического супернатанта, или на других образцах смешанной ДНК. В варианте осуществления эти способы могут быть использованы в случае, если у одного индивидуума присутствуют клетки различной генетической структуры, такие как раковые клетки или клетки трансплантатов.
В некоторых вариантах осуществления мультиплексная ПЦР-амплификация может предусматривать использование различных типов протокола вложения, например, полувложенная мини-ПЦР, полностью вложенная мини-ПЦР, гемивложенная мини-ПЦР, тройная гемивложенная мини-ПЦР, односторонняя вложенная мини-ПЦР, односторонняя мини-ПЦР или обратная полувложенная мини-ПЦР.
Диагностический бокс
В варианте осуществления настоящее раскрытие предусматривает диагностический бокс, выполненный с возможностью частичного или осуществления видов способов, описанных в настоящем раскрытии. В варианте осуществления диагностический бокс может быть размещен в кабинете врача, в лаборатории больницы или в любом приемлемом месте, разумно близком к пункту наблюдения за пациентом. С помощью бокса виды способа можно выполнять полностью автоматизированно, или в боксе может потребоваться выполнение одного или ряда этапов вручную лаборантом. В варианте осуществления бокс может предоставлять возможность анализировать генотипические данные, измеренные на материнской плазме. В варианте осуществления бокс может быть связан со средствами передачи измеренных диагностическим боксом генотипических данных во внешний вычислительный центр, который затем может анализировать генотипические данные и, возможно, также создавать отчет. В диагностическом боксе может содержаться роботизированный модуль, который способен перемещать водные или жидкие образцы из одного контейнера в другой. В нем может содержаться ряд реагентов, как твердых, так и жидких. В нем может содержаться высокопроизводительный секвенатор. В нем может содержаться компьютер.
Набор праймеров
В некоторых вариантах осуществления набор может быть составлен с содержанием множества праймеров, сконструированных для реализации описанных в настоящем раскрытии способов. Праймеры могут быть внешними прямыми и обратными праймерами, внутренними прямыми и обратными праймерами, как раскрыто в настоящем документе, они могут быть праймерами, которые были сконструированы с низкой связывающей аффинностью по отношению к другим праймерам в наборе, как раскрыто в разделе по конструированию праймеров, они могут быть зондами гибридного захвата или предварительно циркуляризованными зондами, как описано в соответствующих разделах, или некоторой комбинацией таковых. В варианте осуществления набор может быть составлен для определения статуса плоидности целевой хромосомы у вынашиваемого плода, разработанный для использования в раскрытых в настоящем документе способах набор содержит множество внутренних прямых праймеров и необязательно множество внутренних обратных праймеров, а также необязательно внешние прямые праймеры и внешние обратные праймеры, при этом каждый из праймеров конструируется для гибридизации с областью ДНК непосредственно в 3'-5'-направлении и/или в 5'-3'-направлении от одного из полиморфных сайтов целевой хромосомы и необязательно дополнительных хромосом. В варианте осуществления набор праймеров может быть использован в комбинации с описанным в другом разделе настоящего документа диагностическим боксом.
Оценки, полученные с использованием способа максимального правдоподобия
Многие известные в уровне техники способы определения присутствия или отсутствия фенотипа или генотипа, например, хромосомной аномалии, медицинского состояния или отцовства, включают использование теста отклонения одной гипотезы, при котором измеряют показатель, который непосредственно связан или коррелирует с условием, и если показатель находится по одну сторону от заданного порогового значения, то условие определяют как присутствующее, в то время как если показатель попадает по другую сторону от порогового значения, условие определяют как отсутствующее. Тест отклонения одной гипотезы при выборе между нулевой и альтернативной гипотезами учитывает только распределение, соответствующее нулевой гипотезе. Без учета распределения, соответствующего альтернативной гипотезе, специалист не может оценить правдоподобие каждой гипотезы, принимая во внимание данные наблюдений, и вследствие этого не может рассчитать достоверность при прогнозировании. Следовательно, с тестом отклонения одной гипотезы специалист получит ответ "да" или "нет" без оценки достоверности, связанной с конкретным случаем.
Согласно некоторым вариантам осуществления способ, раскрытый в настоящем документе, способен выявить присутствие или отсутствие фенотипа или генотипа, например, хромосомной аномалии, медицинского состояния или отцовства с использованием способа максимального правдоподобия. Это является существенным улучшением по сравнению со способами, в которых используется методика с отклонением одной гипотезы, поскольку пороговое значение для прогноза отсутствия или присутствия условия можно корректировать подходящим образом для каждого случая. Это особенно уместно для диагностических методик, целью которых является определение отцовства для вынашиваемого плода, исходя из генетических данных, доступных из смеси ДНК плода и матери, присутствующей в свободноплавающей ДНК, обнаруживаемой в плазме крови матери. Способ оценки максимального правдоподобия может использовать аллельные распределения, связанные с каждой гипотезой, для оценки правдоподобия данных с учетом условий для каждой гипотезы. Эти обусловленные вероятности можно затем преобразовать в прогноз и достоверность гипотезы. Подобным образом, способ оценки с помощью апостериорного максимума использует те же самые обусловленные вероятности, что и оценка максимального правдоподобия, но также предусматривает априорные распределения в популяции при выборе наилучшей гипотезы и определении достоверности.
Исходя из вышеизложенного, использование методики оценки максимального правдоподобия (MLE) или близкородственной методики с использованием апостериорного максимума (MAP) дает два преимущества, во-первых, она повышает шанс верного прогноза, и она также позволяет рассчитать достоверность для каждого прогноза. Согласно варианту осуществления выбор прогнозируемого результата при выяснении отцовства, соответствующего гипотезе с наибольшей вероятностью, выполняют с использованием оценок, полученных с помощью способа максимального правдоподобия, или оценок с использованием апостериорного максимума. Согласно варианту осуществления раскрыт способ определения отцовства для вынашиваемого плода, который предусматривает использование любого способа, известного в настоящее время в уровне техники, который использует методику отклонения одной гипотезы, и переформулирование его так, чтобы он использовал методики MLE или MAP.
Способ определения отцовства
ffДНК, как правило, присутствует в низком относительном количестве в смеси с ДНК матери. Согласно некоторым вариантам осуществления мать имеет известный генотип, или генотип матери можно определить или вывести. Как правило, относительное количество ДНК плода, обнаруживаемой в плазме крови матери, составляет от 2% до 20%, хотя при разных условиях это процентное значение может находиться в диапазоне от приблизительно 0,01% до приблизительно 50%. Согласно варианту осуществления микроматричный анализ или другая методика, которая предоставляет данные плотности в расчете на аллель, можно применять для анализа плазмы крови матери. Согласно варианту осуществления секвенирование можно применять для анализа ДНК, содержащейся в плазме крови матери. В этих случаях измеренное значение плотности аллеля или количества импульсов счета для ридов при секвенировании для конкретного аллеля являются суммой сигналов от матери и плода. При предположении, что соотношение ДНК ребенка к ДНК матери в смеси составляет r к 1, относительное количество аллелей в локусе состоит из 2 аллелей от матери и 2 r аллелей от ребенка. Согласно одному варианту осуществления локусы содержат однонуклеотидные полиморфизмы. В Таблице 1 показано относительное количество каждого аллеля в смеси для выбора информативных контекстов у родителей.
Следует заметить, что выбор вышеприведенных четырех контекстов в качестве информативных не предназначен для включения всех контекстов, которые могут быть информативными. Можно использовать любое сочетание контекстов, и существует существенное количество информации, которую можно найти при генотипическом анализе любого контекста.
Даже при наличии существенной частоты выпадения аллеля у ребенка может существовать явное различие между сигналом, где аллель присутствует, и сигналом, где аллель не присутствует. Например, рассмотрим данные для аллеля А, полученные с помощью измерения SNP (однонуклеотидный полиморфизм) у пар с контекстом ВВ|ВВ и ВВ|АА, и данные для аллеля В, полученные с помощью измерения SNP у пар с контекстом АА|АА и АА|ВВ. В каждом случае, в первом контексте сигнал не должен присутствовать и сигнал должен присутствовать во втором контексте, в любых условиях, где аллели ребенка не подверглись выпадению. Однако если предполагаемый отец является выбранным ошибочно, сигнал иногда будет присутствовать сигнал в обоих контекстах. Следовательно, распределение данных, полученных с помощью измерения SNP, должно отличаться в зависимости от того, является ли предполагаемый отец выбранным верно или нет.
Различие, как правило, будет более заметно на конце распределения с более высоким уровнем сигнала, поскольку он будет характеризовать SNP, где присутствует более высокое правдоподобие присутствия доли ДНК ребенка. Это различие можно заметить при сравнении значений высоких процентилей для распределений данных, полученных с помощью измерения SNP. Примерами возможных способов с использованием процентилей являются определение ближайшего ранга, линейная интерполяция между ближайшими друг к другу рангами и определение взвешенного процентиля.
Например, определим X1 как набор данных, полученных с помощью измерения SNP для аллеля А в контексте ВВ|ВВ, и Х2 - как набор полученных с помощью измерения данных для аллеля А в контексте ВВ|АА от всех хромосом. Если предполагаемый отец выбран правильно, то значение 99го процентиля у X1 будет существенно меньше, чем значение 99го процентиля у Х2. Если предполагаемый отец выбран ошибочно, значения 99го процентиля у двух распределений будут ближе друг к другу. Следует заметить, что любой процентиль можно использовать с тем же успехом, например, 9ый процентиль, 90ый процентиль, 85ый процентиль или 80ый процентиль. Согласно варианту осуществления для конкретного измерительного канала, X1 можно определить как данные, полученные с помощью измерения в контексте с отсутствием сигнала, и Х2 можно определить как данные, полученные с помощью измерения в контексте, где как мать, так и отец являются гомозиготными, и только аллели отца обеспечивают сигнал (унаследованы ребенком).
Определим p1 как 99ый (или 95ый, 90ый и так далее) процентиль у данных X1, и р2 как 99ый (или 95ый, 90ый и так далее) процентиль у данных Х2. Определим статистический критерий t как p1/p2. Следует заметить, что другие функции для р1 и р2, которые демонстрируют различие значений можно использовать с тем же успехом. Значение t будет варьировать в зависимости от количества ДНК ребенка, присутствующей в образце, которое неизвестно. Исходя из вышеизложенного, классификакцию пороговых значений для t нельзя рассчитать предварительно.
Статистический критерий t для одного образца можно сравнить с распределением, полученным из генотипов многих индивидов, о которых известно, что они не являются отцом, с использованием следующей процедуры. Предположим, что доступны генотипы из трех больших наборов неродственных индивидов.
1. Для каждого из неродственных индивидов предположим, что он является отцом, и рассчитаем значение статистического критерия t.
2. Допустим, что Tu представляет набор измерений t у неродственных мужчин. Аппроксимируем распределение в Tu. Оно представляет собой распределение t для конкретного образца в условиях нулевой гипотезы. Нулевая гипотеза заключается в том, что "генотипы не происходят от отца ребенка, ДНК которого присутствует в образце". Распределение Pu(t) может представлять собой аппроксимацию, полученную с использованием способа максимального правдоподобия, или аппроксимацию, полученную с использованием метода моментов, аппроксимацию к любому известному распределению, например к распределению Гаусса, аппроксимация ядерной оценки плотности с использованием ядерной функции, например, функции Гаусса, прямоугольной функции, треугольной функции и так далее, или любого другого подходящего способа аппроксимации распределения.
3. Рассматриваем генотипы предполагаемого отца и рассчитываем соответствующий статистический критерий tc.
4. Для истинного отца ожидается получение в результате меньшего значения t, чем для неродственного индивида. Вероятность того, что для неродственного отца будет получено tc или более отдаленное значение является кумулятивной функцией плотности распределения Pu, оцениваемой при tc. Следовательно, р-значение р для отклонения нулевой гипотезы имеет следующий вид:
Если р попадает ниже порогового значения значимости α, то гипотеза, что предполагаемый отец является неродственным индивидом, может быть отклонена с значимостью α. Если р больше, чем α, то нулевая гипотеза не может быть отклонена, и предполагаемый отец может быть неродственным по отношению к ребенку, ДНК которого присутствует в образце. Значимость порогового значения α определяет вероятность того, что неродственный индивид может быть классифицирован как истинный отец. Например, при пороговом значении а равном 0,01 один процент из неродственных индивидов можно идентифицировать в качестве истинного отца.
Можно рассматривать различные способы комбинирования данных от каналов для аллеля А и В. Например, два простых способа требуют того, чтобы р-значение от всех каналов было ниже порогового значения, или требуют того, чтобы р-значение от любого канала было ниже порогового значения.
Согласно некоторым вариантам осуществления способ установления отцовства предполагает, что ДНК ребенка присутствует в достаточной концентрации для проведения различий между SNP, которые характеризуются присутствием или отсутствием сигнала от ребенка. В отсутствие достаточной концентрации ДНК ребенка этот способ может сообщить об "ошибочно выбранном отце", поскольку ожидаемые унаследованные по отцовской линии аллели не определяются в плазме крови матери. Согласно варианту осуществления описан способ, который подтверждает присутствие достаточного количества ДНК ребенка до применения теста на установление отцовства. Подтверждение присутствия ДНК ребенка основывается на расчете статистического критерия, который является пропорциональным концентрации ДНК ребенка, но не требует знания генотипов отца. Если статистический критерий выше требуемого порогового значения, то концентрация ДНК ребенка является достаточной для проведения теста на установление отцовства.
Рассмотрим набор SNP (от всех хромосом в сумме), где генотип матери представляет собой АА, и измерения проводят по каналу В. Сигнал ожидается только у субпопуляции SNP, где генотип ребенка содержит В, но эти SNP не могут быть идентифицированы заранее без генотипов отца, которые недоступны. Вместо этого, рассмотрим частоты {fi} SNP в популяциях, где fi представляет собой среднее количество образцов с В в генотипе SNP i на основе большой популяции образцов. Следует заметить, что большинство SNP, где генотип матери представляет собой АА, будут иметь fi менее 0,5, но распределение fi в этих SNP простирается почти до единицы. Рассмотрим два набора SNP, S1 и S2, где S1={i:fi<TL} и S2={i:fi>Тн}. Пороговые значения TL и ТН установлены так, чтобы очень малое количество SNP в S1, как ожидается, имели В, и многие SNP в S2, как ожидается, имели В, и каждый набор содержал достаточную популяцию. Согласно одному варианту осуществления алгоритм использует TL=0,05 и ТН=0,7, в то время как другие значения для TL и ТН могут работать с тем же успехом или лучше. Примем yi за данные, полученные с помощью измерения по каналу В от SNP i, Y1={yi:i∈S1}, и Y2={yi:i∈S2}. Распределения Y1 и Y2 будут очень похожи, поскольку большинство SNP в обоих распределениях характеризуются отсутствием сигнала. Однако некоторое ненулевое количество SNP в S2, как ожидается, характеризуются присутствием сигнала от ДНК ребенка, и очень немногие SNP в S1, как ожидается, характеризуются присутствием сигнала от ДНК ребенка. Исходя из вышеизложенного, "хвост" у Y2 нужно продолжить до более высокой интенсивности, чем "хвост" у Y1. Предположим, что pt представляет собой процентиль, близкий к 1, например, 99ый процентиль. В присутствии достаточного количества ДНК ребенка процентиль pt у Y2 должен быть существенно выше, чем процентиль pt у Y1. Следовательно, статистический критерий s можно определить следующим образом:
s=процентиль(Y2; pt)-процентиль(Y1; pt).
Согласно одному варианту осуществления статистический критерий можно нормализовать с помощью ряда способов, чтобы попытаться учесть различия в амплификации среди матриц. Согласно одному варианту осуществления нормализацию можно выполнить в расчете на хромосому. Согласно одному варианту осуществления нормализацию можно выполнить в расчете на матрицу. Согласно одному варианту осуществления нормализацию можно выполнить в расчете на один цикл секвенирования.
Следующий расчет демонстрирует, как с помощью пороговых значений TL и ТН можно различить влияние ДНК ребенка в конкретном материнском образце, исходя из примерных количеств SNP и частот выпадения.
Согласно одному варианту осуществления способ предусматривает следующие предположения:
- частоты в популяции рассчитывают, исходя из набора данных от большой популяции, например, более чем 500 индивидов, более чем 1000 индивидов, более чем 5000 индивидов или более чем 20000 индивидов, и количество SNP в каждом контексте получают для иллюстративных матери и отца;
- SNP отсутствуют там, где мать представляет АА, а отец представляет ВВ (в действительности, они составляют примерно 8 процентов SNP для матери с АА);
- половина SNP, где отец имеет В, дают в результате В у ребенка;
- частота выпадения у ребенка составляет 90 процентов;
- измеренные значения с сигналом от ребенка будут выше, чем измеренные значения без сигнала от ребенка.
В Таблице 3 показаны некоторые данные из конкретного случая определения отцовства с использованием раскрытого способа при вышеприведенных параметрах. Не ожидалось, что измеренные значения 98го процентиля от S1 будут включать какие-либо SNP с присутствием сигнала от ребенка. Измеренные значения 98го процентиля от S2, как ожидалось, будут включать приблизительно 50 SNP с присутствием сигнала от ребенка. Различие между этими двумя гипотезами должно отражать величину сигнала от ребенка.
На фигуре 1 показано распределение данных плотности аллеля для контекстов АА|АА и АА|ВВ из образца плазмы крови матери, собранного на 38 неделе. Измеряют аллель В. Следует заметить, что распределение АА|ВВ распространяется значительно выше, чем распределение АА|АА, это показывает, что аллель В (который присутствует только в геноме ребенка) присутствует в контексте АА|ВВ, а не в контексте АА|АА. фигура 2 происходит из того же образца плазмы крови матери, что и фигура 1, и на ней показано распределение для статистического критерия t для аллеля В с использованием генотипов от 200 неродственных индивидов. Показаны два распределения (две кривые): гауссовская аппроксимация максимального правдоподобия и ядерная аппроксимация распределения. Значение tc для биологического отца помечено звездочкой. р-Значение составляет меньше чем 10-7 для нулевой гипотезы, заключающейся в том, что предполагаемый отец является неродственным в отношении ребенка.
В Таблице 4 представлены результаты от 8 образцов крови матери на разных сроках беременности. р-Значение рассчитывают, исходя из данных, измеренных по каждому каналу (аллель А и аллель В) для истинного отца. Если требуется, чтобы р-значения для обоих каналов были ниже 0,01, то два образца являются классифицированными неверно. Если требуется, чтобы значение только для одного канала превышало пороговое значение, то все образцы являются классифицированными верно. Любое количество показателей и пороговых значений можно использовать для подтверждения или исключение отцовства. Например, специалист в данной области техники может использовать отсекающее р-значение 0,02, 0,005, 0,001 или 0,00001; подобным образом, специалист в данной области техники может требовать, чтобы р-значения для одного или обоих каналов были ниже заданного порогового значения, или специалист в данной области техники может иметь два различных пороговых значения для р-значений у разных каналов.
В Таблице 4 показаны Р-значения для нулевой гипотезы, заключающейся в том, что истинный отец является неродственным индивидом. Каждая строка соответствует отличающемуся образцу крови матери, и соответствующему генетическому образцу от отца. Генетические данные, полученные с помощью измерений, выполненные на 200 неродственных мужчинах, использовали в качестве контроля. Кривая на фигуре 3 показывает распределение отношений плотности для 200 неродственных мужчин, и звездочкой представлено соотношение плотности для биологического отца. Эти данные получены для случая, где кровь забирали у матери, которая была на 11 неделе беременности.
На фигуре 4 показаны кривые частоты кумулятивного распределения (cdf), для корреляционного соотношения между данными, полученными с помощью измерения генотипа плода, и данными, полученными с помощью измерения генотипа отца, для трех случаев: (1) где как беременная мать, так и предполагаемый отец являются биологическими родителями плода ("верно", крайняя правая кривая), (2) где беременная мать является биологической матерью плода, а предполагаемый отец не является биологическим отцом плода ("одно ошибочное", средняя кривая), и (3) где ни беременная мать, ни предполагаемый отец не являются биологическими родителями плода ("оба ошибочные", крайняя левая кривая). Кривые cdf представляют собой корреляционное соотношение между данными исследования генотипа эмбриона, рассчитанные, исходя из данных, полученных с помощью измерения на одной клетке, и данными исследования генотипа предполагаемых родителей, если ноль, один или двое из предполагаемых родителей в действительности являются генетическим родителями плода. Следует заметить, что пометки "верно" и "оба ошибочные" перепутаны. На фигуре 5 показаны гистограммы для тех же трех случаев. Следует заметить, что данная гистограмма составлена на основании более чем 1000 случаев, где один или оба родителя определены ошибочно. Гистограмма корреляционного соотношения, измеренного между данными исследования генотипа плода, которые получены на одной клетке, и данными исследования генотипа предполагаемых родителей, когда ноль, один или двое из предполагаемых родителей в действительности являются генетическими родителями плода.
Тридцать пять результатов теста на отцовство показаны на фигуре 6 с использованием данного способа для проведения теста на установление отцовства. Их проводили на образцах, собранных у беременных женщин с гестационным возрастом плода, варьирующим от 9 до 40 недель. Красная кривая справа представляет собой нормализованное гауссово распределение статистических данных при проведении теста на установление отцовства для 800 неродственных мужчин. Распределение у неродственных мужчин отличалось для каждого случая; нормализованное распределение используется в настоящем описании с целью визуализации.
Голубые столбики представляют нормализованный статистический критерий для истинного (потенциального) отца. Понятно, что истинные отцы четко отделяются от неродственных мужчин. Следует заметить, что нормализованный статистический критерий грубо приравнивается к стандартным отклонениям, исходя из вышеизложенного, "-5" на графике ниже составляет приблизительно 5 стандартных отклонений от среднего значения. Таким образом, все предполагаемые истинные отцы в этой группе были подтверждены как истинные отцы со значимостью по меньшей мере 99,9999%.
Согласно одному варианту осуществления настоящего изобретения знание родительских гаплотипов можно использовать для повышения точности теста. Например, если два гаплотипа отца известны для данного сегмента хромосомы, то знание того, какие SNP присутствуют в случаях, когда нет выпадения, можно использовать для определения того, каких SNP следует ожидать для тех случаев, когда может существовать выпадение. Например, представим набор из трех SNP, которые являются связанными, то есть, они располагаются близко по отношению друг к другу на той же хромосоме, и где контексты у матери и предполагаемого отца представляют собой: АА|АВ, АА|АВ, АА|ВА. Следует заметить, что если генотип родителя фазирован, то АВ≠ВА, поскольку первая из двух букв представляет аллели в первом гаплотипе, а вторая буква представляет аллели во втором гаплотипе. А теперь представим, что у этих трех SNP существенный уровень аллеля В измеряют для всех трех; в этом случае, вероятность того, что предполагаемый отец является истинным отцом, является низкой, так как два гаплотипа отца представляют собой А, А, В и В, В, А, в то время как полученный с помощью измерений генотип плода является положительным в отношении В при всех трех SNP, и вклад матери может быть представлен только А. Если генотип отца не фазирован, не представляется возможности исключить этого предполагаемого отца, принимая во внимание этот набор данных, полученных с помощью измерений. Согласно одному варианту осуществления указывается, что определение гаплотипов отца можно проводить с учетом данных, полученных с помощью измерения измерений ДНК диплоидного генома, вместе с данными генетических измерений гаплоидного набора хромосом, выполняемыми на одном или нескольких сперматозоидах. Применение более чем одного сперматозоида может позволить определение гаплотипов с большей точностью, равно как и определить, сколько случаев кроссинговера могут иметь место для каждой из хромосом вместе с их расположением во время мейоза, при котором образуется сперматозоид. Способ выполнения данного фазирования для отца можно найти более подробно описанным в четырех патентных заявках за авторством Rabinowitz, упоминаемым в других местах в настоящем документе.
Согласно варианту осуществления определение отцовства выполняют исключительно с использованием данных, полученных с помощью измерения SNP, и при этом не используют данные единичных тандемных повторов. Согласно варианту осуществления определение отцовства выполняют исключительно с использованием данных, полученных с помощью измерения как SNP, так и STR. Данные SNP можно получить с помощью измерения с использованием микроматриц для выявления SNP, или их можно получить с помощью секвенирования. Секвенирование может быть ненаправленным, или оно может быть направленным, например, при использовании циклизирующих зондов, которые могут быть направлены на набор полиморфных локусов, или его можно использовать при направлении с использованием захвата с помощью методик гибридизации. Согласно некоторым вариантам осуществления генетические данные можно измерить с помощью сочетания способов; например, генетические данные отца можно получить с помощью измерения на микроматрице для выявления SNP, в то время как данные для ДНК, выделенной из сыворотки крови матери, можно получить с помощью направленного секвенирования, где захватывающие зонды для гибридизации используются для нацеливания на те же SNP, что и обнаруживаемые на микроматрице для выявления SNP. Согласно одному варианту осуществления комбинацию следующих типов данных можно использовать для определения того, является ли предполагаемый отец биологическим отцом плода или нет: данные SNP, данные STR, данные в отношении кроссинговера, данные в отношении микроделеций, данные в отношении вставок, данные в отношении транслокаций или другие генетические данные.
Согласно варианту осуществления способ может предусматривать создание отчета, раскрывающего установленного отца плода или другого целевого индивида. Согласно варианту осуществления отчет можно создать с целью сообщения об определении отцовства. Согласно варианту осуществления отчет может содержать вероятность того, что предполагаемый отец является биологическим отцом плода. Некоторые примеры такого отчета показаны в настоящем документе; фигуре 7 представляет собой пример отчета, раскрывающего исключение факта отцовства, фигура 8 представляет собой пример отчета, раскрывающего наличие факта отцовства, и фигура 9 представляет собой пример отчета, указывающего на неопределенный результат. Согласно одному варианту осуществления отчет может содержать график, содержащий распределение связанного с отцовством показателя для множества неродственных индивидов по отношению к данному плоду и матери (показан в виде серой кривой), и указание показателя для предполагаемого отца (показан в виде треугольника). Распределение у неродственных мужчин отличается для каждого случая; в этих трех отчетах в настоящем документе используют фактическое распределение статистического критерия для плода и неродственных мужчин. Согласно варианту осуществления отчет также может содержать указание на то, что предполагаемый отец, скорее всего, является частью распределения неродственных индивидов (например, фигура 7), и, исходя из вышеизложенного, установлено, что предполагаемый отец не является биологическим отцом плода; тот факт, что треугольник находится в участке графика, соответствующем исключению факта отцовства, указывает на исключение факта отцовства. Согласно варианту осуществления отчет также может содержать указание на то, что предполагаемый отец, скорее всего, не является частью распределения связанного с отцовством показателя для неродственных индивидов (например, фигура 8), и установлено, что предполагаемый отец является биологическим отцом плода; тот факт, что треугольник находится в участке графика, который соответствует присутствию отцовства, указывает на наличие факта отцовства. Согласно варианту осуществления отчет также может содержать указание на то, что данные измерений являются неопределенными (например, фигура 9); тот факт, что треугольник находится в участке графика, который соответствует "неопределенному результату", указывает на то, что нет возможности сделать какие-либо выводы в отношении установления отцовства плода.
Согласно одному варианту осуществления настоящего изобретения определение того, является ли предполагаемый отец биологическим отцом плода или нет, выполняют без использования данных об отдельных тандемных повторах (STR). Согласно одному варианту осуществления настоящего изобретения точность определения отцовства повышается путем фазирования генотипов родителей. Согласно одному варианту осуществления настоящего изобретения генотипы одного или нескольких из родителей фазируют с применением генетического материала от одного или нескольких индивидов, находящихся в родстве с этим родителем. Согласно одному варианту осуществления индивидом, находящим в родстве с родителем, является отец, мать, сибс, сын, дочь, брат, сестра, тетка, дядя, близнец, клон родителя, гамета от родителя и их сочетания.
Другой способ определения отцовства
Согласно варианту осуществления данные для плазмы крови матери и необязательно другого генетического материала можно измерить с помощью секвенирования, например, с использованием секвенаторов с высокой пропускной способностью, таких как HISEQ или MISEQ от ILLUMINA или ION TORRENT от LIFE TECHNOLOGIES.
Неинвазивный тест на установление отцовства можно провести на образце крови матери, если присутствует существенная концентрация свободноплавающей ДНК плода. В целом, доля ДНК плода в плазме крови матери в большинстве случаев будет составлять приблизительно от 2 процентов до 20 процентов, хотя она может составлять от 0,01% или до 40%, в некоторой степени завися от гестационного возраста. Уже было продемонстрировано, что этот диапазон доли ДНК плода является существенным для проведения теста на установление отцовства с помощью способа отклонения одной гипотезы с использованием микроматриц для выявления SNP. Секвенирование с высокой пропускной способностью является платформой, обладающей гораздо более высокой точностью, что дает возможность математического моделирования ожидаемого ответа, полученного с помощью измерений при каждом SNP для комбинаций генотипов матери и ребенка. Согласно варианту осуществления данные для плазмы крови матери и необязательно другого генетического материала можно получить с помощью измерений при секвенировании, например, с использованием секвенаторов с высокой пропускной способностью, таких как HISEQ или MISEQ от ILLUMINA или ION TORRENT от LIFE TECHNOLOGIES. Достоверности для случаев присутствия отцовства и исключения отцовства можно затем рассчитать с использованием теории вероятности и/или теории статистического оценивания.
Согласно варианту осуществления способ проведения теста на установление отцовства может предусматривать следующее. Для предполагаемого отца специалист в данной области техники может, исходя из данных секвенирования, полученных из плазмы крови, рассчитать вероятность для двух различных гипотез: (1) предполагаемый отец является истинным (биологическим) отцом (Hc), и (2) предполагаемый отец не является истинным (биологическим) отцом (Hw). Затем выбирают гипотезу, которая характеризуется более высоким правдоподобием или апостериорной вероятностью. Согласно варианту осуществления этот подход можно сочетать с базовой моделью, которая связана с соотношением аллелей в плазме крови к наблюдаемому количеству секвенированных аллелей А и В. С доступной базовой моделью возможно получение вероятностных оценок правдоподобия для секвенированных аллелей А и В при каждом расположении SNP для каждой гипотезы.
Одна сложность заключается в том, что значение доли ДНК плода в плазме крови матери может изменяться между индивидами и с течением времени. Согласно варианту осуществления способ может учитывать эту изменчивость. Существует несколько способов разрешения сложностей, связанных с данным типом изменчивости. Согласно варианту осуществления с помощью способа можно ясно оценить долю ДНК плода; согласно другому варианту осуществления с помощью способа можно принять ранее полученные данные за неизвестное количество и интегрировать по всем возможным значениям. Согласно варианту осуществления может использоваться ранее полученные данные, то есть они могут присутствовать в виде равномерного распределения от 0 до определенного порогового значения, например 40%. Любые ранее полученные данные могут работать в теории. Согласно варианту осуществления рассчитывают оценки правдоподобия для различных значений доли ДНК ребенка либо в непрерывном пространстве, либо на конечном разбиении и интегрируют или суммируют по диапазону, соответственно.
Рассмотрим плазму крови матери с долей ДНК плода, f, и одним SNP, где ожидаемое соотношение аллелей, присутствующих в плазме крови, представляет собой r (на основе генотипов матери и плода). Согласно варианту осуществления ожидаемое соотношение аллелей определено как ожидаемая доля аллелей А в объединенной ДНК матери и плода. Для генотипа матери gm и генотипа ребенка gc ожидаемое соотношение аллелей задается уравнением 1, если предположить, что генотипы представлены также как и соотношения аллелей.
Данные исследования при SNP включают число нанесенных на карту ридов, na и nb, где присутствует каждый аллель, что в сумме дает "глубину" рида d. Предположим, что к вероятностям нанесения на карту применили меры по контролю качества с тем, чтобы результаты нанесения на карту и результаты наблюдения для аллелей можно было считать верными. Простой моделью для правдоподобия наблюдения является биномиальное распределение, которое предполагает, что каждый из d ридов независимо взят из большого пула, который содержит соотношение аллелей r. Уравнение 2 описывает эту модель.
Если генотипы матери и плода представляют собой либо исключительно А, либо исключительно В, ожидаемое соотношение аллелей в плазме крови будет равно 0 или 1, а pbino не будет четко определено. Помимо этого, это является нежелательным, поскольку на практике иногда определяют неожиданные аллели. Биномиальную модель можно уточнить с помощью ряда способов. Согласно варианту осуществления возможно использование скорректированного соотношения аллелей
Основную базовую модель для ответа при SNP можно определить как F(a,b,gc,gm,f) (3) или вероятность наблюдения na=а и nb=b с учетом генотипов матери и плода, которая также зависит от доли ДНК плода через уравнение 1.
Следует заметить, что целесообразным может быть упрощение формулы (3) путем установления условий к функции gc, gm и f, например, при использовании r, как определено в (1), и примера биномиальной модели в (2). Тогда уравнение для F можно записать в виде
В целом, функциональная форма F может представлять собой биномиальное распределение, бета-биномиальное распределение, многомерное распределение Пойа, эмпирическое распределение, оцениваемое, исходя из данных режима обучения, или подобные функции, которые обсуждались выше. Согласно варианту осуществления функциональная форма F принимает различные формы в зависимости от гипотезы для числа копий в рассматриваемой хромосоме.
Способ расчета доли ДНК плода
Определение доли ДНК плода, которая присутствует в смешанной фракции ДНК, может быть неотъемлемой частью любого способа неинвазивного пренатального определения отцовства, прогнозирования плоидности или прогнозирования аллеля. Согласно некоторым вариантам осуществления долю ДНК плода из смешанного образца можно определить с использованием данных о генотипе матери, данных о генотипе отца и измеренных данных о генотипе из смешанного образца, который содержит ДНК как матери, так и плода. В случае проведения теста на установление отцовства, а также в меньшей степени в случае прогнозирования плоидности личность отца неизвестна и, исходя из вышеизложенного, данные о генотипе биологического отца плода могут быть недоступны. В этих случаях важно иметь способ определения доли ДНК плода, при котором нет потребности в генотипе биологического отца плода. В настоящем документе описаны несколько способов, с помощью которых выполняют оценку доли ДНК плода. Эти способы описаны в общих чертах с тем, чтобы они являлись подходящими, когда генотип биологического отца доступен и когда он недоступен.
В отношении конкретной хромосомы предположим, что мы рассматриваем N SNP, в отношении которых мы имеем следующие данные:
- набор данных секвенирования NR в плазме крови S=(S1,…,SNR). Согласно варианту осуществления, где мы имеем количество импульсов счета (А,В) для аллелей А и В при каждом SNP, s можно записать как s=((a1,b1),…,(aN,bN)), где ai представляет собой количество импульсов счета а при SNP i, bi представляет собой количество импульсов счета b при SNP i, и
- данные родителей, включающие:
- информацию о генотипе: мать Gm=(Gm1,…,GmN); отец Gf=(Gf1,…,GfN), где Gmi, Gfi∈(АА,АВ,ВВ); и/или
- полученные данные секвенирования: данные для матери NRM sm=(sm1,…,smnr), данные для отца NRF Sf=(Sf1,…,Sfnr). Подобно вышеприведенному упрощению, если мы имеем количество импульсов счета (А,В) при каждом SNP Sm=((am1,bm1),…,(amN,bmN)), Sf=((af1,bf1),…,(afN,bfN)).
В совокупности данные ребенка, полученные от матери и отца, можно определить как D=(Gm,Gf,Sm,Sf,S). Согласно варианту осуществления доступны данные о генотипе от обоих родителей; согласно варианту осуществления доступны данные только о генотипе матери; согласно варианту осуществления доступны данные только о генотипе отца; согласно варианту осуществления данные о генотипе какого-либо из родителей недоступны. Согласно некоторому варианту осуществления данные о генотипе матери можно вывести из данных о генотипе, полученных в смешанном образце. Следует заметить, что, в целом, данные родителей являются желательными и повышают точность алгоритма, но не являются необходимыми.
Оценка доли ДНК ребенка
Согласно варианту осуществления специалист в данной области техники может разбить интервал возможных значений доли ДНК ребенка на набор С находящихся на малом расстоянии друг от друга точек и произвести расчеты в каждой точке, что сокращает вышеприведенное уравнение до:
P(f|D) представляет собой правдоподобие для конкретной доли ДНК ребенка f с учетом данных D. Специалист в данной области техники может дополнительно получить с использованием правила Байеса:
P(f|D)~P(D|f)*P(f),
где P(f) представляет собой априорное весовое значение для конкретной доли ДНК ребенка. Согласно варианту осуществления его можно получить из неинформативного априорного распределения (равномерного), и оно может быть пропорциональным расстоянию между возможными значениями доли ДНК ребенка в наборе С.
P(D|cfr) представляет собой правдоподобие указанных данных с учетом конкретной доли ДНК ребенка, полученное при допущениях о конкретном количестве копий на соответствующих хромосомах. Согласно варианту осуществления специалист в данной области техники может предположить дисомию в используемых хромосомах. Правдоподобие данных при всех SNP является произведением правдоподобия данных при отдельных SNP.
где i обозначает конкретный SNP, тогда для SNP i получаем:
где gm представляет собой возможные верные генотипы матери, gf представляет собой возможные верные генотипы отца, gc представляет собой возможные генотипы ребенка, и gm, gf, gc∈{АА,АВ,ВВ}.
P(gm|i) представляет собой общую априорную вероятность генотипа матери gm при SNP i, на основе известной частоты в популяции при SNP i, обозначенной pAi. В частности:
p(AA|pAi)=(pAi)2,
р(AB|pAi)=2(pAi)*(1-pAi),
То же самое для p(f|i), вероятности генотипа отца.
Пусть обозначение P(gc|gm,gf,H) представляет собой вероятность получения верного генотипа ребенка = с с учетом родителей m, f и предполагаемой гипотезы Н, которую можно легко рассчитать. Например, для дисомии:
Пусть P(D|gm,gf,gc,H,i,f)be будет вероятностью для указанных данных D при SNP i с учетом верного генотипа матери m, верного генотипа отца f, верного генотипа ребенка с, гипотезы Н для числа копий и доли ДНК ребенка f. Ее можно разбить на вероятность данных для матери, отца и ребенка следующим образом:
Вероятность g данных о генотипе матери, полученных с использованием способа Illumina, при SNP i в сравнении с верным генотипом gm, предполагая, что генотипы, полученные с использованием способа Illumina, являются верными, представляет собой не что иное как:
Согласно варианту осуществления вероятность для данных секвенирования от матери при SNP i, в случае количества импульсов счета Smi=(ami,bmi), без включения дополнительного "шума" или отклонения, представляет собой вероятность биномиального распределения, определяемую как: P(Sm|,i)=PX|m(ami), где X|m~Binom(pm(A), ami+bmi), где Pm(A) определено как:
Подобное уравнение применяется для вероятностей в отношении отца.
Следует заметить, что является возможным получение ответа без данных от родителей, особенно без данных от отца. Например, если данные о генотипе отца F недоступны, специалист в данной области техники может использовать P(Gf|gf,i)=1. Если данные секвенирования для Sf недоступны, специалист в данной области техники может использовать P(Sf|gf,i)=1. Согласно варианту осуществления информацию от различных хромосом объединяют с использованием средних значений, средневзвешенных значений или подобной функции.
Другой способ расчета доли ДНК плода
Другой способ определения доли ДНК плода в смеси ДНК описан в настоящем разделе. Согласно одному варианту осуществления вариант оценки максимального правдоподобия в отношении доли ДНК плода f для теста на установление отцовства, теста на плоидность или другой цели можно получить без использования информации от родителей. Определим S0 как набор SNP с генотипом матери 0 (АА), S0,5 как набор SNP с генотипом матери 0,5 (АВ) и S1 как набор SNP с генотипом матери 1 (ВВ). Возможные генотипы плода при S0 представляют собой 0 и 0,5, давая в результате 7 набор возможных соотношений аллелей
Определим Na0 и Nb0 как векторы, образованные количеством импульсов счета при секвенировании для SNP при S0, подобным образом, Na0,5 и Nb0,5 для S0.5, и подобным образом, Na1 и Nb1 для S1. Оценка максимального правдоподобия
Если предположить, что количества импульсов счета для аллелей при каждом SNP являются независимыми с учетом условий для соотношения аллелей при SNP для ДНК в плазме крови, то вероятности можно выразить в виде произведения вероятностей для SNP в каждом наборе:
,
где nas, nbs представляют собой количество импульсов счета при s SNP.
Зависимость от f укладывается в возможные соотношения аллелей R0(f), R0,5(f) и R1(f). Вероятность SNP P(nas,nbs|f) можно приближенно выразить предположением генотипа с максимальным правдоподобием с учетом условий для f. При сравнительно высокой доле ДНК плода и "глубине" рида, выбор генотипа с максимальным правдоподобием будет обладать высокой достоверностью. Например, при доле ДНК плода в 10 процентов и "глубине" рида 1000 рассмотрим SNP, где мать имеет генотип 0. Ожидаемые соотношения аллелей равны 0 и 5 процентов, которые будут легко различимы при достаточно большой "глубине" рида. Замена оцениваемого генотипа ребенка в уравнении 5 приводит к полному уравнению (6) для оценки доли ДНК плода.
(6)
Доля ДНК плода должна находиться в диапазоне [0,1] и, таким образом, оптимизацию легко можно осуществить с использованием одномерного поиска с заданными ограничениями.
Другим способом может быть суммирование возможных генотипов при каждом SNP, что дает в результате следующее выражение (7) для P(na,nb|f) с SNP при S0. Априорную вероятность Р(r) можно предположить равномерной по R0(f) или можно получить, исходя из частот в популяции. Распространение на группы S0,5 и S1 является обычным.
Получение вероятностей
Достоверность можно рассчитать, исходя из данных правдоподобия двух гипотез Htf, то есть предполагаемый отец является биологическим отцом, и Hwf, то есть предполагаемый отец не является биологическим отцом. Целью является расчет P(H|D), то есть вероятности исходных данных гипотезы, для каждой гипотезы и получение заключения о том, какая гипотеза является более вероятной. Согласно одному варианту осуществления это можно выполнить с использованием правила Байеса: P(WD)~P(D|H)*Р(Н), где Р(Н) представляет собой априорный вес гипотезы, и где P(D|H) представляет собой правдоподобие данных с учетом гипотезы.
Рассмотрим P(D|H,f), то есть правдоподобие данных с учетом гипотезы для конкретной доли ДНК ребенка. Если доступно распределение для доли ДНК ребенка, можно получить
и далее.
Следует заметить, что P(f|H) является независимым от гипотезы, то есть P(f|H)=P(f), поскольку доля ДНК ребенка является той же вне зависимости от того, является ли предполагаемый отец биологическим отцом или нет, и можно выбрать любое приемлемое априорное P(f), например равномерное априорное распределение доли ДНК ребенка от 0% до 50%. Согласно варианту осуществления является возможным использование только одного значения доли ДНК ребенка,
P(D|H)=P(D|H,f)
Рассмотрим правдоподобие P(D|H,f). Правдоподобие каждой гипотезы получают, исходя из модели откликов, оцененной доли ДНК плода, генотипов для матери, генотипов для предполагаемого отца, частот аллеля в популяции, количества импульсов счета при определении аллеля и SNP в плазме крови. Пусть D представляет данные, которые определены выше.
Согласно варианту осуществления предполагается, что результаты исследования для каждого SNP являются независимыми с учетом условий для соотношения аллелей в плазме крови, следовательно, правдоподобие гипотезы об отцовстве представляет собой произведение значений правдоподобия для SNP:
В следующих уравнениях описывается, как специалист в данной области техники может получить правдоподобие для одного SNP i и одной доли ДНК ребенка f. Уравнение 8 представляет собой общее выражение для правдоподобия любой гипотезы Н, которая затем будет разбита на конкретные случаи Htf и Hwf. Следует заметить, что генотипы gm, gtf, gdf и gc принимают значения {АА,АВ,ВВ}, которые переводится как {0,0,5,1}, где АА=0, АВ=0,5, ВВ=1. Кроме того, gtf обозначает генотипы истинного отца, и gdf обозначает генотипы, представленные данными, предусмотренными для отца. В случае Htf, gtf и gdf являются эквивалентными.
В случае гипотезы Htf предполагаемый отец является биологическим отцом, и генотипы плода унаследованы от генотипов матери и генотипов предполагаемого отца. Вышеприведенное уравнение упрощается до:
Далее,
P(gc|gm,gtf,H=Htf)=P(gc|gm,gtf)
и
В случае Hwf предполагаемый отец не является биологическим отцом. Одну оценку генотипов истинного отца можно получить с использованием частоты в популяции для каждого SNP. Следовательно, вероятности для генотипов ребенка можно определить с помощью известных генотипов матери и частот в популяции, то есть данные не предоставляют дополнительной информации о генотипах биологического отца. В этом случае вышеприведенное уравнение дополнительно не упрощается и остается в виде:
Далее,
P(gc|gm,gtf,H=Hwf)=P(gc|gm,gtf)
где априорные распределения в популяции представляют информацию только для gtf и:
В обоих выражениях значений правдоподобия P(D|f,H,i), то есть для обеих гипотез модель откликов P(s|gm,gdf,gc,f,H) является обобщенной. Конкретные параметры упомянуты в других местах данного документа в обсуждениях основных базовых моделей. Некоторые примеры модели откликов включают биномиальное распределение, бета-биномиальное распределение, многомерное распределение Пойа, эмпирическое распределение, оцениваемое, исходя из данных режима обучения, или подобные функции, которые обсуждались выше.
Согласно некоторым вариантам осуществления достоверность Ср для верного определения отцовства можно рассчитать, исходя из значений правдоподобия P(D|Htf) и P(D|Hwf). Согласно варианту осуществления этот расчет можно выполнить с использованием правила Байеса, выраженного следующим образом:
или написанного для более конкретного случая в виде произведения значений SNP для двух значений правдоподобия:
Согласно другому варианту осуществления достоверность можно рассчитать следующим образом:
Также возможны другие приемлемые функции правдоподобия.
Экспериментальный раздел
Эксперимент 1
Привлекали двадцать одну беременную женщину с подтвержденным отцовством и внутриутробным возрастом от 6 до 21 недели. Участницы добровольно сдавали кровь как часть одобренной IRB исследовательской программы в соответствии с настоящим изобретением и были привлечены из центров IVF, офисов ОВ и общего населения в различных районах США. Бесклеточную ДНК (ffDNA), выделенную из материнской плазмы вместе с ДНК матери и предполагаемого отца, амплифицировали и измеряли с использованием матрицы SNP. Использовала раскрытый в настоящем документе метод информатики для исключения или подтверждения отцовства 21 истинного отца и 36400 неправильно названных отцов путем сравнения каждого предполагаемого отца с эталонным распределением, сгенерированным из набора более 5000 неродственных индивидуумов. 20 из 21 образца имели достаточно плодной ДНК для получения результатов. Двадцать из двадцати (100%) подтверждений отцовств были правильными. 36382 из 36382 исключений отцовств были правильными (100%) с 18 случаями «отсутствия признаков» вследствие промежуточного генетического сходства. Не было неверных признаков.
Популяция состояла из пар, сдававших свою кровь для пренатального исследования. Женщины должны были быть с одноплодными беременностями на первом или втором триместре и иметь подтвержденное отцовство. Образцы крови брали у женщин с использованием пробирок для крови CELL-FREE (STRECK), содержащих консервант для лейкоцитов, а генетические образцы собирали от отцов, либо в виде крови (с EDTA), либо в виде буккального образца. От всех участников получали письменное информированное согласие и генетические образцы собирали у пациентов, участвующих в одобренном IRB исследовании.
Кровь матери центрифугировали для выделения лейкоцитарной пленки и сыворотки. Геномную ДНК из лейкоцитарных пленок матери и предполагаемого отца, ДНК из сыворотки крови матери готовили для анализа и прогоняли на матрице SNP CYTO12 INFINIUM от ILLUMINA с использованием стандартных протоколов. Вкратце, сывороточную ДНК выделяли с использованием набора CIRCULATING NUCLEIC ACID от QIAGEN и элюировали в 45 мкл буфера в соответствии с инструкциями производителя. Двадцать один микролитр элюата использовали в реакции формирования тупых концов в 1 × буфере NEB 4 с 0,42 мМ dNTP и 2,5 единицы ДНК-полимеразы Т4 (NEW ENGLAND BIOLABS), инкубировали при 20°C в течение 30 минут, а затем при 75°C в течение 15 минут. Добавляли три микролитра смеси для лигирования (0,5 мкл 10 × NEB 4, 1 мкл 10 мМ АТФ, 1 мкл PNK Т4 (NEW ENGLAND BIOLABS), 0,5 мкл ДНК-лигазы Т4 (NEW ENGLAND BIOLABS)) и образцы инкубировали при 16°C в течение 24 часов, а затем при 75°C в течение 15 минут. Образец переносили на стандартный образец для анализа INFINIUM от ILLUMINA вместе с геномной ДНК матери и предполагаемого отца. Вкратце, в 24 мкл ДНК амплифицировали весь геном при 37°C в течение 20-24 часов с последующими фрагментацией и преципитацией. Преципитат затем ресуспендировали в буфере для гибридизации, подвергали термоденатурации и переносили на матрицы SNP Cyto12 с использованием EVO от TECAN. Матрицы инкубировали при 48°C в течение по меньшей мере 16 часов, Х-окрашивали (INFINIUM II CHEMISTRY), отмывали в EVO от TECAN и в заключение сканировали. Интенсивности матриц регистрировали с использованием BEADSTIDUO (ILLUMINA).
С помощью раскрытого метода информатики генерировали тестовую статистику, которой измеряли степень генетического сходства между плодом и другим индивидуумом. Эту тестовую статистику рассчитывали как для предполагаемого отца, так и для набора более чем 5000 неродственных индивидуумов. Затем по тесту отклонения простой гипотезы определяли, может ли рассчитанная для предполагаемого отца статистика быть исключена из распределения, сформированного неродственными индивидуумами стандарта. Если предполагаемого отца можно исключить из набора неродственных индивидуумов, это означало принятие отцовства; в противном случае отцовство исключали. На 20 образцах с достаточным количеством ДНК тест на отцовство проводили с 20 истинными отцами и с 1820 случайно выбранными неправильными отцами.
Принятие отцовства объявляли, когда р-значение тестовой статистики для предполагаемого отца на распределении неродственных индивидуумов составляло менее 10-4. В теории это означает, что не более чем у одного из 10000 неродственных индивидуумов ожидали такое же генетическое сходство с плодом. «Отсутствие признака» отмечали, когда р-значение составляло от 10-4 до 0,02. Признак «недостаточного количества плодной ДНК» означал, что плодная ДНК составляла менее 2% ДНК плазмы. Группа неродственных индивидуумов, использованный для генерирования ожидаемого распределения, состоял из индивидуумов различных рас, и расчеты для принятия или исключения отцовства пересчитывали для групп неродственных индивидуумов различных рас, в том числе раса предполагаемого отца. Результаты принятия и исключения автоматически генерировались алгоритмом, и необходимости во вмешательстве человека не было.
В заключение тестировали двадцать один образец материнской крови с известным отцовством. Результаты получали для двадцати образцов из 21, так как в одном образце содержалось недостаточно плодной ДНК для анализа; этот образец получали от женщины на 8 неделе гестации. Двадцать из двадцати (100%) результатов характеризовались правильным подтверждением отцовства со р-значением <10-4 в каждом случае. Каждый из 20 образцов с достаточной фракцией плодной ДНК тестировали по отношению к случайному набору из 1820 неправильно названных отцов, что в целом составляло 36400 индивидуальных тестов на отцовство. Результаты получали для 36382 из этих анализов; в 36382 из 36382 (100%) правильно исключали отцовство с р-значениями более 10-4, а в 18 из 36400 (0,05%) объявляли «отсутствие признака» с р-значением от 10-4 до 0,02. Не было случаев неправильного принятия или исключения отцовства.
Девять образцов из 21 характеризовались подтвержденным отцовством благодаря контролю оплодотворения во время IVF с правильным отцовством, подтвержденным после оплодотворения посредством доимплантационной генетической диагностики. Двенадцать образцов характеризовались отцовством, подтвержденным независимым установлением отцовства по геномной ДНК плода/ребенка, проведенным в Центре диагностики ДНК, Фэрфилд, Огайо.
Эксперимент 2
В одном эксперименте получали четыре образца материнской плазмы и амплифицировали с использованием гемивложенного 9600-плексного протокола. Образцы получали следующим образом: от 15 до 40 мл крови матери центрифугировали для выделения лейкоцитарной пленки и плазмы. Геномную материнскую ДНК получали из лейкоцитарной пленки, а отцовскую ДНК получали из образца крови или образца слюны. Бесклеточную ДНК выделяли из материнской плазмы с использованием набора CIRCULATING NUCLEIC ACID от QIAGEN и элюировали в 45 мкл буфера ТЕ в соответствии с инструкциями производителя. Универсальные адаптеры лигирования добавляли к концу каждой молекулы в 35 мкл очищенной ДНК плазмы, амплифицировали библиотеки в течение 7 циклов с использованием специфичных по отношению к адаптерам праймеров. Библиотеки очищали гранулами AGENCOURT AMPURE и элюировали в 50 мкл воды.
Амплифицировали 3 мкл ДНК в течение 15 циклов STA (95°С в течение 10 минут для начальной активации полимеразы, затем 15 циклов при 95°C в течение 30 секунд; 72°C в течение 10 секунд; 65°C в течение 1 минуты; 60°C в течение 8 минут; 65°C в течение 3 минут и 72°C в течение 30 секунд с финальным удлинением при 72°C в течение 2 минут) с использованием 9600 маркированных обратных праймеров, специфичных по отношению к целям, в концентрации 14,5 нМ и одного прямого праймера, специфичного к адаптеру библиотеки, в концентрации 500 нМ.
Протокол гемивложенной ПЦР предусматривал вторую амплификацию разведенных продуктов первых STA в течение 15 циклов STA (95°C в течение 10 минут для начальной активации полимеразы, затем 15 циклов при 95°C в течение 30 секунд; 65°C в течение 1 минуты; 60°C в течение 5 минут; 65°C в течение 5 минут и 72°C в течение 30 секунд с финальным удлинением при 72°C в течение 2 минут) с использованием обратного маркера в концентрации 1000 нМ и 9600 прямых праймеров, специфичных по отношению к мишеням, в концентрации 16,6 нМ для каждого.
Затем аликвоту продуктов STA амплифицировали с помощью стандартной ПЦР в течение 10 циклов с 1 мкМ прямых специфичных по отношению к маркеру праймеров и обратных праймеров со штрихкодом для получения штрихкодированных библиотек для секвенирования. Аликвоту каждой библиотеки смешивали с библиотеками различных штрихкодов и очищали с использованием спин-колонки.
Таким образом, использовали 9600 праймеров в однолуночных реакциях; праймеры конструировали для нацеливания на SNP, найденные в хромосомах 1, 2, 13, 18, 21, X и Y. Затем ампликоны секвенировали с использованием секвенатора GAIIX от ILLUMINA. С помощью секвенатора генерировали приблизительно 3,9 миллиона считываний на образец, 3,7 миллионов считываний картировались с геномом (94%), и из них 2,9 миллионов считываний (74%) картировались с целевыми SNP со средней глубиной считывания 344 и медианой глубины считывания 255. Плодная фракция в четырех образцах составляла 9,9%, 18,9%, 16,3% и 21,2%.
Соответствующие образцы материнской и отцовской геномной ДНК амплифицировали с использованием полувложенного 9600-плексного протокола и секвенировали. Полувложенный протокол отличается тем, что в нем применяется 9600 внешних прямых праймеров и маркированных обратных праймеров при 7,3 нМ в первой STA. Условия термоциклирования и состав второй STA и штрихкодирующей ПЦР были такими же, как в гемивложенном протоколе.
Данные секвенирования анализировали с использованием раскрытых в настоящем документе методов информатики, и для каждого из группы десяти неродственных мужчин из контрольной группы устанавливали, что он не является биологическим отцом каждого из вынашиваемых плодов.
Эксперимент 3
В одном эксперименте 45 наборов клеток амплифицировали с использованием 1200-плексного полувложенного протокола, секвенировали и для трех хромосом определяли плоидность. Следует отметить, что этот эксперимент предназначался для моделирования условий выполнения установления отцовства по единичным плодным клеткам, полученным из крови матери, или по экспертным образцам, в которых присутствовало небольшое количество ДНК ребенка. Помещали 15 индивидуальных единичных клеток и 30 наборов по три клетки в 45 пробирок для индивидуальных реакций с общим количеством 45 реакций, где в каждой реакции участвовали клетки только из одной клеточной линии, но в различных реакциях участвовали клетки различных клеточных линий. Клетки готовили в 5 мкл отмывочного буфере, лизировали добавлением 5 мкл лизирующего буфера ARCTURUS PICOPURE (APPLIED BIOSYSTEMS) и инкубировали при 56°C в течение 20 минут, при 95°C в течение 10 минут.
ДНК единичных/трех клеток амплифицировали в течение 25 циклов STA (95°C в течение 10 минут для начальной активации полимеразы, затем 25 циклов при 95°C в течение 30 секунд; 72°C в течение 10 секунд; 65°C в течение 1 минуты; 60°C в течение 8 минут; 65°C в течение 3 минут и 72°C в течение 30 секунд с финальным удлинением при 72°C в течение 2 минут) с использованием 1200 прямых специфичных по отношению к мишеням праймеров и маркированных обратных праймеров в концентрации 50 нМ.
Протокол полувложенной ПЦР предусматривал три параллельные вторые амплификации разведенных продуктов первых STA в течение 20 циклов STA (95°C в течение 10 минут для начальной активации полимеразы, затем 15 циклов при 95°C в течение 30 секунд; 65°C в течение 1 минуты; 60°C в течение 5 минут; 65°C в течение 5 минут и 72°C в течение 30 секунд с финальным удлинением при 72°C в течение 2 минут) с использованием обратных специфичных по отношению к маркеру праймеров в концентрации 1000 нМ и 400 специфичных по отношению к мишеням вложенных прямых праймеров в концентрации 60 нМ для каждого. Таким образом, в трех параллельных 400-плексных реакциях амплифицировали всего 1200 целей, амплифицированных в первой STA.
Затем аликвоту продуктов STA амплифицировали с помощью стандартной ПЦР в течение 15 циклов с 1 мкМ специфичных по отношению к маркеру прямых и штрихкодированных обратных праймеров для получения штрихкодированных библиотек секвенирования. Аликвоту каждой библиотеки смешивали с библиотеками различных штрихкодов и очищали с использованием спин-колонки.
Таким образом, в реакциях с единичными клетками использовали 1200 праймеров; праймеры конструировали для нацеливания на SNP, найденные в хромосомах 1, 21 и X. Затем ампликоны секвенировали с использованием секвенатора GAIIX от ILLUMINA. С помощью секвенатора генерировали приблизительно 3,9 миллионов считываний на образец, от 500000 до 800000 миллионов считываний картировались с геномом (от 74% до 94% всех считываний на образец).
Соответствующие образцы материнской и отцовской геномной ДНК из клеточных линий анализировали с использованием такого же полувложенного 1200-плексного пула анализируемых фрагментов по аналогичному протоколу с меньшим количеством циклов и 1200-плексной второй STA и секвенировали.
Данные секвенирования анализировали с использованием раскрытых в настоящем документе методов информатики и для каждой группы из десяти неродственных мужчин из контрольной группы по каждой из 45 клеток определяли, что он не является биологическим отцом целевого индивидуума.
ДНК детей от предыдущих беременностей в крови матери
Одной из трудностей неинвазивного пренатального установления отцовства является отличие плодных клеток текущей беременности от плодных клеток предыдущих беременностей. Некоторые полагают, что генетический материал от предыдущих беременностей со временем исчезает, однако, убедительных доказательств представлено не было. В варианте осуществления настоящего раскрытия можно определить присутствующую в крови матери плодную ДНК отцовского происхождения (т.е. ДНК, которую плод унаследовал от отца) с использованием метода PARENTAL SUPPORT™ (PS) и информации об отцовском геноме. В этом способе может быть использована фазированная генетическая информация родителей. Можно фазировать родительский генотип от нефазированной генотипической информации с использованием генетических данных бабушек и дедушек (такие как измеренные генетические спермы дедушки) или генетических данные от других рожденных детей, или образца от выкидыша. Можно также фазировать нефазированную генетическую информацию методом основанного на НарМар фазирования или гаплотипированием отцовских клеток. Успешное гаплотипирование было продемонстрировано посредством остановки клеток в фазе митоза, при которой хромосомы представляют собой плотные пучки, и использования подходов микрофлюидики для помещения отдельных хромосом в отдельные лунки. В другом варианте осуществления можно использовать фазированные родительские гаплотипические данные для выявления присутствия более одного гомолога от отца, что свидетельствует о наличии в крови генетического материала более чем одного ребенка. Фокусируясь на хромосомах, которые по прогнозам должны быть эуплоидными у плода, можно исключить вероятность того, что плод страдает от трисомии. Также можно определить, происходит ли плодная ДНК от теперешнего отца, в этом случае возможно использование других способов, таких как тройной тест для прогнозирования генетических аномалий.
Могут существовать другие источники плодного генетического материала, доступного благодаря способам, отличным от взятой крови. В случае плодного генетического материала, доступного из крови матери, существуют две основные категории: (1) цельные плодные клетки, например, ядросодержащие плодные красные кровяные клетки или эритробласты, и (2) свободно плавающая плодная ДНК. В случае цельных плодных клеток имеются некоторые доказательства, что плодные клетки могут пребывать в крови матери продолжительные периоды времени так, что можно отделить клетку от беременной женщины, у которой есть ДНК ребенка или плода от предыдущей беременности. Имеются также доказательства того, что свободно плавающая плодная ДНК выводится из системы неделями. Одной из проблем является определение идентичности индивидуума, чей генетический материал содержится в клетке, а именно гарантии того, что измеренный генетический материал не принадлежит плоду от предыдущей беременности. В варианте осуществления настоящего раскрытия информацию о материнском генетическом материале можно использовать для того, чтобы удостовериться, что рассматриваемый генетический материал не является материнским генетическим материалом. Существует ряд способов для достижения этого, в том числе основанные на информатике методы, такие как PARENTAL SUPPORT™, описанные в настоящем документе или в любом из упомянутых в настоящем документе патентов.
В варианте осуществления настоящего раскрытия кровь, взятая у беременной матери, может быть разделена на фракцию, содержащую свободно плавающую плодную ДНК, и фракцию, содержащую ядросодержащие красные кровяные клетки. Свободно плавающую ДНК можно необязательно приумножать, а генотипическую информацию ДНК можно измерять. Исходя из измеренной генотипической информации о свободно плавающей ДНК, информацию о материнском генотипе можно использовать для определения аспектов генотипа плода. Эти аспекты могут относиться к идентификациям состояния плоидности и/или набора аллелей. Затем, индивидуальные ядросодержащие клетки, которые предположительно или возможно плодного происхождения, могут быть генотипированы с использованием способов, описанных в других разделах настоящего документа и других упомянутых патентах, особенно в тех, которые упомянуты в настоящем документе. Информация о материнском геноме позволит определить, является ли данная единичная клетка крови генетически материнской или нет. А также аспекты генотипа плода, которые были установлены, как описано выше, позволят определить, происходит ли единичная клетка крови генетически от плода текущей гестации. В сущности, этот аспект настоящего раскрытия позволяет использовать генетическую информацию матери и, возможно, генетическую информацию от других родственных индивидуумов, таких как отец, наряду с измеренной генетической информацией о свободно плавающей ДНК, обнаруженной в крови матери, для определения, является ли выделенная ядросодержащая клетка, обнаруженная в крови матери (а) генетически материнской, (b) генетически от плода текущей гестации или (с) генетически от плода предыдущей беременности.
Все патенты, заявки на выдачу патентов и опубликованные ссылки, цитированные в настоящем документе, тем самым включены посредством ссылки во всей своей полноте. Будет понятно, что некоторые из раскрытых выше и других признаков и функций или их альтернатив могут быть в соответствии с желанием объединены во многие другие различные системы или применения. Специалистами в данной области впоследствии могут быть выполнены различные в настоящий момент непредвиденные или неожиданные альтернативы, модификации, вариации или улучшения настоящего изобретения, которые также предназначены быть охваченными следующей формулой изобретения.
название | год | авторы | номер документа |
---|---|---|---|
СПОСОБЫ НЕИНВАЗИВНОГО ПРЕНАТАЛЬНОГО УСТАНОВЛЕНИЯ ПЛОИДНОСТИ | 2011 |
|
RU2671980C2 |
СПОСОБЫ И КОМПОЗИЦИИ ДЛЯ ВЫСОКОМУЛЬТИПЛЕКСНОЙ ПЦР | 2012 |
|
RU2650790C2 |
ОБНАРУЖЕНИЕ МУТАЦИЙ И ПЛОИДНОСТИ В ХРОМОСОМНЫХ СЕГМЕНТАХ | 2015 |
|
RU2717641C2 |
СПОСОБ ОТБОРА ЖИВОТНЫХ ПО ПРИЗНАКАМ, НАСЛЕДУЕМЫМ ПО МЕХАНИЗМУ РОДИТЕЛЬСКОГО ИМПРИНТИНГА | 1999 |
|
RU2262229C2 |
УЛУЧШЕННЫЙ СПОСОБ И НАБОР ДЛЯ ОПРЕДЕЛЕНИЯ ТЯЖЕСТИ И ПРОГРЕССИРОВАНИЯ ПЕРИОДОНТАЛЬНОГО ЗАБОЛЕВАНИЯ | 2011 |
|
RU2664431C2 |
СПОСОБ ОПРЕДЕЛЕНИЯ ДОСТОВЕРНОСТИ ПРОИСХОЖДЕНИЯ И ЧИСТОПОРОДНОСТИ СВИНЕЙ | 2019 |
|
RU2744733C1 |
НЕИНВАЗИВНЫЙ ДИАГНОСТИЧЕСКИЙ ТЕСТ ДНК ДЛЯ ОБНАРУЖЕНИЯ АНЕУПЛОИДИИ | 2012 |
|
RU2638456C2 |
Способ преимплантационного генетического тестирования Гемофилии А | 2022 |
|
RU2795796C1 |
Способ прогнозирования роста новорожденных с использованием данных о генетическом полиморфизме матерей | 2023 |
|
RU2820498C1 |
МУЛЬТИАЛЛЕЛЬНОЕ ГЕНОТИПИРОВАНИЕ ОДНОНУКЛЕОТИДНЫХ ПОЛИМОРФИЗМОВ И ИНДЕЛ-МУТАЦИЙ | 2016 |
|
RU2706203C1 |
Изобретения относятся к области генетики и медицины и касаются способов неинвазивного пренатального установления отцовства. В способах применяются генетические измерения наличия однонуклеотидных полиморфизмов, делеций, дупликаций и инверсий нуклеотидных последовательностей, выполненные в плазме, взятой от беременной матери, вместе с аналогичными генетическими измерениями предполагаемого отца для определения того, является или не является предполагаемый отец биологическим отцом плода. Изобретения осуществляются с помощью основанного на информатике метода, при котором генетический фингерпринт плодной ДНК, обнаруженной в материнской плазме, может сравниваться с генетическим фингерпринтом предполагаемого отца. 4 н. и 13 з.п. ф-лы, 9 ил., 4 табл., 3 пр.
1. Способ установления ex vivo, является ли предполагаемый отец биологическим отцом плода, который вынашивается беременной матерью, включающий:
осуществление генотипических определений наличия или отсутствия однонуклеотидных полиморфизмов, делеций, дупликаций или инверсий во множестве полиморфных локусов на генетическом материале от предполагаемого отца;
осуществление генотипических определений наличия или отсутствия однонуклеотидных полиморфизмов, делеций, дупликаций или инверсий во множестве полиморфных локусов в смешанном образце ДНК, происходящей из образца крови от беременной матери, где смешанный образец ДНК содержит свободно плавающую плодную ДНК и свободно плавающую материнскую ДНК;
определение на компьютере вероятности того, что предполагаемый отец является биологическим отцом плода, с использованием генотипических определений, выполненных на генетическом материале от предполагаемого отца и в смешанном образце ДНК; и где для генотипических определений используют аутосомные хромосомы.
2. Способ по п. 1, дополнительно включающий получение генотипических определений во множестве полиморфных локусов из генетического материала от матери, в котором вероятность того, что предполагаемый отец является биологическим отцом плода, определяется с использованием генотипических определений, выполненных на генетическом материале от матери, генетическом материале от предполагаемого отца и смешанном образце ДНК.
3. Способ по п. 1, в котором полиморфные локусы содержат однонуклеотидные полиморфизмы (SNPs).
4. Способ по п. 1, в котором смешанный образец ДНК содержит (i) свободно плавающую ДНК из плазменной фракции образца крови от матери, (ii) материнскую цельную кровь, (iii) фракцию крови матери, содержащую ядросодержащие клетки, или (iv) смесь плодных и материнских клеток.
5. Способ по п. 1, в котором установление того, является ли предполагаемый отец биологическим отцом плода, дополнительно включает:
установление того, что предполагаемый отец является биологическим отцом плода, путем отклонения гипотезы, что предполагаемый отец не является родственным плоду, если вероятность того, что предполагаемый отец является биологическим отцом плода, выше верхнего порога; или
установление того, что предполагаемый отец не является биологическим отцом плода, путем неотклонения гипотезы, что предполагаемый отец не является родственным плоду, если вероятность того, что предполагаемый отец является биологическим отцом плода, ниже нижнего порога; или
неустановление того, является ли предполагаемый отец биологическим отцом плода, если правдоподобие находится между нижним порогом и верхним порогом или если правдоподобие не определяется с достаточно высокой достоверностью.
6. Способ по п. 2, в котором определение вероятности того, что предполагаемый отец является биологическим отцом плода, включает:
получение популяционных частот аллелей для каждого локуса во множестве полиморфных локусов;
создание разделения возможных фракций плодной ДНК в смешанном образце ДНК, которое варьируется от нижнего предела плодной фракции до верхнего предела плодной фракции;
вычисление вероятности того, что предполагаемый отец является биологическим отцом плода, с учетом генотипических определений, выполненных на генетическом материале от матери, генетическом материале от предполагаемого отца и смешанном образце ДНК, для каждой из возможных плодных фракций в разделении;
определение вероятности того, что предполагаемый отец является биологическим отцом плода, путем объединения рассчитанных вероятностей того, что предполагаемый отец является биологическим отцом плода, для каждой из возможных плодных фракций в разделении;
вычисление вероятности того, что предполагаемый отец не является биологическим отцом плода, с учетом генотипических определений, выполненных на генетическом материале от матери, генетическом материале от предполагаемого отца и смешанном образце ДНК, и с учетом полученных популяционных частот аллелей; для каждой из возможных плодных фракций в разделении; и
определение вероятности того, что предполагаемый отец не является биологическим отцом плода, путем объединения рассчитанных вероятностей того, что предполагаемый отец не является биологическим отцом плода, для каждой из возможных плодных фракций в разделении.
7. Способ по п. 6, в котором вычисление вероятности того, что предполагаемый отец является биологическим отцом плода, и вычисление вероятности того, что предполагаемый отец не является биологическим отцом плода, дополнительно включает:
вычисление для каждого из множества полиморфных локусов правдоподобия наблюдаемых данных последовательности в конкретном локусе с использованием модели зависимости от платформы, одной или множества фракций в разделении возможных плодных фракций, множества аллельных отношений для матери, множества аллельных отношений для предполагаемого отца и множества аллельных отношений для плода;
вычисление правдоподобия того, что предполагаемый отец является биологическим отцом, путем объединения правдоподобия наблюдаемых данных последовательности в каждом полиморфном локусе по всем возможным плодным фракциям в разделении, по аллельным отношениям матери в наборе полиморфных локусов, по аллельным отношениям предполагаемого отца в наборе полиморфных локусов и по аллельным отношениям плода в наборе полиморфных локусов;
вычисление правдоподобия того, что предполагаемый отец не является биологическим отцом, путем объединения правдоподобия наблюдаемых данных последовательности в каждом полиморфном локусе по всем возможным плодным фракциям в разделении, по аллельным отношениям матери в наборе полиморфных локусов, по популяционным частотам для набора полиморфных локусов и по плодным аллельным отношениям в наборе полиморфных локусов;
вычисление вероятности того, что предполагаемый отец является биологическим отцом, на основе правдоподобия того, что предполагаемый отец является биологическим отцом; и
вычисление вероятности того, что предполагаемый отец не является биологическим отцом, на основе правдоподобия того, что предполагаемый отец не является биологическим отцом.
8. Способ по п. 6, в котором вычисление вероятности того, что предполагаемый отец является биологическим отцом, на основе правдоподобия того, что предполагаемый отец является биологическим отцом, выполняется с использованием оценки максимального правдоподобия или метода максимальной апостериорной гипотезы.
9. Способ по п. 6, в котором установление того, является ли предполагаемый отец биологическим отцом плода, дополнительно предусматривает:
установление того, что предполагаемый отец является биологическим отцом, если рассчитанная вероятность того, что предполагаемый отец является биологическим отцом плода, значительно больше рассчитанной вероятности того, что предполагаемый отец не является биологическим отцом; или
установление того, что предполагаемый отец не является биологическим отцом плода, если рассчитанная вероятность того, что предполагаемый отец не является биологическим отцом, значительно больше рассчитанной вероятности того, что предполагаемый отец является биологическим отцом.
10. Способ по п. 6, в котором разделение возможных фракций плодной ДНК содержит только одну плодную фракцию и в котором плодная фракция определяется методикой, выбранной из группы, состоящей из количественной ПЦР, цифровой ПЦР, целевой ПЦР, зондов циркуляризации, других способов амплификации ДНК, захвата гибридизационными зондами, других способов предпочтительного приумножения, микроматриц SNP, микроматриц ДНК, секвенирования, других методик измерения полиморфных аллелей, других методик измерения неполиморфных аллелей, измерения полиморфных аллелей, которые присутствуют в геноме отца, но не присутствуют в геноме матери, измерения неполиморфных аллелей, которые присутствуют в геноме отца, но не присутствуют в геноме матери, измерения аллелей, которые являются специфичными для Y-хромосомы, сравнивающих измеренное количество унаследованных от отца аллелей с измеренным количеством унаследованных от матери аллелей, оценок максимального правдоподобия, методов максимальной апостериорной гипотезы и их комбинаций.
11. Способ по п. 1, в котором достоверность вычисляется для установленного определения того, является ли предполагаемый отец биологическим отцом плода.
12. Способ по п. 2, в котором получение генотипических определений в генетическом материале от матери включает осуществление генотипических определений на образце генетического материала от матери, который состоит, главным образом, из материнского генетического материала.
13. Способ по п. 2, в котором получение генотипических определений в генетическом материале от матери включает:
заключение о том, какие генотипические определения, выполненные в смешанном образце ДНК, возможно относятся к генетическому материалу от матери; и
использование тех генотипических определений, которые согласно заключению принадлежат генетическому материалу от матери, в качестве полученных генотипических определений.
14. Способ по п. 1, включающий идентификацию (i) аллелей, которые присутствуют в плодной ДНК и отсутствуют в материнской ДНК в полиморфных локусах, и/или идентификацию (ii) аллелей, которые отсутствуют в плодной ДНК и в материнской ДНК в полиморфных локусах;
определение на компьютере вероятности того, что предполагаемый отец является биологическим отцом плода, в котором определение включает:
(1) сравнение (i) аллелей, которые присутствуют в плодной ДНК и отсутствуют в материнской ДНК в полиморфных локусах, с (ii) аллелями в соответствующих полиморфных локусах в генетическом материале от предполагаемого отца, и/или
(2) сравнение (i) аллелей, которые отсутствуют в плодной ДНК и в материнской ДНК в полиморфных локусах, с (ii) аллелями в соответствующих полиморфных локусах в генетическом материале от предполагаемого отца,
установление того, является ли предполагаемый отец биологическим отцом плода, с использованием определенной вероятности того, что предполагаемый отец является биологическим отцом плода.
15. Способ установления, является ли предполагаемый отец биологическим отцом плода, который вынашивается беременной матерью, включающий:
получение генотипических определений наличия или отсутствия однонуклеотидных полиморфизмов, делеций, дупликаций или инверсий во множестве полиморфных локусов на генетическом материале от предполагаемого отца;
получение генотипических определений наличия или отсутствия однонуклеотидных полиморфизмов, делеций, дупликаций или инверсий во множестве полиморфных локусов на генетическом материале от множества индивидуумов, которые не являются родственными плоду;
получение генотипических определений во множестве полиморфных локусов в смешанном образце ДНК, происходящей из образца крови от беременной матери, в котором смешанный образец ДНК содержит свободно плавающую плодную ДНК и свободно плавающую материнскую ДНК;
вычисление тестовой статистики для предполагаемого отца, в котором тестовая статистика для предполагаемого отца показывает степень генетического сходства между предполагаемым отцом и плодом и в котором тестовая статистика для предполагаемого отца основана на генотипических определениях, выполненных на генетическом материале от предполагаемого отца и смешанном образце ДНК;
вычисление тестовой статистики для множества неродственных индивидуумов, в котором каждая тестовая статистика для неродственного индивидуума показывает степень генетического сходства между неродственным индивидуумом и плодом и в котором тестовая статистика для неродственного индивидуума основана на генотипических определениях, выполненных на генетическом материале от неродственного индивидуума и в смешанном образце ДНК;
вычисление вероятности того, что тестовая статистика для предполагаемого отца находится в пределах распределения тестовой статистики, рассчитанной для множества неродственных индивидуумов; и
установление того, является ли предполагаемый отец биологическим отцом плода, с использованием вероятности того, что тестовая статистика, рассчитанная для предполагаемого отца, находится в пределах распределения тестовой статистики, рассчитанной для множества неродственных индивидуумов, и где для генотипических определений используют аутосомные хромосомы.
16. Способ установления, является ли предполагаемый отец биологическим отцом плода, который вынашивается беременной матерью, включающий:
получение генотипических определений наличия или отсутствия однонуклеотидных полиморфизмов, делеций, дупликаций или инверсий, включающее определение аллелей, представленных в каждом полиморфном локусе во множестве полиморфных локусов на генетическом материале от предполагаемого отца;
получение генотипических определений наличия или отсутствия однонуклеотидных полиморфизмов, делеций, дупликаций или инверсий, включающее определение и установление количества аллелей, представленных в каждом локусе во множестве полиморфных локусов в смешанном образце ДНК, происходящей из образца крови от беременной матери, в котором смешанный образец ДНК содержит свободно плавающую плодную ДНК и свободно плавающую материнскую ДНК и в котором плодная ДНК и материнская ДНК остаются физически смешенными в смешанном образце ДНК;
вычисление на компьютере ожидаемых генотипических определений для смешанного образца ДНК для одного или более возможных соотношений плодной ДНК к тотальной ДНК в смешанном образце ДНК, в котором ожидаемые генотипические определения для смешанного образца ДНК рассчитаны с использованием генотипических определений, выполненных в генетическом материале от предполагаемого отца;
определение на компьютере вероятности того, что предполагаемый отец является биологическим отцом плода, путем сравнения генотипических определений, выполненных в смешанном образце ДНК, с ожидаемыми генотипическими определениями для смешанного образца ДНК, и где для генотипических определений используют аутосомные хромосомы.
17. Способ установления, является ли предполагаемый отец биологическим отцом плода, который вынашивается беременной матерью, включающий:
получение генотипических определений наличия или отсутствия однонуклеотидных полиморфизмов, делеций, дупликаций или инверсий во множестве полиморфных локусов в генетическом материале от предполагаемого отца;
получение генотипических определений наличия или отсутствия однонуклеотидных полиморфизмов, делеций, дупликаций или инверсий во множестве полиморфных локусов в менее чем 40 плодных клетках, выделенных из образца крови от беременной матери;
вычисление на компьютере ожидаемых генотипических определений для плодных клеток с использованием генотипических определений, выполненных на генетическом материале от предполагаемого отца;
определение на компьютере вероятности того, что предполагаемый отец является биологическим отцом плода, путем сравнения генотипических определений, выполненных на плодных клетках, с ожидаемыми генотипическими определениями для плодных клеток; и где для генотипических определений используют аутосомные хромосомы.
WO 2008081451 A2 10.07.2008 | |||
EP 2848704 A1 18.03.2015 | |||
WAGNER J., DZIJAN S | |||
etd "Non-invasive prenatal paternity testing from maternal blood", Int J Legal Med | |||
Колосоуборка | 1923 |
|
SU2009A1 |
TANG DL., LI Y | |||
etd "Multiplex fluorescent PCR for noninvasive prenatal detection of fetal-derived paternally inherited diseases using circulatory fetal DNA in maternal plasma", Eur J Obstet Gynecol Reprod Biol | |||
Колосоуборка | 1923 |
|
SU2009A1 |
SU 1552642 A3 15.03.1994. |
Авторы
Даты
2017-05-30—Публикация
2011-12-22—Подача