СПОСОБ ОПРЕДЕЛЕНИЯ АНЕУПЛОИДИИ ПЛОДА В ОБРАЗЦЕ КРОВИ БЕРЕМЕННОЙ ЖЕНЩИНЫ Российский патент 2022 года по МПК G01N33/48 

Описание патента на изобретение RU2777072C1

Область техники

Изобретение относится к области медицины, а именно неинвазивной пренатальной диагностике анеуплоидий плода по внеклеточной ДНК крови матери, и может быть использовано для определения генетических аномалий плода (анеуплоидий, в том числе моносомий и трисомий) на первом триместре беременности безопасными как для ребенка, так и для матери неинвазивными методами.

Уровень техники

Анеуплоидия является следствием изменений кариотипа, при котором число хромосом в клетках плода не кратно гаплоидному набору (в отличие от нормального состояния кариотипа, эуплоидии, при котором число хромосом равно двум гаплоидным наборам). Примерами анеуплоидии, которая может быть выявлена с использованием заявленного способа, являются моносомия и трисомия, а также частичная трисомия или частичная моносомия (соответственно, приобретение дополнительных копий или делеция крупных участков хромосом, как правило, одного из хромосомных плеч). Частными примерами являются трисомия по хромосоме 21 (синдром Дауна), трисомия по хромосоме 13 (синдром Патау), трисомия по хромосоме 18 (синдром Эдвардса), моносомия по хромосоме Х (синдром Шерешевского-Тернера), наличие более чем двух половых хромосом, например, синдром Клайнфельтера (XXY) и т.д. Перечень связанных с анеуплоидиями заболеваний, которые могут быть диагностированы заявленным способом, не ограничен каким-либо специальным образом. Ввиду тяжести заболеваний, связанных с анеуплоидией, постановка соответствующего диагноза может являться основанием для проведения аборта, в связи с чем имеют большое значение скорость проведения такой диагностики, точность постановки результата и возможность проведения исследований в более ранние сроки беременности методами, безопасными как для ребенка, так и для матери.

В настоящее время для обнаружения анеуплоидии плода у беременной женщины используют плановый УЗИ в сочетании с биохимическим анализом крови (тройной тест с использованием альфафетопротеина (АФП), хорионического гонадотропина (ХГЧ) и неконъюгированного эстриола (НЭ) (патенты US5324667, US5622176). Это позволяет выявить более 90% случаев возникновения наиболее распространенных анеуплоидий плода, к которым относятся: трисомия по хромосоме 21 (синдром Дауна), трисомия по хромосоме 18 (синдром Эдвардса), трисомия по хромосоме 13 (синдром Патау). В случае, если по результатам проведенного исследования выявлена анеуплоидия плода, у беременной женщины может быть проведен забор генетического материала плода методами амниоцентеза или биопсии ворсин хориона. Эти процедуры являются инвазивными и обладают рисками спонтанного выкидыша до 1% или инфицирования плода.

Последнее время для диагностики анеуплоидий плода наиболее активно используются неинвазивные способы пренатального скрининга, основанные на анализе генетического материала плода - внеклеточной ДНК (вкДНК) плода в крови беременной женщины. В норме вкДНК плода составляет от 3% общей вкДНК будущей матери [LoYM, CorbettaN, ChamberlainPF, RaiV, SargentIL, RedmanCW, WainscoatJS. Presence of fetal DNA in maternal plasma and serum. Lancet. 1997 Aug 16; 350 (9076): 485-7].

Из уровня техники известны способы неинвазивного пренатального скрининга, основанные на прочтении всех фрагментов вкДНК в образце крови или плазмы беременной женщины. Полученные чтения представляют собой смесь фрагментов полного генома из клеток как матери, так и плаценты (клеток плода). В частности, известен способ определения анеуплоидии плода методом секвенирования (патент RU2529784C2), согласно которому определяют количество чтений на каждой хромосоме в геноме человека, вычисляют среднее число чтений на каждой хромосоме, по которому делают вывод о наличии или отсутствии анеуплоидии плода.

Однако чтобы обнаруженные различия в количестве чтений с разных хромосом были статистически значимы, необходимо получить не менее 10 миллионов чтений на образец крови или плазмы беременной женщины. Получение такого большого количества данных требует значительного времени и использования дорогостоящего оборудования (секвенаторов нового поколения), что не позволяет внедрить данную технологию в повседневную практику. Поэтому актуальной является разработка нового способа неинвазивного пренатального скрининга, позволяющего уменьшить время на проведение теста и снизить стоимость исследования при сохранении достоверности получаемого результата.

Из уровня техники известен способ неинвазивной пренатальной диагностики трисомии по хромосоме 21, основанный на цифровой ПЦР (патент RU2734484C1). Данный подход подразумевает разделение выделенной вкДНК из плазмы крови беременной женщины на две аликвоты и проведение независимого анализа каждой аликвоты. В первой аликвоте проводят количественную оценку двух генов: гена PRDM15 с хромосомы 21 и гена EIF2C1 с хромосомы 1. По соотношению количества этих генов делают вывод о соотношении хромосом 21 и 1 в образце. В норме такое соотношение должно быть равно 1, при трисомии плода по 21 хромосоме соотношение больше 1. Помимо этого, если соотношение количества генов больше 1, определяют долю вкДНК плода. Вторую аликвоту сначала обрабатывают эндонуклеазой рестрикции, чувствительной к метилированию. Полноту протекания рестрикции проверяют при помощи ПЦР в реальном времени по гену АСТВ, содержащему сайт рестрикции. При наличии сигнала от гена АСТВ делают вывод о неполном протекании процедуры рестрикции, в этом случае процедуру повторяют. Затем долю вкДНК плода определяют с помощью подсчета количества двух генов: гиперметилированного у плода гена RASSF1A, который представлен только в вкДНК плода (при условии полного протекания реакции рестрикции), и гена EIF2C1, который представлен в вкДНК матери и плода. Результат анализа считают достоверным, если две оценки доли вкДНК отличаются не более чем на 10%.

В данном способе не требуется анализировать всю выделенную вкДНК, что существенно снижает трудоемкость и себестоимость метода относительно полногеномного секвенирования. Основным недостатком данного способа является возможность его использования для выявления трисомии только по хромосоме 21. Для того чтобы расширить анализ либо на другие анеуплоидии (например, на трисомию по хромосомам 13 или 18), либо на частичные трисомии по хромосоме 21 (например, отсутствие короткого плеча хромосомы 21), необходимо провести дополнительное независимое исследование: выбор новых референсных генов, проверку анализа на точность. Более того, в данном способе хромосома 21 представлена одним геном и одной парой праймеров. Замена, делеция или дупликация нуклеотидов в области генома, где отжигаются праймеры, может привести к отсутствию сигнала от всей хромосомы. В таком случае провести анализ на наличие анеуплоидии по этой хромосоме будет невозможно. С учетом вышеперечисленных факторов, важной задачей является поиск нового, более универсального способа, который позволит выявлять любую анеуплоидию плода в образце вкДНК при наличии референсной выборки образцов с данной анеуплоидией.

Известен способ диагностики анеуплоидий плода по вкДНК плода в крови матери с использованием дифференциального метилирования ДНК матери и плода (Заявка на изобретение RU 2012119187). Данный способ позволяет сократить время проведения анализа за счет выборочного секвенирования только тех фрагментов генома, которые дифференциально метилированы у плода и у матери. Для этого проводят амплификацию специально отобранных дифференциально метилированных регионов (ДМР), после чего проводят бисульфитную конвертацию полученных фрагментов ДНК и определяют последовательность конвертированных фрагментов. Благодаря бисульфитной конвертации возможно точно отделить чтения плода от чтений матери и достоверно определить наличие трисомии с гораздо меньшим, по сравнению с полногеномным методом, набором данных.

Однако профиль метилирования обладает индивидуальными особенностями у каждого человека, что может приводить к снижению точности тестирования и увеличивать минимальное необходимое количество данных, а значит, и стоимость теста. Поэтому важной задачей является поиск нового селективного подхода, основанного на отличиях в свойствах вкДНК матери и плода.

Наиболее близким к заявляемому решению является способ неинвазивной пренатальной диагностики анеуплоидий плода, основанный на определении числа чтений в заранее выбранных регионах генома человека (Патент RU2627673 C2). Кандидатные регионы генома отбирают с использованием критерия, основанного на различии в открытости хроматина между плацентой и клетками крови матери не менее чем на 20%. Для выбора итоговых регионов используют референсную выборку образцов, содержащих как образцы беременных женщин без анеуплоидий плода, так и образцы беременных женщин с анеуплоидией плода по конкретной хромосоме. В каждом образце определяют число чтений в каждом регионе, проводят удаление дубликатов чтений, полученных в ходе амплификации, затем полученное число чтений корректируют на общее покрытие образца. Решение о наличии анеуплоидии у плода принимают по результатам сравнения скорректированного покрытия в каждом регионе генома с распределением покрытия в референсной выборке образцов, с последующим вычислением вероятности наличия и отсутствия анеуплоидии, при этом обе вероятности сравнивают с пороговыми значениями.

В изобретении RU2627673 предлагается новый подход к определению анеуплоидий плода с помощью секвенирования целевых регионов генома, основанный на отличии открытости хроматина между клетками крови матери и плаценты плода с использованием этапа, связанного с добавлением вырожденных меток до этапа приготовления геномных библиотек, на основании которых производят удаление ПЦР-дупликатов, которые вносят сдвиг в распределение покрытий регионов. Однако данный способ существенно зависит от качества и количества референсных образцов. Чем больше образцов доступно, тем больше между ними систематических отклонений, которые связаны с воспроизводимостью отдельных этапов процесса лабораторной подготовки образцов из-за: использования различного лабораторного оборудования с различающейся погрешностью (многоканальные пипетки, плашки, центрифуги, печи, различные пробирки, амплификаторы), необходимости секвенирования образцов отдельными партиями и на разных платформах, различий в применяемых технологиях проведения исследований в различных лабораториях и т.д. В известном способе RU2627673 C2 данный фактор не учитывается, что накладывает существенные ограничения на возможность его масштабирования с обеспечением высокой точности получаемого результата (анализ должен проводиться в максимально похожих условиях, лучше всего в одной лаборатории на одном приборе и одним и тем же лаборантом). Кроме того, в процессе обработки данных секвенирования проводят процедуру нормализации на общее покрытие, что понижает точность результата диагностики. Помимо этого, классификация образца основана на предположении о независимости количества чтений в разных регионах, которое в случае анализа нескольких регионов с одной хромосомы может привести к неправильной трактовке полученных результатов. Таким образом, данный способ классификации образцов накладывает определенные ограничения на максимально возможное количество регионов при проведении исследовании.

Технической проблемой, решаемой заявляемым изобретением, является разработка способа неинвазивной пренатальной диагностики анеуплоидии плода по вкДНК плода в крови матери, лишенного всех вышеперечисленных недостатков, характеризующегося повышением чувствительности и точности диагностики.

Раскрытие изобретения

Техническим результатом является повышение точности пренатальной диагностики анеуплоидий плода на ранних этапах беременности.

Заявляемый способ позволяет одновременно выявлять анеуплоидию плода по хромосомам 13, 18, 21 и X.

Технический результат достигается при использовании способа неинвазивной пренатальной диагностики анеуплоидий плода по образцу вкДНК из крови беременной женщины, включающего:

выбор целевых регионов генома из кандидатных регионов, в качестве которых используют сайты гиперчувствительности к ДНКазе I в геноме человека, посредством отбора сайтов, характеризующихся открытым состоянием хроматина в клетках-источниках вкДНК у взрослого человека и закрытым состоянием хроматина в клетках-источниках вкДНК плода, с последующим определением среднего нормализованного покрытия кандидатных регионов в группах беременных и небеременных женщин по результатам полногеномного секвенирования вкДНК, выделенной из образцов крови беременных и небеременных женщин, при этом в качестве целевых регионов используют регионы, характеризующиеся наибольшей разницей в среднем нормализованном покрытии между группами беременных и небеременных женщин;

выделение исследуемого образца вкДНК из крови беременной женщины;

внесение к фрагментам вкДНК молекулярных меток, каждая из которых содержит: случайную последовательность нуклеотидов, универсальную последовательность и специфичную последовательность, комплементарную целевым регионам генома;

амплификацию целевых регионов выделенной вкДНК, с использованием праймеров к универсальной и к специфичной последовательностям в молекулярных метках;

приготовление геномных библиотек из полученных ампликонов;

секвенирование геномных библиотек;

картирование полученных последовательностей на референсный геном или отдельные его части;

определение групп чтений дубликатов — чтений, картированных на одну и ту же координату референсного генома и содержащих одну и ту же случайную последовательность в молекулярных метках;

удаление в каждой группе чтений дубликатов всех чтений, кроме одной копии, которая представляет собой исходную молекулу вкДНК, существовавшую до амплификации;

определение количества исходных молекул вкДНК в каждом из целевых регионов (наблюдаемого количества молекул); с последующим сравнением с аналогичными значениями, полученными для обучающей выборки образцов вкДНК беременных женщин с эуплоидией и анеуплоидией плода;

определение вероятностей принадлежности исследуемого образца к группе с эуплоидией плода и к группе с анеуплоидией плода, по которым делают вывод о наличии анеуплоидии у плода;

при выборе целевых регионов из кандидатных регионов удаляют те из них, геномные координаты которых пересекаются с координатами известных повторов в геноме человека, а наибольшую разницу в среднем нормализованном покрытии между двумя группами беременных и небеременных женщин для выбора целевых регионов из кандидатных регионов определяют исходя из наибольшего значения разности площадей, ограниченных графиками среднего нормализованного покрытия в группах беременных и небеременных женщин, в окне фиксированной длины;

исследуемый образец вкДНК анализируют в партии вместе с другими образцами вкДНК беременных женщин, содержащей, по меньшей мере, 8 анализируемых образцов, при этом количество исходных молекул вкДНК в каждом из целевых регионов (наблюдаемого количества молекул) определяют для всех образцов партии посредством определения параметра, представляющего собой отношение числа всех чтений всех образцов партии во всех целевых регионах к числу чтений после удаления чтений дубликатов во всех целевых регионах всех образцов партии (далее параметр батч-коррекции), после чего проводят коррекцию всех образцов в партии с использованием параметра батч-коррекции: для каждого образца в каждом целевом регионе определяют ожидаемое количество молекул путем деления числа чтений в целевом регионе образца на значение параметра батч-коррекции; дополнительно определяют в каждом образце разность между наблюдаемым и ожидаемым значениями количества молекул для каждого целевого региона, которую используют для сравнения количеств молекул с аналогичными значениями, полученными для обучающей выборки образцов вкДНК беременных женщин с эуплоидией и анеуплоидией плода.

Для отбора сайтов с открытым состоянием хроматина в качестве клеток-источников вкДНК у взрослого человека используют эндотелиальные и гематопоэтические клеточные линии; для отбора сайтов с закрытым состоянием хроматина в качестве клеток-источников вкДНК у плода используют клетки внешних оболочек плода (хориона).

Для формирования кандидатных регионов из БД сайтов гиперчувствительности к ДНКазе I в геноме человека отбирают сайты длиной не менее 100 нуклеотидов с последующим приведением (расширением) к одинаковой для всех длине 1000 нуклеотидов.

Для формирования результатов полногеномного секвенирования вкДНК используют, по меньшей мере, по 50 образцов беременных и небеременных женщин.

Для выявления отклонений по хромосомам 13, 18, 21, X выбирают, по меньшей мере, 5 целевых регионов, характеризующихся наибольшей разницей в среднем нормализованном покрытии, при этом для определения базового уровня числа чтений выбирают по меньшей мере 2 целевых региона на других хромосомах из следующего перечня хромосом:1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 14, 15, 16, 17, 20, 22.

Диагностируют анеуплоидию у плода в случае, если вероятность эуплоидии не превышает 0,1, а вероятность анеуплоидии не ниже, чем 0,9.

Для определения вероятностей принадлежности исследуемого образца к группе с эуплоидией плода и к группе с анеуплоидией плода используют, по меньшей мере, одну классификационную модель, в качестве которой используют математическую модель логистического регрессионного анализа.

На основании результатов проведенной диагностики возможно формирование группы риска беременных женщин.

Технический результат достигается при использовании совокупности признаков, включая усовершенствованный этап, связанный с выбором целевых регионов генома из кандидатных регионов, направленный на повышение точности пренатальной диагностики анеуплоидий плода, и этап, касающийся проведения анализа исследуемого образца вкДНК беременной женщины одновременно с анализом образцов вкДНК других беременных женщин (не менее 8 анализируемых образцов в партии, один из которых является целевым для исследования для постановки диагноза), что позволяет скорректировать систематические отклонения при лабораторной подготовке исследуемых образцов вкДНК и тем самым также повысить точность диагностики анеуплоидий плода. Увеличение точности диагностики достигается и благодаря использованию классификационной модели, так как это позволяет избавиться от дополнительных этапов обработки данных, таких как нормализация числа чтений на общее число чтений в образце. Кроме того, в заявляемом способе нет ограничений на максимальное количество целевых регионов, используемых при анализе, а точность классификационной модели тем выше, чем больше целевых регионов (при наличии достаточного числа образцов в референсной выборке).

Осуществление изобретения

В настоящем изобретении использованы следующие термины и определения.

Референсный геном человека – электронная база данных нуклеотидных последовательностей, которая представляет собой эталонный образец генома человека: последовательности, соответствующие гаплоидному набору хромосом (всех хромосом генома в единственной копии).

Чтение – нуклеотидная последовательность одного из фрагментов геномной библиотеки, определенная с помощью секвенирования.

Картирование чтений – определение координат (хромосомы и позиции на ней) чтений в референсном геноме.

Регион генома – определённый участок референсного генома, задаваемый геномными координатами (хромосомой и позициями начала и конца участка). Например, обозначение chr21:32925263-32925495 означает, что участок расположен на хромосоме 21, начинается с 32925263 нуклеотида этой хромосомы и заканчивается на 32925495 нуклеотиде.

Геномная библиотека – приготовленный особым образом образец ДНК, доступный для чтения на секвенаторе. Процедура приготовления геномных библиотек включает в себя следующие операции с молекулами ДНК: достройку концов, лигирование адаптеров, отбор по длине, и ПЦР-амплификацию.

Батч-коррекция – коррекция чисел чтений, полученных от нескольких образцов в одном запуске секвенирования.

Покрытие региона – число чтений, которое приходится на каждую геномную координату, входящую в регион.

Способ пренатальной диагностики анеуплоидий по вкДНК плода в крови матери включает исследование сыворотки крови матери. Для исследования кровь забирают в вакуумную пробирку, центрифугируют для отделения плазмы от клеточной массы. Из плазмы крови выделяют вкДНК на колонках, после чего к фрагментам вкДНК вносят вырожденные молекулярные метки и приготавливают геномные библиотеки. Далее определяют нуклеотидную последовательность фрагментов геномной библиотеки, которая заключается в цифровом анализе внеклеточной ДНК посредством секвенирования. Полученные короткие чтения последовательностей ДНК подвергают статистическому анализу (который может быть реализован программным путем), который включает этап удаления ПЦР-дубликатов с последующим определением вероятностей принадлежности исследуемого образца к группе с эуплоидией плода и к группе с анеуплоидией плода. О наличии анеуплоидии плода судят, если вероятность принадлежности группе анеуплоидии превышает пороговое значение.

Далее представлено более детальное описание заявляемого изобретения.

1. Формирование данных о кандидатных регионов, характеризующихся открытым хроматином в клетках-источниках вкДНК матери и закрытым хроматином в клетках-источниках вкДНК плода.

Из открытой базы данных регуляторных элементов генома человека [см. например, N.C. Sheffield, R.E. Thurman, L. Song, A. Safi, J.A. Stamatoyannopoulos, B. Lenhard, G.E. Crawford, T.S. Furey, Pattern s of regulatory activity across diverse human cell types predict tissue identity, transcription factor binding, and long-range interactions, Genome Res., 23 (2013) 777–788] отбирают сайты гиперчувствительности к ДНКазе I, для которых известно открытое состояние хроматина в эндотелиальных и гематопоэтических клеточных линиях, и закрытое состояние хроматина в клетках внешних оболочек плода (хориона). Всего в указанной базе обнаружено 13637 таких сайтов, из которых 149 сайтов находятся на 21 хромосоме. Сайты в базе имеют длину 100 нуклеотидов, для последующего анализа для выявления локальных изменений покрытия выбранные сайты расширяют до размера 1000 нуклеотидов посредством отсчета одинакового количества нуклеотидов в обе стороны последовательности. В результате было получено 13637 кандидатных регионов со всех хромосом генома человека, кроме Y (в связи с отсутствием в открытой базе данных сведений по этой хромосоме).

Далее отфильтровывают регионы, которые пересекаются с повторяющимися элементами генома человека. Для этого могут быть использованы геномные координаты повторов, полученные с помощью программы RepeatMasker (http://www.repeatmasker.org), которая основана на базе данных повторяющихся элементов в геноме человека Repbase [J. Jurka, RepbaseUpdate: a database and an electronic journal of repetitive elements, Trends Genet., 16 (2000) 418–420]. В результате указанной обработки были отобраны не пересекающиеся с повторяющимися элементами генома человека10610 кандидатных регионов, из них 118 на 21 хромосоме.

2. Формирование данных результатов полногеномного секвенирования вкДНК, выделенной из образцов крови беременных и небеременных женщин.

Для формирования базы данных используют чтения образцов беременных и небеременных женщин, не менее 50 образцов в каждой группе. Чтения образцов беременных женщин отбирают из заранее полученных чтений полногеномного секвенирования вкДНК для проведения неинвазивного пренатального скрининга, для получения чтений образцов небеременных применяют тот же лабораторный протокол. В каждом образце определяют покрытие каждого кандидатного региона. Используют только образцы, в которых покрытие кандидатных регионов генома не ниже 0,3x (покрывается чтениями не менее 30% всех нуклеотидов всех кандидатных регионов генома).

3. Определение среднего нормализованного покрытия кандидатных регионов в группах беременных и небеременных женщин.

Для устранения различий в исходном количестве чтений в образцах беременных и небеременных женщин применяют следующий вид нормализации: определяют один образецбеременной или небеременной женщины, в котором число картированных чтений (с качеством не ниже 20 по шкале PHRED) меньше, чем во всех остальных образцах. Затем для каждого образца вычисляют коэффициент нормализации, равный отношению числа чтений в образце к минимальному числу чтений. Далее в каждом образце покрытие регионов делят на коэффициент нормализации: например, если минимальное число чтений во всех образцах составляет 2 миллиона, а в анализируемом образце 6 миллионов чтений, то покрытие в каждом регионе в анализируемом образце следует поделить на 3 (данное число получено делением 6 миллионов чтений на 2 миллиона чтений). Для удобства визуализации в каждом образце проводят процедуру сглаживания, а именно для каждой геномной координаты применяют суммирование покрытия в скользящем окне размером 10 нуклеотидов. После этого в каждом регионе определяют среднее покрытие в двух группах образцов: беременных и небеременных женщин.

4. Выбор целевых регионов из БД кандидатных регионов для анализа основных трисомий плода.

Для каждой хромосомы в отдельности вычисляют оценку каждого региона: в регионе длиной 1000 нуклеотидов проводят поиск максимальной разности площадей под двумя графиками среднего нормализованного покрытия (для групп беременных и небеременных) в окне с фиксированной длиной 100 нуклеотидов. Наиболее подходящими для анализа считают регионы с максимальным значением данной метрики. Полученные значения сортируют по убыванию, получая таким образом ранжированный список регионов для каждой хромосомы.

Для анализа основных анеуплоидий плода и отклонений в числе хромосом X выбирают целевые регионы из начала ранжированного списка. Для анализа основных трисомий выбирают не менее 5 регионов с каждой из хромосом 13, 18, 21, X. Кроме того, выбирают не менее 2 регионов с каждой из остальных хромосом, кроме хромосомы 19. 19 хромосома генома человека обладает рядом особенностей: например, среднее количество оснований G и C в ней отличается от среднего по всему геному, поэтому использование регионов с 19 хромосомы при анализе основных анеуплоидий плода способно снизить точность метода.

5. Выделение внеклеточной ДНК из крови беременной женщины.

Материалом для исследований служит венозная кровь беременной женщины, что позволяет исключить риск инфекции плода или провоцирования выкидыша, который присутствует при проведении теста стандартными инвазивными методиками, такими как биопсия хориона или амниоцентез. Периферическую кровь матери собирают, например, в две пробирки по 9 мл, содержащие ЭДТА для предотвращения коагуляции. После забора крови содержимое пробирок перемешивают переворачиванием пробирки вверх-вниз, например, 10 раз. Далее пробирки незамедлительно перевозят в лабораторию для заготовки плазмы. Перевозка пробирок должна проходить при +4°C для предотвращения разрушения клеток крови матери и увеличения фракции геномной ДНК матери, содержащейся во вкДНК плазмы крови. Заготовка плазмы должна проводиться не позже, чем через 4 часа после забора крови, это необходимо для предотвращения обогащения фракции вкДНК геномной ДНК матери из разрушающихся клеток крови матери.

Заготовка плазмы может быть реализована известным способом. В частности, для заготовки плазмы необходимо провести первое центрифугирование (9 мл) при 1600g, 10 минут, при +4°C для отделения фракции плазмы, богатой клетками. После проведения центрифугирования верхнюю фазу (верхнюю часть) переносят в несколько охлажденных во льду пробирок по 2 мл, не затрагивая интерфазу, в ней могут находиться клетки крови матери. Пробирки подписывают в соответствии с маркировкой первоначального образца. Далее проводят второе центрифугирование (2 мл) при 16000g, 10 минут, при +4°C для отделения оставшихся в плазме фрагментов клеток. Супернатант переносят в охлажденные 2 мл LoBind пробирки (DNA LoBindTube 2,0 ml (Eppendorf AG)). Супернатант необходимо отбирать аккуратно, не задевая небольшой осадок клеток. Пробирки подписывают в соответствии с маркировкой первоначального образца.

Выделение вкДНК из плазмы проводят с помощью набора реагентов QIAamp CirculatingNucleic Acid Kit (Qiagen) по протоколу производителя.

6. Внесение к фрагментам вкДНК молекулярной метки для определения чтений, происходящих из одной исходной молекулы ДНК, и амплификация целевых регионов выделенной вкДНК.

Внесение к фрагментам вкДНК молекулярной метки может быть реализовано по известному протоколу [Q. Peng, C. Xu, D. Kim, M. Lewis, J. DiCarlo, Y. Wang, TargetedSinglePrimerEnrichmentSequencingwithSingleEndDuplex-UMI, Sci. Rep., 9 (2019).], который отличается высокой эффективностью захвата целевых молекул ДНК относительно других методов секвенирования с молекулярной меткой, а также дает информацию о том, с какой цепи исходной молекулы ДНК произошла амплификация. Молекулярная метка, содержащая случайную последовательность нуклеотидов, пришивается в составе двухцепочечного адаптера непосредственно к двухцепочечному исходному фрагменту ДНК. На одном конце двухцепочечного адаптера имеются нуклеотиды с основаниями 5’-InvddT-iisodG-iisodG-3’. Основание InvddT (тимидин дидезоксирибонуклеотид) присоединен к цепочке нуклеотидов по связи 5’-5’, в то время как сам он не может образовывать 3’-связь, что позволяет предотвратить дальнейшее присоединение других молекул ДНК с 5’-конца дуплексного адаптера. Благодаря этому исключается ситуация, когда к одной молекуле ДНК прикрепляется несколько адаптеров с разными молекулярными метками. Помимо этого, данный протокол позволяет использовать одиночные чтения при секвенировании, что дешевле, чем использование парно-концевых чтений, необходимое в других протоколах внесения молекулярной метки. Кроме того, выполнение протокола занимает около 8 часов, то есть 1 рабочий день, и это существенно меньше, чем при выполнении других подобных методов (например, дуплексного секвенирования с последующей гибридизацией ДНК-проб, где требуется 2-3 дня и большее количество этапов лабораторного протокола).

Для приготовления геномных библиотек берут по 5 нг внеклеточной ДНК, выделенной из плазмы крови беременной женщины, в конечном объеме 30 мкл. Лигирование адаптеров с молекулярной меткой проводят с помощью набора реагентов NEB II Ultra (New England Biolabs) по протоколу производителя с концентрацией адаптеров 40 нг/мкл, инкубируют 60 минут при 20°С. Далее смесь очищают от свободных адаптеров, для этого добавляют 87 мкл магнитных частиц AMPure (AMPure ХР Bead (Agencourt)) по протоколу производителя. Далее для обогащения смеси фрагментами вкДНК, происходящими из отобранных целевых регионов генома человека, проводят ПЦР. При этом используют 10 мкл PCR master mix (Q5 high fidelity 2x master mix (New England Biolabs)), 2 мкл универсального праймера с концентрацией 10 мкМ, 8 мкл смеси специфичных праймеров с концентрацией каждого праймера 20 нM, 16 мкл очищенной смеси фрагментов вкДНК. Амплификацию проводят по программе: предварительная денатурация 98°C 2 минуты, и 10 циклов: денатурация 98°C 30 секунд, отжиг праймеров 69°C 30 секунд, достройка цепи 72°C 30 секунд, и на последнем этапе окончательная достройка цепи 72°C 5 минут, после чего смесь хранят при 4°C.

Затем ампликоны чистят с помощью AMPure, используя 45 мкл магнитных частиц по протоколу производителя, и отбирают 23 мкл очищенной смеси для второго ПЦР, предназначенного для внесения к фрагментам ДНК индексов для секвенирования. При этом используют 10 мкл PCR master mix (Q5 high fidelity 2x master mix (New England Biolabs)), 1 мкл праймера Fw с концентрацией 10 мкМ, 10 мкл индексного праймера In, отдельного для каждого образца, с концентрацией 10 нM, 23 мкл смеси ампликонов. Амплификацию проводят по следующему протоколу: предварительная денатурация при температуре 98°C в течение 2 минут, всего 20 циклов: денатурация при температуре 98°C в течение 30 секунд, отжиг праймеров при температуре 69°C в течение 30 секунд, достройка цепи при температуре 72°C в течение 30 секунд, и на последнем этапе - окончательная достройка цепи при температуре 72°C в течение 5 минут, после чего смесь охлаждают до 4°C и чистят с помощью AMPure, используя 45 мкл шариков по протоколу производителя.

8. Приготовление и секвенирование геномных библиотек.

Приготовление геномной библиотеки проводят с помощью наборов реактивов, совместимых с платформой Illumina: NEBNext DNA library prep reagents et for Illumina и NEBNext multiplex oligos for Illumina (North England Biolabs) по протоколам производителя. Концентрацию полученной библиотеки проверяют с помощью флюориметра Qubit 2.0 (Life Technologies). Определение размера и качества приготовления библиотеки проводят с помощью прибора Bioanalyzer 2100 (Agilent), длина фрагментов ДНК должна находиться в диапазоне 350±10 п.н.

Выше описан процесс получения геномной библиотеки для одного образца. Для однократного запуска секвенирования набирают партию, которая содержит не менее чем 8 образцов, включая исследуемый образец.

Далее полученные геномные библиотеки подвергают секвенированию. Секвенирование проводят на секвенаторах нового поколения, которые дают возможность определять нуклеотидную последовательность большого количества (от сотен до сотен миллионов) чтений за 1 запуск прибора. Частными примерами технологий (приборов), которые могут быть использованы, являются: секвенирование синтезом на молекулярных колониях (HiSeq, MiSeq, NextSeq, NovaSeq (Illumina)), секвенирование через нанопоры (*ION (Oxford Nanopore Technologies)), мономолекулярное секвенирование в реальном времени (RS, Sequel (PacBio)) лигазное секвенирование с использованием эмульсионного ПЦР (SOLiD4, 5500-series (Thermo Fisher Scientific)), полупроводниковое секвенирование (Ion Torrent, Ion Proton (Thermo Fisher Scientific)), пиросеквенирование (454 (Roche)), и т.д. Заявляемый способ не ограничивается перечисленными технологиями (приборами) секвенирования. Результатом секвенирования геномных библиотек является получение нуклеотидной последовательности всех фрагментов, составляющих секвенируемую геномную библиотеку.

9. Картирование чтений на референсный геном.

Картирование полученных чтений выполняют с использованием любого подходящего программного обеспечения (например, можно использовать программы BWA, Bowtie). Чтение с определенными геномными координатами называется картированным чтением. Образцы, в которых доля картированных чтений составляет менее 10%, не должны использоваться в анализе, для них следует повторно провести приготовление и секвенирование геномных библиотек.

10. Выделение групп чтений дубликатов, определение количества исходных молекул вкДНК, существовавших до амплификации, батч-коррекция, определение вероятностей эуплоидии и анеуплоидии в образце.

Определяют группы чтений дубликатов, приходящихся на каждый регион (чтений, имеющих одинаковую молекулярную метку (с возможностью несовпадения 1 буквы) и картированных с одними и теми же координатами). В каждой группе чтений дубликатов удаляют все чтения, кроме одной копии. Подсчитывают число чтений до и после удаления чтений дубликатов. Для партии образцов определяют значение параметра батч-коррекции: отношения числа всех чтений всех образцов партии во всех целевых регионах к числу чтений после удаления чтений-дубликатов во всех целевых регионах всех образцов партии.

Для каждого образца определяют ожидаемое число чтений в каждом регионе: отношение числа картированных чтений в образце, приходящихся на каждый целевой регион, на параметр батч-коррекции в партии. Далее в каждом образце определяют разности между наблюдаемым и ожидаемым количеством молекул для каждого целевого региона. Разности между наблюдаемым и ожидаемым значениями количества молекул в каждом из целевых регионов используют для сравнения количеств молекул в классификационной модели для определения вероятностей эуплоидии и анеуплоидии в образце. У плода диагностируют анеуплоидию в случае, если вероятность эуплоидии не превышает 0,1, а вероятность анеуплоидии не ниже, чем 0,9.

Частными примерами классификационных моделей, пригодных для использования в заявляемом способе, являются: логистический регрессионный анализ, метод опорных векторов, случайный лес, градиентный бустинг, нейронные сети. Выбор классификационной модели зависит от количества доступных образцов с эуплоидией и анеуплоидией плода в обучающей выборке. Если обучающая выборка содержит менее 1000 образцов, следует использовать модель логистического регрессионного анализа. В результате работы классификационной модели для вектора разности между наблюдаемым и ожидаемым значениями количества молекул в одном образце определяются вероятности принадлежности исследуемого образца к группе с эуплоидией плода и к группе с определенной анеуплоидией плода, по которым делают вывод о наличии у плода анеуплоидии данного типа. Алгоритм вычисления вероятностей определяется функцией потерь над преобразованными данными, способ преобразования является известным для каждой классификационной модели.

Пример 1

Пациентка С., 36 лет, срок беременности на момент забора крови 13 недель. У пациентки провели забор венозной крови в две пробирки по 9 мл, содержащие ЭДТА. Содержимое пробирок перемешали 10 раз и сразу после этого отправили в лабораторию при +4°C. Через 2 часа была проведена заготовка плазмы. Выделение вкДНК из плазмы крови провели согласно протоколу QIAamp Circulating Nucleic Acid Kit. Для полученного образца вкДНК провели приготовление геномных библиотек и секвенирование в составе партии из 18 образцов, в соответствии с методикой, описанной в настоящем документе.

Для 18 образцов были получены чтения в формате FASTQ, в среднем 809220 чтений с качеством не ниже 20 по шкале PHRED на образец. В исследуемом образце получили 839937 чтений. Из чтений были извлечены последовательности, содержащие молекулярные метки, затем оставшиеся фрагменты чтений были картированы на референсный геном человека версии GRCh38 программой bowtie2, после этого подсчитывалось число чтений, приходящихся на каждый целевой регион. Отфильтровали образцы, в которых доля картированных чтений составила менее 10%, после этого в партии осталось 16 образцов для дальнейшего анализа, включая образец пациентки С. Для двух образцов, не прошедших фильтр, провели повторное секвенирование в составе следующей партии образцов.

Определили группы чтений дубликатов, приходящихся на каждый регион (чтений, имеющих одинаковую молекулярную метку (с возможностью несовпадения 1 буквы) и картированных с одними и теми же координатами), с помощью программы dedup из программного пакета umi-tools. В каждой группе чтений дубликатов удалили все чтения, кроме одной копии. Во всех образцах партии подсчитывалось число чтений до и после удаления чтений дубликатов. Для партии образцов определили значение параметра батч-коррекции, оно составило 6,8.

Для каждого образца определили ожидаемое число чтений в каждом регионе: число картированных чтений поделили на параметр батч-коррекции в партии; затем получили разности между реальным и ожидаемым количеством молекул для каждого целевого региона. Из полученных разностей был составлен вектор чисел, упорядоченный по порядковому номеру региона. Ниже представлен фрагмент таблицы с результатами для исследуемого образца вкДНК пациентки С.

Таблица 1. Результаты подсчета чтений в 10 целевых регионах генома человека для исследуемого образца (пациентка С.). Входные данные для классификатора находятся в столбце “Разность между наблюдаемым и ожидаемым числом чтений”.

Регион Число чтений Число чтений без учета дубликатов Параметр батч-коррекции для региона Ожидаемое число чтений без дубликатов Разность между наблюдаемым и ожидаемым числом чтений DHS1 2185 494 4,42 321 173 DHS2 4278 530 8,07 629 -99 DHS3 3758 511 7,35 553 -42 DHS4 3532 490 7,21 519 -29 DHS5 932 276 3,38 137 139 DHS6 3168 432 7,33 466 -34 DHS7 266 104 2,56 39 65 DHS8 536 190 2,82 79 111 DHS9 1454 329 4,42 214 115 DHS10 751 227 3,31 110 117

Вектор чисел был подан на вход классификатору LogisticRegression из библиотеки для машинного обучения scikit-learn, обученному на заранее исследованных образцах беременных женщин с эуплоидией или трисомией плода по хромосоме 21 (на аналогично полученных векторах разностей для тех же целевых регионов). По результатам проведенного вычисления было определено, что вероятности принадлежности образца к классу образцов с эуплоидией и с трисомией плода по хромосоме 21 составляют 7% и 93%, соответственно. Вероятность трисомии плода в образце превышает пороговое значение, равное 90%. Принято решение о наличии трисомии по хромосоме 21 у плода в исследуемом образце.

На основании результатов планового УЗИ в сочетании с биохимическим анализом крови в I триместре беременности, пациентка С. была направлена на инвазивную диагностику трисомии по хромосоме 21 методом биопсии ворсин хориона с последующим кариотипированием. По результатам инвазивной диагностики у плода пациентки С. была выявлена трисомия по хромосоме 21, что совпадает с результатом неинвазивного определения трисомии по хромосоме 21 с использованием заявляемой технологии.

Пример 2

Пациентка М., 39 лет. Срок беременности на момент забора крови 16 недель. У пациентки провели забор венозной крови в две пробирки, содержащие ЭДТА, по 9 мл, затем выделили вкДНК, провели приготовление геномных библиотек и секвенирование в составе партии из 8 образцов, в соответствии с методикой, описанной в настоящем документе.

Для 8 образцов были получены чтения в формате FASTQ, в среднем 786565 чтений с качеством не ниже 20 по шкале PHRED на образец. В исследуемом образце получили 623198 чтений. Из чтений были извлечены последовательности, содержащие молекулярные метки, затем оставшиеся фрагменты чтений были картированы на референсный геном человека версии GRCh38 программой bowtie2, после этого подсчитывалось число чтений, приходящихся на каждый целевой регион. Во всех образцах доля картированных чтений оказалась не менее 10%, в среднем она составила 15%, в исследуемом образце 14%.

Определили группы чтений дубликатов, приходящихся на каждый регион (чтений, имеющих одинаковую молекулярную метку (с возможностью несовпадения 1 буквы) и картированных с одними и теми же координатами), с помощью программы dedup из программного пакета umi-tools. В каждой группе чтений дубликатов удалили все чтения, кроме одной копии. Во всех образцах партии подсчитывалось число чтений до и после удаления чтений дубликатов. Для партии образцов определили значение параметра батч-коррекции, оно составило 3,4.

Для каждого образца определили ожидаемое число чтений в каждом регионе: число картированных чтений поделили на параметр батч-коррекции в партии; затем получили разности между реальным и ожидаемым количеством молекул для каждого целевого региона. Из полученных разностей был составлен вектор чисел, упорядоченный по порядковому номеру региона. Ниже представлен фрагмент таблицы с результатами для исследуемого образца вкДНК пациентки М.

Таблица 2. Результаты подсчета чтений в 10 целевых регионах генома человека для исследуемого образца (пациентка М.). Входные данные для классификатора находятся в столбце “Разность между наблюдаемым и ожидаемым числом чтений”.

Регион Число чтений Число чтений без учета дубликатов Параметр батч-коррекции для региона Ожидаемое число чтений без дубликатов Разность между наблюдаемым и ожидаемым числом чтений DHS227 1,692 413 4.10 498 -85 DHS228 841 296 2.84 247 49 DHS229 1,192 320 3.73 351 -31 DHS230 1,477 350 4.22 434 -84 DHS231 349 153 2.28 103 50 DHS232 148 54 2.74 44 10 DHS233 2,702 539 5.01 795 -256 DHS234 662 246 2.69 195 51 DHS235 425 175 2.43 125 50 DHS236 1,106 334 3.31 325 9

Вектор чисел был подан на вход классификатору LogisticRegression из библиотеки для машинного обучения scikit-learn, обученному на заранее исследованных образцах беременных женщин с эуплоидией или трисомией плода по хромосоме 18 (на аналогично полученных векторах разностей для тех же целевых регионов). По результатам проведенного вычисления было определено, что вероятности принадлежности образца к классу образцов с эуплоидией и с трисомией плода по хромосоме 18 составляют 94% и 6%, соответственно. Принято решение об отсутствии трисомии по хромосоме 18 у плода в исследуемом образце.

На основе результатов биохимического анализа крови I триместра беременности, пациентка М. была направлена на инвазивную диагностику трисомии по хромосоме 18 при помощи амниоцентеза с последующим кариотипированием. По результатам инвазивной диагностики у пациентки М. не была выявлена трисомия по хромосоме 18 плода, что совпадает с результатом неинвазивного определения трисомии по хромосоме 18 с использованием заявляемой технологии.

Похожие патенты RU2777072C1

название год авторы номер документа
СПОСОБ НЕИНВАЗИВНОЙ ПРЕНАТАЛЬНОЙ ДИАГНОСТИКИ АНЕУПЛОИДИЙ ПЛОДА 2014
  • Прохорчук Егор Борисович
  • Пантюх Катерина Сергеевна
  • Артемов Артем Владимирович
RU2583830C2
СПОСОБ НЕИНВАЗИВНОЙ ПРЕНАТАЛЬНОЙ ДИАГНОСТИКИ АНЕУПЛОИДИЙ ПЛОДА 2015
  • Пантюх Катерина Сергеевна
  • Прохорчук Егор Борисович
  • Артемов Артем Владимирович
RU2627673C2
СПОСОБ НЕИНВАЗИВНОЙ ДИАГНОСТИКИ АНЕУПЛОИДИЙ ПЛОДА МЕТОДОМ СЕКВЕНИРОВАНИЯ 2014
  • Ахтительнова Юлия Александровна
  • Мазур Александр Михайлович
  • Прохорчук Егор Борисович
  • Чеканов Николай Николаевич
RU2543155C1
ТЕХНОЛОГИЯ ОПРЕДЕЛЕНИЯ АНЕУПЛОИДИИ МЕТОДОМ СЕКВЕНИРОВАНИЯ 2012
  • Ахтительнова Юлия Александровна
  • Мазур Александр Михайлович
  • Прохорчук Егор Борисович
  • Шанько Андрей Викторович
  • Чеканов Николай Николаевич
  • Пантюх Катерина Сергеевна
RU2529784C2
Способ неинвазивного пренатального скрининга анеуплоидий плода 2019
  • Козюлина Полина Юрьевна
  • Вашукова Елена Сергеевна
  • Глотов Андрей Сергеевич
  • Баранов Владислав Сергеевич
  • Гладких Николай Алексеевич
RU2712175C1
ТЕХНОЛОГИЯ ОПРЕДЕЛЕНИЯ ТРИСОМИИ ХРОМОСОМ МЕТОДОМ СЕКВЕНИРОВАНИЯ 2012
  • Ахтительнова Юлия Александровна
  • Мазур Александр Михайлович
  • Пехов Василий Михайлович
  • Прохорчук Егор Борисович
  • Шанько Андрей Викторович
  • Пантюх Катерина Сергеевна
RU2507269C2
СПОСОБЫ И КОМПОЗИЦИИ ДЛЯ ВЫСОКОМУЛЬТИПЛЕКСНОЙ ПЦР 2012
  • Циммерманн Бернхард
  • Хилл Мэттью М.
  • Лакроут Филипп Гилберт
  • Додд Майкл
RU2650790C2
Способ определения кариотипа плода беременной женщины на основании секвенирования гибридных прочтений, состоящих из коротких фрагментов внеклеточной ДНК 2019
  • Коростин Дмитрий Олегович
  • Плахина Дарья Александровна
  • Евфратов Сергей Викторович
  • Ракитько Александр Сергеевич
  • Ильинский Валерий Владимирович
RU2717023C1
Способ неинвазивного пренатального выявления эмбриональной хромосомной анеуплоидии по материнской крови 2016
  • Дюриш Франтишек
  • Будиш Ярослав
  • Сземес Томас
  • Минарик Габриэль
RU2744604C2
СПОСОБ ОПРЕДЕЛЕНИЯ ИСТОЧНИКА АНЕУПЛОИДНЫХ КЛЕТОК ПО КРОВИ БЕРЕМЕННОЙ ЖЕНЩИНЫ 2016
  • Ребриков Денис Владимирович
  • Трофимов Дмитрий Юрьевич
  • Шубина Екатерина Сергеевна
  • Тетруашвилли Нана Картлосовна
  • Барков Илья Юрьевич
RU2674700C2

Реферат патента 2022 года СПОСОБ ОПРЕДЕЛЕНИЯ АНЕУПЛОИДИИ ПЛОДА В ОБРАЗЦЕ КРОВИ БЕРЕМЕННОЙ ЖЕНЩИНЫ

Изобретение относится к области медицины, а именно неинвазивной пренатальной диагностике анеуплоидий плода по внеклеточной ДНК крови матери, и может быть использовано для определения генетических аномалий плода, анеуплоидий, в том числе моносомий и трисомий, на первом триместре беременности безопасными как для ребенка, так и для матери неинвазивными методами. Способ пренатальной диагностики анеуплоидий по вкДНК плода в крови матери включает приготовление геномных библиотек, определение нуклеотидной последовательности фрагментов геномной библиотеки, которая заключается в цифровом анализе вкДНК посредством секвенирования. Полученные короткие чтения последовательностей ДНК подвергают статистическому анализу, который включает этап удаления ПЦР-дубликатов с последующим определением вероятностей принадлежности исследуемого образца к группе с эуплоидией плода и к группе с анеуплоидией плода. Способ содержит усовершенствованный этап, связанный с выбором целевых регионов генома из кандидатных регионов, и этап, касающийся проведения анализа исследуемого образца вкДНК беременной женщины одновременно с анализом образцов вкДНК других беременных женщин, что позволяет скорректировать систематические отклонения при лабораторной подготовке исследуемых образцов вкДНК и тем самым повысить точность диагностики анеуплоидий плода. 6 з.п. ф-лы, 2 табл., 2 пр.

Формула изобретения RU 2 777 072 C1

1. Способ неинвазивной пренатальной диагностики анеуплоидий плода по образцу вкДНК из крови беременной женщины, включающий

выбор целевых регионов генома из кандидатных регионов, в качестве которых используют сайты гиперчувствительности к ДНКазе I в геноме человека, посредством отбора сайтов, характеризующихся открытым состоянием хроматина в клетках-источниках вкДНК у взрослого человека и закрытым состоянием хроматина в клетках-источниках вкДНК плода, с последующим определением среднего нормализованного покрытия кандидатных регионов в группах беременных и небеременных женщин по результатам полногеномного секвенирования вкДНК, выделенной из образцов крови беременных и небеременных женщин, при этом в качестве целевых регионов используют регионы, характеризующиеся наибольшей разницей в среднем нормализованном покрытии между группами беременных и небеременных женщин;

выделение исследуемого образца вкДНК из крови беременной женщины;

внесение к фрагментам вкДНК молекулярных меток, каждая из которых содержит: случайную последовательность нуклеотидов, универсальную последовательность и специфичную последовательность, комплементарную целевым регионам генома;

амплификацию целевых регионов выделенной вкДНК, с использованием праймеров к универсальной и к специфичной последовательностям в молекулярных метках;

приготовление геномных библиотек из полученных ампликонов;

секвенирование геномных библиотек;

картирование полученных последовательностей на референсный геном или отдельные его части;

определение групп чтений дубликатов - чтений, картированных на одну и ту же координату референсного генома и содержащих одну и ту же случайную последовательность в молекулярных метках;

удаление в каждой группе чтений дубликатов всех чтений, кроме одной копии, которая представляет собой исходную молекулу вкДНК, существовавшую до амплификации;

определение количества исходных молекул вкДНК в каждом из целевых регионов с последующим сравнением с аналогичными значениями, полученными для обучающей выборки образцов вкДНК беременных женщин с эуплоидией и анеуплоидией плода;

определение вероятностей принадлежности исследуемого образца к группе с эуплоидией плода и к группе с анеуплоидией плода, по которым делают вывод о наличии анеуплоидии у плода;

отличающийся тем, что

при выборе целевых регионов из кандидатных регионов удаляют те из них, геномные координаты которых пересекаются с координатами известных повторов в геноме человека, а наибольшую разницу в среднем нормализованном покрытии между двумя группами беременных и небеременных женщин для выбора целевых регионов из кандидатных регионов определяют исходя из наибольшего значения разности площадей, ограниченных графиками среднего нормализованного покрытия в группах беременных и небеременных женщин, в окне фиксированной длины;

исследуемый образец вкДНК анализируют в партии вместе с другими образцами вкДНК беременных женщин, содержащей, по меньшей мере, 8 анализируемых образцов, при этом количество исходных молекул вкДНК в каждом из целевых регионов определяют для всех образцов партии посредством определения параметра, представляющего собой отношение числа всех чтений всех образцов партии во всех целевых регионах к числу чтений после удаления чтений дубликатов во всех целевых регионах всех образцов партии, после чего проводят коррекцию всех образцов в партии с использованием данного параметра: для каждого образца в каждом целевом регионе определяют ожидаемое количество молекул путем деления числа чтений в целевом регионе образца на значение упомянутого параметра; дополнительно определяют в каждом образце разность между наблюдаемым и ожидаемым значениями количества молекул для каждого целевого региона, которую используют для сравнения количеств молекул с аналогичными значениями, полученными для обучающей выборки образцов вкДНК беременных женщин с эуплоидией и анеуплоидией плода.

2. Способ по п.1, отличающийся тем, что для отбора сайтов с открытым состоянием хроматина в качестве клеток-источников вкДНК у взрослого человека используют эндотелиальные и гематопоэтические клеточные линии; для отбора сайтов с закрытым состоянием хроматина в качестве клеток-источников вкДНК у плода используют клетки внешних оболочек плода.

3. Способ по п.1, отличающийся тем, что для формирования кандидатных регионов из БД сайтов гиперчувствительности к ДНКазе I в геноме человека отбирают сайты длиной не менее 100 нуклеотидов с последующим приведением к одинаковой для всех длине 1000 нуклеотидов.

4. Способ по п.1, отличающийся тем, что для формирования результатов полногеномного секвенирования вкДНК используют, по меньшей мере, по 50 образцов беременных и небеременных женщин.

5. Способ по п.1, отличающийся тем, что для выявления отклонений по хромосомам 13, 18, 21, X выбирают, по меньшей мере, 5 целевых регионов, характеризующихся наибольшей разницей в среднем нормализованном покрытии, при этом для определения базового уровня числа чтений выбирают, по меньшей мере, 2 целевых региона на других хромосомах из следующего перечня хромосом: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 14, 15, 16, 17, 20, 22.

6. Способ по п.1, характеризующийся тем, что диагностируют анеуплоидию у плода в случае, если вероятность эуплоидии не превышает 0,1, а вероятность анеуплоидии не ниже, чем 0,9.

7. Способ по п.1, характеризующийся тем, что для определения вероятностей принадлежности исследуемого образца к группе с эуплоидией плода и к группе с анеуплоидией плода используют, по меньшей мере, одну классификационную модель, в качестве которой используют математическую модель логистического регрессионного анализа.

Документы, цитированные в отчете о поиске Патент 2022 года RU2777072C1

СПОСОБ НЕИНВАЗИВНОЙ ПРЕНАТАЛЬНОЙ ДИАГНОСТИКИ АНЕУПЛОИДИЙ ПЛОДА 2015
  • Пантюх Катерина Сергеевна
  • Прохорчук Егор Борисович
  • Артемов Артем Владимирович
RU2627673C2
СПОСОБ НЕИНВАЗИВНОЙ ПРЕНАТАЛЬНОЙ ДИАГНОСТИКИ АНЕУПЛОИДИЙ ПЛОДА 2014
  • Прохорчук Егор Борисович
  • Пантюх Катерина Сергеевна
  • Артемов Артем Владимирович
RU2583830C2
CN 103074416 A, 01.05.2013
EP 3575399 A1, 04.12.2019
US 5714325 A1, 03.02.1998.

RU 2 777 072 C1

Авторы

Прохорчук Егор Борисович

Мазур Александр Михайлович

Васюткина Ольга Николаевна

Даты

2022-08-01Публикация

2021-06-15Подача