СПОСОБ И СИСТЕМА ДЛЯ ОПРЕДЕЛЕНИЯ НУКЛЕОТИДНОЙ ПОСЛЕДОВАТЕЛЬНОСТИ В ЗАДАННОЙ ОБЛАСТИ ГЕНОМА ПЛОДА Российский патент 2016 года по МПК C12Q1/68 

Описание патента на изобретение RU2597981C2

ОБЛАСТЬ ТЕХНИКИ

Объекты предлагаемого изобретения, в целом, относятся к способу определения нуклеотидной последовательности в заданной области генома плода, и используемых с этой целью системы и машиночитаемой среды.

ПРЕДШЕСТВУЮЩИЙ УРОВЕНЬ

К генетическим заболеваниям относятся заболевания, вызванные изменениями генетического материала - врожденными, семейными, необратимыми и наследуемыми. Генетические заболевания могут быть подразделены на 3 класса: моногенные заболевания, полигенные нарушения и хромосомные нарушения. Моногенное заболевание, в большинстве случаев, представляет собой аномальное функционирование гена, вызванное наследованием единственного гена, вызывающего заболевание, по доминантному или рецессивному типу, тогда как к полигенным нарушениям относятся заболевания, вызванные изменениями во множестве генов, на которые в определенной степени может влиять внешняя среда. Хромосомные нарушения включают аномальное число хромосом и структурные аномалии, наиболее часто встречающимся примером является синдром Дауна, возникающий в результате трисомии по 21 хромосоме, при которой у больного ребенка присутствуют врожденные признаки монголизма, тело имеет аномальную форму и т.д. В связи с тем, что эффективные методы лечения генетических заболеваний до настоящего времени отсутствуют, возможны лишь правильно подобранная поддерживающая терапия и дорогостоящая медикаментозная ремиссия, которые ложатся тяжелым бременем на экономику и сознание общества и семьи. Поэтому крайне необходимо проводить профилактическую работу для обнаружения патологии у плода до рождения, с целью обеспечения хорошего медицинского обслуживания в пренатальном и постнатальном периодах.

Однако существующие методы обнаружения патологии нуждаются в усовершенствовании.

КРАТКОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ

Предлагаемое изобретение направлено на решение, по крайней мере, частичное, одной из существующих проблем в данной области техники.

Первым объектом предлагаемого изобретения в широком смысле является создание способа для определения нуклеотидной последовательности в заданной области генома плода. В соответствии с вариантами предлагаемого изобретения, способ может включать: конструирование библиотеки для секвенирования из образца геномной ДНК плода; секвенирование библиотеки для секвенирования с целью получения результата секвенирования, включаюшего множество полученных при секвенировании данных плода; и определение нуклеотидной последовательности в заданной области генома на основании результата секвенирования последовательностей плода в сочетании с генетической информацией о родственнике, посредством использования скрытой марковской модели. Образование генома потомка равнозначно случайной рекомбинации геномов родителей (т.е. рекомбинации посредством обмена гаплотипов и случайной комбинации гамет). В случае плазмы беременной женщины, если исходят из того, что гаплотип плода (рекомбинация родительских гаплотипов) находится в скрытом состоянии, можно использовать данные, полученные при секвенировании плазмы, поскольку наблюдения (наблюдаемые последовательности), вероятности переходов, вероятности наблюдаемых символов и распределение исходных состояний могут быть прослежены по предшествовавшим данным, затем можно определить наиболее вероятную рекомбинацию гаплотипов плода, используя скрытую марковскую модель и алгоритм Витерби, что позволит получить больше информации о плоде до рождения. Таким образом, в соответствии с вариантами предлагаемого изобретения, в скрытой модели Маркова, например, используя алгоритм Витерби и соотносясь с генетической информацией родственника, можно определить нуклеотидную последовательность в заданной области генома плода, тем самым провести пренатальную генетическую диагностику по генетической информации, содержащейся в геноме плода.

Вторым объектом предлагаемого изобретения в широком смысле является создание системы для определения нуклеотидной последовательности в заданной области генома плода. В соответствии с вариантами предлагаемого изобретения, система может включать: аппарат конструирования библиотеки, предназначенный для конструирования библиотеки для секвенирования образца геномной ДНК плода; аппарат секвенирования, соединенный с аппаратом конструирования библиотеки и предназначенный для секвенирования библиотеки, с целью получения результата секвенирования последовательностей плода, включающего множество полученных при секвенировании данных плода; и аппарат анализа, соединенный с аппаратом секвенирования и предназначенный для определения нуклеотидной последовательности в заданной области генома на основании результата секвенирования последовательностей плода в сочетании с генетической информацией о родственнике, посредством использования скрытой марковской модели. Использование системы позволяет эффективно осуществить описанный выше способ определения нуклеотидной последовательности в заданной области генома плода, на основании которой может быть определена нуклеотидная последовательность заданной области генома плода посредством использования скрытой марковской модели и алгоритма Витерби и соотносясь с генетической информацией о родственнике, тем самым провести пренатальную генетическую диагностику по генетической информации, содержащейся в геноме плода.

Третьим объектом предлагаемого изобретения в широком смысле является создание машиночитаемой среды. В соответствии с вариантами предлагаемого изобретения машиночитаемая среда, включающая множество команд, предназначена для определения нуклеотидной последовательности в заданной области генома на основании результата секвенирования последовательностей плода в сочетании с генетической информацией о родственнике, посредством использования скрытой марковской модели. Использование машиночитаемой среды, являющейся объектом предлагаемого изобретения, позволяет процессору эффективно выполнять множество команд для определения нуклеотидной последовательности в заданной области генома плода в скрытой марковской модели при использовании, например, алгоритма Витерби, на основании данных о секвенировании последовательностей плода в сочетании с генетической информацией о родственнике, и, тем самым, провести пренатальную генетическую диагностику по генетической информации, содержащейся в геноме плода.

Дополнительные особенности и преимущества предлагаемого изобретения будут частично представлены в описании, частично станут очевидными из описания или станут известны из практики осуществления вариантов предлагаемого изобретения.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

Эти и другие особенности и преимущества предлагаемого изобретения будут более понятны и наглядны из последующего описания с отсылками к прилагаемым чертежам, на которых:

Фиг. 1 - блок-схема, показывающая процесс анализа с использованием скрытой марковской модели, согласно варианту предлагаемого изобретения; и

Фиг. 2 - диаграмма, показывающая систему для определения нуклеотидной последовательности в заданной области генома плода, согласно варианту предлагаемого изобретения.

ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ

В дальнейших подробных ссылках на варианты предлагаемого изобретения одинаковые или аналогичные элементы и элементы с одинаковыми или аналогичными функциями по всему описанию обозначены одними и теми же цифрами. Описанные в настоящем документе варианты со ссылками на чертежи представлены с разъяснительной, иллюстративной целью и использованы для общего понимания предлагаемого изобретения. Интерпретация вариантов не должна ограничивать предлагаемое изобретение.

Следует понимать, что термины «первый» и «второй», используемые только с описательной целью, не указывают и не подразумевают относительную важность или значение признаков. Также, признаки, определенные как «первый» или «второй», могут явно или неявно включать один или несколько упомянутых признаков. Кроме того, в описании предлагаемого изобретения термин «множество» означает «два или более», если не указано иное.

Способ определения нуклеотидной последовательности в заданной области генома плода

Первым объектом предлагаемого изобретения является способ определения нуклеотидной последовательности в заданной области генома плода. Согласно вариантам предлагаемого изобретения, способ может включать:

на первом этапе, конструирование библиотеки для секвенирования из образца геномной ДНК плода. Согласно предлагаемому изобретению, на источник образца геномной ДНК плода не накладываются специальные ограничения. Могут быть использованы любые образцы, полученные у беременной женщины и содержащие нуклеиновую кислоту плода. Например, согласно вариантам предлагаемого изобретения, образцом от беременной женщины может быть образец молока, мочи и периферической крови, полученный у беременной женщины. При этом наиболее предпочтителен образец периферической крови. Использование периферической крови беременной женщины в качестве источника образца геномной ДНК плода позволяет эффективно получать образец геномной ДНК плода неинвазивным способом, при возможности осуществлять эффективный мониторинг генома плода, не оказывая влияния на нормальное развитие растущего плода. В отношении способов и процессов, используемых для конструирования библиотеки для секвенирования из образца нуклеиновой кислоты, специалист в данной области может сделать надлежащий выбор, с учетом различных технологий секвенирования. Подробное описание процесса может быть представлено производителем, например, компанией Illumina Company, в «Руководстве по мультиплексированной подготовке образца» (Часть №1005063; февраль 2010 г.) или «Руководстве по приготовлению образца для парного секвенирования с концов ДНК» (Часть №1005063; февраль 2010 г.), которые включены в данный документ в форме ссылки. Согласно вариантам предлагаемого изобретения, на способы и устройства для выделения нуклеиновой кислоты из биологического образца специальные ограничения не накладываются, и эта процедура может быть выполнена при использовании коммерческого набора для выделения нуклеиновой кислоты.

После того как библиотека для секвенирования сконструирована, эту библиотеку вносят в секвенатор для получения результата секвенирования, представляющего собой множество данных секвенирования. Согласно вариантам предлагаемого изобретения, на способы и устройства для секвенирования специальные ограничения не накладываются, и может быть использован, в частности, способ обрыва нуклеотидной цепи (Sanger); предпочтение отдается высокопроизводительным методам. Таким образом, использование аппарата, обеспечивающего высокопроизводительное и глубокое секвенирование, позволяет дополнительно повысить эффективность процесса и, тем самым, дополнительно улучшить точность и сходимость последующего анализа (например, статистической проверки) полученных в результате секвенирования данных. Методы высокопроизводительного секвенирования включают, в частности, технологии секвенирования нового поколения или технологию секвенирования одиночных молекул (одномолекулярного секвенирования). Платформа секвенирования нового поколения (Metzker ML. Технологии секвенирования нового поколения. Nat Rev Genet. 2010 Jan; 11(1): 31-46) включают, в частности, платформы секвенирования Illumina-Solexa (GATM, HiSeq2000TM, etc), ABI-Solid и Roche-454 (пиросеквенирование). Платформа (технология) одномолекулярного секвенирования, в частности, включает технологию истинного одномолекулярного секвенирования ДНК компании Helicos Company, технологию одномолекулярного секвенирования в режиме реального времени (SMRT™) компании Pacific Biosciences Company и технологию нанопорового секвенирования, разработанную компанией Oxford Nanopore Technologies (Rusk, Nicole (2009-04-01), Cheap Third-Generation Sequencing (Дешевые технологии секвенирования третьего поколения) Nature Methods 6 (4): 244-245), и т.д. По мере постепенного развития технологии секвенирования специалисту в данной области станут понятными другие методы и оборудование для секвенирования, которые также могут быть использованы для полногеномного секвенирования. Согласно отдельным примерам предлагаемого изобретения, для секвенирования полногеномной библиотеки может быть использован, по крайней мере, один из следующих аппаратов: Illumina-Solexa, ABI-SOLiD, Roche-454 и аппарат для одномолекулярно секвенирования.

Полученный результат секвенирования может быть совмещен с эталонной последовательностью для определения данных секвенирования, соответствующих заданной области. Используемый в описании термин «заданная область» следует понимать в широком смысле, как относящийся к любой области молекулы нуклеиновой кислоты, содержащей возможный заданный объект. В случае анализа однонуклеотидного полиморфизма (ОНП; SNP), заданной областью может быть область, содержащая участок с ОНП. В случае анализа хромосомной анеуплодидии термин «заданная область» относится к подлежащей анализу части хромосомы или целой хромосоме, т.е. к выборочным данным секвенирования хромосомы. На методы выбора данных секвенирования, полученных для соответствующей области в результате секвенирования не накладываются специальные ограничения. Согласно вариантам предлагаемого изобретения, для получения данных секвенирования заданной области, все полученные данные секвенирования могут быть картированы к эталонной последовательности известной нуклеиновой кислоты. Дополнительно, согласно вариантам предлагаемого изобретения, заданная область может также представлять собой множество дискретных точек, непрерывно расположенных в геноме. Согласно вариантам предлагаемого изобретения, на тип используемой эталонной последовательности не накладываются специальные ограничения, и заданной последовательностью может являться любая известная последовательность, содержащая искомую область. Согласно вариантам предлагаемого изобретения, в качестве эталонной поверхности может быть использована известная эталонная последовательность генома человека. Например, согласно вариантам предлагаемого изобретения, эталонной последовательностью генома человека является последовательность NCBI 36.3, HG18. Согласно вариантам предлагаемого изобретения, специальные ограничения не накладываются также и на методы картирования. В конкретных примерах, для картирования может быть использовано программное обеспечение SOAP.

Следующим этапом является определение части последовательности нуклеиновой кислоты в заданной области генома на основании данных секвенирования, соответствующих заданной области; и определение других частей последовательности нуклеиновой кислоты на основании определенной части последовательности нуклеиновой кислоты в заданной области посредством использования алгоритма Витерби, для получения последовательности нуклеиновой кислоты в заданной области. Согласно изобретению, нуклеотидную последовательность в заданной области определяют на основании результата секвенирования последовательностей плода в сочетании с генетической информацией о родственнике посредством использования скрытой марковской модели. Согласно вариантам предлагаемого изобретения, для определения нуклеотидной последовательности в заданной области используют скрытую марковскую модель и алгоритм Витерби. Таким образом, может быть выполнена пренатальная генетическая диагностика по генетической информации, содержащейся в геноме плода.

На Фиг. 1 подробно описан принцип анализа в скрытой марковской модели посредством использования алгоритма Витерби:

В генетическом значении термин «родственник» относится к лицам, имеющим генетическое родство с плодом. Например, согласно вариантам предлагаемого изобретения, «родственником» может быть представитель родительского поколения, т.е. отец и мать плода. Так, образование генома потомка равнозначно случайной рекомбинации геномов родителей (т.е. рекомбинации посредством обмена гаплотипов и случайной комбинации гамет). В случае плазмы беременной женщины, если исходят из того, что гаплотип плода (рекомбинация родительских гаплотипов) находится в скрытом состоянии, можно использовать данные, полученные при секвенировании плазмы, поскольку наблюдения (наблюдаемые последовательности), вероятности транзиций, вероятности наблюдаемых символов и распределение исходных состояний могут быть прослежены по предшествовавшим данным, затем можно определить наиболее вероятную рекомбинацию гаплотипов плода, используя скрытую марковскую модель и алгоритм Витерби, что позволит получить больше информации о плоде до рождения.

Ниже подробно показаны этапы анализа:

Marker:

I. Количество участков, которые необходимо детектировать, обозначают как N.

II. Гаплотипы родителей обозначают, соответственно, и ,

где

, i=1, 2, 3, …, N

III. Неизвестный гаплотип плода обозначают , в частности h0 и h1 соответственно, отражают наследование от матери и отца.

где , ,

Подстрочные индексы xi и yi, соответственно, представляют собой парные последовательности, и - это скрытые состояния, которые требуется декодировать.

При этом все, возможно, присутствующие скрытые состояния представляют собой набор Q.

IV. Данные секвенирования записывают следующим образом: , где представляет собой информацию, полученную при секвенировании участка, содержащего в некотором количестве четыре основания А, Ц, Т и Г.

V. Среднюю концентрацию (образца) плода и среднюю частоту ошибок при секвенировании, соответственно, записывают как ε и e.

Этап 1. Конструирование вектора распределения вероятностей для исходного состояния и матрицы переходов для рекомбинации гаплотипов:

I. Распределение вероятностей исходных состояний записывают как (j∈Q).

Согласно вариантам предлагаемого изобретения, в случае отсутствия референсных данных, можно исходить из того, что , т.е. возможности присутствия каждого скрытого состояния на каждом участке равны.

II. Согласно вариантам предлагаемого изобретения, вероятность рекомбинации гаплотипов записывают как pr=re/N, где re - это среднее число рекомбинаций гамет человека, и предшествующие данные варьирует от 25 до 30.

III. Согласно вариантам предлагаемого изобретения, матрицу переходов для рекомбинации гаплотипов записывают как (j,k∈Q), где ajk - это вероятность перехода скрытых состояний, т.е.

Подстрочные индексы xi и yi гаплотипов плода и составляют пару последовательности, и представляют собой скрытые состояния, подлежащие кодированию. Например, xi=0 означает "в материнской хромосоме аллелем в соответствующем локусе является mi0".

Этап 2. Конструирование матрицы вероятности наблюдений:

Согласно вариантам предлагаемого изобретения, матрицу вероятности наблюдений записывают как (i=1, 2, 3, …, N, j∈Q) где bi,j(si) означает «наблюдаемую возможность данной, полученной при секвенировании, информации на участке i, учитывая гаплотип матери и гаплотип плода (состояние j, )", т.е.

где Pi,base - это "возможность присутствия основания на участке i, учитывая, что гаплотип матери и гаплотип плода (состояния j, )", т.е.

где индикаторной функцией является

На данном этапе выполняется скрытое марковское моделирование (СММ; НММ); расчет распределения вероятности наблюдения на каждом участке bi,j(si), т.е. расчет возможности присутствия текущих данных секвенирования (наблюдений) в плазме беременной женщины, исходя из предположения о различии гаплотипов плода на каждом участке.

Этап 3. Конструирование частичной матрицы вероятностей и обратного перемещения (рассмотрим в качестве примера конструирование одномерной матрицы вероятности):

Определение: частичная вероятность

Определение: обратное перемещение

Используемые в настоящем документе термины «частичная вероятность» δi(qi) и «обратное перемещение» Ψi(qi) соответствуют классическим определениям алгоритма Витебри. Подробные описания определения параметра см. в публикации Lawrence R. Rabiner. PROCEEDINGS OF THE IEEE. Vol. 77. No. 2. February 1989, включенной в данный документ в форме ссылки.

Этап 4. Определение конечного состояния и отслеживание альтернативного пути

Определение конечного состояния,

Наиболее вероятный гаплотип плода (i=1, 2, 3, …, N-1) получают посредством отслеживания альтернативного пути на основании обратного перемещения.

Этап 5. Выведение результата

Таким образом, существует возможность эффективного анализа генома плода. По сравнению с другими известными способами антенатальной диагностики способ согласно предлагаемому изобретению может иметь следующие технические преимущества, главным образом, заключающиеся в точности и количестве получаемой информации:

1) Согласно вариантам предлагаемого изобретения, участок, который требуется обнаружить, не ограничивается участком отцовской ДНК; применительно к материнскому участку, т.е. гетерозиготному материнскому участку, также можно успешно выявить возможное наследование плодом материнского дефектного участка с точностью до 95% и более; и можно обнаружить аномалии, принадлежащие к множеству типов, что расширяет список диагностируемых заболеваний.

2) Информацию о множестве участков и заболеваний можно получить посредством однократного секвенирования; при этом метод, согласно предлагаемому изобретению ,позволяет точно и достоверно определить последовательности генов с малой степенью покрытия в плазме беременной женщины, которые невозможно точно определить посредством лишь увеличения глубины секвенирования.

3). Согласно предлагаемому изобретению, может быть получено графическое изображение генетического заболевания, по информации о других участках могут быть непосредственно установлены родственные заболевания, при возможности получения большого объема информации одномоментно, что особенно целесообразно при клинической диагностике.

Дополнительно, согласно вариантам предлагаемого изобретения, способ определения нуклеотидной последовательности в заданной области генома плода, не ограниченный определенными участками с генетическим полиморфизмом, такими как однонуклеотидный полиморфизм (SNP) или короткий тандемный повтор (STR), а адаптированный для всех генетических полиморфизмов, может параллельно применяться в отношении множества участков, для взаимного подтверждения. Помимо применения для антенатального неинвазивного получения информации о геноме плода с целью диагностики заболевания, способ, согласно предлагаемому изобретению, может применяться также для неинвазивного антенатального установления отцовства, т.е. определения личности отца плода до рождения, тем самым способствуя решению спорных вопросов, связанных с ответственностью и обязательствами, собственностью, случаями изнасилования и пр.

Система для определения нуклеотидной последовательности в заданной области генома плода

Предлагаемое изобретение также касается создания системы для определения нуклеотидной последовательности в заданной области генома плода. Согласно вариантам предлагаемого изобретения (см. Фиг. 2) система 1000 может включать: аппарат 100 конструирования библиотеки, аппарат 200 секвенирования (секвенатор) и аппарат 400 анализа (анализатор).

Согласно вариантам предлагаемого изобретения, аппарат 100 конструирования библиотеки предназначен для создания библиотеки для секвенирования, полученной из образца геномной ДНК плода. Согласно вариантам предлагаемого изобретения, секвенатор 200 соединен с аппаратом 100 конструирования библиотеки и предназначен для секвенирования библиотеки для секвенирования с целью получения результата, включающего множество полученных при секвенировании данных плода. Согласно вариантам предлагаемого изобретения, система 1000 может также включать аппарат выделения образца ДНК, предназначенный для выделения образца геномной ДНК плода из периферической крови беременной женщины. Таким образом, система предназначена для неинвазивной антенатальной диагностики.

Согласно изобретению, система может включать также аппарат 300 картирования, который соединен с секвенатором 200 и предназначен для картирования результата секвенирования последовательности плода к эталонной последовательности с целью получения результата секвенирования, соответствующего заданной области. В предлагаемом изобретении на способы и устройства для секвенирования специальные ограничения не накладываются, и можно использовать, в частности, способ обрыва нуклеотидной цепи (Sanger); предпочтение отдается высокопроизводительным методам. Так, использование аппарата, обеспечивающего высокопроизводительное и глубокое секвенирование, позволяет дополнительно повысить эффективность процесса и, тем самым дополнительно улучшить точность и сходимость последующего анализа (например, статистической проверки) полученных в результате секвенирования данных. Методы высокопроизводительного секвенирования включают, в частности, технологию секвенирования Next-Generation или технологию секвенирования одиночных молекул (одномолекулярного секвенирования). Платформа секвенирования Next-Generation (Metzker ML. Технологии секвенирования нового поколения. Nat Rev Genet. 2010 Jan; 11(1): 31-46) включает, в частности, платформы секвенирования Illumina-Solexa (GATM, HiSeq2000TM, etc), ABI-Solid и Roche-454 (пиросеквенирование). Платформа (технология) одномолекулярного секвенирования, в частности, включает технологию истинного одномолекулярного секвенирования ДНК компании Helicos Company, технологию одномолекулярного секвенирования в режиме реального времени (SMRT™) компании Pacific Biosciences Company и технологию нанопорового секвенирования, разработанную компанией Oxford Nanopore Technologies (Rusk, Nicole (2009-04-01), Cheap Third-Generation Sequencing (Дешевые технологии секвенирования третьего поколения) Nature Methods 6 (4): 244-245), и т.д.

По мере постепенного развития технологии секвенирования специалисту в данной области станут понятными другие методы и оборудование для секвенирования, которые также могут быть использованы для полногеномного секвенирования. Согласно отдельным примерам предлагаемого изобретения, для секвенирования полногеномной библиотеки может быть использован, по крайней мере, один из следующих аппаратов: Illumina-Solexa, ABI-SOLiD, Roche-454 и аппарат для одномолекулярноо секвенирования. В предлагаемом изобретении на тип используемой эталонной последовательности не накладываются специальные ограничения, и эталонной может являться любая известная последовательность, содержащая искомую область. В частности в качестве эталонной последовательности может быть использована известная эталонная последовательность генома человека, например последовательность NCBI 36.3, HG18. Также предлагаемое изобретение, не накладывает специальные ограничения на методы картирования. Согласно конкретным примерам, для картирования может быть использовано программное обеспечение SOAP.

Согласно вариантам предлагаемого изобретения, анализатор 400 соединен с секвестором и позволяет определить нуклеотидную последовательность в заданной области на основании результата секвенирования последовательностей плода в сочетании с генетической информацией о родственнике посредством использования скрытой марковской модели.

В соответствии с изобретением, в алгоритме Витерби 0,25 используют в качестве распределения вероятности исходных состояний, re/N используют как вероятность рекомбинации, где re равен 25~30, предпочтительно, re равен 25 и N - длина заданной области,

используют в качестве матрицы переходов для рекомбинации, где pr равен re/N.

Согласно изобретению, аппарат картирования предназначен для определения основания, присутствующего с наибольшей вероятностью, на основании следующей формулы:

где .

Анализ полученных в результате секвенирования данных также применяется в системе для определения нуклеотидной последовательности в заданной области генома плода. Он подробно описан выше и не включен в данный раздел для краткости.

Таким образом, использование системы позволяет эффективно осуществить описанный выше способ определения нуклеотидной последовательности в заданной области генома плода, на основании которой может быть определена нуклеотидная последовательность заданной области генома плода посредством использования скрытой марковской модели и алгоритма Витерби и, соотносясь с генетической информации о родственнике, тем самым провести пренатальную генетическую диагностику по генетической информации, содержащейся в геноме плода.

Согласно предлагаемому изобретению, заданная область - это участок, в котором ранее был определен генетический полиморфизм, и генетический полиморфизм представлен, по крайней мере, одним из следующих полиморфизмов: однонуклеотидным полиморфизмом или коротким тандемным повтором (STR).

Термин «соединенный» следует понимать в широком смысле. Он может относиться к прямому соединению и непрямому соединению, при условии достижения вышеописанного функционального соединения.

Специалистам в данной области техники следует принять во внимание, что описанные выше характеристики и преимущества способа определения нуклеотидной последовательности в заданной области генома плода могут быть адаптированы для применения вместе с системой для определения нуклеотидной последовательности в заданной области генома плода.

Машиночитаемая среда

Еще одним объектом предлагаемого изобретения является машиночитаемая среда, которая включает множество команд, предназначенных для определения нуклеотидной последовательности в заданной области на основании результата секвенирования последовательностей плода в сочетании с генетической информацией о родственнике посредством использования скрытой марковской модели. Таким образом, использование машиночитаемой среды позволяет эффективно осуществить описанный выше способ определения нуклеотидной последовательности в заданной области генома плода, на основании которой может быть определена нуклеотидная последовательность заданной области генома плода посредством использования скрытой марковской модели и, например, алгоритма Витерби и, соотносясь с генетической информацией о родственнике, тем самым провести пренатальную генетическую диагностику по генетической информации, содержащейся в геноме плода.

Согласно изобретению, множество команд предназначено для определения нуклеотидной последовательности в заданной области генома посредством использования скрытой марковской модели и алгоритма Витерби. Согласно вариантам предлагаемого изобретения, в алгоритме Витерби 0,25 используют в качестве распределения вероятности исходных состояний, re/N - как вероятность рекомбинации, где re равен 25~30, предпочтительно, re равен 25 и N - длина заданной области.

используют в качестве матрицы переходов для рекомбинации, где pr равен re/N.

В предлагаемом изобретении множество команд адаптируют для определения основания, присутствующего с наибольшей вероятностью, на основании следующей формулы:

где .

Подробно описанный выше анализ полученных в результате секвенирования данных также может быть осуществлен в машиночитаемой среде и не включен в данный раздел для краткости.

В предлагаемом изобретении заданная область - это участок, в котором ранее был определен генетический полиморфизм, и генетический полиморфизм представлен, по крайней мере, одним из следующих полиморфизмов: однонуклеотидным полиморфизмом или коротким тандемным повтором (STR).

В данном описании «машиночитаемой средой» может быть любое устройство, пригодное для включения в себя, хранения, обмена, распространения или передачи программ, используемых системой, устройством или исполняющим команды оборудованием, или взаимодействующее с этой системой, устройством или оборудованием. Частные примеры машиночитаемой среды включают, например: электронное соединение (электронное устройство) с одним или несколькими проводами; портативный компьютер (магнитное устройство), оперативное запоминающее устройство (ОЗУ; ROM), стираемое программируемое постоянное запоминающее устройство (СППЗУ; EPROM или флэш-память), оптоволоконное устройство и портативное постоянное запоминающее устройство на основе компакт-диска (ПЗУ-КД; CDROM). Дополнительно, машиночитаемой средой может быть даже бумага или другая соответствующая среда, на которой могут быть напечатаны программы, в связи с возможностью оптического сканирования бумаги или другой соответствующей среды с последующим редактированием, дешифровкой или обработкой другими надлежащими способами при необходимости получения программы в электронном виде, после чего программы могут храниться в компьютерной памяти.

Следует понимать, что каждая часть предлагаемого изобретения может быть реализована при использовании аппаратного обеспечения, программного обеспечения, аппаратно-программного обеспечения и их сочетания. В приведенных выше вариантах изобретения множество этапов или методов может быть реализовано программным обеспечением или аппаратно-программным обеспечением, хранящимся в памяти, и может быть исполнено соответствующей системой исполнения команд. Например, в случае реализации аппаратным обеспечением (аналогично тому, как и в другом варианте изобретения), этапы или методы могут быть реализованы одним из технических приемов или несколькими техническими приемами, известными из уровня техники: дискретной логической схемой, предназначенной для реализации логической функции или сигнала данных; специализированной интегральной схемой, имеющей соответствующую комбинационную логическую стробирующую схему; программируемой логической матрицей (ПЛМ; PGA), программируемой пользователем логической матрицей (ППЛМ; FPGA) и т.д.

Специалистам в данной области очевидно, что этапы приведенного выше в качестве примера способа, согласно предлагаемому изобретению, полностью или частично, могут быть достигнуты посредством использования программ для управления аппаратным обеспечением. Программы могут храниться в машиночитаемом хранилище данных, и программы включают один этап или комбинацию этапов в вариантах способа, согласно предлагаемому изобретению, при осуществлении этого способа с использованием компьютера.

Дополнительно, каждая функциональная ячейка вариантов, согласно предлагаемому изобретению, может быть интегрирована в модуль управления, либо эти ячейки могут быть физические разделены, либо две или более ячеек могут быть интегрированы в модуль управления. Интегральный модуль может быть осуществлен в форме программного обеспечения или в форме программных функциональных модулей. В тех случаях, когда интегральный модуль осуществлен в форме программного функционального модуля и поступает в продажу или используется в качестве самостоятельного товара, интегральный модуль может храниться в машиночитаемом хранилище данных.

Далее приводятся подробные примеры осуществления предлагаемого изобретения. Специалистам следует принять во внимание, что описанные ниже примеры представлены с разъяснительной целью и не должны ограничивать объем предлагаемого изобретения. В тех случаях, когда в примерах отсутствует указание на конкретную технологию или условия, при воспроизведении такого этапа следует использовать технологии и условия, описанные в литературе или известные из уровня техники (например, см. публикацию J. Sambrook. et al. (в переводе Huang РТ). Молекулярное клонирование: Руководство по лабораторным исследованиям, 3-е издание, Science Press), или руководствоваться инструкциями на продукт. Если производители реактивов или оборудования не указаны, можно использовать серийно выпускаемые товары, например, компанией Illumina company.

Общий подход

Способ, согласно вариантам предлагаемого изобретения, в основном включает следующие этапы:

1) неинвазивное получение образца от беременной женщины, содержащего генетический материал плода, выделение из образца геномной ДНК;

2) выделение и очистка образца геномной ДНК у членов семьи плода, таких как родители или бабушки/дедушки;

3) конструирование библиотеки для секвенирования из всех видов генетического материала, в соответствии с требованиям к применению различных платформ секвенирования;

4) фильтрация полученных в результате секвенирования данных при использовании критериев фильтрации, основанных на оценке качества, степенью контаминации последовательности-адаптора и т.д.

5) сборка полученных высококачественных последовательностей, в соответствии с требованиями, картирование результата сборки к эталонной последовательности генома человека с целью получения уникально картируемых последовательностей с последующим их анализов в математической модели

Модель анализа

Маркер:

I. Количество участков, которые необходимо детектировать, обозначают как N.

II. Гаплотипы родителей обозначают, соответственно, и ,

где

, i=1, 2, 3, …, N.

III. Неизвестный гаплотип плода обозначают , в частности, h0 и h1 соответственно, отражают наследование от матери и отца.

где , ,

Подстрочные индексы xi и yi соответственно, представляют собой парные последовательности, и это скрытые состояния, которые требуется декодировать.

При этом все, возможно, присутствующие скрытые состояния представляют собой набор Q.

IV. Данные секвенирования записывают следующим образом:

где представляет собой информацию, полученную при секвенировании участка, содержащего в некотором количестве четыре основания А, Ц, Т и Г.

V. Среднюю концентрацию (образца) плода и среднюю частоту ошибок при секвенировании, соответственно, записывают как ε и е.

Этап 1. Конструирование вектора распределения вероятностей для исходного состояния и матрицы переходов для рекомбинации гаплотипов:

I. Распределение вероятностей исходных состояний записывают как (j∈Q).

Согласно вариантам предлагаемого изобретения, в случае отсутствия референсных данных, можно исходить из того, что , т.е. возможности присутствия каждого скрытого состояния на каждом участке равны.

II. В предлагаемом изобретении, вероятность рекомбинации гаплотипов записывают как pr=re/N, где re - это среднее число рекомбинаций гамет человека, и предшествующие данные варьирует от 25 до 30.

III. Согласно вариантам предлагаемого изобретения, матрицу переходов для рекомбинации гаплотипов записывают как (j, k∈Q), где a jk - это вероятность перехода скрытых состояний, т.e.

,

Подстрочные индексы xi и yi гаплотипов плода и составляют пару последовательности, и представляют собой скрытые состояния, подлежащие кодированию. Например, xi=0 означает "в материнской хромосоме аллелем в соответствующем локусе является mi0".

Этап 2. Конструирование матрицы вероятности наблюдений:

В предлагаемом изобретении, матрицу вероятности наблюдений записывают как (i=1, 2, 3, …, N, j∈Q), где bi,j(si) означает «наблюдаемую возможность данной, полученной при секвенировании, информации на участке i, учитывая гаплотип матери и гаплотип плода (состояние j, )", т.е.

это "возможность присутствия основания на участке i, учитывая, гаплотип матери и гаплотип плода (состояние j, )", т.e.,

где индикаторной функцией является

Этап 3. Конструирование частичной матрицы вероятностей и обратного перемещения (рассмотрим в качестве примера конструирование одномерной матрицы вероятности):

Определение: частичная вероятность

Определение: обратное перемещение

Этап 4. Определение конечного состояния и отслеживание альтернативного пути

Определение конечного состояния ,

Наиболее вероятный гаплотип плода (i=1, 2, 3, …, N-1) получают посредством отслеживания альтернативного пути на основании обратного перемещения.

Этап 5. Выведение результата

ПРИМЕР 1

Получение и обработка образца

(1) полученный образец включал: периферическую кровь отца и беременной матери (членов семьи) и собранную после рождения пуповинную кровь плода; всю эту кровь собирали в пробирку, которая содержала ЭДТА, для предотвращения коагуляции; и собранную слюну двух бабушек и двух дедушек (использовали набор Oragene® OG-250, предназначенный для сбора слюны, предназначенной для определения ДНК/очистки ДНК).

(2) выполняли генотипирование выделенной из слюны ДНК двух бабушек и двух дедушек, используя для этого ДНЧ-чип Infinium® HD Human610-Quad BeadChip.

(3) периферическую кровь беременной матери центрифугировали при 1600 g и 4°С в течение 10 минут для разделения клеток крови и плазмы. Затем полученную плазму центрифугировали при 16000 g и 4°С в течение 10 минут, для того чтобы полностью удалить остаточные лейкоциты и получить конечный образец плазмы беременной матери. Для выделения геномной ДНК из конечного образца плазмы беременной матери использовали набор TIANamp Micro DNA (TIANGEN) и получали в результате смесь геномной ДНК матери и плода. Затем материнскую геномную ДНК выделяли из удаленных остаточных лейкоцитов. Полученную из плазмы ДНК использовали для конструирования библиотеки последовательностей, в соответствии с руководством по применению секвенатора HiSeq2000™ компании Illumia. В отношении сконструированных библиотек проводили проверку распределения, используя анализатор Agilent®Bioanalyzer 2100, чтобы обеспечить соответствие требования, предъявляемого к размеру фрагментов. Затем выполняли количественный анализ двух библиотек методом количественной ПЦР. Библиотеки, соответствующие требованиям, секвенировали на секвенаторе Illumina® HiSeq2000™, используя цикл секвенирования РЕ101 index (т.е. парное секвенирование с обоих концов ДНК для образца с индексом РЕ101), при этом настройки параметров и операции соответствовали спецификациям компании Illumina® (опубликованным на сайте http://www.illumina.com/support/documentation.ilmn).

(4) из периферической крови родителей, лейкоцитов, выделенных из периферической материнской крови, и пуповинной крови плода выделяли соответствующую геномную ДНК, используя набор TIANamp Micro DNA Kit (TIANGEN).

В полученные образцы ДНК, кроме образца ДНК, выделенного из плазмы, следовало фрагментировать, используя Covaris™, чтобы длина последовательности составила 500 п.н. Полученные фрагменты ДНК и образец ДНК, выделенный из плазмы, использовали для конструирования библиотеки, в соответствии с руководством по применению секвенатора HiSeq2000™ компании Illumia; методика подробно описана ниже:

Реакционная система для концевой репарации:

10-буферный раствор полинуклеотидкиназы Т4 10 мкл дНТФ (10 мМ) 4 мкл ДНК-полимераза Т4 5 мкл Фрагменты Кленова 1 мкл Полинуклеотидкиназа Т4 5 мкл Фрагменты ДНК 30 мкл Бидистиллированная Н2О до 100 мкл

После проведения реакции в течение 30 минут при температуре 20°С использовали набор для очистки продуктов ПЦР (QIAGEN) в отношении продуктов ДНК с репарированными концами. Далее продукты ДНК с репарированными концами растворяли в 34 мкл элюирующего буферного раствора.

Реакционная система для добавления основания А в конце последовательности:

10-буферный раствор Кленова 5 мкл дАТФ (1 мМ) 10 мкл Фрагмент Кленова (3′-5′ экзо-) 3 мкл ДНК 32 мкл

После 30-минутной инкубации при 37°С полученные продукты очищали, используя для этого набор для очистки продуктов ПЦР набор MinElute® PCR Purification Kit (QIAGEN), и растворяли в 12 мкл элюирующего буферного раствора, для того чтобы получить образцы ДНК с добавленным на концах основанием А.

Система для лигирования адаптеров:

2-буферный раствор для быстрого лигирования ДНК 25 мкл Смесь адаптерных олигонуклеотидов (20 мкМ) 10 мкл ДНК-лигаза Т4 5 мкл Образец ДНК с добавленным на конце основанием А 10 мкл

После проведения реакции в течение 15 минут при 20°С использовали набор для очистки продуктов ПЦР (QIAGEN) в отношении лигированных продуктов. Далее лигированные продукты растворяли в 32 мкл элюирующего буферного раствора.

Реакционная система для ПЦР:

Цитированный продукт 10 мкл Смесь ДНК-полимераз Phusion 25 мкл Праймер для ПЦР (10 пмоль/мкл) 1 мкл Индексная последовательность N (10 пмоль/мкл) 1 мкл Ультрачистая вода UltraPure™ 13 мкл

Ниже показаны условия проведения реакции:

Для очистки продуктов ПЦР использовали набор PCR Purification Kit (QIAGEN) и очищенные продукты ПЦР растворяли в 50 мкл элюирующего буферного раствора.

В отношении сконструированных библиотек проводили проверку распределения, используя анализатор Agilent®Bioanalyzer 2100, чтобы обеспечить соответствие требования, предъявляемого к размеру фрагментов. Затем выполняли количественный анализ двух библиотек методом количественной ПЦР. Библиотеки, соответствующие требованиям, секвенировали на секвенаторе Illumina® HiSeq2000™, используя цикл секвенирования РЕ101 index (т.е. парное секвенирование с обоих концов ДНК для образца с индексом РЕ101), при этом настройки параметров и операции соответствовали спецификациям компании Illumina® (опубликованным на сайте http://www.illumina.com/support/documentation.ilmn)

(5) генотипирование посредством секвенирования отцовского и материнского геномов

a. полученные при секвенировании данные сравнивали с эталонной последовательностью генома человека (Hg19, NCBI 36.3), используя программное обеспечение SOAP2.

b. полученные данные использовали для конструирования консенсусной последовательности (популяции CHS) при помощи программного обеспечения SOAPsnp (для получения генеалогических данных для популяции Southern Han (CHS) использовали тысячи плановых показателей).

c. выделяли генотипы маркерных участков.

(6) определение родительских гаплотипов

a. конструирование матрицы группового генотипа, содержащей генотипы предков и родителей, т.е. выделение генотипов на маркерных участках родителей, предков и популяции Southern Han

b. использование программного обеспечения BEAGLE для прослеживания родительских гаплотипов.

(7) определение гаплотипа плода

a. картирование данных, полученных при секвенировании плазмы, с эталонной последовательностью генома человека ((Hg19, NCBI 36.3) при использовании программного обеспечения SOAP2;

b. конструирование вектора распределения вероятностей для исходных состояний и матрицы переходов для рекомбинации гаплотипов,

конструирование вектора распределения вероятностей для исходных состояний: рассматривают модель неэталонных данных, т.е. вероятность каждого из исходных состояний одинакова и равна 0.25.

конструирование матрицы переходов для рекомбинации гаплотипов,: консервативно, re=25 (в других случаях - аналогично, в соответствии с описанием в разделе «общий подход»);

c. расчет информации о секвенировании для каждого участка и конструирование матрицы вероятности наблюдений (в других случаях - аналогично, в соответствии с описанием в разделе «общий подход»);

d. конструирование частичной матрицы вероятности и обратного перемещения (в других случаях - аналогично, в соответствии с описанием в разделе «общий подход»);

e. определение конечного состояния и отслеживание альтернативного пути; и

f. получение результата.

Ниже показана точность результатов генотипирования:

Промышленная применимость

Способ определения нуклеотидной последовательности в заданной области генома плода, система для определения нуклеотидной последовательности в заданной области генома плода и машиночитаемая среда, согласно вариантам предлагаемого изобретения, могут эффективно применяться для анализа последовательностей нуклеиновых кислот в заданной области генома плода.

Хотя в описании представлены поясняющие варианты изобретения, специалистам следует принять во внимание, что этими вариантами изобретение не ограничивается и в варианты изобретения могут быть внесены изменения, модификации и альтернативы, не выходящие за пределы существа, принципов и объема предлагаемого изобретения.

Указания в тексте данного документа на «вариант (изобретения)», «некоторые варианты», «один вариант», «другой пример», «пример», «частные примеры» или «некоторые примеры» означают, что частный признак, структура, материала или характеристика, описанные в связи с вариантом изобретения или примером, включены, по крайней мере., в один вариант или пример предлагаемого изобретения. Таким образом, присутствие фраз «в некоторых вариантах изобретения», «в одном варианте», «в варианте, «в другом примере», «в примере», «в определенных примерах» или «в некоторых примерах» в различных местах описания не всегда относятся к одному и тому же варианту или примеру предлагаемого изобретения. Более того, определенные признаки, структуры, материалы или характеристики могут присутствовать вместе приемлемым образом в одном или нескольких вариантах или примерах.

Похожие патенты RU2597981C2

название год авторы номер документа
СПОСОБЫ И СИСТЕМЫ ДЛЯ ОПРЕДЕЛЕНИЯ ТОГО, ЯВЛЯЕТСЯ ЛИ ГЕНОМ АНОМАЛЬНЫМ 2011
  • Цю Юн
  • Лю Лифу
  • Цзян Хуэй
  • Чэнь Фан
  • Чжан Чуньлэй
  • Ван Цзянь
  • Ван Цзюнь
  • Ян Хуаньмин
  • Чжан Сюцин
RU2599419C2
ОБНАРУЖЕНИЕ МУТАЦИЙ И ПЛОИДНОСТИ В ХРОМОСОМНЫХ СЕГМЕНТАХ 2015
  • Бабиарц Джошуа
  • Константин Тюдор Помпилиу
  • Юбанк Лейн А.
  • Джемелос Джордж
  • Хилл Мэттью Мика
  • Киркизляр Хусейн Эсер
  • Рабиновиц Мэттью
  • Сакария Онур
  • Сигурджонссон Стёрмир
  • Зиммерман Бернхард
RU2717641C2
СПОСОБЫ И КОМПОЗИЦИИ ДЛЯ ВЫСОКОМУЛЬТИПЛЕКСНОЙ ПЦР 2012
  • Циммерманн Бернхард
  • Хилл Мэттью М.
  • Лакроут Филипп Гилберт
  • Додд Майкл
RU2650790C2
СПОСОБЫ НЕИНВАЗИВНОГО ПРЕНАТАЛЬНОГО УСТАНОВЛЕНИЯ ОТЦОВСТВА 2011
  • Райан Эллисон
  • Сигурджонссон Стаймир
  • Банджевик Милена
  • Джемелос Джордж
  • Хилл Мэтью
  • Банер Йохан
  • Рабиновитц Мэтью
  • Демко Закари
RU2620959C2
СПОСОБ ОБНАРУЖЕНИЯ МИКРОДЕЛЕЦИЙ В ОБЛАСТИ ХРОМОСОМЫ С ДНК-МАРКИРУЮЩИМ УЧАСТКОМ 2012
  • Лю Сяо
  • Чжан Цзюньцзе
  • Сюй Хуайцянь
  • Су Чжен
  • Чжан Жуйфан
  • Ван Цзюнь
  • Ван Цзянь
  • Ян Хуаньмин
RU2610691C2
СПОСОБЫ НЕИНВАЗИВНОГО ПРЕНАТАЛЬНОГО УСТАНОВЛЕНИЯ ПЛОИДНОСТИ 2011
  • Рабиновитц, Мэтью
  • Джемелос, Джордж
  • Банджевик, Милена
  • Райан, Эллисон
  • Демко, Закари
  • Хилл, Мэтью
  • Зиммерман, Бернхард
  • Банер, Йохан
RU2671980C2
БИОИНФОРМАЦИОННЫЕ СИСТЕМЫ,УСТРОЙСТВА И СПОСОБЫ ВЫПОЛНЕНИЯ ВТОРИЧНОЙ И/ИЛИ ТРЕТИЧНОЙ ОБРАБОТКИ 2017
  • Ван Ройн, Питер
  • Рюле, Майкл
  • Мехьо, Рами
  • Стоун, Гэвин
  • Хам, Марк
  • Оджард, Эрик
  • Пташек, Амнон
RU2750706C2
БИОИНФОРМАЦИОННЫЕ СИСТЕМЫ, УСТРОЙСТВА И СПОСОБЫ ДЛЯ ВЫПОЛНЕНИЯ ВТОРИЧНОЙ И/ИЛИ ТРЕТИЧНОЙ ОБРАБОТКИ 2017
  • Ван Ройн, Питер
  • Рюле, Майкл
  • Мехьо, Рами
  • Стоун, Гэвин
  • Хам, Марк
  • Оджард, Эрик
  • Пташек, Амнон
RU2799750C2
СПОСОБЫ СЕКВЕНИРОВАНИЯ ТРЕХМЕРНОЙ СТРУКТУРЫ ИССЛЕДУЕМОЙ ОБЛАСТИ ГЕНОМА 2011
  • Ван Мин Макс Ян
  • Де Лат Ваутер Леонард
RU2603082C2
МОЛЕКУЛЯРНЫЕ МАРКЕРЫ, АССОЦИИРОВАННЫЕ С УСТОЙЧИВОСТЬЮ ПОДСОЛНЕЧНИКА К OROBANCHE 2018
  • Гао, Вэньсян
  • Рипли, Ван Л.
  • Арадхия, Чандрашекар С.
  • Мейер, Дэвид Х.
  • Веласко, Леонардо
  • Бенсон, Роберт М.
  • Перес Вич, Бегона
  • Эриксон, Анджела Л.
  • Фернандес Мартинес, Хосе Мария
  • Жэнь, Жуйхуа
  • Авери, Милан
RU2776361C2

Иллюстрации к изобретению RU 2 597 981 C2

Реферат патента 2016 года СПОСОБ И СИСТЕМА ДЛЯ ОПРЕДЕЛЕНИЯ НУКЛЕОТИДНОЙ ПОСЛЕДОВАТЕЛЬНОСТИ В ЗАДАННОЙ ОБЛАСТИ ГЕНОМА ПЛОДА

Группа изобретений относится к области биотехнологии. Предложены способ и система для определения нуклеотидной последовательности в заданной области генома плода. Способ включает следующие этапы: конструирование библиотеки для секвенирования из образца геномной ДНК из периферической крови беременной женщины; секвенирование библиотеки для секвенирования с целью получения результата секвенирования. Результат секвенирования плода включает множество полученных при секвенировании данных. Нуклеотидную последовательность в заданной области генома определяют посредством использования скрытой марковской модели на основании результата секвенирования последовательностей плода в сочетании с генетической информацией о родственнике с помощью алгоритма Витерби. Система состоит из аппарата конструирования библиотеки, секвенатора и анализатора. Использование изобретений позволяет произвести генотипирование с высокой точностью. 2 н. и 12 з.п. ф-лы, 2 ил., 1 табл., 1 пр.

Формула изобретения RU 2 597 981 C2

1. Способ определения нуклеотидной последовательности в заданной области генома плода, включающий следующие этапы:
конструирование библиотеки для секвенирования из образца геномной ДНК из периферической крови беременной женщины;
секвенирование библиотеки для секвенирования с целью получения результата секвенирования, включающего множество полученных при секвенировании данных плода; и
определение нуклеотидной последовательности в заданной области на основании результата секвенирования последовательностей плода в сочетании с генетической информацией о родственнике, посредством использования скрытой марковской модели, основываясь на алгоритме Витерби.

2. Способ по п. 1, отличающийся тем, что секвенирование библиотеки для секвенирования производят с помощью по крайней мере одного аппарата, выбранного из группы, включающей Illumina-Solexa, ABI-Solid, Roche-454 и аппарат одномолекулярного секвенирования.

3. Способ по п. 1, отличающийся тем, что включает этап картирования результата секвенирования к эталонной последовательности для определения данных секвенирования, соответствующих заданной области.

4. Способ по п. 3, отличающийся тем, что эталонная последовательность является эталонной последовательностью человека.

5. Способ по п. 1, отличающийся тем, что родственниками являются родители плода.

6. Способ по п. 1, отличающийся тем, что в алгоритме Витерби 0,25 используют в качестве распределения вероятности исходных состояний, re/N используют как вероятность рекомбинации, где re равен 25~30, предпочтительно re равен 25 и N - длина заданной области,

используют в качестве матрицы переходов для рекомбинации, где pr равен re/N.

7. Способ по п. 3, отличающийся тем, что этап картирования результата секвенирования к эталонной последовательности для определения данных секвенирования, соответствующих заданной области включает:
определение основания, присутствующего с наибольшей вероятностью, с использованием следующей формулы:

где

8. Способ по п. 1, отличающийся тем, что заданной областью является участок, предварительно определенный как имеющий генетический полиморфизмом.

9. Способ по п. 8, отличающийся тем, что генетическим полиморфизмом является однонуклеотидный полиморфизм и/или STR.

10. Система определения нуклеотидной последовательности в заданной области генома плода, содержащая:
аппарат конструирования библиотеки, предназначенный для создания библиотеки для секвенирования, полученной из образца геномной ДНК из периферической крови беременной женщины;
секвенатор, соединенный с аппаратом конструирования библиотеки и предназначенный для секвенирования библиотеки для секвенирования с целью получения результата, включающего множество полученных при секвенировании данных плода, и
анализатор, соединенный с секвенатором и предназначенный для определения нуклеотидной последовательности в заданной области на основании результата секвенирования последовательностей плода в сочетании с генетической информацией о родственнике, посредством использования скрытой марковской модели, основываясь на алгоритме Витерби.

11. Система по п. 10, отличающаяся тем, что секвенатором является по крайней мере один аппарат, выбранный из группы, включающей Illumina-Solexa, ABI-Solid, Roche-454 и аппарат одномолекулярного секвенирования.

12. Система по п. 10, отличающаяся тем, что содержит аппарат картирования, соединенный с секвенатором и предназначенный для картирования результата секвенирования последовательности плода к эталонной последовательности с целью получения результата секвенирования, соответствующего заданной области.

13. Система по п. 10, отличающаяся тем, что в алгоритме Витерби 0,25 используют в качестве распределения вероятности исходных состояний, re/N используют как вероятность рекомбинации, где re равен 25~30, предпочтительно re равен 25 и N - длина заданной области,

используют в качестве матрицы переходов для рекомбинации, где pr равен re/N.

14. Система по п. 12, отличающаяся тем, что аппарат картирования предназначен для определения основания, присутствующего с наибольшей вероятностью, с использованием следующей формулы:

где

Документы, цитированные в отчете о поиске Патент 2016 года RU2597981C2

CN 102127818 A 20.07.2011
CN 102317473 A 11.07.2012
US 20110281759 A1 17.11.2011.

RU 2 597 981 C2

Авторы

Чень Шэнпэй

Гэ Хуэйцзюань

Ли Хучао

И Шан

Ван Цзянь

Ван Цзюнь

Ян Хуаньмин

Чжан Сюцин

Даты

2016-09-20Публикация

2012-05-14Подача