СПОСОБ ОБНАРУЖЕНИЯ ВАРИАЦИЙ ЧИСЛА КОПИЙ (CNV) ПО ДАННЫМ СЕКВЕНИРОВАНИЯ ПОЛНОГО ЭКЗОМА ЧЕЛОВЕКА И ГЕНОМА С НИЗКИМ ПОКРЫТИЕМ Российский патент 2024 года по МПК C12Q1/68 C12Q1/6883 C12Q1/6869 

Описание патента на изобретение RU2822040C1

Изобретение относится к медицине, биологии, биотехнологии, эпидемиологии, а именно - к способам диагностики заболеваний, вызванных вариацией числа копий определенной последовательности геномной ДНК человека (copy number variation, CNV) и может быть использовано в медицинской (клинической) практике для диагностики и дифференциальной диагностики патологических процессов, вызванных вариацией числа копий определенной последовательности геномной ДНК человека.

Результаты многочисленных исследований убедительно доказали патогенетическое значение вариаций числа копий определенных последовательностей геномной ДНК человека (Wu C.H.W. et al. Copy Number Variation Analysis Facilitates Identification of Genetic Causation in Patients with Congenital Anomalies of the Kidney and Urinary Tract // Eur. Urol. Open Sci. The Authors, 2022. Vol. 44. P. 106-112; BHW F. et al. All-in-one whole exome sequencing strategy with simultaneous CNV-, SNV- and Absence-of-Heterozygosity analysis in fetuses with structural ultrasound anomalies: A one year's experience. // Prenat. Diagn. 2023; Correa-Silva S.R. et al. Copy number variation in pituitary stalk interruption syndrome: A large case series of sporadic non-syndromic patients and literature review // J. Neuroendocrinol. 2023. Vol. 35, №1).

Учитывая важность и актуальность решения проблемы точной оценки вариаций числа копий определенных последовательностей геномной ДНК человека для различных областей медицины, возникает настоятельная потребность в разработке и внедрении в практическое здравоохранение новых диагностических подходов, позволяющих определять CNV. Подобные новые диагностические подходы необходимы для диагностики генетических, онкологических, иммунологических и иных заболеваний.

В настоящее время для обнаружения вариаций числа копий определенных последовательностей геномной ДНК человека используют различные методы клинической и лабораторной диагностики: множество вариантов гибридизации, ПЦР, метод мультиплексной амплификации лигазо-связанных проб (MLPA), секвенирование первого, второго и третьего поколений, хромосомный микроматричный анализ. В частности, наиболее актуальным на сегодня подходом является секвенирование второго поколения (высокопроизводительное секвенирование, next generation sequencing, NGS), выполняемое по протоколу определения полного генома, полного экзома или отдельных панелей генов.

Для поиска CNV в данных экзомного и геномного секвенирования предложен ряд инструментов как для анализа данных геномного секвенирования: CNVnator (Abyzov A. et al. CNVnator: An approach to discover, genotype, and characterize typical and atypical CNVs from family and population genome sequencing. 2011. P. 974-984), CNVSeq (Xie C., Tammi M.T. CNV-seq, a new method to detect copy number variation using high-throughput sequencing. // BMC Bioinformatics. 2009. Vol. 10. P. 80), CNV-TV (Duan J. et al. CNV-TV: a robust method to discover copy number variation from short sequencing reads. // BMC Bioinformatics. 2013. Vol. 14. P. 150) так и для поиска CNV в данных экзомного секвенирования DECoN (Fowler A. DECoN: А Detection and Visualization Tool for Exonic Copy Number Variants. 2022. P. 77-88), SavvyCNV (Laver T.W. et al. SavvyCNV: Genome-wide CNV calling from off-target reads // PLoS Comput. Biol. 2022. Vol. 18, №3. P. 1-16) и др.

Большинство известных алгоритмов для поиска CNV в данных секвенирования нового поколения используют информацию о глубине прочтения регионов и не учитывают информацию о генотипах в регионе, кроме того, при использовании секвенировании с низким покрытие информация о генотипах недоступна, результаты, получаемые по данных этих инструментов как правило сильно зашумлены и требуют обязательного подтверждения референсным методом (Özden F., Alkan C., Çiçek A.E. Polishing copy number variant calls on exome sequencing data via deep learning // Genome Res. 2022. Vol. 32, №6. P. 1170-1182).

Таким образом, разработка нового способа выявления вариаций и изменений числа копий по данным секвенирования экзома совместно с секвенирование генома с низким покрытием позволит повысить эффективность использования данной технологии в медицине благодаря уточнению наличия или отсутствия CNV по данным доли альтернативных аллелей в экзомных данных и изменении глубины покрытия как в данных до проведения обогащения, так и данных после проведения обогащения.

Ближайшими аналогами предлагаемого способа являются:

- Заявка на изобретение №2020114321 от 21.04.2020 «Способ выявления вариаций и изменений числа копий в генах BRCA1 и BRCA2 по данным таргетного массового параллельного секвенирования генома». Предложен способ выявления вариаций и изменений числа копий в генах BRCA1 и BRCA2.

Однако описанный способ обеспечивает выявление вариаций числа копий лишь определенного региона геномной ДНК (в генах BRCA1 и BRCA2).

- Заявка на изобретение RU 2014134175/10А от 20.01.2012 «Способ и система выявления вариации числа копий в геноме» где предложен способ выявление изменений числа копий фрагментов хромосом по данным полногеномного секвенирования.

Однако описанный способ учитывает только изменение глубины покрытия и точки разрыва и не учитывает генотипы вариантов в регионе.

Технический результат состоит в создании нового способа выявления терминальных изменений числа копий и увеличение его точности путем секвенирования полного экзома человека и генома с низким покрытием и обработки получаемых данных.

Технический результат достигается тем, что в способе обнаружения вариаций числа копий в образце по данным одновременного секвенирования полного экзома человека и секвенирования генома с низким покрытием не менее 0.1 прочтений на нуклеотид и не более 5 прочтений на нуклеотид, включающий выделение геномной ДНК из лейкоцитов крови пациентов, подготовку геномных библиотек, проведение обогащения целевой ДНК с использованием гибридизационной системы экзомного обогащения, проведение одновременного секвенирования геномной библиотеки с низким покрытием и экзомной библиотеки с обычным покрытием на приборе для проведения NGS, анализ данных экзомного секвенирования и секвенирования генома с низким покрытием , картирование полученных после секвенирования прочтений на последовательность референсного генома человека с использованием алгоритма BWA-MEM, конвертирование полученного SAM-файла в ВАМ-файл, его сортирование и индексирование функциями программы SAMtools, обработка полученного файла с данными секвенирования генома с низким покрытием с помощью программы QDNASeq, в результате чего получается VCF-файл с данными о нарушениях числа копий, проведение поиска отличий от референсного генома для файла с данными секвенирования экзома с использованием протокола GATK best practices и поиск CNV в экзомных данных с использованием GATK, кроме того проводится оценка покрытия каждой хромосомы, после получения всех данных проводится сопоставление результатов, полученных разными способами, из всех потенциальных CNV оставляют только те, данные которых не противоречат друг другу по результатам хотя бы 2-х методов.

Способ осуществляется следующим образом образом.

Из образцов геномной ДНК, выделенных из лейкоцитов крови пациентов готовят геномные библиотеки, после чего проводят обогащение целевой ДНК с использованием гибридизационной системы обогащения. Преимущественно используется набор для экзомного обогащения IDT xGen™ Exome Hyb Panel v2, однако он может быть заменен на любой другой, который позволяет проводить экзомное обогащение. Далее проводят одновременное секвенирование геномной библиотеки с низким покрытием и экзомной библиотеки с обычным покрытием на приборе для проведения NGS (например, Novaseq, HiSeq Illumina или DNBSEQ-T7, DNBSEQ-G400, DNBSEQ-G50 BGI). Полученные после секвенирования прочтения картируют на последовательность референсного генома человека с использованием алгоритма BWA mem (http://bio-bwa.sourceforge.net). Полученный SAM-файл конвертируют в ВАМ-файл функцией view программы samtools, а последний сортируют и индексируют функциями sort и index samtools, соответственно. Полученный файл с данными секвенирования генома с низким покрытием обрабатывается с помощью программы QDNASeq https://bioconductor.org/packages/release/bioc/html/QDNAseq.html), в результате чего получается vcf файл с данными о нарушениях числа копий. Для файла с данными секвенирования экзома проводится поиск отличий от референсного генома с использованием протокола GATK best practices (https://gatk.broadinstitute.org/hc/en-us/articles/360035535932-Germline-short-variant-discovery-SNPs-Indels-) и поиск CNV в экзомных данных с использованием GATK, кроме того проводится оценка покрытия каждой хромосомы.

После получения всех данных проводится сопоставление результатов, полученных разными способами. Из всех потенциальных CNV оставляют только те, данные которых не противоречат друг другу по результатам хотя бы 2-х методов.

Например, в случае подозрения на делецию в регионе делеции ожидается отсутствие гетерозиготных отличий от референсного генома. В случае подозрения на дупликацию для гетерозиготных отличий от референсного генома ожидается соотношение аллелей 1:2 вместо обычного для гетерозигот 1:1.

Определяющими преимуществом способа является анализ числа копий всей последовательности генома, а не только определенных регионов, а также секвенирование 2-х типов библиотек, что незначительно влияет на стоимость анализа, но при этом позволяет проводить анализ не только фрагментов полученных после проведения обогащения, что значительно влияет на равномерность представленности фрагментов.

Разработанный подход может быть использован для дополнительного анализа CNV при проведении экзомного исследования.

Пример реализации изобретения

Результаты определения CNV сравнивали с данными стандартного кариотипирования или с данными хромосомного микроматричного анализа.

Образец 1 (фиг. 1, 2)

По данным секвенирования с низким покрытие была обнаружена делеция на 8 хромосоме. Потеря гетерозиготности с данных экзомного секвенирования подтверждает наличие делеции. По данным хромосомного микроматричного анализа наличие делеции так же подтверждено.

Образец 2 (фиг. 3)

По данным секвенирования с низким покрытие была обнаружена трисомия по 21 хромосоме. Изменение соотношения гетерозигных аллелей в данных экзомного секвенирования подтверждает наличие трисомии. По данным стандартного кариотипирования подтверждена трисомия 21.

Образец 3 (фиг. 4)

По данным секвенирования с низким покрытием было обнаружено нарушение числа копий половых хромосом (2 копии X хромосомы и 1 копия Y хромосомы). Наличие гетерозигных аллелей на X хромосоме в данных экзомного секвенирования подтверждает наличие 2-х копий X хромосомы, а наличие покрытия целевых регионов Y хромосомы подтверждает мужской пол. По данным кариотипирования подтверждено наличие синдрома Клайенфельтера.

Похожие патенты RU2822040C1

название год авторы номер документа
Способ выявления вариаций и изменений числа копий в генах BRCA1 и BRCA2 по данным таргетного массового параллельного секвенирования генома 2020
  • Кечин Андрей Андреевич
  • Боярских Ульяна Александровна
  • Оскорбин Игорь Петрович
  • Шарапов Содбо Жамбалович
  • Филипенко Максим Леонидович
RU2759953C2
Способ обработки данных полногеномного секвенирования 2023
  • Альберт Евгений Александрович
  • Павлов Валерий Александрович
  • Сайганова Мария Алексеевна
  • Федонин Геннадий Геннадьевич
  • Карпулевич Евгений Андреевич
  • Беленикин Максим Сергеевич
  • Косова Екатерина Валерьевна
  • Зобкова Гаухар Юрьевна
RU2806429C1
Система обработки данных полногеномного секвенирования 2023
  • Альберт Евгений Александрович
  • Павлов Валерий Александрович
  • Сайганова Мария Алексеевна
  • Федонин Геннадий Геннадьевич
  • Карпулевич Евгений Андреевич
  • Беленикин Максим Сергеевич
  • Косова Екатерина Валерьевна
  • Зобкова Гаухар Юрьевна
RU2804535C1
СПОСОБ ОПРЕДЕЛЕНИЯ ИСТОЧНИКА АНЕУПЛОИДНЫХ КЛЕТОК ПО КРОВИ БЕРЕМЕННОЙ ЖЕНЩИНЫ 2016
  • Ребриков Денис Владимирович
  • Трофимов Дмитрий Юрьевич
  • Шубина Екатерина Сергеевна
  • Тетруашвилли Нана Картлосовна
  • Барков Илья Юрьевич
RU2674700C2
РАСЧЕТ БРЕМЕНИ ОПУХОЛЕВЫХ МУТАЦИЙ С ИСПОЛЬЗОВАНИЕМ ДАННЫХ РНК СЕКВЕНИРОВАНИЯ ОПУХОЛЕЙ И КОНТРОЛИРУЕМОГО МАШИННОГО ОБУЧЕНИЯ 2020
  • Буздин Антон Александрович
  • Сорокин Максим Игоревич
  • Зотова Евгения Дмитриевна
  • Ткачев Виктор Сергеевич
  • Гаража Андрей Владимирович
RU2759205C1
Способ и тест-система для определения доли плодовой ДНК в плазме крови беременной женщины с помощью методов высокопроизводительного секвенирования 2017
  • Шубина Екатерина Сергеевна
  • Трофимов Дмитрий Юрьевич
  • Тетруашвили Нана Картлосовна
RU2636618C1
Способ определения нуклеотидных последовательностей экзонов генов BRCA1 и BRCA2 2015
  • Кечин Андрей Андреевич
  • Боярских Ульяна Александровна
  • Ермоленко Наталья Александровна
  • Храпов Евгений Александрович
  • Филипенко Максим Леонидович
RU2612894C1
СПОСОБ НЕИНВАЗИВНОЙ ПРЕНАТАЛЬНОЙ ДИАГНОСТИКИ АНЕУПЛОИДИЙ ПЛОДА 2014
  • Прохорчук Егор Борисович
  • Пантюх Катерина Сергеевна
  • Артемов Артем Владимирович
RU2583830C2
СПОСОБ И СИСТЕМА ВЫЯВЛЕНИЯ ВАРИАЦИИ ЧИСЛА КОПИЙ В ГЕНОМЕ 2012
  • Инь Сюйян
  • Чжан Чуньлэй
  • Чэнь Шеньпэй
  • Чжан Чуньшэн
  • Пань Сяоюй
  • Цзян Хуэй
  • Чжан Сюцин
RU2593708C2
ИНДИВИДУАЛИЗИРОВАННЫЕ ПРОТИВООПУХОЛЕВЫЕ ВАКЦИНЫ 2012
  • Сахин Угур
  • Крайтер Себастьян
  • Дикен Мустафа
  • Дикманн Ян
  • Козловски Михаель
  • Бриттен Цедрик
  • Кэстл Джон
  • Лёвер Мартин
  • Ренард Бернхард
  • Омококо Тана
  • Де Граф Йоханнес Хендрикус
RU2779946C2

Иллюстрации к изобретению RU 2 822 040 C1

Реферат патента 2024 года СПОСОБ ОБНАРУЖЕНИЯ ВАРИАЦИЙ ЧИСЛА КОПИЙ (CNV) ПО ДАННЫМ СЕКВЕНИРОВАНИЯ ПОЛНОГО ЭКЗОМА ЧЕЛОВЕКА И ГЕНОМА С НИЗКИМ ПОКРЫТИЕМ

Изобретение относится к области молекулярной биологии. Описан способ обнаружения вариаций числа копий в образце по данным одновременного секвенирования полного экзома человека и секвенирования генома с низким покрытием не менее 0,1 прочтений на нуклеотид и не более 5 прочтений на нуклеотид. Технический результат состоит в создании нового способа выявления терминальных изменений числа копий и увеличении его точности путем секвенирования полного экзома человека и генома с низким покрытием и обработки получаемых данных. 4 ил., 1 пр.

Формула изобретения RU 2 822 040 C1

Способ обнаружения вариаций числа копий в образце по данным одновременного секвенирования полного экзома человека и секвенирования генома с низким покрытием не менее 0,1 прочтений на нуклеотид и не более 5 прочтений на нуклеотид, включающий выделение геномной ДНК из лейкоцитов крови пациентов, подготовку геномных библиотек, проведение обогащения целевой ДНК с использованием гибридизационной системы экзомного обогащения, проведение одновременного секвенирования геномной библиотеки с низким покрытием и экзомной библиотеки с обычным покрытием на приборе для проведения NGS, анализ данных экзомного секвенирования и секвенирования генома с низким покрытием, картирование полученных после секвенирования прочтений на последовательность референсного генома человека с использованием алгоритма BWA-MEM, конвертирование полученного SAM-файла в ВАМ-файл, его сортирование и индексирование функциями программы SAMtools, обработку полученного файла с данными секвенирования генома с низким покрытием с помощью программы QDNASeq, в результате чего получается VCF-файл с данными о нарушениях числа копий, проведение поиска отличий от референсного генома для файла с данными секвенирования экзома с использованием протокола GATK best practices и поиск CNV в экзомных данных с использованием GATK, кроме того, проводится оценка покрытия каждой хромосомы, после получения всех данных проводится сопоставление результатов, полученных разными способами, из всех потенциальных CNV оставляют только те, данные которых не противоречат друг другу по результатам хотя бы 2-х методов.

Документы, цитированные в отчете о поиске Патент 2024 года RU2822040C1

US 20220215900 A1, 07.07.2022
US 20200270682 A1, 27.08.2020
CN 108292327 A, 17.07.2018
СПОСОБ И СИСТЕМА ВЫЯВЛЕНИЯ ВАРИАЦИИ ЧИСЛА КОПИЙ В ГЕНОМЕ 2012
  • Инь Сюйян
  • Чжан Чуньлэй
  • Чэнь Шеньпэй
  • Чжан Чуньшэн
  • Пань Сяоюй
  • Цзян Хуэй
  • Чжан Сюцин
RU2593708C2

RU 2 822 040 C1

Авторы

Шубина Екатерина

Ребриков Денис Владимирович

Трофимов Дмитрий Юрьевич

Даты

2024-06-28Публикация

2023-03-01Подача