НУКЛЕОЗИДЫ И НУКЛЕОТИДЫ С 3’-ГИДРОКСИ БЛОКИРУЮЩИМИ ГРУППАМИ И ИХ ПРИМЕНЕНИЕ В СПОСОБАХ СЕКВЕНИРОВАНИЯ ПОЛИНУКЛЕОТИДОВ Российский патент 2024 года по МПК C07H19/06 C07H19/10 C07H19/16 C07H19/20 C07H21/00 C12Q1/68 

Описание патента на изобретение RU2818762C2

Настоящее раскрытие в общем относится к нуклеотидам, нуклеозидам или олигонуклеотидам, содержащим 3’-гидрокси защитные группы, и к их применению в способах секвенирования полинуклеотидов. Также раскрываются способы получения 3’-гидрокси защищенных нуклеотидов, нуклеозидов или олигонуклеотидов.

Описание родственной области

К успехам в исследовании молекул отчасти привели улучшения технологий, используемых для характеристики молекул или их биологических реакций. В частности, исследование нуклеиновых кислот - ДНК и РНК - выиграло от разработки технологий, используемых для анализа последовательностей и исследований событий гибридизации.

Примером технологий, которые улучшили исследование нуклеиновых кислот, является разработка готовых к применению чипов иммобилизованных нуклеиновых кислот. Данные чипы типично состоят из высокоплотной матрицы полинуклеотидов, иммобилизованных на веществе твердой подложки. См., например, Fodor et al., Trends Biotech. 12: 19-26, 1994, в которой описываются пути сборки нуклеиновых кислот с использованием химически сенсибилизированной стеклянной поверхности, защищенной маской, но экспонированной в определенных областях для обеспечения присоединения подходящим образом модифицированных нуклеотидфосфорамидитов. Готовые к применению чипы также могут быть изготовлены методикой «нанесения в виде пятен» известных полинуклеотидов на твердую подложку в заданных положениях (например, Stimpson et al., Proc. Natl. Acad. Sci. 92: 6379-6383, 1995).

Один способ определения нуклеотидной последовательности нуклеиновой кислоты, связанной с чипом, называется «секвенирование посредством синтеза» или «SBS». Данная методика определения последовательности ДНК в идеале требует контролируемого (т.е. по очереди) включения правильного комплементарного нуклеотида напротив секвенируемой нуклеиновой кислоты. Это обеспечивает точное секвенирование посредством добавления нуклеотидов в многочисленных циклах, так как каждый нуклеотидный остаток секвенируется по очереди, таким образом, предотвращая осуществление неконтролируемых серий включений. Включенный нуклеотид считывается с использованием подходящей метки, присоединенной к нему, перед удалением группировки метки и последующим дальнейшим циклом секвенирования.

Для обеспечения того, что происходит только одно включение, в каждый меченый нуклеотид, который добавляется к растущей цепи, включается структурная модификация («защитная группа» или «блокирующая группа») для обеспечения того, что включается только один нуклеотид. После добавления нуклеотида с защитной группой защитная группа затем удаляется при условиях реакции, которые не мешают целостности секвенируемой ДНК. Цикл секвенирования может затем продолжаться с включением следующего защищенного меченого нуклеотида.

Для того, чтобы быть полезными в секвенировании ДНК нуклеотиды, которые обычно представляют собой нуклеотидтрифосфаты, обычно требуют 3’-гидрокси защитной группы, чтобы предотвращать продолжение репликации полимеразой, используемой для включения в полинуклеотидную цепь, как только добавляется основание на нуклеотиде. Имеется много ограничений по типам групп, которые могут быть добавлены на нуклеотид и все еще являются подходящими. Защитная группа должна предотвращать добавление дополнительных нуклеотидных молекул в полинуклеотидную цепь, в то же самое время будучи легко удаляемой от сахарного фрагмента, без вызова повреждения полинуклеотидной цепи. Кроме того, модифицированному нуклеотиду нужно быть совместимым с полимеразой или другим подходящим ферментом, используемым для его включения в полинуклеотидную цепь. Идеальная защитная группа, следовательно, должна демонстрировать долговременную стабильность, быть эффективно включаемой полимеразным ферментом, вызывать блокирование вторичного или дальнейшего включения нуклеотидов и иметь способность к удалению при мягких условиях, которые не вызывают повреждение структуры полинуклеотида, предпочтительно при водных условиях.

Обратимые защитные группы были описаны ранее. Например, Metzker et al., (Nucleic Acids Research, 22 (20): 4259-4267, 1994) раскрывает синтез и применение восьми 3’-модифицированных 2-дезоксирибонуклеозид-5'-трифосфатов (3'-модифицированный дНТФ) и тестирование в двух анализах ДНК-матрицы на активность включения. В WO 2002/029003 описан способ секвенирования, который может включать применение аллильной защитной группы для кэппирования 3’-ОН группы на растущей цепи ДНК в полимеразной реакции.

Кроме того, разработка целого ряда обратимых защитных групп и способов снятия их защиты при совместимых с ДНК условиях была ранее описана в публикациях международных заявок № WO 2004/018497 и WO 2014/139596, каждая из которых является тем самым включенной посредством ссылки во всей ее полноте.

КРАТКОЕ ИЗЛОЖЕНИЕ СУЩНОСТИ ИЗОБРЕТЕНИЯ

Некоторые воплощения настоящего раскрытия относятся к нуклеотиду или нуклеозиду, содержащему рибозу или дезоксирибозу, имеющую удаляемую 3’-ОН защитную или блокирующую группу, образующую структуру ковалентно присоединенную к атому 3’-углерода, в которой:

каждый R1a и R1b независимо представляет собой Н, С16 алкил, С16 галогеналкил, С16 алкокси, С16 галогеналкокси, циано, галоген, возможно замещенный фенил или возможно замещенный аралкил;

каждый R2a и R2b независимо представляет собой Н, С16 алкил, С16 галогеналкил, циано или галоген;

в качестве альтернативы, R1a и R2a, наряду с атомами, к которым они присоединяются, образуют возможно замещенную пяти-восьмичленную гетеро цикл ильную группу;

R3 представляет собой Н, возможно замещенный С26 алкенил, возможно замещенный С37 циклоалкенил, возможно замещенный С26 алкинил или возможно замещенный (С16 алкилен)Si(R4)3; и

каждый R4 независимо представляет собой Н, С16 алкил или возможно замещенный С610 арил. В некоторых воплощениях, когда каждый R1a и R1b представляет собой Н или C1-C6 алкил, оба R2a и R2b представляют собой Н, тогда R3 представляет собой замещенный С26 алкенил, возможно замещенный С37 циклоалкенил, возможно замещенный С26 алкинил или возможно замещенный (C1-C6 алкилен)Si(R4)3. В некоторых воплощениях, когда каждый R1a, R1b, R2a и R2b представляет собой Н, тогда R3 не является Н.

Некоторые воплощения настоящего раскрытия относятся к нуклеозиду или нуклеотиду, содержащему рибозу или дезоксирибозу, имеющую удаляемую блокирующую 3’-ОН группу, образующую структуру ковалентно присоединенную к 3’-атому углерода, в которой:

каждый из R5 и R6 независимо представляет собой Н, С16 алкил, С26 алкенил, С26 алкинил, С16 галогеналкил, С28 алкоксиалкил, возможно замещенный -(СН2)m-фенил, возможно замещенный

-(СН2)n-(5 или 6-членный гетероарил), возможно замещенный-(СН2)k37 карбоциклил или возможно замещенный -(СН2)р-(3-7-членный гетероциклил);

каждый из -(СН2)m-, -(СН2)n- -(СН2)k- и -(СН2)p- является возможно замещенным; и

каждый из m, n, k и р независимо представляет собой 0, 1, 2, 3 или 4.

Некоторые воплощения настоящего раскрытия относятся к олигонуклеотиду или полинуклеотиду, содержащему 3’-ОН-блокированную молекулу нуклеотида, описанную в данном документе.

Некоторые воплощения настоящего раскрытия относятся к способу получения растущего полинуклеотида, комплементарного целевому одноцепочечному полинуклеотиду, в реакции секвенирования, включающему включение молекулы нуклеотида, описанной в данном документе, в растущий комплементарный поли нуклеотид, где включение данного нуклеотида предотвращает введение любого последующего нуклеотида в растущий комплементарный полинуклеотид. В некоторых воплощениях включение данного нуклеотида осуществляется полимеразой, терминальной дезоксинуклеотидилтрансферазой (TdT) или обратной транскриптазой. В одном воплощении включение осуществляется полимеразой (например, ДНК-полимеразой).

Некоторые другие воплощения настоящего раскрытия относятся к способу определения последовательности целевого одноцепочечного полинуклеотида, включающему:

(a) включение нуклеотида, содержащего 3’-ОН блокирующую группу и выявляемую метку, как описано в данном документе, в копию полинуклеотидной цепи, комплементарной по меньшей мере части целевой полинуклеотидной цепи;

(b) выявление идентичности нуклеотида, включенного в копию полинуклеотидной цепи; и

(с) химическое удаление метки и 3’-ОН блокирующей группы из нуклеотида, включенного в копию полинуклеотидной цепи.

В некоторых воплощениях способ секвенирования дополнительно включает (d) отмывку химически удаленных метки и 3'-блокирующей группы от копии полинуклеотидной цепи. В некоторых воплощениях такая стадия отмывки также удаляет не включенные нуклеотиды. В некоторых таких воплощениях 3'-блокирующая группа и выявляемая метка включенного нуклеотида удаляются перед введением следующего комплементарного нуклеотида. В некоторых других воплощениях 3’-блокирующая группа и выявляемая метка удаляются в одной стадии химической реакции. В некоторых воплощениях последовательное включение, описанное в данном документе, проводится по меньшей мере 50 раз, по меньшей мере 100 раз, по меньшей мере 150 раз, по меньшей мере 200 раз или по меньшей мере 250 раз.

Некоторые другие воплощения настоящего раскрытия относятся к наборам, содержащим целый ряд молекул нуклеотидов или нуклеозидов, описанных в данном документе, и их упаковочные материалы. Нуклеотиды, нуклеозиды, олигонуклеотиды или наборы, которые излагаются в данном документе, могут использоваться для выявления, измерения или идентификации биологической системы (включая, например, ее процессы и компоненты). Типичные методики, в которых могут использоваться нуклеотиды, олигонуклеотиды или наборы, включают секвенирование, анализ экспрессии, анализ гибридизации, генетический анализ, анализ РНК, клеточный анализ (например, связывание с клеткой или анализ клеточной функции) или анализ белка (например, анализ связывания белка или анализ активности белка). Данное применение может осуществляться на автоматическом приборе для выполнения конкретной методики, таком как автоматический секвенатор. Секвенатор может содержать два или более чем два лазера, работающих при разных длинах волн, для различения между разными выявляемыми метками.

КРАТКОЕ ОПИСАНИЕ ГРАФИЧЕСКИХ МАТЕРИАЛОВ

ФИГ. 1 представляет собой график, иллюстрирующий стабильность разных 3' блокированных нуклеотидов как функцию времени в буферном растворе при 65°С.

ФИГ. 2А представляет собой график, иллюстрирующий процентную долю (%) остающегося нуклеотида (исходное вещество) как функцию времени при сравнении скорости деблокирования нуклеотида с 3’-АОМ блокирующей группой с нуклеотидом с 3’-О-азидометильной (-CH2N3) блокирующей группой в растворе.

ФИГ. 2В представляет собой график, иллюстрирующий процентную долю (%) 3' деблокированных нуклеотидов как функцию времени при сравнении скорости деблокирования 3' блокированных нуклеотидов с разными ацетальными блокирующими группами в растворе.

ФИГ. 3А и 3В иллюстрируют результаты секвенирования на приборе Illumina MiniSeq® с использованием полностью функционализированных нуклеотидов (ffN) с 3’-АОМ блокирующей группой в смеси для включения.

ФИГ. 3С иллюстрирует показатель ошибки секвенирования с использованием полностью функционализированных нуклеотидов (ffN) с 3’-АОМ блокирующей группой в смеси для включения по сравнению со стандартными ffN с 3’-О-азидометильной блокирующей группой.

ФИГ. 4А и 4В каждая иллюстрирует сравнение первичных показателей секвенирования, включающих фазирование, предфазирование и показатель ошибок, с использованием полностью функционализированных нуклеотидов с 3’-АОМ и 3’-О-азидометильными блокирующими группами с использованием двух разных ДНК-полимераз (Pol 812 и Pol 1901) соответственно.

ФИГ. 5 представляет собой график, иллюстрирующий стабильность секвенирования полностью функционализированных нуклеотидов с 3’-АОМ и 3’-О-азидометильными блокирующими группами как функцию времени в буферном растворе при 45°С.

ФИГ. 6 представляет собой график, иллюстрирующий стабильность нуклеозидов с разными 3' блокирующими группами как функцию времени в буферном растворе при 65°С.

ФИГ. 7 представляет собой график, иллюстрирующий процентную долю (%) остающегося 3' блокированного нуклеотида как функцию времени при сравнении скорости расщепления (деблокирования) тиокарбаматной 3' блокирующей группы диметилтиокарбамата (DMTC) при двух разных условиях (Oxone® или NaIO4) со скоростью расщепления 3’-О-азидометильной (3'-O-CH2N3) блокирующей группы.

ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ

Воплощения настоящего раскрытия относятся к нуклеозидам и нуклеотидам с 3’-ОН ацетальной или тиокарбаматной блокирующими группами для приложений секвенирования, например, секвенирования посредством синтеза (SBS). Данные блокирующие группы обеспечивают лучшую стабильность в растворе по сравнению с блокирующими группами, известными в данной области. В частности, 3’-ОН блокирующие группы имеют улучшенную стабильность во время синтеза полностью функционализированных нуклеотидов (ffN) и также большую стабильность в растворе во время приготовления в виде препарата, хранения и действия на секвенаторах. Кроме того, с 3’-ОН блокирующими группами, описанными в данном документе, также могут достигаться низкое предфазирование, меньшее угасание сигнала для улучшенного качества данных, что обеспечивает более длинные считываемые фрагменты из приложений секвенирования.

Определения

Если не определено иначе, все технические и научные термины, использованные в данном документе, имеют такое значение, которое является общедоступным для обычного специалиста в данной области. Применение термина «включающий», а также других форм, таких как «включают», «включает» и «включенный», не является ограничивающим. Применение термина «имеющий», а также других форм, таких как «имеют», «имеет» и «имел», не является ограничивающим. Термины «содержат(жит)» и «содержащий» в том виде, в котором они используются в данном описании изобретения, независимо оттого, в переходной фразе или в отличительной части формулы изобретения, следует интерпретировать как имеющие неограничивающее значение. То есть, приведенные выше термины следует интерпретировать синонимично с фразами «имеющий по меньшей мере» или «включающий по меньшей мере». Например, при использовании в контексте способа, термин «содержащий» означает то, что данный способ включает по меньшей мере перечисленные этапы, но может включать дополнительные этапы. При использовании в контексте соединения, композиции или устройства термин «содержащий» означает то, что соединение, композиция или устройство включает по меньшей мере перечисленные характеристики или компоненты, но также может включать дополнительные характеристики или компоненты.

В том виде, в котором они используются в данном документе, обычные сокращения органических соединений определяются следующим образом:

Термин «чип» в том виде, в котором он используется в данном документе, относится к популяции разных молекул-зондов, которые присоединяются к одному или более чем одному субстрату, таким образом, что разные молекулы-зонды могут быть дифференцированы друг от друга согласно относительному положению. Чип может включать разные молекулы-зонды, каждая из которых располагается в отличном адресуемом месте на субстрате. Альтернативно или дополнительно, чип может включать отельные субстраты, причем каждый несет отличную молекулу-зонд, где разные молекулы-зонды могут быть идентифицированы согласно положениям субстратов на поверхности, к которой присоединяются субстраты, или согласно положениям субстратов в жидкости. Типичные чипы, в которых отдельные субстраты располагаются на поверхности, включают, без ограничения, чипы, включающие шарики в лунках, как описано, например, в патенте США №6355431 В1, US 2002/0102578 и публикации РСТ № WO 00/63437. Типичные форматы, которые можно использовать в данном изобретении для различения шариков в жидком чипе, например, с использованием микроструйного прибора, такого как сортер флуоресцентно активированных клеток (FACS), описываются, например, в патенте США №6524793. Другие примеры чипов, которые можно использовать в данном изобретении, включают, без ограничения, чипы, описанные в патентах США №5429807; 5436327; 5561071; 5583211; 5658734; 5837858; 5874219; 5919523; 6136269; 6287768; 6287776; 6288220; 6297006; 6291193; 6346413; 6416949; 6482591; 6514751 и 6610482; и WO 93/17126; WO 95/11995; WO 95/35505; ЕР 742287; и ЕР 799897.

Термин «ковалентно присоединенный» или «ковалентно связанный» в том виде, в котором он используется в данном документе, относится к образованию химического связывания, которое отличается обобществлением пар электронов между атомами. Например, ковалентно присоединенное полимерное покрытие относится к полимерному покрытию, которое образует химические связи с функционализированной поверхностью субстрата, по сравнению с присоединением к поверхности посредством других способов, например, адгезии или электростатического взаимодействия. Будет понятно то, что полимеры, которые ковалентно присоединяются к поверхности, также могут быть связаны посредством других способов, помимо ковалентного присоединения.

Любая(бые) группа(пы) «R» в том виде, в котором данный термин используется в данном документе, представляет заместители, которые могут быть присоединены к указанному атому. Группа R может быть замещенной или незамещенной. Если две группы «R» описываются как «вместе с атомами, к которым они присоединяются» формирующие кольцо или кольцевую систему, это означает то, что совокупным блоком атомов, расположенных между связей и двух групп R является описанное кольцо. Например, при наличии следующей подструктуры:

и R1, и R2 определяются как выбранные из группы, состоящей из водорода и алкила, или R1 и R2 совместно с атомами, к которым они присоединяются, образуют арил или карбоциклил, это означает то, что R1 и R2 могут быть выбраны из водорода или алкила, или альтернативно, данная подструктура имеет структуру:

где А представляет собой арильное кольцо или карбоциклил, содержащий указанную двойную связь.

Следует понимать то, что определенные соглашения по названию радикалов могут включать либо монорадикал, либо дирадикал, в зависимости от контекста. Например, в случае, где заместитель требует две точки присоединения к остальной молекуле, понятно то, что данный заместитель представляет собой дирадикал. Например, заместитель, идентифицированный как алкил, который требует две точки присоединения, включает дирадикалы, такие как -СН2- -СН2СН2-, -СН2СН(СН3)СН2- и тому подобные. Другие соглашения по наименованию радикалов ясно указывают то, что данный радикал представляет собой дирадикал, такой как «алкилен» или «алкенилен».

Термин «галоген» или «галоген-» в том виде, в котором он используется в данном документе, означает любой из радиоактивно стабильных атомов столбца 7 Периодической таблицы элементов, например, фтор, хлор, бром или йод, причем фтор и хлор являются предпочтительными.

Термин «от Са до Cb», в котором «а» и «b» представляют собой целые числа, в том виде, в котором он используется в данном документе, относится к числу атомов углерода в алкильной, алкенильной или алкинильной группе, или к числу атомов кольца циклоалкильной или арильной группы. То есть, данный алкил, алкенил, алкинил, кольцо циклоалкила и кольцо арила может содержать от «а» до «b» включительно атомов углерода. Например, «С14 алкильная» группа относится ко всем алкильным группам, имеющим от 1 до 4 углеродов, то есть, СН3-, СН3СН2-, СН3СН2СН2-, (СН3)2СН-, СН3СН2СН2СН2-, СН3СН2СН(СН3)- и (СН3)3С-; С34 циклоалкильная группа относится ко всем циклоалкильным группам, имеющим от 3 до 4 атомов углерода, то есть, циклопропильной и циклобутильной. Аналогичным образом, «4-6-членная гетероциклильная» группа относится ко всем гетеро цикл ильным группам с 4-6 общими атомами кольца, например, к азетидину, оксэтану, оксазолину, пирролидину, пиперидину, пиперазину, морфолину и тому подобным. Если не обозначены «а» и «b» по отношению к алкильной, алкенильной, алкинильной, циклоалкильной или арильной группе, следует предполагать самый широкий интервал, описываемый в данных определениях. Термин «С16» в том виде, в котором он используется в данном документе, включает С1, С2, С3, С4, С5 и С6, и интервал, определенный любыми двумя данными числами. Например, С16 алкил включает С1, С2, С3, С4, С5 и С6 алкил, С26 алкил, С13 алкил и т.д. Аналогичным образом, С26 алкенил включает С2, С3, С4, С5 и С6 алкенил, С25 алкенил, С34 алкенил и т.д.; и С26 алкинил включает С2, С3, С4, С5 и С6 алкинил, С25 алкинил, С34 алкинил и т.д. Каждый С38 циклоалкил включает углеводородное кольцо, содержащее 3, 4, 5, 6, 7 и 8 атомов углерода, или интервал, определенный любыми двумя числами, как, например, С37 циклоалкил или С56 циклоалкил.

Термин «алкил» в том виде, в котором он используется в данном документе, относится к прямой или разветвленной углеводородной цепи, которая является полностью насыщенной (т.е. не содержит двойные или тройные связи). Алкильная группа может иметь от 1 до 20 атомов углерода (числовое значение, такое как «от 1 до 20» всякий раз, когда оно появляется в данном документе, относится к каждому целому числу в данном интервале, например, «от 1 до 20 атомов углерода» означает то, что алкильная группа может состоять из 1 атома углерода, 2 атомов углерода, 3 атомов углерода и т.д., вплоть до и включая 20 атомов углерода, хотя настоящее определение также охватывает появление термина «алкил», где не обозначается числовой интервал). Алкильная группа также может представлять собой алкил среднего размера, имеющий от 1 до 9 атомов углерода. Алкильная группа также могла бы представлять собой низший алкил, имеющий от 1 до 6 атомов углерода. Алкильная группа может быть обозначена как «С14алкил» или аналогичными обозначениями. Лишь в качестве примера, «С16алкил» указывает то, что в алкильной цепи имеется от одного до шести атомов углерода, т.е. алкильная цепь выбрана из группы, состоящей из метила, этила, пропила, изопропила, н-бутила, изобутила, втор-бутила и трет-бутила. Типичные алкильные группы включают метил, этил, пропил, изопропил, бутил, изобутил, третичный бутил, пентил, гексил и тому подобные, но ни в коей мере не ограничиваются ими.

Термин «алкокси» в том виде, в котором он используется в данном документе, относится к формуле -OR, в которой R представляет собой алкил, как определяется выше, как, например, «С19 алкокси», включая метокси, этокси, н-пропокси, 1-метилэтокси (изопропокси), н-бутокси, изобутокси, втор-бутокси и трет-бутокси, и тому подобные, но не ограничиваясь ими.

Термин «алкенил» в том виде, в котором он используется в данном документе, относится к прямой или разветвленной углеводородной цепи, содержащей одну или более чем одну двойную связь. Данная алкенильная группа может иметь от 2 до 20 атомов углерода, хотя настоящее определение также охватывает появление термина «алкенил», где числовой интервал не обозначается. Алкенильная группа также может представлять собой алкенил среднего размера, имеющий от 2 до 9 атомов углерода. Алкенильная группа также могла бы быть низшим алкенилом, имеющим от 2 до 6 атомов углерода. Алкенильная группа может быть обозначена как «С26 алкенил» или аналогичными обозначениями. Лишь в качестве примера, «С26 алкенил» указывает на то, что в алкенильной цепи имеется от двух до шести атомов углерода, т.е. данная алкенильная цепь выбрана из группы, состоящей из этенила, пропен-1-ила, пропен-2-ила, пропен-3-ила, бутен-1-ила, бутен-2-ила, бутен-3-ила, бутен-4-ила, 1-метил-пропен-1-ила, 2-метил-пропен-1-ила, 1-этил-этен-1-ила, 2-метил-пропен-3-ила, бута-1,3-диенила, бута-1,2-диенила и бута-1,2-диен-4-ила.

Типичные алкенильные группы включают, но ни к коей мере не ограничиваются этенилом, пропенилом, бутенилом, пентенилом и гексенилом, и тому подобными.

Термин «алкинил» в том виде, в котором он используется в данном документе, относится к прямой или разветвленной углеводородной цепи, содержащей одну или более чем одну тройную связь. Данная алкинильная группа может иметь от 2 до 20 атомов углерода, хотя настоящее определение также охватывает появление термина «алкинил», где не обозначается числовой интервал. Алкинильная группа также может представлять собой алкинил среднего размера, имеющий от 2 до 9 атомов углерода. Алкинильная группа также могла бы быть низшим алкинилом, имеющим от 2 до 6 атомов углерода. Алкинильная группа может быть обозначена как «С26 алкинил» или аналогичными обозначениями. Лишь в качестве примера, «С26 алкинил» указывает на то, что в алкинильной цепи имеется от двух до шести атомов углерода, т.е. данная алкинильная цепь выбрана из группы, состоящей из этинила, пропин-1-ила, пропин-2-ила, бутин-1-ила, бутин-3-ила, бутин-4-ила и 2-бутинила. Типичные алкинильные группы включают, но ни к коей мере не ограничиваются этинилом, пропинилом, бутинилом, пентинилом и гексинилом, и тому подобными.

Термин «гетероалкил» в том виде, в котором он используется в данном документе, относится к прямой или разветвленной углеводородной цепи, содержащей один или более чем один гетероатом, то есть, отличный от углерода элемент в остове цепи, включающий азот, кислород и серу, но не ограничивающийся ими. Гетероалкильная группа может иметь от 1 до 20 атомов углерода, хотя настоящее определение также охватывает появление термина «гетероалкил», где не обозначается числовой интервал. Гетероалкильная группа также может представлять собой гетероалкил среднего размера, имеющий от 1 до 9 атомов углерода. Данная гетероалкильная группа также могла бы быть низшим гетероалкилом, имеющим от 1 до 6 атомов углерода. Данная гетероалкильная группа может быть обозначена «С16 гетероалкил» или аналогичными обозначениями. Данная гетероалкильная группа может содержать один или более чем один гетероатом. Лишь в качестве примера, «С46 гетероалкил» указывает то, что имеется от четырех до шести атомов углерода в гетероалкильной цепи и дополнительно один или более чем один гетероатом в остове цепи.

Термин «ароматический» относится к кольцу или кольцевой системе, имеющей систему конъюгированных пи-электронов, и он включает как карбоциклическую ароматическую (например, фенильную), так и гетероциклическую ароматическую группы (например, пиридин). Данный термин включает моноциклическую группу или полициклическую группу с конденсированным кольцом (т.е. кольца, которые имеют общие смежные пары атомов), при условии, что вся кольцевая система является ароматической.

Термин «арил» в том виде, в котором он используется в данном документе, относится к ароматическому кольцу или кольцевой системе (т.е. к двум или более чем двум конденсированным кольцам, которые имеют два общих смежных атома углерода), содержащей только углерод в остове кольца. Когда арил представляет собой кольцевую систему, каждое кольцо в данной системе является ароматическим. Арильная группа может иметь от 6 до 18 атомов углерода, хотя настоящее определение также охватывает появление термина «арил», где не обозначается числовой интервал. В некоторых воплощениях арильная группа имеет от 6 до 10 атомов углерода. Данная арильная группа может быть обозначена как «С610 арил», «С6 или С10 арил» или аналогичными обозначениями. Примеры арильных групп включают фенил, нафтил, азуленил и антраценил, но не ограничиваются ими.

«Аралкил» или «арилалкил» представляет собой арильную группу, присоединенную, в качестве заместителя, через алкиленовую группу, как, например, «С7-14 аралкил» и тому подобные, включающую бензил, 2-фенилэтил, 3-фенилпропил и нафтилалкил, но не ограничивающуюся ими. В некоторых случаях алкиленовая группа представляет собой низшую алкиленовую группу (т.е. С16 алкиленовую группу).

Термин «гетероарил» в том виде, в котором он используется в данном документе, относится к ароматическому кольцу или кольцевой системе (т.е. к двум или более чем двум конденсированным кольцам, которые имеют два смежных атома), которая(рые) содержит(жат) один или более чем один гетероатом, то есть, к отличному от углерода элементу в остове кольца, включающему азот, кислород и серу, но не ограничивающемуся ими. Когда гетероарил представляет собой кольцевую систему, каждое кольцо в данной системе является ароматическим. Гетероарильная группа может иметь 5-18 членов кольца (т.е. число атомов, составляющих остов кольца, включая атомы углерода и гетероатомы), хотя настоящее определение также охватывает появление термина «гетероарил», где не обозначается числовой интервал. В некоторых воплощениях гетероарильная группа имеет от 5 до 10 членов кольца или от 5 до 7 членов кольца. Гетероарильная группа может быть обозначена как «5-7-членный гетероарил», «5-10-членный гетероарил» или аналогичными обозначениями. Примеры гетероарильных колец включают фурил, тиенил, фталазинил, пирролил, оксазолил, тиазолил, имидазолил, пиразолил, изоксазолил, изотиазолил, триазолил, тиадиазолил, пиридинил, пиридазинил, пиримидинил, пиразинил, триазинил, хинолинил, изохинолинил, бензимидазолил, бензоксазолил, бензотиазолил, индолил, изоиндолил и бензотиенил, но не ограничиваются ими.

«Гетероаралкил» или «гетероарилалкил» представляет собой гетероарильную группу, соединенную, в качестве заместителя, через алкиленовую группу. Примеры включают 2-тиенилметил, 3-тиенилметил, фурилметил, тиенилэтил, пирролилалкил, пиридилалкил, изоксазоллилалкил и имидазолилалкил. В некоторых случаях алкиленовая группа представляет собой низшую алкиленовую группу (т.е. С16 алкиленовую группу).

Термин «карбоциклил» в том виде, в котором он используется в данном документе, означает неароматическое циклическое кольцо или кольцевую систему, содержащую только атомы углерода в остове кольцевой системы. Когда карбоциклил представляет собой кольцевую систему, два или более чем два кольца могут быть связаны друг с другом конденсированным, мостиковым или спиро-соединенным способом. Карбоциклилы могут иметь любую степень насыщения, при условии, что по меньшей мере одно кольцо в данной кольцевой системе не является ароматическим. Таким образом, карбоциклилы включают циклоалкилы, циклоалкенилы и циклоалкинилы. Карбоциклильная группа может иметь от 3 до 20 атомов углерода, хотя настоящее определение также охватывает появление термина «карбоциклил», где не обозначается числовой интервал. Карбоциклильная группа также может представлять собой карбоциклил среднего размера, имеющий от 3 до 10 атомов углерода. Карбоциклильная группа также может представлять собой карбоциклил, имеющий от 3 до 6 атомов углерода. Карбоциклильная группа может быть обозначена «С36 карбоциклил» или аналогичными обозначениями. Примеры карбо цикл ильных колец включают циклопропил, циклобутил, циклопентил, циклогексил, циклогексенил, 2,3-дигидро-инден, бицикл[2.2.2]октанил, адамантил и спиро[4.4]нонанил, но не ограничиваются ими.

Термин «циклоалкил» в том виде, в котором он используется в данном документе, означает полностью насыщенное карбоциклильное кольцо или кольцевую систему. Примеры включают циклопропил, циклобутил, циклопентил и циклогексил.

Термин «гетероциклил» в том виде, в котором он используется в данном документе, означает неароматическое циклическое кольцо или кольцевую систему, содержащую по меньшей мере один гетероатом в остове кольца. Гетероциклилы могут быть связаны друг с другом конденсированным, мостиковым или спиро-связанным способом. Гетероциклилы могут иметь любую степень насыщения, при условии, что по меньшей мере одно кольцо в данной кольцевой системе не является ароматическим. Гетероатом(мы) может(гут) присутствовать либо в неароматическом, либо в ароматическом кольце в кольцевой системе. Гетероциклическая группа может иметь от 3 до 20 членов кольца (т.е. число атомов, составляющих остов кольца, включая атомы углерода и гетероатомы), хотя настоящее определение также охватывает появление термина «гетероциклил», где не обозначается числовой интервал. Гетероциклильная группа также может представлять собой гетероциклил среднего размера, имеющий от 3 до 10 членов кольца. Данная гетероциклильная группа также могла бы быть гетероциклилом, имеющим от 3 до 6 членов кольца. Данная гетероциклильная группа может быть обозначена как «3-6-членный гетероциклил» или аналогичными обозначениями. В предпочтительных шестичленных моноциклических гетероциклилах гетероатом(мы) выбран(ны) из одного-трех О, N или S, и в предпочтительных пятичленных моноциклических гетероциклилах гетероатом(мы) выбран(ны) из одного или двух гетероатомов, выбранных из О, N или S. Примеры гетероциклильных колец включают азепинил, акридинил, карбазолил, циннолинил, диоксоланил, имидазолинил, имидазолидинил, морфолинил, оксиранил, оксепанил, тиепанил, пиперидинил, пиперазинил, диоксопиперазинил, пирролидинил, пирролидонил, пирролидионил, 4-пиперидонил, пиразолинил, пиразолидинил, 1,3-диоксинил, 1,3-диоксанил, 1,4-диоксинил, 1,4-диоксанил, 1,3-оксатианил, 1,4-оксатиинил, 1,4-оксатианил, 2Н-1,2-оксазинил, триоксанил, гексагидро-1,3,5-триазинил, 1,3-диоксолил, 1,3-диоксоланил, 1,3-дитиолил, 1,3-дитиоланил, изоксазолинил, изоксазолидинил, оксазолинил, оксазолидинил, оксазолидинонил, тиазолинил, тиазолидинил, 1,3-оксатиоланил, индолинил, изоиндолинил, тетрагидрофуранил, тетрагидропиранил, тетрагидротиофенил, тетрагидротиопиранил, тетрагидро-1,4-тиазинил, тиаморфолинил, дигидробензофуранил, бензимидазолидинил и тетрагидрохинолин, но не ограничиваются ими.

«О-карбокси» группа относится к группе «-OC(=O)R», в которой R выбран из водорода, С16 алкила, С26 алкенила, С26 алкинила, С37 карбоциклила, С610 арила, 5-10-членного гетероарила и 3-10-членного гетероциклила, как определено в данном документе.

«С-карбокси» группа относится к группе «-C(=O)OR», в которой R выбран из группы, состоящей из водорода, С16 алкила, С26 алкенила, С26 алкинила, С37 карбоциклила, С610 арила, 5-10-членного гетероарила и 3-10-членного гетероциклила, как определено в данном документе. Неограничивающий пример включает карбоксил (т.е. -С(=O)ОН).

«Сульфонильная» группа относится к группе «-SO2R», в которой R выбран из водорода, С16 алкила, С26 алкенила, С26 алкинила, С37 карбоциклила, С610 арила, 5-10-членного гетероарила и 3-10-членного гетероциклила, как определено в данном документе.

«Сульфино» группа относится к группе «-S(=O)OH».

«S-сульфонамидо» группа относится к группе «-SO2NRARB», в которой каждый из RA и RB независимо выбран из водорода, С16 алкила, С26 алкенила, С26 алкинила, С37 карбоциклила, С610 арила, 5-10-членного гетероарила и 3-10-членного гетероциклила, как определено в данном документе.

«N-сульфонамидо» группа относится к группе «-N(RA)SO2Rb», в которой каждый из RA и RB независимо выбран из водорода, С16 алкила, С26 алкенила, С26 алкинила, С37 карбоциклила, С610 арила, 5-10-членного гетероарила и 3-10-членного гетероциклила, как определено в данном документе.

«С-амидо» группа относится к группе «-C(=O)NRARB», в которой каждый из RA и RB независимо выбран из водорода, С16 алкила, С26 алкенила, С26 алкинила, С37 карбоциклила, С610 арила, 5-10-членного гетероарила и 3-10-членного гетероциклила, как определено в данном документе.

«N-амидо» группа относится к группе «-N(RA)C(=O)RB», в которой каждый из RA и RB независимо выбран из водорода, С16 алкила, С26 алкенила, С26 алкинила, С37 карбоциклила, С610 арила, 5-10-членного гетероарила и 3-10-членного гетероциклила, как определено в данном документе.

«Аминогруппа» относится к группе «-NRARB», в которой каждый из RA и RB независимо выбран из водорода, С16 алкила, С26 алкенила, С26 алкинила, С37 карбоциклила, С610 арила, 5-10-членного гетероарила и 3-10-членного гетероциклила, как определено в данном документе. Неограничивающий пример включает свободный амино (т.е. -NH2).

«Аминоалкильная» группа относится к аминогруппе, присоединенной через алкиленовую группу.

«Алкоксиалкильная» группа относится к алкоксигруппе, присоединенной через алкиленовую группу, такой как «С28 алкоксиалкил» и тому подобное.

Замещенная группа в том виде, в котором данный термин используется в данном документе, происходит от незамещенной родительской группы, в которой была замена одного или более чем одного атома водорода на другой атом или группу. Если не указано иное, когда группа считается «замещенной», подразумевается то, что данная группа замещена одним или более чем одним заместителем, независимо выбранным из C1-C6 алкила, С16 алкенила, С16 алкинила, С16 гетероалкила, С37 карбоциклила (возможно замещенного галоген-, С16 алкилом, С16 алкокси, С16 галогеналкилом и С16 галогеналкокси), С37 карбоциклил-С16-алкила (возможно замещенного галоген-, С16 алкилом, С16 алкокси, С16 галогенал килом и C1-C6 галогеналкокси), 3-10-членного гетероциклила (возможно замещенного галоген-, С16 алкилом, С16 алкокси, С16 галогенал килом и С16 галогеналкокси), 3-10-членного гетероциклил-С16-алкила (возможно замещенного галоген-, C1-C6 алкилом, С16 алкокси, С16 галогеналкилом и C1-C6 галогеналкокси), арила (возможно замещенного галоген-, С16 алкилом, С16 алкокси, C1-C6 галогеналкилом и С16 галогеналкокси), арил(С16)алкила (возможно замещенного галоген-, С16 алкилом, С16 алкокси, С16 галогеналкилом и С16 галогеналкокси), 5-10-членного гетероарила (возможно замещенного галоген-, С16 алкилом, C1-C6 алкокси, С16 галогеналкилом и С16 галогеналкокси), 5-10-членного гетероарил(С16)алкила (возможно замещенного галоген-, С16 алкилом, С16 алкокси, С16 галогеналкилом и С16 галогеналкокси), галоген-, -CN, гидрокси, С16 алкокси, С16 алкокси(С16)алкила (т.е. простой эфир), арилокси, сульфгидрила (меркапто), галоген(С16)алкила (например, -CF3), галогенC16)алкокси (например, -OCF3), С16 алкилтио, арилтио, амино, амино(C1-C6)алкила, нитро, О-карбамила, N-карбамила, О-тиокарбамила, N-тиокарбамила, С-амидо, N-амидо, S-сульфонамидо, N-сульфонамидо, С-карбокси, О-карбокси, ацила, цианато, изоцианато, тиоцианато, изотиоцианато, сульфинила, сульфонила, -SO3H, сульфино, -OSO2C1-4алкила и оксо (=O). Во всех случаях если группа описывается как «возможно замещенная», данная группа может быть замещена приведенными выше заместителями.

Термин «гидрокси» в том виде, в котором он используется в данном документе, относится к группе -ОН.

Термин «цианогруппа» в том виде, в котором он используется в данном документе, относится к группе «-CN».

Термин «азидо» в том виде, в котором он используется в данном документе, относится к группе -N3.

Термин «нуклеотид» в том виде, в котором он используется в данном документе, включает азотсодержащее гетероциклическое основание, сахар и одну или более чем одну фосфатную группу. Они представляют собой мономерные звенья последовательности нуклеиновой кислоты. В РНК сахар представляет собой рибозу, а в ДНК - дезоксирибозу, т.е. сахар с отсутствием гидроксильной группы, которая присутствует в рибозе. Азотсодержащим гетероциклическим основанием может быть пуриновое или пиримидиновое основание. Пуриновые основания включают аденин (А) и гуанин (G), и их модифицированные производные или аналоги. Пиримидиновые основания включают цитозин (С), тимин (Т) и урацил (U), и их модифицированные производные или аналоги. Атом С-1 дезоксирибозы связывается с N-1 пиримидина или N-9 пурина.

«Нуклеозид» в том виде, в котором данный термин используется в данном документе, является структурно сходным с нуклеотидом, но с отсутствием фосфатных группировок. Примером аналога нуклеозида был бы аналог, в котором с основанием связывается метка, и отсутствует фосфатная группа, присоединенная к молекуле сахара. Термин «нуклеозид» используется в данном документе в его исходном смысле, как понятно специалистам в данной области. Примеры включают рибонуклеозид, содержащий рибозный фрагмент, и дезоксирибонуклеозид, содержащий дезоксирибозный фрагмент, но не ограничиваются ими. Модифицированный пентозный фрагмент представляет собой пентозный фрагмент, в котором атом кислорода был заменен углеродом, и/или углерод был заменен серой или атомом кислорода. «Нуклеозид» представляет собой мономер, который имеет замещенное основание и/или сахарный фрагмент. Дополнительно, нуклеозид может быть включен в большие полимеры ДНК и/или РНК и олигомеры.

Термин «пуриновое основание» используется в данном документе в его исходном смысле, как понятно специалистам в данной области, и включает его таутомеры. Аналогичным образом, термин «пиримидиновое основание» используется в данном документе в его исходном смысле, как понятно специалистам в данной области, и включает его таутомеры. Неограничивающий список возможно замещенных пуриновых оснований включает пурин, аденин, гуанин, гипоксантин, ксантин, аллоксантин, 7-алкилгуанин (например, 7-метилгуанин), теобромин, кофеин, мочевую кислоту и изогуанин. Примеры пиримидиновых оснований включают цитозин, тимин, урацил, 5,6-дигидроурацил и 5-алкилцитозин (например, 5-метилцитозин), но не ограничиваются ими.

При описании олигонуклеотида или полинуклеотида, в том виде, в котором данные термины используются в данном документе, как «содержащих» нуклеозид или нуклеотид, описанный в данном документе, это означает то, что нуклеозид или нуклеотид, описанный в данном документе, образует ковалентную связь сданным олигонуклеотидом или полинуклеотидом. Аналогичным образом, при описании нуклеозида или нуклеотида как части олигонуклеотида или полинуклеотида, таких как «включенные в» олигонуклеотид или полинуклеотид, это означает то, что нуклеозид или нуклеотид, описанный в данном документе, образует ковалентную связь с данным олигонуклеотидом или полинуклеотидом. В некоторых таких воплощениях ковалентная связь образуется между 3’-гидроксигруппой олигонуклеотида или полинуклеотида с 5'-фосфатной группой нуклеотида, описанного в данном документе, в виде фосфодиэфирной связи между 3' атомом углерода олигонуклеотида или полинуклеотида и 5' атомом углерода данного нуклеотида.

Термин «производное» или «аналог» в том виде, в котором он используется в данном документе, означает синтетическое нуклеотидное или нуклеозидное производное, имеющее модифицированные фрагменты основания и/или модифицированные фрагменты сахара. Такие производные и аналоги обсуждаются, например, в Scheit, Nucleotide Analogs (John Wiley & Son, 1980) и Uhlman et al., Chemical Reviews 90:543-584, 1990. Нуклеотидные аналоги также могут содержать модифицированные фосфодиэфирные связи, включающие фосфоротиоатные, фосфородитиоатные, алкил-фосфонатные,

фосфоранилидатные и фосфорамидатные связи. Термины «производное», «аналог» и «модифицированный» в том виде, в котором они используются в данном документе, могут использоваться взаимозаменяемо и охватываются терминами «нуклеотид» и «нуклеозид», определенными в данном документе.

Термин «фосфат» в том виде, в котором он используется в данном документе, используется в его обычном смысле, как понятно специалистам в данной области, и включает его протонированные формы (например, ). Термины «монофосфат», «дифосфат» и «трифосфат» в том виде, в котором они используются в данном документе, используется в их обычном смысле, как понятно специалистам в данной области, и включают протонированные формы.

Термины «защитная группа» и «защитные группы» в том виде, в котором они используются в данном документе, относятся к любому атому или группе атомов, которые добавляются к молекуле для того, чтобы предотвращать нежелательные химические реакции существующих групп в молекуле. Иногда термины «защитная группа» и «блокирующая группа» могут использоваться взаимозаменяемо.

Приставки «фото» или «фото-» в том виде, в котором они используются в данном документе, означают относящиеся к световому или электромагнитному излучению. Данный термин может охватывать весь электромагнитный спектр или часть электромагнитного спектра, включая один или более чем один интервал, обычно известный как радио, микроволновые, инфракрасные, видимые, ультрафиолетовые, рентгеновские или гамма-лучевые части спектра, но не ограничиваясь ими. Данная часть спектра может представлять собой часть спектра, которая блокируется металлической областью поверхности, как, например, теми металлами, которые изложены в данном документе. Альтернативно или дополнительно, данная часть спектра может представлять собой часть спектра, которая проходит через промежуточную область поверхности, такую как область, сделанная из стекла, пластмассы, диоксида кремния или другого вещества, изложенного в данном документе. В конкретных воплощениях может использоваться излучение, которое способно проходить через металл. Альтернативно или дополнительно, может использоваться излучение, которое маскируется стеклом, пластмассой, диоксидом кремния или другим веществом, изложенным в данном документе.

Термин «фазирование» в том виде, в котором он используется в данном документе, относится к явлению в SBS, которое вызвано неполным удалением 3' терминаторов и флуорофоров, и неудачей в завершении включения части цепей ДНК в кластеры посредством полимераз в данном цикле секвенирования. Предфазирование вызвано включением нуклеотидов без эффективных 3' терминаторов, где событие включения идет 1 циклом ранее из-за неудачи терминации. Фазирование и предфазирование вызывают то, что измеренные интенсивности сигнала для конкретного цикла состоят из сигнала от текущего цикла, а также из шума от предшествующего и последующего циклов. По мере увеличения числа циклов, доля последовательностей на кластер, подвергавшихся фазированию и предфазированию, увеличивается, затрудняя идентификацию правильного основания. Предфазирование может быть вызвано присутствием следового количества незащищенных или неблокированных 3’-ОН нуклеотидов во время секвенирования посредством синтеза (SBS). Незащищенные 3’-ОН нуклеотиды могли бы быть получены во время процессов изготовления или возможно во время хранения и процессов манипуляций с реагентами. Соответственно, открытие аналогов нуклеотидов, которые уменьшают частоту предфазирования, является неожиданным и обеспечивает большое преимущество в приложениях SBS над существующими аналогами нуклеотидов. Например, предоставленные аналоги нуклеотидов могут приводить к более короткому времени цикла SBS, меньшим значениям фазирования и предфазирования, и большей длине считываемых фрагментов секвенирования.

3’-Гидроксиацетальные блокирующие группы

Некоторые воплощения настоящего раскрытия относятся к молекуле нуклеотида или нуклеозида, содержащей рибозу или дезоксирибозу, имеющую удаляемую 3’-ОН защитную или блокирующую группу, образующую структуру ковалентно присоединенную к 3’-атому углерода, в которой: каждый R1a и R1b независимо представляет собой Н, С16 алкил, С16 галогеналкил, С16 алкокси, С16 галогеналкокси, циано, галоген, возможно замещенный фенил или возможно замещенный аралкил;

каждый R2a и R2b независимо представляет собой Н, С16 алкил, С16 галогеналкил, циано или галоген;

в качестве альтернативы, R1a и R2a, наряду с атомами, к которым они присоединяются, образуют возможно замещенную пяти-восьмичленную гетеро цикл ильную группу;

R3 представляет собой Н, возможно замещенный С26 алкенил, возможно замещенный С37 циклоалкенил, возможно замещенный С26 алкинил или возможно замещенный (С16 алкилен)Si(R4)3; и

каждый R4 независимо представляет собой Н, C1-C6 алкил или возможно замещенный С610 арил при условии, что когда каждый R1a, R1b, R2a и R2b представляет собой Н, тогда R3 не является Н.

Некоторые другие воплощения настоящего раскрытия относятся к соединению, имеющему структуру Формулы (I):

в которой R' представляет собой Н, монофосфат, дифосфат, трифосфат, тиофосфат, аналог сложного эфира фосфата, -О-, присоединенный к реакционноспособной фосфоросодержащей группе, или -О-, защищенный защитной группой; R" представляет собой Н или ОН; В представляет собой нуклеиновое основание; каждый из R1a, R1b, R2a, R2b и R3 определяется выше.

В некотором другом воплощении В представляет собой is В некоторых других воплощениях нуклеиновое основание ковалентно связывается с выявляемой меткой (например, флуоресцентным краситетем (Dye)), возможно через линкер, например, В представляет собой В некоторых таких воплощениях R' представляет собой трифосфат. В некотором таком воплощении R" представляет собой Н.

В некоторых воплощениях ацетальной блокирующей группы, описанной в данном документе, по меньшей мере один из R1a и R1b представляет собой Н. В некоторых таких воплощениях каждый R1a и R1b представляет собой Н. В некоторых других воплощениях по меньшей мере один из R1a и R1b представляет собой С16 алкил, например, метил, этил, изопропил или трет-бутил. В некоторых воплощениях каждый из R2a и R2b независимо представляет собой Н, галоген или С16 алкил. В некоторых воплощениях по меньшей мере один из R2a и R2b представляет собой Н или С16 алкил. В некотором таком воплощении каждый R2a и R2b представляет собой Н. В некотором таком воплощении каждый R2a и R2b представляет собой С16 алкил, например, метил, этил, изопропил или трет-бутил. В одном воплощении каждый R2a и R2b представляет собой метил. В некоторых таких воплощениях каждый из R2a и R2b независимо представляет собой С16 алкил или галоген. В некоторых таких воплощениях R2a представляет собой Н, и R2b представляет собой галоген или С16 алкил.

В некоторых воплощениях ацетальной блокирующей группы, описанной в данном документе, R3 возможно замещен С26 алкенилом. В некоторых таких воплощениях R3 представляет собой С26 алкенил (например, винил, пропенил), возможно замещенный одним или более чем одним заместителем, независимо выбранным из группы, состоящей из галогена, С16 алкила, С16 галогеналкила и их комбинаций. В некоторых других воплощениях R3 представляет собой

В некоторых других воплощениях R3 возможно замещен С26 алкинилом. В некоторых таких воплощениях R3 представляет собой С26 алкинил (например, этинил, пропинил), возможно замещенный одним или более чем одним заместителем, независимо выбранным из группы, состоящей из галогена, С16 алкила, С16 галогеналкила и их комбинаций. В одном воплощении R3 возможно замещен этинилом В некоторых других воплощениях, R3 возможно замещен (С16алкилене)Si(R4)3. В некоторых таких воплощениях по меньшей мере один из R4 представляет собой С1-4 алкил. В некоторых других воплощениях каждый один из R4 представляет собой С14 алкил, например, метил, этил, изопропил или трет-бутил. В одном воплощении, R3 представляет собой -(CH2)-SiMe3. В некоторых альтернативных воплощениях R3 представляет собой С16 алкил.

В некоторых альтернативных воплощениях R1a и R2a совместно с атомами, к которым они присоединяются, образуют пяти-семичленный гетероциклил. В некоторых таких воплощениях R1a и R2a совместно с атомами, к которым они присоединяются, образуют шестичленный гетероциклил. В некоторых таких воплощениях шестичленная гетероциклильная группа имеет структуру В некоторых других воплощениях по меньшей мере один из каждого R1b, R2b и R3 представляет собой Н. В некоторых других воплощениях по меньшей мере один из каждого R1b, R2b и R3 представляет собой C1-C6 алкил. В одном воплощении каждый R1b, R2b и R3 представляет собой Н.

В некоторых других воплощениях соединение Формулы (I) также представлено Формулой (Ia):

где каждый R2c и R2d независимо представляет собой Н, галоген (например, фтор-, хлор-), С16 алкил (например, метил, этил или изопропил) или С16 галогеналкил (например, -CHF2, -CH2F или -CF3). В некоторых таких воплощениях один из R1a и R1b представляет собой Н. В некоторых таких воплощениях каждый R1a и R1b представляет собой Н. В некоторых других воплощениях по меньшей мере один из R1a и R1b представляет собой С16 алкил, например, метил, этил, изопропил или трет-бутил. В некоторых воплощениях каждый из R2a и R2b независимо представляет собой Н, галоген или C1-C6 алкил. В некотором таком воплощении, каждый R2a и R2b представляет собой Н. В некоторых таких воплощениях каждый из R2c и R2d независимо представляет собой Н, галоген или С16 алкил. В некоторых таких воплощениях каждый R2c и R2d представляет собой С16 алкил, например, метил, этил, изопропил или трет-бутил. В одном воплощении каждый R2c и R2d представляет собой метил. В некоторых таких воплощениях каждый R2c и R2d независимо представляет собой галоген. В некоторых таких воплощениях R2c представляет собой Н, и R2d представляет собой Н, галоген (фтор-, хлор-) или С16 алкил (например, метил, этил, изопропил или трет-бутил). В других воплощениях каждый R1a и R1b представляет собой Н; R2a представляет собой Н; R2b представляет собой Н, галоген или метил; R2c представляет собой Н; и R2d представляет собой Н, галоген, метил, этил, изопропил или трет-бутил.

Неограничивающие воплощения блокирующих групп, описанных в данном документе, включают группы, имеющие структуру, выбранную из группы, состоящей из: ковалентно присоединенной к 3’-углероду рибозы или дезоксирибозы.

3’-Гидрокситиокарбаматные блокирующие группы

Некоторые дополнительные воплощения настоящего раскрытия относятся к нуклеозиду или нуклеотиду, содержащему рибозу или дезоксирибозу, имеющую удаляемую 3’-ОН блокирующую группу, образующую структуру ковалентно присоединенную к 3'-атому углерода, в которой:

каждый из R5 и R6 независимо представляет собой Н, С16 алкил, С26 алкенил, С26 алкинил, С16 галогеналкил, С28 алкоксиалкил, возможно замещенный -(СН2)m-фенил, возможно замещенный

-(СН2)n-(5 или 6-членный гетероарил), возможно замещенный-(СН2)k37 карбоциклил или возможно замещенный-(СН2)р-(3-7-членный гетероциклил);

в качестве альтернативы, R5 и R6, совместно с атомами, к которым они присоединяются, образуют возможно замещенный пяти-семичленный гетероциклил;

каждый из -(СН2)m-, -(СН2)n-, -(СН2)k- и -(СН2)p- возможно является замещенным; и

каждый из m, n, k и р независимо равен 0, 1, 2, 3 или 4.

Некоторые дополнительные воплощения относятся к соединению Формулы (II):

в котором R' представляет собой Н, монофосфат, дифосфат, трифосфат, тиофосфат, аналог сложного эфира фосфата, -О-, присоединенный к реакционноспособной фосфоросодержащей группе, или -О-, защищенный защитной группой; R" представляет собой Н или ОН; В представляет собой нуклеиновое основание; каждый из R5 и R6 является таким, как определено выше. В некотором другом воплощении В представляет собой

В некоторых других воплощениях нуклеиновое основание ковалентно связывается с выявляемой меткой (например, флуоресцентным красителем), возможно через линкер, например, В представляет собой В некоторых таких воплощениях R' представляет собой трифосфат.В некотором таком воплощении R" представляет собой Н.

В некоторых воплощениях тиокарбаматной блокирующей группы, описанной в данном документе, по меньшей мере один из R5 и R6 представляет собой Н. В некоторых таких воплощениях каждый R5 и R6 представляет собой Н. В некоторых таких воплощениях R5 представляет собой Н, и R6 представляет собой С16 алкил, например, метил, этил, изопропил или трет-бутил. В некоторых таких воплощениях R5 представляет собой Н, и R6 представляет собой С26 алкенил (например, винил или аллил) или С26 алкинил (например, этинил или пропинил). В некоторых таких воплощениях R5 представляет собой Н, и R2 представляет собой возможно замещенный -(СН2)m-фенил, возможно замещенный -(СН2)n-(5-или 6-членный гетероарил), возможно замещенный -(СН2)k37 карбоциклил или возможно замещенный -(СН2)р-(3-7-членный гетероциклил). В некотором другом воплощении С37 карбоциклильная группа может представлять собой С37 циклоалкил или С37 циклоалкенил. 3-7-членная гетероциклильная группа может содержать ноль или одну двойную связь в структуре кольца. В других воплощениях R5 представляет собой Н, и R6 представляет собой возможно замещенный (СН2)m-фенил, возможно замещенный -(СН2)n-6-членный гетероарил, возможно замещенный -(СН2)k5 или С6 карбоциклил, или возможно замещенный -(СН2)p-(5- или 6-членный гетероциклил). В некоторых воплощениях m, n, k или р равен 0. В других воплощениях m, n, k или р равен 1 или 2. В некоторых других воплощениях по меньшей мере один из R5 и R6 представляет собой С16 алкил, например, метил, этил, изопропил или трет-бутил. В некоторых других воплощениях и R5, и R6 представляет собой С16 алкил. В одном воплощении и R5, и R6 представляет собой метил.

В некоторых альтернативных воплощениях R5 и R6 совместно с атомами, к которым они присоединены, образуют возможно замещенный пяти-семичленный гетероциклил. В некоторых таких воплощениях R5 и R6 совместно с атомами, к которым они присоединены, образуют возможно замещенный пиперидинил.

Неограничивающие воплощения 3’-О-тиокарбаматных блокирующих групп, описанных в данном документе, включающие воплощения, имеющие структуру, выбранную из группы, состоящей из ковалентно присоединяются к 3’-углероду рибозы или дезоксирибозы.

Дополнительные воплощения настоящего раскрытия относятся к олигонуклеотиду или полинуклеотиду, содержащему нуклеозид или нуклеотид, описанный в данном документе.

В любом из воплощений блокирущих групп, описанных в данном документе, когда группа описывается как «возможно замещенная», она может быть либо незамещенной, либо замещенной.

В любых воплощениях нуклеотидов или нуклеозидов с 3' гидрокси блокирующей группой, описанной в данном документе, нуклеозид или нуклеотид может быть ковалентно присоединен к выявляемой метке (например, флуорофор), возможно через линкер. Данный линкер может быть расщепляемым или нерасщепляемым. В некоторых таких воплощениях выявляемая метка (например, флуорофор) ковалентно присоединена к нуклеиновому основанию нуклеозида или нуклеотида через расщепляемый линкер. В некоторых других воплощениях выявляемая метка (например, флуорофор) ковалентно присоединена к 3' кислороду нуклеозида или нуклеотида через расщепляемый линкер. В некоторых других воплощениях такой расщепляемый линкер может содержать азидный фрагмент или дисульфидный фрагмент, ацетальный фрагмент или тиокарбаматный фрагмент. В некоторых воплощениях 3' гидрокси блокирующая группа и расщепляемый линкер (и присоединенная метка) могут быть удалены при таких же или по существу таких же условиях химической реакции, например, блокирующая группа и выявляемая метка могут быть удалены в одной химической реакции. В других воплощениях блокирующая группа и выявляемая метка удаляются за две отдельные стадии.

В некоторых воплощениях нуклеотиды или нуклеозиды, описанные в данном документе, содержат 2'-дезоксирибозу. В некоторых других аспектах 2'-дезоксирибоза содержит одну, две или три фосфатные группы в 5' положении сахарного кольца. В некотором другом аспекте нуклеотиды, описанные в данном документе, представляют собой нуклеотидтрифосфат.

В некоторых воплощениях 3' блокированные нуклеотиды или нуклеозиды, описанные в данном документе, обеспечивают превосходные стабильность в растворе во время хранения или обращение с реагентами во время приложений секвенирования по сравнению с такими же нуклеотидами или нуклеозидами, защищенными стандартной 3’-ОН блокирующей группой, раскрытой в предшествующем уровне техники, например, 3’-О-азидометильной защитной группой. Например, ацетальные или тиокарбаматные блокирующие группы, раскрытые в данном документе, могут придавать по меньшей мере на 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 200%, 300%, 400%, 500%, 600%, 700%, 800%, 900%, 1000%, 1500%, 2000%, 2500% или 3000% улучшенную стабильность по сравнению с защищенной азидометилом 3’-ОН при тех же самых условиях в течение такого же периода времени, уменьшая посредством этого значения предфазирования и приводя к большим длинам считываемых фрагментов при секвенировании. В некоторых воплощениях стабильность измеряется при температуре окружающей среды или при температуре ниже температуры окружающей среды (как, например, 4-10°С). В других воплощениях стабильность измеряется при повышенной температуре, такой как 40°С, 45°С, 50°С, 55°С, 60°С или 65°С. В некоторых таких воплощениях стабильность измеряется в растворе в среде с основным рН, например, при рН 9,0; 9,2; 9,4; 9,6; 9,8 или 10,0. В некоторых таких воплощениях стабильность измеряется с присутствием или без присутствия фермента, такого как полимераза (например, ДНК-полимераза), терминальная дезоксинуклеотидил трансфераза или обратная транскриптаза.

В некоторых воплощениях 3' блокированные нуклеотиды или нуклеозиды, описанные в данном документе, обеспечивают превосходную скорость деблокирования в растворе во время стадии химического расщепления приложений по секвенированию по сравнению с такими же нуклеотидами или нуклеозидами, защищенными стандартной 3’-ОН блокирующей группой, раскрытой в предшествующем уровне техники, например, 3’-О-азидометильной защитной группой. Например, ацетальные или тиокарбаматные блокирующие группы, раскрытые в данном документе, могут придавать по меньшей мере на 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 150%, 200%, 300%, 400%, 500%, 600%, 700%, 800%, 900%, 1000%, 1500% или 2000% улучшенную скорость деблокирования по сравнению с защищенной азидометилом 3’-ОН с использованием стандартного деблокирующего реагента (такого как трис(гидроксипропил)фосфин), уменьшая, посредством этого, общее время для цикла секвенирования. В некоторых воплощениях скорость деблокирования измеряется при температуре окружающей среды или температуре ниже температуры окружающей среды (такой как 4-10°С). В других воплощениях скорость деблокирования измеряется при повышенной температуре, такой как 40°С, 45°С, 50°С, 55°С, 60°С или 65°С. В некоторых таких воплощениях скорость деблокирования измеряется в растворе в среде с основным рН, например, при рН 9,0; 9,2; 9,4; 9,6; 9,8 или 10,0. В некоторых таких воплощениях молярное отношение деблокирующего реагента к субстрату (т.е. 3' блокированному нуклеозиду или нуклеотиду) составляет примерно 10:1, примерно 5:1, примерно 2:1 или примерно 1:1.

В некоторых воплощениях палладиевый деблокирущий реагент (например, для удаления 3' ацетальных блокирующих групп (например, блокирующей группы АОМ) используется Pd(0)). Pd может образовать хелатированный комплекс с двумя атомами кислорода группы АОМ, а также с двойной связью аллильной группы, обеспечивая удаление деблокирующего реагента в непосредственной близости от функциональной группы, и может приводить к повышенной скорости деблокирования.

Снятие защиты 3’-ОН блокирующих групп

3’-ацетальные блокирующие группы, описанные в данном документе, могут быть удалены или расщеплены при разных химических условиях. Для ацетальных блокирующих групп которые содержат винильный или алкенильный фрагмент, неограничивающее условие расщепления включает комплекс Pd(II), такой как Pd(OAc)2 или димер аллилPd(II) хлорида, в присутствии фосфинового лиганда, например, трис(гидроксиметил)фосфина (ТНМР) или трис(гидроксипропил)фосфина (ТНР или ТНРР). Для тех блокирующих групп, которые содержат алкинильную группу (например, этинил), они также могут быть удалены посредством комплекса Pd(II) (например, Pd(OAc)2 или димер аллилPd(II) хлорида) в присутствии фосфинового лиганда (например, ТНР или ТНМР).

Палладиевые расщепляющие реагенты

В некоторых воплощениях ацетальная блокирующая группа, описанная в данном документе, может быть расщеплена палладиевым катализатором. В некоторых таких воплощениях Pd катализатор является водорастворимым. В некоторых таких воплощениях он представляет собой комплекс Pd(0) (например, нонагидрат нонанатриевой соли трис(3,3',3"-фосфинидинтрис(бензолсульфонато)палладия(0)). В некоторых случаях комплекс Pd(0) может быть генерирован in situ из-за восстановления комплекса Pd(II) посредством таких реагентов, как алкены, спирты, амины, фосфины или гидриды металлов. Подходящие источники палладия включают Na2PdCl4, Pd(CH3CN)2Cl2: (PdCl(C3H5))2, [Pd(C3H5)(THP)]Cl, [Pd(C3H5)(THP)2]Cl, Pd(OAc)2, Pd(Ph3)4, Pd(dba)2, Pd(Acac)2, PdCl2(COD), и Pd(TFA)2. В одном таком воплощении комплекс Pd(0) генерируется in situ из Na2PdCl4. В другом воплощении источником палладия является димер хлорида аллилпалладия(II) [(PdCl(C3H5))2]. В некоторых воплощениях комплекс Pd(0) генерируется в водном растворе посредством смешивания комплекса Pd(II) с фосфином. Подходящие фосфины включают водорастворимые фосфины, такие как трис(гидроксипропил)фосфин (ТНР), трис(гидроксиметил)фосфин (ТНМР), 1,3,5-триаза-7-фосфаадамантан (РТА), калиевая соль бис(п-сульфонатофенил)фенилфосфина, трис(карбоксиэтил)фосфин (ТСЕР) и тринатриевая соль трифенилфосфин-3,3',3"-трисульфоновой кислоты.

В некоторых воплощениях Pd(0) получают смешиванием комплекса Pd(II) [(PdCI(C3H5))2] с ТНР in situ. Молярное отношение комплекса Pd(II) и ТНР может составлять примерно 1:2, 1:3, 1:4, 1:5, 1:6, 1:7, 1:8, 1:9 или 1:10. В некоторых других воплощениях может быть добавлен один или более чем один восстановитель, такой как аскорбиновая кислота или ее соль (например, аскорбат натрия). В некоторых воплощениях расщепляющая смесь может содержать дополнительные буферизующие реагенты, такие как первичный амин, вторичный амин, третичный амин, карбонатная соль, фосфатная соль или боратная соль или их комбинации. В некоторых других воплощениях буферизующий реагент содержит этаноламин (ЕА), трис(гидроксиметил)аминометан (Tris), глицин, карбонат натрия, фосфат натрия, борат натрия, 2-диметиламинометанол (DMEA), 2-диэтиламинометанол (DEEA), N,N,N',N'-тетраметилэтилендиамин (TEMED) или N,N,N',N'-тетраэтилэтилендиамин (TEEDA), или их комбинации. В одном воплощении буферизующий реагент представляет собой DEEA. В другом воплощении буферизующий реагент содержит одну или более чем одну неорганическую соль, такую как карбонатная соль, фосфатная соль или боратная соль, или их комбинации. В одном воплощении неорганическая соль представляет собой натриевую соль.

В качестве альтернативы, алкинильный фрагмент, содержащий блокирующие группы, также может расщепляться в присутствии (NH4)2MoS4. Другое неограничивающее условие расщепления для алкинильного фрагмента включает комплекс Cu(II) с лигандом ТНРТА (трис(3-гидроксипропилтриазолилметил)амин), и аскорбат. Неограничивающие условия расщепления для блокирующих групп, содержащих шестичленный гетероцикл (например, тетрагидропиран), включают циклодекстрин или Ln(OTf)3 (лантанида трифлат). Неограничивающее условие расщепления для блокирующих групп, содержащих алкилсилановую группу (например, -CH2SiMe3), включает LiBF4 (тетрафторборат лития). Другие ацетальные блокирующие группы, такие как -O(CH2)O-C1-C6 алкил, могут быть удалены посредством LiBF4 или Bi(OTf)3 (трифлат висмута). Неограничивающие типичные условия для расщепления описанных разных блокирующих групп иллюстрируются на Схеме 1 ниже.

Схема 1. Иллюстрация 3’-деблокирующих условий (Dye+Linker - краситель+линкер)

3’-тиокарбаматные блокирующие группы, описанные в данном документе, могут быть удалены или расщеплены при разных химических условиях. Неограничивающие типичные условия для расщепления тиокарбаматных блокирующих групп, описанных в данном документе, включают NaIO4 и Oxone® (калия пероксимоносульфат).

Кроме того, азидогруппа в -CH2N3 может быть превращена в аминогруппу посредством фосфина. В качестве альтернативы, азидогруппа в -CH2N3 может быть превращена в аминогруппу посредством приведения в контакт таких молекул с тиолами, в частности, с водорастворимыми тиолами, такими как дитиотрейтол (DTT). В одном воплощении фосфин представляет собой ТНР.

Совместимость с линеаризацией

Для того чтобы максимизировать производительность реакций секвенирования нуклеиновых кислот, полезной является возможность параллельного секвенирования множества молекул-матриц. Параллельная обработка многих матриц может достигаться с применением технологии чипа нуклеиновых кислот. Данные чипы типично состоят из высокоплотной матрицы полинуклеотидов, иммобилизованных на веществе твердой подложки.

Как в WO 98/44151, так и в WO 00/18957 описываются способы амплификации нуклеиновой кислоты, которые обеспечивают иммобилизацию продуктов амплификации на твердой подложке для того, чтобы образовать чипы, состоящие из кластеров или «колоний», образованных из множества идентичных иммобилизованных полинуклеотидных цепей и множества идентичных иммобилизованных комплементарных цепей. Чипы данного типа называются в данном документе «кластерными чипами». Молекулы нуклеиновой кислоты, присутствующие в колониях ДНК на кластерных чипах, полученных согласно данным способам, могут предоставлять матрицы для реакций секвенирования, например, как описано в WO 98/44151. Продукты реакций твердофазной амплификации, такие как продукты, описанные в WO 98/44151 и WO 00/18957, представляют собой так называемые «мостиковые» структуры, образованные отжигом пар иммобилизованных полинуклеотидных цепей и иммобилизованных комплементарных цепей, причем оба типа цепей присоединяются к твердой подложке на 5'-конце. Для того чтобы предоставить более подходящие матрицы для секвенирования нуклеиновых кислот, предпочтительным является удаление по существу всей или по меньшей мере части одной из иммобилизованных цепей в «мостиковой» структуре для того, чтобы получить матрицу, которая является по меньшей мере частично одноцепочечной. Часть матрицы, которая является одноцепочечной, будет, таким образом, доступной для гибридизации с праймером секвенирования. Процесс удаления всей или части одной иммобилизованной цепи в «мостиковой» двухцепочечной структуре нуклеиновой кислоты называется «линеаризацией». Существуют разные способы линеаризации, включающие ферментативное расщепление, фотохимическое расщепление или химическое расщепление, но не ограничивающиеся ими. Неограничивающие примеры способов линеаризации раскрываются в публикации РСТ № WO 2007/010251, публикации патента США №2009/0088327, публикации патента США №2009/0118128 и заявке на патент США 62/671816, которые включаются посредством ссылки во всей их полноте.

В некоторых воплощениях условие для снятия защиты или удаления 3’-ОН блокирующих групп также является совместимым с процессами линеаризации. В некоторых других воплощениях условие снятия защиты является совместимым с процессом химической линеаризации, который включает применение комплекса Pd и фосфина, например, Pd(OAc)2 и ТНР. В некоторых воплощениях комплекс Pd представляет собой комплекс Pd(II), который генерирует Pd(0) in situ в присутствии фосфина.

Если не указано иное, ссылка на нуклеотиды также подразумевается применимой к нуклеозидам.

Меченые нуклеотиды

Согласно одному аспекту данного раскрытия описанный 3’-ОН блокированный нуклеотид также содержит выявляемую метку, и такой нуклеотид называется меченым нуклеотидом. Метка (например, флуоресцентный краситель) может быть конъюгирована через возможный линкер посредством множества способов, включая гидрофобное притяжение, ионное притяжение и ковалентное присоединение. В некоторых аспектах красители конъюгируются с субстратом посрдством ковалентного присоединения. Более конкретно, ковалентное присоединение осуществляется посредством линкерной группы. В некоторых случаях такие меченые нуклеотиды также называются «модифицированными нуклеотидами».

Меченые нуклеозиды и нуклеотиды являются полезными для мечения полинуклеотидов, образованных ферментативным синтезом, как, например, в качестве неограничивающего примера, в ПЦР-амплификации, изотермической амплификации, твердофазной амплификации, секвенировании полинуклеотидов (например, твердофазное секвенирование), реакциях ник-трансляции и тому подобных.

В некоторых воплощениях данный краситель может ковалентно присоединяться колигонуклеотидам или нуклеотидам посредством нуклеотидного основания. Например, меченый нуклеотид или олигонуклеотид может иметь метку, присоединенную к С5 положению пиримидинового основания или к С7 положению 7-деазапуринового основания через линкерный фрагмент.

Если не указано иное, ссылка на нуклеотиды также подразумевается как применимая к нуклеозидам. Настоящая заявка также будет дополнительно описана со ссылкой на ДНК, хотя данное описание также будет применимым к РНК, ПНК (пептидная нуклеиновая кислота) и другим нуклеиновым кислотам, если не указано иное.

Линкеры

В некоторых воплощениях, описанных в данном документе, пуриновое или пиримидиновое основание нуклеотидных или нуклеозидных молекул, описанных в данном документе, может быть связано с выявляемой меткой, как описано выше. В некоторых таких воплощениях используемые линкеры являются расщепляемыми. Применение расщепляемых линкеров обеспечивает то, что метка может, если требуется, удаляться после выявления, избегая какого-либо мешающего сигнала с любым меченым нуклеотидом или нуклеозидом, включенным далее. В некоторых воплощениях расщепляемый линкер содержит азидный фрагмент, -O-С26 алкенильный фрагмент (например, -О-аллил), дисульфидный фрагмент, ацетальный фрагмент (такой же или аналогичный 3’-ацетальной блокирующей группе, описанной в данном документе) или тиокарбаматный фрагмент (такую же или аналогичную 3’-ацетальной блокирующей группе, описанной в данном документе).

В некоторых других воплощениях используемые линкеры являются нерасщепляемыми. Поскольку в каждом случае, когда включается меченый нуклеотид по изобретению, затем не нужно включать нуклеотиды, и, таким образом, от данного нуклеотида не нужно удалять метку.

В данной области известны расщепляемые линкеры, и для присоединения линкера к нуклеотидному основанию и метке можно применять традиционную химию. Данный линкер может расщепляться любым походящим способом, включая воздействие кислот, оснований, нуклеофилов, электрофилов, радикалов, металлов, восстановителей или окислителей, света, температуры, ферментов и т.д. Линкер, как обсуждается в данном документе, также может расщепляться тем же самым катализатором, используемым для расщепления связи 3’-О-блокирующей группы. Подходящие линкеры могут быть адаптированы из стандартных химических защитных групп, как раскрыто в Greene & Wuts, Protective Groups in Organic Synthesis, John Wiley & Sons. Другие подходящие расщепляемые линкеры, используемые в твердофазном синтезе, раскрываются в Guillier et al. (Chem. Rev. 100:2092-2157, 2000).

Когда выявляемая метка присоединяется к основанию, линкер может присоединяться в любом положении на нуклеотидном основании, при условии, что все еще может осуществляться образование пар оснований по Уотсону-Крику. В контексте пуриновых оснований предпочтительным является, если линкер присоединяется посредством 7-положения пурина или предпочтительного деазапуринового аналога, через 8-модифицированный пурин, через N-6 модифицированный аденозин или N-2 модифицированный гуанин. Для пиримидинов присоединение предпочтительно осуществляется через 5-положение на цитозине, тимидине или урациле и N-4 положение на цитозине.

В некоторых воплощениях линкер может содержать спейсерное звено. Длина данного линкера не является важной, при условии, что метка удерживается на достаточном расстоянии от нуклеотида таким образом, чтобы не мешать какому-либо взаимодействию между нуклеотидом и ферментом, например, полимеразой.

В некоторых воплощениях линкер может состоять из аналогичной функциональной группы, такой как 3’-ОН защитная группа. Это будет делать более эффективными снятие защиты и способ осуществления снятия защиты, так как будет требоваться только одна обработка для удаления как метки, так и защитной группы.

Применение термина «расщепляемый линкер» не означает то, что он подразумевает, что требуется удаление целого линкера. Сайт расщепления может быть расположен в положении на линкере, которое обеспечивает то, что часть линкера остается присоединенной к группировке красителя и/или субстрата после расщепления. Расщепляемые линкеры, в качестве неограничивающего примера, могут представлять собой электрофильно расщепляемые линкеры, нуклеофильно расщепляемые линкеры, фоторасщепляемые линкеры, расщепляемые при восстановительных условиях (например, линкеры, содержащие дисульфид или азид), окислительных условиях, расщепляемые посредством применения линкеров с защелкой или расщепляемые посредством механизмов элиминации. Применение расщепляемого линкера для присоединения соединения-красителя к группировке субстрата обеспечивает то, что метка, если требуется, может быть удалена после выявления, избегая какого-либо мешающего сигнала на последующих стадиях.

Полезные линкерные группы можно найти в публикации РСТ № WO 2004/018493 (включенной в данный документ посредством ссылки), примеры которых включают линкеры, которые могут расщепляться с использованием водорастворимых фосфинов или водорастворимых катализаторов на основе переходных металлов, образованных из переходного металла и по меньшей мере частично водорастворимых лигандов, например, комплекса Pd(II) и ТНР. В водном растворе последние образуют по меньшей мере частично водорастворимые комплексы переходного металла. Такие расщепляемые линкеры можно использовать для соединения оснований нуклеотидов с метками, такими как красители, изложенные в данном документе.

Конкретные линкеры включают линкеры, раскрытые в публикации РСТ № WO 2004/018493 (включена в данный документ посредством ссылки), такие как линкеры, которые включают фрагменты следующих формул:

(где X выбран из группы, содержащей О, S, NH и NQ, где Q представляет собой С1-10 замещенную или незамещенную алкильную группу, Y выбран из группы, содержащей О, S, NH и N(аллил), Т представляет собой водород или С1-10 замещенную или незамещенную алкильную группу, и * указывает, где данный фрагмент соединен с остальной частью нуклеотида или нуклеозида). В некоторых аспектах линкеры соединяют основания нуклеотидов с метками, такими как, например, соединения-красители, описанные в данном документе.

Дополнительные примеры линкеров включают линкеры, раскрытые в публикации США №2016/0040225 (включена в данный документ посредством ссылки), такие как линкеры, включающие фрагменты следующих формул:

Линкерные фрагменты, проиллюстрированные в данном документе, могут содержать полную или частичную структуру линкера между нуклеотидами/нуклеозидами и метками.

Дополнительные примеры линкеров («L») включают фрагменты следующих формул:

где В представляет собой нуклеиновое основание; Z представляет собой -N3 (азидо), -О-C1-C6 алкил, -O-С26 алкенил или -O-С26 алкинил; и FI содержит флуоресцентную метку, которая может содержать дополнительную линкерную структуру. Обычному специалисту в данной области понятно то, что метка ковалентно связывается с линкером посредством осуществления взаимодействия функциональной группы метки (например, карбоксил) с функциональной группой линкера (например, амино).

В конкретных воплощениях длина линкера между флуоресцентным красителем (флуорофор) и гуаниновым основанием может быть изменена, например, введением полиэтиленгликолевой спейсерной группы, увеличивая, посредством этого, интенсивность флуоресценции по сравнению с таким же флуорофором, присоединенным к гуаниновому основанию через другие связи, известные в данной области. Типичные линкеры и их свойства излагаются в публикации РСТ № WO 2007020457 (включена в данный документ посредством ссылки). Конструкция линкеров и особенно их увеличенная длина могут обеспечивать улучшения в яркости флуорофоров, присоединенных к гуаниновым основаниям гуанозиновых нуклеотидов при включении в полинуклеотиды, такие как ДНК. Таким образом, когда краситель предназначен для применения в любом способе анализа, в котором требуется выявление метки флуоресцентного красителя, присоединенной к гуанинсодержащему нуклеотиду, полезным является, если линкер содержит спейсерную группу формулы -((СН2)2O)n- где n представляет собой целое число от 2 до 50, как описано в WO 2007/020457.

Нуклеозиды и нуклеотиды могут быть мечеными в сайтах на сахаре или нуклеиновом основании. Как известно в данной области, «нуклеотид» состоит из азотистого основания, сахара и одной или более чем одной фосфатной группы. В РНК сахаром является рибоза, а в ДНК - дезоксирибоза, т.е. сахар, не имеющий гидроксильной группы, которая присутствует в рибозе. Азотистое основание представляет собой производное пурина или пиримидина. Пуринами являются аденин (А) и гуанин (G), а пиримидинами являются цитозин (С) и тимин (Т) или, в контексте РНК - урацил (U). Атом С-1 дезоксирибозы связывается с N-1 пиримидина или N-9 пурина. Нуклеотид также представляет собой сложный фосфатный эфир нуклеозида с этерификацией, происходящей на гидроксильной группе, присоединенной к С-3 или С-5 сахара. Нуклеотиды обычно представляют собой моно-, ди- или трифосфаты.

«Нуклеозид» является структурно сходным с нуклеотидом, но у него отсутствуют фосфатные фрагменты. Примером аналога нуклеозида был бы аналог, в котором метка связывается с основанием, и отсутствует фосфатная группа, присоединенная к молекуле сахара.

Хотя основание обычно называют пурином или пиримидином, специалисту будет понятно то, что доступны производные и аналоги, которые не изменяют способность нуклеотида или нуклеозида к образованию пар оснований по Уотсону-Крику. «Производное» или «аналог» означает соединение или молекулу, структура ядра которой является такой же или имеет близкое сходство со структурой родительского соединения, но которое имеет химическую или физическую модификацию, такую как, например, другая или дополнительная боковая группа, которая позволяет производному нуклеотида или нуклеозида связываться с другой молекулой. Например, данное основание может представлять собой деазапурин. В конкретных воплощениях данные производные должны быть способны к образованию пар по Уотсону-Крику. «Производное» и «аналог» также включает, например, синтетическое производное нуклеотида или нуклеозида, имеющее модифицированные фрагменты основания и/или модифицированные фрагменты сахара. Такие производные и аналоги обсуждаются, например, в Scheit, Nucleotide analogs (John Wiley & Son, 1980) и Uhlman et al., Chemical Reviews 90:543-584, 1990. Аналоги нуклеотидов также могут содержать модифицированные фосфодиэфирные связи, включающие фосфоротиоатные, фосфородитиоатные, алкилфосфонатные, фосфоранилидатные, фосфорамидатные связи и тому подобные.

Краситель может быть присоединен в любом положении на нуклеотидном основании, например, через линкер. В конкретных воплощениях образование пар оснований по Уотсону-Крику все еще может осуществляться для образующегося в результате аналога. Конкретные сайты мечения нуклеинового основания включают положение С5 пиримидинового основания или положение С7 7-деазапуринового основания. Как описано выше, линкерную группу можно использовать для ковалентного присоединения красителя к нуклеозиду или нуклеотиду.

В конкретных воплощениях меченый нуклеозид или нуклеотид может быть ферментативно включаемым и ферментативно удлиняемым. Соответственно, линкерный фрагмент может иметь достаточную длину для соединения нуклеотида с соединением, таким образом, что данное соединение не мешает значительно общему связыванию и распознаванию нуклеотида ферментом репликации нуклеиновой кислоты. Таким образом, данный линкер также может содержать спейсерный элемент. Данный спейсер, например, помещает на расстоянии нуклеотидное основание от сайта расщепления или метки.

Нуклеозиды или нуклеотиды, меченные красителями, описанными в данном документе, могут иметь следующую формулу:

где, Dye представляет собой соединение-краситель, В представляет собой нуклеиновое основание, такое как, например, урацил, тимин, цитозин, аденин, гуанин и тому подобные; L представляет собой возможную линкерную группу, которая может присутствовать или может не присутствовать; R' может представлять собой Н, монофосфат, дифосфат, трифосфат, тиофосфат, аналог сложного фосфатного эфира, -О-, присоединенный к реакционноспособной фосфоросодержащей группе, или -О-, защищенный блокирующей группой; R''' может представлять собой Н, ОН, фосфорамидит, или 3’-ОН блокирующую группу, описанную в данном документе, и R" представляет собой Н или ОН. Когда R''' представляет собой фосфорамидит, R' представляет собой кислоторасщепляемую гидрокси защитную группу, которая обеспечивает последующее связывание мономера при условиях автоматического синтеза.

В конкретном воплощении присутствуют и линкер (между красителем и нуклеотидом), и блокирующая группа, и они являются отдельными фрагментами. В конкретных воплощениях и линкер, и блокирующая группа являются расщепляемыми при по существу аналогичных условиях. Таким образом, способы снятия защиты и снятия блокировки могут быть более эффективными, так как будет требоваться только одна обработка для удаления и соединения-красителя, и блокирующей группы. Однако в некоторых воплощениях линкеру и блокирующей группе не нужно быть расщепляемыми при аналогичных условиях, вместо этого они являются индивидуально расщепляемыми при отличных условиях.

Данное раскрытие также охватывает полинуклеотиды, включающие соединения-красители. Такие полинуклеотиды могут представлять собой ДНК или РНК, содержащие, соответственно, дезоксирибонуклеотиды или рибонуклеотиды, соединенные в фосфодиэфирной связи. Полинуклеотиды могут содержать встречающиеся в природе нуклеотиды, нуклеотиды, не встречающиеся в природе (или модифицированные), отличные от меченых нуклеотидов, описанных в данном документе, или любую их комбинацию в комбинации с по меньшей мере одним модифицированным нуклеотидом (например, меченным соединением-красителем), как изложено в данном документе. Полинуклеотиды согласно данному раскрытию также могут включать неприродные связи остова и/или ненуклеотидные химические модификации. Химерные структуры, состоящие из смесей рибонуклеотидов и дезоксирибонуклеотидов, содержащие по меньшей мере один меченый нуклеотид, также рассматриваются.

Неограничивающие типичные меченые нуклеотиды, как описано в данном документе, включают следующие:

где L представляет линкер, и R представляет остаток сахара, как описано выше, или остаток сахара с 5'-положением, замещенным одним, двумя или тремя фосфатами.

В некоторых воплощениях неограничивающие типичные конъюгаты с флуоресцентными красителями показаны ниже:

где PG означает группы, блокирующие 3' гидрокси, описанные в данном документе. В любых воплощениях меченого нуклеотида, описанного в данном документе, данный нуклеотид представляет собой нуклеотидтрифосфат.

Наборы

Согласно настоящему раскрытию также предложены наборы, включающие один или более чем один 3' блокированный нуклеозид и/или нуклеотид, описанный в данном документе, например, 3' блокированный нуклеотид Формулы (I), (Ia) или (II). Такие наборы обычно будут включать по меньшей мере один 3' блокированный нуклеотид или нуклеозид, меченный красителем, наряду с по меньшей мере одним дополнительным компонентом. Дополнительный(ные) компонент(ты) может(гут) представлять собой один или более чем один компонент, идентифицированный в способе, изложенном в данном документе, или в разделе Примеров ниже. Некоторые неограничивающие примеры компонентов, которые могут быть объединены в набор по настоящему раскрытию, излагаются ниже.

В конкретном воплощении набор может включать по меньшей мере один меченый 3' блокированный нуклеотид или нуклеозид совместно с мечеными или немечеными нуклеотидами или нуклеозидами. Например, нуклеотиды, меченные красителями, могут быть поставлены в комбинации с немечеными или природными нуклеотидами и/или с флуоресцентно мечеными нуклеотидами или их любой комбинацией. Комбинации нуклеотидов могут быть предоставлены в виде отдельных индивидуальных компонентов (например, один тип нуклеотида на сосуд или пробирку) или в виде смесей нуклеотидов (например, два или более чем два нуклеотида, смешанных в том те самом сосуде или пробирке).

Когда наборы содержат множество, в частности, два или три, или более, в частности, четыре 3' блокированных нуклеотида, меченных соединением-красителем, разные нуклеотиды могут быть меченными разными соединениями-красителями, или один может быть темным - без соединений-красителей. Когда разные нуклеотиды являются меченными разными соединениями-красителями, характеристикой данных наборов является именно то, что соединения-красители представляют собой спектрально различимые флуоресцентные красители. Термин «спектрально различимые флуоресцентные красители» в том виде, в котором он используется в данном документе, относится к флуоресцентным красителям, которые испускают флуоресцентную энергию при длинах волн, которые могут быть различены оборудованием для выявления флуоресценции (например, имеющаяся в продаже платформа секвенирования ДНК на основе капилляров) при присутствии в одном образце двух или более чем двух таких красителей. Когда два нуклеотида, меченных соединениями-флуоресцентными красителями, поставляются в виде набора, характеристикой некоторых воплощений является именно то, что спектрально различимые флуоресцентные красители могут быть возбуждены при одинаковой длине волны, как, например, посредством того же самого лазера. Когда четыре 3' блокированных нуклеотида (А, С, Т и G), меченных соединениями-флуоресцентными красителями, поставляются в виде набора, характеристикой некоторых воплощений является именно то, что два из спектрально различимых флуоресцентных красителей могут быть оба возбуждены при одной длине волны, а другие два спектрально различимых красителя могут быть оба возбуждены при другой длине волны. Конкретными длинами волн возбуждения являются 488 нм и 532 нм.

В одном воплощении набор включает первый 3' блокированный нуклеотид, меченный первым красителем, и второй нуклеотид, меченный вторым красителем, где данные красители имеют различие в максимуме поглощения по меньшей мере 10 нм, в частности, от 20 нм до 50 нм. Более конкретно два данных соединения-красителя имеют Стоксовы сдвиги от 15 до 40 нм, где «стоксов сдвиг» представляет собой расстояние между длинами волн пика поглощения и пика испускания.

В альтернативном воплощении наборы по данному раскрытию могут содержать 3’-блокированные нуклеотиды, где то же самое основание мечено двумя или более чем двумя разными красителями. Первый нуклеотид (например, 3' блокированный нуклеотидтрифосфат Т или 3' блокированный нуклеотидтрифосфат G) может метиться первым красителем. Второй нуклеотид (например, 3' блокированный нуклеотидтрифосфат С) может метиться вторым красителем, спектрально отличным от первого красителя, например, «зеленым» красителем, поглощающим при меньше, чем 600 нм, и «синим» красителем, поглощающим при меньше, чем 500 нм, например, при 400-500 нм, в частности 450-460 нм). Третий нуклеотид (например, 3' блокированный нуклеотидтрифосфат А) может метиться в виде смеси первого и второго красителей или смеси первого, второго и третьего красителей, а четвертый нуклеотид (например, 3' блокированный нуклеотидтрифосфат G или 3' блокированный нуклеотидтрифосфат Т) может быть «темным» и не содержит метки. В одном примере нуклеотиды 1-4 могут быть меченными «синим», «зеленым», «сине-зеленым» и темным. Для дальнейшего упрощения оборудования четыре нуклеотида могут метиться двумя красителями, возбуждаемыми одним лазером, и, таким образом, мечение нуклеотидов 1-4 может представлять собой «синий 1», «синий 2», «синий 1/синий 2» и темный.

В конкретных воплощениях данные наборы могут содержать четыре меченых 3' блокированных нуклеотида (например, А, С, Т, G), где каждый тип нуклеотида содержит такую же 3' блокирующую группу и флуоресцентную метку, и где каждая флуоресцентная метка имеет отличный максимум флуоресценции, и каждая из флуоресцентных меток отличается от других трех меток. Данные наборы могут быть такими, что две или более чем две флуоресцентные метки имеют аналогичный максимум поглощения, но отличный стоксов сдвиг. В некоторых других воплощениях один тип нуклеотида является немеченым.

Хотя наборы и иллюстрируются в данном документе примерами в отношении конфигураций, имеющих разные нуклеотиды, которые метятся разными соединениями-красителями, будет понятно то, что данные наборы могут включать 2, 3, 4 или более разных нуклеотидов, которые имеют такое же соединение-краситель. В некоторых воплощениях данный набор также включает фермент и подходящий для действия фермента буфер. В некоторых таких воплощениях фермент представляет собой полимеразу, терминальную дезоксинуклеотидилтрансферазу или обратную транскриптазу. В конкретных воплощениях данный фермент представляет собой ДНК-полимеразу, такую как ДНК-полимераза 812 (Pol 812) или ДНК-полимераза 1901 (Pol 1901). Аминокислотные последовательности полимераз Pol 812 и Pol 1901 описываются, например, в заявках на патент США №16/670876, поданной 31 октября 2019 г., и 16/703569, поданной 4 декабря 2019 г., которые обе включаются в данный документ посредством ссылки.

Другие компоненты, подлежащие включению в такие наборы, могут включать буферы и тому подобное. Нуклеотиды по настоящему раскрытию и любые другие нуклеотидные компоненты, включающие смеси разных нуклеотидов, могут быть предоставлены в данном наборе в концентрированном виде для разведения перед применением. В таких воплощениях также может быть включен подходящий буфер для разведения. Опять-таки, в набор по настоящему раскрытию может быть включен один или более чем один компонент, идентифицированный в способе, изложенном в данном документе.

Способы секвенирования

Меченые нуклеотиды или нуклеозиды согласно настоящему раскрытию можно использовать в любом способе анализа, таком как способ, который включает выявление флуоресцентной метки, присоединенной к нуклеотиду или нуклеозиду, независимо от того, самой ли по себе или включенной в или ассоциированной с большей молекулярной структурой или конъюгатом. В данном контексте термин «включенный в полинуклеотид» может означать то, что 5'-фосфат соединяется в фосфодиэфирной связи с 3’-ОН группой второго (модифицированного или немодифицированного) нуклеотида, который сам может образовать часть более длинной полинуклеотидной цепи. 3' конец нуклеотида, изложенного в данном документе, может быть связан или может не быть связан в фосфодиэфирной связи с 5'-фосфатом другого (модифицированного или немодифицированного) нуклеотида. Таким образом, в одном неограничивающем воплощении согласно данному раскрытию предложен способ выявления нуклеотида, включенного в полинуклеотид, который включает: (а) включение по меньшей мере одного нуклеотида по раскрытию в полинуклеотид и (b) выявление нуклеотида(дов), включенного(ных) в данный полинуклеотид посредством выявления флуоресцентного сигнала от соединения-красителя, присоединенного к указанному(ным) нуклеотиду(дам).

Данный способ может включать: стадию синтеза (а), в которой один или более чем один нуклеотид согласно данному раскрытию включается в полинуклеотид, и стадию выявления (b), в которой один или более чем один нуклеотид, включенный в полинуклеотид, выявляется посредством выявления или количественного измерения их флуоресценции.

Некоторые воплощения настоящей заявки направлены на способы секвенирования, включающие: (а) включение по меньшей мере одного меченого нуклеотида, как описано в данном документе, в полинуклеотид и (b) выявление меченого(ных) нуклеотида(дов), включенного(ных) в данный полинуклеотид, посредством выявления флуоресцентного сигнала от нового флуоресцентного красителя, присоединенного куказанному(ным) полинуклеотиду(дам).

Некоторые воплощения настоящего раскрытия относятся к способу определения последовательности целевого одноцепочечного полинуклеотида, включающему:

(a) включение нуклеотида, содержащего 3’-ОН блокирующую группу и выявляемую метку, как описано в данном документе, в копию полинуклеотидной цепи, комплементарной по меньшей мере части целевой полинуклеотидной цепи;

(b) выявление идентичности нуклеотида, включенного в копию полинуклеотидной цепи; и

(c) осуществление химического удаления метки и 3’-ОН блокирующей группы из нуклеотида, включенного в копию полинуклеотидной цепи.

В некоторых воплощениях способ секвенирования дополнительно включает (d) отмывку химически удаленной метки и 3' блокирующей группы от копии полинукеотидной цепи. В некоторых таких воплощениях 3' блокирующая группа и выявляемая метка удаляются перед введением следующего комплементарного нуклеотида. В некоторых других воплощениях 3' блокирующая группа и выявляемая метка удаляются за один этап химической реакции. В некотором воплощении стадия промывки (d) также удаляет не включенные нуклеотиды. В некоторых других воплощениях на стадии промывки после химического расщепления метки и 3' блокирующей группы также используется палладиевый акцептор радикалов.

В некоторых воплощениях стадии (a)-(d) повторяют, пока не определится последовательность части матричной полинуклеотидной цепи. В некоторых воплощениях стадии (a)-(d) повторяют по меньшей мере 50 раз, по меньшей мере 75 раз, по меньшей мере 100 раз, по меньшей мере 150 раз, по меньшей мере 200 раз, по меньшей мере 250 раз или по меньшей мере 300 раз.

В некоторых воплощениях метка и 3' блокирующая группа удаляются в двух отдельных химических реакциях. В некоторых таких воплощениях удаление метки от нуклеотида, включенного в копию полинуклеотидной цепи, включает приведение в контакт копии цепи, включающей данный включенный нуклеотид, с первым расщепляющим раствором. В некотором таком воплощении первый расщепляющий раствор содержит фосфин, такой как триал килфосфин. Неограничивающие примеры триалкилфосфинов включают

трис(гидроксипропил)фосфин (ТНР), трис-(2-карбоксиэтил)фосфин (ТСЕР), трис(гидроксиметил)фосфин (ТНМР) или трис(гидроксиэтил)фосфин (ТНЕР). В одном воплощении первый расщепляющий раствор содержит ТНР. В некоторых таких воплощениях удаление 3' блокирующей группы из нуклеотида, включенного в копию полинуклеотидной цепи, включает приведение в контакт копии цепи, включающей данный включенный нуклеотид, со вторым расщепляющим раствором. В некоторых таких воплощениях второй расщепляющий раствор содержит палладиевый (Pd) катализатор. В некоторых других воплощениях Pd катализатор представляет собой Pd(0) катализатор. В некоторых таких воплощениях Pd(0) получают смешиванием комплекса Pd(II) [(PdCl(C3H5))2] с ТНР in situ. Молярное отношение комплекса Pd(II) и ТНР может составлять 1:2, 1:3, 1:4, 1:5, 1:6, 1:7, 1:8, 1:9 или 1:10. В одном воплощении молярное отношение Pd:THP составляет 1:5. В некоторых других воплощениях можно добавлять один или более чем один восстановитель, такой как аскорбиновая кислота или ее соль (например, аскорбат натрия). В некоторых воплощениях второй расщепляющий раствор может содержать один или более чем один буферизующий реагент, такой как первичный амин, вторичный амин, третичный амин, карбонатная соль, фосфатная соль или боратная соль, или их комбинации. В некоторых других воплощениях буферизующий реагент содержит этаноламин (ЕА),

трис(гидроксиметил)аминометан (Tris), глицин, карбонат натрия, фосфат натрия, борат натрия, 2-диметиламинометанол (DMEA), 2-диэтиламинометанол (DEEA), N,N,N',N'-тетраметилэтилендиамин (TEMED) или N,N,N',N'-тетраэтилэтилендиамин (TEEDA), или их комбинации. В одном воплощении буферизующий реагент представляет собой DEEA. В другом воплощении буферизующий реагент содержит одну или более чем одну неорганическую соль, такую как карбонатна соль, фосфатная соль или боратная соль, или их комбинации. В одном воплощении неорганическая соль представляет собой натриевую соль. В некоторых других воплощениях 3' блокированный нуклеотид содержит группу АОМ, а второй расщепляющий раствор содержит палладиевый (Pd) катализатор и один или более чем один буферизующий реагент, описанный в данном документе (например, третичный амин, такой как DEEA), и имеет рН от примерно 9,0 до примерно 10,0 (например, 9,6 или 9,8).

В некоторых альтернативных воплощениях метку и 3’-ОН блокирующую группу удаляют в одной химической реакции. В некоторых таких воплощениях метка присоединяется к нуклеотиду через расщепляемый линкер, содержащий такой же фрагмент, что и 3' блокирующая группа, например, и линкер, и 3' блокирующая группа могут содержать ацетальный фрагмент или тиокарбаматный фрагмент как описано в данном документе. В некотором таком воплощении одна химическая реакция проводится в расщепляющем растворе, содержащем Pd катализатор, описанный выше.

В некоторых других воплощениях нуклеотиды, используемые на стадии включения (а), представляют собой полностью функционализированные нуклеотидтрифосфаты А, С, Т и G, причем каждый содержит 3' блокирующую группу, описанную в данном документе. В некоторых таких воплощениях нуклеотиды, описанные в данном документе, обеспечивают превосходную стабильность в растворе во время циклов секвенирования по сравнению с такими же нуклеотидами, защищенными стандартной 3’-О-азидометильной блокирующей группой. Например, ацетальная или тиокарбаматная блокирующие группы, раскрытые в данном документе, могут придавать по меньшей мере на 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 200%, 300%, 400%, 500%, 600%, 700%, 800%, 900%, 1000%, 1500%, 2000%, 2500% или 3000% улучшенную стабильность по сравнению с защищенной азидометилом 3’-ОН при тех же самых условиях в течение такого же периода времени, уменьшая, посредством этого, значения предфазирования и приводя к большим длинам считываемых фрагментов при секвенировании. В некоторых воплощениях стабильность измеряется при температуре окружающей среды или при температуре ниже температуры окружающей среды (такой как 4-10°С). В других воплощениях стабильность измеряется при повышенной температуре, такой как 40°С, 45°С, 50°С, 55°С, 60°С или 65°С. В некоторых таких воплощениях стабильность измеряется в растворе при основном рН среды, например, при рН 9,0; 9,2; 9,4; 9,6; 9,8 или 10,0. В некоторых других воплощениях значение предфазирования с 3' блокированным нуклеотидом, описанным в данном документе, составляет меньше, чем примерно 0,25; 0,24; 0,23; 0,22; 0,21; 0,20; 0,19; 0,18; 0,17; 0,16; 0,15; 0,14; 0,13; 0,12; 0,11; 0,10; 0,09; 0,08; 0,07; 0,06 или 0,05 после более чем 50, 100 или 150 циклов SBS. В некоторых других воплощениях значение предфазирования с 3' блокированным нуклеотидом составляет меньше, чем примерно 0,25; 0,24; 0,23; 0,22; 0,21; 0,20; 0,19; 0,18; 0,17; 0,16; 0,15; 0,14; 0,13; 0,12; 0,11; 0,10; 0,09; 0,08; 0,07; 0,06 или 0,05 после более чем 50, 100 или 150 циклов SBS. В одном воплощении каждый ffN содержит группу 3’-АОМ.

В некоторых воплощениях 3' блокированные нуклеотиды, описанные в данном документе, обеспечивают превосходную скорость деблокирования в растворе после стадии химического расщепления цикла секвенирования, по сравнению с такими же нуклеотидами, защищенными стандартной 3’-О-азидометильной блокирующей группой. Например, ацетальная (например, АОМ) или тиокарбаматная блокирующие группы, раскрытые в данном документе, могут придавать по меньшей мере на 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 150%, 200%, 300%, 400%, 500%, 600%, 700%, 800%, 900%, 1000%, 1500% или 2000% улучшенную скорость деблокирования по сравнению с 3’-ОН, защищенной азидометилом, с использованием стандартного деблокирущего реагента (такого как трис(гидроксипропил)фосфин), уменьшая, посредством этого, общее время для цикла секвенирования. В некоторых воплощениях время деблокирования для каждого нуклеотида уменьшается примерно на 5%, 10%, 20%, 30%, 40%, 50% или 60%. Например, время деблокирования для 3’-АОМ и 3’-О-азидометила составляет примерно 4-5 секунд и примерно 9-10 секунд, соответственно, при определенных условиях химической реакции. В некоторых воплощениях время полужизни (t1/2) блокирующей группы АОМ по меньшей мере в 1, 2, 3, 4, 5, 6, 7, 8, 9 или 10 раз меньше, чем азидометильной блокирующей группы. В некотором таком воплощении t1/2 АОМ составляет примерно 1 минуту, тогда как t1/2 азидометила составляет примерно 11 минут. В некоторых воплощениях скорость деблокирования измеряется при температуре окружающей среды или при температуре ниже температуры окружающей среды (такой как 4-10°С). В других воплощениях скорость деблокирования измеряется при повышенной температуре, такой как 40°С, 45°С, 50°С, 55°С, 60°С или 65°С. В некоторых таких воплощениях скорость деблокирования измеряется в растворе в среде с основным рН, например, при рН 9,0; 9,2; 9,4; 9,6; 9,8 или 10,0. В некоторых таких воплощениях молярное отношение деблокирующего реагента к субстрату (т.е. 3' блокированному нуклеозиду или нуклеотиду) составляет примерно 10:1, примерно 5:1, примерно 2:1, примерно 1:1, примерно 1:2, примерно 1:5 или примерно 1:10. В одном воплощении каждый ffN содержит группу 3’-АОМ.

В любых воплощениях способов, описанных в данном документе, меченый нуклеотид представляет собой нуклеотидтрифосфат. В любых воплощениях способа, описанного в данном документе, цепь целевого полинуклеотида присоединяется к твердой подложке, такой как проточная ячейка.

В одном воплощении по меньшей мере один нуклеотид включается в полинуклеотид на стадии синтеза посредством действия фермента полимеразы. В некоторых таких воплощениях полимераза может представлять собой ДНК-полимеразу Pol 812 или Pol 1901. Однако можно использовать другие способы присоединения нуклеотидов к полинуклеотидам, как, например, химический синтез олигонуклеотидов или лигирование меченых олигонуклеотидов с немечеными олигонуклеотидами. Следовательно, термин «включение» при использовании по отношению к нуклеотиду и полинуклеотиду может охватывать синтез полинуклеотида химическими способами, а также ферментативными способами.

В конкретном воплощении стадия синтеза проводится и возможно может включать инкубирование цепи полинуклеотида-матрицы с реакционной смесью, содержащей меченые 3' блокированные нуклеотиды по данному раскрытию. Полимераза также может быть предоставлена при условиях, которые обеспечивают образование фосфодиэфирной связи между свободной 3’-ОН группой на цепи полинуклеотида, подвергнутого отжигу с цепью полинуклеотида-матрицы, и 5' фосфатной группой на нуклеотиде. Таким образом, стадия синтеза может включать образование цепи полинуклеотида в том виде, в котором оно управляется комплементарным образованием пар нуклеотидов с цепью матрицы.

Во всех воплощениях данных способов стадия выявления может проводиться, в то время как цепь полинуклеотида, в которую включаются меченые нуклеотиды, подвергается отжигу с цепью матрицы или после стадии денатурации, на которой две данные цепи разделяются. Другие стадии, например, стадии химической или ферментативной реации, или стадии очистки, могут быть включены между стадией синтеза и стадией выявления. В частности, целевая цепь, включающая меченый(ные) нуклеотид(ды), может быть выделена или очищена и затем подвергнута дальнейшей обработке или использована в последующем анализе. В качестве примера, целевые полинуклеотиды, меченные нуклеотидом(дами), как описано в данном документе, на стадии синтеза могут быть затем использованы в качестве меченых зондов или праймеров. В других воплощениях продукт стадии синтеза, изложенный в данном документе, может быть подвергнут дальнейшим стадиям реакции и, если желательно, продукт данных последующих стадий очищают или выделяют.

Подходящие условия для стадии синтеза будут хорошо известны знакомым со стандартными методиками молекулярной биологии. В одном воплощении стадия синтеза может быть аналогичной стандартной реакции достройки праймера с использованием нуклеотидов-предшественников, включающих нуклеотиды, как описано в данном документе, с образованием достроенной целевой цепи, комплементарной цепи матрицы, в присутствии подходящего фермента полимеразы. В других воплощениях стадия синтеза может сама образовать часть реакции амплификации, продуцирующей меченый двухцепочечный продукт амплификации, состоящий из подвергнувшихся отжигу комплементарных цепей, полученных в результате копирования целевой и матричной полинуклеотидных цепей. Другие типичные стадии синтеза включают ник-трансляцию, полимеризацию с вытеснением цепи, случайное мечение ДНК с праймерами и т.д. Особенно полезным ферментом-полимеразой для стадии синтеза является полимераза, которая способна катализировать включение нуклеотидов, как изложено в данном документе. Можно использовать целый ряд встречающихся в природе или модифицированных полимераз. В качестве примера, для синтетической реакции, которая проводится с использованием условий термоциклирования, можно использовать термостабильную полимеразу, тогда как термостабильная полимераза может быть нежелательной для изотермических реакций достройки праймера. Подходящие термостабильные полимеразы, которые способны включать нуклеотиды согласно данному раскрытию, включают полимеразы, описанные в WO 2005/024010 или WO 06/120433, каждая из которых включается в данный документ посредством ссылки. В синтетических реакциях, которые проводятся при меньших температурах, таких как 37°С, ферменты-полимеразы не обязательно должны быть термостабильными полимеразами, следовательно, выбор полимеразы будет зависеть от целого ряда факторов, таких как температура реакции, рН, активность вытеснения цепи и тому подобных.

В конкретных неограничивающих воплощениях данное раскрытие охватывает способы секвенирования нуклеиновых кислот, повторного секвенирования, полногеномного секвенирования, подсчета однонуклеотидных полиморфизмов, любое другое приложение, включающее выявление меченого нуклеотида или нуклеозида, изложенных в данном документе, при их включении в полинуклеотид. В любом из множества других приложений, выигрывающих от применения полинуклеотидов, меченных нуклеотидами, содержащими флуоресцентные красители, можно использовать меченые нуклеотиды или нукеозиды с красителями, изложенные в данном документе.

В конкретном воплощении согласно данному раскрытию предложено применение меченых нуклеотидов согласно данному раскрытию в реакции секвенирования полинуклеотида посредством синтеза (SBS). Секвенирование посредством синтеза обычно включает последовательное добавление одного или более чем одного нуклеотида или олигонуклеотида к растущей полинуклеотидной цепи в направлении от 5' до 3' с использованием полимеразы или лигазы для того, чтобы образовать удлиненную полинуклеотидную цепь, комплементарную нуклеиновой кислоте-матрице, подлежащей секвенированию. Идентичность основания, присутствующего в одном или более чем одном добавленном нуклеотиде, может быть определена на этапе выявления или «визуализации». Идентичность добавленного основания может быть определена после каждой стадии включения нуклеотида. Последовательность матрицы может быть затем выведена с использованием традиционных правил образования пар оснований по Уотсону-Крику. Применение меченых нуклеотидов, изложенных в данном документе, для определения идентичности одного основания может быть полезным, например, в подсчете однонуклеотидных полиморфизмов, и такие реакции достройки на одно основание находятся в пределах объема данного раскрытия.

В одном воплощении настоящего раскрытия последовательность полинуклеотида-матрицы определяется посредством выявления включения одного или более чем одного 3' блокированного нуклеотида, описанного в данном документе, в растущую цепь, комплементарную полинуклеотиду-матрице, подлежащему секвенированию, посредством выявления флуоресцентной(ных) метки(ток), присоединенной(ных) к включенному(ным) нуклеотиду(дам). Секвенирование полинуклеотида-матрицы может быть запущено с использованием подходящего праймера (или он может быть получен в виде конструкции шпильки, которая будет содержать праймер как часть шпильки), и растущая цепь достраивается ступенчато посредством добавления нуклеотидов к 3' концу праймера в реакции, катализируемой полимеразой.

В конкретных воплощениях каждый из разных нуклеотидтрифосфатов (А, Т, G и С) может метиться уникальным флуорофором и также содержит блокирующую группу в 3' положении для предотвращения неконтролируемой полимеризации. В качестве альтернативы, один из четырех нуклеотидов может быть немеченым (темным). Фермент-полимераза включает нуклеотид в растущую цепь, комплементарную полинуклеотиду-матрице, и блокирующая группа предотвращает дальнейшее включение нуклеотидов. Любые невключенные нуклеотиды могут быть отмыты, и флуоресцентный сигнал от каждого включенного нуклеотида может быть «считан» оптически посредством подходящих средств, таких как прибор с зарядовой связью с использованием возбуждения лазером и подходящих фильтров испускания. 3’-блокирующая группа и соединения-флуоресцентные красители могут быть затем удалены (снятие защиты) одновременно или последовательно для экспонирования растущей цепи для дальнейшего включения нуклеотидов. Типично идентичность включенного нуклеотида будет определяться после каждой стадии включения, но это не является строго существенным. Аналогичным образом, в патенте США №5302509 (который включен в данный документ посредством ссылки) раскрыт способ секвенирования полинуклеотидов, иммобилизованных на твердой подложке.

В данном способе, как проиллюстрировано примерами выше, используется включение флуоресцентно меченых, 3’-блокированных нуклеотидов A, G, С и Т в растущую цепь, комплементарную иммобилизованному полинуклеотиду, в присутствии ДНК-полимеразы. Данная полимераза включает основание, комплементарное целевому полинуклеотиду, но дальнейшее добавление ей предотвращается посредством 3'-блокирующей группы. Затем может быть определена метка включенного нуклеотида, и блокирующая группа удаляется посредством химического расщепления с обеспечением дальнейшей полимеризации. Нуклеиновая кислота-матрица, подлежащая секвенированию в реакции секвенирования посредством синтеза, может представлять собой любой полинуклеотид, который желательно секвенировать. Нуклеиновая кислота-матрица для реакции секвенирования будет типично содержать двухцепочечную область, имеющую свободную 3’-ОН группу, которая служит в качестве праймера или точки инициации для добавления дальнейших нуклеотидов в реакции секвенирования. Область матрицы, подлежащая секвенированию, будет формировать липкий конец с этой свободной 3’-ОН группой на комплементарной цепи. Область с липким концом матрицы, подлежащая секвенированию, может быть одноцепочечной, но может быть двухцепочечной, при условии, что «присутствует одноцепочесный разрыв» на цепи, комплементарной цепи матрицы, подлежащей секвенированию, с предоставлением свободной 3’-ОН группы для инициации реакции секвенирования. В таких воплощениях секвенирование может идти посредством замещения цепи. В некоторых воплощениях в качестве отдельного компонента может быть добавлен праймер, несущий свободную 3’-ОН группу (например, короткий олигонуклеотид), который гибридизуется с одноцепочечной областью матрицы, подлежащей секвенированию. В качестве альтернативы, каждый из праймера и цепи матрицы, подлежащей секвенированию, могут образовать часть частично комплементарной самой себе цепи нуклеиновой кислоты, способной формировать внутримолекулярный дуплекс, такой как, например, структура петли шпильки. Полинуклеотиды шпильки и способы, посредством которых они могут быть присоединены к твердым подложкам, раскрываются в публикациях РСТ № WO 01/57248 и WO 2005/047301, каждая из которых включается в данный документ посредством ссылки. Нуклеотиды могут добавляться к растущему праймеру последовательно, приводя к синтезу полинуклеотидной цепи в направлении от 5' к 3'. Природа основания, которое было добавлено, может быть определена, в частности, но не обязательно после добавления каждого нуклеотида, предоставляя, таким образом, информацию о последовательности для матрицы нуклеиновой кислоты. Таким образом, нуклеотид включается в цепь нуклеиновой кислоты (или полинуклеотид) посредством соединения данного нуклеотида со свободной 3’-ОН группой цепи нуклеиновой кислоты через образование фосфодиэфирной связи с 5' фосфатной группой нуклеотида.

Нуклеиновая кислота-матрица, подлежащая секвенированию, может представлять собой ДНК или РНК, или даже гибридную молекулу, состоящую из дезоксинуклеотидов и рибонуклеотидов. Нуклеиновая кислота-матрица может содержать встречающиеся в природе и/или невстречающиеся в природе нуклеотиды и природные или неприродные связи остова, при условии, что они не предотвращают копирование матрицы в реакции секвенирования.

В некоторых воплощениях нуклеиновая кислота-матрица, подлежащая секвенированию, может быть присоединена к твердой подложке посредством любого подходящего способа связывания, известного в данной области, например, посредством ковалентного присоединения. В некоторых воплощениях полинуклеотиды матрицы могут присоединяться непосредственно к твердой подложке (например, подложка на основе диоксида кремния). Однако в других воплощениях данного раскрытия поверхность твердой подложки может быть некоторым способом модифицирована таким образом, чтобы обеспечивать либо прямое ковалентное присоединение полинуклеотидов матрицы, либо для иммобилизации полинуклеотидов матрицы через гидрогель или мультислой полиэлектролита, который сам может быть нековалентно присоединен к твердой подложке.

Воплощения и альтернативы секвенирования посредством синтеза

Некоторые воплощения включают методики пиросеквенирования. Пиросеквенирование выявляет высвобождение неорганического фосфата (PPi) по мере того, как конкретные нуклеотиды включаются в растущую цепь (Ronaghi, М., Karamohamed, S., Pettersson, В., Uhlen, М. and Nyren, P. (1996) "Real-time DNA sequencing using detection of pyrophosphate release." Analytical Biochemistry 242(1), 84-9; Ronaghi, M. (2001) "Pyrosequencing sheds light on DNA sequencing." Genome Res. 11(1), 3-11; Ronaghi, M., Uhlen, M. and Nyren, P. (1998) "A sequencing method based on real-time pyrophosphate." Science 281(5375), 363; патенты США №6210891; 6258568 и 6274320, раскрытия которых включаются в данный документ посредством ссылки во всей их полноте). При пиросеквенировании высвобожденный PPi может быть выявлен посредством немедленного превращения до аденозинтрифосфата (АТФ) АТФ-сульфуразой, и уровень генерированного АТФ выявляется посредством продуцированных люциферазой фотонов. Нуклеиновые кислоты, подлежащие секвенированию, могут быть присоединены к элементам на чипе, и данный чип может быть визуализирован для фиксации хемилюминисцентных сигналов, которые продуцируются из-за включения нуклеотидов в элементы чипа. Может быть получено изображение после обработки чипа конкретным типом нуклеотида (например, А, Т, С или G). Изображения, полученные после добавления каждого типа нуклеотида, будут отличаться в отношении того, какие элементы на чипе выявляются. Данные различия на изображении отражают разное содержание последовательности элементов на чипе. Однако относительные положения каждого элемента будут оставаться неизменными на изображениях. Данные изображения можно сохранять, обрабатывать и анализировать с использованием способов, изложенных в данном документе. Например, изображениями, полученными после обработки чипа каждым другим типом нуклеотида, можно манипулировать таким же способом, как проиллюстрировано в данном документе примерами для изображений, полученных от разных каналов выявления для способов секвенирования, основанных на обратимом терминаторе.

В другом показательном типе SBS циклическое секвенирование осуществляется поэтапным добавлением нуклеотидов с обратимым терминатором, содержащим, например, расщепляемую или фотообесцвечиваемую метку-краситель, как описано, например, в WO 04/018497 и патенте США №7057026, раскрытия которых включаются в данный документ посредством ссылки. Данный подход выводится на рынок Solexa (теперь Illumina, Inc.) и также описывается в WO 91/06678 и WO 07/123744, каждая из которых включается в данный документ посредством ссылки. Доступность флуоресцентно меченых терминаторов, в которых и терминация может быть обращена, и флуоресцентная метка расщеплена, облегчает эффективное циклическое секвенирование на основе обратимой терминации (CRT). Полимеразы также могут быть подвергнуты соинженении для эффективного включения и достройки от этих модифицированных нуклеотидов.

Предпочтительно в воплощениях секвенирования на основе обратимого терминатора метки по существу не ингибируют достройку при условиях реакции SBS. Однако выявляемые метки могут быть удаляемыми, например, посредством расщепления или деградации. Изображения могут фиксироваться после включения меток в упорядоченные элементы с нуклеиновыми кислотами. В конкретных воплощениях каждый цикл включает одновременную доставку четырех разных типов нуклеотидов на чип, и каждый тип нуклеотида имеет спектрально отличную метку. Затем можно получить четыре изображения, причем в каждом используется выявляющий канал, который является селективным для одной из четырех разных меток. В качестве альтернативы, разные типы нуклеотидов могут быть добавлены последовательно, и изображение чипа может быть получено между каждой стадией добавления. В таких воплощениях каждое изображение будет показывать элементы с нуклеиновыми кислотами, которые включили нуклеотиды конкретного типа. Разные элементы будут присутствовать или отсутствовать на разных изображениях из-за разного содержания последовательности каждого элемента. Однако относительное положение данных элементов будет оставаться на изображениях неизменным. Изображения, полученные от таких способов SBS на основе обратимого терминатора, можно сохранять, обрабатывать и анализировать, как изложено в данном документе. После стадии фиксации изображения метки можно удалять, а фрагменты обратимого терминатора можно удалять для последующих циклов присоединения и выявления нуклеотидов. Удаление меток после их выявления в конкретном цикле и перед последующим циклом может давать преимущество уменьшения фонового сигнала и перекрывания между циклами. Примеры полезных меток и способов удаления излагаются ниже.

В некоторых воплощениях может использоваться выявление четырех разных нуклеотидов с использованием меньше, чем четырех разных меток. Например, SBS можно осуществлять с использованием способов и систем, описанных во включенных материалах публикации США №2013/0079232. В качестве первого примера пару типов нуклеотидов можно выявлять при той же самой длине волны, но различать на основе различия в интенсивности для одного члена пары по сравнению с другим или на основе изменения одного члена пары (например, посредством химической модификации, фотохимической модификации или физической модификации), которое вызывает появление или исчезновение различимого сигнала по сравнению с сигналом, выявляемым для другого члена пары. В качестве второго примера, три из четырех разных типов нуклеотидов можно выявлять при конкретных условиях, тогда как четвертый тип нуклеотида не имеет метки, которая выявляется при данных условиях, или она минимально выявляется при данных условиях (например, минимальное выявление из-за фоновой флуоресценции и т.д.). Включение первых трех типов нуклеотидов в нуклеиновую кислоту может определяться на основе присутствия их соответствующих сигналов, а включение четвертого типа нуклеотида в нуклеиновую кислоту может определяться на основе отсутствия или минимального выявления какого-либо сигнала. В качестве третьего примера один тип нуклеотида может включать метку(ки), которая(рые) выявляется(ются) в двух разных каналах, тогда как другие типы нуклеотидов выявляются в не более чем одном из каналов. Три вышеупомянутые типичные конфигурации не считаются взаимоисключающими и могут использоваться в разных комбинациях. Типичное воплощение, которое объединяет все три примера, представляет собой способ SBS на основе флуоресценции, в котором используется первый тип нуклеотида, который выявляется в первом канале (например, дАТФ, имеющий метку, которая выявляется в первом канале при возбуждении посредством первой длины волны возбуждения), второй тип нуклеотида, который выявляется во втором канале (например, дЦТФ, имеющий метку, которая выявляется во втором канале при возбуждении посредством второй длины волны возбуждения), третий тип нуклеотида, который выявляется как в первом, так и во втором канале (например, дТТФ, имеющий по меньшей мере одну метку, которая выявляется в обоих каналах при возбуждении посредством первой и/или второй длины волны возбуждения), и четвертый тип нуклеотида, который не имеет метки, то есть не выявляется или минимально выявляется в любом из каналов (например, дГТФ, не имеющий метки).

Кроме того, как описано во включенных материалах публикации США №2013/0079232, данные секвенирования могут быть получены с использованием одного канала. В таких так называемых подходах секвенирования с одним красителем первый тип нуклеотида является меченым, но метка удаляется после получения первого изображения, и второй тип нуклеотида метится только после получения первого изображения. Третий тип нуклеотида сохраняет его метку как на первом, так и на втором изображении, а четвертый тип нуклеотида остается немеченым на обоих изображениях.

В некоторых воплощениях может использоваться секвенирование посредством методик лигирования. В таких методиках используется ДНК-лигаза для включения олигонуклеотидов и идентификации включения таких олигонуклеотидов. Данные олигонуклеотиды типично имеют разные метки, которые коррелируют с идентичностью конкретного нуклеотида в последовательности, с которой гибридизуется данный олигонуклеотид. Как и с другими способами SBS, изображения могут быть получены после обработки чипа элементов с нуклеиновыми кислотами с использованием меченых реагентов для секвенирования. На каждом изображении будут показаны элементы с нуклеиновыми кислотами, которые включили метки конкретного типа. Разные элементы будут присутствовать или отсутствовать на разных изображениях из-за разного содержания последовательности каждого элемента, но относительное положение данных элементов останется неизменным на изображениях. Изображения, полученные от способов секвенирования на основе лигирования можно хранить, обрабатывать и анализировать, как изложено в данном документе. Типичные системы и способы SBS, которые можно использовать со способами и системами, описанными в данном документе, описываются в патентах США №6969488, 6172218 и 6306597, раскрытия которых включаются в данный документ посредством ссылки во всей их полноте.

В некоторых воплощениях может использоваться секвенирование на основе нанопор (Deamer, D.W. & Akeson, М. "Nanopores and nucleic acids: prospects for ultrarapid sequencing." Trends Biotechnol. 18, 147-151 (2000); Deamer, D. and D. Branton, "Characterization of nucleic acids by nanopore analysis", Асе, Chem, Res. 35:817-825 (2002); Li, J., M. Gershow, D. Stein, E. Brandin, and J.A. Golovchenko, "DNA molecules and configurations in a solid-state nanopore microscope" Nat. Mater. 2:611-615 (2003), раскрытия которых включаются в данный документ посредством ссылки во всей их полноте). В таких воплощениях целевая нуклеиновая кислота проходит через нанопору. Нанопора может представлять собой синтетическую пору или белок биологической мембраны, такой как а-хемолизин. По мере прохождения целевой нуклеиновой кислоты через нанопору каждая пара оснований может быть идентифицирована посредством измерения колебаний в электрической проводимости данной поры (патент США №7001792; Soni, G.V. & Meller, "A. Progress toward ultrafast DNA sequencing using solid-state nanopores." Clin. Chem. 53, 1996-2001 (2007); Healy, K. "Nanopore-based single-molecule DNA analysis." Nanomed. 2, 459-481 (2007); Cockroft, S.L, Chu, J., Amorin, M. & Ghadiri, M.R. "A single-molecule nanopore device detects DNA polymerase activity with single-nucleotide resolution." J. Am. Chem. Soc. 130, 818-820 (2008), раскрытия которых включаются в данный документ посредством ссылки во всей их полноте). Данные, полученные от секвенирования на основе нанопор, можно сохранять, обрабатывать и анализировать, как изложено в данном документе. В частности, данные можно обрабатывать в виде изображения согласно типичной обработке оптических изображений и других изображений, как изложено в данном документе.

Некоторые другие воплощения способа секвенирования включают применение 3' блокированного нуклеотида, описанного в данном документе, в методике секвенирования на основе наношарика, такой как методики, описанные в патенте США №9222132, раскрытие которого включается посредством ссылки. Посредством способа амплификации по типу катящегося кольца (RCA) можно получать большое число дискретных наношариков ДНК. Смесь наношариков затем распределяется на структурированной поверхности предментного стекла, содержащей элементы, которые обеспечивают ассоциацию одиночного наношарика с каждым положением. При получении наношариков ДНК ДНК фрагментируется и лигируется с первой из четырех адапторных последовательностей. Матрица амплифицируется, циркуляризируется и расщепляется эндонуклеазой типа II. Добавляют второй набор адапторов, с последующей амплификацией, циркуляризацией и расщеплением. Данный способ повторяется для остальных двух адапторов. Конечный продукт представляет собой кольцевую матрицу с четырьмя адапторами, причем каждый разделен последовательностью матрицы. Молекулы библиотеки подвергаются стадии амплификации по типу катящегося кольца, генерируя большую массу конкатемеров, именуемых наношариками ДНК, которые затем наносятся на проточную ячейку. Goodwin et al., "Coming of age: ten years of next-generation sequencing technologies," Nat Rev Genet. 2016; 17(6):333-51.

В некоторых воплощениях могут использоваться способы, включающие мониторинг активности ДНК-полимеразы в реальном времени. Включения нуклеотидов можно выявлять посредством взаимодействий резонансного переноса энергии флуоресценции (FRET) между полимеразой, несущей флуорофор, и нуклеотидами, меченными у-фосфатом, как описано, например, в патентах США №7329492 и 7211414, которые оба включаются в данный документ посредством ссылки, или включения нуклеотидов можно выявлять с использованием волноводов с нулевой модой, как описано, например, в патенте США №7315019, который включается в данный документ посредством ссылки, и с использованием флуоресцентных аналогов нуклеотидов и модифицированных полимераз, как описывается, например, в патенте США №7405281 и публикации США №2008/0108082, которые оба включаются в данный документ посредством ссылки. Освещение может ограничиваться объемом в масштабе зептолитров вокруг связанной с поверхностью полимеразы таким образом, что включение флуоресцентно меченых нуклеотидов можно наблюдать с малым фоном (Levene, М.J. et al. "Zero-mode waveguides for single-molecule analysis at high concentrations." Science 299, 682-686 (2003); Lundquist, P.M. et al. "Parallel confocal detection of single molecules in real time." Opt. Lett. 33, 1026-1028 (2008); Korlach, J. et al. "Selective aluminum passivation for targeted immobilization of single DNA polymerase molecules in zero-mode waveguide nano structures." Proc. Natl. Acad. Sci. USA 105, 1176-1181 (2008), раскрытия которых включаются в данный документ посредством ссылки во всей их полноте). Изображения, полученные от таких способов, можно сохранять, обрабатывать и анализировать, как изложено в данном документе.

Некоторые воплощения SBS включают выявление протона, высвобожденного при включении нуклеотида в продукт достройки. Например, в секвенировании на основе выявления высвобожденных протонов могут использоваться электрический детектор и ассоциированные методики, которые имеются в продаже у Ion Torrent (Guilford, СТ, подразделение Life Technologies), или способы и системы секвенирования, описанные в публикациях США №2009/0026082; 2009/0127589; 2010/0137143 и 2010/0282617, которые все включаются в данный документ посредством ссылки. Способы, изложенные в данном документе для амплификации целевых нуклеиновых кислот с использованием кинетического исключения, могут быть легко применены к субстратам, используемым для выявления протонов. Более конкретно, способы, изложенные в данном документе, можно использовать для получения клональных популяций ампиконов, которые используются для выявления протонов.

Приведенные выше способы SBS можно преимущественно осуществлять в мультиплексных форматах таким образом, что манипуляции с многими разными целевыми нуклеиновыми кислотами осуществляются одновременно. В конкретных воплощениях разные целевые нуклеиновые кислоты можно обрабатывать в общем реакционном сосуде или на поверхности конкретного субстрата. Это обеспечивает удобную доставку реагентов для секвенирования, удаление непрореагировавших реагентов и выявление событий включения мультиплексным способом. В воплощениях с использованием связанных с поверхностью целевых нуклеиновых кислот целевые нуклеиновые кислоты могут находиться в формате чипа. В формате чипа целевые нуклеиновые кислоты типично могут связываться с поверхностью пространственно различимым способом. Целевые нуклеиновые кислоты могут связываться посредством прямого ковалентного присоединения, присоединения к шарику или другой частице, или связывания с полимеразой или другой молекулой, которая присоединяется к поверхности. Данный чип может включать одну копию целевой нуклеиновой кислоты в каждом сайте (также именуемом элементом) или много копий, имеющих ту же самую последовательность, могут присутствовать в каждом сайте или элементе. Многие копии могут продуцироваться такими способами амплификации, как мостиковая амплификация или эмульсионная ПЦР (полимеразная цепная реакция), как описано с дополнительными подробностями ниже.

В способах, изложенных в данном документе, могут использоваться чипы, имеющие элементы в любой из целого ряда плотностей, включающих, например, по меньшей мере примерно 10 элементов/см2, 100 элементов/см2, 500 элементов/см2, 1000 элементов/см2, 5000 элементов/см2, 10000 элементов/см2, 50000 элементов/см2, 100000 элементов/см2, 1000000 элементов/см2, 5000000 элементов/см2 или больше.

Преимуществом способов, изложенных в данном документе, является то, что они обеспечивают быстрое и эффективное параллельное выявление большого количества целевой нуклеиновой кислоты. Соответственно, согласно настоящему раскрытию предложены интегрированные системы, способные получать и выявлять нуклеиновые кислоты с использованием методик, известных в данной области, такие как системы, проиллюстрированные примерами выше. Таким образом, интегрированная система по настоящему раскрытию может включать жидкостные компоненты, способные доставлять амплификационные реагенты и/или реагенты для секвенирования к одному или более чем одному иммобилизованному фрагменту ДНК, систему, содержащую такие компоненты, как насосы, клапаны, резервуары, жидкостные линии и тому подобное. В интегрированной системе для выявления целевых нуклеиновых кислот может быть сконфигурирована и/или использована проточная ячейка. Типичные проточные ячейки описываются, например, в публикации США №2010/0111768 и публикации США с серийным номером 13/273666, каждая из которых включается в данный документ посредством ссылки. Как проиллюстрировано примерами для проточных ячеек, для способа амплификации и для способа выявления можно использовать один или более чем один жидкостный компонент интегрированной системы. Беря в качестве примера воплощение секвенирования нуклеиновой кислоты, один или более чем один жидкостный компонент интегрированной системы можно использовать для способа амплификации, изложенного в данном документе, и для доставки реагентов для секвенирования в способе секвенирования, таком как способы, проиллюстрированные примерами выше. В качестве альтернативы, интегрированная система может включать отдельные жидкостные системы для осуществления способов амплификации и для осуществления способов выявления. Примеры интегрированных систем секвенирования, которые способны создавать амплифицированные нуклеиновые кислоты и также определять последовательность данных нуклеиновых кислот, включают, без ограничения, платформу MiSeq™ (Illumina, Inc., San Diego, CA) и устройства, описанные в публикации США с серийным №13/273666, которые включаются в данный документ посредством ссылки.

Чипы, в которых полинуклеотиды были непосредственно присоединены к подложкам на основе диоксида кремния, представляют собой чипы, например, раскрытые в WO 00/06770 (включенной в данный документ посредством ссылки), где полинуклеотиды иммобилизуются на стеклянной подложке посредством реакции между боковой эпоксидной группой на стекле со внутренней аминогруппой на полинуклеотиде. Кроме того, полинуклеотиды могут быть присоединены к твердой подложке посредством реакции нуклеофила на основе серы с твердой подложкой, например, как описано в WO 2005/047301 (включена в данный документ посредством ссылки). Еще одним другим примером матричных полинуклеотидов на твердой подложке является случай, где матричные полинуклеотиды присоединяются к гидрогелевой подложке на подложках на основе диоксида кремния или другого твердого вещества, например, как описано в WO 00/31148, WO 01/01143, WO 02/12566, WO 03/014392, патенте США №6465178 и WO 00/53812, каждый из которых включается в данный документ посредством ссылки.

Конкретная поверхность, на которой могут быть иммобилизованы матричные полинуклеотиды, представляет собой полиакриламидный гидрогель. Полиакриламидные гидрогели описываются в ссылках, процитированных выше, и в WO 2005/065814, которая включается в данный документ посредством ссылки. Конкретные гидрогели, которые можно использовать, включают гидрогели, описанные в WO 2005/065814 и публикации США №2014/0079923. В одном воплощении гидрогель представляет собой PAZAM (поли(N-(5-азидоацетамидилпентил)акриламид-соакриламид)).

Молекулы ДНК-матрицы могут быть присоединены к шарикам или микрочастицам, например, как описано в патенте США №6172218 (который включен в данный документ посредством ссылки). Присоединение к шарикам или микрочастицам может быть полезным для приложений секвенирования. Могут быть получены библиотеки шариков, где каждый шарик содержит разные последовательности ДНК. Типичные библиотеки и способы их создания описываются в Nature, 437, 376-380 (2005); Science, 309, 5741, 1728-1732 (2005), каждая из которых включается в данный документ посредством ссылки. Секвенирование чипов таких шариков с использованием нуклеотидов, изложенных в данном документе, находится в пределах объема данного раскрытия.

Матрицы, которые подлежат секвенированию, могут образовать часть «чипа» на твердой подложке, причем в данном случае чип может принимать любую удобную форму. Таким образом, способ по данному раскрытию применим ко всем типам высокоплотных чипов, включая одномолекулярные чипы, кластерные чипы и шариковые чипы. Меченые нуклеотиды по настоящему раскрытию можно использовать для секвенирования матриц по существу на любом типе чипа, включая чипы, образованные иммобилизацией молекул нуклеиновых кислот на твердой подложке, но не ограничиваясь ими.

Однако меченые нуклеотиды по данному раскрытию являются особенно полезными в контексте секвенирования кластерных чипов. В кластерных чипах отличные области на чипе (часто именуемые сайты или элементы) содержат многие молекулы полинуклеотида-матрицы. В общем, данные многие молекулы полинуклеотидов не являются индивидуально разрешимыми посредством оптических средств и, вместо этого, выявляются как единое целое. В зависимости от того, как образуется чип, каждый сайт на чипе может содержать многие копии одной индивидуальной молекулы полинуклеотида (например, данный сайт является гомогенным в отношении конкретного вида одно- или двухцепочечной нуклеиновой кислоты) или даже многие копии малого числа разных молекул полинуклеотидов (например, многие копии двух разных видов нуклеиновых кислот). Кластерные чипы молекул нуклеиновой кислоты могут быть получены с использованием общеизвестных в данной области методик. В качестве примера, WO 98/44151 и WO 00/18957, каждая из которых включается в данный документ, описывает способы амплификации нуклеиновых кислот, где и матрица, и продукты амплификации остаются иммобилизованными на твердой подложке для того, чтобы образовать чипы, состоящие из кластеров или «колоний» иммобилизованных молекул нуклеиновых кислот. Молекулы нуклеиновых кислот, присутствующие на кластерных чипах, полученных согласно данным способам, представляют собой подходящие матрицы для секвенирования с использованием нуклеотидов, меченных соединениями-красителями по данному раскрытию.

Меченые нуклеотиды по настоящему раскрытию также являются полезными в секвенировании матриц на одномолекулярных чипах. Термин «одномолекулярный чип» или «SMA» в том виде, в котором он используется в данном документе, относится к популяции молекул полинуклеотидов, распределенных (или выстроенных) над твердой подложкой, где расстояние любого индивидуального полинуклеотида от всех других в популяции является таким, что возможно индивидуально разрешать индивидуальные молекулы полинуклеотидов. Целевые молекулы нуклеиновых кислот, иммобилизованных на поверхности твердой подложки, в некоторых воплощениях могут быть, таким образом, способны к разрешению оптическими средствами. Это означает то, что один или более чем один отличный сигнал, каждый представляющий один полинуклеотид, будет появляться в пределах разрешаемой области конкретного используемого визуализирующего устройства.

Может достигаться выявление одиночных молекул, где расстояние между смежными молекулами полинуклеотидов на чипе составляет по меньшей мере 100 нм, более конкретно по меньшей мере 250 нм, еще более конкретно по меньшей мере 300 нм, даже более конкретно по меньшей мере 350 нм. Таким образом, каждая молекула является индивидуально разрешимой и выявляемой в виде флуоресцентной точки одной молекулы, и флуоресценция от указанной флуоресцентной точки одной молекулы также демонстрирует одноэтапное фотообесцвечивание.

Термины «индивидуально разрешимый» и «индивидуальное разрешение» используются в данном документе для точного определения того, что, при визуализации, возможно различение одной молекулы на чипе от ее соседних молекул. Разделение между индивидуальными молекулами на чипе будет определяться, отчасти, конкретной методикой, используемой для разрешения индивидуальных молекул. Общие характеристики одномолекулярных чипов будут понятными посредством ссылки на опубликованные заявки WO 00/06770 и WO 01/57248, каждая из которых включается в данный документ посредством ссылки. Хотя одним применением нуклеотидов по данному раскрытию является применение в реакциях секвенирования посредством синтеза, польза данных нуклеотидов не ограничивается такими способами. На самом деле, данные нуклеотиды можно с пользой использовать в любой методологии секвенирования, которая требует выявления флуоресцентных меток, присоединенных к нуклеотидам, включенным в полинуклеотид.

В частности, меченые нуклеотиды по данному раскрытию можно использовать в протоколах автоматического флуоресцентного секвенирования, в частности, циклического секвенирования с флуоресцентным красителем-терминатором, на основе способа секвенирования с обрывом цепи Сэнджера и сотрудников. В таких способах обычно используются ферменты и циклическое секвенирование для включения флуоресцентно меченых дидезоксинуклеотидов в реакцию секвенирования с достройкой праймера. Так называемые способы секвенирования по Сэнджеру и родственные протоколы (сэнджеровского типа) используют рандомизированный обрыв цепи с мечеными дидезоксинуклеоидами.

Таким образом, настоящее раскрытие также охватывает меченые нуклеотиды, которые представляют собой дидезоксинуклеоиды, не имеющие гидроксильных групп в обоих положениях: 3' и 2', причем такие дидезоксинуклеоиды подходят для применения в способах секвенирования сэнджеровского типа и тому подобных.

Будет понятно то, что меченые нуклеотиды по настоящему раскрытию, включающие 3' блокирующие группы, также могут быть полезными с способах по Сэнджеру и родственных протоколах, так как такой же эффект, достигаемый посредством применения дидезоксинуклеотидов, может достигаться с использованием нуклеотидов, имеющих 3’-ОН блокирующие группы: и те, и другие предотвращают включение последующих нуклеотидов. Когда нуклеотиды согласно настоящему раскрытию, имеющие 3' блокирующую группу, следует использовать в способах секвенирования сенджеровского типа, будет очевидно то, что соединения-красители или выявляемые метки, присоединенные к данным нуклеотидам, не должны присоединяться через расщепляемые линкеры, так как в каждом случае, где включается меченый нуклеотид по данному раскрытию, далее не должны включаться нуклеотиды, и, таким образом, метка не должна удаляться от нуклеотида.

В любых воплощениях способов, описанных в данном документе, нуклеотид, используемый в приложении секвенирования, представляют собой 3' блокированный нуклеотид, описанный в данном документе, например, нуклеотид Формулы (I), (Ia) или (II). В любых воплощениях 3' блокированный нуклеотид представляет собой нуклеотидтрифосфат.

ПРИМЕРЫ

Дополнительные воплощения раскрываются с дополнительными подробностями с следующих примерах, которые ни в коей мере не предназначены для того, чтобы ограничивать объем формулы изобретения.

Пример 1. Получение нуклеозидов, блокированных 3’-ацеталем

В данном примере получали разные нуклеозиды Т, защищенные 3’-ацеталем, согласно Схеме 2.

Получение T1: в высушенную в печи, продутую азотом 100 мл колбу добавляли 5-йод-2'-дезоксиуридин (5,0 г, 14,12 ммоль). Его совместно выпаривали 3 раза с 30 мл пиридина, затем помещали под азот. Добавляли безводный пиридин (25 мл), и данную реакционную смесь перемешивали при комнатной температуре, пока не получался гомогенный раствор (~15 минут). Данную смесь охлаждали до 0°С в бане со льдом-водой, и медленно добавляли трет-бутилдифенилсилил хлорид (4,04 мл, 15,5 ммоль) по каплям с энергичным перемешиванием (~1 часа). Данную реакционную смесь поддерживали при 0°С в течение 8 часов, пока весь SM не потреблялся при определении посредством ТСХ (тонкослойная хроматография). Добавляли насыщенный водный раствор хлорида аммония (~15 мл), и давали данной реакционной смеси нагреться до комнатной температуры. Данную смесь разбавляли этилацетатом (100 мл) и промывали насыщенным водным хлоридом аммония (200 мл). Органический слой отделяли, и водный слой экстрагировали этилацетатом (4×50 мл). Органические слои объединяли, сушили (MgSO4) и концентрировали в вакууме с получением ~8 г прозрачного желтого масла после удаления остаточного растворителя под высоким вакуумом. Неочищенный продукт Т1 очищали колоночной флэш-хроматографией на диоксиде кремния в виде белого кристаллического вещества. Выход составляет 6,94 г (83%). ЖХ-МС (жидкостная хроматография-масс-спектрометрия) (элетрораспылительная, в режиме отрицательно заряженных ионов) 591,08 [М-Н].

Получение T2: в высушенную в печи, продутую азотом коричневую 500 мл трехгорлую колбу добавляли Т1 (6,23 г, 10,5 ммоль), йодид меди(I) (200 мг, 1,05 ммоль) и бис(трифенилфосфин)палладия(II) дихлорид (369 мг, 0,526 ммоль) под азотом. Данную колбу защищали от света, и добавляли безводный дегазированный DMF (диметилформамид) (200 мл). К данному раствору добавляли 2,2,2-трифтор-N-проп-2-инил-ацетамид (4,74 г, 31,6 ммоль), с последующим добавлением дегазированного триэтиламина (2,92 мл, 21,0 ммоль). Данную реакционную смесь перемешивали при комнатной температуре под азотом в течение 6 часов до того момента, когда не наблюдали дополнительного исходного вещества посредством анализа ТСХ. Летучие вещества удаляли в вакууме (~15 мин), a DMF удаляли под сильным вакуумом (~1 часа) до коричневого осадка. Его растворяли в этилацетате (200 мл) и экстрагировали 0,1 М EDTA (этилендиаминтетрауксусная кислота) в воде (2×200 мл). Водные слои объединяли и дополнительно экстрагировали этилацетатом (200 мл). Органические фазы объединяли, сушили (MgSO4), летучие вещества удаляли в вакууме (~30 мин) и дополнительно сушили под сильным вакуумом (~1 часа) с получением примерно 8 г неочищенного коричневого/желтого масла. Данную смесь очищали колоночной флэш-хроматографией на силикагеле в виде беловатого твердого вещества. Выход: 6,0 г (85%). ЖХ-МС (электрораспылительная, в режиме отрицательно заряженных ионов) 614,19 [М-Н].

Получение Т3: в высушенную в печи, продутую азотом 100 мл колбу, содержащую исходный нуклеозид T2 (2,0 г, 3,25 ммоль), под азотом добавляли одной порцией безводный DMSO (диметилсульфоксид) (6,9 мл, 97,5 ммоль) при комнатной температуре и перемешивали, пока не образовался гомогенный раствор. Добавляли по каплям уксусную кислоту (11,1 мл, 195 ммоль), с последующим добавлением по каплям уксусного ангидрида (15,1 мл, 162,09 ммоль) (~5 минут каждый). Данную смесь нагревали до 50°С и перемешивали до полного потребления исходного нуклеозида (~5 часов) при определении ТСХ (EtOAc/петролейный эфир 3:2). Данную реакционную смесь затем концентрировали до половины объема и охлаждали с использованием бани со льдом до приблизительно 0,5°С. Обработку начинали медленным добавлением холодного (~0,5°С) NaHCO3 (водн., насыщ.) (45 мл), и обеспечивали дальнейшее перемешивание до тех пор, пока больше не наблюдалось шипение (~15 мин). Данному раствору давали нагреться до комнатной температуры, затем водную фазу экстрагировали в EtOAc (3×100 мл). Объединенные органические слои сушили над MgSO4, фильтровали, и летучие вещества выпаривали при пониженном давлении и дополнительно посредством сильного вакуума. Неочищенный продукт Т3 очищали флэш-хроматографией на силикагеле в виде беловатого твердого вещества. Выход: 1,79 г (82%). ЖХ-МС (электрораспылительная, в режиме отрицательно заряженных ионов) 674,20 [М-Н]-.

Получение Т4: в раствор исходного нуклеозида Т3 (1,79 г, 2,649 ммоль) в безводном CH2Cl2 (50 мл) под N2 добавляли циклогексен (1,34 мл, 13,2 ммоль). Данную смесь охлаждали в бане со льдом до 0°С, и медленно добавляли по каплям дистиллированный сульфурилхлорид (322 мкл, 3,97 ммоль) (~20 мин) под N2. После перемешивания в течение 20 мин при данной температуре ТСХ (EtOAc:петролейный эфир - 3:2 (об./об.)) показала полное потребление исходного нуклеозида. Хлоридное промежуточное соединение затем гасили прямым добавлением по каплям свежеперегнанного соответствующего ненасыщенного спирта (5 экв.), как показано на Схеме 3. Образующийся раствор перемешивали при комнатной температуре в течение 2 часов, с последующим выпариванием летучих веществ при пониженном давлении. Маслянистый остаток распределяли между EtOAc:рассолом (3:2) (125 мл). Органический слой отделяли, и водный слой дополнительно экстрагировали в EtOAc (2×50 мл). Объединенные органические экстракты сушили над MgSO4, фильтровали и летучие вещества выпаривали при пониженном давлении. Маслянистый остаток распределяли между EtOAc:рассолом (3:2) (125 мл). Органический слой отделяли, и водный слой дополнительно экстрагировали в EtOAc (2×50 мл). Объединенные органические экстракты сушили над MgSO4, фильтровали и летучие вещества выпаривали при пониженном давлении. Неочищенные продукты Т4 очищали флэш-хроматографией на силикагеле с получением конечных продуктов в виде желтого масла. Выход: 1,20 г (69%) для АОМ; 1,29 г (71%) для PrOM; 1,34 г (71%) для DPrOM.

3’-АОМ: желтое масло. ЖХ-МС (электрораспылительная, в режиме отрицательно заряженных ионов) [М-Н] 684,24.

3’-PrOM: желтое масло. ЖХ-МС (электрораспылительная, в режиме отрицательно заряженных ионов) [М-Н] 682,22.

3’-DprOM: желтое масло. ЖХ-МС (электрораспылительная, в режиме отрицательно заряженных ионов) [М-Н] 710,25.

Получение Т5: в исходное вещество Т4 (1,04 г, 1,516 ммоль) в 50 мл круглодонной колбе под азотом добавляли безводный THF (9 мл) при комнатной температуре. Затем добавляли по каплям TBAF (1,0 М в THF, 1,7 мл, 1,70 ммоль), и данный раствор перемешивали, пока не поглощалось все SM, при определении посредством ТСХ (~2 часа). Данный раствор становился оранжевым по ходу реакции. Летучие вещества удаляли под вакуумом с получением оранжевого остатка, который растворяли в EtOAc (100 мл) и разделяли с NaHCO3 (насыщ. водн.) (60 мл). Два слоя разделяли, и водный слой экстрагировали EtOAc (60 мл). Органические слои объединяли, сушили (MgSO4), фильтровали и упаривали с получением неочищенного продукта в виде желтого масла. Данный неочищенный продукт очищали флэш-хроматографией на силикагеле с получением прозрачного желтого масла. Выход: 637 мг (94%) для АОМ; 526 мг (78%) для PrOM; 617 мг (86%) для DPrOM.

3’-АОМ: прозрачное желтое масло. ЖХ-МС (электрораспылительная, в режиме отрицательно заряженных ионов): [М-Н] 446,12.

3’-PrOM: прозрачное желтое масло (526 мг, 78%). ЖХ-МС (электрораспылительная, в режиме отрицательно заряженных ионов): [М-Н] 444,10.

3’-DPrOM: прозрачное желтое масло (617 мг, 86%). ЖХ-МС (электрораспылительная, в режиме отрицательно заряженных ионов): [М-Н] 472,13.

Кроме того, получали два дополнительных 3' блокированных нуклеозида Т (3’-еАОМ Т и 3’-iAOM Т), следуя аналогичному способу, как описано выше. 3’-iAOM Т: ЖХ-МС (ЭР): (отрицательный ион) m/z 325,5 (М-Н+), (положительный ион) 327,3 (М+Н+). 3’-еАОМ Т: ЖХ-МС (ЭР): (положительный ион) m/z 341,3 (М+1Н+).

Пример 2. Анализ стабильности 3’-ОН блокирующей группы

В данном примере анализы стабильности для нуклеотида 5'-mP 3’-АОМ проводили параллельно в растворе буфера для включения со стандартом - нуклеотидом 5'-mP 3’-О-азидометил Т.

Приготовление бубэерного раствора

1 мл 0,1 мМ каждого 5'-монофосфат 3’-защищенного нуклеотида Т в растворе 100 мМ этаноламинного буфера (рН 9,8), 100 мМ NaCl и 2,5 мМ EDTA инкубировали при 65°С в нагревательном блоке в течение 2 недель. В установленные моменты времени отбирали 40 мкл аликвоты и анализировали ВЭЖХ (высокоэффективная жидкостная хроматография) для определения процентной доли остающегося блокированного нуклеотида и окончательного образования неблокированного нуклеотида.

Результаты анализа стабильности, относящиеся к 5'-монофосфат 3'-защищенным нуклеотидам с ацетальными защитными группами АОМ, PrOM, DPrOM и стандартной азидометильной блокирующей группой, иллюстрируются на ФИГ. 1. Наблюдали то, что 3' блокированный нуклеотид монофосфат с блокирующими группами АОМ, PrOM и DPrOM давал более чем 30-50-кратное улучшение в уменьшении скорости деблокирования в растворе. Данный эксперимент имитирует то, как соответствующие полностью функционализированные нуклеотиды (ffN) вели бы себя при хранении в смеси для включения на картридже устройства для секвенирования. Улучшение стабильности, обеспечиваемое данными ацетальными защитными группами, также приводило бы к меньшему показателю предфазирования в циклах секвенирования. Наконец, оно улучшает срок хранения реагента - смеси для включения.

Пример 3. Анализ деблокирования 3’-АОМ

В данном примере анализы деблокирования для 5'-mP 3’-АОМ Т и стандартного нуклеотида 5'-mP 3’-О-азидометильного Т проводили индивидуально в растворе, уникальном для каждой блокирующей группы. Создавали условия для имитации стандартного деблокирующего реагента Illumina настолько близко, насколько это возможно, и следовали одинаковой методологии. Поддерживали одинаковые концентрации активного деблокирующего реагента, буфера и нуклеозида во всех анализах, но идентичность каждого компонента была уникальной. При данном способе наблюдаемое различие в скорости между индивидуальными химиями деблокирования не может быть обусловлено различиями в концентрации препарата.

Стандартные условия деблокирования азидометила

Нуклеотид: 5'-монофосфат 3’-О-азидометил Т. Активный деблокирующий реагент: трис(гидроксипропил)фосфин (ТНР) (1 М в 18 мΩ воде). (Возможная) добавка: аскорбат натрия (0,1 мМ в 18 мΩ воде), конечная концентрация - 1 мМ. Буфер: этаноламин, рН 9,8 (2 М в 18 мΩ воде). Гасящий реагент: H2O2.

Условия деблокирования А ОМ

Нуклеотид: 5'-монофосфат 3’-О-азидометил Т. Маточный раствор 3’-АОМ Т разводили до 0,1 мМ в 100 мМ этаноламинном буфере (рН 9,8) в стеклянном сосуде под азотом. Маточный раствор добавки - аскорбата натрия - добавляли до конечной концентрации 0,1 мМ, и данный раствор перемешивали 5 минут. Для начала данного анализа добавляли в перемешиваемый раствор при комнатной температуре деблокирующие реагенты (Pd/THP - 1/5; аскорбат натрия; этаноламин) до конечной концентрации 1 мМ ТНР. В определенные моменты времени отбирали 40 мкл аликвоты и гасили 6 мкл смеси 1:3 EDTA/H2O2 (0,025:0,075 М). Проводили анализ ВЭЖХ посредством измерения площади пика исходного нуклеозида, пика 3’-ОН и любых других пиков нуклеотидов, которые появляются на хроматограмме ВЭЖХ. Не наблюдали других побочных продуктов на основе нуклеотидов.

Сравнительный результат показан на ФИГ. 2А. Наблюдали то, что АОМ обеспечивал 10-кратное улучшение скорости в показателях скорости деблокирования в растворе по сравнению со стандартной азидометильной блокирующей группой. Данный эксперимент служит цели имитации того, как соответствующие ffN вели бы себя при секвенировании во время стадии деблокирования. Существенное улучшение скорости деблокирования обеспечивало бы деблокирующую стадию в виде промывки вместо 10-20-секундного времени инкубации, типично используемого в определенных платформах секвенирования от Illumina. В результате скорость деблокирования будет иметь значительное влияние на время цикла секвенирования посредством синтеза (SBS).

Аналогичные экспериментальные условия использовали для анализа деблокирования для 3’-еАОМ Т и 3’-iAOM Т. В качестве единственного изменения отношение Pd катализатора к субстрату уменьшали до 5:1 для того, чтобы наблюдать менее отчетливые различия в скорости деблокирования. 3’-АОМ Т использовали в качестве контроля, и результаты иллюстрируются на ФИГ. 2В. Данные результаты показали то, что скорость деблокирования еАОМ и iAOM в 2-3 раза медленнее, чем АОМ при данной конкретной концентрации деблокирующего реагента с Pd катализатором. Можно ожидать то, что данное различие в скорости деблокирования среди замещенной версии и незамещенной версии блокирующих групп АОМ было бы меньше при более высоком отношении Pd катализатора к субстрату.

Пример 4. Оптимизация палладиевой расщепляющей смеси для секвенирования

Pd/THP катализатор, используемый в реакции деблокирования, описанной в Примере 2, является очень воздухочувствительным. При воздействии воздуха он демонстрировал существенную потерю активности. В данном примере разрабатывали анализ окислительного стресса для оценки воздухочувствительности разных препаратов палладиевой расщепляющей смеси.

0,5 мл Pd расщепляющей смеси аликвотировали в 5 мл стеклянный флакон и оставляли открытой для воздуха в течение 3 часов при комнатной температуре. Остаточную активность окисленной расщепляющей смеси оценивали посредством измерения расщепления 3’-АОМ следующим образом. Маточный раствор 3’-АОМ Т разводили до 0,1 мМ в 100 мМ буфере для расщепляющей смеси. Добавляли маточный раствор аскорбата натрия до конечной концентрации 1 мМ, с последующей окисленной расщепляющей смесью до конечного разведения 1/20. Через 1 час 40 мкл раствора немедленно гасили 10 мкл смеси 1:1 EDTA/H202 (0,25:0,25 М) и анализировали посредством ВЭЖХ. В данном эксперименте подвергали скринингу разные буферные реагенты, включая: первичные амины (такие как этаноламин, Tris и глицин); третичные амины (такие как 2-диметиламинометанол (DMEA), 2-диэтиламинометанол (DEEA), N,N,N',N'-тетраметилэтилендиамин (TEMED) или N,N,N',N'-тетраэтилэтилендиамин (TEEDA)); и разные неорганические соли (такие как боратная соль, карбонатная соль, фосфатная соль). Наблюдали то, что неорганические буферные реагенты (такие как борат натрия, карбонат натрия, фосфат натрия) обеспечивали наилучшую стабильность на воздухе, и палладиевый комплекс сохранял высокий % активностей. Кроме того, третичные амины также существенно улучшали стабильность Pd расщепляющей смеси по сравнению с первичными аминами.

На основе этих данных получали две палладиевые расщепляющие смеси. В первом примере маточный раствор 250 мМ водн. боратного буфера (рН 9,6, 20 мл) разводили водой (14 мл) перед добавлением маточного раствора ТНР (1 М в 100 мМ Tris, рН 9, 5 мл, 5,0 ммоль) и димера аллилпалладия (II) хлорида (183 мг, 0,5 ммоль). Данную смесь энергично перемешивали в течение нескольких минут при комнатной температуре перед добавлением 1 М водн. аскорбата натрия (0,5 мл, 0,5 ммоль), 5 М водн. NaCl (10 мл) и 10% об./об. Tween 20 (0,5 мл). Во втором примере маточный раствор 2 М водн. буфера DEEA (рН 9,6, 0,6 мл) разводили водой (7,6 мл) перед добавлением маточного раствора ТНР (1 М в 100 мМ Tris, рН 9, 1,2 мл, 1,2 ммоль) и твердого димера аллилпалладия (II) хлорида (43,9 мг, 0,12 ммоль). Данную смесь энергично перемешивали в течение нескольких минут при комнатной температуре перед добавлением 1 М водн. аскорбата натрия (0,12 мл, 0,12 ммоль), 5 М водн. NaCl (2,4 мл) и 10% об./об. Tween 20 (0,12 мл).

Пример 5. Получение полностью функционализированных нуклеотидов и применения для приложения секвенирования

В данном примере подробно описывается получение разных полностью функционализированных нуклеотидов (ffN) с 3’-АОМ блокирующей группой. Данные ffN также использовали в приложении секвенирования посредством синтеза на платформе Illumina MiniSeq®.

Синтез промежуточного соединения АОМ С2: нуклеозид С1 (0,5 г, 0,64 ммоль) растворяли в безводном DCM (12 мл) под N2, и данную смесь охлаждали до 0°С. Добавляли циклогексен (0,32 мл, 3,21 ммоль), с последующим добавлением по каплям SO2Cl2 (1,0 М в DCM, 1,27 мл, 1,27 ммоль). Добавляли дополнительный циклогексен (0,32 мл, 3,21 ммоль) перед быстрым переносом данной реакционной смеси на ротационный испаритель для удаления всех летучих веществ при пониженном давлении. Твердый остаток дополнительно сушили под сильным вакуумом в течение 10 мин перед растворением в безводном DCM (5 мл) под N2. Данную смесь охлаждали до 0°С, и добавляли по каплям ледяной аллиловый спирт (5 мл). Данную реакционную смесь перемешивали при 0°С в течение 2 ч перед гашением посредством добавления насыщ. водн. NaHCO3 (50 мл) и DCM (30 мл). Две фазы разделяли, и водный слой экстрагировали EtOAc (2×50 мл). Органические слои объединяли, сушили над MgSO4, фильтровали, и летучие вещества выпаривали при пониженном давлении. Неочищенный продукт очищали флэш-хроматографией на силикагеле с использованием EtOAc/петролейного эфира с получением АОМ С2 в виде белого твердого вещества (264 мг, выход 52%). ЖХ-МС (электрораспылительная, в режиме отрицательно заряженных ионов): [М-Н] 787, [M+Cl] 823.

Синтез промежуточного соединения АОМ С3: АОМ С2 (246 мг, 0,31 ммоль) растворяли в безводном THF (9,5 мл) под N2, и данную смесь охлаждали до 0°С. Добавляли уксусную кислоту (0,054 мл, 0,94 ммоль), с последующим добавлением по каплям TBAF (1,0 М в THF, 5% воды по массе, 0,99 мл, 0,94 ммоль). Данную реакционную смесь перемешивали при 0°С в течение 5 ч перед разведением EtOAc (20 мл) и затем выливали в 0,05 М HCl водн. (20 мл). Два слоя разделяли, и водный слой экстрагировали EtOAc (2×20 мл). Органические слои объединяли, сушили над MgSO4, фильтровали, и летучие вещества выпаривали при пониженном давлении. Неочищенный продукт очищали флэш-хроматографией на силикагеле с использованием DCM/EtOAc, с получением АОМ С3 в виде желтоватого твердого вещества (114 мг, выход 66%). ЖХ-МС (электрораспылительная, в режиме отрицательно заряженных ионов): [М-Н] 549, [М+H2O-Н] 567, [M+Cl] 585, (электрораспылительная, в режиме положительно заряженных ионов): [М+Н] 551, [М+H2O+Н] 569.

Синтез промежуточного соединения АОМ С4: АОМ С3 (0,114 г, 0,21 ммоль), свежеактивированные 4А молекулярные сита, протонную губку (0,066 г, 0,31 ммоль) и магнитную мешалку помещали под N2, и добавляли безводный триметилфосфат (1,0 мл). Данную реакционную смесь охлаждали при ~10°С, и добавляли по каплям свежеперегнанный POCl3 (23 мкл, 0,25 ммоль). Данную реакционную смесь перемешивали при ~10°С в течение 1 часа. Раствор пирофосфата в виде бис-три-н-бутиламмониевой соли (0,5 М в DMF, 1,7 мл, 0,85 ммоль) и безводного три-н-бутиламина (0,41 мл, 1,74 ммоль) предварительно смешивали и добавляли в ледяной раствор активированных нуклеозидов одной порцией. Данную смесь энергично перемешивали в течение 5 минут при комнатной температуре. Данную реакционную смесь выливали в отдельную колбу, содержащую энергично перемешиваемый водн. раствор 2 М ТЕАВ (~10 мл). Данную реакционную колбу промывали маленьким количеством H2O, и промывки добавляли в 2 М раствор ТЕАВ. Объединенную смесь затем перемешивали при комнатной температуре в течение 4 часов, после чего выпаривали растворитель при пониженном давлении. Остаток растворяли в водн. NH3 (35%, ~10 мл) и перемешивали при комнатной температуре в течение ночи. Данную реакционную смесь концентрировали под вакуумом и очищали флэш-хроматографией на DEAE-Sephadex. Продукт дополнительно очищали препаративной ВЭЖХ с получением чистого АОМ С4 (62 мкмоль, выход 30%, определенный спектрометрией в УФ(ультрафиолетовой)-видимой области, λmax равно 294 нм, ε равно 8600 М-1 см-1). ЖХ-МС (электрораспылительная, в режиме отрицательно заряженных ионов): [М-Н] 589.

Синтез 3'-AOM-ffC-LN3-SO7181: LN3-SO7181 (0,0205 ммоль) растворяли в безводном DMA (4 мл) под N2. Добавляли N,N-диизопропилэтиламин (28,6 мкл, 0,164 ммоль), с последующим добавлением TSTU (0,1 М в DMA, 234 мкл, 0,0234 ммоль). Реакционную смесь перемешивали под N2 при комнатной температуре в течение 1 часа. Тем временем, водный раствор АОМ С4 (0,0101 ммоль) выпаривали досуха при пониженном давлении, ресуспендировали в 0,1 М водн. ТЕАВ (400 мкл) и добавляли в раствор LN3-SO7181. Данную реакционную смесь перемешивали при RT (комнатная температура) в течение 17,5 часов и затем гасили 0,1 М водн. ТЕАВ (4 мл). Неочищенный продукт очищали флэш-хроматографией на DEAE-Sephadex. Данный продукт дополнительно очищали препаративной ВЭЖХ с получением чистого 3’-АОМ-ffC-LN3-SO7181 (6,81 мкмоль, выход 67%, определенный спектрометрией в УФ-видимой области, λmax равно 644 нм, ε равно 200000 М-1 см-1). ЖХ-МС (электрораспылительная, в режиме отрицательно заряженных ионов): [М-Н] 1561, [М-2Н] 781, [М-3Н] 520.

Синтез промежуточного соединения АОМ А2: нуклеозид А1 (716 мг, 0,95 ммоль) растворяли в 10 мл безводного дихлорметана под атмосферой N2, добавляли циклогексен (481 мкл, 4,75 ммоль), и данный раствор охлаждали до приблизительно -15°С. Добавляли по каплям сульфурилхлорид (перегнанный, 92 мкл, 1,14 ммоль), и данную реакционную смесь перемешивали в течение 20 минут. После того как все исходное вещество потреблялось, добавляли дополнительную часть циклогексена (481 мкл, 4,75 ммоль), и данную реакционную смесь выпаривали досуха при пониженном давлении. Остаток быстро продували азотом, затем добавляли аллиловый спирт (5 мл, ~100 ммоль) при перемешивании при 0°С. Данную реакционную смесь перемешивали при 0°С в течение 1 часа, затем гасили 50 мл насыщенного водн. NaHCO3. Данную реакционную смесь экстрагировали 2× 100 мл этилацетата. Объединенные органические фазы промывали 100 мл воды и 100 мл рассола, затем сушили над MgSO4, фильтровали и выпаривали досуха. Остаток очищали флэш-хроматографией на силикагеле с использованием петролейного эфира/EtOAc. Выход 60% (435 мг, 0,57 ммоль). ЖХ-МС (ЭР (электрораспылительная ионизация) и ХИ (химическая ионизация): (положительный ион) m/z 763 (М+Н+); (отрицательный ион) m/z 761 (М-Н+).

Синтез промежуточного соединения АОМ A3: нуклеозид АОМ А2 (476 мг, 0,62 ммоль) растворяли в сухом THF (5 мл) под атмосферой N2, затем добавляли раствор 1,0 М TBAF в THF (750 мкл, 0,75 ммоль). Данный раствор перемешивали при комнатной температуре в течение 1,5 часов. Данный раствор разбавляли 50 мл EtOAc, затем промывали 100 мл насыщ. NaH2PO4 (рН 3) и 100 мл рассола. Органическую фазу сушили над MgSO4, фильтровали и выпаривали досуха. Остаток очищали флэш-хроматографией на силикагеле с использованием EtOAc/МеОН. Выход 90% (292 мг, 0,55 ммоль). ЖХ-МС (ЭР и ХИ): (положительный ион) m/z 525 (М+Н+); (отрицательный ион) m/z 523 (М-Н+).

Синтез промежуточного соединения АОМ А4: нуклеозид АОМ A3 (285 мг, 0,544 ммоль) сушили при пониженном давлении над P2O5 в течение 18 ч. Добавляли к нему под азотом безводный триэтилфосфат (2 мл) и некоторое количество свежеактивированных 4 молекулярных сит, затем данную реакционную колбу охлаждали до 0°С в бане со льдом. Добавляли по каплям свежеперегнанный POCl3 (61 мкл, 0,65 ммоль), с последующим добавлением Proton Sponge® (175 мг, 0,816 ммоль). После добавления данную реакционную смесь дополнительно перемешивали при 0°С в течение 15 мин. Затем быстро добавляли 0,5 М раствор пирофосфата в виде бис-три-н-бутиламмониевой соли (5,4 мл, 2,72 ммоль) в безводном DMF, с последующим немедленным добавлением три-н-бутиламина (540 мкл, 2,3 ммоль). Данную реакционную смесь выдерживали в бане со льдом-водой в течение еще 10 минут, затем гасили выливанием ее в 1 М водный триэтиламмония бикарбонат (ТЕАВ, 20 мл) и перемешивали при комнатной температуре в течение 4 часов. Все растворители выпаривали при пониженном давлении. Добавляли в приведенный выше остаток 35%-ный водный раствор аммония (20 мл), и данную смесь перемешивали при комнатной температуре в течение по меньшей мере 5 часов. Затем выпаривали растворители при пониженном давлении. Неочищенный продукт очищали сначала ионообменной хроматографией на DEAE-Sephadex А25 (100 г). Колонку элюировали градиентом водного триэтиламмония бикарбоната. Фракции, содержащие трифосфат, объединяли, и растворитель выпаривали досуха при пониженном давлении. Неочищенное вещество дополнительно очищали ВЭЖХ в препаративном масштабе с использованием колонки YMC-Pack-Pro С18, элюируя 0,1 М ТЕАВ и ацетонитрилом. ЖХ-МС (ЭР и ХИ): (отрицательный ион) m/z 612 (М-Н+); (положительный ион) m/z 614 (М+Н+), 715 (M+Et3NH+).

Общая методика синтеза ffA: краситель-линкер (0,020 ммоль) растворяли в 2 мл безводного N,N'-диметилацетамида (DMA). Добавляли N,N'-диизопропилэтиламин (28,4 мкл, 0,163 ммоль), с последующим добавлением N,N,N',N'-тетраметил-O-(N-сукцинимидил)урония тетрафторбората в виде 0,1 М раствора в безводном DMA (TSTU, 232 мкл, 0,023 ммоль). Данную реакционную смесь перемешивали под азотом при комнатной температуре в течение 1 часа. Тем временем водный раствор трифосфата АОМ А4 (0,01 ммоль) выпаривали досуха при пониженном давлении и ресуспендпровали в 200 мкл 0,1 М раствора триэтиламмония бикарбоната (ТЕАВ) в воде. В данный трифосфат добавляли раствор активированного красителя-линкера, и реакционную смесь перемешивали при комнатной температуре в течение 18 часов. Неочищенный продукт очищали сначала ионообменной хроматографией на DEAE-Sephadex А25 (25 г). Фракции, содержащие трифосфат, объединяли, и растворитель выпаривали досуха при пониженном давлении. Неочищенное вещество дополнительно очищали ВЭЖХ-ОФ (высокоэффективная жидкостная хроматография с обращенной фазой) в препаративном масштабе с использованием колонки YMC-Pack-Pro С18. 3’-АОМ-ffA-LN3-NR7180A: выход 38% (3,8 мкмоль). ЖХ-МС (ЭР): (отрицательный ион) m/z 1459 (М-Н+), 729 (М-2Н+), 486 (М-3Н4). 3'-AOM-ffA-LN3-BL-NR550S0: выход 37% (3,7 мкмоль). ЖХ-МС (ЭР): (отрицательный ион) m/z 1771 (М-Н+), 885 (М-2Н+), 589 (М-3Н+). 3’-АОМ ffA-LN3-BL-NR650C5: выход 51% (51 мкмоль). ЖХ-МС (ЭР): (отрицательный ион) m/z 1917 (М-Н+), 958 (М-2Н+), 645 (М-3Н+).

Синтез промежуточного соединения АОМ G4: известный нуклеозид dG3 (100 мг, 0,143 ммоль) растворяли в 10 мл безводного дихлорметана под атмосферой N2, добавляли циклогексен (72 мкл, 0,714 ммоль), и данный раствор охлаждали до -12°С. Добавляли по каплям сульфурилхлорид (перегнанный, (1 M в DCM), 171 мкл, 0,171 ммоль), и данную реакционную смесь перемешивали в течение 10 мин. Добавляли дополнительную часть циклогексена (72 мкл, 0,714 ммоль), и данную реакционную смесь перемешивали в течение 30 мин при -12°С. Данную реакционную смесь выпаривали досуха при пониженном давлении, остаток продували азотом, и добавляли ледяной чистый аллиловый спирт (перегнанный, 0,8 мл, 12 ммоль) при перемешивании при -12°С. Данную реакционную смесь перемешивали при -12°С в течение 60 мин, затем гасили 2 мл насыщенного водн. NaHCO3. Данную смесь разделяли с этилацетатом (2 мл), водный слой экстрагировали этилацетатом. Объединенные органические фазы промывали 4 мл воды и 4 мл рассола, сушили над MgSO4, фильтровали и упаривали до неочищенного масла. Остаток очищали флэш-хроматографией на силикагеле с получением АОМ G4 в виде прозрачного масла. Выход 36% (50,9 мг, 0,072 ммоль). ЖХ-МС (ЭР и ХИ): (положительный ион) m/z 710 [М+Н]+; (отрицательный ион) m/z 708 [М-Н]-.

Синтез промежуточного соединения АОМ G5: нуклеозид AOM-G4 (111 мг, 0,156 ммоль) растворяли в сухом THF (5 мл) в атмосфере N2. Добавляли уксусную кислоту (27 мкл, 0,468 ммоль), с последующим добавлением раствора 1,0 М TBAF в THF (296 мкл, 0,296 ммоль). Данный раствор перемешивали при комнатной температуре в течение 5 часов. Данный раствор разбавляли 10 мл EtOAc, промывали 10 мл 0,05 М водн. HCl, и органическую фазу отделяли. Водную фазу экстрагировали этилацетатом. Объединенные органические фазы сушили над MgSO4, фильтровали и выпаривали досуха. Остаток очищали флэш-хроматографией на силикагеле с получением АОМ G5 в виде белого твердого вещества. Выход 44% (32,4 мг, 0,068 ммоль). ЖХ-МС (ЭР и ХИ): (положительный ион) m/z 472 [М+Н]+; (отрицательный ион) m/z 470 [М-Н]-.

Синтез 3’-AOM-pppG: нуклеозид AOM-G5 (79 мг, 0,168 ммоль) со свежеактивированными 4 молекулярными ситами сушили при пониженном давлении над P2O5 в течение 18 ч. Добавляли под азотом Proton Sponge® (175 мг, 0,816 ммоль) и безводный триэтилфосфат (0,8 мл) и перемешивали при комнатной температуре в течение 1 часа. Реакционную колбу охлаждали до 0°С в ледяной бане, добавляли по каплям свежеперегнанный POCl3 (19 мкл, 0,202 ммоль), и данную реакционную смесь перемешивали при 0°С в течение 15 минут. Затем быстро добавляли 0,5 М раствор пирофосфата в виде бис-три-н-бутиламмониевой соли (1,68 мл, 0,84 ммоль) в безводном DMF, с последующим немедленным добавлением три-н-бутиламина (168 мкл, 0,705 ммоль). Данную реакционную смесь удаляли из бани со льдом/водой и энергично перемешивали в течение 5 минут, затем гасили вливанием ее в 1 М водный триэтиламмония бикарбонат (ТЕАВ, 6 мл) и перемешивали при комнатной температуре в течение 18 часов. Все растворители выпаривали при пониженном давлении. Остаток растворяли в 35%-ном водном растворе аммиака (10 мл) и перемешивали при комнатной температуре в течение по меньшей мере 5 часов. Растворители затем выпаривали при пониженном давлении и дополнительно совместно выпаривали с водой. Неочищенный продукт сперва очищали ионообменной хроматографией на DEAE-Sephadex А25 (50 г). Колонку элюировали линейным градиентом водного триэтиламмония. Фракции, содержащие трифосфат, отбирали, и растворитель выпаривали досуха при пониженном давлении. Неочищенное вещество дополнительно очищали ВЭЖХ в препаративном масштабе с использованием колонки YMC-Pack-Pro С18. 3’-AOM-pppG получали в виде триэтиламмониевой соли. Выход 24% (39,7 мкмоль). ЖХ-МС (ЭР и ХИ): (отрицательно заряженный ион) m/z 576 [М-Н]-; (положительно заряженный ион) m/z 578 [М+Н]+.

3'-AOM-ffT-LN3-NR550S0 синтезировали аналогично тому, как описано при получении 3’-АОМ ffA и ffC.

Синтез промежуточного соединения Т1: 5-йод-2'-дезоксиуридин (3 г, 8,4 ммоль) и ацетат палладия(II) (1,6 г, 7,14 ммоль) растворяли в сухом дегазированном DMF, затем добавляли N-аллилтрифторацетамид (6,4 мл, 42 ммоль). Раствор помещали под вакуум, затем продували азотом 3 раза, затем добавляли дегазированный триэтиламин (2,3 мл, 16,8 ммоль). Данный раствор нагревали до 80°С в течение 2 часов. Черную смесь охлаждали до комнатной температуры, затем разбавляли 50 мл метанола. Добавляли приблизительно 0,5 г активированного угля, и данный раствор фильтровали на целите, затем выпаривали при пониженном давлении с получением коричневого густого масла. Это неочищенное вещество очищали хроматографией на силикагеле с использованием EtOAc/МеОН. Выход: (2,27 г, 5,99 ммоль). ЖХ-МС (ЭР и ХИ): (отрицательно заряженный ион) m/z 378 (М-Н+).

Синтез промежуточного соединения Т2: 5-[3-(2,2,2-трифторацетамидо)-аллил]-2'-дезоксиуридин (Т1) (2,55 г, 6,72 ммоль) растворяли в сухом DMF. Добавляли имидазол (1,37 г, 20,1 ммоль), с последующим добавлением 4-(диметиламино)пиридина (410 мг, 3,36 ммоль). Данную реакционную смесь охлаждали до 0°С, затем медленно добавляли 3 порциями трет-бутил(хлор)дифенилсилан (1,92 мл, 7,39 ммоль) с интервалами 30 минут.Данную реакционную смесь перемешивали при 0°С в течение 6 часов. Растворитель затем выпаривали, остаток ресуспендировали в 200 мл EtOAc и промывали 2× 200 мл водн. насыщенного NaHCO3 и 200 мл воды, затем 100 мл рассола. Органическую фазу сушили над MgSO4, фильтровали и выпаривали досуха. Неочищенный продукт очищали флэш-хроматографией на диоксиде кремния с использованием DCM/EtOAc. Выход 68% (2,806 г, 4,54 ммоль). ЖХ-МС (ЭР и ХИ): (положительно заряженный ион) m/z 618 (М+Н+); (отрицательно заряженный ион) m/z 616 (М-Н+).

Синтез промежуточного соединения Т3: 5'-O-(трет-бутилдифенилсилил)-5-[3-(2,2,2-трифторацетамидо)-аллил]-2'-дезоксиуридин (Т2) (2,8 г, 4,53 ммоль) растворяли в 10 мл безводного DMSO (136 ммоль), затем добавляли ледяную уксусную кислоту (16 мл, 272 ммоль) и уксусный ангидрид (16 мл, 158 ммоль). Данную реакционную смесь нагревали до 50°С в течение 6 часов, затем гасили 200 мл водн. насыщенного NaHCO3. После того как в растворе прекратили образовываться пузырьки, его экстрагировали 2× 150 мл EtOAc. Органические фазы объединяли и промывали 2×200 мл водн. насыщенного NaHCO3, 200 мл воды и 100 мл рассола. Органическую фазу сушили над MgSO4, фильтровали и выпаривали досуха. Неочищенный продукт очищали флэш-хроматографией на диоксиде кремния с использованием DCM/EtOAc. Выход 77% (2,375 г, 3,51 ммоль). ЖХ-МС (ЭР и ХИ): (положительный ион) m/z 678 (М+Н+); (отрицательный ион) m/z 676 (М-Н4).

Синтез промежуточного соединения Т4: 5'-O-(трет-бутилдифенилсилил)-3'-O-метилтиометил-5-[3-(2,2,2-трифторацетамидо)-аллил]-2'-дезоксиуридин (Т3) (310 мг, 0,45 ммоль) растворяли в 5 мл безводного дихлорметана в атмосфере N2, добавляли циклогексен (228 мкл, 2,25 ммоль), и данный раствор охлаждали до приблизительно -15°С. Сульфурилхлорид (перегнанный, 55 мкл, 0,675 ммоль) добавляли по каплям, и данную реакционную смесь перемешивали в течение 20 минут. После потребления всего исходного вещества добавляли дополнительную часть циклогексена (228 мкл, 2,25 ммоль), и данную реакционную смесь выпаривали досуха при пониженном давлении.

Остаток быстро продували азотом, затем добавляли ледяной аллиловый спирт (2,5 мл) при перемешивании при 0°С. Данную реакционную смесь перемешивали при 0°С в течение 35 минут, затем гасили 25 мл насыщенного водн. NaHCO3, затем дополнительно разбавляли 100 мл насыщенного водн. NaHCO3. Данную смесь экстрагировали 2×50 мл этилацетата. Объединенные органические фазы сушили над MgSO4, фильтровали и выпаривали досуха. Остаток очищали флэш-хроматографией на силикагеле с использованием DCM/EtOAc. Выход 69% (214 мг, 0,311 ммоль). ЖХ-МС (ЭР и ХИ): (положительно заряженный ион) m/z 688 (М+Н+); (отрицательно заряженный ион) m/z 686 (М-Н+).

Синтез промежуточного соединения Т5: 5'-O-(трет-бутилдифенилсилил)-3'-O-аллилоксиметил-5-[3-(2,2,2-трифторацетамидо)-аллил]-2'-дезоксиуридин (Т4) (210 мг, 0,305 ммоль) растворяли в сухом THF (3 мл) под атмосферой N2. Добавляли раствор 1,0 М TBAF в THF (367 мкл, 0,367 ммоль). Данный раствор перемешивали при комнатной температуре в течение 3 часов. Раствор разбавляли 50 мл EtOAc, затем промывали 50 мл насыщ. NaH2PO4 (рН 3) и 50 мл воды. Органическую фазу сушили над MgSO4, фильтровали и выпаривали досуха. Остаток очищали флэш-хроматографией на силикагеле с использованием DCM/EtOAc. Выход 95% (130 мг, 0,289 ммоль). ЖХ-МС (ЭР и ХИ): (отрицательно заряженный ион) m/z 448 (М-Н+), 484 (М+Cl-).

Синтез промежуточного соединения Т6: 3'-O-аллилоксиметил-5-[3-(2,2,2-трифторацетамидо)-аллил]-2'-дезоксиуридин (Т5) (120 мг, 0,267 ммоль) сушили при пониженном давлении над P2O5 в течение 18 ч. Добавляли к нему под азотом безводный триэтилфосфат (1 мл) и некоторое количество свежеактивированных 4 молекулярных сит, затем колбу с реакционной смесью охлаждали до 0°С. Добавляли по каплям свежеперегнанный POCl3 (30 мкл, 0,32 ммоль), с последующим добавлением Proton Sponge® (85 мг, 0,40 ммоль). После добавления данную реакционную смесь дополнительно перемешивали при 0°С в течение 15 минут. Затем быстро добавляли 0,5 М раствор пирофосфата в виде бис-три-н-бутиламмониевой соли (2,7 мл, 1,33 ммоль) в безводном DMF, с последующим немедленным добавлением три-н-бутиламина (270 мкл, 1,2 ммоль). Данную реакционную смесь выдерживали в бане со льдом-водой в течение еще 10 минут, затем гасили вливанием ее в 1 М водный триэтиламмония бикарбонат (ТЕАВ, 10 мл) и перемешивали при комнатной температуре в течение 4 часов. Все растворители выпаривали при пониженном давлении. В вышеупомянутый остаток добавляли 35%-ный водный раствор аммиака (10 мл), и данную смесь перемешивали при комнатной температуре в течение 18 часов. Растворители затем выпаривали при пониженном давлении, остаток ресуспендировали в 10 мл 0,1 М ТЕАВ и фильтровали. Фильтрат сперва очищали ионообменной хроматографией на DEAE-Sephadex А25 (100 г). Колонку элюировали водным триэтиламмония бикарбонатом (ТЕАВ). Фракции, содержащие трифосфат, объединяли, и растворитель выпаривали досуха при пониженном давлении. Неочищенное вещество дополнительно очищали ВЭЖХ в препаративном масштабе с использованием колонки YMC-Pack-Pro С18. Соединение Т6 получали в виде триэтиламмониевой соли. Выход 33% (89 мкмоль). ЖХ-МС (ЭР и ХИ): (отрицательно заряженный ион) m/z 592 (М-Н+), 295 (М-2Н+).

Синтез S'-AOM-ffT-LN3'-NRSSOSO: высушенное известное соединение LN3-NR550S0 (0,015 ммоль) растворяли в безводном DMA (2 мл) под N2. Добавляли N,N-диизопропилэтиламин (17 мкл, 0,1 ммоль), с последующим добавлением TSTU (0,1 М в DMA, 180 мкл, 0,018 ммоль). Данную реакционную смесь перемешивали под N2 при комнатной температуре в течение 1 часа. Тем временем, водный раствор Т6 (0,01 ммоль) выпаривали досуха при пониженном давлении, ресуспендировали в 0,1 М водн. ТЕАВ (200 мкл) и добавляли в раствор LN3-NR550S0. Данную реакционную смесь перемешивали при RT в течение 18 часов и затем гасили 0,1 М водн. ТЕАВ (4 мл). Неочищенный продукт очищали флэш-хроматографией на DEAE-Sephadex. Продукт дополнительно очищали препаративной ВЭЖХ с получением чистого 3'-AOM-ffT-LN3'-NR550S0. Выход 67% (41 мкмоль, при определении спектрометрией в УФ-видимой области, λmax равно 550 нм, е равен 125000 М-1 см-1). ЖХ-МС (ЭР): (отрицательно заряженный ион) m/z 1521 (М-Н+),761 (М-2Н4), 507 (М-3Н+).

Эксперименты по секвенированию посредством синтеза

ffN затем анализировали в секвенировании с использованием прибора Illumina MiniSeq®. За исключением новой смеси для включения, включающей данные ffN, использовали все стандартные имеющиеся в продаже реагенты. Использовали стандартный рецепт 2×150. Помимо стандартных протоколов секвенирования посредством синтеза (SBS), добавляли 5-секундную инкубацию в растворе палладиевой расщепляющей смеси (Pd:THP равно 1/5 в DEEA, как описано в Примере 4) для разблокирования 3’-АОМ.

В первом эксперименте использовали следующие ffN в смеси для включения: 3'-AOM-ffT-LN3-NR550S0, 3'-AOM-ffA-LN3-BL-NR550S0, 3'-AOM-ffA-LN3-BL-NR650C5, 3'-AOM-ffA-LN3-NR7180A, 3'-AOM-ffC-LN3-SO7181 и 3’-AOM-pppG (темный G), и результат секвенирования для считываемого фрагмента 1 обобщается ниже.

Во втором эксперименте немеченый 3’-АОМ-рррТ синтезировали аналогично получению 3’-AOM-pppG, описанному выше (ЖХ-МС (ЭР): (отрицательно заряженный ион) m/z 551 (М-Н4)). Его использовали в присутствии имеющегося в продаже зеленого ffG-LN3-PEG12-ATT0532 (используется на 4-канальных системах Illumina) в секвенировании, и использовались такие же ffA и ffC, что и ffA и ffC, описанные в первом эксперименте выше. Результаты обобщаются ниже. Имелись значительные улучшения по значениям фазирования и предфазирования, и не наблюдали затухания сигнала (ФИГ. 3А). Кроме того, также уменьшались показатели ошибки и для считываемого фрагмента 1, и для считываемого фрагмента 2.

В другом эксперименте использовали смесь для включения, содержащую 3'-AOM-ffT-LN3'-NR550S0, 3'-AOM-ffA-LN3-BL-NR550S0, 3'-AOM-ffA-LN3-BL-NR650C5, 3'-AOM-ffA-LN3-NR7180A, 3'-AOM-ffC-LN3-S07181 и 3’-AOM-pppG (темный G). Аналогично предыдущим прогонам, в стандартный цикл SBS добавляли 5-секундную инкубацию с расщепляющей смесью, содержащей палладиевый катализатор (Pd/THP равно 1:10; 100 мМ DEEA, как описано в Примере 4). Использовали стандартную ДНК-полимеразу MiniSeq®, но с 2-кратным временем включения. Не наблюдали фенотип затухания сигнала (ФИГ. 3В). Кроме того, данные результаты секвенирования сравнивали с прогонами имеющейся в продаже MiniSeq® (среднее из 3; N равно 3), используя ffN со стандартной азидометильной блокирующей группой. Наблюдали то, что показатели ошибок были почти идентичными (ФИГ. 3С). Результаты секвенирования обобщаются ниже.

Кроме того, первичные показатели секвенирования для ffN с 3’-АОМ блокирующими группами сравнивали с первичными показателями секвенирования, полученными посредством стандартного имеющегося в продаже набора MiniSeq®, включающего ДНК-полимеразу Pol 812, и на ФИГ. 4А демонстрируются сравнимые результаты. Очень низкое предфазирование наблюдалось из-за улучшенной стабильности 3’-AOM-ffN. Однако фазирование все еще было повышенным, даже если использовали 2-кратное время включения.

В еще одном другом эксперименте использовали другую ДНК-полимеразу (Pol 1901) вместо ДНК-полимеразы в имеющихся в продаже наборах MiniSeq® (Pol 812). Pol 1901 обеспечивала стандартное 1× время включения в секвенировании вместо 2-кратного времени включения, описанного выше. Кроме того, инкубация в Pd расщепляющей смеси была уменьшена наполовину по сравнению со стандартным прогоном. Это обеспечивало 10%-ную экономию времени при полном химическом цикле SBS. Показатели секвенирования были значительно улучшенными и превышали значения, полученные от стандартных имеющихся в продаже наборов, содержащих 3’-О-азидометильную блокирующую группу (ФИГ. 4 В).

Анализ стабильности 3' блокирующей группы при секвенировании

Для демонстрации улучшения стабильности ffN с 3’-АОМ их сравнивали параллельно со стандартными ffN MiniSeq® с 3’-О-азидометильной группой. Два набора ffN инкубировали при 45°С в течение нескольких суток в стандартных препаратах смесей для включения, исключая только ДНК-полимеразу. Для каждого момента времени добавляли свежую полимеразу для завершения получения смеси для включения непосредственно перед загрузкой на MiniSeq®. Использовали условия секвенирования, описанные ранее. % предфазирования является прямым индикатором процентной доли 3'ОН-ffN, присутствующих в смеси, следовательно, он непосредственно коррелирует со стабильностью 3' блокирующей группы. Значения предфазирования для обоих наборов ffN записывали и откладывали на графике (ФИГ. 5). При 45° наблюдали то, что ffN, содержащие 3’-АОМ, оказывались в 6 раз более стабильными, чем стандартные ffN с 3’-О-азидометильной группой. Показатели секвенирования также подтверждали тенденцию, наблюдаемую во время анализа стабильности в растворе - 3’-АОМ блок был значительно более стабильным, чем 3’-О-азидометильная группа.

Пример 6. Получение нуклеозидов, блокированных 3’-О-тиокарбаматом В данном примере получали разные нуклеозиды Т, защищенные 3’-О-тиокарбаматом, согласно Схеме 8.

Получение Т-7: в высушенную в печи, продутую азотом 100 мл колбу добавляли 5'-O-(4,4'-диметокситритил)тимидин (1,0 г, 1,836 ммоль). Данную смесь совместно выпаривали с безводным DMF (3×20 мл) и помещали под азотом. Добавляли безводный DCM (9,2 мл) и 4-диметиламинопиридин (224 мг, 0,184 ммоль), и перемешивали при комнатной температуре, пока не образовался гомогенный раствор. Затем быстро добавляли 1,1'-тиокарбонилдиимидазол (360 мг, 2,02 ммоль) через струю азота, реакционную смесь повторно запечатывали и перемешивали при комнатной температуре в течение 2 часов, пока не потреблялось все исходное вещество. Данную реакционную смесь фильтруют через слой силикагеля, и остаток на фильтре промывают EtOAc (10 мл). Летучие вещества удаляли в вакууме, и неочищенный остаток использовали без дальнейшей очистки.

Получение Т-8: соединение Т-7 с предыдущей стадии использовали немедленно после сушки в вакууме. Остаток помещали под азотом в 25 мл круглодонной колбе, добавляли диметиламин (2 M в THF, 7,3 мл, 14,6 ммоль), и данную реакционную смесь перемешивали в течение 2 часов, пока все исходное вещество не потреблялось согласно ТСХ. Все летучие вещества удаляли в вакууме с образованием прозрачного неочищенного остатка, который очищали колоночной флэш-хроматографией на силикагеле с получением Т-8 в виде белого твердого вещества. Выход: 1,15 г (99%). ЖХ-МС (электрораспылительная, в режиме отрицательно заряженных ионов) 630,23 [М-Н].

Получение Т-9: исходный нуклеозид Т-8 (320 мг, 0,504 ммоль) растворяли в минимальном количестве ацетонитрила в 50 мл круглодонной колбе на воздухе. Добавляли за один прием раствор АсОН/H2O 5:1 (12,5 мл: 2,5 мл), и данную реакционную смесь перемешивали при комнатной температуре, пока не потреблялось все исходное вещество (2-4 часа). Выпаривание всех летучих веществ под вакуумом и совместное выпаривание остатка в толуоле (2×60 мл) давало неочищенный продукт в виде беловатого твердого вещества. Данный неочищенный продукт очищали колоночной флэш-хроматографией с получением Т-9 в виде белого твердого вещества. Выход: 123 мг (74%). ЖХ-МС (электрораспылительная, в режиме отрицательно заряженных ионов) [М-Н] 328,10.

Следуя аналогичной синтетической методике с использованием соответствующих MeNH2 или NH3, также получали нуклеозиды с двумя тиокарбаматными защитными группами. Общая схема реакции демонстрируется ниже:

Анализ стабильности 3’-О-тиокарбаматных блокирующих групп

Анализы стабильности для нуклеотида 5'-mP 3’-DMTC Т проводили параллельно в растворе буфера для включения со стандартным нуклеотидом 5'-mP 3’-О-азидометил Т.

И для 5'-mP 3’-DMTC Т, и для 5'-mP 3’-О-азидометил Т конечный объем раствора составлял 1 мл, и конечные концентрации соответствующих нуклеотидов состаляли 0,1 мМ для обоих. Другие компоненты водного буферного раствора включают этаноламин (ЕА), этаноламин HCl, NaCl (100 мМ) и EDTA (2,5 мМ). Данный буферный раствор имеет следующую концентрацию: 0,5 М буфер ЕА, 0,5 М NaCl, 0,01 М EDTA.

Методология анализа стабильности

200 мкл 10× буферного раствора добавляли в 1,7 мл полипропиленовую микропробирку с крышкой с защелкой и разводили правильным объемом 18 мΩ воды. Затем добавляли соответствующий нуклеозид, флакон закупоривали и осуществляли перемешивание посредством переворачивания, легкого перемешивания или отсасывания микропипеткой. Отбирали 40 мкл аликвоту и анализировали посредством ВЭЖХ для того, чтобы она действовала в качестве исходного значения (или t равно 0). Данные флаконы затем помещали в предварительно нагретый до 65°С колбонагреватель, покрывали толстым слоем алюминиевой фольги и оставляли нагреваться в течение одного месяца. Периодически отбирали 40 мкл аликвоты (неделя 1: один раз в сутки. Недели 2-4:1 раз каждые 2 суток) и анализировали посредством ВЭЖХ для определения процентной доли исходного вещества и процентной доли деблокированного (3’-ОН) нуклеотида в данных образцах. Анализ ВЭЖХ проводили посредством измерения площади пика исходного нуклеотида и пика 3'ОН. Данные значения использовали для расчета графически процентной доли деблокированного нуклеотида, который присутствовал, и использовали для сравнения стабильности в буфере для включения между образцами. На ФИГ. 6 проиллюстрированы сравнительные результаты стабильности трех разных 3' блокированных тиокарбаматом нуклеотидов с нуклеотидами, блокированными 3’-О-азидометильной блокирующей группой, при 65°С. Наблюдали то, что в то время как нуклеотид с 3'-O-C(=S)NH2 или 3'-O-C(=S)NHCH3 был менее стабильным, чем нуклеотид, защищенный стандартной 3’-О-азидометильной группой, нуклеотид с 3’-DMTC придавал улучшенную стабильность во время 9-сутокчного периода анализа. DMTC, как таковой, демонстрировал превосходную стабильность над стандартной азидометильной блокирующей группой.

Пример 7. Анализ деблокирования 3’-О-тиокарбаматной блокирующей группы

В данном примере деблокирование или анализы деблокирования для 5'-mP 3’-DMTC Т и стандартного 5'-mP 3’-О-азидометил Т проводили индивидуально в уникальном растворе для каждой блокирующей группы. Были созданы условия для имитации стандартного деблокирующего реагента Illumina настолько близко, насколько это возможно, и следуя той же самой методологии. Поддерживали те же самые концентрации активного деблокирующего реагента, буфера и нуклеозида во всех анализах, но идентичность каждого компонента была уникальной. Данным способом наблюдаемое различие в скорости между индивидуальными химиями деблокирования не может быть обусловлено различиями в концентрации препарата.

Общая методология анализа деблокирования

Каждый компонент реакции готовили индивидуально в виде концентрированного маточного раствора в 18 мΩ воде, хранили надлежащим образом, и аликвоты объединяли в конкретном порядке, приведенном ниже. Реакция начиналась добавлением предварительно приготовленного деблокирующего реагента. Конечные концентрации: нуклеозид (0,1 мМ), активный деблокирующий реагент (1 мМ), добавка (специфичная по отношению к деблокирующему реагенту), буфер (100 мМ). Конечный объем: 2000 мкл.

В 3 мл стеклянный флакон добавляли предварительно приготовленный буферный раствор, с последующим добавлением предварительно приготовленной добавки. Данную смесь разбавляли правильным объемом 18 мΩ воды и перемешивали в течение 10 минут. Затем добавляли аликвоту раствора нуклеотида и перемешивали в течение 5 минут. Затем отбирали 40 мкл аликвоту, добавляли гасящий реагент и анализировали посредством ВЭЖХ в качестве эталонного пика (или t равно 0 мин). Затем добавляли к перемешиваемому раствору в один прием деблокирующий реагент, и начинался отсчет времени. В определенные моменты времени отбирали 40 мкл аликвоты и немедленно гасили подходящим гасящим реагентом, затем анализировали посредством ВЭЖХ для определения количества деблокированного нуклеотида, который появлялся в данные определенные моменты времени. Результаты графически откладывали на графике и использовали для сравнения эффективности и действенности деблокирования.

Деблокирование DMTC

Нуклеотид: 5'-mP 3'-DMTC Т. Активный деблокирующий реагент: NaIO4 (0,1 М в 18 мΩ воде) или Oxone® (0,1 М в 18 мΩ воде). Добавка: нет. Буфер для NaIO4: фосфатный буфер с рН 6,75 (1 М в 18 мΩ воде). Буфер для Oxone®: фосфатный буфер с рН 8,65 (1 М в 18 мΩ воде). Гасящий реагент: тиосульфат натрия. Условия деблокирования 3'-О-азидометила являются такими же, как условия, описанные в Примере 3.

Анализ ВЭЖХ проводили посредством измерения площади пика исходного нуклеозида, пика 3'-ОН и любых других пиков нуклеотидов, которые появляются на хроматограмме ВЭЖХ. Данные значения использовали для расчета процентной доли исходного нуклеотида и деблокированного нуклеотида, которую представляли графически и использовали для сравнения скорости, эффективности и действенности деблокирования между образцами. Сравнительный результат показан на ФИГ. 7. Наблюдали то, что деблокирование DMTC с использованием NaIO4 не было эффективным. Однако % остающегося исходного вещества был значительно меньше для нуклеотида с блокирующей группой DMTC при расщеплении DMTC с использованием Oxone®. В заключение, DMTC продемонстрировал превосходную скорость деблокирования (с Oxone®) над скоростью деблокирования стандартной азидометильной блокирующей группы.

Похожие патенты RU2818762C2

название год авторы номер документа
КУМАРИНЫ, ЗАМЕЩЕННЫЕ ВТОРИЧНЫМИ АМИНАМИ, И ИХ ПРИМЕНЕНИЕ В КАЧЕСТВЕ ФЛУОРЕСЦЕНТНЫХ МЕТОК 2018
  • Романов, Николай Николаевич
  • Макколи, Патрик
  • Энестейси, Кэрол
  • У, Сяолинь
  • Хайнс, Найлл
RU2756272C2
ПОЛИМЕТИНОВЫЕ СОЕДИНЕНИЯ И ИХ ПРИМЕНЕНИЕ В КАЧЕСТВЕ ФЛУОРЕСЦЕНТНЫХ МЕТОК 2016
  • Франсе Антуан
  • Лю Сяохай
RU2696562C1
МОДИФИЦИРОВАННЫЕ НУКЛЕОТИДНЫЕ ЛИНКЕРЫ 2015
  • У Сяолинь
  • Лю Сяохай
RU2699993C2
КОМПОЗИЦИИ И СПОСОБЫ ХИМИЧЕСКОГО РАСЩЕПЛЕНИЯ И СНЯТИЯ ЗАЩИТЫ ДЛЯ СВЯЗАННЫХ С ПОВЕРХНОСТЬЮ ОЛИГОНУКЛЕОТИДОВ 2019
  • У, Сяолинь
  • Смит, Рэндалл
  • Шиех, Пейтон
  • Бейерл, Джон М.
  • Джордж, Уэйн Н.
  • Лоуренс, Эллиот Джон
  • Мао, Цзе
  • Лю, Сяохай
RU2766688C2
МУЛЬТИПЛЕКСНОЕ ФЛУОРЕСЦЕНТНОЕ ОБНАРУЖЕНИЕ АНАЛИТОВ 2020
  • Романов, Николай
  • Хонг, Стенли С.
  • Макколи, Патрик
  • Лю, Сяохай
  • Конделло, Данило
  • Сью, Мерек
RU2816515C2
НУКЛЕОТИДЫ, МЕЧЕННЫЕ ЗАРЯДОМ, И СПОСОБЫ ИХ ПРИМЕНЕНИЯ 2019
  • Мэнделл, Джеффри
  • Гравина, Сильвия
  • Пейсаджович, Серджио
  • Пульезе, Кейтлин
  • Тео, Инь На
  • Ян, Сянюань
  • Басигалупо, Мария Канделария Роджерт
RU2751359C2
МОДИФИЦИРОВАННЫЙ КРАСИТЕЛЬ РОДАМИНОВОГО РЯДА И ЕГО ПРИМЕНЕНИЕ В БИОЛОГИЧЕСКИХ АНАЛИЗАХ 2019
  • Эванс, Брайан
  • Бенсон, Скотт
  • Мулла, Хайруззаман Башар
  • Янь, Сёнвэй
RU2809712C2
ТАГМЕНТАЦИЯ С ПРИМЕНЕНИЕМ ИММОБИЛИЗОВАННЫХ ТРАНСПОСОМ С ЛИНКЕРАМИ 2018
  • Десантис, Грейс
  • Гросс, Стивен М.
  • Ли, Цзянь-Сень
  • Моррелл, Натали
  • Слаттер, Эндрю
  • Шен, Кевин
  • Сноу, Саманта
RU2783536C2
СПОСОБЫ И КОМПОЗИЦИИ ДЛЯ ОПРЕДЕЛЕНИЯ ЛИГАНДОВ НА МАТРИЦАХ С ИСПОЛЬЗОВАНИЕМ ИНДЕКСОВ И ШТРИХКОДОВ 2020
  • Сегейл, Даррен
  • Блэк, Фиона Э.
  • Бродин, Джеффри Деннис
  • Берти, Лоренцо
  • Леонг, Сью Хонг
  • Фишер, Джеффри С.
  • Экхардт, Аллен
  • Чжан, Жуй
  • Тео, Инь Нах
RU2825578C1
СПОСОБЫ И КОМПОЗИЦИИ ДЛЯ ОПРЕДЕЛЕНИЯ ЛИГАНДОВ НА МАТРИЦАХ С ИСПОЛЬЗОВАНИЕМ ИНДЕКСОВ И ШТРИХКОДОВ 2019
  • Берти, Лоренцо
  • Блэк, Фиона Э.
  • Бродин, Джеффри Деннис
  • Фишер, Джеффри
  • Леонг, Сью Хонг
  • Сегейл, Даррен
RU2816708C2

Иллюстрации к изобретению RU 2 818 762 C2

Реферат патента 2024 года НУКЛЕОЗИДЫ И НУКЛЕОТИДЫ С 3’-ГИДРОКСИ БЛОКИРУЮЩИМИ ГРУППАМИ И ИХ ПРИМЕНЕНИЕ В СПОСОБАХ СЕКВЕНИРОВАНИЯ ПОЛИНУКЛЕОТИДОВ

Группа изобретений относится к способам секвенирования полинуклеотидов. Раскрыт нуклеотид, содержащий рибозу или дезоксирибозу, имеющую удаляемую 3’-ОН блокирующую группу ковалентно присоединенную к 3’-атому углерода. Также раскрыты олигонуклеотид, способ получения растущего полинуклеотида, комплементарного целевому одноцепочечному полинуклеотиду, в реакции секвенирования, способ определения последовательности целевого одноцепочечного полинуклеотида, набор для применения в мультиплексном секвенировании путем синтеза, применение нуклеотида в мультиплексном секвенировании путем синтеза. Группа изобретений обеспечивает расширение арсенала средств определенного назначения. 6 н. и 48 з.п. ф-лы, 7 ил., 7 пр.

Формула изобретения RU 2 818 762 C2

1. Нуклеотид, содержащий рибозу или дезоксирибозу, имеющую удаляемую 3’-ОН блокирующую группу ковалентно присоединенную к 3’-атому углерода.

2. Нуклеотид по п. 1, содержащий 2’-дезоксирибозу.

3. Нуклеотид по п. 1 или 2, где указанный нуклеотид содержит трифосфат в 5’-положении рибозы или дезоксирибозы.

4. Нуклеотид по любому из пп. 1-3, где указанный нуклеотид ковалентно присоединен к выявляемой метке, возможно через расщепляемый линкер.

5. Нуклеотид по п. 4, в котором выявляемая метка ковалентно присоединена к азотистому основанию нуклеотида через расщепляемый линкер.

6. Нуклеотид по п. 5, в котором указанный расщепляемый линкер содержит азидный фрагмент, -О-аллильный фрагмент, дисульфидный фрагмент, ацетальный фрагмент или тиокарбаматный фрагмент.

7. Нуклеотид по п. 5, где линкер содержит фрагмент, выбранный из группы, состоящей из:

где X выбран из группы, состоящей из О, S, NH и NQ, где Q представляет собой замещенную или незамещенную C1-10-алкильную группу, Y выбран из группы, включающей О, S, NH и N(аллил), Т представляет собой водород или замещенную или незамещенную C1-C10 алкильную группу, и символом «*» показано, где фрагмент соединен с остатком нуклеотида.

8. Нуклеотид по п. 5, где линкер выбран из группы, состоящей из:

где B представляет собой азотистое основание; Z представляет собой -N3 (азидо), -O-C16 алкил, -O-С26 алкенил или -О-С26 алкинил; и FI содержит флуоресцентную метку, которая может содержать дополнительную линкерную структуру.

9. Нуклеотид по любому из пп. 1-3, содержащий азотистое основание, выбранное из группы, состоящей из

10. Нуклеотид по любому из пп. 1-8, содержащий азотистое основание, выбранное из группы, состоящей из

где L представляет собой линкер, a Dye представляет собой флуоресцентный краситель.

11. Нуклеотид по любому из пп. 1-8, имеющий структуру, выбранную из группы, состоящей из

где L представляет собой линкер, Dye представляет собой флуоресцентный краситель, и R представляет собой рибозу или дезоксирибозу, имеющую удаляемую 3’-OH блокирующую группу, ковалентно присоединенную к 3’-атому углерода.

12. Олигонуклеотид, включающий в себя нуклеотид по любому из пп. 1-11, причем фосфодиэфирная связь образована между 3’-атомом углерода олигонуклеотида и 5’-атомом углерода указанного нуклеотида.

13. Способ получения растущего полинуклеотида, комплементарного целевому одноцепочечному полинуклеотиду, в реакции секвенирования, включающий включение нуклеотида по любому из пп. 1-11 в растущий комплементарный полинуклеотид, где включение указанного нуклеотида предотвращает введение любого последующего нуклеотида в растущий комплементарный полинуклеотид.

14. Способ по п. 13, при котором осуществляют включение нуклеотида по любому из пп. 3-11 в растущий комплементарный полинуклеотид.

15. Способ по п. 13 или 14, в котором включение нуклеотида осуществляется полимеразой.

16. Способ определения последовательности целевого одноцепочечного полинуклеотида, включающий:

(a) включение нуклеотида по любому из пп. 4-11 в копию полинуклеотидной цепи, комплементарной по меньшей мере части целевой полинуклеотидной цепи;

(b) выявление идентичности нуклеотида, включенного в копию полинуклеотидной цепи; и

(c) химическое удаление метки и 3’-OH блокирующей группы из нуклеотида, включенного в копию полинуклеотидной цепи.

17. Способ по п. 16, в котором нуклеотид, включенный на стадии (а), представляет собой нуклеотид-5’-трифосфат.

18. Способ по п. 16 или 17, дополнительно включающий (d) отмывку копии полинуклеотидной цепи от химически удаленных метки и 3’-OH блокирующей группы.

19. Способ по п. 18, в котором на стадии (d) используют палладиевый акцептор радикалов.

20. Способ по п. 18 или 19, дополнительно включающий повторение стадий (a)-(d) до тех пор, пока не будет определена последовательность указанной части цепи полинуклеотида-матрицы.

21. Способ по любому из пп. 18-20, в котором стадии (a)-(d) повторяют по меньшей мере 50 раз, по меньшей мере 75 раз, по меньшей мере 100 раз, по меньшей мере 150 раз, по меньшей мере 200 раз, по меньшей мере 250 раз или по меньшей мере 300 раз.

22. Способ по любому из пп. 16-21, где метку и 3’-OH блокирующую группу удаляют с нуклеотида, включенного в копию полинуклеотидной цепи, в одной химической реакции.

23. Способ по п. 22, в котором стадия (с) включает приведение в контакт включенного нуклеотида с расщепляющим раствором, содержащим палладиевый катализатор.

24. Способ по любому из пп. 16-21, в котором метку и 3’-OH блокирующую группу удаляют с нуклеотида, включенного в копию полинуклеотидной цепи, в двух отдельных химических реакциях.

25. Способ по п. 24, в котором стадия (с) включает приведение включенного нуклеотида в контакт с расщепляющим раствором, содержащим фосфин, и палладиевым катализатором.

26. Способ по п. 25, в котором фосфин представляет собой трис(гидроксиметил)фосфин, трис(гидроксиэтил)фосфин или трис(гидроксипропил)фосфин.

27. Способ по любому из пп. 23, 25 или 26, в котором расщепляющий раствор, содержащий палладиевый катализатор, дополнительно содержит один или более чем один буферизующий реагент, выбранный из группы, состоящей из первичного амина, вторичного амина, третичного амина, карбонатной соли, фосфатной соли, боратной соли и их комбинаций.

28. Способ по п. 27, в котором буферизующие реагенты выбраны из группы, состоящей из этаноламина (ЕА), трис(гидроксиметил)аминометана (Tris), глицина, карбонатной соли, фосфатной соли, боратной соли, 2-диметиламиноэтанола (DMEA), 2-диэтиламинометанола (DEEA), N,N,N’,N’-тетраметилэтилендиамина (TEMED) и N,N,N’,N’-тетраэтилэтилендиамина (TEEDA) и их комбинаций.

29. Способ по любому из пп. 23 и 25-28, где расщепляющий раствор дополнительно содержит аскорбиновую кислоту или ее соль.

30. Способ по любому из пп. 16-29, осуществляемый в мультиплексном формате.

31. Способ по любому из пп. 16-30, осуществляемый в формате чипа с использованием связанных с поверхностью целевых нуклеиновых кислот, причем целевые нуклеиновые кислоты связаны с поверхностью пространственно различимым образом.

32. Способ по п. 31, где чип включает множество копий, имеющих одну и ту же последовательность целевых нуклеиновых кислот в каждом сайте.

33. Способ по п. 32, где множество копий целевых нуклеиновых кислот образуется в результате мостиковой амплификации.

34. Способ по п. 32, где множество копий целевых нуклеиновых кислот присутствует в конкатемерах.

35. Способ по любому из пп. 31-34, где чип имеет плотность по меньшей мере примерно 10 элементов/см2, 100 элементов/см2, 500 элементов/см2, 1000 элементов/см2, 5000 элементов/см2, 10000 элементов/см2, 50000 элементов/см2, 100000 элементов/см2, 1000000 элементов/см2 или 5000000 элементов/см2.

36. Способ по любому из пп. 16-35, отличающийся тем, что в способе используют первый тип нуклеотидов - который выявляется в первом канале, второй тип нуклеотидов - который выявляется во втором канале, третий тип нуклеотидов - который выявляется как в первом, так и во втором канале, и четвертый тип нуклеотидов - у которого отсутствует метка, и который не выявляется или минимально выявляется в обоих каналах.

37. Способ по любому из пп. 16-35, отличающийся тем, что в способе используют четыре разных типа нуклеотидов, причем каждый тип нуклеотидов имеет спектрально отличающуюся метку.

38. Способ по любому из пп. 16-37, где включение нуклеотида осуществляют с помощью ДНК-полимеразы.

39. Набор для применения в мультиплексном секвенировании путем синтеза, содержащий один или более чем один нуклеотид по любому из пп. 1-11.

40. Набор по п. 39, в котором по меньшей мере один нуклеотид представляет собой нуклеотид-5’-трифосфат, имеющий 3’-OH блокирующую группу структуры ковалентно присоединенную к 3’-углероду 2’ дезоксирибозы.

41. Набор по п. 39 или 40, дополнительно содержащий фермент и буфер, подходящий для действия фермента.

42. Набор по п. 41, в котором фермент представляет собой полимеразу.

43. Набор по п. 42, в котором полимераза представляет собой ДНК-полимеразу.

44. Набор по любому из пп. 39-43, содержащий по меньшей мере один нуклеотид, меченный выявляемой меткой, по любому из пп. 4-11.

45. Набор по любому из пп. 39-43, содержащий два, три или четыре типа нуклеотидов, меченных выявляемой меткой, по любому из пп. 4-11.

46. Набор по п. 45, дополнительно содержащий «темный» нуклеотид, не имеющий выявляемой метки.

47. Набор по п. 45 или 46, в котором разные типы меченых нуклеотидов мечены спектрально отличающимися красителями.

48. Набор по любому из пп. 45-47, где по меньшей мере один тип нуклеотидов является меченным по азотистому основанию двумя или более разными красителями.

49. Набор по любому из пп. 45-48, где первый тип нуклеотидов является меченным первым красителем, второй тип нуклеотидов является меченным вторым красителем, спектрально отличающимся от первого красителя, третий тип нуклеотидов является меченным в виде смеси первого и второго красителей или смеси первого, второго и третьего красителей, и четвертый нуклеотид не содержит метки.

50. Набор по п. 45, содержащий четыре типа нуклеотидов, меченных выявляемой меткой, причем нуклеотиды, меченные выявляемой меткой, представляют собой А, С, Т и G, причем каждый тип нуклеотидов имеет флуоресцентную метку с заметным максимумом флуоресценции, и каждая из флуоресцентных меток отличается от трех других флуоресцентных меток.

51. Набор по любому из пп. 39-50, дополнительно содержащий расщепляющий раствор, включающий в себя трис(гидроксипропил)фосфин, палладиевый (Pd) катализатор, аскорбиновую кислоту или ее соль, и буферизирующий реагент, выбранный из группы, состоящей из этаноламина (ЕА), трис(гидроксиметил)аминометана (Tris), глицина, карбонатной соли, фосфатной соли, боратной соли, 2-диметиламиноэтанола (DMEA), 2-диэтиламинометанола (DEEA), N,N,N’,N’-тетраметилэтилендиамина (TEMED) и N,N,N’,N’-тетраэтилэтилендиамина (TEEDA) и их комбинаций.

52. Набор по любому из пп. 39-51, дополнительно содержащий промывочный раствор, содержащий палладиевый акцептор радикалов.

53. Применение нуклеотида по любому из пп. 1-11 в мультиплексном секвенировании путем синтеза.

54. Применение по п. 53, где стадии секвенирования повторяют по меньшей мере 50 раз, по меньшей мере 75 раз, по меньшей мере 100 раз, по меньшей мере 150 раз, по меньшей мере 200 раз, по меньшей мере 250 раз или по меньшей мере 300 раз.

Документы, цитированные в отчете о поиске Патент 2024 года RU2818762C2

METZKER M.L
et al
Переносная печь для варки пищи и отопления в окопах, походных помещениях и т.п. 1921
  • Богач Б.И.
SU3A1
Машина для добывания торфа и т.п. 1922
  • Панкратов(-А?) В.И.
  • Панкратов(-А?) И.И.
  • Панкратов(-А?) И.С.
SU22A1
Прибор для промывания газов 1922
  • Блаженнов И.В.
SU20A1
МИШЕНЬ, СИГНАЛИЗИРУЮЩАЯ О ПОПАДАНИИ В ЦЕЛЬ 1926
  • Стивенс А.Э.
SU4259A1
WO 2002029003 A2, 11.04.2002
WO 2004018497 A2, 04.03.2004
МОДИФИЦИРОВАННЫЙ КАПСУЛЯРНЫЙ САХАРИД, СПОСОБ ЕГО ПОЛУЧЕНИЯ И ПРИМЕНЕНИЕ 2008
  • Бардотти Анжела
  • Берти Франческо
  • Костантино Паоло
RU2563808C2

RU 2 818 762 C2

Авторы

Франсе, Антуан

Крессина, Елена

Калли, Адам

Марьяни, Анжелика

У, Сяолинь

Лю, Сяохай

Даты

2024-05-06Публикация

2019-12-23Подача